|
НАЦІОНАЛЬНА АКАДЕМІЯ НАУК УКРАЇНИ
ІНСТИТУТ ПРОБЛЕМ МОДЕЛЮВАННЯ В ЕНЕРГЕТИЦІ
ім. Г. Є. ПУХОВА
ДЕМКІВСЬКА ТЕТЯНА ІВАНІВНА
УДК 681.51
МЕТОДИ ТА ЗАСОБИ ПРОГНОЗУВАННЯ ЕКОЛОГІЧНИХ ТА ЕКОНОМІЧНИХ ПРОЦЕСІВ НА ОСНОВІ КОМП’ЮТЕРНОГО МОДЕЛЮВАННЯ ЧАСОВИХ РЯДІВ
05.13.06 – Автоматизовані системи управління та прогресивні інформаційні технології
Автореферат
дисертації на здобуття наукового ступеня
кандидата технічних наук
КИЇВ-2001
Дисертацією є рукопис.
Роботу виконано на кафедрі інформатики Київського національного університету технологій та дизайну МОН України
Науковий керівник: кандидат технічних наук, Юрачківський Юрій Павлович, Київський національний університет технологій та дизайну МОН України, доцент кафедри інформатики.
Офіційні опоненти: доктор технічних наук, професор Бідюк Петро Іванович, Інститут прикладного системного аналізу Національного технічного університету України “Київський політехнічний інститут” МОН України, професор кафедри математичних методів системного аналізу;
кандидат фізико-математичних наук, доцент Заславський Володимир Анатолійович, факультет кібернетики Київського національного університету імені Тараса Шевченка, заступник декана.
Провідна установа: Національний авіаційний університет МОН України, кафедра комп’ютерно-інтегрованих комплексів, м. Київ.
Захист відбудеться “25” жовтня 2001 р. о 14 годині на засіданні
спеціалізованої вченої ради К 26.185.02 в Інституті проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України, м. Київ, вул. Генерала Наумова, 15.
3 дисертацією можна ознайомитись у бібліотеці Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України, м. Київ, вул. Генерала Наумова, 15.
Автореферат розіслано “24” вересня 2001 р.
Вчений секретар спеціалізованої
вченої ради К 26.185.02, к.т.н. Семагіна Е.П.
ЗАГАЛЬНА ХАРАКТЕРИСТИКА
Актуальність проблеми. В зв’язку з розвитком ринкової економіки та перебудовою суспільних відносин в Україні виникають значні труднощі при прогнозуванні поведінки учасників ринку. Зміни в економіці та обмеженість природних ресурсів в свою чергу призводять до зростання екологічних проблем, особливо з урахуванням наслідків аварії на Чорнобильській АЕС. Тому все більш актуальними стають проблеми моделювання та прогнозування екологічних та економічних процесів для створюваних автоматизованих систем. Моделюванню цих процесів велика увага приділялась в роботах Дженкінса і Бокса, Рао і Каш’яп, Ю.П. Лукашина, А. Капустинскаса і А. Немури. На жаль розроблені ними методи не завжди задовольняють конкретним практичним вимогам. Нові підходи до моделювання еколого-економічних проблем пропонуються в роботах П. І. Бідюка, І.Н. Ляшенка, В.С. Дейнеки, в наукових школах Інституту кібернетики НАН України та Київського університету імені Тараса Шевченка. В той же час прикладні проблеми сьогодення вимагають удосконалення методів ідентифікації та побудови прогнозних моделей.
Оскільки показники, що характеризують економічні та екологічні процеси, можна розглядати як часові ряди, в дисертаційній роботі основну увагу приділено проблемам моделювання і прогнозування часових рядів за допомогою ARIMA (Auto Regression Integrated Moving Average) – моделей авторегресії проінтегрованого ковзного середнього. Найвідомішими з застосувань цих моделей є використання для прогнозування різноманітних економічних рядів, сонячної активності, стоку рік, чисельності популяцій. ARIMA-моделі також можуть бути застосовані у різноманітних автоматизованих системах для прогнозування вартості акцій і інших біржових активів, курсів валют, змін щоденних залишків запасів на складах, в магазинах. За допомогою цих же моделей можна описати еволюцію зміни техніко-економічних характеристик виробів і змінних параметрів хімічних процесів, моделювати поведінку показників частоти відмов обладнання в залежності від його віку. Нарешті, вони можуть бути використані при аналізі сезонності змін статистичних характеристик, в ряді випадків вони застосовуються також для прогнозування макропоказників. В майбутньому попит на використання цих моделей зростатиме, оскільки розвиток фондового ринку, як свідчить досвід країн з розвиненою економікою, потребуватиме більш і більш детального прогнозування економічних процесів. Узагальнюючи, можна сказати, що моделі ARIMA ефективно застосовуються там, де основною інформацією для прогнозу є окремий часовий ряд.
Проведений при виконанні дисертаційної роботи аналіз показав, що поки що недостатньо досліджено питання звуження множини ARIMA-моделей, а також визначення структури і складу її параметрів для практичних потреб розробки автоматизованих систем управління в економіці, екології, банківській справі, тощо.
Саме тому основним напрямком дисертаційної роботи є побудова ARIMA-моделей для опису процесів, що задані часовими рядами, знаходження оцінок параметрів побудованої моделі та побудова прогнозу поведінки часового ряду.
Мета і задачі дослідження. Об’єктом дослідження дисертаційної роботи є процеси, що можуть бути описані часовими рядами. Предметом дослідження є побудова ARIMA-моделей. В роботі використовувались математичні методи аналізу моделей, експериментальні дослідження з застосуванням сучасної електронно-обчислювальної техніки та програмного забезпечення.
Для досягнення поставлених цілей розв’язувались такі задачі:
- побудова ARIMA-моделі, яка адекватно описує часовий ряд;
- визначення структури моделі, оцінювання параметрів та побудова прогнозів на основі отриманої ARIMA-моделі.
Наукова новизна одержаних результатів дисертаційної роботи визначається наступними отриманими автором теоретичними і експериментальними результатами:
- досліджено моделі та побудовано алгоритм пошуку класу моделей та оцінок параметрів для цих моделей без попереднього знання фізичних процесів та оцінки фахівців;
- вперше для вибору множини запізнювань використано частковий коефіцієнт кореляції, що дає змогу без участі оцінок фахівців та емпіричних висновків визначити структуру моделі.
- вперше доведена доцільність використання методу Недлера і Міда для оцінки параметрів ARIMA-моделі і експериментально підтверджена його ефективність в порівнянні з використовуваними на сьогоднішній день методами;
- запропоновані алгоритми та розроблено підсистему управління та інтерфейсу з користувачем для автоматизованих систем схеми обігу цінних паперів в акціонерному товаристві закритого типу “Обрій Капітал” та системі “ЕкоЕксперт”.
Зв’язок з науковими програмами, планами, темами. Дисертаційна робота виконувалась у відповідності з науково-дослідними темами: “Наукові основи комплексних комп’ютерних систем проектування та виготовлення продукції в легкій промисловості”, затвердженою рішенням науково-експертної ради Міносвіти України, пр. Ν 2 від 04.11.1998 р. (регістраційний номер 0199U003013) і “Охорона навколишнього середовища та створення систем захисту людини від шкідливих впливів на виробництві”, затвердженою Наказом Київського національного університету технологій та дизайну від 22.02.2000 року № 25.
Практичне значення одержаних результатів. На основі розроблених методів і запропонованих алгоритмів розв’язана задача побудови прогнозу економічних та екологічних процесів на основі часових рядів.
Сформульовані умови використання часткового коефіцієнту кореляції при визначенні структури моделей та доцільність застосування методу Недлера і Міда для оцінювання параметрів ARIMA-моделей.
Створено програмну підсистему дослідження навколишньго середовища і ресурсів для моніторингу стану техногенно-екологічної безпеки на об’єктах найбільш вразливих з точки зору ймовірності виникнення надзвичайних ситуацій, моніторингу екологічної ситуації в зоні ЧАЕС (у тому числі весняного паводку, лісових і торфових пожеж і т.ін.). Ця підсистема використовується в Українському інституті досліджень навколишнього середовища і ресурсів, який є однією з провідних установ з питань моніторингу техногенно-небезпечних об’єктів та екологічної безпеки.
Розроблені в дисертації програмні засоби використовуються в автоматизованій системі моніторингу і прогнозування економічних показників Українського фондового ринку, зокрема в Акціонерному товаристві закритого типу “Обрій Капітал”, яке займається операціями на Фондовому ринку, а також підтримує автоматизовану систему моніторингу і прогнозування деяких економічних показників Українського фондового ринку, що виконується в рамках автоматизованої системи електронного обігу цінних паперів в Україні.
Автором було розроблено і впроваджено програмне забезпечення для розв’язання задачі знаходження оцінок параметрів визначених ARIMA-моделей та побудови прогнозу поведінки ряду.
Апробація результатів роботи. Основні положення роботи доповідались і обговорювались на конференції “Комп’ютерне моделювання та інформаційні технології в науці, економіці та освіті”, м. Кривий Ріг, 2001 р.; на наукових семінарах кафедри інформатики Київського національного університету технологій та дизайну; на засіданні наукового семінару “Прикладні методи системного аналізу” Інституту прикладного системного аналізу НТУУ КПІ.
Публікації. За матеріалами дисертаційної роботи опубліковано 5 друкованих робіт, з них 4 – у фахових виданнях, список яких затверджений ВАК України.
Особистий внесок здобувача. Всі наукові результати, включені в дисертаційну роботу, одержані автором особисто. У роботах [1], [2], [4], написаних у співавторстві, авторові належить розробка та реалізація алгоритмів, написання програм та проведення експериментальних досліджень за темою дисертації.
Структура та обсяг роботи. Дисертаційна робота обсягом 134 сторінки складається з вступу, п’яти розділів, висновків, списку використаних джерел (87 найменувань) та 3-х додатків.
ОСНОВНИЙ ЗМІСТ
У вступі обгрунтовано актуальність теми та доцільність роботи. Вказано мету роботи, наукову новизну та практичне значення одержаних результатів.
У розділі 1 “Обгрунтування необхідності застосування моделювання часових рядів при створенні автоматизованих систем моніторингу фондового ринку України та контролю за станом природного середовища” обгрунтовується необхідність застосування ARIMA-моделей як єдино доцільного засобу моделювання часових рядів та побудови прогнозу поведінки системи на фондовому ринку України та в інформаційно-експертних системах контролю за станом природного середовища.
Розвиток економіки постійно вимагає мобілізації, розподілу і перерозподілу фінансових ресурсів. У будь-якій країні, де економіка працює ефективно, цей процес здійснюється на ринку фінансових ресурсів. Ринок фінансових ресурсів об’єднує три головні складові: кредитний ринок, валютний ринок та ринок цінних паперів. Ринок цінних паперів є багатоаспектною соціально-економічною системою, на основі якої функціонує ринкова економіка в цілому. Він сприяє акумулюванню капіталу для інвестицій у виробничу і соціальну сфери, структурній перебудові економіки, позитивній динаміці соціальної культури суспільства, підвищенню достатку кожної людини шляхом володіння і вільного розпорядження цінними паперами, психологічній готовності населення до ринкових відносин.
В Україні ринок цінних паперів перебуває на стадії свого становлення. З січня 1992 року працює Українська фондова біржа (УФБ) з Центральним депозитарієм цінних паперів, мережею філій та брокерських контор по всій території України. З грудня 1993 року на біржі введена в дію система електронного обігу цінних паперів, яка не виключає можливості котирування матеріалізованих цінних паперів. Зростає кількість позабіржових фінансових посередників, торговців цінними паперами, інвестиційних фондів і компаній. Збільшується число емітентів (організацій, що випускають цінні папери), які зареєстрували випуск своїх цінних паперів у Міністерстві фінансів України, невпинно зростає загальний обсяг їх емісії.
В квітні 1994 року Кабінет Міністрів України затвердив “Концепцію функціонування і розвитку фондового ринку в Україні”. Указом президента від 25 травня 1994 року “Про електронний обіг цінних паперів і Національний депозитарій” законодавчо закріплене переміщення фінансових активів у дематеріалізованій формі та створення Всеукраїнського Національного депозитарію на базі Центрального депозитарію цінних паперів УФБ.
Одним з головних принципів функціонування фондового ринку є введення системи електронного обігу цінних паперів – їх дематеріалізованого обігу у формі комп’ютерних записів на рахунках через систему “національна фондова біржа – центральний депозитарій – кліринговий банк”. Система електронного обігу цінних паперів дозволяє без додаткових матеріальних затрат здійснювати будь-які операції з цінними паперами: випуски нових емісій, збільшення номіналу акцій, об’єднання цінних паперів при злитті акціонерних товариств, дроблення акцій, їх асиміляцію тощо. Їх головні характеристики – надійність, дешевизна, швидкість у випуску й обігу цінних паперів. Електронна система обігу цінних паперів дає змогу по кожній угоді відслідкувати всі етапи руху цінних паперів і грошових коштів – від банківських розпоряджень і угод між брокерами ринку до стандартизованих розрахунків.
На рис. 1.1 зображено структуру функціональної схеми взаємодії інструментів та суб’єктів централізованого фондового ринку в Україні.
Рис. 1.1. Система електронного обігу цінних паперів в Україні
В традиційній взаємодії складових елементів Української фондової біржі, провідними з яких є емітенти, інвестори та їх посередницькі структури, важливо органічно включити блок “Підсистема управління та інтерфейсу з користувачем” для визначення ефективності ділових угод для всіх учасників фондового ринку.
Для забезпечення функціонування блоку “Підсистема управління та інтерфейсу з користувачем” слід створити підсистему моделювання фінансових потоків та зустрічних потоків цінних паперів. Вказані потоки можуть бути представлені часовими рядами.
Дана система ефективно вписується і в мікроекономічні схеми взаємодії членів акціонерного товариства. “Підсистема управління та інтерфейсу з користувачем” рекомендується для використання при визначенні взаємодії акціонерів відкритих та закритих акціонерних товариств. Нехай, закрите акціонерне товариство здійснило емісію акцій з метою впровадження науково-технічних досягнень і новітніх технологій для подальшого нарощення і розвитку своєї виробничої бази. В наступних операціях акціонерне товариство здійснило розміщення своїх акцій членам і засновникам акціонерного товариства, які в даному випадку виступають інвесторами.
Для акціонерів робочим інструментом оцінки ефективності інвестицій у даній акції стає “Підсистема управління та інтерфейсу з користувачем”. Вона дозволяє здійснити прогнозну оцінку ефективності інвестованого проекту і вирішити питання його фінансування. Результат розрахунку прогнозу дозволяє акціонерам ефективно визначити величину прибутку і надати належну інформацію інвесторам та емітенту для наступного ефективного розподілу дивідентів.
Розглянемо загальну схему ринкової економіки фондової взаємодії (рис. 1.2), яка дає уявлення та пояснює обіг акцій (облігацій), інших цінних паперів в акціонерному товаристві закритого типу, в якій використовується вищеописаний підхід для блоку “Підсистема управління та інтерфейсу з користувачем”.
Фонди ринку
Рис.1.2. Схема обігу цінних паперів в акціонерному товаристві закритого типу
Для успішного функціонування цієї структури необхідно запроваджувати новітні технології, а саме, прогнози, які зокрема можуть бути отримані завдяки запропонованій методиці.
В дисертаційній роботі розроблена система побудови експертно-оціночних модулів, яка пропонується також для використання в системі “ЕкоЕксперт”.
Оптимальним способом організації роботи блоку “Підсистема управління та інтерфейсу з користувачем”, є використання ARIMA-моделювання, тобто вхідні дані слід розглядати як часовий ряд. Модель управління розпадається на дві частини: задачу ідентифікації і задачу вибору оптимального керування.
До задачі вибору оптимального управління входять: задача ідентифікації вхідного ряду, тобто побудова адекватної моделі, що описує даний ряд, та задача вибору функціоналу якості оцінок. Побудову ARIMA-моделі, яка адекватно описує даний ряд, можна розглядати як етап ідентифікації. В свою чергу задача ARIMA-моделювання розпадається на п’ять складових частин: пошук класу моделей, визначення структури моделей відібраного класу, знаходження параметрів і оцінок складових моделі ковзного середнього, вибір моделі, що адекватно описує вхідний ряд та побудова прогнозу на основі адекватної моделі. Запропонований підхід можна зобразити за допомогою структурної схеми, наведеної на рис. 1.3.
Рис. 1.3. Структурна схема “Модель управління”
У розділі 2 “Огляд стану проблеми моделювання часових рядів за допомогою моделей авторегресії та проінтегрованого ковзного середнього” зроблено огляд літератури з проблеми моделювання часових рядів. Наведена історична довідка застосування методів регресійного аналізу часових рядів. Розглянуто основні підходи до проблеми оцінювання параметрів авторегресійних моделей: метод найменших квадратів та метод Юла-Уоккера. Розглянуто можливість використання гармонійного регресійного аналізу при вивченні періодичних часових рядів. Порівнюються різні підходи до визначення класу моделей, що адекватно описують вхідний часовий ряд спостережень досліджуваних процесів, методів визначення порядку процесів AR, MA, ARMA. Розглянуто можливості аналізу часових рядів за допомогою загальної лінійної моделі. Наведено приклади побудови моделей ковзного середнього та авторегресійної моделі першого та другого порядку та розглянуто можливість отримання ефективних оцінок для авторегресійних моделей та моделей ковзного середньго. Вивчено можливість використання авторегресії ковзного середнього для аналізу лінійних процесів. На основі аналізу літератури зроблено висновки про те, що недостатньо уваги приділяється питанню про визначення структури ARIMA-моделі, тобто кількості і складу запізнювань, кількості різниць і порядку ковзного середнього.
У розділі 3 “Розробка алгоритму вибору структури моделі авторегресії та проінтегрованого ковзного середнього” розглянуто можливість використання простого та часткового коефіцієнтів кореляції для визначення структури ARIMA-моделі.
Розглядається наступна ARIMA-модель
∇rxt-1 = φ1∇rxt - l1 + … + φp∇rxt – lp + еt - θ1еt-1 - θ2еt-2 - … - θqеt-q, (1)
де l1,…, lp – різні цілі невід’ємні числа (для визначеності будемо вважати, що l1 < … < lp), ∇r– різницевий оператор зрушення порядку r такий, що ∇r = xt – xt-1. Тобто ARIMA-модель з параметрами (p, r, q). Не порушуючи загальності, далі будемо вважати, що r = 0, тобто будемо розглядати модель ARIMA (p, 0, q), що має наступний вигляд:
xt+1 = φ1xt - l1 + … +φp xt – lp + еt - θ1еt-1 - θ2еt-2 - … - θqеt-q. (2)
На першому етапі вважатимемо εі = 0, i = 1, …, lp. Необхідно визначити p - кількість запізнювань, li - склад запізнювань та оцінити значення φi. Для визначення p та li будуємо кореляційний ряд si. Порівнювалося два підходи.
Перший підхід.
Будуємо кореляційний ряд si, i =1, …, n - 1,
,
де , та .
Вибираємо номери p найбільших за модулем si і вважаємо, що це і є ті запізнювання, комбінації яких дадуть нам множину моделей, серед яких знаходиться адекватна. Відсортувавши їх за зростанням, матимемо номери l1, l2, …, lp запізнювань. Для зручності та прискорення подальших обчислень, пропонується побудувати коваріаційну матрицю наступним чином:
Записуємо ряд з n спостережень у вигляді таблиці 1.
Табл. 1.
Матриця спостережень
Будуємо матрицю R розміром (p+1) × (p+1), елементи якої
.
Подальша частина спільна для обох підходів, тому її буде розглянуто нижче.
Другий підхід.
Розглянемо можливість використання часткового коефіцієнта кореляції для побудови кореляційного ряду.
Частковий коефіцієнт кореляції дозволяє оцінити ступінь тісноти лінійного зв'язку між двома змінними, не залежної від непрямого впливу інших факторів. Для його розрахунку необхідна вихідна інформація як за парою змінних, так і за всіма тими змінними, безпосередній (“той, що заважає”), вплив яких ми хочемо елімінувати.
Без обмеження загальності будемо вважати, що l1 = 1, l2 = 2, …, lm = m, тоді
,
де vij - елементи матриці V = R-1.
Виходячи з властивостей матриці R, отримання матриці V є відносно нескладним завданням. В даній роботі V знаходилась за методом квадратного кореня. Як і в попередньому випадку, вибираємо номери p найбільших за модулем si. Для уточнення (звуження) множини моделей, які розглядаємо, так як вона є вже достатньо вузькою, застосовано метод повного перебору, оскільки основна інформація для роботи методу міститься в матриці R.
Процедура обведення дає змогу здійснити перебір моделей з визначеної множини за прийнятний час, використовуючи інформацію один раз обчисленої коваріаційної матриці.
Знайдено МНК-оцінки запізнень для моделей визначеного класу.
На основі проведених чисельних експериментів над рядами відомої структури, отримано наступні результати:
- перший підхід: в 62% випадків (в межах проведеного експерименту) отримана множина запізнювань, що складалась із 6 найкращих, не містила жодного з істинних запізнювань досліджуваної моделі, хоча і дві-три моделі достатньо точно імітують вихідний ряд;
- другий підхід завжди давав змогу точно (в межах проведеного експерименту) отримати параметри вихідної моделі. Множина моделей для повного перебору не перевищує 6 запізнювань, якщо кількість реальних запізнювань не перевищує 5.
У розділі 4 “Оцінювання коефіцієнтів моделі авторегресії та проінтегрованого ковзного середнього” запропоновано алгоритм уточнення параметрів моделей отриманих в попередньому розділі, а також вибору найкращої моделі, що адекватно описує досліджуємий процес.
Розглядається питання вибору функціоналу якості оцінок. Він очевидно залежить від припущень щодо процесу, який моделюється, а також від мети, для якої ця модель створюється. З того факту, що процес описується рівнянням (1), не витікає, які оцінки для його параметрів φ1,…,φp, θ1,…,θq є найкращими. Перше запитання, на яке слід відповісти, є питання про те, що ми спостерігаємо. Найпростішим і найрозповсюдженішим є припущення, що ми спостерігаємо саме незбурені значення xk. В подальшому також дотримуватимемося цього припущення. Воно приводить до наступної побудови функціоналу якості оцінки параметрів моделі (1) (МНК-оцінки).
Нехай маємо спостереження x1, …, xn. Безпосередньо з (1) випливає, що
(3) .
Якщо припущення про функцію розподілу випадкових величин εk,, k = 1, …, n – 1 прийнято, для них можна було б записати функцію правдоподібності. Функція розподілу не постулюється, але фактично використовується функціонал, до якого зводиться логарифмічна функція правдоподібності, взята зі знаком мінус, у припущенні нормальності шуму:
(4)
який власне і слід мінімізувати.
Головна проблема оцінювання полягає в тому, що, по-перше, значення εk, k = 1,…, q + lp, не спостерігаються, а отже їх треба оцінювати, виходячи з мінімізації функціоналу, а по-друге, що зрештою і є головним – значення εk, k = 1 - q + lp, …, n – 1, також не спостерігаються і їх слід оцінювати, виходячи з мінімізації того ж функціоналу, але, крім того, обчислювати їх за допомогою рекурентної формули (3). Формула (3) є лінійним різницевим рівнянням щодо змінної εk і його розв’язок можна записати у загальному вигляді як лінійну комбінацію k-х степенів коренів характеристичного многочлена різницевого рівняння (3). Проте останнє ніяким чином не допомагає у мінімізації принаймні з двох причин. Перша з них очевидна – корені характеристичного рівняння в разі, якщо його порядок перевищує 4, згідно з теоремою Абеля, у загальному випадку не виражаються через коефіцієнти характеристичного рівняння. Друга причина полягає в тому, що навіть у разі, коли корені виражено через коефіцієнти, функціонал (4) після підстановки у нього аналітичних виразів для εk, k = 1 - q + lp, …, n – 1, перетворюється на достатньо складну для мінімізації функцію. Наведеними причинами пояснюється те, що при оцінюванні параметрів загальний розв’язок різницевого рівняння (3) не використовується.
Існують різні чисельні алгоритми оцінювання параметрів. Але їхньою головною особливістю є те, що оцінки для εk, k = 1,…, q + lp, не отримуються, а вважаються рівними нулю. Таке припущення не створює значних збурень, а оцінки для εk, k = 1 + q + lp, …, n – 1, отримують за допомогою рекурентної формули (3).
Запропоновано використовувати як алгоритм оцінювання параметрів ARIMA-моделі метод Недлера і Міда прямого пошуку по симплексу, що деформується або S2-метод. Для порівняння їх ефективності розглядається ця ж модель:
xk = εk+θ1 εk-1+θ2 εk-2+ θ3 εk-3.
Причиною такого вибору є те, що функція, яку слід мінімізувати, надто відрізняється від квадратичної, отже алгоритми типу Ньютона-Рафсона не можуть бути ефективними.
В методі Недлера і Міда мінімізується функція n незалежних змінних з використанням n + 1 вершин многогранника, що деформується, в Еn. Кожна вершина може бути ідентифікована вектором с. Вершина (точка в Еn), в якій значення f(с) максимальне, проектується через центр ваги (центроїд) вершин, які залишились. Покращені (менші) значення цільової функції знаходяться послідовною заміною точки з максимальним значенням f(с) на “кращі” точки, поки на буде знайдений мінімум f(с).
Запропонований нижче алгоритм призначено для розв’язання задачі оцінювання як структури, так і коефіцієнтів ARIMA-моделі. Його може бути умовно розділено на 4 частини:
1- знаходження оцінок коефіцієнтів φ1,…,φp;
2- знаходження оцінок коефіцієнтів θ1,…,θq;
3- визначення початкових значень εt-1, …, εt-q для t = t0;
4- оцінка адекватності отриманих моделей.
Якщо в процесі побудови моделей було отримано модель, в якій φi = 0 (i = 1, …, p), вважається, що отримано модель типу MA, якщо в моделі θ i = 0 (i = 1, …, q), вважається, що отримано модель типу AR, якщо в побудованій моделі є ненульові φi і θ i то отримана модель належить до класу ARMA (або ARIMA залежно від того яку модель вибрано: (1) чи (2)).
Алгоритм побудови адекватної моделі, що описує часовий ряд
Крок 1. Побудова коваріаційної матриці R.
Для уникнення ситуації переповнення при обчислювальному процесі (тобто в випадках, коли n – велике число, а ряд спостережень xi може приймати достатньо великі значення) пропонується нормувати ряд xi так, щоб xi ∈ [0, 1]. Для цього кожний елемент ряду xi ділиться на max{| x1|, …, | xn |}.
Представимо ряд спостережень xi у вигляді коваріаційної матриці, наведеної вище.
Значення p вибирається з припущення, що максимальний номер запізнення lp ≤ m, також треба мати на увазі, що n > 2m + 1. Будується коваріаційна матриця Rm+1,m+1, де
rij = , i = 0, …, m; j = 0, …, m.
Крок 2. Визначаємо множини структур запізнень.
Виходячи з властивостей матриці R, обчислимо V = R-1 за методом квадратного кореня.
Для визначення структури Φ = (φ i) обчислюються часткові коефіцієнти кореляції cori = -v1,i / і сортуються отримані cori за спаданям. Для підвищення достовірності отриманих результатів пропонується ряд xi розглядати з деяким початковим шумом, тобто = xi + εi, де εi ∈ [-h, h] рівномірно розподілена випадкова величина.
На основі проведених експериментів з даними заздалегідь відомої структури та шумом що не перевищує 10% середнього значення ряду спостережень та кількості складових моделі ковзного середнього не більше 5, можна зробити висновок, що отриманий таким чином ряд з 6 перших значень cori включає в себе номери запізнень вхідного ряду. А отже подальший вибір параметрів шуканої моделі зводиться до розгляду різних комбінацій з множини 6 номерів запізнень (позначимо їх як l1, …, l6). Тобто, якщо визначення структури моделі в загальному випадку є задачею експоненційної складності, то запропонований алгоритм дає змогу звести її фактично до задачі поліноміальної складності.
Крок 3. Визначаємо номери коефіцієнтів запізнень адекватної моделі.
На даному етапі розглядаються всі можливі варіанти моделей, які можна отримати з відібраних на попередньому кроці, та обчислюється значення коефіцієнтів запізнювань і критерій адекватності для кожної моделі. Перебір моделей здійснюється за методом окаймлення.
Для кожної моделі обчислюється критерій crit = Σεi2 / (n – p), або crit= Σεi2 / (n – p)ln(n) (обговорення вибору конкретного критерію виходить за рамки дисертаційної роботи) та вибирається певна фіксована кількість моделей, наприклад, 6 з найменшими значеннями crit.
Крок 4. Знаходимо оцінки θ1, …, θn.
Виходячи з практичних міркувань далі розглядались випадки, коли r = 0, r = 1, r = 2, тобто не порушуючи загальності вважаєьтся, що на практиці більше 3х складових моделі ковзного середнього в задачах не зустрічається. Отже, для кожної відібраної на попередньому кроці моделі досліджуються моделі з різним порядком ковзного середнього:
xt = φ1xt-l1 + φ2xt-l2 + … + φpxt-lp + εt;
xt = φ1xt-l1 + φ2xt-l2 + … + φpxt-lp + εt + θ1εt-1;
xt = φ1xt-l1 + φ2xt-l2 + … + φpxt-lp + εt + θ1εt-1 + θ2εt-2;
Для двох останніх рядів за допомогою методу S2 (описанного вище) знаходяться оцінки θi.
Крок 5. Обчислюємо оцінки ; 
На попередніх кроках заходились оцінки φi та θi, виходячи з того, що = 0 та = 0. На даному етапі вважаючи, що φi та θi відомі, знайдемо оцінки та , виходячи з того, що → min і εi для i = lp, …, n є функціями εi ( ). Розв’язок задачі знаходиться також за допомогою методу S2.
Кроки 4-5 повторюються доти, поки оцінки отримані на двох сусідніх ітераціях змінюватимуться істотно.
Крок 6. Здійснюємо вибір адекватної моделі.
Використовуючи значення ряду x1, …, xlp, а також значень оцінок φi, θi та εt-1, εt-2, будуємо ряд , i = lp+1, n. За критерій адекватності отриманих моделей вхідним даним приймається min .
Крок 7. Закінчуємо роботу за алгоритмом.
|