Метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів
Запропоновано новий метод для побудови прогнозу варіації сильноволатильних гетероскедастичних часових рядів. За модель часового ряду взято авторегресію нескінченного порядку. Параметри моделі знайдено як розв’язок системи рівнянь Тьопліца, у якій використовуються модельні коефіцієнти автокореляції,...
Збережено в:
Дата: | 2015 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
2015
|
Назва видання: | Системні дослідження та інформаційні технології |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/123492 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів / Н.Г. Зражевська // Системні дослідження та інформаційні технології. — 2015. — № 3. — С. 97-108. — Бібліогр.: 12 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-123492 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1234922017-09-07T03:02:57Z Метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів Зражевська, Н.Г. Математичні методи, моделі, проблеми і технології дослідження складних систем Запропоновано новий метод для побудови прогнозу варіації сильноволатильних гетероскедастичних часових рядів. За модель часового ряду взято авторегресію нескінченного порядку. Параметри моделі знайдено як розв’язок системи рівнянь Тьопліца, у якій використовуються модельні коефіцієнти автокореляції, за запропонованим методом. Модель автокореляційної функції на кожному кроці прогнозування побудовано шляхом розв’язання оптимізаційної задачі, що враховує умову сильної залежності. Метод протестовано на штучно згенерованому та реальному часових рядах. Для порівняння результатів прогнозування обрано модель авторегресії, параметри якої знайдено за методом максимальної правдоподібності. Результати свідчать про достатньо високу ефективність запропонованого методу під час прогнозування сильноволатильних гетероскедастичних часових рядів. Предложен новый метод для построения прогноза вариации сильноволотильных гетероскедастических временных рядов. В качестве модели временного ряда рассмотрена модель авторегрессии бесконечного порядка. Параметры модели найдены как решение системы уравнений Тёплица, в которой используются модельные коэффициенты автокорреляции. По предложенному методу модель автокорреляционной функции на каждом шаге прогнозирования построена путем решения оптимизационной задачи, учитывающей условие сильной зависимости. Метод проверен на искусственно сгенерированном и реальном временных рядах. Для сравнения результатов прогнозирования выбрана модель авторегрессии, параметры которой найдены методом максимального правдоподобия. Результаты свидетельствуют о достаточно высокой эффективности предложенного метода для прогнозирования сильноволатильных гетероскедастических временных рядов. The paper proposes a new method for forecasting the variability for strong volatile heteroscedastic time series. An autoregressive model of an infinite order is considered as a model of time series. Parameters of the model are found as a solution of a Toeplitz system that uses correlation coefficients. The model of the autocorrelation function at every forecasting step is constructed by solving an optimization problem that takes into account the condition of strong dependence. The method has been tested on artificially generated and real time series. The autoregressive model parameters found with the method of maximum likelihood were used to compare the results of a selected autoregressive model. The results show a substantially high effectiveness of the proposed method in predicting of strong volatile heteroscedastic time series. 2015 Article Метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів / Н.Г. Зражевська // Системні дослідження та інформаційні технології. — 2015. — № 3. — С. 97-108. — Бібліогр.: 12 назв. — укр. 1681–6048 http://dspace.nbuv.gov.ua/handle/123456789/123492 519.6:519.81 uk Системні дослідження та інформаційні технології Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Ukrainian |
topic |
Математичні методи, моделі, проблеми і технології дослідження складних систем Математичні методи, моделі, проблеми і технології дослідження складних систем |
spellingShingle |
Математичні методи, моделі, проблеми і технології дослідження складних систем Математичні методи, моделі, проблеми і технології дослідження складних систем Зражевська, Н.Г. Метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів Системні дослідження та інформаційні технології |
description |
Запропоновано новий метод для побудови прогнозу варіації сильноволатильних гетероскедастичних часових рядів. За модель часового ряду взято авторегресію нескінченного порядку. Параметри моделі знайдено як розв’язок системи рівнянь Тьопліца, у якій використовуються модельні коефіцієнти автокореляції, за запропонованим методом. Модель автокореляційної функції на кожному кроці прогнозування побудовано шляхом розв’язання оптимізаційної задачі, що враховує умову сильної залежності. Метод протестовано на штучно згенерованому та реальному часових рядах. Для порівняння результатів прогнозування обрано модель авторегресії, параметри якої знайдено за методом максимальної правдоподібності. Результати свідчать про достатньо високу ефективність запропонованого методу під час прогнозування сильноволатильних гетероскедастичних часових рядів. |
format |
Article |
author |
Зражевська, Н.Г. |
author_facet |
Зражевська, Н.Г. |
author_sort |
Зражевська, Н.Г. |
title |
Метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів |
title_short |
Метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів |
title_full |
Метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів |
title_fullStr |
Метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів |
title_full_unstemmed |
Метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів |
title_sort |
метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів |
publisher |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України |
publishDate |
2015 |
topic_facet |
Математичні методи, моделі, проблеми і технології дослідження складних систем |
url |
http://dspace.nbuv.gov.ua/handle/123456789/123492 |
citation_txt |
Метод згладженої автокореляційної функції для прогнозування варіації гетероскедастичних часових рядів / Н.Г. Зражевська // Системні дослідження та інформаційні технології. — 2015. — № 3. — С. 97-108. — Бібліогр.: 12 назв. — укр. |
series |
Системні дослідження та інформаційні технології |
work_keys_str_mv |
AT zraževsʹkang metodzgladženoíavtokorelâcíjnoífunkcíídlâprognozuvannâvaríacíígeteroskedastičnihčasovihrâdív |
first_indexed |
2025-07-08T23:45:46Z |
last_indexed |
2025-07-08T23:45:46Z |
_version_ |
1837124395962728448 |
fulltext |
Н.Г. Зражевська, 2015
Системні дослідження та інформаційні технології, 2015, № 3 97
УДК 519.6:519.81
МЕТОД ЗГЛАДЖЕНОЇ АВТОКОРЕЛЯЦІЙНОЇ ФУНКЦІЇ
ДЛЯ ПРОГНОЗУВАННЯ ВАРІАЦІЇ
ГЕТЕРОСКЕДАСТИЧНИХ ЧАСОВИХ РЯДІВ
Н.Г. ЗРАЖЕВСЬКА
Запропоновано новий метод для побудови прогнозу варіації сильноволатиль-
них гетероскедастичних часових рядів. За модель часового ряду взято авторег-
ресію нескінченного порядку. Параметри моделі знайдено як розв’язок сис-
теми рівнянь Тьопліца, у якій використовуються модельні коефіцієнти
автокореляції, за запропонованим методом. Модель автокореляційної функції
на кожному кроці прогнозування побудовано шляхом розв’язання оптиміза-
ційної задачі, що враховує умову сильної залежності. Метод протестовано на
штучно згенерованому та реальному часових рядах. Для порівняння результа-
тів прогнозування обрано модель авторегресії, параметри якої знайдено за
методом максимальної правдоподібності. Результати свідчать про достатньо
високу ефективність запропонованого методу під час прогнозування сильно-
волатильних гетероскедастичних часових рядів.
ВСТУП
Формалізація даних у вигляді часових рядів використовується у багатьох
сферах людської діяльності. Практично всі природничі та гуманітарні науки
в тому чи іншому вигляді потребують методів для аналізу та класифікації
часових послідовностей. Прикладами часових рядів є короткострокові нери-
зикові процентні ставки, що відіграють важливу роль у функціюванні фі-
нансової системи світу. Вони безпосередньо пов’язані із станом споживчого
ринку, встановленням цін на акції, інфляцією, глобальною економікою та
використовуються як фінансовими інститутами, так і приватними інвесто-
рами для контролю ризиків портфелів. Економічні і, зокрема, фінансові ча-
сові ряди мають специфічні характеристики. Фінансові ряди, як правило,
нестаціонарні. Однією з важливих характеристик часових рядів є волатиль-
ність — статистичний показник, що характеризує межі змін ринкової ціни
або доходу. У термінах статистики волатильність виражається дисперсією.
Часові ряди є гетероскедастичними, якщо їхня точкова умовна дисперсія
змінюється з часом, що є характерною рисою фінансових часових рядів
у кризові періоди. Нерідко в таких рядах зустрічається ефект сильної залеж-
ності. Це ускладнює можливість застосування класичних методів дослі-
дження часових рядів та побудову традиційних моделей для їх прогнозуван-
ня. Для моделювання таких рядів використовують моделі класу GARCH [1],
у яких умовна дисперсія процесу залежить від попередніх значень ряду та
від попередніх значень дисперсії. Для врахування ефекту сильної залежності
у роботі [2] було запропоновано модель FIGARCH.
Методи прогнозування часових рядів за авторегресійною, ARMA та
GARCH моделями проаналізовано у роботі П.І. Бідюка [3]. Як було показа-
но, зокрема, у роботі Е. Зівота [4], FIGARCH процес еквівалентний процесу
Н.Г. Зражевська
ISSN 1681–6048 System Research & Information Technologies, 2015, № 3 98
авторегресії нескінченного порядку. За методом редукції від авторегресійної
моделі нескінченного порядку переходять до авторегресії зі скінченним по-
рядком, який є достатньо великим числом. За цим підходом не враховується
інформація щодо сильної залежності та гетероскедастичності, що може при-
звести до збільшення похибки прогнозних значень. У цьому дослідженні
зроблено спробу покращення моделі, що має застосовуватись для прогнозу-
вання сильнольноволатильних часових рядів, що підкоряються умові силь-
ної залежності, шляхом максимального використання апріорної інформації
та згладження автокореляційної функції, що має на меті зменшення впливу
випадкових факторів та недовизначеності моделі.
МОДЕЛІ ЧАСОВИХ ГЕТЕРОСКЕДАСТИЧНИХ РЯДІВ
Розглядаємо часовий ряд ...},2,1,0,{ tX t записаний у вигляді
tt uX , (1)
де ,constu t — стохастичний процес з нульовим середнім. Через ][1 tE
будемо позначати умовне математичне сподівання, задане на інформаційній
множині, що складається з попередніх значень ряду та іншої інформації, яка
відома в момент часу .1t
Процес, для якого 0][1 ttE , а умовну дисперсію ][ 2
1
2
ttt E пред-
ставлено як лінійну функцію квадратів попередніх значень процесу
,2
1
2
it
q
i it 0 , 0i , qi ,,2,1 (2)
називається процесом авторегресійної умовної скедастичності — ARCH(q).
Формули (1) (2) визначають модель ARCH(q).
Показано [4], що процес ARCH )(q може бути записано у вигляді авто-
регресійного процесу AR ).(q Якщо покласти
ttt v 22 , (3)
де tv — незалежні однаково розподілені випадкові величини (н.о.р.в.в.),
то з (2):
tit
q
i it v 2
1
2 . (4)
GARCH ),( pq є узагальненням моделі ARCH .)(q За цією моделлю умовна
дисперсія залежить не тільки від квадратів попередніх значень процесу,
а й від попередніх значень самої умовної дисперсії:
2
1
2
1
2
jt
p
j jit
q
i it . (5)
Застосовуючи оператор зсуву 1 tt XLX , можна переписати (2) і (5)
в операторному вигляді:
,)( 22
tt L (6)
,)()( 222
ttt LL (7)
де
q
i
i
i LL
1
)( , .)(
1
p
j
j
j LL
Метод згладженої автокореляційної функції для прогнозування варіації …
Системні дослідження та інформаційні технології, 2015, № 3 99
Умови 0 , 0i , ,,,2,1 qi 0j , pj ,,2,1 є достатніми для
коректності моделі [1]. Формально (7) можна записати у вигляді
.))(1())()(1( 2
tt vLLL
Модель, для якої 1)1()1( , називається IGARCH:
,))(1()1)(( 2
tt vLLL (8)
де оператор 1)1))(()(1()( LLLL має порядок ,1m
),max( qpm .
Подальшим узагальненням є модель FIGARCH ),,( qdp [2]:
,))(1()1)(( 2
tt
d vLLL (9)
де
1
)(
)1()(
)(
)1(
j
jd L
jd
dj
L — оператор дробової різниці ( )( —
гамма функція). Для коректності моделі достатньо покласти
p
i i
q
i i 11
1,0 . Якщо із ),2/1,0(d то модель описує часові
ряди сильною залежністю з параметром Херста .2/1 dH
Модель (9) можна переписати у вигляді
212 )())1(1( tt L (10)
або
,)())1(1( 212
ttt vL (11)
де dLLL )1)(())1(1(1)( 1 . При цьому 3
3
2
21)( LLLL .
Модель FIGARCH ),,( qdp коректно визначена і 02 t майже напев-
но для всіх t за умови 0k , ,2,1,0k .Таким чином, FIGARCH ),,( qdp
можна визначити як модель ARCH )( для дисперсії часового ряду (пред-
ставлення (2)) або як модель AR )( для квадратів процесу }{ 2
t (представ-
лення (11)).
ОЦІНЮВАННЯ ПАРАМЕТРІВ АВТОРЕГРЕСІЙНОЇ МОДЕЛІ
ЗА УМОВИ СИЛЬНОЇ ЗАЛЕЖНОСТІ
Для оцінки параметрів моделі (9), використовують метод максимальної
правдоподібності та метод максимальної квазиправдоподібності, оскільки
для волатильних рядів функції правдоподібності мають явний вигляд. У цій
роботі використовується представлення (11) (з переходом до моделі
AR )( ), що є зручним для побудови прогнозу. Надалі вважаємо ряд сильно
залежним в сенсі наступного означення [5].
Означення. Часовий ряд ...},2,1,0,{ tX t з автокореляційною функ-
цією (АКФ) ),()( ktt XXCorrk , }0{Nk підкоряється сильній залеж-
ності (довгостроковій залежності або залежності з далеким радіусом), якщо
існує 10 та константа 0rc такі, що:
Н.Г. Зражевська
ISSN 1681–6048 System Research & Information Technologies, 2015, № 3 100
1)/()(lim
kck r
k
. (12)
Таким чином, АКФ повільно спадає, а це призводить до розбіжності
ряду
k
k)( . Характеристикою сильної залежності в (9) є параметр .d
У загальному випадку задача побудови моделі AR )( у вигляді
tNtNtt vXaXaX ...11 , ..... ввронvt , (13)
зводиться до задачі оцінювання коефіцієнтів '
1 ,...),...,( Naaa
авторегресій-
ної моделі нескінченного порядку. Оцінки будуються за методом най-
менших квадратів (МНК) шляхом розв’язання нормальної системи рівнянь
[6], що, у цьому випадку, є нескінченною системою лінійних алгебраїчних
рівнянь (СЛАР) із різницевими індексами:
1
0
i
j
jji a , ,...,0i , (14)
де )(ii , ,...,0i — оцінка автокореляційної функції часового ря-
ду tX , ,...1, TTt , визначена формулою: ,
)0(ˆ
)(ˆ
)(ˆ
voc
kvoc
k )(ˆ kvoc
)()(
1
1
kj
T
lj
j XX
lT
, ,
1
1
T
lj
jX
lT
lk ,...,0 , l , де T —
актуальний момент часу.
Ввівши позначення
0,}{R jiji (автокореляційна матриця) та
'
21 ...),( b
, отримуємо нескінченну СЛАР
ba
R . (15)
Розв’язання (15) за стандартним методом редукції є некоректним,
оскільки, в силу припущення щодо сильної залежності, ряд автокореляцій-
них коефіцієнтів розбігається, а, отже, не виконується умова регулярності та
нормальності матриці СЛАР. Збіжність розв’язку редукованої системи до
точного розв’язку не гарантована.
Нескінченні СЛАР з різницевими індексами в загальному випадку екві-
валентні крайовій задачі Рімана. Альтернативою є підхід, запропонований
у роботі [7], де показано, що наближений розв’язок систем виду (14) буде
збігатись до точного розв’язку під час редукування системи з урахуванням
асимптотичної поведінки розв’язку. Вказаний підхід базується на теоремі.
Теорема (про збіжність розв’язку редукованої системи до точного
розв’язку). Якщо для АКФ часового ряду виконується асимптотичне спів-
відношення
)(~)( 12 klkk d , k , 2/10 d , (16)
то існує єдиний розв’язок системи (14), що задовольняє умові
)(sin
)21,(
~
2/1
)1( dd
ddB
c
ka rd
k
, k , (17)
Метод згладженої автокореляційної функції для прогнозування варіації …
Системні дослідження та інформаційні технології, 2015, № 3 101
та може бути знайдений шляхом розв’язання редукованої системи рівнянь
1
)1(
1
0
~~~~
Nj
d
jii
N
j
jji ja , ,,...,0 Ni (18)
де
.,
,,~
1
12
1
Niic
Ni
d
i
i
При цьому 0
~
1,
NNC
aa
.
Тут )(B — бета функція, .21 d Тоді параметр Херста
)1,2/1(2/1 dH .
Значення N визначається з умови практичної збіжності розв’язку, оскі-
льки застосування інформаційного критерію Акаїке та його модифікацій
у випадку сильної залежності не дає повної відповіді на питання, яким треба
вибрати N [8]. Вони лише визначають нижню оцінку цього значення.
Особливість запропонованого методу прогнозування полягає в тому,
що в системі нормальних рівнянь Тьопліца замість коефіцієнтів кореляції,
побудованих на спостережуваних значеннях часового ряду, використову-
ються значення згладженої за новим методом АКФ. Регресійна модель для
АКФ випливає із означення сильної залежності (асимптотичне співвідно-
шення (12)):
k
HkHHk
2
22
1 )12()( , ..... ввронk , Nkk 0 , (19)
де H — параметр Херста [5]. Отже, для побудови моделі АКФ достатньо
отримати оцінку Ĥ (відповідає накладеній умові сильної залежності часо-
вого ряду), після чого оцінки коефіцієнтів моделі (19) можна отримати шля-
хом побудови лінійної регресії з використанням МНК. Таким чином, оцінці
Ĥ можна поставити у відповідність оцінки АКФ )(~ k з похибками )(~ k .
Лінійна регресія не включає перші 0k значень автокореляцій, оскільки (1)
задає асимптотичні властивості. У роботі [9] детально описано та проаналі-
зовано широковживані методи оцінювання параметра Херста, такі як: метод
вибіркової дисперсії агрегованого ряду, метод абсолютних значень агрего-
ваних рядів, метод залишків регресії, метод нормованого розмаху, метод
періодограм. Кожен з цих методів має свої особливості, що визначають ефек-
тивність його застосування залежно від мети застосування оцінки параметра
Херста та особливих властивостей часових рядів. Оскільки в цій роботі роз-
глянуто часові ряди лише з умовами сильної залежності та стаціонарності
(для квадратів значень часових рядів), додаткова специфічна інформація
відсутня. Пропонується знайти п’ять оцінок параметра Херста за перерахо-
ваними методами оцінювання та покласти Ĥ як агреговане зважене (з рів-
ними вагами) значення оцінок, якому ставиться у відповідність )(~ k з усе-
редненою похибкою )(~ k . Для уточнення оцінок автокореляції з метою їх
застосування до задачі прогнозування, використаємо наступну оптимізацій-
ну процедуру.
Нехай задано N
kky 1}{ — значення автокореляції, за якими визначено
агреговану оцінку параметра Херста і середню дисперсію помилки цієї мо-
делі 2 . Визначаємо на повній вибірці дві підвибірки: I — ,}{ 1
1
k
kky II —
Н.Г. Зражевська
ISSN 1681–6048 System Research & Information Technologies, 2015, № 3 102
2
1 1}{ k
kkky . На підвибірці II будуємо регресійну модель (19). Для цього до-
статньо мінімізувати ,)ˆ(
2
1 1
2
k
kk
kk yy де kŷ , 21 ,1 kkk значення моделі,
що визначаються за (19). На підвибірці I визначаємо похибки моделі
2)ˆ( kk yy , 1,1 kk та обмежуємо їх значенням середньої дисперсії похибки
2 . Очевидно, що така задача мінімізації квадратичного функціоналу з квад-
ратичним обмеженням є опуклою. Однак, в силу того, що 2 — середня
(а не максимальна) дисперсія, задача може не мати допустимих розв’язків.
Для формулювання задачі з оптимальним розв’язком достатньо ввести
в праву частину обмеження релаксаційний параметр 0q , включення якого
в цільову функцію забезпечить мінімальне відхилення оптимальної моделі
від моделі, побудованої вище. Основний функціонал і релаксаційний пара-
метр в цільовій функції слід зважити з коефіцієнтом штрафу ( 10 ).
Варіювання дозволяє отримати бажаний баланс між відповідністю моделі
вихідним даним (на другий підвибірці) і відповідності моделі умові сильної
залежності (на першій підвибірці).
Таким чином, формулювання оптимізаційної задачі має вигляд:
,min)(
1
)1(
2
1 1
2
12
k
kk
kk yy
kk
q
(20)
qyy kk 22)(
, ,,.,2,1 1kk (21)
0q . (22)
У результаті розв’язання оптимізаційної задачі (20)–(22), отримуємо
уточнені оцінки параметрів 21 ˆ,ˆ й знаходимо уточнену оцінку параметра
Херста .ˆ
optimH Модель АКФ має вигляд
2
2ˆ2
1 ˆ)1ˆ2(ˆˆ)( optimH
optimoptim kHHk
, Nkk 0 . (23)
МЕТОД ПОБУДОВИ ПРОГНОЗУ СИЛЬНО ЗАЛЕЖНИХ
ЧАСОВИХ РЯДІВ НА ОСНОВІ АВТОРЕГРЕСІЙНИХ МОДЕЛЕЙ
НЕСКІНЧЕННОГО ПОРЯДКУ
Для побудови прогнозної моделі, вкажемо метод для знаходження квад-
рату значення часового ряду 2
1
ˆ
lX , використовуючи спостереження
22
1
2
0 ...,,, lXXX . Для цього використаємо авторегресійну модель нескінченно-
го порядку (13) (редуковану до моделі зі скінченним лагом) з апріорним
припущенням існування сильної залежності. Теоретичні дослідження дозво-
лили сформулювати наступний алгоритм.
Алгоритм
Крок 1. Знаходимо оцінку параметра Херста optimĤ та параметри згла-
дженої моделі АКФ за описаною в попередньому розділі процедурою.
Метод згладженої автокореляційної функції для прогнозування варіації …
Системні дослідження та інформаційні технології, 2015, № 3 103
Крок 2. Визначаємо оцінки автокореляційних коефіцієнтів )(k згідно
з моделлю (23).
Крок 3. Складаємо редуковану систему нормальних рівнянь (14), вико-
ристовуючи замість k отримані за моделлю (23) значення ,)(k та знахо-
димо оцінку '
1 )ˆ,...,ˆ(ˆ
NN aaa
вектора коефіцієнтів автокореляції за методом
Холецького [10].
Крок 4. Визначаємо лаг редукованої авторегресійної моделі ,NM
використовуючи 3 інформаційні критерії AIK (інформаційний критерій Ака-
іке), HQC (інформаційний критерій Хеннена-Куіна), SBIC (інформаційний
критерій Байєса) [8]. Значення лагу обираємо з умови мінімального відхи-
лення до отриманих трьох значень.
Крок 5. P значень прогнозу часового ряду обчислюємо за екстраполя-
ційною формулою
M
i
ilipl XaX
0
2
1
2 ˆˆ , ,...1 Nl ., .,...,1 Pp (24)
Зауважимо, що за теоремою про збіжність розв’язку редукованої сис-
теми до точного розв’язку, отриманний розв’язок редукованої системи буде
за нормою збігатися до точного. Проте через накопичення похибки
апроксимації точність прогнозу може суттєво зменшуватись із
збільшенням .P
Застосуємо запропонований алгоритм до прогнозування гетероскеда-
стичних рядів із сильною залежністю (представлення (11)).
За базу верифікації результатів прогнозування із застосуванням запро-
понованого методу (алгоритм) використаємо прогноз, отриманий за широко
відомим методом максимальної правдоподібності побудови авторегресійної
моделі часового ряду.
Розглядаємо редуковану модель AR )( p , у якій лаг обирається за інфор-
маційним критерієм. Враховуємо, що 0][ tE , 22 ][,][ xtt XDD .
Вважаємо }{ tX стаціонарним в широкому сенсі. Оцінимо параметри моделі
авторегрессії ia й 2
методом максимальної правдоподібності. Припускає-
мо, що ),0(~}{ 2
Nt . Для гаусівського вектора ,,...,( 1 M
TM XXX
),...,1 TMM XX функція максимальної правдоподібності може бути записа-
на у вигляді:
2
2
1
2/)(
2
)(
expdet)2();;(
aS
RaXf TM
TTMTM ,
де ),...,( 1 Maaa
— вектор параметрів моделі,
TMjkTM jkRR
,1,
)( —
автокореляційна матриця вектора TMX
, ),()( 12 MM
M XXRaS
.
1
2
€1
T
k
M
j
jkMjTM XaX
Н.Г. Зражевська
ISSN 1681–6048 System Research & Information Technologies, 2015, № 3 104
Для знаходження оцінок параметрів ia й 2
методом максимальної
правдоподібності розглядається задача максимізації функції ,);;( aXf TM
яка зводиться до СЛАР [11].
Для порівняння фактичного часового ряду, спрогнозованого ряду за
методом згладженої автокореляції та спрогнозованого ряду за методом мак-
симальної правдоподібності, використаємо Diebold-Mariano тест [12].
Нехай }{ tX — часовий ряд, який прогнозуємо та )1(
|
ˆ
tptX й )2(
|
ˆ
tptX —
два прогнози, які порівнюємо. Похибки прогнозів цих моделей позначимо
відовідно: )1(
|
)1(
|
ˆ
tptpttpt XX , )2(
|
)2(
| tptpttpt XX
.
Нехай 0T — загальна кількість P -крокових прогнозів. Прогноз на
P -кроків було побудовано для .,...,Ttt o Таким чином маємо дві послідов-
ності похибок прогнозів: T
ttpt 0
}{ )1(
| й T
ttpt 0
}{ )2(
| . Оскільки P -кроковий про-
гноз використовує дані, що часто повторюються, отримані послідовності
похибок будуть корельованими.
Нехай точність кожного прогнозу вимірюється функцією втрат:
2,1),(),( )(
|
)(
| iLyyL i
tpt
i
tptpt . У якості такої функції беремо функцію
квадратів похибки: 2,1,)()(2 2)(
|
)(
| iL i
tpt
i
tpt .
Для порівняння моделей перевіряємо основну гіпотезу: )][(: )1(
|0 tptLEH
.)]([ )2(
|tptLE Тоді альтернативна гіпотеза .)]([)]([: )2(
|
)1(
|1 tpttpt LELEH
Нехай )()( )2(
|
)1(
| tpttptt LLd . Тоді гіпотеза .0][:0 tdEH Перевіряємо
гіпотезу ,0H використовуючи статистику тесту Дієболда-Маріано:
2/1)/ˆ( TVRL
d
DM
d
,
де
T
tt
td
T
d
00
1
, ,),(cov,2
1
0 jttj
j
jd ddLRV
dVRL ˆ — оцінка
асимптотичної дисперсії для dT .
DM є вихідною характеристикою тесту Дієболда-Маріано. Якщо взяти
рівень достовірності 05,0 , то при 96,1DM прогнози є подібними,
в іншому випадку суттєво різняться.
У кількісному вимірі якість прогнозування визначимо похибками:
N
i
ii yyNME
1
)ˆ(/1 — середня похибка;
N
i
ii yyNMAE
1
|ˆ|/1 — середня
абсолютна похибка;
N
i
ii yyNMSE
1
2)ˆ(/1 — середньоквадратична похиб-
Метод згладженої автокореляційної функції для прогнозування варіації …
Системні дослідження та інформаційні технології, 2015, № 3 105
ка;
N
i
ii yyNMAPE
1
%100|ˆ/1|/1 — середня абсолютна процентна похиб-
ка, де iy — фактичний квадрат значення часового ряду, iŷ — спрогнозова-
не значення.
ПОБУДОВА ПРОГНОЗУ ТА АНАЛІЗ РЕЗУЛЬТАТІВ
Метою цього розділу є побудова та порівняння з фактичними значеннями
прогнозів середніх дисперсій за методом максимальної правдоподібності та
за запропонованим методом згладження автокореляційної функції. Прогноз
для часового ряду будується на 5 кроків вперед та усереднюється на цьому
ж періоді, що відповідає стандартній в фінансовій галузі процедурі
прогнозування середньої варіації доходів фінансового інструменту на
тижневій основі.
Прогнози будуються для штучно сгенерованого часового ряду та для
реального часового ряду. Для генерування штучних даних використовуємо
модель FIGARCH(1; 0,42; 1) з параметрами: 1,0;1,0;1,0 11 . За реа-
льний часовий ряд обираємо доходи на денній основі індекса РТС — офі-
ційного індикатора Фондової біржі РТС («Российская Торговая Система»)
за 2014 рік. З метою побудови прогнозу дисперсій, значення рядів піднесені
до квадрату.
Об’єм реальної вибірки для побудови моделі 1600N . За методом
згладження АКФ застосовуємо алгоритм, описаний у попередньому розділі,
на 5 кроків вперед з максимальним лагом для АКФ рівним 55. Значення
прогнозу усереднюються та декларуються як прогноз середньої дисперсії
на наступний робочий тиждень. Потім індекс значень часовогу ряду
збільшується на одиницю та процедура повторюється. Таким чином, на
кожному кроці модель АКФ перебудовується для врахування актуальних
даних. За методом максимальної правдоподібності використовується
аналогічна процедура.
Результати прогнозування для штучно сгенерованого часового ряду
FIGARCH )1;42,0;1( графічно зображені на рис. 1 (Method 1 — метод
максимальної правдоподібності, Method 2 — метод згладження авто-
кореляційної функції, 2X — фактичні значення). З графіку видно, що про-
гноз, отриманий за методом згладження АКФ значно краще відтворює як
абсолютні відхилення фактичного часового ряду, так і тенденції локальних
трендів (зростання-падання) у порівнянні з прогнозом за методом
максимальної правдоподібності. Суттєвою перевагою запропонованого
методу є також значне зменшення затримки під час прогнозування точок
перелому локального тренду. Для порівняння траєкторій прогнозів моделей
використано Diebold-Mariano тест. Отримано характеристику: DM
96,1948,0 . Таким чином, для штучно згенерованих даних траєкторія
прогнозу за методом згладження автокореляційної функції подібна траєкто-
рії прогнозу за методом найбільшої правдоподібності, що свідчить про
коректність запропонованого методу, оскільки на даних з контрольованими
властивостями, обидва методи, в цілому, подібні та дозволяють отримати
достовірний прогноз.
Н.Г. Зражевська
ISSN 1681–6048 System Research & Information Technologies, 2015, № 3 106
Результати прогнозування для реального часового ряду доходів на ден-
ній основі індекса РТС графічно зображені на рис. 2. Реальні дані задоволь-
няють припущенням, покладеним в основу побудови прогнозу не в повній
мірі, а, отже, якість прогнозу суттєво гірша, що видно з рисунку. Особливіс-
тю цього випадку є те, що прогноз, отриманий за методом згладження АКФ,
є більш консервативним у порівнянні з прогнозом за методом максимальної
правдоподібності, що обумовлюється згладженням АКФ. Як і для штучних
даних, він значно краще відтворює як абсолютні відхилення фактичного
часовогу ряду, так і тенденцію локальних трендів, а також демонструє
значне зменшення затримки при прогнозуванні точок перелому локального
тренду. Отже, запропонований метод згладження АКФ має переваги
у порівнянні зі стандартним методом прогнозування для сильно
волатильних часових рядів. Характеристика порівняння прогнозних траєк-
торій за Diebold-Mariano тестом: .96,151,4 DM Отже, на відміну від ви-
падку штучних даних, прогнози, отримані за методом згладження АКФ та
за методом максимальної правдоподібності, суттєво різняться.
Diebold-Mariano тест дозволяє визначати лише подібність/відмінність
прогнозів, побудованих за різними моделями. Для кількісної оцінки якості
прогнозів використаємо міри похибок ME, MAE, MSE та MAPE. Отримані
значення наведено в таблиці (ЗД — згенеровані дані, РТС — дані доходів
індексу РТС, Method 1 — метод максимальної правдоподібності,
Method 2 — метод згладження АКФ). Значення похибок підтверджують ре-
зультати, отримані у ході графічного аналізу. Похибки прогнозу за методом
згладження АКФ менші за похибки прогнозу за методом максимальної
правдоподібності. При цьому похибки, отримані під час прогнозування
згенерованого часового ряду, більші в порівнянні з похибками
прогнозування реальних даних. Відношення похибок для різних методів
Рис. 1. Усереднені за 5 значеннями квадрати згенерованного часового ряду
(Smoothed 2Y ), значення згладжених прогнозів за методом максимальної правдопо-
дібності (Method 1) та методом згладження АКФ (Method 2)
Метод згладженої автокореляційної функції для прогнозування варіації …
Системні дослідження та інформаційні технології, 2015, № 3 107
змінюється під час переходу від штучних даних до реальних даних, що
також свідчить про перевагу застосування запропонованого методу при
прогнозуванні поведінки реальних сильно волатильних часових рядів
у порівнянні зі стандартними методами.
Таблиця. Похибки прогнозу для згенерованих і реальних даних
ME MAE MSE MAPE (%)
Метод
РТС З.Д. РТС З.Д. РТС З.Д. РТС З.Д.
Method 1 0,666 0,842 1,507 1,252 5,157 2,196 262,94 240,51
Method 2 –0 ,55 –0,261 1,017 0,569 4,435 0,711 81,156 76,61
ВИСНОВКИ
У роботі запропоновано новий метод для побудови прогнозу варіації силь-
новолатильних гетероскедастичних часових рядів за наявності сильної за-
лежності. Прогноз побудовано на основі авторегресійної моделі нескінчен-
ного порядку, що еквівалентна моделі FIGARCH. Новим є метод
оцінювання коефіцієнтів моделі, що базується на розв’язанні нескінченної
системи нормальних рівнянь Тьопліца. У якості коефіцієнтів системи взято
значення, отримані за допомогою моделі АКФ, побудова якої запропонована
авторами. Модель АКФ базується на агрегованій оцінці параметра Херста,
що є основною характеристикою сильної залежності та дозволяє адаптувати,
шляхом вирішення оптимізаційної задачі, модель АКФ саме для викорис-
тання її в алгоритмі прогнозування. Для розв’язання системи рівнянь
Тьопліца запропоновано застосування методу редукування, що враховує
асимптотичну поведінку коефіцієнтів моделі АКФ. Лаг редукованої авто-
регресійної моделі визначається за інформаційними критеріями.
Рис. 2. Усереднені за 5 значеннями квадрати згенерованного часового ряду індексу
РТС (Smoothed 2Y ), значення згладжених прогнозів за методом максимальної прав-
доподібності (Method 1) та методом згладження АКФ (Method 2)
Н.Г. Зражевська
ISSN 1681–6048 System Research & Information Technologies, 2015, № 3 108
Метод протестовано на штучно згенерованих за моделлю FIGARCH
даних та застосовано для побудови прогнозу середніх дисперсій для реаль-
ного часового ряду доходів індексу РТС за 2014 рік. У якості порівняння
було також побудовано прогноз вказаних часових рядів за методом авторег-
ресії, отриманої у відповідності до відомого методу максимальної правдо-
подібності. Отримані в ідентичних умовах прогнози порівняні між собою за
Diebold-Mariano тестом, який продемонстрував подібність прогнозних траек-
торій для штучно згенерованих даних та суттєву відмінність для реальних
даних. Отже, теоретичне обгрунтування запропонованого методу прогнозу-
вання є коректним. Побудовані кількісні оцінки порівняння прогнозів з фак-
тичними значеннями показують суттєве підвищення ефективності запропо-
нованого методу прогнозування в порівнянні з широковживаними
методами. Зокрема, окрім зменшення похибки прогнозу, запропонований
метод дозволяє отримати прогноз, який значно краще відтворює як
абсолютні відхилення фактичного часовогу ряду, так і тенденцію локальних
трендів, та також демонструє значне зменшення затримки при прогнозуванні
точок перелому локального тренду.
Результати роботи можуть бути використані для прогнозування поведі-
нки гетероскедастичних сильнозалежних часових рядів в фінансовій сфері
діяльності.
ЛІТЕРАТУРА
1. Bollerslev T. Generalized autoregressive conditional heteroskedasticity // Journal of
Econometrics. — 1986. — № 31. — P. 307–327.
2. Baillie R.T., Bollerslev T., and Mikkelsen H.O. Fractionally integrated generalized
autoregressive conditional heteroskedasticity // Journal of Econometrics. —
1996. — №4. — P. 3–30.
3. Бідюк П.І. Системний підхід до прогнозування на основі моделей часових
рядів // Системні дослідження та інформаційні технології. — 2003. —
№ 3. — С. 88–110.
4. Zivot E., Wang J. Modeling Financial Time Series with S-PLUS. — NY: Springer-
Verlag, 2003. — 705 p.
5. Palma W. Long-Memory Time Series: Theory and Methods. — NewJersey: John
Wiley& Sons, Inc, 2007. — 304 p.
6. Strobach P. Linear Prediction Theory: A Mathematical Basis for Adaptive Sys-
tems. — NY: Springer-Verlag, 1990. — 422 p.
7. Зражевський О.Г. Системний підхід до відновлення функціональних залежностей
нестаціонарних часових рядів різної структури // Автореферат дисертації на
здобуття наукового ступеня ктн. — 2011. — 20 с.
8. Baillie R. T., Kapetanios G., F.Papailias F .Modified information criteria and selec-
tion of long memory time series models // Computational Statistics and Data
Analysis. — 2014. — №76. — P. 116–131.
9. Taqqu M,S., Teverovsky V.,Willinger W. Estimators for long-range dependence: An
empirical study // Fractals. — 1995. — P. 785–798.
10. Durbin J. The fitting of time series models // Rev. Int. Stat. — 1960. — 28. —
P. 233–244.
11. Тараскин А.Ф. Статистический анализ временных рядов авторегрессии
и скользящего среднего. — Самара: Самар. гос. аэрокосм. ун-т, 1998. — 64 с.
12. Diebold Francis X. Comparing Predictive Accuracy, Twenty Years Later: A Per-
sonal Perspective on the Use and Abuse of Diebold–Mariano Tests // Journal of
Business & Economic Statistics. — 2015. — 33, № 1. — 16 р.
Надійшла 02.06.2015
|