Причинно-следственная связь по Грейнджеру
На практических примерах временных рядов предлагаются методы прогнозирования и поиска причинно-следственных связей по Грейнджеру.
Збережено в:
Дата: | 2012 |
---|---|
Автори: | , |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2012
|
Назва видання: | Теорія оптимальних рішень |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/85026 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Причинно-следственная связь по Грейнджеру / В.М. Горбачук, Г.А. Шулинок // Теорія оптимальних рішень: Зб. наук. пр. — 2012. — № 11. — С. 119-125. — Бібліогр.: 9 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-85026 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-850262015-07-19T03:02:23Z Причинно-следственная связь по Грейнджеру Горбачук, В.М. Шулинок, Г.А. На практических примерах временных рядов предлагаются методы прогнозирования и поиска причинно-следственных связей по Грейнджеру. На практичних прикладах часових рядів пропонуються методи прогнозування та пошуку причинно-наслідкових зв’язків за Грейнджером. The methods of forecasting and Granger causality search are proposed, based upon practical examples of time series. 2012 Article Причинно-следственная связь по Грейнджеру / В.М. Горбачук, Г.А. Шулинок // Теорія оптимальних рішень: Зб. наук. пр. — 2012. — № 11. — С. 119-125. — Бібліогр.: 9 назв. — рос. XXXX-0013 http://dspace.nbuv.gov.ua/handle/123456789/85026 519.8 ru Теорія оптимальних рішень Інститут кібернетики ім. В.М. Глушкова НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
description |
На практических примерах временных рядов предлагаются методы прогнозирования и поиска причинно-следственных связей по Грейнджеру. |
format |
Article |
author |
Горбачук, В.М. Шулинок, Г.А. |
spellingShingle |
Горбачук, В.М. Шулинок, Г.А. Причинно-следственная связь по Грейнджеру Теорія оптимальних рішень |
author_facet |
Горбачук, В.М. Шулинок, Г.А. |
author_sort |
Горбачук, В.М. |
title |
Причинно-следственная связь по Грейнджеру |
title_short |
Причинно-следственная связь по Грейнджеру |
title_full |
Причинно-следственная связь по Грейнджеру |
title_fullStr |
Причинно-следственная связь по Грейнджеру |
title_full_unstemmed |
Причинно-следственная связь по Грейнджеру |
title_sort |
причинно-следственная связь по грейнджеру |
publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
publishDate |
2012 |
url |
http://dspace.nbuv.gov.ua/handle/123456789/85026 |
citation_txt |
Причинно-следственная связь по Грейнджеру / В.М. Горбачук, Г.А. Шулинок // Теорія оптимальних рішень: Зб. наук. пр. — 2012. — № 11. — С. 119-125. — Бібліогр.: 9 назв. — рос. |
series |
Теорія оптимальних рішень |
work_keys_str_mv |
AT gorbačukvm pričinnosledstvennaâsvâzʹpogrejndžeru AT šulinokga pričinnosledstvennaâsvâzʹpogrejndžeru |
first_indexed |
2025-07-06T12:11:31Z |
last_indexed |
2025-07-06T12:11:31Z |
_version_ |
1836899520153124864 |
fulltext |
Теорія оптимальних рішень. 2012. 119
ÒÅÎвß
ÎÏÒÈÌÀËÜÍÈÕ
вØÅÍÜ
На практических примерах вре-
менных рядов предлагаются ме-
тоды прогнозирования и поиска
причинно-следственных связей по
Грейнджеру.
В. М. Горбачук, Г. А. Шулинок,
2012
ÓÄÊ 519.8
Â. Ì. ÃÎÐÁÀ×ÓÊ, Ã. À. ØÓËÈÍÎÊ
ÏÐÈ×ÈÍÍÎ-ÑËÅÄÑÒÂÅÍÍÀß ÑÂßÇÜ
ÏÎ ÃÐÅÉÍÄÆÅÐÓ
Введение. При наблюдениях временных ря-
дов часто возникает вопрос о причинно-
следственных связях между ними. В отличие
от кросс-секционных данных, наблюдения
временных рядов упорядочены во времени:
значение занятости (минимальной зарплаты,
инфляции, денежной массы) в данной стране
в году t может зависеть от значения этого
показателя в предыдущие годы 1−t , K,2−t ,
1. Статистические свойства оценивателей
обычного метода наименьших квадратов
(ОМНК) как случайных переменных основа-
ны на том, что выборки являются случайно
отобранными из соответствующей генераль-
ной совокупности [1–3]. Поскольку разные
случайные выборки содержат, вообще гово-
ря, разные значения зависимой и независи-
мых переменных (дохода, зарплаты, стажа,
семейного положения), то оцениватели
ОМНК, вычисленные на разных выборках,
вообще говоря, будут отличаться.
Рассмотрим в период t методы прогнози-
рования 11101 +++ +α+α= ttt uxy процесса
временного ряда в будущий период 1+t
(год, квартал, месяц, неделю, день, час, ми-
нуту) [4], которые основаны на регрессиях и
исходят из информационного множества
t
kkkt xyI
0
},{ == , используемого в естествнн-
ном условии 0)|( 1 =−tt IuE . Обозначим tf
прогноз на шаг вперед (one-step-ahead fore-
cast) и обозначим ttt fye −= ++ 11 ошибку
прогноза (forecast error). Так как 1+ty – слу-
чайная переменная, то 1+te – также случай-
ная переменная.
В. М. ГОРБАЧУК, Г. А. ШУЛИНОК
Теорія оптимальних рішень. 2012. 120
Самыми распространенными мерами потерь, связанных с прогнозом, явля-
ются квадрат ошибки 2
1)( +te и модуль || 1+te . Значение 2
1)( +te одинаково для
ошибок 1+± te ; значение || 1+te одинаково для ошибок 1+± te .
Лучший прогноз tf минимизирует, при данном информационном множест-
ве tI , ожидаемые потери
]|)[(]|)[( 2
1
2
1 ttttt IfyEIeE −= ++ .
Если ∞<)( 2
YE , а для функции )(Xg выполняется неравенство
∞<})]({[ 2
XgE , то по свойству условной вероятности для среднего )(Xµ име-
ем
}|)]({[}|)]({[ 22
XXgYEXXYE −≤µ− ,
откуда следует значение лучшего прогноза )|( 1
*
ttt IyEf += .
0)|( 1
* == + ttt IyEf , K,2,1,0=t , если ∞
=0}{ tty является разностно-
мартингальной последовательностью, где знание прошлого не влияет на лучший
прогноз. Аналогично лучший прогноз *
,htf на много шагов ( h шагов) вперед
(multiple-step-ahead-forecast) равен )|( tht IyE + .
Отдачи акции часто приближают разностно-мартингальной последователь-
ностью, но с положительным средним
)(),,,|( 1011 +−+ = tttt yEyyyyE K .
Процесс }{ ty называют мартингалом, если
)(),,,|( 011 tttt yEyyyyE =−+ K , K,2,1,0=t
}{ ty∆ – разностно-мартингальная последовательность, если }{ ty – мартингал
Методом прогнозирования также является экспоненциальное сглаживание
0
0
11 )1()1()|( yyyIyE
t
tttt
−
−+ α−α++α−α+α= K (1)
с параметром )1,0(∈α (весовой коэффициент kktt )1()1( )( α−α=α−α −− при
kty − экспоненициально убывает к 0 с ростом k ). Из уравнения (1) следует
0111112
*
1 )1()|()|( yyIyEIyEf α−α+α=== + ,
=α−α+α−α+α=== + 0
2
1221223
*
2 )1()1()|()|( yyyIyEIyEf
*
12122012 )1()|()1(])1([)1( fyIyEyyyy α−+α=α−+α=α−α+αα−+α= ,
и т. д. Отсюда в предположении *
00 fy = получаем рекуррентную зависимость
*
11
* )1()|( −+ α−α+α== ttttt fyIyEf , K,2,1=t ,
которая требует выбора параметра α . Регрессионные методы позволяют оцени-
вать значения таких параметров.
Если для прогнозирования применять статическую регрессионную модель
ПРИЧИННО-СЛЕДСТВЕННАЯ СВЯЗЬ ПО ГРЕЙНДЖЕРУ
Теорія оптимальних рішень. 2012. 121
ttt uzy +β+β= 10 (2)
с единственной объясняющей переменной tz , а в период t известны параметры
0β , 1β , то лучший прогноз (при условии знания 1+tz ) определяется
)|()|(),,,,|( 11101,111
*
ttttttttt IuEIzEzyzyzyEf ++++ +β+β== K .
Если объясняющая переменная не является временным трендом или сезон-
ной переменной, то значение 1+tz в будущий период )1( +t неизвестно. Кроме
того, если }{ tu содержит серийную корреляцию, то 0)|( 1 ≠+ tt IuE .
Для прогнозирования более подходящей является не статическая модель (2),
а модель с только лаговыми значениями y и z :
tttt uzyy +γ+α+δ= −− 11110 , (3)
0)|( 1 =−tt IuE .
Отсюда, используя 111 )|( −−− = ttt yIyE , 111 )|( −−− = ttt zIzE , получаем
11101 ++ +γ+α+δ= tttt uzyy ,
=+γ+α+δ== ++ )|()|()|()|( 11101
*
ttttttttt IuEIzEIyEIyEf
tt zy 110 γ+α+δ= .
Можно по выборке размера n найти ОМНК-оценки 0δ̂ , 1α̂ , 1γ̂ для значе-
ний 0δ , 1α , 1γ параметров зависимости (3) и построить точечный прогноз (point
forecast) для 1+ny
nf̂ tt zy 110 ˆˆˆ γ+α+δ= , (4)
а в период )1( +n вычислить ошибку прогноза
nnn fye ˆˆ 11 −= ++ . (5)
Интервал прогноза (forecast interval) определяют таким самым способом, как
интервал предвидения (prediction interval) 95 % при классических предположе-
ниях линейной модели. Зависимость (3) содержит лаговую зависящую перемен-
ную 1−ty и поэтому не удовлетворяет этим предположениям, но интервал про-
гноза остается приближенно валидным, если погрешность )|( 1−tt Iu (погреш-
ность tu при данной информационном множестве 1−tI ) является нормально ра-
спределенной с нулевым средним и постоянной дисперсией. При такой погреш-
ности )|( 1−tt Iu , ОМНК-оценки являются приближенно нормально распреде-
ленными с обычными ОМНК-дисперсиями, а погрешность 1+tu не зависит от
ОМНК-оценивателей, имеет нулевое среднее и дисперсию 2σ .
Значения nf̂ точечного прогноза и его стандартной ошибки (standard error)
)ˆ( nfSE можно получить как пересечение (intercept) и его стандартную ошибку
В. М. ГОРБАЧУК, Г. А. ШУЛИНОК
Теорія оптимальних рішень. 2012. 122
для регрессии ty по )( 1 nt yy −− и )( 1 nt zz −− , nt ,,2,1 K= . Из уравнения (5) сле-
дует
222
1 ˆ)]ˆ([)]ˆ([ σ+=+ nn fSEeSE , (6)
где σ€ – оценка для σ . Тогда интервал прогноза 95 % задается
))ˆ(96.1ˆ),ˆ(96.1ˆ( 11 ++ +− nnnn eSEfeSEf . (7)
Ошибка )ˆ( nfSE приближенно пропорциональна
n
1
и поэтому мала по сравне-
нию с σ̂ (мерой неопределенности погрешности )1+nu .
На данных США 1948–1996 гг. табл. 1 [5] (с помощью MS Excel) оценим
параметры простой авторегрессии AR(1)
ttt uUU +β+β= −110
для уровня tU (%) гражданской безработицы (civilian unemployment) в году t :
=tU€ 1.572 + 0.732 1−tU , (8)
(0.577) (0.097)
Здесь выражение в круглых скобках означает стандартную ошибку соответст-
вующей оценки параметра; 4819481996 =−=n ; 554.02 =R ; нормированная
(adjusted) величина 544.02 =R ; 049.1€ =σ .
На этих же данных оценим параметры модели
tttt vPUU +α+β+β= −− 11110 ,
обобщающей зависимость (8) путем учета инфляции – роста 1−tP (%) средних
потребительских цен (consumer price index, CPI) в году )1( −t :
=tU€ 1.304 + 0.647 1−tU + 0.184 1−tP , (9)
(0.490) (0.084) (0.041)
48=n ; 691.02 =R ; нормированная величина 677.02 =R ; 883.0€ =σ .
Хотя модель (9) имеет лучшее значение нормированной величины 2
R , чем
модель (8), и довольно значимую t-статистику для инфляции ( 96.146.4 >> ), это
не обязательно означает, что модель (9) дает лучший прогноз безработицы на
следующий после наблюдений 1997 г., чем модель (8). По модели (9)
=1997
€U 1.304 + 0.647 1996U + 0.184 1996P = 1.304 + 0.647 × 5.4 + 0.184 × 3.0 = 5.35,
а по модели (8) –
=1997
€U 1.572 + 0.732 1996U = 1.572 + 0.732 × 5.4 = 5.53.
Наблюдение дает =1997U 4.9 (табл. 2 [5]), что ближе к прогнозу модели (9).
На этих же данных оценим параметры модели
tttt wPUU +−α+−β+β= −− )0.3()4.5( 11110 :
=tU€ 5.348 + 0.647 ( 1−tU – 5.4) + 0.184 ( 1−tP – 3.0); (10)
(0.137) (0.084) (0.041)
ПРИЧИННО-СЛЕДСТВЕННАЯ СВЯЗЬ ПО ГРЕЙНДЖЕРУ
Теорія оптимальних рішень. 2012. 123
48=n ; 691.02 =R ; нормированная величина 677.02 =R ; 883.0€ =σ . Тогда из
соотношений (4), (10) следует )€( nfSE = 0.137, откуда в силу равенства (6) имеем
=+=σ+=+
5.0225.022
1 )883.0137.0(}€)]€({[)€( nn fSEeSE 0.893.
Таким образом, интервал прогноза по модели (9) определяется формулой (7):
))€(96.1€),€(96.1€( 11 ++ +− nnnn eSEfeSEf =
= (5.348 – 1.96 × 0.893, 5.348 + 1.96 × 0.893) = (3.597, 7.100).
Очевидно, =1997U 4.9 принадлежит этому интервалу.
Обычно требуется вырабатывать прогноз для каждого периода (времени):
например, в 1996-м году требуется выработать прогноз 1997U ; когда становятся
известными значения 1997U , 1997P , требуется выработать прогноз 1998U . Если
вырабатывать прогноз 1998U на основе модели (3), то это можно делать по
крайней мере двумя способами:
1) использовать формулу (4) 1998
€f 19979619979696 €€€ PU γ+α+δ= , где парамет-
ры 96
€δ , 96€α , 96€γ оцениваются на 49 наблюдениях 1996
1948},{ =ttt PU ;
2) использовать формулу (4) 1998
€f 19979719979797 €€€ PU γ+α+δ= , где парамет-
ры 97
€δ , 97€α , 97€γ оцениваются на 50 наблюдениях 1997
1948},{ =ttt PU , включающих
предыдущие 49 наблюдений 1996
1948},{ =ttt PU .
Для способа 1) применим соотношение (9) и табл. 2 [5]:
1998
€f 19979619979696 €€€ PU γ+α+δ= =1.304 + 0.647 × 4.9 + 0.184 × 2.3 = 4.90.
Для способа 2) на данных США 1948–1997 гг. табл. 1, 2 [5] оценим парамет-
ры авторегрессии
ttt uUU +β+β= −110 :
=tU€ 1.549 + 0.734 1−tU ; (11)
(0.572) (0.096)
4919481997 =−=n ; 554.02 =R ; 544.02 =R ; 041.1€ =σ . На этих же данных
оценим параметры модели
tttt vPUU +α+β+β= −− 11110 :
=tU€ 1.286 + 0.648 1−tU + 0.185 1−tP , (12)
(0.484) (0.083) (0.041)
49=n ; 691.02 =R ; 677.02 =R ; 876.0€ =σ . Оценки (11) и (12) близки к оценкам
(8) и (9) соответственно, так как учитывают одно дополнительное наблюдение.
По модели (12)
=1998
€U 1.286 + 0.648 1997U + 0.185 1997P = 1.286 + 0.648 × 4.9 + 0.185 × 2.3 = 4.88,
а по модели (11) –
В. М. ГОРБАЧУК, Г. А. ШУЛИНОК
Теорія оптимальних рішень. 2012. 124
=1998
€U 1.549 + 0.734 1997U = 1.549 + 0.734 × 4.9 = 5.15.
Наблюдение дает =1998U 4.5 (табл. 2 [5]), что незначительно (на 0.02) бли-
же ближе к прогнозу модели (12) способа 2), чем модели (9) способа 1).
Зависимость (3) является одним из уравнений векторной авторегрессионной
(vector autoregressive, VAR) модели. Если авторегрессионная (AR) модель касае-
тся единственого временного ряда }{ ty , где переменная ty выражается через
собственное прошлое ,1−ty ,,2 K−ty 0y , то векторная авторегрессионная мо-
дель касается по крайней мере двух рядов }{ ty и }{ tz , где каждая переменная
ty (или tz ) выражается как через собствнное прошлое ,1−ty ,,2 K−ty 0y , так и
через прошлое другой переменной ,1−tz ,,2 K−tz 0z :
L+γ+α+γ+α+δ+= −−−− 222211110 tttttt zyzyuy , (13)
L+ρ+β+ρ+β+η+= −−−− 222211110 tttttt zyzywz , (14)
)|(0)|( 11 −− == tttt IwEIuE .
Выбор числа лагов в зависимостях (13) и (14) виден на примере модели (9): зна-
чение F-теста на совместную значимость переменных 2−tU и 2−tP подтвержда-
ет, что только одного лага для безработицы и инфляции достаточно. Если пери-
од – это год, то 1–2 лага обычно достаточно; если период – квартал, то требуется
4–8 лагов; если период – месяц, то требуется от 6 до 24 лагов.
Уравнения VAR (13) и (14) полезны при прогнозировании переменной y ,
для чего требуется оценить и проанализировать уравнение (13). Модель VAR
может включать 3 ряда }{ ty , }{ tz , { tx }. В предположении гомоскедастичности
можно применять ОМНК для оценки параметров модели.
Говорят, что z влияет по Грейнджеру (Granger causes) на y , если
),,,|(),,,,,,|( 021002211 yyyyEyzyzyzyE tttttttt KK −−−−−− ≠ ;
неравенство не означает одновременной (contemporaneous) причинности между
z и y , и нельзя сказать, является ли z экзогенной или эндогенной переменной
в зависимостях (13) и (14). Поэтому причинность по Грейнджеру не применяют
для кросс-секционных данных (Грейнджер – Нобелевский лауреат 2002 г.) [6, 7].
Говорят, что z влияет по Грейнджеру на y при условии g , если
),,,,,|(),,,,,,|( 0022,11002211 gygygyyEyzyzyzyE tttttttttt KK −−−−−−−− ≠ .
Может быть, что z влияет по Грейнджеру на y , но z не влияет по Грейнджеру
на y при условии g . Если z – рост предложения денег, y – рост реального ва-
лового внутреннего продукта, g – изменение процентных ставок, то причинно-
следственная связь по Грейнджеру имеет прикладное значение [8, 9].
Предположим, ty определяют 3 лаговые переменные 1−ty , 2−ty , 3−ty :
ttttt uyyyy +α+α+α+δ= −−− 3322110 ,
ПРИЧИННО-СЛЕДСТВЕННАЯ СВЯЗЬ ПО ГРЕЙНДЖЕРУ
Теорія оптимальних рішень. 2012. 125
0),,,|( 021 =−− yyyuE ttt K .
Гипотеза 0H о том, что переменная 1−tz не влияет по Грейнджеру на ty , сво-
дится к t-тесту для 1−tz в зависимости
tttttt uzyyyy +γ+α+α+α+δ= −−−− 113322110 ;
гипотеза 0H о том, что переменные 1−tz , 2−tz не влияют по Грейнджеру на ty ,
сводится к F-тесту на совместную значимость для 1−tz и 2−tz в зависимости
ttttttt uzzyyyy +γ+γ+α+α+α+δ= −−−−− 22113322110 .
В случае гетероскедастичности можно использовать робастные варианты тестов.
При гипотезе 0H серийная корреляция отсутствует, поскольку модель является
динамически полной.
Перед построением модели (9) была построена модель (8), где число лагов
равно 1 (модель (8) принадлежит классу AR(1)). Модель (9) говорит, что инфля-
ция влияет по Грейнджеру на безработицу.
В. М. Горбачук,Г. О. Шулінок
ПРИЧИННО-НАСЛІДКОВИЙ ЗВ’ЯЗОК ЗА ГРЕЙНДЖЕРОМ
На практичних прикладах часових рядів пропонуються методи прогнозування та пошуку
причинно-наслідкових зв’язків за Грейнджером.
V.M. Gorbachuk, G.O. Shulinok
GRANGER CAUSALITY
The methods of forecasting and Granger causality search are proposed, based upon practical
examples of time series.
1. Горбачук В. М. Економетричне програмування TSP та EViews. Препр. 96-14. – К.:
Ін-т кібернетики імені В. М. Глушкова НАН України, 1996. – 24 с.
2. Горбачук В. М. Макроекономічні методи. – К.: Альтерпрес, 1999. – 263 с.
3. Wooldridge J. M. Introductory econometrics: a modern approach. 4-th edition. – Mason,
OH: Cencage Learning, 2009. – 865 p.
4. Diebold F. X. Elements of forecasting. – Cincinnati, OH: South-Western, 1998.
5. Горбачук В. М., Кривонос Ю. Г. Особенности регрессионного анализа временных
рядов // Компьютерная математика. – 2012. – № 2. – С. 3–12.
6. Gorbachuk V. Causality in time series analysis // Nonlinear analysis and applications. –
Kyiv: NTUU “KPI”, 2012. – P. 30.
7. Gorbachuk V. M. Regression analysis of time series and Granger causality // 14-та міжна-
родна наукова конференція імені академіка М. Кравчука. Т. 3. – К.: НТУУ „КПІ”,
2012. – С. 11.
8. Stock J. H., Watson M. W. Interpreting the evidence on money-income causality // Journal
of econometrics. – 1989. – V. 40. – P. 161–181.
9. Горбачук В. М. Методи індустріальної організації. – К.: А. С. К., 2010. – 224 с.
Получено 22.05.2012
|