На основании официальной статистики (www.gks.ru) рассмотрите временной ряд для конкретного социально-экономического показателя, состоящий не менее чем из 20 уровней (это могут быть поквартальные или помесячные данные). Изобразите графически динамику исходного ряда. Выделите неслучайные компоненты динамического ряда (тренд и/или сезонную/циклическую компоненту), рассчитав значения автокорреляционной функции от 10 и более лаговых переменных. Изобразите автокорреляционную функцию на диаграмме. Выберете величину лага. Постройте модель динамического ряда. Рассчитайте теоретические значения социально-экономического показателя и протестируйте остатки на предмет автокорреляции (критерий Дарбина-Уотсона), определите прогнозные значения показателя на три года (или др. отрезка времени) вперед.
Решение.
Среднемесячная номинальная начисленная заработная плата одного работника в целом по РФ, руб.
Год Квартал руб.
2010 I 19485
II 20809
III 21031
IV 23491
2011 I 21354
II 23154
III 23352
IV 26905
2012 I 24407
II 26547
III 26127
IV 30233
2013 I 27339
II 30245
III 29578
IV 33269
2014 I 30057
II 32963
III 31730
IV 35657
Решение.
Для выявления структуры ряда (т. е. состава компонент) строят автокорреляционную функцию.
Автокорреляция уровней ряда – корреляционная между последовательными уровнями одного и того же ряда динамики (сдвинутыми на определенный промежуток времени L – лаг). То есть связь между рядом: Х1, Х2, … Хn-L и рядом Х1+L, Х2+L, … Хn, где L – положительное целое число. Автокорреляция может быть измерена коэффициентом автокорреляции.
Лаг (сдвиг во времени) определяет порядок коэффициента автокорреляции. Если L = 1, то имеем коэффициент автокорреляции 1-го порядка rt,t-1. Если L = 2, то коэффициент автокорреляции 2-го порядка rt,t-2 и т.д.
Следует учитывать, что с увеличением лага на единицу число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается на 1. Поэтому обычно рекомендуют максимальный порядок коэффициента автокорреляции, равный n/4.
Рассчитав несколько коэффициентов автокорреляции, можно определить лаг (I), при котором автокорреляция (rt,t-L) наиболее высокая, выявив тем самым структуру временного ряда.
Если наиболее высоким оказывается значение rt,t-1, то исследуемый ряд додержит только тенденцию. Если наиболее высоким оказался rt,t-L, то ряд содержит (помимо тенденции) колебания периодом L.
Если ни один из rt,t-L (l=1;L) не является значимым, можно сделать одно из двух предположений:
• либо ряд не содержит тенденции и циклических колебаний, а его уровень определяется только случайной компонентой;
• либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ.
Чтобы найти коэффициент корреляции 1-го порядка, нужно найти корреляцию между рядами (расчет производится не по 20, а по 19 парам наблюдений):
Сдвигаем исходный ряд на 1 уровень. Получаем следующую таблицу:
№ yt yt – 1
1 19485 20809 379665225 433014481 405463365
2 20809 21031 433014481 442302961 437634079
3 21031 23491 442302961 551827081 494039221
4 23491 21354 551827081 455993316 501626814
5 21354 23154 455993316 536107716 494430516
6 23154 23352 536107716 545315904 540692208
7 23352 26905 545315904 723879025 628285560
8 26905 24407 723879025 595701649 656670335
9 24407 26547 595701649 704743209 647932629
10 26547 26127 704743209 682620129 693593469
11 26127 30233 682620129 914034289 789897591
12 30233 27339 914034289 747420921 826539987
13 27339 30245 747420921 914760025 826868055
14 30245 29578 914760025 874858084 894586610
15 29578 33269 874858084 1106826361 984030482
16 33269 30057 1106826361 903423249 999966333
17 30057 32963 903423249 1086559369 990768891
18 32963 31730 1086559369 1006792900 1045915990
19 31730 35657 1006792900 1271421649 1131396610
Сумма 502076 518248 13605845894 14497602318 13990338745
Среднее 26425,05 27276,21 716097152,32 763031700,95 736333618,16
Линейный коэффициент автокорреляции rt,t-1:
Сдвигаем исходный ряд на 2 уровня. Получаем следующую таблицу:
№ yt yt – 2
1 19485 21031 379665225 442302961 409789035
2 20809 23491 433014481 551827081 488824219
3 21031 21354 442302961 455993316 449095974
4 23491 23154 551827081 536107716 543910614
5 21354 23352 455993316 545315904 498658608
6 23154 26905 536107716 723879025 622958370
7 23352 24407 545315904 595701649 569952264
8 26905 26547 723879025 704743209 714247035
9 24407 26127 595701649 682620129 637681689
10 26547 30233 704743209 914034289 802595451
11 26127 27339 682620129 747420921 714286053
12 30233 30245 914034289 914760025 914397085
13 27339 29578 747420921 874858084 808632942
14 30245 33269 914760025 1106826361 1006220905
15 29578 30057 874858084 903423249 889025946
16 33269 32963 1106826361 1086559369 1096646047
17 30057 31730 903423249 1006792900 953708610
18 32963 35657 1086559369 1271421649 1175361691
Сумма 470346 497439 12599052994 14064587837 13295992538
Среднее 26130,33 27635,50 699947388,56 781365990,94 738666252,11
Линейный коэффициент автокорреляции rt,t-2:
Сдвигаем исходный ряд на 3 уровня. Получаем следующую таблицу:
№ yt yt – 3
1 19485 23491 379665225 551827081 457722135
2 20809 21354 433014481 455993316 444355386
3 21031 23154 442302961 536107716 486951774
4 23491 23352 551827081 545315904 548561832
5 21354 26905 455993316 723879025 574529370
6 23154 24407 536107716 595701649 565119678
7 23352 26547 545315904 704743209 619925544
8 26905 26127 723879025 682620129 702946935
9 24407 30233 595701649 914034289 737896831
10 26547 27339 704743209 747420921 725768433
11 26127 30245 682620129 914760025 790211115
12 30233 29578 914034289 874858084 894231674
13 27339 33269 747420921 1106826361 909541191
14 30245 30057 914760025 903423249 909073965
15 29578 32963 874858084 1086559369 974979614
16 33269 31730 1106826361 1006792900 1055625370
17 30057 35657 903423249 1271421649 1071742449
Сумма 437383 476408 11512493625 13622284876 12469183296
Среднее 25728,41 28024,00 677205507,35 801310875,06 733481370,35
Линейный коэффициент автокорреляции rt,t-3:
Сдвигаем исходный ряд на 4 уровня. Получаем следующую таблицу:
№ yt yt – 4
1 19485 21354 379665225 455993316 416082690
2 20809 23154 433014481 536107716 481811586
3 21031 23352 442302961 545315904 491115912
4 23491 26905 551827081 723879025 632025355
5 21354 24407 455993316 595701649 521187078
6 23154 26547 536107716 704743209 614669238
7 23352 26127 545315904 682620129 610117704
8 26905 30233 723879025 914034289 813418865
9 24407 27339 595701649 747420921 667262973
10 26547 30245 704743209 914760025 802914015
11 26127 29578 682620129 874858084 772784406
12 30233 33269 914034289 1106826361 1005821677
13 27339 30057 747420921 903423249 821728323
14 30245 32963 914760025 1086559369 996965935
15 29578 31730 874858084 1006792900 938509940
16 33269 35657 1106826361 1271421649 1186272733
Сумма 407326 452917 10609070376 13070457795 11772688430
Среднее 25457,88 28307,31 663066898,50 816903612,19 735793026,88
Линейный коэффициент автокорреляции rt,t-4:
Сдвигаем исходный ряд на 5 уровней. Получаем следующую таблицу:
№ yt yt – 5
1 19485 23154 379665225 536107716 451155690
2 20809 23352 433014481 545315904 485931768
3 21031 26905 442302961 723879025 565839055
4 23491 24407 551827081 595701649 573344837
5 21354 26547 455993316 704743209 566884638
6 23154 26127 536107716 682620129 604944558
7 23352 30233 545315904 914034289 706001016
8 26905 27339 723879025 747420921 735555795
9 24407 30245 595701649 914760025 738189715
10 26547 29578 704743209 874858084 785207166
11 26127 33269 682620129 1106826361 869219163
12 30233 30057 914034289 903423249 908713281
13 27339 32963 747420921 1086559369 901175457
14 30245 31730 914760025 1006792900 959673850
15 29578 35657 874858084 1271421649 1054662746
Сумма 374057 431563 9502244015 12614464479 10906498735
Среднее 24937,13 28770,87 633482934,33 840964298,60 727099915,67
Линейный коэффициент автокорреляции rt,t-5:
Сдвигаем исходный ряд на 6 уровней. Получаем следующую таблицу:
№ yt yt – 6
1 19485 23352 379665225 545315904 455013720
2 20809 26905 433014481 723879025 559866145
3 21031 24407 442302961 595701649 513303617
4 23491 26547 551827081 704743209 623615577
5 21354 26127 455993316 682620129 557915958
6 23154 30233 536107716 914034289 700014882
7 23352 27339 545315904 747420921 638420328
8 26905 30245 723879025 914760025 813741725
9 24407 29578 595701649 874858084 721910246
10 26547 33269 704743209 1106826361 883192143
11 26127 30057 682620129 903423249 785299239
12 30233 32963 914034289 1086559369 996570379
13 27339 31730 747420921 1006792900 867466470
14 30245 35657 914760025 1271421649 1078445965
Сумма 344479 408409 8627385931 12078356763 10194776394
Среднее 24605,64 29172,07 616241852,21 862739768,79 728198313,86
Линейный коэффициент автокорреляции rt,t-6:
Сдвигаем исходный ряд на 7 уровней. Получаем следующую таблицу:
№ yt yt – 7
1 19485 26905 379665225 723879025 524243925
2 20809 24407 433014481 595701649 507885263
3 21031 26547 442302961 704743209 558309957
4 23491 26127 551827081 682620129 613749357
5 21354 30233 455993316 914034289 645595482
6 23154 27339 536107716 747420921 633007206
7 23352 30245 545315904 914760025 706281240
8 26905 29578 723879025 874858084 795796090
9 24407 33269 595701649 1106826361 811996483
10 26547 30057 704743209 903423249 797923179
11 26127 32963 682620129 1086559369 861224301
12 30233 31730 914034289 1006792900 959293090
13 27339 35657 747420921 1271421649 974826723
Сумма 314234 385057 7712625906 11533040859 9390132296
Среднее 24171,85 29619,77 593278915,85 887156989,15 722317868,92
Линейный коэффициент автокорреляции rt,t-7:
Сдвигаем исходный ряд на 8 уровней. Получаем следующую таблицу:
№ yt yt – 8
1 19485 24407 379665225 595701649 475570395
2 20809 26547 433014481 704743209 552416523
3 21031 26127 442302961 682620129 549476937
4 23491 30233 551827081 914034289 710203403
5 21354 27339 455993316 747420921 583797006
6 23154 30245 536107716 914760025 700292730
7 23352 29578 545315904 874858084 690705456
8 26905 33269 723879025 1106826361 895102445
9 24407 30057 595701649 903423249 733601199
10 26547 32963 704743209 1086559369 875068761
11 26127 31730 682620129 1006792900 829009710
12 30233 35657 914034289 1271421649 1078018081
Сумма 286895 358152 6965204985 10809161834 8673262646
Среднее 23907,92 29846,00 580433748,75 900763486,17 722771887,17
Линейный коэффициент автокорреляции rt,t-8:
Сдвигаем исходный ряд на 9 уровней. Получаем следующую таблицу:
№ yt yt – 9
1 19485 26547 379665225 704743209 517268295
2 20809 26127 433014481 682620129 543676743
3 21031 30233 442302961 914034289 635830223
4 23491 27339 551827081 747420921 642220449
5 21354 30245 455993316 914760025 645851730
6 23154 29578 536107716 874858084 684849012
7 23352 33269 545315904 1106826361 776897688
8 26905 30057 723879025 903423249 808683585
9 24407 32963 595701649 1086559369 804527941
10 26547 31730 704743209 1006792900 842336310
11 26127 35657 682620129 1271421649 931610439
Сумма 256662 333745 6051170696 10213460185 7833752415
Среднее 23332,91 30340,45 550106426,91 928496380,45 712159310,45
Линейный коэффициент автокорреляции rt,t-9:
Сдвигаем исходный ряд на 10 уровней. Получаем следующую таблицу:
№ yt yt – 10
1 19485 26127 379665225 682620129 509084595
2 20809 30233 433014481 914034289 629118497
3 21031 27339 442302961 747420921 574966509
4 23491 30245 551827081 914760025 710485295
5 21354 29578 455993316 874858084 631608612
6 23154 33269 536107716 1106826361 770310426
7 23352 30057 545315904 903423249 701891064
8 26905 32963 723879025 1086559369 886869515
9 24407 31730 595701649 1006792900 774434110
10 26547 35657 704743209 1271421649 946586379
Сумма 230535 307198 5368550567 9508716976 7135355002
Среднее 23053,5 30719,8 536855056,7 950871697,6 713535500,2
Линейный коэффициент автокорреляции rt,t-10:
Лаг (порядок) rt,t-L
1 0,845
2 0,951
3 0,799
4 0,992
5 0,778
6 0,924
7 0,676
8 0,981
9 0,629
10 0,859
Вывод: в данном ряду динамики имеется тенденция, а также имеются периодические колебания с периодом, равным 4.
Построение аддитивной модели временного ряда.
Общий вид аддитивной модели следующий:
Y = T + S + E
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой (T), сезонной (S) и случайной (E) компонент.
Рассчитаем компоненты аддитивной модели временного ряда.
Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого:
Найдем скользящие средние (гр. 3 таблицы). Полученные таким образом выровненные значения уже не содержат сезонной компоненты.
Приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух последовательных скользящих средних – центрированные скользящие средние (гр. 4 табл.).
t yt Скользящая средняя Центрированная скользящая средняя Оценка сезонной компоненты
1 19485 – – –
2 20809 21204 – –
3 21031 21671,25 21437,63 -406,63
4 23491 22257,5 21964,38 1526,63
5 21354 22837,75 22547,63 -1193,63
6 23154 23691,25 23264,5 -110,5
7 23352 24454,5 24072,88 -720,88
8 26905 25302,75 24878,63 2026,38
9 24407 25996,5 25649,63 -1242,63
10 26547 26828,5 26412,5 134,5
11 26127 27561,5 27195 -1068
12 30233 28486 28023,75 2209,25
13 27339 29348,75 28917,38 -1578,38
14 30245 30107,75 29728,25 516,75
15 29578 30787,25 30447,5 -869,5
16 33269 31466,75 31127 2142
17 30057 32004,75 31735,75 -1678,75
18 32963 32601,75 32303,25 659,75
19 31730 – – –
20 35657 – – –
Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими средними (гр. 5 табл.). Используем эти оценки для расчета значений сезонной компоненты S. Для этого найдем средние за каждый квартал (по всем годам) оценки сезонной компоненты Si. В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна нулю.
Показатели 1 2 3 4
1 – – -406,63 1526,63
2 -1193,63 -110,5 -720,88 2026,38
3 -1242,63 134,5 -1068 2209,25
4 -1578,38 516,75 -869,5 2142
5 -1678,75 659,75 – –
Всего за период -5693,38 1200,5 -3065 7904,25
Средняя оценка сезонной компоненты -1423,34 300,13 -766,25 1976,06
Скорректированная сезонная компонента, Si -1444,99 278,48 -787,9 1954,41
Для данной модели имеем:
Корректирующий коэффициент:
Рассчитываем скорректированные значения сезонной компоненты Si и заносим полученные данные в таблицу.
Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины T + E = Y – S (гр. 4 табл.). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.
Определим компоненту T данной модели. Для этого проведем аналитическое выравнивание ряда (T + E) с помощью линейного тренда. Результаты аналитического выравнивания следующие:
T = 19244,831 + 727,792t
Подставляя в это уравнение значения t = 1,…,20, найдем уровни T для каждого момента времени (гр. 5 табл.).
t yt Si yt – Si T T + Si E = yt – (T + Si) E2
1 19485 -1444,99 20929,99 19972,62 18527,63 957,37 916555,78
2 20809 278,48 20530,52 20700,42 20978,89 -169,89 28863,25
3 21031 -787,9 21818,9 21428,21 20640,31 390,69 152639,31
4 23491 1954,41 21536,59 22156 24110,41 -619,41 383673,71
5 21354 -1444,99 22798,99 22883,79 21438,8 -84,8 7191,05
6 23154 278,48 22875,52 23611,58 23890,06 -736,06 541786
7 23352 -787,9 24139,9 24339,38 23551,48 -199,48 39791,65
8 26905 1954,41 24950,59 25067,17 27021,58 -116,58 13591,66
9 24407 -1444,99 25851,99 25794,96 24349,97 57,03 3252,5
10 26547 278,48 26268,52 26522,75 26801,23 -254,23 64633,1
11 26127 -787,9 26914,9 27250,55 26462,65 -335,65 112659,39
12 30233 1954,41 28278,59 27978,34 29932,75 300,25 90148,54
13 27339 -1444,99 28783,99 28706,13 27261,14 77,86 6062,4
14 30245 278,48 29966,52 29433,92 29712,4 532,6 283663,11
15 29578 -787,9 30365,9 30161,72 29373,82 204,18 41690,7
16 33269 1954,41 31314,59 30889,51 32843,92 425,08 180691,47
17 30057 -1444,99 31501,99 31617,3 30172,31 -115,31 13295,91
18 32963 278,48 32684,52 32345,09 32623,57 339,43 115213,45
19 31730 -787,9 32517,9 33072,88 32284,99 -554,99 308009,74
20 35657 1954,41 33702,59 33800,68 35755,09 -98,09 9621,86
3313034,57
Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням T значения сезонной компоненты для соответствующих кварталов (гр. 6 табл.).
Для оценки качества построенной модели применим сумму квадратов полученных абсолютных ошибок
Следовательно, можно сказать, что аддитивная модель объясняет 99% общей вариации уровней временного ряда.
Прогнозирование по аддитивной модели. Прогнозное значение Ft уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда: T = 19244,831 + 727,792t.
руб.
руб.
руб.
Соответствующие сезонные компоненты равны .
Тогда прогнозные значения составят:
руб.
руб.
руб.
Критерий Дарбина-Уотсона.
Этот критерий является наиболее известным для обнаружения автокорреляции.
При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин ei.
y y(x) ei = y-y(x) e2 (ei – ei-1)2
19485 19646,49 -161,49 26077,64 0
20809 20408,61 400,39 160313,54 315706,26
21031 21170,73 -139,73 19524,7 291732,38
23491 21932,85 1558,15 2427820,88 2882787,81
21354 22694,98 -1340,98 1798216,47 8404911,6
23154 23457,1 -303,1 91868,7 1077189,59
23352 24219,22 -867,22 752072,35 318234,26
26905 24981,34 1923,66 3700453,91 7788996,91
24407 25743,47 -1336,47 1786141,81 10628399,08
26547 26505,59 41,41 1714,89 1898546,25
26127 27267,71 -1140,71 1301222,22 1397413,74
30233 28029,83 2203,17 4853941,15 11181516,36
27339 28791,96 -1452,96 2111082,27 13367232,15
30245 29554,08 690,92 477371,9 4596210,49
29578 30316,2 -738,2 544941,46 2042391,28
33269 31078,32 2190,68 4799061,07 8578323,08
30057 31840,45 -1783,45 3180681,83 15793650,09
32963 32602,57 360,43 129910,38 4596210,49
31730 33364,69 -1634,69 2672217,05 3980514,02
35657 34126,81 1530,19 2341468,32 10016449,23
Сумма 33176102,56 109156415,06
Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона:
Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 20 и количества объясняющих переменных m=1.
Автокорреляция отсутствует, если выполняется следующее условие:
d1 < DW и d2 < DW < 4 – d2.
Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1,5 < DW < 2,5. Поскольку 1,5 < 3,29 > 2,5, то автокорреляция остатков присутствует.
Для более надежного вывода целесообразно обращаться к табличным значениям.
По таблице Дарбина-Уотсона для n=20 и k=1 (уровень значимости 5%) находим: d1 = 1,20; d2 = 1,41.
Поскольку 1,20 < 3,29 и 1,41 < 3,29 > 4 – 1,41, то автокорреляция остатков присутствует.