Для нормалізації даних визначимо середнє значення, дисперсію, середнє квадратичне відхилення.
х1
х2
х3
у
Дисперсія
67,70673
1,53961E+20
1,50502E+19
1,35019E+19
Середнє значення
12,28846
7,73E+09
5,06E+09
Середнє квадратичне відхилення
8,22841
Нормалізуємо дані
X1
x2
x3
y
2,760136955
-1,424378976
-1,83937
-0,01654
1,544835332
-1,294625094
-1,78859
0,124978
-0,095821859
-1,184213406
-1,81411
0,111371
-0,642707589
-0,983538147
-1,62671
0,111371
-0,581942508
-0,760296995
-1,54938
0,03517
-0,338882183
0,019838147
0,020423
-0,0111
-0,460412346
0,261615568
-0,54924
-0,04375
-0,521177427
1,075599549
0,636488
0,084156
-0,278117102
0,995007076
0,765371
0,217508
-0,15658694
0,592044709
-0,76319
1,643555
-0,338882183
1,244843743
-0,33014
2,623281
-0,551559967
1,019184818
-0,13424
2,02456
-0,338882183
0,438919009
0,025578
2,541638
F- критерій m;
Проведемо алгоритм.
Крок 1. Розбиваємо вихідні дані У на k груп. У нашому випадку існує 13 спостережень, тому розбиваємо на три групи: 4, 4, 5.
Група 1
-0,016538124
0,124977978
0,111370661
0,111371
Група 2
0,035169682
-0,011095197
-0,04375276
0,084156
Група 3
0,217507738
1,643554618
2,623281482
2,02456
2,541637576
Крок 2. Розраховуємо суму квадратів відхилень по кожній групі.
Квадрати відхилень по групам
0,01327961
0,009317205
3,806491708
Крок 3. Розраховуємо суму квадратів відхилень у цілому по всій сукупності спостережень.
Сума
2,417044007
Крок 4. Обчислюємо параметр a
Параметр a»0
Крок 5. Розраховуємо критерій m
,
Відповідно до формули m»0.
Порівнюємо з значенням c2 для степенем вольності k-1. Значення c2=5,22. Крім того 5,22>0, тому можемо стверджувати, що при вибраному рівні довіри 0,95 і ступені свободи 12 явище гетероскедастичності відсутнє.
Параметричний тест Гольдельда-Квандта
Крок 1. Впорядковуємо по Х від меншого до більшого значення з сукупності спостережень.
x1
x2
x3
y
-0,09582186
-1,294625094
-1,839369874
-0,04375276
-0,46041235
-1,294625094
-1,814108652
-0,016538124
-0,33888218
-1,184213406
-1,788589663
-0,011095197
-0,58194251
-0,983538147
-1,626711631
0,035169682
1,544835332
-0,760296995
-1,549381361
0,084156026
-0,15658694
0,019838147
-0,763190281
0,111370661
2,760136955
0,261615568
-0,549243201
0,111370661
-0,64270759
0,438919009
-0,330140769
0,124977978
-0,2781171
0,592044709
-0,134237418
0,217507738
-0,15658694
0,995007076
0,020423123
1,643554618
-0,09582186
1,019184818
0,025578474
2,024559509
1,544835332
1,075599549
0,636487608
2,541637576
2,760136955
1,244843743
0,765371391
2,623281482
Крок 2. Відкидаємо С спостережень, які знаходяться у центрі вектора. Оскільки оптимальне співвідношення:
І n=13, то с=13*4/15»3,5. Для полегшення розрахунків беремо 3.
Будуємо дві сукупності.
Перша сукупність:
-0,04375276
-0,016538124
-0,011095197
0,035169682
0,084156
-0,09582186
-0,460412346
-0,338882183
-0,581942508
1,544835
-1,29462509
-1,294625094
-1,184213406
-0,983538147
-0,7603
-1,83936987
-1,814108652
-1,788589663
-1,626711631
-1,54938
Друга сукупність:
0,217508
1,643555
2,02456
2,541638
2,623281482
-0,27812
-0,15659
-0,09582
1,544835
2,760136955
0,592045
0,995007
1,019185
1,0756
1,244843743
-0,13424
0,020423
0,025578
0,636488
0,765371391
Крок 3. Будуємо дві економетричні моделі на основі 1МНК по двох створених сукупностях спостережень. Отримали параметри А.
По першій моделі:
34,08241349
18,65117692
-77,11904746
24,77184596
По другій моделі:
-57,4484
1716,923
-1697,36
48,72941
Крок 4. Знаходимо суму квадратів залишків за першою (1) і другою (2) моделях S1 і S2.
, де — залишки по моделі (1) ;
, де — залишки по моделі (2).
Маємо значення залишків для першої моделі:
-86,61464273
-80,41315351
-74,7917
-58,74620623
-83,06359824
Тому S= 7502,096336
Значення для другої моделі залишків:
1546,624
2015,827
1952,665812
-797,713
-2603,22
При цьому S= 2392046
Крок 5. Розраховуэмо критерій R.
R= 318,8503769
Порівняємо з табличним заначенням F критерію при ступенях свободи (13-3-2*3)/2=3. Порівнюємо з R.
318,8503769>9,28. Отже робимо висновок, про те що гетероскедастичність існує.