Bài thảo luận môn kinh tế lượng
Nhóm 2 –Lớp học phần : 0905AMAT0411
Đề tài: Hiện tượng phương sai sai số thay đổi ,
cách phát hiện và khắc phục.
I. Ví dụ 1
Bảng số liệu gồm 3 biến
obs Y X Z
1 66.00000 6.000000 7.000000
2 72.00000 7.000000 6.000000
3 78.00000 7.000000 5.000000
4 82.00000 8.000000 5.000000
5 74.00000 8.000000 6.000000
6 90.00000 10.00000 6.000000
7 102.0000 11.00000 5.000000
8 108.0000 12.00000 5.000000
9 112.0000 12.00000 4.000000
10 118.0000 13.00000 4.000000
Lập hàm hổi quy mẫu Ŷ = β1+β2*X+β3*Z
Dependent Variable: Y
Method: Least Squares
Date: 04/09/09 Time: 10:11
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 55.29630 10.84960 5.096621 0.0014
X 6.083333 0.492335 12.35607 0.0000
Z -4.203704 1.299147 -3.235743 0.0143
R-squared 0.986862 Mean dependent var 90.20000
Adjusted R-squared 0.983108 S.D. dependent var 18.55802
S.E. of regression 2.411941 Akaike info criterion 4.842066
Sum squared resid 40.72222 Schwarz criterion 4.932841
Log likelihood -21.21033 Hannan-Quinn criter. 4.742485
F-statistic 262.9049 Durbin-Watson stat 1.425305
Prob(F-statistic) 0.000000
Tính được phần dư e
Last updated: 04/09/09 - 10:13
Modified: 1 10 // hoiquymau.makeresid
1 3.629630
2 -0.657407
3 1.138889
4 -0.944444
5 -4.740741
6 -0.907407
7 0.805556
8 0.722222
9 0.518519
10 0.435185
Tính được giá trị ước lượng của Y : Ŷ
Last updated: 04/09/09 - 10:13
Modified: 1 10 // hoiquymau.fit(f=actual) yf
1 62.37037
2 72.65741
3 76.86111
4 82.94444
5 78.74074
6 90.90741
7 101.1944
8 107.2778
9 111.4815
10 117.5648
\
Tạo biến e2 = e^2
1. Kiểm định
Kiểm định Park
Dependent Variable: LOG(E2)
Method: Least Squares
Date: 04/09/09 Time: 10:17
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 24.21826 8.412174 2.878954 0.0205
LOG(YF) -5.385885 1.874718 -2.872903 0.0207
R-squared 0.507801 Mean dependent var 0.074239
Adjusted R-squared 0.446276 S.D. dependent var 1.570787
S.E. of regression 1.168864 Akaike info criterion 3.326799
Sum squared resid 10.92995 Schwarz criterion 3.387316
Log likelihood -14.63399 Hannan-Quinn criter. 3.260412
F-statistic 8.253573 Durbin-Watson stat 2.208081
Prob(F-statistic) 0.020736
P-value = 0.0207 < 0.05 => Có hiện tượng phương sai sai số thay đổi
Kiểm định Glejser
Dependent Variable: ABS(E)
Method: Least Squares
Date: 04/09/09 Time: 10:18
Sample: 1 10
Included observations: 10
Variable
Coefficien
t Std. Error t-Statistic Prob.
C 5.700307 2.109986 2.701585 0.0270
YF -0.047121 0.022965 -2.051894 0.0743
R-squared 0.344814 Mean dependent var 1.450000
Adjusted R-squared 0.262916 S.D. dependent var 1.479385
S.E. of regression 1.270106 Akaike info criterion 3.492934
Sum squared resid 12.90535 Schwarz criterion 3.553451
Log likelihood -15.46467 Hannan-Quinn criter. 3.426547
F-statistic 4.210270 Durbin-Watson stat 2.360428
Prob(F-statistic) 0.074289
P-value = 0.0743 > 0.05 => không có hiện tượng Phuong sai sai số thay đổi
Kiểm định White không lát cắt
Từ hàm hồi quy mẫu chọn View->Residual tests -> Heteroskedasticity Test: White
Heteroskedasticity Test: White
F-statistic 1.885625 Prob. F(2,7) 0.2213
Obs*R-squared 3.501219 Prob. Chi-Square(2) 0.1737
Scaled explained SS 2.674228 Prob. Chi-Square(2) 0.2626
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 04/09/09 Time: 10:22
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C -7.784209 15.52286 -0.501468 0.6314
X^2 -0.003926 0.071863 -0.054633 0.9580
Z^2 0.423027 0.334867 1.263270 0.2469
R-squared 0.350122 Mean dependent var 4.072222
Adjusted R-squared 0.164442 S.D. dependent var 7.579084
S.E. of regression 6.927953 Akaike info criterion 6.952331
Sum squared resid 335.9757 Schwarz criterion 7.043106
Log likelihood -31.76165 Hannan-Quinn criter. 6.852750
F-statistic 1.885625 Durbin-Watson stat 2.574620
Prob(F-statistic) 0.221264
R
2
hq phụ
= 0.350122
Dùng kiểm định LM = nR
2
hồi quy phụ
= 10× 0.350122= 3.50122
Nếu nR
2
hồi quy phụ
> χ
2
0.05
(2) Bác bỏ H
0
χ
2
0.05
(2) = 5.99
⇒ nR
2
hồi quy phụ
< χ
2
0.05
(2) ⇒ Không có hiện tượng phương sai sai số thay đổi
2. Biện pháp khắc phục
Sử dụng giả thiết 1 : Phương sai của sai số tỷ lệ với bình phương của biến giải thích
Tạo 3 biến mới
y1 = y/x
x2 = 1/x
x3 = z/x
Hồi quy mẫu với 3 biến mới
Dependent Variable: Y1
Method: Least Squares
Date: 04/09/09 Time: 10:28
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 5.965677 0.578796 10.30704 0.0000
X2 53.64877 11.63814 4.609740 0.0025
X3 -3.700592 1.365256 -2.710549 0.0302
R-squared 0.885136 Mean dependent var 9.761156
Adjusted R-squared 0.852318 S.D. dependent var 0.834514
S.E. of regression 0.320699 Akaike info criterion 0.806696
Sum squared resid 0.719934 Schwarz criterion 0.897472
Log likelihood -1.033481 Hannan-Quinn criter. 0.707116
F-statistic 26.97092 Durbin-Watson stat 1.588679
Prob(F-statistic) 0.000514
Thu đươc phần dư mới e1
Last updated: 04/09/09 - 10:30
Modified: 1 10 // makeresid
1 0.410219
2 -0.172137
3 0.156350
4 -0.108903
5 -0.646329
6 -0.110199
7 0.111977
8 0.105505
9 0.130456
10 0.123061
Và ước lượng của Y1
Last updated: 04/09/09 - 10:31
Modified: 1 10 // fit(f=actual) y1f
1 10.58978
2 10.45785
3 10.98651
4 10.35890
5 9.896329
6 9.110199
7 9.160751
8 8.894495
9 9.202877
10 8.953862
Kiểm định lại bằng phương pháp Park
Dependent Variable: LOG(E1^2)
Method: Least Squares
Date: 04/09/09 Time: 10:32
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C -19.31492 11.32579 -1.705392 0.1265
LOG(Y1F) 6.911710 4.974460 1.389439 0.2021
R-squared 0.194404 Mean dependent var -3.587130
Adjusted R-squared 0.093705 S.D. dependent var 1.251611
S.E. of regression 1.191528 Akaike info criterion 3.365206
Sum squared resid 11.35790 Schwarz criterion 3.425723
Log likelihood -14.82603 Hannan-Quinn criter. 3.298819
F-statistic 1.930541 Durbin-Watson stat 2.376092
Prob(F-statistic) 0.202147
P-value = 0.2021 > 0.05 => hiện tượng phương sai sai số thay đổi đã được khắc phục
II. Ví dụ 2
Bảng số liệu gồm 3 biến
obs Y X Z
1 5.170000 1.000000 7.000000
2 4.600000 2.000000 4.000000
3 5.370000 3.000000 0.000000
4 5.640000 3.000000 5.000000
5 4.270000 4.000000 1.000000
6 5.260000 6.000000 0.000000
7 7.140000 7.000000 7.000000
8 8.740000 8.000000 5.000000
9 7.110000 9.000000 0.000000
10 6.530000 9.000000 2.000000
11 6.530000 9.000000 6.000000
12 6.360000 11.00000 1.000000
13 9.730000 12.00000 7.000000
14 6.850000 14.00000 0.000000
15 7.880000 16.00000 1.000000
16 8.170000 16.00000 2.000000
17 11.80000 16.00000 7.000000
18 6.060000 19.00000 0.000000
19 14.69000 20.00000 7.000000
20 9.010000 22.00000 1.000000
21 18.13000 22.00000 2.000000
22 8.850000 24.00000 2.000000
23 7.200000 25.00000 0.000000
24 18.72000 25.00000 5.000000
25 9.800000 25.00000 3.000000
26 13.80000 26.00000 2.000000
27 6.200000 26.00000 0.000000
28 9.120000 28.00000 5.000000
29 18.54000 29.00000 7.000000
30 22.52000 29.00000 4.000000
Lập hàm hồi quy mẫu Ŷ = β1+β2*X+β3*Z
Dependent Variable: Y
Method: Least Squares
Date: 04/16/09 Time: 09:14
Sample: 1 30
Included observations: 30
Variable Coefficient Std. Error t-Statistic Prob.
C 1.602773 1.343437 1.193039 0.2432
X 0.362525 0.063466 5.712073 0.0000
Z 0.674948 0.217137 3.108397 0.0044
R-squared 0.602211 Mean dependent var 9.326333
Adjusted R-squared 0.572745 S.D. dependent var 4.771772
S.E. of regression 3.119056 Akaike info criterion 5.207578
Sum squared resid 262.6698 Schwarz criterion 5.347697
Log likelihood -75.11366 Hannan-Quinn criter. 5.252403
F-statistic 20.43759 Durbin-Watson stat 2.031447
Prob(F-statistic) 0.000004
Tính phẫn dư e
Last updated: 04/16/09 - 09:16
Modified: 1 30 // makeresid
1 -1.519934
2 -0.427615
3 2.679652
4 -0.425088
5 0.542179
6 1.482077
7 -1.725084
8 0.862287
9 2.244502
10 0.314606
11 -2.385186
12 0.094504