Bài tập phương sai sai số thay đổi.
Người ta sử dụng số liệu quan sát tại 40 thành phố của Mỹ năm 1988 để nghiên cứu môi quan hệ
của nhu cầu sử dụng xe bus 1 giờ( busdemand -tính bằng đơn vị 1000 người ) với các biến số
khác là giá vé xe bus (fare -đo bằng dollars), giá 1 thùng dầu hỏa( gasprice -đo bằng dollars)
thu nhập bình quân đầu người của thành phố(income:đo bằng dollars/ năm) dân số của thành
phố(pop đo bằng nghìn người) và mật độ dân số( Density đo bằng số người trên 1 dặm vuông.
Như vậy ta hồi qui trên mô hinh sau:
1 2 3 4 5 6
busdemand = + fare + gasprice + income + pop + density +
i i i i i i i
β β β β β β ε
.Dùng STATA ta
nhận được kết quả sau:
Source | SS df MS Number of obs = 40
+ F( 5, 34) = 78.25
Model | 212184332 5 42436866.3 Prob > F = 0.0000
Residual | 18439936.9 34 542351.084 R-squared = 0.9200
+ Adj R-squared = 0.9083
Total | 230624268 39 5913442.78 Root MSE = 736.44
busdemand | Coef. Std. Err. t P>|t| [95% Conf. Interval]
+
fare | -310.3075 433.8628 -0.72 0.479 -1192.023 571.4078
gasprice | 714.8923 2618.163 0.27 0.786 -4605.855 6035.64
income | 2005684 .0636879 -3.15 0.003 3299978 071139
pop | 1.586886 .124422 12.75 0.000 1.33403 1.839742
density | .1451475 .0388827 3.73 0.001 .0661283 .2241666
_cons | 2470.836 2584.192 0.96 0.346 -2780.873 7722.545
1. Hệ số ước lượng trên density bằng bao nhiêu? Độ lệch tiêu chuẩn tương ứng bằng bao
nhiêu?
2. Làm kiểm định Breusch-Pagan với Chi bình phương và rút ra được các kết quả sau:
Biến số Thống kê của kiểm định
Chi- bình phương
Quyết định về phương sai
đồng nhất?
fare
2.45 ?
gasprice
0.81 ?
income
0.01 ?
pop
3.53 ?
density
0.12 ?
Ta quyết định thế nào về vấn đề phương sai đồng nhất?
3. Làm kiểm định Breusch-Pagan cùng 1 lúc với hai biến Fare và Pop( bằng Chi- bình
phương) và thu được thống kê Chi bình phương bằng 6.07. Kết luận gì về vấn đề phương
sai sai số thay đổi.
hettest fare pop
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fare pop
chi2(2) = 6.07
Prob > chi2 = 0.0480
4. Nghi ngờ density là nguyên nhân dẫn đến vấn đề phương sai sai số thay đổi người ta sắp
xếp số liệu theo density, rồi chia nhỏ và làm hồi qui OLS. Làm kiểm định Goldfeld-
Quandt với mỗi mẫu nhỏ có 15 quan sát và rút ra kết luận?
.sort dénity
.regress busdemand fare gasprice income pop density if _n<16
Source | SS df MS Number of obs = 15
+ F( 5, 9) = 1.73
Model | 3211452.92 5 642290.583 Prob > F = 0.2233
Residual | 3337837.75 9 370870.861 R-squared = 0.4904
+ Adj R-squared = 0.2072
Total | 6549290.67 14 467806.476 Root MSE = 608.99
.regress busdemand fare gasprice income pop density if _n>25
Source | SS df MS Number of obs = 15
+ F( 5, 9) = 47.55
Model | 160480088 5 32096017.5 Prob > F = 0.0000
Residual | 6074413.32 9 674934.813 R-squared = 0.9635
+ Adj R-squared = 0.9433
Total | 166554501 14 11896750.1 Root MSE = 821.54
Làm kiểm định White và thu được kết quả sau. Hãy mô tả lại kiển định White và rút ra
kết luận.
5.
whitetst
White's general test statistic : 31.07551 Chi-sq(20) P-value = .0542.
6. Làm kiểm định Ramsey Reset và thu được kết quả sau. Hãy mô tả lại kiểm định này và
rút ra kết luận
ovtest
Ramsey RESET test using powers of the fitted values of busdemand
Ho: model has no omitted variables
F(3, 31) = 4.17
Prob > F = 0.0136
7. Ta tạm tin rằng do dân số pop là nguyên nhân dẫn đến phương sai sai số thay đổi và
chỉnh lại mô hình bằng cách sử dụng phương pháp WLS:
2
ar( ) /
i i
v u pop
σ
=
. Hồi qui
bằng WLS với câu lệnh sau:
reg busdemand fare gasprice income pop density [aweight=pop]
và thu được kết quả:
Source | SS df MS Number of obs = 40
+ F( 5, 34) = 268.60
Model | 865706802 5 173141360 Prob > F = 0.0000
Residual | 21916583.1 34 644605.384 R-squared = 0.9753
+ Adj R-squared = 0.9717
Total | 887623385 39 22759574 Root MSE = 802.87
busdemand | Coef. Std. Err. t P>|t| [95% Conf. Interval]
+
fare | -1367.114 425.2522 -3.21 0.003 -2231.331 -502.8979
gasprice | 1163.041 3391.929 0.34 0.734 -5730.188 8056.269
income | 197205 .0902789 -2.18 0.036 3806739 0137361
pop | 1.684187 .1088307 15.48 0.000 1.463016 1.905357
density | .081208 .0411698 1.97 0.057 0024592 .1648751
_cons | 3359.844 3388.495 0.99 0.328 -3526.407 10246.1
Nhận xét và gaiir thích kết quả vưa thu được.
8. Kiểm định Ramsey nói với chúng ta rằng có lẽ chúng ta nên giải thích mô hình với mô
hình log log và giải thích bằng đọ co dãn. Giải thích kết quả vừa thu được?
gen lnbusdemand=log( busdemand)
. gen lnincome=log(income)
. regress lnbusdemand fare gasprice lnincome pop density
Source | SS df MS Number of obs = 40
+ F( 5, 34) = 8.52
Model | 29.0603858 5 5.81207716 Prob > F = 0.0000
Residual | 23.1959939 34 .682235115 R-squared = 0.5561
+ Adj R-squared = 0.4908
Total | 52.2563797 39 1.33990717 Root MSE = .82598
lnbusdemand | Coef. Std. Err. t P>|t| [95% Conf. Interval]
+
fare | .3053295 .4865871 0.63 0.535 6835344 1.294193
gasprice | .0716445 2.937378 0.02 0.981 -5.897825 6.041114
lnincome | -4.481243 1.176696 -3.81 0.001 -6.872577 -2.08991
pop | .0003364 .0001396 2.41 0.022 .0000526 .0006201
density | .0001353 .0000433 3.12 0.004 .0000472 .0002233
_cons | 49.0144 11.87455 4.13 0.000 24.88241 73.14639