Tải bản đầy đủ (.pdf) (13 trang)

Các Đề thi kinh tế lượng có lời giải - P7

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (662.56 KB, 13 trang )

ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
1
GV: Nguyễn Thị Mai Bình

Môn học: KINH TẾ LƯỢNG
Lớp: 04QK, 04QB, 04QB (Năm học 2006 – 2007)

Gợi ý đáp án Bài tập số 2
: MÔ HÌNH HỒI QUI BỘI



Câu 1: (40điểm) Xem xét dữ liệu về tiêu dùng thịt gà ở Mỹ giai đọan 1960 đến 1982 được trình bày
trong file Table 7.9 thuộc bộ dữ liệu của Gujarati (hoặcc file chicken demand). Trong đó:
Y = lượng thịt gà tiêu thụ bình quân đầu người (pound)
X2 = thu nhập khả dụng bình quân đầu người (USD)
X3 = Giá bán lẻ của thịt gà (cent/pound)
X4 = Giá bán lẻ của thịt bò (cent/pound)
X5 = Giá bán lẻ của thịt heo (cent/pound)
X6 = Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (cent/pound)
Các anh/chị hãy:
a) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô
hình tối ưu. Giải thích quá trình thực hiện và các kiểm định cần thiết. (α=5%)
Mô hình hồi qui tổng thể của lượng thịt gà tiêu thụ bình quân đầu người (Y) theo thu nhập khả dụng bình
quân đầu người (X2), giá bán lẻ của thịt gà (X3), giá bán lẻ của thịt bò (X4), giá bán lẻ của thịt heo (X5),
Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (X6)
(PRF): Y = β
1
+ β
2
X


2
+ β
3
X
3
+ β
4
X
4
+ β
5
X
5
+ β
6
X
6
+u
i
Chạy Eview với mô hình trên ta có:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:23
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 38.59691 4.214488 9.158150 0.0000
X2 0.004889 0.004962 0.985370 0.3383
X3 -0.651888 0.174400 -3.737889 0.0016
X4 0.243242 0.089544 2.716443 0.0147

X5 0.104318 0.070644 1.476674 0.1580
X6 -0.071110 0.098381 -0.722805 0.4796
R-squared 0.944292 Mean dependent var 39.66957
Adjusted R-squared 0.927908 S.D. dependent var 7.372950
S.E. of regression 1.979635 Akaike info criterion 4.423160
Sum squared resid 66.62224 Schwarz criterion 4.719376
Log likelihood -44.86635 F-statistic 57.63303
Durbin-Watson stat 1.100559 Prob(F-statistic) 0.000000
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến X2, X5, X6 đều lớn hơn α = 5% vì vậy
ta thực hiện kiểm định Wald với:
H
0
: β
2
= β
5
= β
6
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 5, 6)
Chạy Eview ta có kết quả:
Wald Test:
Equation: EQ01
Test Statistic Value df Probability
F-statistic 7.852143 (3, 17) 0.0017
Chi-square 23.55643 3 0.0000


Null Hypothesis Summary:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
2
Normalized Restriction (= 0) Value Std. Err.
GV: Nguyễn Thị Mai Bình
C(2) 0.004889 0.004962
C(5) 0.104318 0.070644
C(6) -0.071110 0.098381
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value =0.0017 < α = 5%
Vì vậy ta bác bỏ giả thuyết H
0
, vậy có ít nhất một giá trị β
i
≠ 0 với (i = 2, 5, 6)

Để thực hiện việc xây dựng mô hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến
độc lập. Biến được loại ra khỏi mô hình là biến có hệ số P_value lớn.
- Đầu tiên ta bỏ biến X6 ra khỏi mô hình vì biến này có P_value = 0.4796 (P_value lớn nhất). Lúc này
kết quả Eview như sau:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:42
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 37.23236 3.717695 10.01490 0.0000
X2 0.005011 0.004893 1.024083 0.3194

X3 -0.611174 0.162849 -3.753010 0.0015
X4 0.198409 0.063721 3.113734 0.0060
X5 0.069503 0.050987 1.363144 0.1896
R-squared 0.942580 Mean dependent var 39.66957
Adjusted R-squared 0.929821 S.D. dependent var 7.372950
S.E. of regression 1.953198 Akaike info criterion 4.366473
Sum squared resid 68.66969 Schwarz criterion 4.613320
Log likelihood -45.21444 F-statistic 73.87052
Durbin-Watson stat 1.065034 Prob(F-statistic) 0.000000
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến X6, ta nhận thấy vẫn còn có các biến X2, X5 có
P_value lớn hơn α = 5%. Ta tiếp tục bỏ biến X2 do P_value = 0.3194 (P_value lớn nhất) và được kết
quả như sau:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:46
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 35.68084 3.399337 10.49641 0.0000
X3 -0.654097 0.157564 -4.151300 0.0005
X4 0.232528 0.054387 4.275460 0.0004
X5 0.115422 0.024303 4.749224 0.0001
R-squared 0.939235 Mean dependent var 39.66957
Adjusted R-squared 0.929641 S.D. dependent var 7.372950
S.E. of regression 1.955702 Akaike info criterion 4.336146
Sum squared resid 72.67063 Schwarz criterion 4.533624
Log likelihood -45.86568 F-statistic 97.89329
Durbin-Watson stat 1.251523 Prob(F-statistic) 0.000000
Lúc này các biến X3, X4, X6 đều có P_value nhỏ hơn α = 5%. Vậy mô hình trên có thể là mô hình phù
hợp nhất. Tuy nhiên, để kiểm tra lại có phải việc loại bỏ biến X6, và X2 ra khổi mô hình là phù hợp. Ta

thực hiện lại việc kiểm định Wald với:
H
0
: β
2
= β
6
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 6)
Chạy Eview ta có kết quả:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
3
GV: Nguyễn Thị Mai Bình
Wald Test:
Equation: HOIQUI_U
Test Statistic Value df Probability
F-statistic 0.771684 (2, 17) 0.4778
Chi-square 1.543368 2 0.4622

Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) 0.004889 0.004962
C(6) -0.071110 0.098381
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value =0.4778 > α = 5%

Vì vậy ta chấp nhận giả thuyết H
0
, điều này có nghĩa việc loại bỏ 2 biến thu nhập khả dụng bình quân
đầu người (X2 và giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (X6) ra khỏi mô hình là phù
hợp

Mô hình hồi qui phù hợp nhất là:
Y
ˆ
= 35.68083973 - 0.6540969702*X3 + 0.2325281315*X4 + 0.1154218668*X5

b) Giải thích ý nghĩa các tham số của mô hình phù hợp nhất:
Ta có:
β
1
= 35.68083973 không giả thích được vì có ẩn chứa những biến bỏ sót ngoài mô hình hoặc chọn hàm
sai.
β
3
= - 0.6540969702: tác động biên của X3 lên Y. Trong điều kiện các biến khác không đổi, theo thông
tin từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt gà tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình
quân đầu người sẽ giảm đi 0.6540969702pound
β
4
= 0.2325281315 tác động biên của X4 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin
từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt bò tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân
đầu người sẽ tăng lên 0.2325281315 pound
β
5
= 0.1154218668 tác động biên của X5 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin

từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt heo tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân
đầu người sẽ tăng lên 0.1154218668 pound
(Với hệ số β
4
và β
5
cho thấy thịt gà có thể là sản phẩm thay thế cho thịt bò và thịt heo)
Câu 2: (40 điểm) Xem xét dữ liệu về các yếu tố ảnh hưởng đền giá nhà trong fike Data7-3 thuộc bộ
dữ liệu Ramanathan. Trong đó:
Price = giá nhà
Baths = số phòng tắm
Bedrms = số phòng ngủ
Famroom = nhận giá trị 1 nếu nhà có phòng gia đình và giá trị 0 cho trường hợp ngược lại
Firepl = nhận giá trị 1 nếu nhà có thiết bị báo cháy và giá trị 0 cho trường hợp ngược lại
Pool = nhận giá trị 1 nếu nhà có hồ bơi và giá trị 0 cho trường hợp ngược lại
Sqft = diện tích nhà
Các anh/chị hãy:
a) Xây dựng các mô hình sau theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình
nào là mô hình tối ưu (xem xét các mô hình tổng quát dưới đây). Giải thích quá trình thực hiện
và các kiểm định cần thiết. (α=5%)
a. Price = β
1
+ β
2
Baths + β
3
Bedrms + β
4
Famroom + β
5

Firepl + β
6
Pool + β
7
Sqft
Chạy mô hình trên với Eview, ta có kết quả:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 15:19
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
4
Sample: 1 14
GV: Nguyễn Thị Mai Bình
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 39.05715 89.53975 0.436199 0.6758
BATHS -0.263691 41.45465 -0.006361 0.9951
BEDRMS -7.045531 28.73627 -0.245179 0.8134
FAMROOM -21.34471 42.87340 -0.497854 0.6338
FIREPL 26.18799 53.84537 0.486355 0.6416
POOL 53.19581 22.06352 2.411030 0.0467
SQFT 0.146551 0.030101 4.868577 0.0018
R-squared 0.911504 Mean dependent var 317.4929
Adjusted R-squared 0.835650 S.D. dependent var 88.49816
S.E. of regression 35.87726 Akaike info criterion 10.30494
Sum squared resid 9010.244 Schwarz criterion 10.62447
Log likelihood -65.13456 F-statistic 12.01657
Durbin-Watson stat 2.602259 Prob(F-statistic) 0.002213
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl đều
lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:

H
0
: β
2
= β
3
= β
4
= β
5
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 3, 4, 5)
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 0.086452 (4, 7) 0.9839
Chi-square 0.345807 4 0.9867

Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -0.263691 41.45465
C(3) -7.045531 28.73627
C(4) -21.34471 42.87340
C(5) 26.18799 53.84537
Restrictions are linear in coefficients.

P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.9839 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, vậy các hệ số trước các biến Baths, Bedrms, Famroom, Firepl đều
bằng 0; hay các biến số phòng tắm, số phòng ngủ, có phòng gia đình, có thiết bị báo cháy không ảnh
hưởng đến giá nhà. Vì vậy ta có thể bỏ các biến trên ra khỏi mô hình. Lúc này ta có mô hình:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 15:29
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 22.67277 29.50580 0.768417 0.4584
POOL 52.78980 16.48172 3.202931 0.0084
SQFT 0.144415 0.014185 10.18086 0.0000
R-squared 0.907132 Mean dependent var 317.4929
Adjusted R-squared 0.890247 S.D. dependent var 88.49816
S.E. of regression 29.31856 Akaike info criterion 9.781728
Sum squared resid 9455.359 Schwarz criterion 9.918669
Log likelihood -65.47210 F-statistic 53.72383
Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
5
GV: Nguyễn Thị Mai Bình
Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồi qui lúc này:
PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT +

i

u
ˆ

b. Price = β
1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft + β
8
Firepl* Sqft
Chạy mô hình trên với Eview, ta có kết quả:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:33
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -391.6926 362.2206 -1.081365 0.3211
BATHS -5.049608 40.23999 -0.125487 0.9042
BEDRMS 0.068210 28.36362 0.002405 0.9982
FAMROOM -21.67260 41.42130 -0.523223 0.6196
FIREPL 437.6739 340.0121 1.287230 0.2454
POOL 65.52753 23.57464 2.779578 0.0320
SQFT 0.502063 0.291755 1.720837 0.1361
FIREPL*SQFT -0.355295 0.290125 -1.224627 0.2666
R-squared 0.929200 Mean dependent var 317.4929

Adjusted R-squared 0.846601 S.D. dependent var 88.49816
S.E. of regression 34.66139 Akaike info criterion 10.22469
Sum squared resid 7208.472 Schwarz criterion 10.58986
Log likelihood -63.57282 F-statistic 11.24945
Durbin-Watson stat 2.524457 Prob(F-statistic) 0.004472
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl, Sqft,
Firepl* Sqft đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H
: β
0 2
= β = β = β = β = β = 0
3 4 5 7 8
H
: có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8)
1 i
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 12.67148 (6, 6) 0.0035
Chi-square 76.02890 6 0.0000

Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -5.049608 40.23999
C(3) 0.068210 28.36362
C(4) -21.67260 41.42130
C(5) 437.6739 340.0121
C(7) 0.502063 0.291755
C(8) -0.355295 0.290125

Restrictions are linear in coefficients.

P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.0035> α = 5%
Vì vậy ta bác bỏ giả thuyết H
, vậy có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8)
0 i
Để thực hiện việc xây dựng mô hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến
độc lập. Biến được loại ra khỏi mô hình là biến có hệ số P_value lớn.

×