Tải bản đầy đủ (.pdf) (152 trang)

Mô hình hồi qui bội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.94 MB, 152 trang )

ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
1
GV: Nguyễn Thị Mai Bình

Môn học: KINH TẾ LƯỢNG
Lớp: 04QK, 04QB, 04QB (Năm học 2006 – 2007)

Gợi ý đáp án Bài tập số 2: MÔ HÌNH HỒI QUI BỘI



Câu 1: (40điểm) Xem xét dữ liệu về tiêu dùng thịt gà ở Mỹ giai đọan 1960 đến 1982 được trình bày
trong file Table 7.9 thuộc bộ dữ liệu của Gujarati (hoặcc file chicken demand). Trong đó:
Y = lượng thịt gà tiêu thụ bình quân đầu người (pound)
X2 = thu nhập khả dụng bình quân đầu người (USD)
X3 = Giá bán lẻ của thịt gà (cent/pound)
X4 = Giá bán lẻ của thịt bò (cent/pound)
X5 = Giá bán lẻ của thịt heo (cent/pound)
X6 = Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (cent/pound)
Các anh/chị hãy:
a) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô
hình tối ưu. Giải thích quá trình thực hiện và các kiểm định cần thiết. (α=5%)
Mô hình hồi qui tổng thể của lượng thịt gà tiêu thụ bình quân đầu người (Y) theo thu nhập khả dụng bình
quân đầu người (X2), giá bán lẻ của thịt gà (X3), giá bán lẻ của thịt bò (X4), giá bán lẻ của thịt heo (X5),
Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (X6)
(PRF): Y = β
1
+ β
2
X
2


+ β
3
X
3
+ β
4
X
4
+ β
5
X
5
+ β
6
X
6
+u
i
Chạy Eview với mô hình trên ta có:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:23
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 38.59691 4.214488 9.158150 0.0000
X2 0.004889 0.004962 0.985370 0.3383
X3 -0.651888 0.174400 -3.737889 0.0016
X4 0.243242 0.089544 2.716443 0.0147
X5 0.104318 0.070644 1.476674 0.1580

X6 -0.071110 0.098381 -0.722805 0.4796
R-squared 0.944292 Mean dependent var 39.66957
Adjusted R-squared 0.927908 S.D. dependent var 7.372950
S.E. of regression 1.979635 Akaike info criterion 4.423160
Sum squared resid 66.62224 Schwarz criterion 4.719376
Log likelihood -44.86635 F-statistic 57.63303
Durbin-Watson stat 1.100559 Prob(F-statistic) 0.000000
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến X2, X5, X6 đều lớn hơn α = 5% vì vậy
ta thực hiện kiểm định Wald với:
H
0
: β
2
= β
5
= β
6
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 5, 6)
Chạy Eview ta có kết quả:
Wald Test:
Equation: EQ01
Test Statistic Value df Probability
F-statistic 7.852143 (3, 17) 0.0017
Chi-square 23.55643 3 0.0000


Null Hypothesis Summary:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
2
Normalized Restriction (= 0) Value Std. Err.
GV: Nguyễn Thị Mai Bình
C(2) 0.004889 0.004962
C(5) 0.104318 0.070644
C(6) -0.071110 0.098381
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value =0.0017 < α = 5%
Vì vậy ta bác bỏ giả thuyết H
0
, vậy có ít nhất một giá trị β
i
≠ 0 với (i = 2, 5, 6)

Để thực hiện việc xây dựng mô hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến
độc lập. Biến được loại ra khỏi mô hình là biến có hệ số P_value lớn.
- Đầu tiên ta bỏ biến X6 ra khỏi mô hình vì biến này có P_value = 0.4796 (P_value lớn nhất). Lúc này
kết quả Eview như sau:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:42
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 37.23236 3.717695 10.01490 0.0000
X2 0.005011 0.004893 1.024083 0.3194
X3 -0.611174 0.162849 -3.753010 0.0015

X4 0.198409 0.063721 3.113734 0.0060
X5 0.069503 0.050987 1.363144 0.1896
R-squared 0.942580 Mean dependent var 39.66957
Adjusted R-squared 0.929821 S.D. dependent var 7.372950
S.E. of regression 1.953198 Akaike info criterion 4.366473
Sum squared resid 68.66969 Schwarz criterion 4.613320
Log likelihood -45.21444 F-statistic 73.87052
Durbin-Watson stat 1.065034 Prob(F-statistic) 0.000000
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến X6, ta nhận thấy vẫn còn có các biến X2, X5 có
P_value lớn hơn α = 5%. Ta tiếp tục bỏ biến X2 do P_value = 0.3194 (P_value lớn nhất) và được kết
quả như sau:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:46
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 35.68084 3.399337 10.49641 0.0000
X3 -0.654097 0.157564 -4.151300 0.0005
X4 0.232528 0.054387 4.275460 0.0004
X5 0.115422 0.024303 4.749224 0.0001
R-squared 0.939235 Mean dependent var 39.66957
Adjusted R-squared 0.929641 S.D. dependent var 7.372950
S.E. of regression 1.955702 Akaike info criterion 4.336146
Sum squared resid 72.67063 Schwarz criterion 4.533624
Log likelihood -45.86568 F-statistic 97.89329
Durbin-Watson stat 1.251523 Prob(F-statistic) 0.000000
Lúc này các biến X3, X4, X6 đều có P_value nhỏ hơn α = 5%. Vậy mô hình trên có thể là mô hình phù
hợp nhất. Tuy nhiên, để kiểm tra lại có phải việc loại bỏ biến X6, và X2 ra khổi mô hình là phù hợp. Ta
thực hiện lại việc kiểm định Wald với:

H
0
: β
2
= β
6
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 6)
Chạy Eview ta có kết quả:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
3
GV: Nguyễn Thị Mai Bình
Wald Test:
Equation: HOIQUI_U
Test Statistic Value df Probability
F-statistic 0.771684 (2, 17) 0.4778
Chi-square 1.543368 2 0.4622

Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) 0.004889 0.004962
C(6) -0.071110 0.098381
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value =0.4778 > α = 5%
Vì vậy ta chấp nhận giả thuyết H

0
, điều này có nghĩa việc loại bỏ 2 biến thu nhập khả dụng bình quân
đầu người (X2 và giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (X6) ra khỏi mô hình là phù
hợp

Mô hình hồi qui phù hợp nhất là:
Y
ˆ
= 35.68083973 - 0.6540969702*X3 + 0.2325281315*X4 + 0.1154218668*X5

b) Giải thích ý nghĩa các tham số của mô hình phù hợp nhất:
Ta có:
β
1
= 35.68083973 không giả thích được vì có ẩn chứa những biến bỏ sót ngoài mô hình hoặc chọn hàm
sai.
β
3
= - 0.6540969702: tác động biên của X3 lên Y. Trong điều kiện các biến khác không đổi, theo thông
tin từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt gà tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình
quân đầu người sẽ giảm đi 0.6540969702pound
β
4
= 0.2325281315 tác động biên của X4 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin
từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt bò tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân
đầu người sẽ tăng lên 0.2325281315 pound
β
5
= 0.1154218668 tác động biên của X5 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin
từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt heo tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân

đầu người sẽ tăng lên 0.1154218668 pound
(Với hệ số β
4
và β
5
cho thấy thịt gà có thể là sản phẩm thay thế cho thịt bò và thịt heo)
Câu 2: (40 điểm) Xem xét dữ liệu về các yếu tố ảnh hưởng đền giá nhà trong fike Data7-3 thuộc bộ
dữ liệu Ramanathan. Trong đó:
Price = giá nhà
Baths = số phòng tắm
Bedrms = số phòng ngủ
Famroom = nhận giá trị 1 nếu nhà có phòng gia đình và giá trị 0 cho trường hợp ngược lại
Firepl = nhận giá trị 1 nếu nhà có thiết bị báo cháy và giá trị 0 cho trường hợp ngược lại
Pool = nhận giá trị 1 nếu nhà có hồ bơi và giá trị 0 cho trường hợp ngược lại
Sqft = diện tích nhà
Các anh/chị hãy:
a) Xây dựng các mô hình sau theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình
nào là mô hình tối ưu (xem xét các mô hình tổng quát dưới đây). Giải thích quá trình thực hiện
và các kiểm định cần thiết. (α=5%)
a. Price = β
1
+ β
2
Baths + β
3
Bedrms + β
4
Famroom + β
5
Firepl + β

6
Pool + β
7
Sqft
Chạy mô hình trên với Eview, ta có kết quả:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 15:19
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
4
Sample: 1 14
GV: Nguyễn Thị Mai Bình
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 39.05715 89.53975 0.436199 0.6758
BATHS -0.263691 41.45465 -0.006361 0.9951
BEDRMS -7.045531 28.73627 -0.245179 0.8134
FAMROOM -21.34471 42.87340 -0.497854 0.6338
FIREPL 26.18799 53.84537 0.486355 0.6416
POOL 53.19581 22.06352 2.411030 0.0467
SQFT 0.146551 0.030101 4.868577 0.0018
R-squared 0.911504 Mean dependent var 317.4929
Adjusted R-squared 0.835650 S.D. dependent var 88.49816
S.E. of regression 35.87726 Akaike info criterion 10.30494
Sum squared resid 9010.244 Schwarz criterion 10.62447
Log likelihood -65.13456 F-statistic 12.01657
Durbin-Watson stat 2.602259 Prob(F-statistic) 0.002213
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl đều
lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H

0
: β
2
= β
3
= β
4
= β
5
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 3, 4, 5)
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 0.086452 (4, 7) 0.9839
Chi-square 0.345807 4 0.9867

Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -0.263691 41.45465
C(3) -7.045531 28.73627
C(4) -21.34471 42.87340
C(5) 26.18799 53.84537
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:

P_value = 0.9839 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, vậy các hệ số trước các biến Baths, Bedrms, Famroom, Firepl đều
bằng 0; hay các biến số phòng tắm, số phòng ngủ, có phòng gia đình, có thiết bị báo cháy không ảnh
hưởng đến giá nhà. Vì vậy ta có thể bỏ các biến trên ra khỏi mô hình. Lúc này ta có mô hình:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 15:29
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 22.67277 29.50580 0.768417 0.4584
POOL 52.78980 16.48172 3.202931 0.0084
SQFT 0.144415 0.014185 10.18086 0.0000
R-squared 0.907132 Mean dependent var 317.4929
Adjusted R-squared 0.890247 S.D. dependent var 88.49816
S.E. of regression 29.31856 Akaike info criterion 9.781728
Sum squared resid 9455.359 Schwarz criterion 9.918669
Log likelihood -65.47210 F-statistic 53.72383
Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
5
GV: Nguyễn Thị Mai Bình
Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồi qui lúc này:
PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT +

i
u

ˆ

b. Price = β
1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft + β
8
Firepl* Sqft
Chạy mô hình trên với Eview, ta có kết quả:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:33
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -391.6926 362.2206 -1.081365 0.3211
BATHS -5.049608 40.23999 -0.125487 0.9042
BEDRMS 0.068210 28.36362 0.002405 0.9982
FAMROOM -21.67260 41.42130 -0.523223 0.6196
FIREPL 437.6739 340.0121 1.287230 0.2454
POOL 65.52753 23.57464 2.779578 0.0320
SQFT 0.502063 0.291755 1.720837 0.1361
FIREPL*SQFT -0.355295 0.290125 -1.224627 0.2666
R-squared 0.929200 Mean dependent var 317.4929
Adjusted R-squared 0.846601 S.D. dependent var 88.49816

S.E. of regression 34.66139 Akaike info criterion 10.22469
Sum squared resid 7208.472 Schwarz criterion 10.58986
Log likelihood -63.57282 F-statistic 11.24945
Durbin-Watson stat 2.524457 Prob(F-statistic) 0.004472
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl, Sqft,
Firepl* Sqft đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H
: β
0 2
= β = β = β = β = β = 0
3 4 5 7 8
H
: có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8)
1 i
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 12.67148 (6, 6) 0.0035
Chi-square 76.02890 6 0.0000

Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -5.049608 40.23999
C(3) 0.068210 28.36362
C(4) -21.67260 41.42130
C(5) 437.6739 340.0121
C(7) 0.502063 0.291755
C(8) -0.355295 0.290125
Restrictions are linear in coefficients.


P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.0035> α = 5%
Vì vậy ta bác bỏ giả thuyết H
, vậy có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8)
0 i
Để thực hiện việc xây dựng mô hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến
độc lập. Biến được loại ra khỏi mô hình là biến có hệ số P_value lớn.
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
6
GV: Nguyễn Thị Mai Bình
- Đầu tiên ta bỏ biến Bedrms ra khỏi mô hình vì biến này có P_value = 0.9982 (P_value lớn nhất). Lúc
này kết quả Eview như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:42
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -391.3735 312.0440 -1.254225 0.2500
BATHS -5.013808 34.61187 -0.144858 0.8889
FAMROOM -21.69964 36.90877 -0.587926 0.5751
FIREPL 437.5656 312.0188 1.402370 0.2036
POOL 65.50844 20.55132 3.187553 0.0153
SQFT 0.501915 0.264005 1.901154 0.0990
FIREPL*SQFT -0.355152 0.262910 -1.350849 0.2188
R-squared 0.929200 Mean dependent var 317.4929
Adjusted R-squared 0.868515 S.D. dependent var 88.49816
S.E. of regression 32.09023 Akaike info criterion 10.08183
Sum squared resid 7208.479 Schwarz criterion 10.40136

Log likelihood -63.57283 F-statistic 15.31173
Durbin-Watson stat 2.525083 Prob(F-statistic) 0.001044
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, ta nhận thấy các hệ số P_value của các biến
Baths, Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Baths, do
P_value = 0.8889 (P_value lớn nhất) và được kết quả như sau
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:45
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -396.8103 290.2054 -1.367343 0.2087
FAMROOM -23.43309 32.70893 -0.716412 0.4941
FIREPL 437.8164 292.2995 1.497835 0.1726
POOL 66.06998 18.90720 3.494435 0.0081
SQFT 0.498254 0.246188 2.023872 0.0776
FIREPL*SQFT -0.354257 0.246230 -1.438725 0.1882
R-squared 0.928988 Mean dependent var 317.4929
Adjusted R-squared 0.884606 S.D. dependent var 88.49816
S.E. of regression 30.06262 Akaike info criterion 9.941969
Sum squared resid 7230.087 Schwarz criterion 10.21585
Log likelihood -63.59378 F-statistic 20.93140
Durbin-Watson stat 2.543786 Prob(F-statistic) 0.000210
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, Baths; ta nhận thấy các hệ số P_value của
các biến Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Famroom, do
P_value = 0.4941 (P_value lớn nhất) và được kết quả như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:47
Sample: 1 14

Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -376.6690 280.9210 -1.340836 0.2128
FIREPL 402.0001 280.0962 1.435221 0.1850
POOL 63.03432 17.92106 3.517331 0.0065
SQFT 0.482192 0.238444 2.022249 0.0739
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
7
GV: Nguyễn Thị Mai Bình
FIREPL*SQFT -0.340550 0.238755 -1.426357 0.1875
R-squared 0.924432 Mean dependent var 317.4929
Adjusted R-squared 0.890846 S.D. dependent var 88.49816
S.E. of regression 29.23837 Akaike info criterion 9.861294
Sum squared resid 7693.940 Schwarz criterion 10.08953
Log likelihood -64.02906 F-statistic 27.52457
Durbin-Watson stat 2.550994 Prob(F-statistic) 0.000046
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, Baths, Famroom; ta nhận thấy các hệ số
P_value của các biến Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Firepl* Sqft,
do P_value =
0.1875 (P_value lớn nhất) và được kết quả như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:49
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 21.73385 31.51070 0.689729 0.5061
FIREPL 4.317827 28.16788 0.153289 0.8812
POOL 52.95961 17.30140 3.061001 0.0120
SQFT 0.142938 0.017711 8.070628 0.0000

R-squared 0.907350 Mean dependent var 317.4929
Adjusted R-squared 0.879555 S.D. dependent var 88.49816
S.E. of regression 30.71350 Akaike info criterion 9.922238
Sum squared resid 9433.193 Schwarz criterion 10.10483
Log likelihood -65.45567 F-statistic 32.64424
Durbin-Watson stat 2.595128 Prob(F-statistic) 0.000018
- Tiếp tục bỏ biến Firepl do P_value = 0.8812 > 0.05 ta có:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:50
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 22.67277 29.50580 0.768417 0.4584
POOL 52.78980 16.48172 3.202931 0.0084
SQFT 0.144415 0.014185 10.18086 0.0000
R-squared 0.907132 Mean dependent var 317.4929
Adjusted R-squared 0.890247 S.D. dependent var 88.49816
S.E. of regression 29.31856 Akaike info criterion 9.781728
Sum squared resid 9455.359 Schwarz criterion 9.918669
Log likelihood -65.47210 F-statistic 53.72383
Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002
Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồi qui lúc này:
PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT +

i
u
ˆ


c. Price = β
1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft +
β
8
Famroom* Bedrms
Chạy mô hình trên với Eview, ta có kết quả:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
8
GV: Nguyễn Thị Mai Bình

Điều này có nghĩa mô hình có hiện tượng đa cộng tuyến hoàn hảo.
Lúc này ta tạo biến mới Famroom_Bedrms và lập bảng ma trận tương quan để xác định cá biến bị đa cộng
tuyến. Ta có:
PRICE BATHS BEDRMS FAMROOM FIREPL POOL SQFT FAMROOM
_BEDRMS
PRICE 1.000000 0.669612 0.315634 0.472715 0.495681 0.179062 0.905827 0.477140
BATHS 0.669612 1.000000 0.532327 0.534885 0.457693 -0.185695 0.787318 0.615893
BEDRMS 0.315634 0.532327 1.000000 0.337350 0.547723 -0.377778 0.464730 0.532557
0.968264
FAMROOM 0.472715 0.534885 0.337350 1.000000 0.781736 0.025950 0.520220
FIREPL 0.495681 0.457693 0.547723 0.781736 1.000000 -0.121716 0.551010 0.756927
POOL 0.179062 -0.185695 -0.377778 0.025950 -0.121716 1.000000 -0.124679 -0.060671
SQFT 0.905827 0.787318 0.464730 0.520220 0.551010 -0.124679 1.000000 0.559476

0.968264
FAMROOM
_BEDRMS
0.477140 0.615893 0.532557 0.756927 -0.060671 0.559476 1.000000
Lúc này ta có hệ số tương quan giữa hai biến FAMROOM và FAMROOM_BEDRMS bằng 0.968264 (gần
bằng 1). Vậy có hiện tượng đa cộng tuyến là do 2 biến trên có mối quan hệ chặt chẽ với nhau vì vậy ta bỏ 1
trong 2 biến; giả sử bỏ biến FAMROOM ta có kết quả chạy Eview như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 17:01
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 23.04862 96.48374 0.238886 0.8180
BATHS -0.263691 41.45465 -0.006361 0.9951
BEDRMS -1.709353 27.73050 -0.061642 0.9526
FIREPL 20.85181 46.43392 0.449064 0.6670
POOL 53.19581 22.06352 2.411030 0.0467
SQFT 0.146551 0.030101 4.868577 0.0018
FAMROOM_BEDR
MS
-5.336177 10.71835 -0.497854 0.6338
R-squared 0.911504 Mean dependent var 317.4929
Adjusted R-squared 0.835650 S.D. dependent var 88.49816
S.E. of regression 35.87726 Akaike info criterion 10.30494
Sum squared resid 9010.244 Schwarz criterion 10.62447
Log likelihood -65.13456 F-statistic 12.01657
Durbin-Watson stat 2.602259 Prob(F-statistic) 0.002213
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Firepl, Famroom* Bedrms
đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:

H
: β
0 2
= β = β = β = 0
3 5 8
H
: có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 5, 8)
1 i
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 0.086452 (4, 7) 0.9839
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
9
GV: Nguyễn Thị Mai Bình
Chi-square 0.345807 4 0.9867

Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -0.263691 41.45465
C(3) -1.709353 27.73050
C(4) 20.85181 46.43392
C(7) -5.336177 10.71835
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.9839 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, vậy các hệ số trước các biến Baths, Bedrms, Firepl, Famroom*

Bedrms đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, có thiết bị báo cháy và biến ảnh hưởng
của có phòng gia đình lên số lượng phòng ngủ không ảnh hưởng đến giá nhà. Vì vậy ta có thể bỏ các
biến trên ra khỏi mô hình. Lúc này ta có mô hình:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 15:29
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 22.67277 29.50580 0.768417 0.4584
POOL 52.78980 16.48172 3.202931 0.0084
SQFT 0.144415 0.014185 10.18086 0.0000
R-squared 0.907132 Mean dependent var 317.4929
Adjusted R-squared 0.890247 S.D. dependent var 88.49816
S.E. of regression 29.31856 Akaike info criterion 9.781728
Sum squared resid 9455.359 Schwarz criterion 9.918669
Log likelihood -65.47210 F-statistic 53.72383
Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002
Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồi qui lúc này:
PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT +

i
u
ˆ

d. Price = β
1
+ β
2

Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft +
β
8
Pool*Sqft
Chạy mô hình trên với Eview, ta có kết quả:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 17:10
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 76.93417 64.38956 1.194824 0.2772
BATHS -10.24209 29.37901 -0.348619 0.7393
BEDRMS 4.867122 20.64732 0.235727 0.8215
FAMROOM -10.51463 30.40630 -0.345804 0.7413
FIREPL -1.107752 39.07848 -0.028347 0.9783
POOL -85.25082 50.95585 -1.673033 0.1453
SQFT 0.124680 0.022526 5.534876 0.0015
POOL*SQFT 0.074512 0.026121 2.852620 0.0291
R-squared 0.962442 Mean dependent var 317.4929
Adjusted R-squared 0.918624 S.D. dependent var 88.49816
S.E. of regression 25.24543 Akaike info criterion 9.590727
Sum squared resid 3823.992 Schwarz criterion 9.955903
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
10
Log likelihood -59.13509 F-statistic 21.96456

GV: Nguyễn Thị Mai Bình
Durbin-Watson stat 2.150252 Prob(F-statistic) 0.000712

Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl, Pool đều
lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H
: β
0 2
= β = β = β = β = 0
3 4 5 6
H
: có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 6)
1 i
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 0.675681 (5, 6) 0.6581
Chi-square 3.378405 5 0.6419

Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -10.24209 29.37901
C(3) 4.867122 20.64732
C(4) -10.51463 30.40630
C(5) -1.107752 39.07848
C(6) -85.25082 50.95585
Restrictions are linear in coefficients.

P_value sau khi chạy Wald test trong kiểm định trên ta có:

P_value = 0.6581 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, vậy các hệ số trước các biến Baths, Bedrms, Famroom, Firepl, Pool
đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, có phòng gia đình, có thiết bị báo cháy, có hồ bơi
không ảnh hưởng đến giá nhà. Vì vậy ta có thể bỏ các biến trên ra khỏi mô hình. Lúc này ta có mô hình:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 17:17
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 42.79643 22.36292 1.913723 0.0820
SQFT 0.132927 0.011257 11.80854 0.0000
POOL*SQFT 0.031857 0.006697 4.757055 0.0006
R-squared 0.941294 Mean dependent var 317.4929
Adjusted R-squared 0.930620 S.D. dependent var 88.49816
S.E. of regression 23.31047 Akaike info criterion 9.323092
Sum squared resid 5977.157 Schwarz criterion 9.460032
Log likelihood -62.26164 F-statistic 88.18710
Durbin-Watson stat 2.756228 Prob(F-statistic) 0.000000

Với các giá trị P_value trước biến Pool*Sqft và biến Sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồi qui lúc này:
PRICE = 42.7964305 + 0.132927069*SQFT + 0.03185742065*(POOL*SQFT) +
i
u
ˆ

e. Price = β

1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft +
β
8
Famroom* Bedrms + β
9
Firepl* Sqft + β
10
Pool*Sqft + β
11
Firepl*Bedrms+
β
Pool*Baths
10
Chạy mô hình trên với Eview, ta có kết quả:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
11
GV: Nguyễn Thị Mai Bình

Điều này có nghĩa mô hình có hiện tượng đa cộng tuyến hoàn hảo.
Lúc này ta tạo biến mới Famroom_Bedrms, Firepl_Sqft, Pool_Sqft, Firepl_Bedrms, Pool_Baths và lập bảng
ma trận tương quan để xác định các biến bị đa cộng tuyến. Ta có:
PRICE BATHS BEDRMS
FAMRO

OM
FIREPL POOL SQFT
FAMRO
OM_BED
RMS
FIREPL_
SQFT
POOL_S
QFT
FIREPL_
BEDRMS
POOL_B
ATHS

1.000000
0.669612 0.315634 0.472715 0.495681 0.179062 0.905827 0.477140 0.827444 0.443966 0.489466 0.298262
PRICE

0.669612
1.000000 0.532327 0.534885 0.457693 -0.185695 0.787318 0.615893 0.729672 0.007397 0.536074 -0.030708
BATHS

0.315634
0.532327 1.000000 0.337350 0.547723 -0.377778 0.464730 0.532557 0.565943 -0.273813 0.768273 -0.299574
BEDRMS

0.472715
0.534885 0.337350 1.000000 0.781736 0.025950 0.520220 0.968264 0.714019 0.164184 0.715908 0.103549
FAMROOM


0.495681
0.457693 0.547723 0.781736 1.000000 -0.121716 0.551010 0.756927 0.838394 0.050916 0.956365 -0.026253
FIREPL

0.179062
-0.185695 -0.377778 0.025950 -0.121716 1.000000 -0.124679 -0.060671 -0.123212 0.930736 -0.225050 0.970620
POOL

0.905827
0.787318 0.464730 0.520220 0.551010 -0.124679 1.000000 0.559476 0.915473 0.108745 0.583864 -0.003719
SQFT

0.477140
FAMROOM_
BEDRMS
0.615893 0.532557 0.756927 -0.060671 0.559476 1.000000 0.727890 0.076263 0.765096 0.022538
0.968264

0.827444
FIREPL_SQF
T
0.729672 0.565943 0.714019 -0.123212 0.727890 1.000000 0.104587 0.839084 -0.002457
0.838394 0.915473

0.443966
0.007397 -0.273813 0.164184 0.050916 0.108745 0.076263 0.104587 1.000000 -0.056664 0.973173
POOL_SQFT
0.930736

0.489466

FIREPL_BED
RMS
0.536074 0.768273 0.715908 -0.225050 0.583864 0.765096 -0.056664 1.000000 -0.124702
0.956365 0.839084

0.298262
POOL_BATH
S
-0.030708 -0.299574 0.103549 -0.026253 -0.003719 0.022538 -0.002457 -0.124702 1.000000
0.970620 0.973173

Lúc này ta có hệ số tương quan giữa các biến sau gần bằng 1:
- Hai biến POOL_BATHS và POOL_SQFT bằng 0.973173.
- Hai biến POOL_BATHS và POOL bằng 0.970620
- Hai biến FAMROOM và FAMROOM_BEDRMS bằng 0.968264.
- Hai biến FIREPL_BEDRMS và FIREPL bằng 0.956365
- Hai biến POOL_SQFT và POOL bằng 0.930736
- Hai biến FIREPL_SQRT và SQRT bằng 0.956365
Vậy có hiện tượng đa cộng tuyến là do các cặp biến trên có mối quan hệ chặt chẽ với nhau vì vậy ta bỏ lần
lượt các biến sau cho đến khi mô hình không còn báo lỗi “Near singular matrix”
1. POOL_BATHS
2. FAMROOM
3. FIREPL
Ta có kết quả chạy Eview như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 18:04
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.

C 64.41180 83.90901 0.767639 0.4774
BATHS -10.28888 32.19667 -0.319564 0.7622
BEDRMS 4.190055 111.7813 0.037484 0.9715
POOL -83.26236 73.16128 -1.138066 0.3067
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
12
SQFT 0.136839 0.290322 0.471334 0.6573
GV: Nguyễn Thị Mai Bình
FAMROOM_BEDRMS -2.662211 8.363818 -0.318301 0.7631
FIREPL_SQFT -0.011903 0.283178 -0.042034 0.9681
POOL_SQFT 0.073664 0.035004 2.104437 0.0892
FIREPL_BEDRMS 3.442053 112.1985 0.030678 0.9767
R-squared 0.962455 Mean dependent var 317.4929
Adjusted R-squared 0.902383 S.D. dependent var 88.49816
S.E. of regression 27.65010 Akaike info criterion 9.733231
Sum squared resid 3822.641 Schwarz criterion 10.14405
Log likelihood -59.13262 F-statistic 16.02171
Durbin-Watson stat 2.159633 Prob(F-statistic) 0.003635
Với kết quả của bảng trên ta thấy tất cả các hệ số P_value của các biến đều lớn hơn α = 5% vì vậy ta thực
hiện kiểm định Wald với:
H
: β
0 2
= β = β = β = β = β = β
3 6 7 8 9 10
= β
11
= 0
H
: có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 6, 7, 8, 9, 10, 11)

1 i
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 16.02171 (8, 5) 0.0036
Chi-square 128.1737 8 0.0000

Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -10.28888 32.19667
C(3) 4.190055 111.7813
C(4) -83.26236 73.16128
C(5) 0.136839 0.290322
C(6) -2.662211 8.363818
C(7) -0.011903 0.283178
C(8) 0.073664 0.035004
C(9) 3.442053 112.1985
Restrictions are linear in coefficients.


P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.0036> α = 5%
Vì vậy ta bác bỏ giả thuyết H
, vậy có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 6, 7, 8, 9, 10, 11)
0 i
Để thực hiện việc xây dựng mô hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến độc
lập. Biến được loại ra khỏi mô hình là biến có hệ số P_value lớn. Tương tự như các câu trên, các biến được
bỏ theo thứ tự:
1. BEDRMS

2. FIREPL_SQFT
3. BATHS
4. FAMROOM_BEDRMS
5. FIREPL_BEDRMS
6. POOL
Lúc này mô hình hồi qui sẽ là:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 18:18
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 42.79643 22.36292 1.913723 0.0820
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
13
SQFT 0.132927 0.011257 11.80854 0.0000
POOL_SQFT 0.031857 0.006697 4.757055 0.0006
GV: Nguyễn Thị Mai Bình
R-squared 0.941294 Mean dependent var 317.4929
Adjusted R-squared 0.930620 S.D. dependent var 88.49816
S.E. of regression 23.31047 Akaike info criterion 9.323092
Sum squared resid 5977.157 Schwarz criterion 9.460032
Log likelihood -62.26164 F-statistic 88.18710
Durbin-Watson stat 2.756228 Prob(F-statistic) 0.000000
Với các giá trị P_value trước biến POOL và biến SQFT đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Kiểm định Wald lại về việc bỏ các biến: bedrms, firepl_sqft, baths, famroom_bedrms, firepl_bedrms,
pool, ta có:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability

F-statistic 0.469683 (6, 5) 0.8078
Chi-square 2.818100 6 0.8313

Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -10.28888 32.19667
C(3) 4.190055 111.7813
C(4) -83.26236 73.16128
C(6) -2.662211 8.363818
C(7) -0.011903 0.283178
C(9) 3.442053 112.1985
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value =
0.8078 < α = 5%
Vì vậy việc bỏ các biến trên là phù hợp. các biến: bedrms, firepl_sqft, baths, famroom_bedrms,
firepl_bedrms, pool không ảnh hưởng tới giá nhà:

Vậy phương trình hồi qui lúc này:
PRICE = 42.7964305 + 0.132927069*SQFT + 0.03185742065*POOL_SQFT +
i
u
ˆ

b) Giải thích ý nghĩa các tham số của mô hình phù hợp nhất
Với 5 mô hình trên, sau khi chạy Eview ta thấy kết quả nhìn chung chỉ có 2 mô hình là:
Mô hình 1: PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT +

i
u

ˆ
Mô hình 2: PRICE = 42.7964305 + 0.132927069*SQFT + 0.03185742065*POOL_SQFT +
i
u
ˆ
Lú này để chọn mô hình tối ưu ta so sánh các …… số R
2
, AIC, Schwarz
R
2
AIC SCHWARZ
2
R

Mô hình 1 0.907132 0.89024 9.781728 9.918669
Mô hình 2 0.941294 0.930620 9.323092 9.460032
Vậy mô hình hồi qui phú hợp nhất là mô hình 2:
PRICE = 42.7964305 + 0.132927069*SQFT + 0.03185742065*POOL_SQFT +
i
u
ˆ
Ta có:
β
1
= 42.7964305 không giả thích được vì có ẩn chứa những biến bỏ sót ngoài mô hình hoặc chọn hàm
sai.
β
2
= 0.132927069 Tác động biên của SQFT lên PRICE là: 0.132927069 điều này có nghĩa Trong điều
kiện các biến khác không đổi, theo thông tin từ dữ liệu mẫu ta có nếu diện tích nhà tăng lên 1 đơn vị thì

giá nhà trung bình sẽ tăng lên một lượng là 0.132927069
β
2
= 0.03185742065: có sự khác biệt giữa nhà có hồ bơi và nhà không có hồ bơi. Sự khác biệt này do
diện tích nhà gây ra.
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 3

1

Môn học: KINH TẾ LƯỢNG
Lớp: 04QK, 04QB, 04QB (Năm học 2006 – 2007)

Gợi ý đáp án Bài tập số 3: ĐA CỘNG TUYẾN VÀ DẠNG HÀM


Câu 1:
(40điểm) Cho mô hình nhập khẩu của Hoa Kỳ giai đoạn 1970-1998 như sau:
Ln Imports
t
= β
1
+ β
2
ln GDP
t
+ β
3
ln CPI
t
+ u

t
(theo dữ liệu trong file T10-12.txt thuộc bộ dữ liệu của Gujarati).
Trong đó:
Imporst = Giá trị nhập khẩu của Hoa Kỳ
GDP = Tổng sản phẩm quốc nội của Hoa Kỳ
CPI = Chỉ số giá tiêu dùng tại Hoa Kỳ
a) Trước khi chạy hồi qui anh/chị hãy dự báo dấu kỳ vọng của β
2
và β
3
. Lý giải sự lựa chọn của mình
β
2
: theo mô hình trên thể hiện tốc độ tăng của giá trị nhập khẩu của Hoa kỳ khi tổng sản phẩm quốc nội tăng
1%. Dự báo dấu kỳ vọng của β
2
sẽ là số âm vì khi Tổng sản phẩm quốc nội tăng lên nhu cầu về hàng nhập sẽ
giảm vì vậy Giá trị nhập khẩu của Hoa kỳ sẽ giảm.
β
3
: theo mô hình trên thể hiện tốc độ tăng của giá trị nhập khẩu của Hoa kỳ khi chỉ số giá tiêu dùng tăng 1%. Dự
báo dấu kỳ vọng của β
3
sẽ là số âm vì khi chỉ số giá tiêu dùng tăng, khả năng mua của người dân sẽ thấp và
điều này sẽ ảnh hưởng lên khả năng tiêu thụ hàng nhập khẩu và vì vậy giá trị nhập khẩu của Hoa kỳ sẽ giảm.

b) Hãy ước lượng các hệ số trong mô hình.
Dependent Variable: LOG(IMPORTS)
Method: Least Squares
Date: 05/08/07 Time: 23:24

Sample: 1970 1998
Included observations: 29
Variable Coefficient Std. Error t-Statistic Prob.
C 1.975260 0.782070 2.525683 0.0180
LOG(GDP) 1.043167 0.405783 2.570749 0.0162
LOG(CPI) 0.446142 0.569840 0.782925 0.4407
R-squared 0.982318 Mean dependent var 12.49048
Adjusted R-squared 0.980958 S.D. dependent var 0.904848
S.E. of regression 0.124862 Akaike info criterion -1.225512
Sum squared resid 0.405356 Schwarz criterion -1.084068
Log likelihood 20.76993 F-statistic 722.2174
Durbin-Watson stat 0.461405 Prob(F-statistic) 0.000000
Sau khi chạy mô hình log kép ta có :
Ln Imports
t
= 1.975 + 1.043 ln GDP
t
+ 0.446 ln CPI
t
+
t
u
ˆ


c) Từ kết quả trên anh/chị có nghi ngờ có sự đa cộng tuyến trong mô hình không? Tại sao?
Dựa vào mô hình trên, ta nghi ngờ có dự đa cộng tuyến vì:
− Dấu của các biến trong mô hình ngược với dấu kỳ vọng.
− R
2

= 0.98 là một số lớn trong khi đó t
stat(CPI)
= 0.782925 là một số nhỏ (hay Prob
CPI
= 0.4407)

d) Thực hiện tiếp các hồi qui sau:
Ln Imports
t
= A
1
+ A
2
ln GDP
t
(1)
Dependent Variable: LOG(IMPORTS)
Method: Least Squares
Date: 05/08/07 Time: 23:26
Sample: 1970 1998
Included observations: 29
Variable Coefficient Std. Error t-Statistic Prob.
C 1.407426 0.290493 4.844960 0.0000
LOG(GDP) 1.359628 0.035525 38.27295 0.0000
R-squared 0.981901 Mean dependent var 12.49048
Adjusted R-squared 0.981231 S.D. dependent var 0.904848
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 3

2
S.E. of regression 0.123964 Akaike info criterion -1.271175

Sum squared resid 0.414912 Schwarz criterion -1.176879
Log likelihood 20.43204 F-statistic 1464.819
Durbin-Watson stat 0.437805 Prob(F-statistic) 0.000000


Ln Imports
t
= B
1
+ B
2
ln CPI
t
(2)
Dependent Variable: LOG(IMPORTS)
Method: Least Squares
Date: 05/08/07 Time: 23:28
Sample: 1970 1998
Included observations: 29
Variable Coefficient Std. Error t-Statistic Prob.
C 3.898610 0.250312 15.57499 0.0000
LOG(CPI) 1.905351 0.055221 34.50388 0.0000
R-squared 0.977824 Mean dependent var 12.49048
Adjusted R-squared 0.977002 S.D. dependent var 0.904848
S.E. of regression 0.137220 Akaike info criterion -1.067993
Sum squared resid 0.508390 Schwarz criterion -0.973697
Log likelihood 17.48590 F-statistic 1190.518
Durbin-Watson stat 0.495763 Prob(F-statistic) 0.000000

Ln GDP

t
= C1 + C2 ln CPI
t
(3)
Dependent Variable: LOG(GDP)
Method: Least Squares
Date: 05/08/07 Time: 23:29
Sample: 1970 1998
Included observations: 29
Variable Coefficient Std. Error t-Statistic Prob.
C 1.843760 0.108024 17.06804 0.0000
LOG(CPI) 1.398826 0.023831 58.69726 0.0000
R-squared 0.992224 Mean dependent var 8.151539
Adjusted R-squared 0.991936 S.D. dependent var 0.659461
S.E. of regression 0.059218 Akaike info criterion -2.748702
Sum squared resid 0.094684 Schwarz criterion -2.654406
Log likelihood 41.85618 F-statistic 3445.368
Durbin-Watson stat 0.348619 Prob(F-statistic) 0.000000

Dựa trên các kết quả hồi quy có được, anh/ chị nhận xét gì về mức độ đa cộng tuyến trong bộ dữ liệu? Giải
thích sự nhận xét của mình.
Căn cứ vào mô hình (1) và mô hình (2) ta thấy mối quan hệ giữa GDP và CPI với Imports là mối quan hệ thuận
điều này có nghĩa GDP và CPI tăng sẽ làm cho Import tăng. Vì vậy, dấu kỳ vọng tại câu a là chưa chính xác. Mặc
khác căn cứ vào mô hình (1) và mô hình (2), phương trình hồi qui giữa Imports v
ới từng biến GDP và CPI có ý
nghĩa về mặt thống kê (R
2
lớn và t
stat
lớn).

Mô hình (3) thể hiện mối quan hệ giữa 2 biến độc lập GDP và CPI, ta thấy mô hình này có ý nghĩa về mặt thống kê
điều này có nghĩa có hiện tượng đa cộng tuyến trong mô hình gốc. Mặt khác, R
2
trong mô hình 3 (R
2
hqp
=0.992224)
lớn hơn mô hình ban đầu (R
2
= 0.982318) và lớn nhất trong các mô hình vì vậy mức độ đa cộng tuyến giữa hai biến
GDP và CPI rất mạnh.

e) Giải sử trong mô hình ban đầu (mô hình Ln Imports
t
= β
1
+ β
2
ln GDP
t
+ β
3
ln CPI
t
+ u
t
có hiện tượng
đa cộng tuyến nhưng β
2
và β

3
đều có ý nghĩa về mặt thống kê ở mức ý nghĩa 5% và thống kê F cũng có ý
nghĩa. Trong trường hợp này, chúng ta có nên lo lắng về hiện tượng đa cộng tuyến không?
Trong trường hợp trên chứng ta không cần phải lo lắng vì t
stat
>2 (do câu β
2
và β
3
đều có ý nghĩa về mặt thống kê ở
mức ý nghĩa 5%) và R
2
của mô hình cao hơn R
2
của mô hình hồi qui phụ (do câu thống kê F cũng có ý nghĩa)
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 3

3
Câu 2: (40 điểm) Xem xét dữ liệu trong file Table7.3 thuộc bộ dữ liệu Gujarati. Trong đó:
Y = GDP thực hằng năm của khu vực nông nghiệp Đài Loan (triệu USD)
X
2
= Số ngày lao động hằng năm của khu vực nông nghiệp Đài Loan (triệu ngày công lao động)
X
3
= Vốn thực hằng năm của khu vực nông nghiệp Đài Loan (triệu USD)

Các anh/chị hãy:
a) Ước lượng hàm Cobb-Douglas có dạng Y=AX
2

β2
X
3
β3
e
ui
.
Chuyển mô hình về hàm log kep và ước lượng ta có :
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 05/09/07 Time: 20:40
Sample: 1958 1972
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
C -3.338455 2.449508 -1.362908 0.1979
LOG(X2) 1.498767 0.539803 2.776509 0.0168
LOG(X3) 0.489858 0.102043 4.800487 0.0004
R-squared 0.889030 Mean dependent var 10.09653
Adjusted R-squared 0.870535 S.D. dependent var 0.207914
S.E. of regression 0.074810 Akaike info criterion -2.170875
Sum squared resid 0.067158 Schwarz criterion -2.029265
Log likelihood 19.28156 F-statistic 48.06885
Durbin-Watson stat 0.891083 Prob(F-statistic) 0.000002
LOG(Y) = -3.338455 + 1.498767 LOG(X2) + 0.489858 LOG(X3) +
t
u
ˆ

b) Hãy giải thích các hệ số ước lượng β
1

, β
2
, β
3
theo ý nghĩa kinh tế
β
1
= -3.338455 không có cách giải thích vì còn ẩn chứa biến bỏ sót ngoài mô hình.
β
2
= 1.498767 độ co giãn riêng phần của GDP thực hằng năm (triệu USD) theo số ngày lao động hằng năm (triệu
ngày công lao động) của khu vực nông nghiệp Đài Loan. Điều này có nghĩa: giữ nhập lượng vốn thực hằng
năm không đổi, căn cứ theo dữ liệu mẫu ta có nếu gia tăng số ngày lao động hằng năm của khu vực nông
nghiệp Đài Loan lên 1% thì GDP thực hằng năm của khu vực nông nghiệ
p Đài Loan sẽ tăng 1.498767%
β
3
= 0.489858 độ co giãn riêng phần của GDP thực hằng năm (triệu USD) theo vốn thực hằng năm (triệu USD) của
khu vực nông nghiệp Đài Loan. Điều này có nghĩa giữ nhập lượng số ngày lao động hằng năm của khu vực
nông nghiệp Đài Loan không đổi, căn cứ theo dữ liệu mẫu ta có nếu gia tăng vốn thực hằng năm của khu vực
nông nghiệp Đài Loan lên 1% thì GDP thực hằng nă
m của khu vực nông nghiệp Đài Loan sẽ tăng 0.489858%
c) Khu vực nông nghiệp Đài Loan có phát triển hiệu quả không? Giải thích vì sao anh/chị lại có nhận định
như vậy. Ngoài những lý do phát triển do vốn và lao động các anh chị còn có giả thiết nào về các nguyên
nhân khác tác động đến sự phát triển của khu vực nông nghiệp không ?
Để kiểm định Khu vực nông nghiệp Đài Loan phát triển có hiệu quả không? Ta thực hiện vệc kiểm đị
nh Wald với:
H
0
: β

1
+ β
3
= 1
H
1
: β
1
+ β
3
≠ 1
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 4.344966 (1, 12) 0.0592
Chi-square 4.344966 1 0.0371

Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
-1 + C(2) + C(3) 0.988625 0.474284
Restrictions are linear in coefficients.
Căn cứ theo bảng trên ta có P = 0.0592 < 0.1 vì vậy ta bác bỏ H
0
với mức ý nghĩa α = 10%, mặc khác β
1
+ β
3
=
1.988625 > 1. Vì vậy, ta có mô hình tăng theo qui mô với mức ý nghĩa α = 10%
Ngoài những lý do phát triển do vốn và lao động các nguyên nhân khác tác động đến sự phát triển của khu vực nông

nghiệp bao gồm: sự phát triển của lĩnh vực công nghiệp, khoa học kỹ thuật liên quan đến nông nghiệp, thời tiết_khí
hậu,…
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 1
Khoa Quản Trị Kinh Doanh
GV: Nguyễn Thị Mai Bình
1

Môn học: KINH TẾ LƯỢNG
Lớp: 04QK (Năm học 2006 – 2007)

Gợi ý đáp án Bài tập số 1: MÔ HÌNH HỒI QUI ĐƠN BIẾN

Ngày phát: Thứ Bảy, ngày 31 tháng 03 năm 2007
Ngày nộp: Thứ Bảy, ngày 07 tháng 04 năm 2007


Câu 1: (10điểm) Chứng minh công thức xác định hệ số tương quan đơn biến sau:

SST
SSR
SS
S
r
yx
xy
==

GIẢI :
Ta có
∑∑


−−
−−
=
2
i
2
i
ii
yx
xy
)YY()XX(
)YY)(XX(
SS
S
(1)
Ngoài ra:
SSR =


2
i
)YY
ˆ
(
SST =


2
i

)YY(


i21i
XY
ˆ
β+β=

XY
21
β−=β




−−
==β
2
i
ii
2
x
xy
2
)XX(
)YY)(XX(
S
S



)XX(YXXYXY
ˆ
i2i22i21i
−β+=β+β−=β+β=
⇒ SSR =



∑∑










−−
=−β=−−β+
2
i
2
2
i
ii
2
i
2

2
2
i2
)XX(
)XX(
)YY)(XX(
)XX()Y)XX(Y(
Do đó:
()
∑∑





−−
−−
=











−−

=
2
i
2
i
2
ii
2
i
2
i
2
2
i
ii
)YY()XX(
)YY)(XX(
)YY(
)XX(
)XX(
)YY)(XX(
SST
SSR


()
∑∑

∑∑


−−
−−
=
−−
−−
=
2
i
2
i
ii
2
i
2
i
2
ii
)YY()XX(
)YY)(XX(
)YY()XX(
)YY)(XX(
SST
SSR
(2)

Từ (1) và (2) ta có:
SST
SSR
SS
S

r
yx
xy
==


ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 1
Khoa Quản Trị Kinh Doanh
GV: Nguyễn Thị Mai Bình
2
Câu 2: (70 điểm) Một sinh viên đã tiến hành nghiên cứu mối quan hệ giữa thu nhập trung
bình hằng năm của Cha Mẹ và điểm trung bình học tập của sinh viên. Dữ liệu thu thập từ
mẫu gồm 8 sinh viên và được kết quả như sau:

STT
Biến Y
ĐIỂM TRUNG BÌNH
ĐTB
Biến X
THU NHẬP TRUNG BÌNH HẰNG NĂM
TN - Triệu đồng
1 10.00 105
2 7.50 75
3 8.75 45
4 5.00 45
5 7.50 60
6 8.75 90
7 6.25 30
8 6.25 60


a) Tính các trị thống kê tổng hợp cho biến thu nhập trung bình hằng năm và biến điểm
trung bình. (10 điểm)

Cách 1: Dùng các hàm của Excel:


Cách 2: Dùng Data analysis trong excel:
- Chọn Descriptive Statistics cho phần thống kê mô tả
-
Chọn Correlation cho phần tính giá trị tương quan
-
Hệ số biến thiên áp dụng công thức
binh trung triaGi
chuanlech Do
v =
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 1
Khoa Quản Trị Kinh Doanh
GV: Nguyễn Thị Mai Bình
3


Cách 3: Dùng Eveiw:
Vào view /Decriptive Stats/ common sample Vào view /correlations

Các giá trị thống kê còn lại phải tự tính bằng tay

KẾT QUẢ:
TRỊ THỐNG KÊ TỔNG HỢP BIẾN ĐTB BIẾN TN
Số lần quan sát (n) 8 8
Trung bình 7.5 63.75

Trung vị 7.5 60
Yếu vị 7.5 45
Giá trị lớn nhất 10 105
Giá trị nhỏ nhất 5 30
Khoảng 5 75
Phương sai 2.678571429 626.7857
Độ lệch chuẩn 1.636634177 25.03569
Hệ số biến thiên 0.218218 0.392717
Hệ số tương quan 0.719092

ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 1
Khoa Quản Trị Kinh Doanh
GV: Nguyễn Thị Mai Bình
4

b) Vẽ đồ thị phân tán điểm cho tập dữ liệu từ đó xác định đường hồi qui. (5điểm)

Bằng Excel
ĐỒ THỊ PHÂN TÁN
y = 0.047x + 4.5032
0
2
4
6
8
10
12
0 20406080100120
Biến TN
Biến ĐTB



Bằng Eveiws



ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 1
Khoa Quản Trị Kinh Doanh
GV: Nguyễn Thị Mai Bình
5
c) Dựa vào công thức lý thuyết, hãy lập bảng xác định các tham số
1
ˆ
β ,
2
ˆ
β (10điểm)
Cách 1:
Theo công thức ta có:




−−
==β
2
i
ii
x
xy

2
)XX(
)YY)(XX(
S
S
ˆ

XY
ˆ
21
β−=β

Áp dụng theo công thức:

5.4387
25.206
)XX(
)YY)(XX(
S
S
ˆ
2
i
ii
x
xy
2
=

−−

==β


=0.047009

XY
ˆ
21
β−=β
= 7.5 – 0.047*63.75 = 4.503205

Cách 2:
Theo công thức ta có:






22
i
ii
2
XnX
YXnYX
ˆ

XY
ˆ
21

β−=β



Áp dụng theo công thức:

∑∑



=



222
i
ii
2
75.63*836900
75.63*5.7*825.4031
XnX
YXnYX
ˆ
=0.047009

XY
ˆ
21
β−=β = 7.5 – 0.047*63.75 = 4.503205


Vậy phương trình hồi qui:

i
Y
ˆ
= 4.503205 + 0.047009X
i

STT Biến Y Biến X
(Y
i
- Y) (X
i
- X) (Y
i
- Y )(X
i
- X) (X
i
- X)
2
1 10 105 2.5 41.25 103.125 1701.563
2 7.5 75 0 11.25 0 126.5625
3 8.75 45 1.25 -18.75 -23.4375 351.5625
4 5 45 -2.5 -18.75 46.875 351.5625
5 7.5 60 0 -3.75 0 14.0625
6 8.75 90 1.25 26.25 32.8125 689.0625
7 6.25 30 -1.25 -33.75 42.1875 1139.063
8 6.25 60 -1.25 -3.75 4.6875 14.0625
TỔNG 60 510 0 0 206.25 4387.5

Mean 7.5 63.75
STT Biến Y Biến X X
i
Y
i
X
i
2
1 10 105 1050 11025
2 7.5 75 562.5 5625
3 8.75 45 393.75 2025
4 5 45 225 2025
5 7.5 60 450 3600
6 8.75 90 787.5 8100
7 6.25 30 187.5 900
8 6.25 60 375 3600
TỔNG 60 510 4031.25 36900
Mean 7.5 63.75
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 1
Khoa Quản Trị Kinh Doanh
GV: Nguyễn Thị Mai Bình
6
d) Dựa vào các hàm trong Excel hãy các định các tham số
1
ˆ
β ,
2
ˆ
β (5điểm)


Dùng hàm INTERCEPT ta xác định được:
1
ˆ
β
= 4.503205
Dùng hàm SLOPE ta xác định được:
2
ˆ
β = 0.047009

Vậy phương trình hồi qui:
Y
i
= 4.503205 + 0.047009X
i
+
i
u
ˆ


e)
Sử dụng data analysis trong Excel để xác định lại phương trình hồi qui (5điểm)
Kết quả sau khi sử dụng data analysis:
SUMMARY OUTPUT

Regression Statistics

Multiple R 0.719092
R Square 0.517094

Adjusted R
Square 0.43661
Standard Error 1.228447
Observations 8

ANOVA
df SS MS F Significance F

Regression 1 9.695513 9.695513 6.424779 0.044396
Residual 6 9.054487 1.509081
Total 7 18.75

Coefficients
Standard
Error t Stat P-value Lower 95% Upper 95%
Intercept 4.503205 1.259551 3.575245 0.01171 1.421191 7.585219
X 0.047009 0.018546 2.534715 0.044396 0.001628 0.092389

Vậy phương trình hồi qui:

i
Y
ˆ
= 4.503205 + 0.047009X
i


ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 1
Khoa Quản Trị Kinh Doanh
GV: Nguyễn Thị Mai Bình

7
f) Tính lại các tham số
1
ˆ
β ,
2
ˆ
β bằng Eview (10điểm)

Dependent Variable: Y
Method: Least Squares
Date: 04/05/07 Time: 00:02
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C 4.503205 1.259551 3.575245 0.0117
X 0.047009 0.018546 2.534715 0.0444
R-squared 0.517094 Mean dependent var 7.500000
Adjusted R-squared 0.436610 S.D. dependent var 1.636634
S.E. of regression 1.228447 Akaike info criterion 3.461696
Sum squared resid 9.054487 Schwarz criterion 3.481556
Log likelihood -11.84678 F-statistic 6.424779
Durbin-Watson stat 3.055480 Prob(F-statistic) 0.044396

Vậy phương trình hồi qui:

i
Y
ˆ
= 4.503205128 + 0.04700854701*X

i

g)
Giải thích ý nghĩa của các tham số
1
ˆ
β ,
2
ˆ
β trong phương trình hồi qui (10điểm)
2
ˆ
β = 0.047 : ảnh hưởng cận biên của biến thu nhập trung bình hằng năm của cha mẹ lên biến
điểm trung bình của sinh viên; nghĩa là: khi thu nhập trung bình hằng năm của cha mẹ tăng lên 1
triệu đồng thì theo thông tin của mẫu điểm trung bình của sinh viên sẽ tăng lên trung bình là
0.047 điểm.
1
ˆ
β = 4.5 : tung độ gốc của đường hồi qui tổng thể, không có cách giải thích cho
1
ˆ
β vì còn ẩn
chứa biến bỏ sót (ngoài mô hình)

h) Hảy kiểm định giả thuyết cho rằng trung bình hằng năm của Cha Mẹ có ảnh hưởng
đến thu nhập điểm trung bình của sinh viên (10điểm)
H
0
: β
2

= 0 → X không ảnh hưởng đối với Y
H
1
: β
2
≠ 0 → X có ảnh hưởng đối với Y
Ta có:
-
P
value
= 0.044396 < 0.05
-
T
stat
= 2.534715 > T
6,0.025
= 2.447
-
Lower 95% =0.001628; Upper 95% = 0.092389 cùng dấu
⇒ bác bỏ H
0
: vậy thu nhập có ảnh hưởng lên điểm trung bình của sinh viên.

i) Phương trình sẽ thay đổi như thế nào nếu biến thu nhập đuợc thay đổi theo đơn vị tính
là ngàn đồng (5 điểm)
Gọi X
*
là biến thu nhập được tính theo đơn vị ngàn đồng, ta có:
X
i

*
=
1000
X
i
⇒ X
i
=1000 X
i
*

Vậy phương trình hồi qui lúc này sẽ là:

i
Y
ˆ
= 4.503205128 + 47X
i
*


1






TRƯỜNG ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG
KHOA QUẢN TRỊ KINH DOANH


MÔN HỌC: KINH TẾ LƯỢNG _ ĐỀ 1

KỲ THI: CHÍNH LỚP: 04QK
NGÀY THI: 02/07/2007 Thời gian làm bài: 90 phút
(Sinh viên được sử dụng tài liệu)
CB ra đề: Nguyễn Thị Mai Bình
Ngày ra đề: 25/06/2007
Ký tên:



Trưởng Khoa:
Ngày duyệt đề:
Ký tên:



Câu 1: (25 điểm) Dữ liệu về tiêu dùng thịt gà với các biến được định nghĩa như sau:
Y = lượng thịt gà tiêu thụ bình quân đầu người (pound)
X2 = thu nhập khả dụng bình quân đầu người (USD)
X3 = Giá bán lẻ của thịt gà (cent/pound)
X4 = Giá bán lẻ của thịt bò (cent/pound)
X5 = Giá bán lẻ của thịt heo (cent/pound)
X6 = Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (cent/pound)
1. Hãy giải thích mối quan hệ kỳ vọng giữa lượ
ng thịt gà tiêu thụ bình quân đầu người
với các biến còn lại.
2. Nhận xét các khả năng xảy ra hiện tượng đa cộng tuyến trong mô hình 1.1
3. Trong mô hình 1.1, các biến nào không có ý nghĩa về mặt thống kê (không ảnh hưởng

đến lượng thịt gà tiêu thụ bình quân đầu người) với mức ý nghĩa 10%. Hãy cho biết
nên thực hiện kiểm định nào để biết được có nên bỏ các biến trên ra khỏi mô hình 1.1
4. Việc xây dự
ng mô hình từ mô hình 1.1 đến mô hình 1.2 có tên gọi là gì? Hãy giải thích
ý nghĩa các tham số của mô hình phù hợp nhất.
5. Theo kết quả trong mô hình 1.3 và mô hình 1.4, mô hình này có bị bệnh phương sai
thay đổi hay tương quan chuỗi không? Hãy viết các kiểm định cần thiết và cho kết
luận với mức ý nghĩa 10%
Mô hình 1.1

Dependent Variable: Y
Method: Least Squares
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 38.59691 4.214488 9.158150 0.0000
X2 0.004889 0.004962 0.985370 0.3383
X3 -0.651888 0.174400 -3.737889 0.0016
X4 0.243242 0.089544 2.716443 0.0147
X5 0.104318 0.070644 1.476674 0.1580
X6 -0.071110 0.098381 -0.722805 0.4796
R-squared 0.944292 Mean dependent var 39.66957
Adjusted R-squared 0.927908 S.D. dependent var 7.372950
S.E. of regression 1.979635 Akaike info criterion 4.423160
Sum squared resid 66.62224 Schwarz criterion 4.719376
Log likelihood -44.86635 F-statistic 57.63303
Durbin-Watson stat 1.100559 Prob(F-statistic) 0.000000
2







Mô hình 1.2
Dependent Variable: Y
Method: Least Squares
Date: 06/18/07 Time: 16:17
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 35.68084 3.399337 10.49641 0.0000
X3 -0.654097 0.157564 -4.151300 0.0005
X4 0.232528 0.054387 4.275460 0.0004
X5 0.115422 0.024303 4.749224 0.0001
R-squared 0.939235 Mean dependent var 39.66957
Adjusted R-squared 0.929641 S.D. dependent var 7.372950
S.E. of regression 1.955702 Akaike info criterion 4.336146
Sum squared resid 72.67063 Schwarz criterion 4.533624
Log likelihood -45.86568 F-statistic 97.89329
Durbin-Watson stat 1.251523 Prob(F-statistic) 0.000000
Mô hình 1.3
White Heteroskedasticity Test:
F-statistic 2.057006 Probability 0.116679
Obs*R-squared 10.01575 Probability 0.123990

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/18/07 Time: 16:20
Sample: 1960 1982

Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 9.104201 22.91467 0.397309 0.6964
X3 -0.615702 1.217573 -0.505680 0.6200
X3^2 0.008291 0.013154 0.630327 0.5374
X4 -0.330705 0.251955 -1.312556 0.2078
X4^2 0.001315 0.001247 1.055248 0.3070
X5 0.318804 0.192811 1.653455 0.1177
X5^2 -0.001030 0.000552 -1.865428 0.0806
R-squared 0.435468 Mean dependent var 3.159593
Adjusted R-squared 0.223768 S.D. dependent var 2.772478
S.E. of regression 2.442665 Akaike info criterion 4.869847
Sum squared resid 95.46582 Schwarz criterion 5.215432
Log likelihood -49.00324 F-statistic 2.057006
Durbin-Watson stat 3.388400 Prob(F-statistic) 0.116679

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×