Tải bản đầy đủ (.doc) (9 trang)

Bài tập Kinh tế lượng 2 có đáp án

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (199.02 KB, 9 trang )

ĐÁP ÁN BÀI TẬP 2 Người soạn: PVM
ĐẠI HỌC HOA SEN
KINH TẾ LƯỢNG
ĐÁP ÁN Bài tập SỐ 2
MÔ HÌNH HỒI QUY ĐƠN
Người soạn: GV. Phạm Văn Minh
Câu 1 (25 điểm): Các khẳng định sau đây có chính xác không? Hãy cẩn thận suy xét
và giải thích các câu trả lời của Anh/Chị.
a. Các ước lượng bình phương nhỏ nhất thông thường (OLS) cho hệ số gốc được
ước tính chính xác hơn nếu như các giá trị của X gần với các giá trị trung
bình mẫu hơn.
Trước khi trả lời câu này, nhắc lại sự khác nhau giữa "đúng" và "chính xác" là hữu
ích. Đúng nghĩa là không chệch; chính xác nghĩa là phương sai thấp. Do đó, câu hỏi
này là về phương sai của các hàm ước lượng bình phương thông thường nhỏ nhất
(OLS).
Phương sai của các hàm ước lượng độ dốc OLS trong mô hình hồi qui đơn giản là:
Từ biểu thức này chúng ta thấy rằng phương sai là nhỏ hơn (hàm ước lượng này
chính xác hơn) nếu các giá trị của X cách xa giá trị trung bình mẫu hơn. Vậy khẳng
định trên là sai.
b. Nếu X
i
và u
i
tương quan với nhau, thì các hàm ước lượng (OLS) vẫn là không
chệch.
Điều này không đúng. Để thấy tại sao, hãy viết biểu thức sau đối với hàm ước
lượng độ dốc :
Nếu X
i
và u
i


có tương quan với nhau, thì số hạng sau cùng trong biểu thức này
không phải là zero và hàm ước lượng này là chệch.
c. Các hàm ước lượng không thể là ước lượng không chệch tuyến tính tốt nhất
(BLUE) trừ khi các u
i
đều có phân phối chuẩn.
BLUE nghĩa là "Hàm ước lượng không chệch tuyến tính tốt nhất." Trong bối
cảnh này, "tuyến tính " chỉ một hàm ước lượng là một hàm tuyến tính của số hạng
sai số ngẫu nhiên trong mô hình này, hoặc là một hàm tuyến tính của biến phụ thuộc
của mô hình này. Kiểm tra các hàm ước lượng OLS cho độ dốc và tung độ gốc là đủ
để xác lập rằng chúng là tuyến tính. Không yêu cầu tính chuẩn.
Không chệch được thiết lập bằng cách lấy kỳ vọng của hàm ước lượng OLS, là điều
mà chúng ta đã làm nhiều lần. Không cần tới tính chuẩn khi chứng minh rằng kỳ
vọng này bằng với giá trị thực (nhưng chưa biết) của thông số.
Tốt nhất là dùng Định lý Gauss-Markov. Phép chứng minh định lý này không cần
tới tính chuẩn.
Chúng ta thấy rằng phát biểu này là sai.
d. Nếu phương sai của u
i
lớn thì các khoảng tin cậy đối với các hệ số sẽ rộng
hơn.
Điều này là đúng. Chiều rộng của một khoảng tin cậy liên quan trực tiếp tới độ lớn
của độ lệch chuẩn của hàm ước lượng và độ lệch chuẩn của hàm ước lượng liên
quan trực tiếp tới độ lệch chuẩn của số hạng sai số. Anh/Chị cần viết được các biểu
thức có liên quan này dựa vào trí nhớ.
e. Nếu các giá trị của X có một phương sai lớn thì các khoảng tin cậy sẽ hẹp hơn.
Điều này là đúng. Xem các câu trả lời cho phần 4a và 4d.
f. Một giá trị p cao có nghĩa là hệ số này khác không ở mức độ có ý nghĩa về mặt
thống kê.
Điều này là sai. Câu hỏi này nói tới kiểm định thống kê của giả thuyết cho là hệ số

hồi qui bằng không.
Giá trị p là xác suất của việc trị thống kê kiểm định này có thể vượt quá giá trị
tuyệt đối của trị thống kê kiểm định được tính toán cho một mẫu cụ thể, cho trước
rằng giả thuyết không là đúng. Giá trị tuyệt đối của trị thống kê kiểm định càng lớn
2
thì giá trị p sẽ càng nhỏ. Trị thống kê kiểm định càng lớn thì hệ số càng có ý nghĩa
thống kê hơn.
g. Nếu Anh/Chị chọn một mức độ ý nghĩa cao hơn thì một hệ số hồi qui có khả
năng có ý nghĩa nhiều hơn.
Điều này đúng. Câu hỏi này nói tới kiểm định thống kê của giả thuyết cho là hệ số
hồi qui bằng không.
Một mức độ ý nghĩa cao thu được một giá trị tới hạn nhỏ hơn nếu xét về giá trị tuyệt
đối. Bác bỏ giả thuyết không khi giá trị tuyệt đối của giá trị tới hạn nhỏ hơn là điều
dễ hơn.
h. Giá trị p là xác suất để giả thuyết không (H
0
) là đúng.
Đây là một giải thích không chính xác (nhưng thường gặp) đối với giá trị p.
Xem câu trả lời cho phần 4f.
Câu 2 (25 điểm):
Một số liệu thống kê về lãi suất ngân hàng (X, % năm) và tổng vốn đầu tư (Y, tỉ đồng)
trên địa bàn tỉnh Bình Dương qua 10 năm liên tiếp như sau:
Năm 1 2 3 4 5 6 7 8 9 10
X
i
7.0 6.5 6.5 6.0 6.0 6.0 5.5 5.5 5.0 4.5
Y
i
29 32 31 34 32 35 40 43 48 50
1. Hãy lập mô hình hồi quy tuyến tính mô tả quan hệ giữa tổng vốn đầu tư và lãi

suất ngân hàng (mô hình hồi quy đơn). Nêu ý nghĩa của các hệ số hồi quy ước
lượng được. Đánh giá mức độ phù hợp của mô hình.
Mô hình hồi quy tuyến tính mô tả quan hệ giữa tổng vốn đầu tư và lãi suất
ngân hàng được cho như sau:
Trong đó:
là tung độ gốc của hàm hồi quy trên, được tính bằng lệnh Intercept trong
Excel với cú pháp như sau: Intercept (Tập hợp các dữ liệu của biến phụ thuộc,
Tập hợp các dữ liệu của biến độc lập) = 93.164. Giá trị này nói lên rằng khi lãi
3
suất ngân hàng bằng 0% (điều này hiếm xảy ra trên thực tế), thì tổng vốn đầu tư
trung bình một năm sẽ là 93.164 tỉ đồng.
là hệ số góc của hàm hồi quy trên, được tính bằng lệnh Slope trong Excel
với cú pháp như sau: Slope (Tập hợp các dữ liệu của biến phụ thuộc, Tập hợp
các dữ liệu của biến độc lập) = -9.532. Giá trị này nói lên rằng: xét các giá trị
của X nằm trong khoảng (4.5, 7)%, khi lãi suất ngân hàng tăng thêm 1% một
năm thì tổng vốn đầu tư một năm sẽ giảm trung bình 9.532 tỉ đồng/năm.

2. Kiểm định giả thiết: Hệ số hồi quy của X trong hàm hồi quy tổng thể bằng 0
với mức ý nghĩa 2% và nêu ý nghĩa của kết quả.
Để kiểm định β
2
= 0 với mức ý nghĩa 2%, ta làm các bước sau:
Đặt giả thiết không và giả thiết đối:
H
0
: β
2
= 0 với H
1
: β

2
≠ 0
Chúng ta biết rằng trong mô hình hồi quy hai biến kiểm định β
2
= 0 cũng chính
là kiểm định sự phù hợp của mô hình hồi quy (X thật sự có tác động đến Y?)
Để kiểm định giả thiết trên ta áp dụng quy tắc kiểm định sau:
Tính : Nếu F > F
α
(1, n-2) thì ta bác bỏ giả thiết H
0
Dựa vào bảng số liệu trên, ta tính được = 5.025; = 4.975. Cụ thể hơn,
Xin tham khảo bảng tính sau (double click vào để xem cách tính):
4
Từ kết quả trên,
Tra cứu ta có: F
α
(1, n-2) =F
0.02
(1, 8) = 8.389 (dùng hàm FINV trong Excel)
Ta thấy rằng: F > F
α
(1, n-2) nên ta bác bỏ giả thiết H
0
, tức là β
2
≠ 0.
Ý nghĩa của kết quả: Với tập dữ liệu mẫu đã cho, bác bỏ giả thuyết H
0


2
=0)
có nghĩa rằng biến lãi suất ngân hàng (X, % năm) thực sự có tác động đến tổng
vốn đầu tư (Y, tỉ đồng).
Cách khác để kiểm định giả thiết H
0
ở trên là dùng giá trị p (p-value): ta
dùng hàm FDIST để tìm giá trị P-value trong Excel ứng với giá trị F đã tính
được bằng công thức ở trên, cú pháp:
FDIST(F, bậc tự do tử số, bậc tự do mẫu số)
= FDIST(91.776,1,8) = 0.000011683 = P-value (được gọi là mức ý nghĩa
quan sát hay mức ý nghĩa chính xác hay xác suất phạm sai lầm loại I,
mức ý nghĩa thấp nhất mà H
0
có thể bị bác bỏ)
Nguyên tắc kiểm định như sau:
o P-value < α thì bác bỏ H
0
, chấp nhận H
1
o P-value ≥ α thì chưa có cơ sở để bác bỏ H
0
.
Vậy từ kết quả P-value tính được ở trên, ta so sánh nó với mức ý nghĩa α của đề
bài, ta có: P-value (0.000011683) < α (0.02). P-value rất thấp, có nghĩa là xác
suất phạm phải sai lầm bác bỏ giả thiết H
0
khi nó đúng là rất thấp.
3. Dự báo tổng vốn đầu tư trung bình khi lãi suất là 4,8% năm với độ tin cậy
98%.

47.409 = 4.8 * 9.532 - 93.164 =
0
Y


Ta tính:
( )









+=

2
2
0
2
0
)(1
i
x
XX
n
YVar
σ



(*) trong đó:
2
σ

= 4.975;

2
i
x
= 5.025;
X
= 5.85; X
0
=4,8; n=10.
(*) 
( )
589.1
025.5
)86.58.4(
10
1
975.4
2
0
=








+=
YVar


( )
261.1
0
=
YSe

5
t
0,01
(8) = 2,896
Khoảng tin cậy 98% của vốn đầu tư trung bình khi lãi suất là 4,8% năm:
47.409
±
2,896 *1.261 Hay: 43.757 < E(Y/X=4.8) < 51.061
Câu 3 (25 điểm):
Bảng dưới đây cho biết số liệu về tiền lương trung bình 1 giờ (mean hourly wage, đặt
tên biến là Meanwage) và số năm được đào tạo (years of schooling, đặt tên biến là
Education) như sau:
Quan sát
(n)
Số năm được đào tạo
(Education - năm)

Lương trung bình một giờ
(Meanwage - $)
1 6 4.4567
2 7 5.7700
3 8 5.9787
4 9 7.3317
5 10 7.3182
6 11 6.5844
7 12 7.8182
8 13 7.8351
9 14 11.0223
10 15 10.6738
11 16 10.8361
12 17 13.6150
13 18 13.5310
Từ số liệu trên, chúng ta có kết quả hồi quy sau:

ii
EducationwagenMea 724097.0014453.0
+−=


se = (0.874624) ( A )
t = ( B ) (10.40648) r
2
= 0.9078 n = 13
a. Bạn hãy điền vào chỗ trống ( ) các giá trị thích hợp.
Do
)
ˆ

(
0
ˆ
i
i
Se
t
β
β

=

01652.0
874624.0
014453.0
−=

=
B
;
06958.0
40648.10
724097.0
==
A
;
b. Giải thích ý nghĩa của hệ số góc.
1
β


= - 0.014453 là tung độ gốc của đường hồi quy mẫu, không thể giải thích một
cách máy móc là khi số năm được đào tạo bằng 0 thì tiền lương một giờ trung bình
bằng -0.014453$ (số âm không có ý nghĩa ở đây).
6
2
β

= 0.729097. Giá trị này nói lên rằng: xét các giá trị của Education nằm trong
khoảng (6, 18) năm, khi số năm được đào tạo tăng thêm một năm thì tiền lương một
giờ trung bình sẽ tăng lên 0.729097$.
c. Education có ảnh hưởng đến Meanwage không? Tại sao? (Gợi ý: Kiểm định
giả thiết).
Kiểm định giả thiết: H
0
: β
2
=0, H
1
: β
2
≠0 với mức ý nghĩa 5%
t = 10.40648 (đề cho)
t
α
/2(n-2)
= t
0.025 (11)
= 2.201
t
> t

0.025 (11)
nên bác bỏ giả thiết H
0
(với mức ý nghĩa 5%).
Vậy β
2
≠0 đáng kể về mặt thống kê, hay Education (số năm được đào tạo) thực
sự có ảnh hưởng đến Meanwage (tiền lương một giờ).
R
2
= 0.9078 khá gần 1. Vậy mô hình có mức độ phù hợp cao.
d. Đánh giá mức độ phù hợp của mô hình.
Với kết quả trong câu c (β
2
≠0) và R
2
= 0.9078 khá gần 1. Ta có thể kết luận rằng mô
hình có mức độ phù hợp cao với tập dữ liệu mẫu đã cho.
Câu 4 (25 điểm):
Xem kết quả của phân tích hồi quy sau:

ii
XY 6560.02033.0
ˆ
+=
Se = (0.0976) (0.1961)
r
2
= 0.397 RSS = 0.0544 ESS = 0.0358
Trong đó: Y là tỷ lệ tham gia lực lượng lao động của nữ năm 1972

X là tỷ lệ tham gia lực lượng lao động của nữ năm 1968
Kết quả phân tích hồi quy này có được từ một mẫu gồm 19 thành phố của Mỹ.
a. Giải thích ý nghĩa của các hệ số hồi quy ước lượng được.
1
β

= 0.2033 là tung độ gốc của đường hồi quy mẫu, nói lên rằng khi tỷ lệ tham gia
lực lượng lao động của nữ năm 1968 (X) bằng 0, thì tỷ lệ tham gia lực lượng lao
động trung bình của nữ năm 1972 (Y) bằng 0.2033.
7
2
β

= 0.6560 là hệ số góc của đường hồi quy mẫu, nói lên rằng khi tỷ lệ tham gia lực
lượng lao động của nữ năm 1968 (X) tăng (giảm) 1 đơn vị, thì tỷ lệ tham gia lực
lượng lao động trung bình của nữ năm 1972 (Y) sẽ tăng (giảm) 0.6560 đơn vị.
b. Kiểm định giả thiết: H
0
: β
2
=1; H
1
: β
2
>1 với mức ý nghĩa 5%.
754.1
0.1961
16560.0
)
ˆ

(
1
ˆ
2
2
−=

=

=
β
β
Se
t

t
0,05 (17)
= 1.740
t < t
0,05 (17)
nên không bác bỏ giả thiết H
0
(với mức ý nghĩa 5%).
c. Từ kết quả phân tích hồi quy trên, chứng minh rằng:
2
σ

= 0.0032;

2

i
x
= 0.0832;
X
= 0.4932
Ta có:

=
=
n
i
i
xESS
1
22
2
)
ˆ
(
β

0.0832
)6560.0(
0358.0
)
ˆ
(
2
2
2

1
2
===

=
β
ESS
x
n
i
i
(đpcm)
0032.0
219
0544.0
22
ˆ
1
2
2
=

=

=

=

=
n

RSS
n
e
n
i
i
σ
(đpcm)
2
1
2
1
2
1
2
1
))
ˆ
((
ˆ
)
ˆ
(
βσβ
Se
xn
X
Var
n
i

i
n
i
i
==


=
=

2
2
1
1
2
1
2
ˆ
))
ˆ
((
σ
β
Sexn
X
n
i
i
n
i

i


=
=
=
7057.4
0032.0
)0976.0(*0832.0*19
2
1
2
==

=
n
i
i
X
Ta còn có:
2
1
2
1
2
)(XnXx
n
i
i
n

i
i
−=
∑∑
==

n
xX
X
n
i
i
n
i
i
∑∑
==

=
1
2
1
2
2
)(
2433.0
19
0832.07057.4
)(
2

=

=
X

4932.0
=
X
(đpcm)
d. Giả sử rằng tỷ lệ tham gia lực lượng lao động của nữ năm 1968 là 0,58 (hay
58%). Trên cơ sở kết quả của phân tích hồi quy ở trên, giá trị trung bình của
tỷ lệ tham gia lực lượng lao động của nữ năm 1972 là bao nhiêu? Thiết lập
khoảng tin cậy 95% cho giá trị dự báo trung bình này.
0
Y

= 0.2033 + 0.6560 * 0.58 = 0.58378
8
( )
0,00046=
0832.0
)4932.058.0(
19
1
.00320 =
)(1
var
2
2
2

0
2
0







+









+=

i
x
XX
n
Y
σ




)(
0
Yse

= 0,02141
t
0,025
(17) = 2.110
Khoảng tin cậy 95% của dự báo trung bình của tỷ lệ tham gia lực lượng lao động của
nữ năm 1972 khi tỷ lệ tham gia lực lượng lao động của nữ năm 1968 là 0.58, là:
0.58378
±
2.110* 0,002141 Hay: 0.5386 < E(Y/X=0.58) < 0.6289
HẾT
9

×