Tải bản đầy đủ (.pdf) (9 trang)

bài tập kinh tế lượng - hồi quy đơn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (200.51 KB, 9 trang )

MÔ HÌNH H
ỒI QUY ĐƠN
Câu 1 (25 đi
ểm)
: Các kh
ẳng định sau đây có chính xác không? Hãy cẩn thận suy xét
và gi
ải thích
các câu tr
ả lời của Anh/Chị.
a. Các ư
ớc lượng bình phương nhỏ nhất thông thường (OLS) cho hệ số gốc được
ư
ớc
tính chính xác hơn n
ếu nh
ư các gi
á tr
ị của X gần với các giá trị trung
bình mẫu hơn.
Trư
ớc khi trả lời câu này, nhắc lại sự khác nhau giữa "
đúng" và
"chính xác" là h
ữu
ích. Đúng ngh
ĩa là không chệch; chính xác
ngh
ĩa là phương sai thấp. Do đó
, câu
h


ỏi này là về phương sai của các hàm
ư
ớc l
ư
ợng bình phương thông thường nhỏ
nh
ất (OLS).
Phương sai c
ủa các hàm ước lượng độ dốc OLS trong mô hình hồi qui đơn giản
là:
T
ừ biểu thức này chúng ta thấy rằng ph
ương sai là nhỏ hơn (hàm ước lượng
này
chính xác hơn) n
ếu các giá trị của X cách xa giá trị
trung bình m
ẫu hơn.
V
ậy
kh
ẳng
định trên là
sai.
b. N
ếu X
i
và u
i
tương quan v

ới nhau, thì các hàm ước lượng (OLS) vẫn là không
ch
ệch.
Đi
ều này
không đúng. Đ
ể thấy tại sao, hãy viết biểu thức sau đối với hàm ước

ợng
độ dốc :
Nếu X
i
và u
i
có tương quan với nhau, thì số hạng sau cùng trong biểu thức này
không ph
ải là zero và hàm
ước lượng này là chệch.
c. Các hàm ư
ớc lượng không thể là ước lượng không chệch tuyến tính tốt nhất
(BLUE) tr
ừ khi các u
i
đ
ều có phân phối chuẩn.
BLUE ngh
ĩa là
"Hàm ư
ớc lượng không chệc
h tuy

ến tính tốt nhất."
Trong b
ối
c
ảnh này, "tuyến tính " chỉ một hàm
ước lượng là một hàm tuyến
tính c
ủa số hạng
forum.ueh.vn
2
sai s
ố ngẫu nhiên trong mô hình này, hoặc là một hàm tuyến
tính c
ủa biến phụ
thu
ộc của mô hình này. Kiểm tra các hàm ước lượng OLS
cho đ
ộ dốc
và tung đ

gốc là đủ để xác lập rằng chúng là tuyến tính. Không yêu cầu tính chuẩn.
Không ch
ệch được thiết lập bằng cách lấy kỳ vọng của hàm ước lượng OLS, là
đi
ều mà chúng ta
đã làm nhiều lần. Không cần tới tính chuẩn khi chứng minh
r
ằng
k
ỳ vọng này bằng

v
ới giá trị thực (nhưng chưa biết) của thông số.
T
ốt nhất là dùng
Định lý Gauss
-Markov. Phép ch
ứng minh
định lý này không
c
ần
t
ới tính chuẩn.
Chúng ta th
ấy rằng phát biểu này là
sai.
d. N
ếu phương sai của u
i
l
ớn thì các khoảng tin cậy đối với các hệ số sẽ rộn
g
hơn.
Đi
ều này là
đúng. Chi
ều rộng của một khoảng tin cậy liên quan trực tiếp tới
đ
ộ lớn
c
ủa

độ lệch chuẩn của hàm ước lượng và độ lệch chuẩn của hàm ước

ợng liên
quan tr
ực tiếp tới độ lệch chuẩn của số hạng sai số. Anh/Chị cần
vi
ết được các biểu
th
ức c
ó liên quan này d
ựa vào trí nhớ.
e. N
ếu các giá trị của X có một phương sai lớn th
ì các kho
ảng tin cậy sẽ hẹp hơn
.
Đi
ều này là
đúng. Xem các câu tr
ả lời cho phần 4a và 4
d.
f. M
ột giá trị p cao có nghĩa là hệ số này khác không ở mức độ có ý nghĩa về mặt
th
ống kê.
Đi
ều này là
sai. Câu h
ỏi này nói tới kiểm định thống kê của giả thuyết cho là
h

ệ số
h
ồi qui bằng không.
Giá trị p là xác suất của việc trị thống kê kiểm định này có thể vượt quá giá trị
tuy
ệt đối của trị thống kê kiểm định được tính toán cho một mẫu cụ t
h
ể,
cho trư
ớc
r
ằng giả thuyết không là
đúng. Giá trị tuyệt đối của trị thống kê
ki
ểm
định càng lớn
thì giá tr
ị p sẽ càng nhỏ. Trị thống kê kiểm định càng lớn
thì h
ệ số càng có ý nghĩa
th
ống kê h
ơn.
g. N
ếu Anh/Chị chọn một mức độ ý nghĩa cao hơn thì một hệ số
h
ồi qui có khả
năng có ý ngh
ĩa nhiều h
ơn.

forum.ueh.vn
3
Đi
ều này
đúng. Câu h
ỏi này nói tới kiểm định thống kê của giả thuyết cho là
h
ệ số
h
ồi qui bằng không.
Một mức độ ý nghĩa cao thu được một giá trị tới hạn nhỏ hơn nếu xét về giá trị
tuy
ệt đối. Bác bỏ giả thuyết khôn
g khi giá tr
ị tuyệt đối của giá trị tới hạn nhỏ
hơn
là đi
ều dễ h
ơn.
h. Giá tr
ị p là xác suất để giả thuyết không (H
0
) là đúng.
Đây là m
ột giải thích
không chính xác (nhưng thư
ờng gặp)
đối với gi
á tr
ị p.

Xem câu tr
ả lời cho phần 4
f.
Câu 2 (25 đi
ểm):
M
ột số l
i
ệu thống kê về lãi suất ngân hàng (X, % n
ăm) và tổng vốn đầu tư (Y, tỉ đồng)
trên đ
ịa bàn tỉnh Bình Dương qua 10 năm liên tiếp như sau:
Năm
1
2
3
4
5
6
7
8
9
10
X
i
7.0
6.5
6.5
6.0
6.0

6.0
5.5
5.5
5.0
4.5
Y
i
29
32
31
34
32
35
40
43
48
50
1. Hãy l
ập mô hình hồi quy tuyến tính mô tả quan hệ giữa tổng vốn
đầu tư và lãi
su
ất ngân hàng (mô hình hồi quy đơn). Nêu ý nghĩa của các hệ số hồi quy ước

ợng
được.
Đánh giá m
ức
độ phù hợp của mô hình
.
Mô hình h

ồi quy tuyến tính mô tả quan hệ giữa tổng vố
n đ
ầu tư và lãi suất
ngân hàng đư
ợc cho như sau:
Trong đó:
là tung đ
ộ gốc
c
ủa hàm hồi quy trê
n, đư
ợc tính bằng lệnh
Intercept trong
Excel v
ới cú pháp
như sau: Intercept (T
ập hợp các dữ liệu của biến phụ thuộc,
T
ập hợp các dữ liệu
c
ủa biến
đ
ộc lập)
= 93.164. Giá tr
ị này nói lên rằng
khi lãi
su
ất ngân hàng bằng 0%
(đi
ều này hiếm xảy ra trên thực tế)

, thì t
ổng vốn đầu
tư trung b
ình
m
ột n
ăm sẽ
là 93.164 t

đồng.
là h
ệ số góc
c
ủa hàm hồi quy trên, được tính bằng lệnh
Slope trong Excel
v
ới cú pháp
như sau: Slope (T
ập hợp các dữ liệu của biến phụ thuộc, Tập hợp
forum.ueh.vn
4
các d
ữ liệu của biến độc lập)
= -9.532. Giá tr
ị này nói lên rằng
: xét các giá tr

c
ủa X nằm trong khoảng (4.5, 7)%
, khi lãi su

ất ngân hàng
tăng thêm 1% m
ột
năm thì tổng vốn đầu tư một năm sẽ giảm trung bình 9.532 tỉ đồng/năm.
2. Ki
ểm định giả thiết: Hệ số hồi quy của X trong hàm hồi quy tổng thể bằng 0
v
ới mức ý nghĩa 2% và nêu ý nghĩa của kết quả.
Đ
ể kiểm định
β
2
= 0 v
ới mức ý nghĩa 2%,
ta làm các bư
ớc sau:
Đ
ặt giả thiết không và giả thiết
đối:
H
0
: β
2
= 0 với H
1
: β
2
≠ 0
Chúng ta bi
ết rằng

trong mô hình h
ồi quy hai biến
ki
ểm định
β
2
= 0 c
ũng chính
là ki
ểm
định
s
ự phù hợp của mô hình hồi quy (X thật sự có tác
động đến Y
?)
Để kiểm định giả thiết trên ta áp dụng quy tắc kiểm định sau:
Tính : N
ếu
F > F
α
(1, n-2) thì ta bác b
ỏ giả thiết H
0
D
ựa vào bảng số liệu trên, ta tính
được =
5.025; = 4.975. C
ụ thể h
ơn
,

Xin tham kh
ảo bảng tính sau
(double click vào đ
ể xem cách tính)
:
Năm
Xi Yi
xi xi^2 ei ei^2
1 7.0 29 1.2 1.323 2.562 6.565
2 6.5 32 0.7 0.423 0.796 0.634
3 6.5 31 0.7 0.423 -0.204 0.042
4 6.0 34 0.2 0.023 -1.970 3.881
5 6.0 32 0.2 0.023 -3.970 15.762
6 6.0 35 0.2 0.023 -0.970 0.941
7 5.5 40 -0.4 0.123 -0.736 0.542
8 5.5 43 -0.4 0.123 2.264 5.124
9 5.0 48 -0.9 0.722 2.498 6.238
10 4.5 50 -1.4 1.823 -0.269 0.072
Tổng 5.025 39.801
Trung bình 5.9 37.4
Bêta 1 mũ 93.164 sigma mũ ^2 4.975
Bêta 2 mũ -9.532 F= 91.776
T
ừ kết quả trên,
=
(
2
)
2


2
=1
2
=
(−9.532)
2
5.025
4.975
= 91.776
Tra c
ứu
ta có: F
α
(1, n-2) =F
0.02
(1, 8) = 8.389 (dùng hàm FINV trong Excel)
forum.ueh.vn
5
Ta th
ấy rằng:
F > F

(1, n-2) nên ta bác b
ỏ giả thiết H
0
, t
ức là
β
2
≠ 0.

Ý ngh
ĩa của kết quả:
V
ới tập dữ liệu mẫu đã cho,
bác b
ỏ giả thuyết
H
0

2
=0)
có ngh
ĩa rằng
bi
ến
lãi su
ất ngân hàng (X, % năm)
th
ực sự
có tác đ
ộng đến
t
ổng vốn đầu tư (Y, tỉ đồng)
.
Cách khác để kiểm định giả thiết H
0
ở trên là dùng giá trị p (p-value): ta
dùng hàm FDIST đ
ể tìm giá trị P
-value trong Excel ứng với giá trị F

đ
ã t
ính
đư
ợc bằng công thức ở trên, cú pháp:
FDIST(F, b
ậc tự do tử số, bậc tự do mẫu số)
= FDIST(91.776,1,8) = 0.000011683 = P-value (đư
ợc gọi là mức ý
ngh
ĩa quan sát hay mức ý nghĩa chính xác hay xác suất phạm sai lầm
lo
ại I
, m
ức ý n
gh
ĩa thấp nhất mà H
0
có th
ể bị bác bỏ
)
Nguyên t
ắc kiểm
định như sau:
o P-value < α thì bác b
ỏ H
0
, ch
ấp nhận H
1

o P-value
≥ α
thì ch
ưa có cơ sở để bác bỏ H
0
.
V
ậy từ kết quả P
-value tính đư
ợc ở trên, ta so sánh nó với mức ý nghĩa
α c
ủa
đ
ề bài, ta có:
P-value (0.000011683) < α (0.02). P-value r
ất thấp, có nghĩa là
xác suất phạm phải sai lầm bác bỏ giả thiết H
0
khi nó đúng là rất thấp.
3. D
ự báo tổng vốn đầu tư trung bình khi lãi suất là 4,8% năm với độ tin cậy
98%.
47.409=4.8*9.532-93.164=
0
Y

Ta tính:
( )










+=

2
2
0
2
0
)(1
i
x
XX
n
YVar



(*) trong đó:
2


= 4.975;

2

i
x
= 5.025;
X
= 5.85; X
0
=4,8; n=10.
(*) 
( )
589.1
025.5
)86.58.4(
10
1
975.4
2
0
=







+=YVar


( )
261.1

0
=YSe

t
0,01
(8) = 2,896
Khoảng tin cậy 98% của vốn đầu tư trung bình khi lãi suất là 4,8% năm:
47.409
±
2,896 *1.261 Hay: 43.757 < E(Y/X=4.8) < 51.061
Câu 3 (25 đi
ểm):
forum.ueh.vn
6
Bảng dưới
đây
cho bi
ết số liệu
v
ề tiền l
ương trung bình 1 gi
ờ (mean
hourly wage, đ
ặt
tên bi
ến là
Meanwage) và s
ố năm đ
ược đào t
ạo (years of schooling,

đ
ặt tên biến là
Education) như sau:
Quan sát
(n)
S
ố n
ăm được đào tạo
(Education - năm)
Lương trung bình m
ột giờ
(Meanwage - $)
1
6
4.4567
2
7
5.7700
3
8
5.9787
4
9
7.3317
5
10
7.3182
6
11
6.5844

7
12
7.8182
8
13
7.8351
9
14
11.0223
10
15
10.6738
11
16
10.8361
12
17
13.6150
13
18
13.5310
Từ số liệu trên, chúng ta có kết quả hồi quy sau:
ii
EducationwagenMea 724097.0014453.0 +−=

se = (0.874624) ( A )
t = ( B ) (10.40648) r
2
= 0.9078 n = 13
a. B

ạn hãy đ
i
ền vào chỗ trống (
) các giá tr
ị thích hợp.
Do
)
ˆ
(
0
ˆ
i
i
Se
t



=

01652.0
874624.0
014453.0
−=

=B
;
06958.0
40648.10
724097.0

==A
;
b. Gi
ải thích ý nghĩa của hệ số góc.
1


= - 0.014453 là tung đ
ộ gốc của
đườn
g h
ồi quy mẫu, không thể giải thích một
cách máy móc là khi s
ố n
ăm được đào tạo
b
ằng 0 thì
ti
ền l
ương một giờ
trung bình
b
ằng
-0.014453$ (s
ố âm không có ý nghĩa ở đây)
.
2


= 0.729097. Giá tr

ị này nói lên rằng: xét các giá trị của
Education n
ằm trong
kho
ảng (
6, 18) năm, khi s
ố n
ăm được đào tạo
tăng thêm m
ột n
ăm thì
ti
ền l
ương
m
ột giờ
trung bình s

tăng lên 0.729097$.
c. Education có
ảnh h
ưởng
đến Meanwage không? Tại sao?
(G
ợi ý: Kiểm định
gi
ả thiết).
forum.ueh.vn
7
Ki

ểm định giả thiết:
H
0
: β
2
=0, H
1
: β
2
≠0 v
ới mức ý nghĩa 5%
t = 10.40648 (đề cho)
t
α/2(n-2)
= t
0.025 (11)
= 2.201
t
> t
0.025 (11)
nên bác bỏ giả thiết H
0
(với mức ý nghĩa 5%).
V
ậy
β
2
≠0
đáng k
ể về mặt thống kê, hay

Education (s
ố n
ăm được đào tạo
) th
ực
s


ảnh h
ưởng
đến
Meanwage (ti
ền lương một giờ
).
R
2
= 0.9078 khá g
ần 1.
V
ậy mô hình có mức
độ phù hợp cao.
d. Đánh giá m
ức độ phù hợp của mô hình.
V
ới kết quả trong câu
c (β
2
≠0) và R
2
= 0.9078 khá g

ần 1.
Ta có th
ể kết luận rằng
mô hình có m
ức độ phù hợp cao
v
ới tập dữ liệu mẫu
đ
ã cho.
Câu 4 (25 đi
ểm):
Xem k
ết quả của phân tích hồi quy sau:
ii
XY 6560.02033.0
ˆ
+=
Se = (0.0976) (0.1961)
r
2
= 0.397 RSS = 0.0544 ESS = 0.0358
Trong đó: Y là t
ỷ lệ tham gia lực l
ượng lao
động của nữ năm 1972
X là t

l
ệ tham gia lực l
ượng lao

động của nữ năm 1968
K
ết quả phân tích hồi quy này có đ
ược từ một mẫu gồm 19 thành phố của Mỹ.
a. Gi
ải thích ý nghĩa của các hệ số hồi quy
ước lượng
đ
ược.
1


= 0.2033 là tung đ
ộ gốc của
đường hồi quy mẫu,
nói lên r
ằng
khi t
ỷ lệ
tham gia
l
ực l
ượng lao
đ
ộng của nữ năm 1968
(X) b
ằng 0, thì
t
ỷ lệ
tham gia l

ực l
ượng lao
đ
ộng
trung bình c
ủa nữ năm 19
72 (Y) b
ằng
0.2033.
2


= 0.6560 là h
ệ số góc
c
ủa đường hồi quy mẫu,
nói lên r
ằng khi tỷ lệ
tham gia
l

c lượng lao
động của nữ năm 1968
(X) tăng (gi
ảm) 1 đơn vị
, thì t
ỷ lệ
tham gia
l
ực l

ượng lao
động
trung bình c
ủa nữ năm 19
72 (Y) s

tăng (gi
ảm)
0.6560 đơn v

.
b. Ki
ểm định giả thiết: H
0
: β
2
=1; H
1
: β
2
>1 v
ới mức ý nghĩa 5%.
forum.ueh.vn
8
754.1
0.1961
16560.0
)
ˆ
(

1
ˆ
2
2
−=

=

=


Se
t
t
0,05 (17)
= 1.740
t < t
0,05 (17)
nên không bác b
ỏ giả thiết H
0
(v
ới mức ý nghĩa
5%).
c. T
ừ kết quả phân tích hồi quy trên, chứng minh rằng:
2


= 0.0032;


2
i
x
= 0.0832;
X
= 0.4932
Ta có:

=
=
n
i
i
xESS
1
22
2
)
ˆ
(


0.0832
)6560.0(
0358.0
)
ˆ
(
2

2
2
1
2
===

=

ESS
x
n
i
i
(đpcm)
0032.0
219
0544.0
22
ˆ
1
2
2
=

=

=

=


=
n
RSS
n
e
n
i
i

(đpcm)
2
1
2
1
2
1
2
1
))
ˆ
((
ˆ
)
ˆ
(

Se
xn
X
Var

n
i
i
n
i
i
==


=
=

2
2
1
1
2
1
2
ˆ
))
ˆ
((


Sexn
X
n
i
i

n
i
i


=
=
=
7057.4
0032.0
)0976.0(*0832.0*19
2
1
2
==

=
n
i
i
X
Ta còn có:
2
1
2
1
2
)(XnXx
n
i

i
n
i
i
−=
∑∑
==

n
xX
X
n
i
i
n
i
i
∑∑
==

=
1
2
1
2
2
)(
2433.0
19
0832.07057.4

)(
2
=

=X

4932.0=X
(đpcm)
d. Gi
ả sử rằng tỷ lệ tham gia lực l
ượng lao
đ
ộng của nữ năm 1968 là 0,58 (hay
58%). Trên cơ s
ở kết quả của phân tích hồi quy ở trên, giá trị trung bình của
t
ỷ lệ tham gia lực l
ượng lao
đ
ộng của nữ năm 1972 là bao nhiêu? Thiết lập
kho
ảng tin cậy 95% cho giá tr
ị dự báo trung bình này.
0
Y

= 0.2033 + 0.6560 * 0.58 = 0.58378
( )
0,00046=
0832.0

)4932.058.0(
19
1
.00320=
)(1
var
2
2
2
0
2
0







+









+=


i
x
XX
n
Y




)(
0
Yse

= 0,02141
forum.ueh.vn
9
t
0,025
(17) = 2.110
Khoảng tin cậy 95% của d
ự báo trung bình
c
ủa tỷ lệ tham gia lực lượng lao động của
n
ữ năm 1972
khi t
ỷ lệ tham gia lực lượng lao động của nữ năm 1968 là 0
.58, là:
0.58378

±
2.110* 0,002141 Hay: 0.5386 < E(Y/X=0.58) < 0.6289
H
ẾT
forum.ueh.vn

×