TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
---------***--------
BÀI TẬP GIỮA KỲ
MÔN: KINH TẾ LƯỢNG
Sinh viên thực hiện :
1) Vũ Thị Kiều Oanh
MSV: 1213310082
2) Phạm Minh Hà
MSV:1213330025
3) Lương Đức Phúc
MSV: 1213330064
4) Nguyễn Thị Vân Nhung MSV: 1211120081
Lớp
:KTE309.5
Giáo viên hướng dẫn :Th.s Đặng Thái Long
Hà Nội, 2014
LỜI NÓI ĐẦU
Kinh tế lượng là môn học quan trọng với tất cả sinh viên theo học kinh tế. Đây là
môn học có tính thực nghiệm cao, nó chú trọng đến việc kiểm định các luật kinh tế
bằng các số liệu thực tế. Và mặc dù có rất nhiều công thức và định lý, nó lại được
xem như một môn khoa học xã hội, vận dụng đồng thời cả lý thuyết và thực tiễn để
phân tích về lượng các vấn đề kinh tế.
Thông qua bài tập giữa kỳ này, chúng em đã được áp dụng nhiều hơn những
kiến thức của bộ môn kinh tế lượng vào thực tiễn thay vì chỉ ngồi cầm sách và học
thuộc lòng công thức. Bài tập này cũng chú trọng người học tìm hiểu nhiều về
phần mềm stata, làm cách nào sử dụng nó, nhận xét kết quả của nó. Đây là những
bài tập rất bổ ích và quý báu để thực hành kiến thức lý thuyết một cách hiệu quả.
Khi tham khảo phong cách trình bày bài làm của các anh chị khối trên, chúng em
thấy hầu như các báo cáo đều được trình bày theo phong cách của một tiểu luận.
Tuy nhiên, vì được giao 2 bài tập, hơn nữa với mỗi bài đều có yêu cầu riêng nên
chúng em quyết định trình bày theo hướng đưa ra câu trả lời và giải thích luôn,
tránh để bài làm quá dài, đồng thời đưa ra kết luận riênng cho từng phần.
Tuy chúng em đã cố gắng làm bài tập cẩn thận nhưng với vốn kiến thức có hạn,
bài làm của chúng em chắc chắn không tránh khỏi sai sót, mong thầy thông cảm.
Chúng em xin cảm ơn thầy vì đã tận tình hướng dẫn chúng em trong thời gian vừa
qua và mong thầy tiếp tục chỉ bảo thêm cho chúng em.
Danh sách thành viên
1)
2)
3)
4)
Vũ Thị Kiều Oanh
MSV: 1213310082
Phạm Minh Hà
MSV:1213330025
Lương Đức Phúc
MSV: 1213330064
Nguyễn Thị Vân Nhung MSV: 1211120081
1
BÀI TẬP 1
Nhóm chúng em chọn mô hình 19 ( Regression run 19) để thực hành và trả lời
câu hỏi.
I) Câu hỏi 1: Những vấn đề kinh tế mà mô hình này thể hiện hay cơ sở kinh tế
của mô hình.
1) Giải thích ý nghĩa từng biến của mô hình:
- QDPASSt : tổng lượng đô-la tiền gửi vào các tài khoản thuộc ngân hàng S&Ls,
Mỹ trên danh nghĩa trong quý t. Đây là biến phụ thuộc của mô hình 19, trong quý t,
nó đo lường tổng các khoản tiền gửi thuần túy vào tài khoản thuộc ngân hàng
S&Ls mà không đo lượng tiền thuộc các tài khoản vãng lai, tài khoản trên thị
trường tiền tệ, chứng chỉ tiền gửi, tài khoản gửi tiền có trả lãi, tài khoản của các
ngân hàng thương mại và tài khoản của các công ty môi giới.
- QYDUSt : Thu nhập sau thuế trên danh nghĩa trong quý t tại Mỹ.
-QRDPASSt : Tỷ lệ lợi nhuận bình quân của các tài khoản tiết kiệm tại ngân hàng
S&Ls trong quý t. Đây là yếu tố cạnh tranh của phương thức gửi tiền vào ngân
hàng với các phương thức đầu tư tài chính khác, nhà đầu tư sẽ căn cứ vào tỷ lệ lợi
nhuận bình quân để đưa ra các quyết định tài chính phù hợp, có lợi nhất cho mình.
-QRTB3Yt : Lãi suất theo kỳ hạn ba tháng ( theo quý) của trái phiếu kho bạc trong
quý t. tương tự như QRDPASSt, đây là yếu tố quan trọng được xem xét để đưa ra
quyết định đầu tư khi so sánh lãi suất khi gửi tiền vào ngân hàng với mặt bằng lãi
suất trong quý t.
- MMCDUMt : một biến giả, bằng 0 trước quý III của 1978( khi có sự hợp pháp
hóa các chứng chỉ thị trường tiên tệ có lãi suất cao hơn so với các phương thức trên
thị trường tiền tệ hiện tại) và bằng 1 với các quý sau đó.
-EXPINFt : tỷ lệ lạm phát kỳ vọng trong quý t ( bằng với tỷ lệ lạm phát của quý
trước). Nếu lạm phát cao hơn dự kiến, tài sản thuộc các tài khoản có lãi suất thấp
sẽ giảm giá trị. Vì thế EXPINFt cũng có thể là một biến giải thích.
-BRANCHt : số chi nhánh của ngân hàng S&Ls họat động ở Mỹ trong quý t. Biến
này góp phần thể hiện sự thuận tiện trong giao dịch mà người gửi tiền được hưởng.
2
2) Ảnh hưởng dự đoán của các biến giải thích tới biến phụ thuộc
Ta có bảng sau:
QDPASSt
QYDUS QRDPASS
QRTB3Y MMCDUMt
EXPINF BRANCHt
t
t
t
t
+
+
-
-
-
+
*) Giải thích:
- Khi thu nhập sau thuế tăng, mọi người có thể dành nhiều tiền hơn để đầu tư
tài chính, trong đó gửi tiền vào tài khoản tiết kiệm trong ngân hàng là một
phương thức phổ biến. Vì vậy QYDUSt có thể tác động cùng chiều lên
QDPASSt
- Khi tỷ lệ lợi nhuận bình quân tăng, sự cạnh tranh của phương thức gửi tiền
tiết kiệm tăng lên, lượng tiền gửi vào ngân hàng tăng lên vì khả năng sinh lời
cao hơn. Nên QRDPASSt có thể ảnh hưởng dương lên QDPASSt
- Khi lãi suất theo quý của trái phiếu kho bạc tăng lên, nhà đầu tư sẽ do dự
giữa việc bỏ tiền mua trái phiếu kho bạc và gửi tiền vào tài khoản ngân hàng,
dẫn đến lượng tiền gửi có thể giảm xuống. Cho nên QRTB3Yt có thể ảnh
hưởng âm lên QDPASSt
- Khi có sự hợp pháp hóa các chứng chỉ thị trường tiền tệ với lãi suất cao hơn
các công cụ của thị trường tiền tệ hiện có thì khả năng cạnh tranh của phương
thức gửi tiền tiết kiệm sẽ giảm xuống, lượng tiền gửi cũng giảm.
- Khi tỷ lệ lạm phát kỳ vọng tăng lên, việc gửi tiền vào tài khoản ngân hàng
có lãi suất thấp có thể làm giảm giá trị của lượng tiền gửi, khiến lượng tiền gửi
giảm xuống cho nên EXPINFt có thể ảnh hưởng âm lên QDPASSt
- Khi số lượng chi nhánh của ngân hàng S&Ls tăng lên, việc giao dịch với
khách hàng thuận tiện hơn sẽ kích thích lượng tiền gửi tăng lên. Vậy
BRANCHt có thể ảnh hưởng dương lên QDPASSt
3) Vấn đề kinh tế thể hiện từ mô hình
Thông qua các biến giải thích đã chọn, có thể thấy được có 3 loại ảnh hưởng quan
trọng tác động lên lượng tiền gửi vào tài khoản ngân hàng:
- Ảnh hưởng chủ quan: Phụ thuộc vào thu nhập hoặc tài sản của mình, mỗi cá
nhân có nhu cầu tiết kiệm một phần thu nhập. Gửi tiền vào tài khoản tiết
3
kiệm tại ngân hàng có thể nhận được lợi tức từ lãi suất tiền gửi, đồng thời
cũng có tính lỏng cao hơn nhiều phương thức khác, do đó, người gửi tiền có
thể coi sổ tiết kiệm như một tài khoản giao dịch tạm thời. Trong mô hình này
, biến QYDUSt có chịu ảnh hưởng từ quan điểm chủ quan của nhà đầu tư.
- Ảnh hưởng bởi sự cạnh tranh giữa các phương thức đầu tư tài chính trên thị
trường: Khi quyết định đầu tư tiền theo một phương thức nào đó, nhà đầu tư
sẽ dựa trên mặt bằng chung về lãi suất sinh lời của các phương thức trên thị
trường, kết hợp với yêu cầu và điều kiện của bản thân để đưa ra quyết định
đầu tư phù hợp. Việc gửi tiền vào tài khoản ngân hàng với lãi suất càng cao
thì lợi ích càng lớn (không tính đến lạm phát) sẽ kích thích nhà đầu tư gửi
nhiều tiền hơn. Mặt khác, gửi tiền ở ngân hàng là một biện pháp khá an toàn
so với các phương thức mạo hiểm khác, tính lỏng cũng cao. Trong mô hình ,
các biến QRDPASSt , QRTB3Yt , MMCDUMt thể hiện loại ảnh hưởng này.
- Ảnh hưởng của môi trường khoản tiền gửi đang hoạt động: Trong mô hình ,
các biến EXPINFt , BRANCHt thể hiện loại ảnh hưởng này.
Như vậy, vấn đề kinh tế mà mô hình thể hiện là : các ảnh hưởng chủ quan và
khách quan lên lượng tiền gửi vào tài khoản ngân hàng S&Ls của Mỹ trong quý t.
Qua mô hình có thể thấy được sức ảnh hưởng của từng loại tác động, đây sẽ là một
căn cứ thực tiễn để ngân hàng S&Ls đưa ra các chính sách huy động tiền gửi phù
hợp và đánh giá được hiệu quả mà các chính sách đem lại.
II) Câu hỏi 2: Đánh giá kết quả thu được qua ý nghĩa kinh tế của mô hình và
đánh giá ý nghĩa các hệ số của biến giải thích.
1) Chạy mô hình:
- Thiết lập mô hình tổng quát:
QDPASSt= b0 + b1QYDUSt+ b2 QRDPASSt + b3 EXPINFt + b4 QRTB3Yt
- Dùng lệnh reg để chạy mô hình:
use "C:\Users\VUOANH\Downloads\Passbook Deposits.dta", clear
4
. reg qdpass qydus branch qrtb3y expinf mmcdum qrdpass
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
6,
40
33) =
126.88
Model |
1.4811e+10
6
2.4685e+09
Prob > F
=
0.0000
Residual |
642055506
33
19456227.5
R-squared
=
0.9585
Adj R-squared =
0.9509
Root MSE
4410.9
-------------+-----------------------------Total |
1.5453e+10
39
396239615
=
-----------------------------------------------------------------------------qdpass |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------qydus |
46.10241
21.70716
2.12
0.041
1.938872
90.26595
branch |
4.453625
1.698509
2.62
0.013
.9979833
7.909267
qrtb3y |
-1678.216
650.0142
-2.58
0.014
-3000.68
-355.752
expinf |
201.4539
438.3215
0.46
0.649
-690.318
1093.226
mmcdum |
-21924.8
4104.256
-5.34
0.000
-30274.97
-13574.63
qrdpass |
-43408.16
12290.05
-3.53
0.001
-68412.45
-18403.86
_cons |
242848.4
56439.71
4.30
0.000
128020.9
357675.8
------------------------------------------------------------------------------
Ta thu được phương trình hồi quy mẫu như sau:
QDPASSt = 242848.4+ 46.10241QYDUSt -43408.16 QRDPASSt -1678.216
QRTB3Yt -21924.8 MMCDUMt +201.4539EXPINFt + 4.453625 BRANCHt
2) Kiểm định ý nghĩa thống kê của các hệ số hồi quy
Xét cặp giả thiết với mức ý nghĩa α = 0.05
Dựa vào kết quả bảng Stata ở bên trên, ta thấy giá trị P-value của biến EXPINFt
là 0.649> 0.05, nên chấp nhận H0 . Vì vậy, biến này không có ý nghĩa thống kê. Giá
trị P-value của các biến còn lại đều thể hiện biến có ý nghĩa thống kê tại mức ý
nghĩa 5%.
3) Kiểm định sự phù hợp của mô hình.
5
Từ kết quả chạy hồi quy ta có giá trị R2 = 0,9585 . Tức là về mặt trung bình,
95.85% sự thay đổi trong biến phụ thuộc có thể được giải thích thông qua các biến
độc lập.
Ta xét cặp giả thiết sau: với α = 0.05
Thu được giá trị P-value của mô hình là 0.0000< 0.05 nên bác bỏ H0, có cơ sở đánh
giá mô hình phù hợp.
Như vậy, sau khi chạy mô hình và kiểm định tổng quát, ta thấy biến EXPINFt
mang dấu dương, trái ngược với dự đoán trên lý thuyết. Có thể thấy tỷ lệ lạm phát
kỳ vọng tăng không những không làm giảm lượng tiền gửi mà còn làm tăng thêm
nữa. Điều này cũng có thể lý giải là lạm phát dù tăng cao cũng vẫn thấp hơn lãi
suất tiền gửi của ngân hàng. Các biến còn lại đều tác động lên biến phụ thuộc theo
chiều đã dự đoán dựa vào lý thuyết bên trên.
III) Câu hỏi 3: Lựa chọn khẳng định của đề bài gần với đề xuất của của bản
thân khi tính toán cho phương trình.
Để có thể lựa chọn được khẳng định phù hợp, ta cần phải kiểm định lại mô hình
xem nó có vi phạm vào giả định nào không, từ đó đưa ra hướng giải quyết.
1) Kiểm định mô hình
a) Kiểm định thừa biến
- Vì biến EXPINFt không có ý nghĩa thống kê nên ta cần kiểm định xem mô
hình có thừa biến này không
test expinf
( 1)
expinf = 0
F(
1,
33) =
Prob > F =
0.21
0.6488
Vì P-value thu được là 0.6488> 0.05 nên mô hình thừa biến EXPINFt
Như vậy ta đồng ý với khẳng định iii) là “I would like to drop EXPINF from the
equation”
- Sau khi bỏ biến EXPINFt , ta chạy lại mô hình mới như sau:
reg qdpass qydus branch qrtb3y mmcdum qrdpass
Source |
SS
df
MS
6
Number of obs =
40
-------------+-----------------------------Model |
1.4807e+10
5
2.9614e+09
Residual |
646165341
34
19004863
F(
-------------+-----------------------------Total |
1.5453e+10
39
396239615
5,
34) =
155.83
Prob > F
=
0.0000
R-squared
=
0.9582
Adj R-squared =
0.9520
Root MSE
4359.5
=
-----------------------------------------------------------------------------qdpass |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------qydus |
44.11119
21.02223
2.10
0.043
1.388872
86.8335
branch |
4.560427
1.662906
2.74
0.010
1.180995
7.939859
qrtb3y |
-1550.963
581.2351
-2.67
0.012
-2732.174
-369.7507
mmcdum |
-21734.64
4035.705
-5.39
0.000
-29936.18
-13533.1
qrdpass |
-41007.82
10995.37
-3.73
0.001
-63353.1
-18662.54
_cons |
231772.9
50441.07
4.59
0.000
129264.3
334281.5
------------------------------------------------------------------------------
Phương trình hồi quy mẫu mới là:
QDPASSt = 231772.9+ 44.11119 QYDUSt -41007.82QRDPASSt -1550.963
QRTB3Yt -21734.64 MMCDUMt +4.560427BRANCHt
- Nhận thấy tất cả các hệ số của phương trình đều có ý nghĩa thống kê. Ta tiến
hành kiểm định lại xem mô hình có định dạng đúng hay không.
. ovtest
Ramsey RESET test using powers of the fitted values of qdpass
Ho:
model has no omitted variables
F(3, 31) =
1.19
Prob > F =
0.3307
Có P-value= 0.3307>0.05 nên mô hình đã được định dạng đúng.
b) Kiểm định phân phối chuẩn
Trong các giả định của mô hình hồi quy tuyến tính, có một giả định quan trọng
đó là ui ~ U(0;σ2). Tuy nhiên trên thực tế có nhiều nhân tố ảnh hưởng tới phân phối
7
của ui, làm cho nó không còn phân phối chuẩn nữa. Phân phối không chuẩn khiến
cho các kiểm định và suy diễn thống kê không còn đáng tin cậy nữa.
- Cặp giả thiết:
- Sử dụng kiểm định Shapiro- Wilk:
predict e,r
swilk e
Shapiro-Wilk W test for normal data
Variable |
Obs
W
V
z
Prob>z
-------------+-------------------------------------------------e |
40
0.93333
2.635
2.039
0.02071
Vì P-value = 0. 02071 <0,05 nên bác bỏ H0. Vậy có cơ sở khẳng định phần
dư không có phân phối chuẩn. Lỗi này là do số liệu thu thập trên thực tế nên ta
không sửa được.
Tiếp theo, vì số liệu đã cho là time series nên ta sẽ kiểm tra tự tương quan trước.
c) Kiểm tra tự tương quan
- Khởi tạo biến thời gian tên time bằng lệnh gen time=_n
- Cài đặt biến thời gian: tsset time
- Sử dụng kiểm định Durbin- Watson:
. gen time=_n
. tsset time
time variable:
delta:
time, 1970q1 to 1979q4
1 quarter
. estat dwatson
Durbin-Watson d-statistic(
6,
40) =
1.015904
Ta thu được d=1.015904. Với k’= 5 và n=40, tra bảng ta có: dL=1.23 và dU=1,786.
Ta thấy: d< dL nên có cơ sở khẳng định mô hình có hiện tượng tự tương quan
dương. Cho nên ta đồng ý với khẳng định ii) “No further variable changes are
advisable, but I am concerned about heteroskedasticity or serial correlation”
8
*) Ta tiến hành sửa lỗi mô hình tự tương quan:
-Lấy độ trễ của mô hình : gen
e1= e[_n-1]
-Ước lượng 1: Chạy et theo et-1:
. reg e e1,nocons
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
1,
39
38) =
9.65
Model |
130707156
1
130707156
Prob > F
=
0.0036
Residual |
514757277
38
13546244.1
R-squared
=
0.2025
Adj R-squared =
0.1815
Root MSE
3680.5
-------------+-----------------------------Total |
645464433
39
16550370.1
=
-----------------------------------------------------------------------------e |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------e1 |
.4899208
.1577196
3.11
0.004
Ta thu được 1 =0 .4899208
- Sử dụng kết quả trên để biến đổi số liệu:
. gen qdpass1= qdpass- 0.4899208* qdpass[_n-1]
(1 missing value generated)
. gen qydus1= qydus- 0.4899208* qydus[_n-1]
(1 missing value generated)
. gen branch1= branch- 0.4899208* branch[_n-1]
(1 missing value generated)
. gen qrtb3y1= qrtb3y- 0.4899208* qrtb3y[_n-1]
(1 missing value generated)
. gen mmcdum1= mmcdum- 0.4899208* mmcdum[_n-1]
(1 missing value generated)
. gen qrdpass1= qrdpass- 0.4899208* qrdpass[_n-1]
(1 missing value generated)
-
Chạy hồi quy mới:
reg qdpass1 qydus1 branch1 qrtb3y1 mmcdum1 qrdpass1
9
.1706342
.8092074
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
5,
39
33) =
55.04
Model |
3.3767e+09
5
675332409
Prob > F
=
0.0000
Residual |
404868783
33
12268751
R-squared
=
0.8929
Adj R-squared =
0.8767
Root MSE
3502.7
-------------+-----------------------------Total |
3.7815e+09
38
99513969.1
=
-----------------------------------------------------------------------------qdpass1 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------qydus1 |
28.13143
20.99437
1.34
0.189
-14.58195
70.8448
branch1 |
4.849555
1.609467
3.01
0.005
1.575069
8.124041
qrtb3y1 |
-2559.498
646.1759
-3.96
0.000
-3874.153
-1244.844
mmcdum1 |
-11833.66
3785.925
-3.13
0.004
-19536.18
-4131.135
qrdpass1 |
-24558.92
10601.09
-2.32
0.027
-46127
-2990.847
_cons |
84298.98
25274.73
3.34
0.002
32877.15
135720.8
- Kiểm định lại bằng DW test:
. estat dwatson
Durbin-Watson d-statistic(
6,
39) =
1.106826
Với k’=5 và n=39, ta có: dL=1.218 và dU=1,789, nên d
tương quan dương.
- Tiếp tục ước lượng 2
. gen e11=e1[_n-1]
(2 missing values generated)
. reg e1 e11,nocons
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
1,
38
37) =
9.50
Model |
111082119
1
111082119
Prob > F
=
0.0039
Residual |
432779419
37
11696741
R-squared
=
0.2042
Adj R-squared =
0.1827
-------------+------------------------------
10
Total |
543861537
38
14312145.7
Root MSE
=
3420
-----------------------------------------------------------------------------e1 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------e11 |
.4536187
.1471978
3.08
0.004
.1553676
.7518697
------------------------------------------------------------------------------
Ta thu được 2 = 0.4536187
-Sử dụng kết quả trên để biến đổi dữ liệu:
. gen qdpass11= qdpass-0.4536187* qdpass[_n-1]
(1 missing value generated)
. gen qydus11=
qydus- 0.4536187* qydus[_n-1]
(1 missing value generated)
. gen branch11= branch- 0.4536187* branch[_n-1]
(1 missing value generated)
. gen qrtb3y11= qrtb3y- 0.4536187* qrtb3y[_n-1]
(1 missing value generated)
. gen mmcdum11= mmcdum- 0.4536187* mmcdum[_n-1]
(1 missing value generated)
. gen qrdpass11= qrdpass- 0.4536187* qrdpass[_n-1]
(1 missing value generated)
- Chạy hồi quy mới:
reg qdpass11 qydus11 branch11 qrtb3y11 mmcdum11 qrdpass11
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
5,
39
33) =
61.22
Model |
3.9081e+09
5
781625654
Prob > F
=
0.0000
Residual |
421323397
33
12767375.7
R-squared
=
0.9027
11
-------------+-----------------------------Total |
4.3295e+09
38
113932939
Adj R-squared =
0.8879
Root MSE
3573.1
=
-----------------------------------------------------------------------------qdpass11 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------qydus11 |
28.9062
21.33955
1.35
0.185
-14.50943
72.32183
branch11 |
4.879611
1.639464
2.98
0.005
1.544096
8.215125
qrtb3y11 |
-2502.799
648.2535
-3.86
0.000
-3821.681
-1183.917
mmcdum11 |
-12634.2
3841.899
-3.29
0.002
-20450.6
-4817.796
qrdpass11 |
-25586.95
10716.27
-2.39
0.023
-47389.37
-3784.536
_cons |
92410.49
27316.9
3.38
0.002
36833.83
147987.1
------------------------------------------------------------------------------
- Kiểm tra DW test
estat dwatson
Durbin-Watson d-statistic(
6,
39) =
1.0941
Ta có d < dL= 1.218 nên mô hình vẫn còn tự tương quan dương.
Như vậy, rất khó để loại bỏ hoàn toàn tự tương quan. Tuy nhiên ta chọn mô hình
thứ trên vì nó có R2 = 0.9027 hiệu quả hơn mô hình đầu chỉ có R2= 0.8929.
Mô hình mới thu được sau khi sửa lỗi là:
QDPASSt = 92410.49+ 28.9062 QYDUSt -25586.95 QRDPASSt -2502.799
QRTB3Yt -12634.2 MMCDUMt +4.879611 BRANCHt
d) Kiểm tra đa cộng tuyến:
-Kiểm tra thừa số tăng phương sai:
. vif
Variable |
VIF
1/VIF
-------------+---------------------qydus11 |
39.41
0.025377
branch11 |
31.20
0.032053
qrdpass11 |
2.74
0.365606
12
mmcdum11 |
2.47
0.405041
qrtb3y11 |
2.18
0.457730
-------------+---------------------Mean VIF |
15.60
Ta thấy VIF=15.6>10. Mô hình có hiện tượng đa cộng tuyến.
- Kiểm tra tương quan giữa các biến:
corr qydus11 branch11 qrtb3y11 mmcdum11 qrdpass11
(obs=39)
|
qydus11 branch11 qrtb3y11 mmcdum11 qrdpa~11
-------------+--------------------------------------------qydus11 |
1.0000
branch11 |
0.9768
1.0000
qrtb3y11 |
0.6088
0.5174
1.0000
mmcdum11 |
0.6729
0.5878
0.6253
1.0000
qrdpass11 |
0.7763
0.7749
0.5155
0.4298
1.0000
Có đa cộng tuyến mức độ cao giữa 2 biến QYDUSt và BRANCHt do hệ số tương
quan giữa 2 biến lớn hơn 0.9.
- Sử dụng hồi quy phụ: dùng biến BRANCHt
reg branch11 qydus11 qrtb3y11 mmcdum11 qrdpass11
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
4,
39
34) =
256.68
Model |
143441551
4
35860387.7
Prob > F
=
0.0000
Residual |
4750046.76
34
139707.258
R-squared
=
0.9679
Adj R-squared =
0.9642
Root MSE
373.77
-------------+-----------------------------Total |
148191598
38
3899778.88
=
-----------------------------------------------------------------------------branch11 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------qydus11 |
12.34652
.7067803
17.47
13
0.000
10.91016
13.78287
qrtb3y11 |
-144.1476
63.14484
-2.28
0.029
-272.4733
-15.82185
mmcdum11 |
-695.028
383.8045
-1.81
0.079
-1475.013
84.95664
qrdpass11 |
728.76
1114.003
0.65
0.517
-1535.165
2992.685
_cons |
-1867.378
2839.523
-0.66
0.515
-7637.983
3903.226
Nhận thấy hệ số của 2 biến QYDUSt và QRDPASSt là có ý nghĩa. Có thể 2 biến
này có quan hệ đa cộng tuyến với BRANCHt
*) Sửa lỗi đa cộng tuyến:
- Bỏ biến BRANCHt
reg qdpass11 qydus11 qrtb3y11 mmcdum11 qrdpass11
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
4,
39
34) =
60.36
Model |
3.7950e+09
4
948756698
Prob > F
=
0.0000
Residual |
534424876
34
15718378.7
R-squared
=
0.8766
Adj R-squared =
0.8620
Root MSE
3964.6
-------------+-----------------------------Total |
4.3295e+09
38
113932939
=
-----------------------------------------------------------------------------qdpass11 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------qydus11 |
89.15239
7.496851
11.89
0.000
73.91696
104.3878
qrtb3y11 |
-3206.183
669.7801
-4.79
0.000
-4567.34
-1845.026
mmcdum11 |
-16025.66
4071.031
-3.94
0.000
-24299
-7752.333
qrdpass11 |
-22030.89
11816.27
-1.86
0.071
-46044.44
1982.672
_cons |
83298.41
30118.94
2.77
0.009
22089.35
144507.5
-Bỏ biến QYDUSt
reg qdpass11 branch11 qrtb3y11 mmcdum11 qrdpass11
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
4,
39
34) =
74.24
Model |
3.8847e+09
4
971175364
Prob > F
=
0.0000
Residual |
444750213
34
13080888.6
R-squared
=
0.8973
14
-------------+-----------------------------Total |
4.3295e+09
38
113932939
Adj R-squared =
0.8852
Root MSE
3616.8
=
-----------------------------------------------------------------------------qdpass11 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------branch11 |
6.986147
.5254245
13.30
0.000
5.918355
8.053938
qrtb3y11 |
-2170.725
607.4358
-3.57
0.001
-3405.183
-936.2669
mmcdum11 |
-10381.14
3505.45
-2.96
0.006
-17505.07
-3257.206
qrdpass11 |
-23949.57
10777.82
-2.22
0.033
-45852.73
-2046.402
_cons |
88958.62
27529.69
3.23
0.003
33011.56
144905.7
-Bỏ biến QRDPASSt
reg qdpass11 qydus11 branch11 qrtb3y11 mmcdum11
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
4,
39
34) =
65.98
Model |
3.8353e+09
4
958835417
Prob > F
=
0.0000
Residual |
494109998
34
14532647
R-squared
=
0.8859
Adj R-squared =
0.8724
Root MSE
3812.2
-------------+-----------------------------Total |
4.3295e+09
38
113932939
=
-----------------------------------------------------------------------------qdpass11 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------qydus11 |
23.15893
22.62175
1.02
0.313
-22.814
69.13185
branch11 |
4.443176
1.73823
2.56
0.015
.9106674
7.975685
qrtb3y11 |
-2815.044
677.3991
-4.16
0.000
-4191.684
-1438.403
mmcdum11 |
-10776.82
4014
-2.68
0.011
-18934.25
-2619.391
_cons |
27548.89
3067.307
8.98
0.000
21315.37
33782.41
------------------------------------------------------------------------------
R2 của 2 mô hình bỏ biến BRANCHt ,QYDUSt và QRDPASSt lần lượt là : 0.8766,
0.8973 và 0.8859. Vì R2 của mô hình bỏ biến QYDUSt cao hơn nên ta ưu tiên kiểm
định mô hình bỏ biến QYDUSt
15
- Kiểm định thu hẹp hồi quy: bỏ biến QYDUSt
Chọn cặp giả thuyết:
H0: bỏ được QYDUSt
H1 : không bỏ được QYDUSt
Tiêu chuẩn kiểm định:
= 1.83145< Ftới hạn=4.13925
Mô hình có thể bỏ biến QYDUSt. Tiếp tục kiểm định thu hẹp hồi quy với 2 biến
còn lại, ta thấy 2 biến đó vẫn có ý nghĩa. Vậy chỉ cần bỏ biến QYDUSt. Chạy hồi
quy mới khi đã bỏ biến.
reg qdpass11 branch11 qrtb3y11 mmcdum11 qrdpass11
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
4,
39
34) =
74.24
Model |
3.8847e+09
4
971175364
Prob > F
=
0.0000
Residual |
444750213
34
13080888.6
R-squared
=
0.8973
Adj R-squared =
0.8852
Root MSE
3616.8
-------------+-----------------------------Total |
4.3295e+09
38
113932939
=
-----------------------------------------------------------------------------qdpass11 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------branch11 |
6.986147
.5254245
13.30
0.000
5.918355
8.053938
qrtb3y11 |
-2170.725
607.4358
-3.57
0.001
-3405.183
-936.2669
mmcdum11 |
-10381.14
3505.45
-2.96
0.006
-17505.07
-3257.206
qrdpass11 |
-23949.57
10777.82
-2.22
0.033
-45852.73
-2046.402
_cons |
88958.62
27529.69
3.23
0.003
33011.56
144905.7
Xét thấy các giá trị P-value của kiểm định T đều < 0.05 , mô hình không còn đa
cộng tuyến.
Vậy mô hình mới là:
16
QDPASSt = 88958.62 -23949.57 QRDPASSt -2170.725QRTB3Yt -10381.14
MMCDUMt +6.986147 BRANCHt
e) Kiểm định phương sai sai số thay đổi
- Cách 1: Kiểm định Breusch-Pagan:
. hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of qdpass11
chi2(1)
Prob > chi2
=
=
0.74
0.3910
Vì P-value= 0.3910>0.05 nên chấp nhận H0 . Vì vậy mô hình không có phương sai
sai số thay đổi.
- Cách 2: Kiểm định White:
imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(14)
Prob > chi2
=
=
24.91
0.0355
Cameron & Trivedi's decomposition of IM-test
--------------------------------------------------Source |
chi2
df
p
---------------------+----------------------------Heteroskedasticity |
24.91
14
0.0355
Skewness |
10.96
4
0.0270
Kurtosis |
0.06
1
0.7991
---------------------+----------------------------Total |
35.94
19
0.0107
---------------------------------------------------
P-value = 0.0355 <0.05 nên mô hình có phươnng sai sai số thay đổi
- Cách 3: Kiểm định Park
+) Chạy OLS lnei2 theo lnBRANCHt thu được kết quả hồi quy như sau:
. gen lnbranch11= log( branch11)
(1 missing value generated)
. gen lei_square= log( e11^2)
(2 missing values generated)
. reg lei_square lnbranch11
Source |
SS
df
MS
-------------+-----------------------------Model | 8.00716883
1 8.00716883
Residual | 172.995057
36 4.80541826
-------------+-----------------------------Total | 181.002226
37 4.89195206
Number of obs
F( 1,
36)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
38
1.67
0.2050
0.0442
0.0177
2.1921
-----------------------------------------------------------------------------lei_square |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnbranch11 | -1.665855
1.290515
-1.29
0.205
-4.283141
.9514319
_cons |
29.54502
11.42926
2.59
0.014
6.365419
52.72463
17
------------------------------------------------------------------------------
Ta có = -1.665855 ≠0; tại mức ý nghĩa �=0.05> �−�����=0.205 nên không tồn
tại mối liên hệ có ý nghĩa về mặt thống kê giữa lnei2 và lnBRANCHt
-Tương tự chạy với các biến còn lại:
. gen lnqrtb3y11= log( qrtb3y11)
(1 missing value generated)
. reg lei_square lnqrtb3y11
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
1,
38
36) =
2.87
Model |
13.3697808
1
13.3697808
Prob > F
=
0.0988
Residual |
167.632445
36
4.65645682
R-squared
=
0.0739
Adj R-squared =
0.0481
Root MSE
2.1579
-------------+-----------------------------Total |
181.002226
37
4.89195206
=
-----------------------------------------------------------------------------lei_square |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnqrtb3y11 |
1.637628
.9664537
1.69
0.099
-.3224304
3.597687
_cons |
12.80756
1.226156
10.45
0.000
10.3208
15.29432
------------------------------------------------------------------------------
Nên không tồn tại mối liên hệ có ý nghĩa về mặt thống kê giữa lnei2 và
lnQRTB3Yt
. gen lnqrdpass11= log( qrdpass11)
(1 missing value generated)
. reg lei_square lnqrdpass11
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
1,
38
36) =
0.07
Model |
.358870501
1
.358870501
Prob > F
=
0.7907
Residual |
180.643356
36
5.01787099
R-squared
=
0.0020
-------------+------------------------------
18
Adj R-squared = -0.0257
Total |
181.002226
37
4.89195206
Root MSE
=
2.2401
-----------------------------------------------------------------------------lei_square |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnqrdpass11 |
-3.161876
11.82322
-0.27
0.791
-27.14047
20.81672
_cons |
18.092
12.31974
1.47
0.151
-6.893586
43.07759
------------------------------------------------------------------------------
Vì P-value= 0.7907> 0.05 nên không tồn tại mối liên hệ có ý nghĩa về mặt thống
kê.Vậy theo kiểm định Park thì có thể khẳng định không có phương sai sai số thay
đổi
Ta thấy lỗi phương sai sai số thay đổi không phải kiểm định nào cũng phát hiện ra
và phát hiện đúng. Việc sửa chữa mô hình rất khó khăn, vì vậy, ta sẽ để nguyên mô
hình như cũ.Vậy mô hình cuối cùng là:
QDPASSt = 88958.62 -23949.57 QRDPASSt -2170.725QRTB3Yt -10381.14
MMCDUMt +6.986147 BRANCHt
TỔNG KẾT:
Với những dự kiến đầu tiên trong việc thiết lập mô hình hồi quy mẫu, chúng em đã
đưa ra phương trình:
QDPASSt = 242848.4+ 46.10241QYDUSt -43408.16 QRDPASSt -1678.216
QRTB3Yt -21924.8 MMCDUMt +201.4539EXPINFt + 4.453625 BRANCHt
Từ kết quả hồi quy , kiểm định và sửa lỗi ta rút ra được mô hình tối ưu nhất là:
QDPASSt = 88958.62 -23949.57 QRDPASSt -2170.725QRTB3Yt -10381.14
MMCDUMt +6.986147 BRANCHt
Trong quá trình chạy mô hình, chúng em đã gặp phải một số khó khăn như không
thể loại bỏ được hết tự tương quan và phương sai sai số thay đổi. Chúng em cũng
19
không thể triển khai hết tất cả các yêu cầu của đề bài. Rất mong thầy đưa ra những
nhận xét, ý kiến để bài làm của chúng em hoàn thiện hơn.
BÀI TẬP 2
Nhóm chúng em xin chọn mô hình 5 để thực hành và trả lời câu hỏi.
I) Câu hỏi 1: Những vấn đề kinh tế mà mô hình này thể hiện, nói cách khác là
cơ sở kinh tế của mô hình.
1) Giải thích ý nghĩa từng biến của mô hình
Từ các câu hỏi nghiên cứu được đặt ra, và từ việc tham khảo một số tài liệu
nghiên cứu về cùng đề tài trước đó, nhóm em đưa ra giả thuyết: Khối lượng mặt
hàng thịt lợn một người Mỹ tiêu dùng trong quý t (CONPKt ) chịu ảnh hưởng của
ba nhân tố:
+) Giá của mỗi pound thịt lợn ở quý t (PRIPKt) . Biến này có thể ảnh hưởng âm
lên biến phụ thuộc vì khi giá thịt lợn giảm, người tiêu dùng có khả năng sử dụng
nhiều thịt lợn hơn.
+) Thu nhập sau thuế theo đầu người ở Mỹ trong quý t (YDUSPt). Biến này có thể
ảnh hưởng dương lên biến phụ thuộc vì khi thu nhập sau thuế tăng, người tiêu dùng
có thêm điều kiện về kinh tế để mua thịt lợn.
+) Giá của mỗi pound thịt bò trong quý t (PRIBFt). Biến này có thể ảnh hưởng
dương lên biến phụ thuộc vì khi giá thịt bò giảm, người tiêu dùng sẽ cân nhắc giữa
việc mua thịt bò và thịt lợn, có thể dẫn đến khối lượng thịt lợn tiêu thụ cho mỗi cá
nhân giảm xuống.
2) Vấn đề kinh tế mà mô hình thể hiện
Mô hình thể hiện nhu cầu tiêu dùng trung bình một mặt hàng thông thường (thịt
lợn) của một người Mỹ. Các biến số thể hiện giá sản phẩm, sức mua của người tiêu
dùng và giá mặt hàng thay thế luôn có tác động rõ ràng lên biến phụ thuộc này.
Dựa vào kết quả mà mô hình đưa ra, ta có thể rút ra ảnh hưởng riêng biệt của từng
biến giải thích lên biến phụ thuộc, từ đó rút ra các kết luận về chính sách giá, chính
sách cạnh tranh, về phân phối thu nhập của người tiêu dùng. Những kết luận này
20
có ý nghĩa vô cùng quan trọng trong thực tiễn và cũng là bằng chứng chứng minh
cho căn cứ lý thuyết mà ta đã đề ra phía trên.
II) Câu hỏi 2: Đánh giá kết quả thu được qua ý nghĩa kinh tế của mô hình và
đánh giá ý nghĩa các hệ số của biến giải thích.
1) Chạy mô hình:
- Xây dựng mô hình tổng quát:
CONPKt = β1 + β2*PRIPKt + β3*YDUSPt + β4*PRIBFt
(1)
- Ước lượng các hệ số của mô hình
Với sự trợ giúp của phần mềm Stata và các số liệu trong bộ số liệu, chúng em
tiến hành chạy mô hình và thu được kết quả sau:
Model 1: OLS, using observations 1-40
Dependent Variable: CONPK
Hàm hồi quy mẫu ban đầu:
CONPKt = 15.81965 – 0.0730813PRIPKt + 0.3045125YDUSPt +0.0366806PRIBFt
2) Kiểm định ý nghĩa của các hệ số hồi quy:
*) Mô tả các hệ số hồi quy:
21
+) β2 = - 0.0730813 > 0, phù hợp với dự đoán ban đầu, khi giá thịt lợn tăng
1USD/100pounds thì lượng thịt lợn tiêu thụ giảm 0.0730813 pounds.
+) β3 = 0.3045125, phù hợp với dự đoán ban đầu, khi thu nhập tăng 1USD thì
lượng thịt lợn tiêu thụ tăng 0.3045125 pounds.
+) β4 = 0.0366806, phù hợp với dự đoán ban đầu, khi giá thịt bò tăng 1 USD thì
lượng thịt lợn tiêu thụ tăng 0.0366806 pounds.
*) Kiểm định ý nghĩa thống kê của các hệ số hồi quy:
Xét cặp giả thiết với mức ý nghĩa α = 0.05
Các hệ số đều có ý nghĩa thống kê ở mức 5%, từ đó cho thấy các hệ số đều có ý
nghĩa về mặt thống kê .
3) Độ phù hợp của hàm hồi quy:
R2 (R-squared) = 0.7716, cho thấy các biến độc lập giải thích được 77.16% biến
động của biến phụ thuộc trong ngắn hạn.
Như vậy sau khi chạy mô hình và kiểm định tổng quát, ta thấy các hệ số của biến
phụ thuộc đều mang dấu như dự đoán và mô hình có độ phù hợp khá cao.
III) Câu hỏi 3: Lựa chọn khẳng định của đề bài gần với đề xuất của của bản
thân khi tính toán cho phương trình.
Để đưa ra được sự lựa chọn, chúng ta cần kiểm định mô hình kỹ càng hơn.
1) Kiểm tra mô hình có thiếu biến hay không?
Vì các biến đều có ý nghĩa thống kê nhưng R2 vẫn còn thấp nên ta nghi ngờ mô
hình có thể thiếu biến.
Sử dụng kiểm định RAMSEY-RESET với giả định:
H0: mô hình không thiếu biến
H1: mô hình thiếu biến, ta có kết quả:
22
Từ kết quả thu được ở trên, ta nhận thấy giá trị P-value = 0.9272 > 0.05 nên chấp
nhận giả thiết H0, nghĩa là mô hình không thiếu biến.
2) Kiểm định phân phối chuẩn.
Dùng lệnh predict e,r để khởi tạo biến phần dư.
- Vẽ đồ thị phân phối của phần dư trong mô hình:
Đồ thị phân phối của phần dư bị chệch không nhiều so với phân phối chuẩn, có thể
phần dư của mô hình vẫn có phân phối chuẩn.
23
- Dùng lệnh sktest r ta thu được kết quả.
Với giả thiết:
H0 :U có phân phối chuẩn
H1: U không phân phối chuẩn
Ta có:
Phần dư có giá trị P-value của Skewness > 0.05 và của Kurtosis > 0.05 nên chấp
nhận giả thiết H0 là U có phân phối chuẩn.
Vì số liệu đã cho là time series nên ta sẽ kiểm tra tự tương quan trước
3) Kiểm định tự tương quan
- Với biến time có sẵn, ta tiến hành cài đặt biến thời gian bằng lệnh tsset time
=> Ta thu được kết quả:
- Sau khi đã cài đặt xong dữ liệu về chuỗi thời gian, với kết quả của mô hình hồi
quy đã chạy, ta có thể dùng các kiểm định Durbin – Watson (DW), Breush –
Godfrey (BG) để phát hiện sự tương quan.
H0: Mô hình không có tự tương quan.
H1: Mô hình có tự tương quan.
24