Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
1
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ VÀ KINH DOANH QUỐC TẾ
-----❧❧❧❧-----
BÁO CÁO KINH TẾ LƯỢNG
BẢNG SỐ LIỆU 24 + 58
Nhóm 18
GV HƯỚNG DẪN: T.S ĐINH THỊ THANH BÌNH
Hà Nội, 2014
2
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
DANH SÁCH THÀNH VIÊN NHÓM VÀ ĐÓNG GÓP
Công việc
Sinh viên
MSSV
Làm việc
nhóm
% đóng góp
(?/5)
Nguyễn Anh Tuấn
1213160132
5/5
Như nhau
Nguyễn Thị Tươi
1216160133
5/5
Như nhau
Phạm Minh Tuyền
1211160134
5/5
Như nhau
Đào Vân Uyên
1211160135
5/5
Như nhau
Nguyễn Thị Hồng Vân
1213160136
5/5
Như nhau
3
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
MỤC LỤC
Nội dung
Trang
LỜI MỞ ĐẦU
A. BẢNG SỐ LIỆU SỐ 24
I.
MÔ TẢ THỐNG KÊ SỐ LIỆU:
1. Tổng quan:
2. Mô tả chi tiết các biến trong mô hình:
II.
MÔ HÌNH HỒI QUI VÀ PHÂN TÍCH HỒI QUI:
1. Phân tích mối quan hệ tương quan giữa các biến:
2. Chạy mô hình hồi qui và phân tích kết quả:
3. Một số kiểm định F:
III.
KIỂM ĐỊNH VÀ SỬA CHỮA CÁC KHUYẾT TẬT CỦA MÔ HÌNH:
1. Vấn đề đa cộng tuyến:
2. Vấn đề về phương sai sai số thay đổi:
B. BẢNG SỐ LIỆU SỐ 58
I.
MÔ TẢ THỐNG KÊ SỐ LIỆU:
1. Tổng quan:
2. Mô tả chi tiết các biến trong mô hình:
II.
MÔ HÌNH HỒI QUI VÀ PHÂN TÍCH HỒI QUI:
1. Phân tích mối quan hệ tương quan giữa các biến:
2. Chạy mô hình hồi qui và phân tích kết quả:
3. Một số kiểm định F:
III.
KIỂM ĐỊNH VÀ SỬA CHỮA CÁC KHUYẾT TẬT CỦA MÔ HÌNH
1. Vấn đề đa cộng tuyến:
2. Vấn đề về phương sai sai số thay đổi:
TÀI LIỆU THAM KHẢO
4
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
LỜI MỞ ĐẦU
Như chúng ta đã biết, nếu như kinh tế vi mô và vĩ mô mô tả sự vận động của nền kinh tế, thì
kinh tế lượng cung cấp các phân tích về mặt lượng mối quan hệ giữa các hiện tượng kinh tế, cùng
với sự tác động qua lại giữa chúng, trên cơ sở các số liệu thu thập từ thực tế, nhằm củng cố thêm
các giả thiết, từ đó đưa ra các quyết định đúng đắn hơn. Đặc biệt, trong thời đại công nghệ phát
triển mạnh mẽ như hiện nay, sự đòi hỏi phải phân tích định lượng các hiện tượng kinh tế trong quá
trình hoạch định chính sách vĩ mô, việc dự báo và dự đoán phải có độ tin cậy cao,… kinh tế lượng
ngày càng đóng một vai trò quan trọng, và bản thân nó cũng không ngừng được hoàn thiện và phát
triển.
Sau quá trình học tập và nghiên cứu, dưới sự chỉ dẫn tận tình của cô Đinh Thị Thanh Bình,
nhóm chúng em đã tiếp nhận được lượng kiến thức mà môn học truyền tải, tự đó có thể hoàn thành
báo cáo về bảng số liệu 24 và 58. Chúng em rất mong nhận được những ý kiến nhận xét của cô và
các bạn để bài làm có thể hoàn thiện hơn!
5
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
A. BẢNG SỐ LIỆU SỐ 24
Bất kì một quốc gia nào trên thế giới muốn giữ vững trật tự, kỉ cương của xã hội cũng đều đặt
ra hệ thống luật pháp của riêng mình; và bất cứ ai vi phạm hệ thống ấy cũng đều bị bắt và xử lý theo
pháp luật.
Vậy số lần phạm tội trộm cắp tài sản bị bắt giữ, thu nhập hợp pháp tính trong năm, thời gian
kết án trung bình trong năm,… có ảnh hưởng như thế nào đến số lần bị bắt giữ trong năm? Để hiểu
rõ hơn, sâu sắc hơn về vấn đề trên, nhóm chúng em đã sử dụng bộ số liệu 24; bộ số liệu này dựa
trên những nghiên cứu trong năm 1986 - một mốc thời gian cụ thể.
6
Báo cáo Kinh tế lượng
I.
Nhóm 18/ Lớp KTE309.25_LT
MÔ TẢ THỐNG KÊ SỐ LIỆU:
1. Tổng quan:
Sau quá trình thảo luận nhóm cũng như xem xét ý nghĩa của từng biến trong file bảng số liệu
24, nhóm chúng em đã quyết định chọn mô hình hồi quy gồm các biến như sau:
●
Biến phụ thuộc: narr86
●
Biến độc lập: (bao gồm 5 biến)
−
X1: nparr86
−
X2: inc86
−
X3: black
−
X4: avgsen
−
X5: ptime86
Dưới đây là kết quả thu được của nhóm khi tiến hành mô tả thống kê biến phụ thuộc và các
biến độc lập bằng lệnh miêu tả biến des:
des narr86 nparr86 ptime86 avgsen black inc86
variable name
storage
display
value
type
format
label
variable label
---------------------------------------------------------------------------------------------------------------------------------------narr86
byte
%9.0g
# times arrested, 1986
nparr86
byte
%9.0g
# property crme arr., 1986
ptime86
byte
%9.0g
mos. in prison during 1986
avgsen
float
%9.0g
avg sentence length, mos.
black
byte
%9.0g
=1 if black
inc86
float
%9.0g
legal income, 1986, $100s
7
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
Dựa vào kết quả trên, ta có bảng tổng hợp sau:
Tên biến
Định dạng hiển thị
Đơn vị tính
Ý nghĩa biến
narr86
%9.0g
-
Số lần bị bắt trong năm 1986
nparr86
%9.0g
-
Số lần phạm tội trộm cắp tài sản bị bắt
giữ trong năm 1986
inc86
%9.0g
trăm đô
Thu nhập hợp pháp tính trong năm
1986
%9.0g
-
= 1 nếu là người da đen
Black
=0 nếu là không là người da đen
avgsen
%9.0g
tháng
Thời gian kết án trung bình
ptime86
%9.0g
tháng
Số tháng ngồi tùtrong năm 1986
Sau đó sử dụng lệnh Sum để tiếp tục mô tả các biến trên:
sum narr86 nparr86 avgsen ptime86 inc86 black
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------narr86 |
2725
.4044037
.8590768
0
12
nparr86 |
2725
.1255046
.4828473
0
8
avgsen |
2725
.6322936
3.508031
0
59.2
ptime86 |
2725
.387156
1.950051
0
12
inc86 |
2725
54.96705
66.62721
0
541
-------------+--------------------------------------------------------
8
Báo cáo Kinh tế lượng
black |
Nhóm 18/ Lớp KTE309.25_LT
2725
.1611009
.3676915
0
1
Kết quả của lệnh Sum cho ta biết số quan sát (Obs), giá trị trung bình (Mean), độ lệch chuẩn
(Std. Dev.), giá trị lớn nhất (Max), giá trị nhỏ nhất (Min) của các biến.
Dựa theo kết quả trên, ta có bảng tổng hợp sau:
Biến
Số quan
sát
Giá trị
trung bình
Độ lệch chuẩn
Giá trị nhỏ nhất
Giá trị lớn nhất
narr86
2725
0.4044037
0.8590768
0
12
nparr86
2725
0.1255046
0.4828473
0
8
Avgsen
2725
0.6322936
3.508031
0
59.2
ptime86
2725
0.387156
1.950051
0
12
inc86
2725
54.96705
66.62721
0
541
Black
2725
0.1611009
0.3676915
0
1
2. Mô tả chi tiết các biến trong mô hình:
Để mô tả chi tiết các biến đã chọn, dùng lệnh tab:
a) Số lần bị bắt giữ trong năm 1986.
tab narr86
# times |
arrested, |
1986 |
Freq.
Percent
Cum.
------------+----------------------------------0 |
1,970
72.29
72.29
1 |
559
20.51
92.81
2 |
121
4.44
97.25
3 |
42
1.54
98.79
4 |
12
0.44
99.23
9
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
5 |
13
0.48
99.71
6 |
4
0.15
99.85
7 |
1
0.04
99.89
9 |
1
0.04
99.93
10 |
1
0.04
99.96
12 |
1
0.04
100.00
------------+----------------------------------Total |
2,725
100.00
− Số lần bị bắt giữ dao động trong khoảng 0 đến 12 với tần suất cao nhất r ơi vào m ức 0 là
1970 chiếm 72,29% và giảm dần đáng kể cho đến mức 12. Nhìn một cách t ổng quan có th ể
thấy số lần phạm tội chủ yếu nằm trong khoảng từ 0 – 2 chiếm 97,25%.
− Ý nghĩa của Cum: có 97.25% trong tổng số 2725 số quan sát mà Số lần bị bắt gi ữ trong năm
1986 ≤ 2.
b) Số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm 1986.
tab nparr86
# property |
crme arr., |
1986 |
Freq.
Percent
Cum.
------------+----------------------------------0 |
2,469
90.61
90.61
1 |
208
7.63
98.24
2 |
31
1.14
99.38
3 |
7
0.26
99.63
4 |
5
0.18
99.82
5 |
3
0.11
99.93
8 |
2
0.07
100.00
------------+----------------------------------Total |
2,725
100.00
10
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
− Số lần phạm tội trộm cắp tài sản bị bắt giữ nằm trong khoảng từ 0 đến 8. Trong đó mức 0 có
tần suất đáng kể nhất là 2469 chiếm 90,61% , theo sau đó là s ự gi ảm xu ống đáng k ể ở các
mức tiếp theo. Với số lần phạm tội trộm cắp tài sản bị bắt gi ữ là 8 chi ếm ít nh ất, ch ỉ có
0,07%.
− Ý nghĩa của Cum: có 99.63% trong tổng số 2725 số quan sát mà số lần phạm tội trộm cắp tài
sản bị bắt giữ trong năm 1986 ≤ 3
c) Thời gian kết án trung bình.
tab avgsen
avg |
sentence |
length, |
mos. |
Freq.
Percent
Cum.
------------+----------------------------------0 |
2,591
95.08
95.08
.3 |
1
0.04
95.12
.8 |
2
0.07
95.19
.9 |
2
0.07
95.27
1.1 |
5
0.18
95.45
1.4 |
1
0.04
95.49
2.2 |
1
0.04
95.52
2.3 |
1
0.04
95.56
2.6 |
2
0.07
95.63
2.9 |
1
0.04
95.67
3.5 |
1
0.04
95.71
4 |
2
0.07
95.78
4.3 |
1
0.04
95.82
4.8 |
1
0.04
95.85
4.9 |
1
0.04
95.89
5.5 |
2
0.07
95.96
11
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
5.6 |
4
0.15
96.11
6 |
1
0.04
96.15
6.1 |
2
0.07
96.22
6.2 |
1
0.04
96.26
6.3 |
1
0.04
96.29
6.7 |
1
0.04
96.33
6.9 |
1
0.04
96.37
7.1 |
3
0.11
96.48
7.2 |
1
0.04
96.51
7.6 |
1
0.04
96.55
--more—
− Thời gian kết án trung bình dao động từ 0 đến 59,2 tháng v ới t ần su ất c ủa mỗi kho ảng th ời
gian đều rất ít lặp lại hoặc hầu như không lặp lại trừ mức 0 tháng có t ần su ất cao nh ất 2591
chiếm 95,08%.
− Ý nghĩa của Cum: có 96.26% trong tổng số 2725 số quan sát mà thời gian k ết án trung bình ≤
6.2
d) Số tháng ngồi tù trong năm 1986.
tab ptime86
mos. in |
prison |
during 1986 |
Freq.
Percent
Cum.
------------+----------------------------------0 |
2,594
95.19
95.19
1 |
7
0.26
95.45
2 |
15
0.55
96.00
3 |
8
0.29
96.29
4 |
7
0.26
96.55
5 |
5
0.18
96.73
6 |
10
0.37
97.10
7 |
7
0.26
97.36
12
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
8 |
2
0.07
97.43
9 |
4
0.15
97.58
10 |
4
0.15
97.72
11 |
4
0.15
97.87
12 |
58
2.13
100.00
------------+----------------------------------Total |
2,725
100.00
− Số tháng ngồi tù trong năm 1986 trải đều từ 0 – 12 tháng. Trong đó thời gian ngồi tù chi ếm
tần suất lớn nhất là 0 tháng với mức 2594 chiếm 95,19%.
− Ý nghĩa của Cum: có 97.43% trong tổng số 2725 số quan sát mà số tháng ngồi tù trong năm
1986 ≤ 8.
e) Thu nhập hợp pháp tính trong năm 1986.
tab inc86
legal |
income, |
1986, $100s |
Freq.
Percent
Cum.
------------+----------------------------------0 |
650
23.85
23.85
.1 |
5
0.18
24.04
.2 |
9
0.33
24.37
.3 |
7
0.26
24.62
.4 |
11
0.40
25.03
.5 |
4
0.15
25.17
.6 |
2
0.07
25.25
.7 |
6
0.22
25.47
.8 |
10
0.37
25.83
.9 |
4
0.15
25.98
1 |
12
0.44
26.42
1.1 |
1
0.04
26.46
1.2 |
3
0.11
26.57
13
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
1.3 |
7
0.26
26.83
1.4 |
1
0.04
26.86
1.5 |
5
0.18
27.05
1.6 |
3
0.11
27.16
1.7 |
8
0.29
27.45
1.8 |
7
0.26
27.71
1.9 |
9
0.33
28.04
2 |
1
0.04
28.07
2.1 |
6
0.22
28.29
2.2 |
4
0.15
28.44
2.3 |
2
0.07
28.51
2.4 |
3
0.11
28.62
2.5 |
3
0.11
28.73
2.6 |
4
0.15
28.88
--more--
− Thu nhập hợp pháp tính trong năm 1986 dao động trong khoảng từ 0 đến 54100$ v ới t ần
suất cao nhất vẫn là mức 0 với 650 lần xuất hiện chi ếm 23,85%. Nhìn chung, thu nh ập h ợp
pháp ở mức không cao.
− Ý nghĩa của Cum: có 28.44% trong tổng số 2725 số quan sát mà thu nhập hợp pháp tính trong
năm 1986 ≤ 2.2
f) Màu da.
tab black
=1 if black |
Freq.
Percent
Cum.
------------+----------------------------------0 |
2,286
83.89
83.89
1 |
439
16.11
100.00
------------+----------------------------------Total |
2,725
100.00
Biến black = 1 nếu là người da đen, xuất hiện 439 lần chiếm 16,11%.
Biến black =0 nếu là không phải người da đen, xuất hiện 2286 lần chiếm 83,89%
14
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
Nhìn chung, số lượng người da đen chiếm tỉ lệ thấp hơn so với người da màu khác trong mối
quan hệ với số lần bị bắt giữ trong năm 1986.
II.
MÔ HÌNH HỒI QUI VÀ PHÂN TÍCH HỒI QUI:
❖
Hàm hồi quy tổng thể (PRF) và hàm hồi quy mẫu (SRF):
Chọn biến phụ thuộc Y là narr86, các biến độc lập X1, X2, X3, X4, X5 lần lượt là nparr86,
avgsen, ptime86, inc86, black.
Như vậy ta có hàm hồi qui tổng thể PRF biểu diễn mối quan hệ phụ thuộc giữa Y và các biến
X như sau:
Narr86 = + * nparr86 + * avgsen + * ptime86 + * inc86 + * black +
Hàm hồi qui mẫu SRF là:
+ * nparr86 + * avgsen + * ptime86 + * inc86 + * black
1. Phân tích mối quan hệ tương quan giữa các biến:
Thực hiện lệnh corr có bảng tương quan giữa biến phụ thuộc narr86 và các biến độc lập như
sau:
corr narr86 nparr86 avgsen ptime86 inc86 black
(obs=2725)
|
narr86
nparr86
avgsen
ptime86
inc86
black
-------------+-----------------------------------------------------narr86 |
1.0000
nparr86 |
0.6608
1.0000
avgsen |
0.0293
-0.0098
1.0000
ptime86 |
-0.0299
-0.0087
0.2353
1.0000
inc86 |
-0.1900
-0.1405
-0.0958
-0.1600
1.0000
black |
0.1493
0.1011
0.1194
0.0737
-0.1470
1.0000
Từ bảng trên có thể thấy:
-
Hệ số tương quan giữa narr86 và nparr86 là 0.6608
Hệ số tương quan giữa narr86 và avgsen là 0.0293
Hệ số tương quan giữa narr86 và ptime86 là -0.0299
15
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
- Hệ số tương quan giữa narr86 và inc86 là -0.1900
- Hệ số tương quan giữa narr86 và black là 0.1493
Như vậy, ta có thể thấy trong các nhân tố được nghiên cứu, biến nparr86 có mối tương quan
mạnh nhất đến narr86, hay nói cách khác số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm
1986 có ảnh hưởng khá lớn đến số lần bị bắt trong năm 1986. Hệ số tương quan mang dấu dương
cũng thể hiện mối quan hệ cùng chiều giữa các biến, như nếu số lần phạm tội trộm cắp tài sản bị bắt
giữ trong năm 1986 tăng thì số lần bị bắt giữ trong năm 1986 cũng tăng.
Ngược lại, biến avgsen ít ảnh hưởng nhất đến narr86, hay mối tương quan giữa thời gian
kết án trung bình và số lần bị bắt giữ trong năm 1986 không mạnh như các yếu tố khác. Hệ số tương
quan giữa 2 biến mang dấu dương, chứng tỏ chúng có quan hệ cùng chiều, nếu thời gian kết án
trung bình tăng thì số lần bị bắt giữ trong năm 1986 tăng nhưng không đáng kể.
Ngoài ra, vì giá trị tuyệt đối của các chỉ số đều nhỏ hơn 0.8 nên dự đoán sẽ không xảy ra
hiện tượng đa cộng tuyến.
2. Chạy mô hình hồi qui và phân tích kết quả:
* Sử dụng lệnh hồi qui reg ta có kết quả như sau:
. reg narr86 nparr86 avgsen ptime86 inc86 black
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F(
5,
2719) =
2725
452.37
Model |
912.915316
5
182.583063
Prob > F
=
0.0000
Residual |
1097.43184
2719
.403615977
R-squared
=
0.4541
Adj R-squared =
0.4531
Root MSE
.63531
-------------+-----------------------------Total |
2010.34716
2724
.738012906
=
-----------------------------------------------------------------------------narr86 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------nparr86 |
1.138975
.0255741
44.54
0.000
1.088828
1.189121
avgsen |
.0074017
.0035952
2.06
0.040
.0003521
.0144513
ptime86 |
-.02286
.0064938
-3.52
0.000
-.0355933
-.0101267
inc86 |
-.0012251
.0001887
-6.49
0.000
-.0015952
-.000855
black |
.1654735
.0338007
4.90
0.000
.0991958
.2317511
_cons |
.3063096
.0181962
16.83
0.000
.2706299
.3419893
------------------------------------------------------------------------------
16
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
Từ đó ta có bảng số liệu:
Tên biến
Hệ số hồi quy
P-value
Khoảng tin cậy
Hệ số tự do
0.3063096
0.000
(0.2706299 ; 0.3419893)
nparr86
1.138975
0.000
(1.088828 ; 1.189121)
Avgsen
0.0074017
0.040
(0.0003521 ; 0.0144513)
ptime86
-0.02286
0.000
(-0.0355933 ; -0.0101267)
inc86
-0.0012251
0.000
(-0.0015952 ; -0.000855)
Black
0.1654735
0.000
(0.0991958 ; 0.2317511)
Phương trình hồi qui mẫu của mô hình là:
narr86 = 0.3063096 + 1.138975* nparr86 + 0.0074017 * avgsen-0.02286* ptime86 0.0012251 * inc86 + 0.1654735* black + ui
* Phân tích kết quả hồi qui:
−
−
−
−
−
−
Số quan sát Obs = 2725.
Tổng bình phương sai số tổng cộng SST = 2010.34716.
Tổng bình phương sai số được giải thích SSE = 912.915316.
Tổng bình phương các phần dư SSR = 1097.43184.
Bậc tự do của phần được giải thích Dfm= 5.
Bậc tự do của phần dư Dfr = 2719.
− Hệ số xác định R2 = 0.4541 thể hiện mức độ phù hợp của hàm hồi quy mẫu và sự biến động
của số lần bị bắt trong năm 1986 được giải thích bởi các biến độc lập: số lần tội phạm trộm cắp tài
sản bị bắt giữ trong năm 1986, thu nhập hợp pháp tính trong năm 1986, thời gian kết án trung
bình, số tháng ngồi tù trong năm 1986, màu da.
− Hệ số xác định điều chỉnh = 0.4531
17
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
− Ý nghĩa các hệ số hồi quy trong mô hình:
Với điều kiện các yếu tố khác không đổi thì :
▪ = 0.3063096 có nghĩa khi giá trị các biến độc lập = 0 thì số lần bị bắt trong năm 1986 là
▪
▪
▪
▪
▪
0.3063096 lần.
= 1.138975 có nghĩa số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm 1986 tăng lên 1
đơn vị thì tổng số lần bị bắt giữ tăng lên 1.138975 lần.
= 0.0074017 có nghĩa nếu thời gian kết án trung bình tăng lên 1 tháng thì số lần bị bắt giữ
tăng 0.0074017 lần.
= -0.02286 có nghĩa là nếu số tháng ngồi tù trong năm 1986 tăng lên 1 tháng thì số lần bị bắt
giữ giảm đi 0.02286 lần.
= -0.0012251có nghĩa nếu thu nhập hợp pháp tính trong năm 1986 tăng lên 100$ thì số lần bị
bắt giữ giảm đi 0.0012251 lần.
= 0.1654735 có nghĩa nếu là người da đen thì số lần bị bắt giữ cao hơn so với da màu khác
0.1654735 lần.
3. Một số kiểm định F:
a) Kiểm định sự phù hợp của mô hình:
- Mục đích: xem xét trường hợp các tham số của biến độc lập đồng thời bằng 0 có thể xảy ra
hay không.
- Có cặp giả thuyết thống kê:
Nếu giá trị Prob > F nhỏ hơn mức ý nghĩa thì bác bỏ Ho, chấp nhận H1 tức là hàm hồi quy
mẫu phù hợp.
F = = 452.353
= 2.22
Mà F= 452.353 > 2,22 → Bác bỏ H0.
Vậy mô hình hồi quy tìm được là phù hợp.
18
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
- Sử dụng lệnh test có kết quả:
test nparr86 avgsen ptime86 inc86 black
( 1)
nparr86 = 0
( 2)
avgsen = 0
( 3)
ptime86 = 0
( 4)
inc86 = 0
( 5)
black = 0
F(
5,
2719) =
Prob > F =
452.37
0.0000
Như vậy, Prob > F = 0.0000, nhỏ hơn mức ý nghĩa , vì thế bác bỏ Ho.
→ Hệ số hồi qui của các biến độc lập không đồng thời bằng 0 mô hình hồi qui phù hợp.
b) Kiểm định giả thuyết về hệ số hồi qui:
- Mục đích: kiểm định ảnh hưởng của từng biến độc lập lên giá trị trung bình của biến phụ
thuộc narr86.
- Có cặp giả thuyết thống kê:
Nếu giá trị Prob > F nhỏ hơn mức ý nghĩa thì bác bỏ Ho, chấp nhận H1, tức là biến độc
lập đó có ý nghĩa thống kê đối với narr86.
- Theo bảng chạy hồi qui, ta thấy:
+ Biến nparr86 có giá trị p-value < 0.05, bác bỏ H o, tức là biến nparr86 có ý nghĩa
+
+
+
+
thống kê đối với narr86.
Biến avgsen có giá trị p-value < 0.05, bác bỏ H o, tức là biến avgsen có ý ngĩa thống
kê đối với narr86.
Biến ptime86 có giá trị p-value < 0.05, bác bỏ H o, tức là biến ptime86 có ý nghĩa
thống kê đối với narr86.
Biến inc86 có giá trị p-value < 0.05, bác bỏ H o, tức là biến inc86 có ý nghĩa thống
kê đối với narr86.
Biến black có giá trị p-value < 0.05, bác bỏ H o, tức là biến black có ý nghĩa thống
kê đối với narr86.
19
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
→ Các biến nparr86, avgsen, ptime86, inc86, black đều có ảnh hưởng đến narr86.
III.
KIỂM ĐỊNH VÀ SỬA CHỮA CÁC KHUYẾT TẬT CỦA MÔ HÌNH:
1. Vấn đề đa cộng tuyến:
a)
Bản chất:
Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các biến độc lập Xi
trong mô hình hồi quy đa biến có tương quan tuyến tính với nhau.
b)
Nguyên nhân:
Có 3 nguyên nhân gây ra vấn đề đa cộng tuyến:
● Đa cộng tuyến hoàn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện tượng đa cộng
tuyến hoàn hảo ít khi xảy ra.
● Đa cộng tuyến không hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã hội mà các
biến độc lập đã có sẵn mối quan hệ cộng tuyến với nhau.
● Đa cộng tuyến không hoàn hảo xảy ra do số liệu điều tra không đủ lớn, hay số liệu
điều tra không ngẫu nhiên.
Các dạng mô hình dễ xảy ra đa cộng tuyến:
- Hồi quy dạng các biến độc lập được bình phương sẽ xảy ra đa cộng tuyến, đặc biệt khi phạm
vi giá trị ban đầu của biến độc lập là nhỏ.
- Các biến độc lập vĩ mô được quan sát theo chuỗi thời gian.
c)
Cách phát hiện đa công tuyến:
➢ Cách 1: Dùng lệnh corr [indep] để kiểm định đa cộng tuyến. Nếu giữa 2 biến có giá trị corr
> 0.8 thì mô hình có khả năng xảy ra đa cộng tuyến.
Sử dụng phần mềm stata và lệnh corr, ta thu được kết quả như sau:
.
corr nparr86 avgsen ptime86 inc86 black
(obs=2725)
|
nparr86
avgsen
ptime86
inc86
black
-------------+--------------------------------------------nparr86 |
1.0000
avgsen |
-0.0098
1.0000
ptime86 |
-0.0087
0.2353
1.0000
inc86 |
-0.1405
-0.0958
-0.1600
1.0000
20
Báo cáo Kinh tế lượng
black |
Nhóm 18/ Lớp KTE309.25_LT
0.1011
0.1194
0.0737
-0.1470
1.0000
Từ bảng số liệu trên, ta thấy giá trị corr của các biến rất nhỏ so với 0.8 nên mô hình không
tồn tại đa cộng tuyến.
➢ Cách 2: Dùng lệnh vif. Nếu Mean VIF > 10 thì mô hình có hiện tượng đa cộng tuyến.
Sử dụng phần mềm stata và lệnh vif, ta thu được kết quả như sau:
. vif
Variable |
VIF
1/VIF
-------------+---------------------ptime86 |
1.08
0.923993
avgsen |
1.07
0.931522
inc86 |
1.07
0.937112
black |
1.04
0.959274
nparr86 |
1.03
0.971723
-------------+---------------------Mean VIF |
1.06
Từ bảng kết quả trên, ta thấy Mean VIF < 10 => Mô hình không tồn tại vấn đề đa cộng tuyến.
Kết luận: Từ các cách kiểm định khác nhau trên, ta thấy không tồn tại vấn đề đa cộng tuyến trong
mô hình.
2. Vấn đề về phương sai sai số thay đổi:a
a)
Bản chất:
U
X
Phương sai của mỗi một ngẫu nhiên i, trong điều kiện giá trị đã cho của biến giải thích i là
không đổi, nghĩa là:
= = ; i = 1,2,3…n
Khi giảthiết đó bị vi phạm thì mô hình mắclỗi phương sai sai sốthayđổi
b)
−
Nguyên nhân:
Do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theo không gian được điều tra
trên những đối tượng có quy mô khác nhau hoặc các hiện tượng kinh tế theo thời gian được điều tra
qua các giai đoạn có mức biến động khác nhau thì phương sai sai số có thể không đồng đều.
21
Báo cáo Kinh tế lượng
−
−
−
−
Nhóm 18/ Lớp KTE309.25_LT
Do định dạng không đúng dạng hàm của mô hình. Có thể do bỏ sót biến thích hợp hoặc giải tích của
hàm là sai.
Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn xuất hiện các quan sát
ngoại lai. Quan sát ngoại lai là các quan sát khác biệt rất nhiều ( quá nhỏ hoặc quá lớn) với các quan
sát khác trong mẫu. Việc đưa vào hay loại bỏ các quan sát này ảnh hưởng rất lớn đến phân tích hồi
quy.
Do kỹ thuật thu thập, bảo quản và xử lý số liệu được cải tiến nên sai số có xu hướng giảm.
Do con người học được hành vi trong quá khứ. Chẳng hạn, lỗi của người đánh máy càng ít nếu thời
gian thực hành càng tăng…
c)
Cách phát hiện dấu hiệu của phương sai sai số thay đồi:
➢ Cách 1: Xem xét đồ thị của phần dư:
Y
Trong cách này ta sẽ sử dụng đồ thị của sai số của hồi qui e (phần dư) với giá trị dự đoán i
Y
(biểu diễn sự tương quan giữa e và i).
Từ cơ sở dữ liệu đã cho và phần mềm stata, sử dụng lệnh rvfplot, yline (0) ta xây dựng
được Đồ thị sau:
Dựa vào lí thuyết kinh tế lượng đã được học và đồ thị vừa xây dựng được, ta thấy các giá trị
trên đồ thị phân bố không đồng đều, các giá trị tuy có xoay xung quanh giá trị trung bình bằng 0
(đường ngang màu đỏ), tuy nhiên tỉ lệ rời xa giá trị trung bình bằng 0 còn khá lớn. Vì thế, ta có thể
dự đoán được mô hình có hiện tượng phương sai sai số thay đổi.
22
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
➢
Cách 2: Dùng kiểm định White:
Cặp giả thuyết:
Nếu giá trị Prob > chi2 và <0.05, chúng ta bác bỏ giả thiết H 0 và chấp nhận giả thiết H1, có
nghĩa là mô hình có hiện tượng phương sai sai số thay đổi.
Sử dụng phần mềm stata, ta thu được bảng kết quả như sau:
. imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(19)
=
84.28
Prob > chi2
=
0.0000
Cameron & Trivedi's decomposition of IM-test
--------------------------------------------------Source |
chi2
df
p
---------------------+----------------------------Heteroskedasticity |
84.28
19
0.0000
Skewness |
38.28
5
0.0000
Kurtosis |
7.30
1
0.0069
---------------------+----------------------------Total |
129.86
25
0.0000
---------------------------------------------------
Từ bảng trên, kết quả kiểm định bằng lệnh imtest, white cho thấy Prob > chi2 = 0.0000 < 0.05
=> Bác bỏ giả thiết H0, H1 đúng hay mô hình có phương sai sai số thay đổi (với mức ý nghĩa 5%).
➢
Cách 3: Dùng kiểm định Breusch – Pagan:
Cặp giả thuyết:
Sử dụng phần mềm stata và lệnh hettest, ta thu được kết quả như sau:
hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of narr86
chi2(1)
=
315.85
23
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
Prob > chi2
=
0.0000
Từ kết quả thu được, ta thấy Prob > chi2 = 0.0000 < 0.05 => Bác bỏ giả thiết H0, H1 đúng
hay mô hình có phương sai sai số thay đổi (với mức ý nghĩa 5%).
Kết luận: Vì kết quả của các kiểm định trên thống nhất nên có thể kết luận được rằng có xảy ra
hiện tượng phương sai sai số thay đổi trong mô hình.
d)
Cách khắc phục hiện tượng phương sai sai số thay đổi
Để khắc phục hiện tượng phương sai sai số thay đổi, chúng ta dùng lệnh robust, thu được kết
quả:
. reg narr86 nparr86 avgsen ptime86 inc86 black, robust
Linear regression
Number of obs =
F(
5,
2719) =
2725
148.18
Prob > F
=
0.0000
R-squared
=
0.4541
Root MSE
=
.63531
-----------------------------------------------------------------------------|
narr86 |
Robust
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------nparr86 |
1.138975
.0478223
23.82
0.000
1.045203
1.232747
avgsen |
.0074017
.0045754
1.62
0.106
-.00157
.0163733
ptime86 |
-.02286
.0040695
-5.62
0.000
-.0308396
-.0148804
inc86 |
-.0012251
.0001533
-7.99
0.000
-.0015257
-.0009244
black |
.1654735
.0445903
3.71
0.000
.0780391
.2529078
_cons |
.3063096
.0187887
16.30
0.000
.2694681
.3431511
------------------------------------------------------------------------------
Với cách này, mô hình đã khắc phục được hiện tượng phương sai sai số thay đổi trong mô
hình.
24
Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT
B. BẢNG SỐ LIỆU SỐ 58
Như chúng ta đã biết, tỉ lệ trẻ sơ sinh thiếu cân là một chỉ số sức khỏe quan trọng của một
quốc gia, một địa phương .Trẻ sơ sinh thiếu cân là trẻ sinh ra có cân nặng dưới 2.500g, bao gồm trẻ
đẻ non có cân nặng nhẹ so với tuổi thai ; thai đủ tháng có cân nặng nhẹ hoặc thai già tháng cân nặng
nhẹ so với tuổi thai. Trẻ sơ sinh thiếu cân có nguy cơ mắc các bệnh nhiều hơn trẻ sơ sinh đủ cân
như các bệnh phổi mãn tính, các bệnh nhiễm khuẩn và các bệnh thông thường khác; ngoài ra sau đẻ
phải nằm viện lâu hơn và thường xuyên mắc bệnh phải nhâp viện liên tục nhất là trong năm năm
đầu sau sinh . Nhiều trẻ trong số này phải chết sớm và số còn lại phải chịu đựng bệnh tật, kém phát
triển vể thể chất và tâm thần hoặc chịu những vấn đề sức khỏe khác đến cả khi trưởng thành.
Vậy, có những yếu tố nào ảnh hưởng đến tỉ lệ trẻ sơ sinh thiếu cân ? Và chúng ảnh hưởng với
mức độ ra sao? Để tìm hiểu rõ hơn về chủ đề trên, nhóm chúng em đã tiến hành làm báo cáo thống
kê thông qua bảng dữ liệu số 58 để nghiên cứu, nhằm giúp chúng em và các bạn có một cái nhìn
tổng quan hơn về vấn đề trẻ sơ sinh thiếu cân.
25