Tải bản đầy đủ (.doc) (64 trang)

Bài giải 10 bài tập môn kinh tế lượng (tham khảo)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (555.92 KB, 64 trang )

Bài 1
Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như sau :
ĐVT:%
Nam US Anh Nhat Duc Phap
1960 1.5 1 3.6 1.5 3.6
1961 1.1 3.4 5.4 2.3 3.4
1962 1.1 4.5 6.7 4.5 4.7
1963 1.2 2.5 7.7 3 4.8
1964 1.4 3.9 3.9 2.3 3.4
1965 1.6 4.6 6.5 3.4 2.6
1966 2.8 3.7 6 3.5 2.7
1967 2.8 2.4 4 1.5 2.7
1968 4.2 4.8 5.5 18 4.5
1969 5 5.2 5.1 2.6 6.4
1970 5.9 6.5 7.6 3.7 5.5
1971 4.3 9.5 6.3 5.3 5.5
1972 3.6 6.8 4.9 5.4 5.9
1973 6.2 8.4 12 7 7.5
1974 10.9 16 24.6 7 14
1975 9.2 24.2 11.7 5.9 11.7
1976 5.8 16.5 9.3 4.5 9.6
1977 6.4 15.9 8.1 3.7 9.4
1978 7.6 8.3 3.8 2.7 9.1
1979 11.4 13.4 3.6 4.1 10.7
1980 13.6 18 8 5.5 13.3

a. Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian . Cho
nhận xét tổng quát về lạm phát của 5 nước ?
0
2
4


6
8
10
12
14
1956 1960 1964 1968 1972 1976 1980 1984
NAM
US
2
4
6
8
10
12
14
16
1956 1960 1964 1968 1972 1976 1980 1984
NAM
PHAP
0
4
8
12
16
20
24
28
1956 1960 1964 1968 1972 1976 1980 1984
NAM
NHAT

0
4
8
12
16
20
1956 1960 1964 1968 1972 1976 1980 1984
NAM
DUC
0
5
10
15
20
25
1956 1960 1964 1968 1972 1976 1980 1984
NAM
ANH
Nhận xét: Tỉ lệ lạm phát của các nước Hoa Kì, Anh , Pháp có xu hướng ngày càng
tăng. Còn các nước Nhật và Đức thì tỉ lệ lạm phát tuy có những biến động qua các
năm nhưng không lớn và không có xu hướng tăng.
b. Lạm phát nước nào biến thiên nhiều hơn giải thích ?
ANH DUC NHAT PHAP US
Mean 8.547619 4.638095 7.347619 6.714286 5.123810
Median 6.500000 3.700000 6.300000 5.500000 4.300000
Maximum 24.20000 18.00000 24.60000 14.00000 13.60000
Minimum 1.000000 1.500000 3.600000 2.600000 1.100000
Std. Dev. 6.321046 3.458248 4.632992 3.579146 3.694984
Skewness 0.941799 2.852530 2.603757 0.653541 0.784310
Kurtosis 2.866323 11.83415 10.29502 2.214858 2.672861

Jarque-Bera 3.120083 96.76612 70.29363 2.034298 2.246638
Probability 0.210127 0.000000 0.000000 0.361625 0.325199
Sum 179.5000 97.40000 154.3000 141.0000 107.6000
Sum Sq. Dev. 799.1124 239.1895 429.2924 256.2057 273.0581
Observations 21 21 21 21 21
Từ bảng tính các thống kê mô tả, ta thấy độ lệch chuẩn lạm phát của nước Anh là
lớn nhất nghĩa là lạm phát của nước Anh biến thiên nhiều nhất.
c. Ươc lượng mô hình hồi qui: Lạm phát theo thời gian cho từng quốc gia theo
giả địn: (Lamphat)
i
=
1
+
2
(Thoigian)
i
+ U
i

Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng
quát về tác động lạm phát tại từng quốc gia ? Vẽ đồ thị ?
Dependent Variable: ANH
Method: Least Squares
Date: 04/19/11 Time: 3:09
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 0.322944 1.612211 0.200311 0.8434
NAMMOHINH 0.822468 0.137908 5.963871 0.0000
R-squared 0.651809 Mean dependent var 8.547619

Adjusted R-squared 0.633483 S.D. dependent var 6.321046
S.E. of regression 3.826801 Akaike info criterion 5.612328
Sum squared resid 278.2437 Schwarz criterion 5.711806
Log likelihood -56.92945 F-statistic 35.56776
Durbin-Watson stat 1.141176 Prob(F-statistic) 0.000010
ANH = 0.3229437229 + 0.8224675325*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của
nước Anh tăng thêm gần 0.823%.
0
5
10
15
20
25
0 4 8 12 16 20 24
NAMMOHINH
ANH
Đức
Dependent Variable: DUC
Method: Least Squares
Date: 04/19/11 Time: 3:10
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 3.593939 1.468324 2.447648 0.0243
NAMMOHINH 0.104416 0.125600 0.831332 0.4161
R-squared 0.035098 Mean dependent var 4.638095
Adjusted R-squared -0.015687 S.D. dependent var 3.458248
S.E. of regression 3.485266 Akaike info criterion 5.425359
Sum squared resid 230.7945 Schwarz criterion 5.524837

Log likelihood -54.96626 F-statistic 0.691114
Durbin-Watson stat 2.328057 Prob(F-statistic) 0.416112
DUC = 3.593939394 + 0.1044155844*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của
nước Đức tăng thêm 0.104%.
0
4
8
12
16
20
0 4 8 12 16 20 24
NAMMOHINH
DUC
Nhật
Dependent Variable: NHAT
Method: Least Squares
Date:04/19/11 Time: 3:10
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 5.215152 1.919155 2.717421 0.0137
NAMMOHINH 0.213247 0.164164 1.298984 0.2095
R-squared 0.081565 Mean dependent var 7.347619
Adjusted R-squared 0.033226 S.D. dependent var 4.632992
S.E. of regression 4.555374 Akaike info criterion 5.960885
Sum squared resid 394.2773 Schwarz criterion 6.060364
Log likelihood -60.58929 F-statistic 1.687359
Durbin-Watson stat 1.175297 Prob(F-statistic) 0.209493
NHAT = 5.215151515 + 0.2132467532*NAMMOHINH

Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của
nước Nhật tăng thêm 0.213%.
0
4
8
12
16
20
24
28
0 4 8 12 16 20 24
NAMMOHINH
NHAT
pháp
Dependent Variable: PHAP
Method: Least Squares
Date: 04/19/11 Time: 3:15
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 1.853247 0.832871 2.225130 0.0384
NAMMOHINH 0.486104 0.071244 6.823112 0.0000
R-squared 0.710166 Mean dependent var 6.714286
Adjusted R-squared 0.694912 S.D. dependent var 3.579146
S.E. of regression 1.976933 Akaike info criterion 4.291363
Sum squared resid 74.25703 Schwarz criterion 4.390842
Log likelihood -43.05931 F-statistic 46.55486
Durbin-Watson stat 0.961869 Prob(F-statistic) 0.000002
PHAP = 1.853246753 + 0.4861038961*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của

nước Pháp tăng thêm 0.486%.
2
4
6
8
10
12
14
16
0 4 8 12 16 20 24
NAMMOHINH
PHAP
Hoa Kì
Dependent Variable: US
Method: Least Squares
Date: 04/19/11 Time: 3:16
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C -0.164502 0.734285 -0.224030 0.8251
NAMMOHINH 0.528831 0.062811 8.419444 0.0000
R-squared 0.788624 Mean dependent var 5.123810
Adjusted R-squared 0.777499 S.D. dependent var 3.694984
S.E. of regression 1.742926 Akaike info criterion 4.039401
Sum squared resid 57.71804 Schwarz criterion 4.138879
Log likelihood -40.41371 F-statistic 70.88704
Durbin-Watson stat 1.131804 Prob(F-statistic) 0.000000
US = -0.1645021645 + 0.5288311688*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của
nước Hoa Kì tăng thêm gần 0.529%.

0
2
4
6
8
10
12
14
0 4 8 12 16 20 24
NAMMOHINH
US
d. Ươc lượng mô hình hồi qui: Lạm phát của từng quốc gia theo tỉ lệ lạm phát
của Mỹ
(Lamphat)
i
=
1
+
2
(lamphat-USA)
i
+ U
i

Đọc và đánh giá từng mô hình ước lượng? Đưa ra kết luận tổng quát về
tác động lạm phát tại từng quốc gia so với lạm phát của USA ?
Dependent Variable: ANH
Method: Least Squares
Date: 04/19/11 Time: 3:21
Sample: 1960 1980

Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 3.942998 1.029230 3.831018 0.0011
ANHLP 1.344882 0.199758 6.732569 0.0000
R-squared 0.704636 Mean dependent var 8.547619
Adjusted R-squared 0.689091 S.D. dependent var 6.321046
S.E. of regression 3.524566 Akaike info criterion 5.447784
Sum squared resid 236.0287 Schwarz criterion 5.547263
Log likelihood -55.20174 F-statistic 45.32748
Durbin-Watson stat 0.439091 Prob(F-statistic) 0.000002
ANH = 3.942998281 + 1.344882282*ANHLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1%
thì về trung bình tỉ lệ lạm phát ở nước Anh tăng thêm 1.345%
Dependent Variable: DUC
Method: Least Squares
Date: 004/19/11 Time: 4:05
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 4.860462 0.627216 7.749263 0.0000
DUCLP 0.457815 0.142581 3.210916 0.0046
R-squared 0.351757 Mean dependent var 4.638095
Adjusted R-squared 0.317639 S.D. dependent var 3.458248
S.E. of regression 2.856691 Akaike info criterion 5.027598
Sum squared resid 155.0530 Schwarz criterion 5.127076
Log likelihood -50.78978 F-statistic 10.30998
Durbin-Watson stat 1.202348 Prob(F-statistic) 0.004600
DUC = 4.860462352 + 0.4578146464*DUCLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1%
thì về trung bình tỉ lệ lạm phát ở nước Đức tăng thêm 0.46%

Dependent Variable: NHAT
Method: Least Squares
Date: 04/19/11 Time: 4:06
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 5.795073 0.866538 6.687612 0.0000
NHATLP 0.698147 0.177928 3.923768 0.0009
R-squared 0.447610 Mean dependent var 7.347619
Adjusted R-squared 0.418536 S.D. dependent var 4.632992
S.E. of regression 3.532831 Akaike info criterion 5.452469
Sum squared resid 237.1370 Schwarz criterion 5.551947
Log likelihood -55.25092 F-statistic 15.39596
Durbin-Watson stat 0.534453 Prob(F-statistic) 0.000912
NHAT = 5.795072835 + 0.6981471192*NHATLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1%
thì về trung bình tỉ lệ lạm phát ở nước Nhật tăng thêm khoảng 0.7%
Dependent Variable: PHAP
Method: Least Squares
Date: 04/19/11 Time:4:06
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 6.251776 1.212106 5.157778 0.0001
PHAPLP 0.290800 0.574747 0.505961 0.6187
R-squared 0.013294 Mean dependent var 6.714286
Adjusted R-squared -0.038637 S.D. dependent var 3.579146
S.E. of regression 3.647635 Akaike info criterion 5.516428
Sum squared resid 252.7996 Schwarz criterion 5.615906
Log likelihood -55.92249 F-statistic 0.255996

Durbin-Watson stat 0.273299 Prob(F-statistic) 0.618704
PHAP = 6.25177575 + 0.2907996784*PHAPLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1%
thì về trung bình tỉ lệ lạm phát ở nước Pháp tăng thêm khoảng 0.29%
nhận xét chung: Từ kết quả cho thấy có mối quan hệ khá chặt chẽ giữa tỉ lệ lạm
phát của Anh với tỉ lệ lạm phát của Hoa Kì, tỉ lệ lạm phát của Anh chịu ảnh hưởng
nhiều bởi tỉ lệ lạm phát của Hoa Kì, còn tỉ lệ lạm phát của Nhật và Đức, Pháp ít
chịu ảnh hưởng bởi tỉ lệ lạm phát của Hoa Kì.
Bài tập 2 :
Nhà phân tích học viện nghiên cứu Anh ngữ đã thu thập dữ liệu từ 8 sinh
viên khác nhau trong một lớp . Bảng dữ liệu gốc được trình bài như sau :
Sinh
viên
Điểm
tóan
Điểm khoa
học
điểm Anh
Văn
1 13.5 9.9 13.3
2 13.7 6.8 10
3 7 5.5 8.9
4 7.4 5.7 2.4
5 13.2 10.3 8.2
6 7.3 1.8 6.3
7 5.2 5.2 7.7
8 8.4 6.9 2.9
Người ta muốn xem xét xem là có mối quan hệ nào giữa điểm môn Anh văn
và điểm môn Khoa học của sinh viên . Cụ thể là chúng ta có thể dựa vào điểm
môn Khoa học và của sinh viên có thể dự đóan điểm của môn Anh văn hay không

- Cũng như dựa vào điểm môn Tóan của sinh viên có thể dự đóan điểm của môn
Anh văn hay không ?
Cho từng cặp môn học tương ứng , anh chị :
a. Ươc lượng mô hình hồi qui tuyến tính cho tập dữ liệu nói trên? - Đọc và
nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng quát ?
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 04/19/11 Time: 4:13
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C 3.762656 3.422463 1.099400 0.3137
DIEMKHOAHOC 0.568114 0.489567 1.160442 0.2900
R-squared 0.183299 Mean dependent var 7.462500
Adjusted R-squared 0.047182 S.D. dependent var 3.605130
S.E. of regression 3.519055 Akaike info criterion 5.566580
Sum squared resid 74.30247 Schwarz criterion 5.586440
Log likelihood -20.26632 F-statistic 1.346627
Durbin-Watson stat 1.325655 Prob(F-statistic) 0.289950
DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC
Mô hình trên đây thể hiện mối quan hệ thuận giữa điểm Anh Văn và điểm Khoa
Học. Cụ thể là khi điểm môn Khoa Học tăng thêm 1điểm thì về trung bình điểm
môn Anh Văn tăng thêm 0.57 điểm.
Khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn là 3.76
điểm.
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 04/19/11 Time: 4:13
Sample: 1 8
Included observations: 8

Variable Coefficient Std. Error t-Statistic Prob.
C 1.691257 3.486802 0.485045 0.6448
DIEMTOAN 0.609907 0.348935 1.747907 0.1311
R-squared 0.337396 Mean dependent var 7.462500
Adjusted R-squared 0.226962 S.D. dependent var 3.605130
S.E. of regression 3.169724 Akaike info criterion 5.357484
Sum squared resid 60.28290 Schwarz criterion 5.377344
Log likelihood -19.42994 F-statistic 3.055180
Durbin-Watson stat 2.104833 Prob(F-statistic) 0.131069
DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN
Mô hình trên cũng thể hiện mối quan hệ thuận giữa điểm Anh Văn và điểm Toán.
Cụ thể là khi điểm môn Toán tăng thêm 1 điểm thì về trung bình điểm môn Anh
Văn tăng thêm 0.61 điểm.
Khi điểm môn Toán bằng không thì về trung bình điểm môn Anh Văn là 1.69
điểm.
Nhận xét tổng quát: Do hệ số tương quan của 2 mô hình là rất thấp (R
2
<0.5) cho
thấy mức độ phù hợp của 2 mô hình là rất thấp. Các biến đưa vào mô hình hầu như
không có tác động đến biến phụ thuôc, mô hình đưa ra không có ý nghĩa nhiều về
mặt thống kê. Hay điểm môn Khoa Học hoặc môn Toán không có ảnh hưởng đến
điểm của môn Anh văn.
b. Giải thích ý nghĩa của hệ số tương quan ? Giải thích ý nghĩa của hệ số độ
dốc và tung độ gốc của phương trình hồi qui ?
ý nghĩa của hệ số tương quan:
R
2
đo lường mối tương quan giữa biến phụ thuộc (điểm Anh Văn) với biến độc lập
(điểm Khoa Học, điểm Toán). R
2

ở 2 mô hình trên đều rất nhỏ điều đó chứng tỏ
điểm của môn Anh Văn không phụ thuộc vào môn khoa học hay môn toán.
Ý nghĩa của hệ số độ dốc v à tung độ gốc:
DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC
+ b1= 3.762656345: khi điểm môn Khoa Học bằng không thì về trung bình điểm
môn Anh Văn bằng 3.76
+ b2 = 0.5681141889 : khi điểm môn Khoa Học tăng thêm 1 điểm thì về trung bình
điểm môn Anh Văn tăng thêm 0.57 điểm

DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN
+ b1= 1.691256533: khi điểm môn Khoa Học bằng không thì về trung bình điểm
môn Anh Văn bằng 1.69
+ b2 = 0.6099068394: khi điểm môn Khoa Học tăng thêm 1 điểm thì về trung bình
điểm môn Anh Văn tăng thêm 0.61 điểm
Bài tập 3:
Ta có tập dữ liệu sau bao gồm 64 quan sát của các quốc gia với các biến số được
giải thích bên dưới của bảng số liệu :
obs CM FLR PGNP TFR obs CM FLR PGNP TFR
1 128 37 1870 6.66 33 142 50 8640 7.17
2 204 22 130 6.15 34 104 62 350 6.6
3 202 16 310 7 35 287 31 230 7
4 197 65 570 6.25 36 41 66 1620 3.91
5 96 76 2050 3.81 37 312 11 190 6.7
6 209 26 200 6.44 38 77 88 2090 4.2
7 170 45 670 6.19 39 142 22 900 5.43
8 240 29 300 5.89 40 262 22 230 6.5
9 241 11 120 5.89 41 215 12 140 6.25
10 55 55 290 2.36 42 246 9 330 7.1
11 75 87 1180 3.93 43 191 31 1010 7.1
12 129 55 900 5.99 44 182 19 300 7

13 24 93 1730 3.5 45 37 88 1730 3.46
14 165 31 1150 7.41 46 103 35 780 5.66
15 94 77 1160 4.21 47 67 85 1300 4.82
16 96 80 1270 5 48 143 78 930 5
17 148 30 580 5.27 49 83 85 690 4.74
18 98 69 660 5.21 50 223 33 200 8.49
19 161 43 420 6.5 51 240 19 450 6.5
20 118 47 1080 6.12 52 312 21 280 6.5
21 269 17 290 6.19 53 12 79 4430 1.69
22 189 35 270 5.05 54 52 83 270 3.25
23 126 58 560 6.16 55 79 43 1340 7.17
24 12 81 4240 1.8 56 61 88 670 3.52
25 167 29 240 4.75 57 168 28 410 6.09
26 135 65 430 4.1 58 28 95 4370 2.86
27 107 87 3020 6.66 59 121 41 1310 4.88
28 72 63 1420 7.28 60 115 62 1470 3.89
29 128 49 420 8.12 61 186 45 300 6.9
30 27 63 19830 5.23 62 47 85 3630 4.1
31 152 84 420 5.79 63 178 45 220 6.09
32 224 23 530 6.5 64 142 67 560 7.2
Trong đó: - CM : Tỉ lệ tử vong của trẽ sơ sinh (%)
- FLR : Tỉ lệ biết chử của dân số (%)
- PGNP : GNP bình quân đầu người (Đô la)
- TFR : Tỉ lệ sinh chung của dân số (%)
1. Hãy giải thích mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến
khác đã cho, bằng những lập luận mang tính cách kinh tế và lô gic ? - Sau đó vẽ
biểu đồ phân tán giữa CM và FLR; CM và PGNP; CM và TFR. Rồi từ đó đối chiếu
đồ thị với các giải thích của anh chị lúc ban đầu ( nêu lên sự phù hợp và không phù
hợp với lời giải thích ban đầu)
Trả lời:

Mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến khác đã cho:
+ Tỉ lệ biết chữ của dân số (FLR): đây là mối quan hệ tỉ lệ nghịch. Tỉ lệ biết chữ
của dân số càng cao thì tỉ lệ tử vong của trẻ sơ sinh càng thấp. Khi dân trí cao thì
người dân sẽ tiếp thu được nhiều tri thức hơn trong việc chăm sóc, bảo vệ sức
khỏe cho trẻ sơ sinh, dân trí cao thì con người sẽ phá bỏ những phong tục tập quán
lạc hậu, những điều lệ cổ hũ gây nguy hiểm đến tính mạng của trẻ sơ sinh, từ đó
làm giảm tỉ lệ tử vong ở trẻ sơ sinh.
+ GNP bình quân đầu người (PGNP): đây cũng là mối quan hệ tỉ lệ nghịch. GNP
bình quân đầu người càng cao thì người dân sẽ có điều kiện hơn trong việc chăm
sóc, bảo vệ sức khỏe của trẻ sơ sinh. Khi thu nhập của người dân được tăng lên thì
người ta sẽ quan tâm hơn đến vấn đề dinh dưỡng cho trẻ sơ sinh, họ sẽ có điều kiện
hơn để đi khám chữa bệnh…. từ đó làm giảm tỉ lệ tử vong của trẻ sơ sinh.
+ Tỉ lệ sinh chung của dân số (TFR): đây là mối quan hệ tỉ lệ thuận. Khi tỉ lệ sinh
chung càng cao thì số trẻ sơ sinh sinh ra càng nhiều, đây là một vấn đề khó khăn
cho công tác chăm sóc và bảo vệ sức khỏe cho trẻ sơ sinh. Từ đó có thể làm tăng tỉ
lệ tử vong ở trẻ sơ sinh.
0
40
80
120
160
200
240
280
320
0 20 40 60 80 100
FLR
CM
Qua đồ thị cho thấy tỉ lệ biết chữ của dân số càng cao thì tỉ lệ tử vong của trẻ sơ
sinh càng thấp và ngược lại.

Tuy nhiên có chỗ chưa phù hợp với nhận xét ở chỗ: có một số trường hợp, khi ti lệ
biết chữ của dân số không phải là cao nhất nhưng tỉ lệ tử vong của trẻ sơ sinh là
thấp nhất.
0
40
80
120
160
200
240
280
320
0 4000 8000 12000 16000 20000
PGNP
CM
Qua đồ thị cho thấy GNP bình quân đầu người càng cao thì tỉ lệ tử vong càng thấp.
Mức độ phân tán của GNP bình quân đầu người thấp còn khá cao, điều này chứng
tỏ GNP bình quân đầu người ở đây còn thấp và tỉ lệ tử vong của trẻ sơ sinh ở đây
còn cao. Đây hoàn toàn phù hợp với nhận xét ban đầu
0
40
80
120
160
200
240
280
320
1 2 3 4 5 6 7 8 9
TFR

CM
Qua đồ thị ta thấy tỉ lệ sinh chung của dân số càng cao thì tỉ lệ tử vong của
trẻ sơ sinh càng cao. Tuy nhiên cũng có một số trường hợp, tỉ lệ sinh chung cao
nhưng tỉ lệ tử vong của trẻ sơ sinh vẫn thấp, điều này cho thấy: mặc dù tỉ lệ sinh
cao nhưng công tác chăm sóc và bảo vệ sức khỏe tốt hạn chế được tỉ lệ tử vong ở
trẻ sơ sinh.
2. Anh chị hãy xây dựng mô hình hồi qui đơn cho CM va PGNP . Nhận xét
các thông tin chính từ mô hình nầy như ý nghĩa thống kê của hệ số hồi qui, hệ số
xác định R
2
.

Dependent Variable: CM
Method: Least Squares
Date: 04/19/11 Time: 21:15
Sample: 1 64
Included observations: 64
Variable Coefficient Std. Error t-Statistic Prob.
C 157.4244 9.845583 15.98935 0.0000
PGNP -0.011364 0.003233 -3.515661 0.0008
R-squared 0.166217 Mean dependent var 141.5000
Adjusted R-squared 0.152769 S.D. dependent var 75.97807
S.E. of regression 69.93413 Akaike info criterion 11.36374
Sum squared resid 303228.5 Schwarz criterion 11.43120
Log likelihood -361.6396 F-statistic 12.35987
Durbin-Watson stat 1.931458 Prob(F-statistic) 0.000826
Mô hình hồi qui đơn:
CM = 157.4244406 - 0.01136445358*PGNP
Qua phương trình hồi qui ta thấy mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và
GNP bình quân đầu người là mối quan hệ tỉ lệ nghịch.

+ Trong điều kiện GNP bình quân đầu người không đổi, về trung bình tỉ lệ tử vong
của trẻ sơ sinh là 157.43%.
+ Khi GNP bình quân đầu người tăng thêm 1 USD thì về trung bình tỉ lệ tử vong
của trẻ sơ sinh giảm 0.114%.
+ R
2
= 0.166217 cho thấy mô hình đưa ra không phù hợp, không có ý nghĩa thống
kê, biến đưa vào không giải thích nhiều về biến phụ thuộc, hay nói cách khác tỉ lệ
tử vong của trẻ sơ sinh ít chịu ảnh hưởng bởi GNP bình quân đầu người mà phụ
thuộc vào nhiều nhân tố khác nữa.
3. Hãy xây dựng mô hình hồi qui bội cho quan hệ CM; FLR và PGNP. Nhận
xét thông tin chính từ mô hình nầy , như ý nghĩa thống kê của hệ số , hệ số xác
định R
2
.
Dependent Variable: CM
Method: Least Squares
Date: 04/19/11 Time: 21:16
Sample: 1 64
Included observations: 64
Variable Coefficient Std. Error t-Statistic Prob.
C 263.6416 11.59318 22.74109 0.0000
FLR -2.231586 0.209947 -10.62927 0.0000
PGNP -0.005647 0.002003 -2.818703 0.0065
R-squared 0.707665 Mean dependent var 141.5000
Adjusted R-squared 0.698081 S.D. dependent var 75.97807
S.E. of regression 41.74780 Akaike info criterion 10.34691
Sum squared resid 106315.6 Schwarz criterion 10.44811
Log likelihood -328.1012 F-statistic 73.83254
Durbin-Watson stat 2.186159 Prob(F-statistic) 0.000000

CM = 263.6415856 - 2.231585732*FLR - 0.005646594817*PGNP
Phương trình hồi qui cho thấy:
+ Trong điều kiện GNP bình quân đầu người và tỉ lệ biết chữ của dân số không đổi
thì về trung bình tỉ lệ tử vong của trẻ sơ sinh là 263.64%
+ Trong điều kiện GNP bình quân đầu người không đổi, khi tỉ lệ biết chữ của dân
số tăng 1% thì về trung bình tỉ lệ tử vong của trẻ sơ sinh giảm 2.23%.
+ Trong điều kiện tỉ lệ biết chữ của dân số không đổi, khi GNP bình quân đầu
người tăng thêm 1 USD thì về trung bình tỉ lệ tử vong của trẻ sơ sinh giảm
0.0056%.
+ R
2
= 0.707665 cho thấy mức độ phù hợp của mô hình là khá cao. Các biến đưa
vào mô hình đã giải thích được phần lớn biến phụ thuộc, hay nói cách khác tỉ lệ tử
vong của trẻ sơ sinh chịu phần lớn vào tỉ lệ biết chữ của dân số và GNP bình quân
đầu người.
4 . So sánh mô hình đơn và mô hình bội anh chị có nhận xét gì về hệ số hồi
qui tìm được của biến PGNP, nếu phải chọn hệ số PGNP của mô hình nào để giải
thích tác động của PGNP lên CM ? Tại sao?
So sánh 2 mô hình hồi qui cho thấy: hệ số hồi qui của biến PGNP của phương trình
hồi qui đơn nhỏ hơn hệ số hồi qui của phương trình hồi qui bội. Điều này cho thấy
hệ số hồi qui của biến PGNP của phương trình hồi qui bội giải thích biến CM rõ
hơn của phương trình hồi qui đơn.
nếu phải chọn thì ta nên chọn hệ số PGNP của mô hình hồi qui bội để giải thích
tác động của PGNP lên CM. Vì ở mô hình hồi qui bội hệ số của biến PGNP giải
thích rõ hơn tác động của biến PGNP lên CM , R
2
lớn cho thấy mô hình phù hợp
hơn và có ý nghĩa thống kê.
5. Hồi qui CM cho tất cả các biến trong tập dữ liệu ? Nhận xét va cho ý kiến
của anh chị?

Dependent Variable: CM
Method: Least Squares
Date: 04/19/11 Time: 21:17
Sample: 1 64
Included observations: 64
Variable Coefficient Std. Error t-Statistic Prob.
C 168.3067 32.89165 5.117003 0.0000
FLR -1.768029 0.248017 -7.128663 0.0000
PGNP -0.005511 0.001878 -2.934275 0.0047
TFR 12.86864 4.190533 3.070883 0.0032
R-squared 0.747372 Mean dependent var 141.5000
Adjusted R-squared 0.734740 S.D. dependent var 75.97807
S.E. of regression 39.13127 Akaike info criterion 10.23218
Sum squared resid 91875.38 Schwarz criterion 10.36711
Log likelihood -323.4298 F-statistic 59.16767
Durbin-Watson stat 2.170318 Prob(F-statistic) 0.000000
CM = 168.3066897 - 1.768029221*FLR - 0.00551122506*PGNP +
12.86863633*TFR
Nhận xét:
Qua phương trình hồi qui cho thấy tất cả các biến đưa vào (FLR, PGNP, TFR) đều
giải thích được cho biến phụ thuộc (CM).
Hệ số hồi qui của các biến trong mô hình này lớn hơn các mô hình trên, chứng tỏ
các biến đưa ra ở mô hình này giải thích rõ biến phụ thuộc hơn so với các mô hình
trên.
R
2
= 0.747372 cao hơn các mô hình trên, cho thấy mức độ phù hợp này khá cao, có
ý nghĩa thống kê hơn cả các mô hình trên vì CM không chịu tác động riêng lẽ bởi
bất kì yếu tố nào mà CM chịu tác động cộng gộp bởi các nhân tố: FLR, PGNP,
TFR và nhiều nhân tố khác.

+ Mô hình này thể hiện giải thích rõ nhất tác động của các biến đến biến phụ thuộc
cho nên mô hình này nên lựa chọn là mô hình giải thích nguyên nhân biến động
của tỉ lệ tử vong của trẻ sơ sinh
Bài 4 :Ta có tập dữ liệu sau: Baitap 4 – cau 2 - luan
obs AGE
D
ALC
C
EDU1 EDU2 HEX
C
INCC MORT PHYS POV TOB
C
URB
1 0.122 1.9 0.565 0.122 1620 1067
3
934.9 142 0.189 114.5 0.675
2 0.034 3.86 0.825 0.211 1667 1818
7
396.2 127 0.107 128.9 0.417
3 0.123 3.08 0.724 0.174 1473 1279
5
771.5 184 0.132 107.1 0.764
4 0.149 1.78 0.555 0.108 1552 1047
6
1022.8 136 0.19 125.8 0.397
5 0.106 3.19 0.735 0.196 2069 1606
5
766 235 0.114 102.8 0.957
6 0.09 3.09 0.786 0.23 1664 1481
2

625.7 196 0.101 112.4 0.817
7 0.133 2.8 0.703 0.207 1945 1808
9
888.4 275 0.08 111 0.926
8 0.114 3.17 0.686 0.175 1691 1427
2
880.2 185 0.119 144.5 0.659
9 0.122 5.34 0.671 0.275 3872 1816
8
1120.5 552 0.186 122.1 1
10 0.177 3.12 0.667 0.149 1886 1374
2
1065.6 191 0.135 124.2 0.908
11 0.1 2.48 0.564 0.146 1755 1254
3
814.3 159 0.166 128.8 0.648
12 0.097 2.97 0.738 0.203 1693 1381
4
554.2 212 0.099 69.8 0.763
13 0.112 2.43 0.737 0.158 1288 11120 708.7 118 0.126 100.7 0.2
14 0.12 2.77 0.665 0.162 1864 1473
8
886.5 199 0.11 121.6 0.825
15 0.119 2.19 0.664 0.125 1625 1244
6
876.3 142 0.097 135.3 0.681
16 0.145 2.09 0.715 0.139 1758 1259
4
966.1 136 0.101 109.4 0.434
17 0.134 1.95 0.733 0.17 1820 1377

5
900.3 162 0.101 115.7 0.534
18 0.12 1.85 0.531 0.111 1404 1082
4
935 149 0.176 182.4 0.461
19 0.101 2.63 0.577 0.139 1716 11274 825.4 173 0.186 125 0.692
20 0.133 2.57 0.687 0.144 1641 11887 979.4 165 0.13 127.9 0.361
21 0.106 2.84 0.674 0.204 1732 1586
4
833.6 303 0.098 121.9 0.929
22 0.136 3.04 0.722 0.2 2289 1638
0
955.4 300 0.096 117.2 0.906
23 0.114 2.6 0.68 0.143 1996 1360
8
866.2 174 0.104 126.6 0.799
24 0.125 2.68 0.731 0.174 1888 1408
7
830.2 203 0.095 113 0.666
25 0.12 2.06 0.548 0.123 1519 9187 944.6 117 0.239 115.3 0.305
26 0.137 2.27 0.635 0.139 1858 1324
4
1000.4 179 0.122 129.2 0.66
27 0.121 2.95 0.744 0.175 1494 1097
4
815 136 0.123 103.6 0.242
28 0.136 2.41 0.734 0.155 1766 1328
1
928.5 156 0.107 105.1 0.476
29 0.103 5.19 0.755 0.144 1946 1448

8
772.3 155 0.087 146.7 0.826
30 0.116 4.91 0.723 0.182 1417 1496
4
849.1 179 0.085 201.1 0.563
31 0.129 2.83 0.674 0.183 1702 17211 940.7 219 0.095 116.9 1
32 0.098 2.75 0.689 0.176 1385 1091
4
672.8 161 0.176 88 0.489
33 0.128 2.67 0.663 0.179 2412 1605
0
969.9 287 0.134 115.9 0.912
34 0.115 2.13 0.548 0.132 1380 11617 846.3 168 0.148 156.3 0.554
35 0.13 2.55 0.664 0.148 1872 1205
2
821.6 157 0.126 103.2 0.384
36 0.123 2.26 0.67 0.137 1833 1322
8
920.6 182 0.103 126.7 0.789
37 0.124 1.91 0.66 0.151 1644 1223
2
900.8 138 0.134 124.2 0.588
38 0.134 2.63 0.756 0.179 1654 1262
2
889.7 189 0.107 118.6 0.677
39 0.146 2.25 0.647 0.136 1894 1343
7
1043.9 214 0.105 115.8 0.848
40 0.146 2.92 0.611 0.154 2054 1390
6

997.6 223 0.103 133.4 0.926
41 0.105 2.5 0.537 0.134 1341 1058
6
812.6 146 0.166 125.4 0.605
42 0.139 2.33 0.679 0.14 1617 11161 932.6 130 0.169 104.4 0.291
43 0.123 1.95 0.562 0.126 1671 11243 906.8 176 0.165 128.7 0.671
44 0.095 2.82 0.626 0.169 1577 1348
3
722.2 160 0.147 115.9 0.813
45 0.08 1.53 0.8 0.199 1203 1049
3
550.1 171 0.103 66.5 0.774
46 0.119 3.12 0.71 0.19 1481 12117 871.4 232 0.121 144.5 0.232
47 0.105 2.55 0.624 0.191 1498 1454
2
794.1 194 0.118 134.6 0.722
48 0.117 2.71 0.776 0.19 1660 1387
6
782.8 196 0.098 96.5 0.816
49 0.136 1.68 0.56 0.104 1542 1019
3
1003.8 156 0.15 109.1 0.365
50 0.13 3.19 0.696 0.148 1862 1315
4
868.8 172 0.087 107 0.665
51 0.084 2.86 0.779 0.172 1453 1322
3
642.9 125 0.079 125.7 0.292
Trong đó : - MORT : Tỉ lệ tử vong chung trên 100.000 dân số
- INCC : Thu nhập đầu người tính bằng USD

- POV : Tỉ lệ của những người dân trong nước sống dưới mức nghèo
khó
- EDU1 : Tỉ lệ dân số đã học trung học
- EDU2 : Tỉ lệ dân số đã học trung học và đại học.
- ALCC : Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người.
- TOBC : Tiêu dùng thuốc lá đầu người tíng bằng bao
- HEXC : Chi tiêu y tế bình quân đầu người (USD)
- URB : Tỉ lệ dân số sống tại các khu vực thành thị
- AGED : Tỉ lệ dân số có độ tuồi trên 65
- PHYS : Các cán bộ y tế trên 1000.000 dân
Yêu cầu :
1. Chọn biến Mort là biến phụ thuộc – Đối với từng biến giải thích, hãy lý
giải tại sao nó có thể có tác động lên tỉ lệ tử vong tổng thể và chỉ ra
hướng tác động nầy?
+ Đối với INCC: thu nhập đầu người càng thấp thì tỉ lệ tử vong chung trên 100.000
dân số càng cao, do thu nhập thấp thì người dân có ít điều kiện hơn trong việc
chăm sóc sức khỏe cho bản thân và gia đình về dinh dưỡng, y tế… từ dó có thể làm
tăng khả năng tỉ lệ tử vong.
+ POV: Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó càng cao
thì việc chăm lo của người dân đến dinh dưỡng và tiếp cận đến các dịch vụ y tế
càng thấp, làm cho tỉ lệ suy dinh dưỡng cao, nếu người dân mắc các bệnh tật thì
cũng ít có khả năng chạy chữa, từ đó có thể làm tỉ lệ tử vong chung trên 100.000
dân số càng cao,
+ EDU1 và EDU2: Tỉ lệ dân số đã học trung học và tỉ lệ dân số đã học trung học
và đại học càng cao cho thấy trình độ dân trí của người dân càng cao, dân trí cao
thì người dân mới tiếp thu được những kiến thức tiến bộ về sức khỏe, y tế, khoa
học….từ đó có thể giảm bớt được tỉ lệ tử vong chung trên 100.000 dân số do họ có
thể bỏ nhưng hủ thục lạc hậu, những cách chữa bệnh không khoa học… có thể ảnh
hưởng đến sức khỏe người dân.
nhưng EDU2 tác động mạnh hơn.

+ ALCC v à TOBC : khi tiêu dùng cồn ( rượu) tính bằng lít trên đầu người và tiêu
dùng thuốc lá đầu người càng cao thì người dân sẽ dễ bị mắc các bệnh dạ dày, ung
thư phổi…. nhiều từ đó tỉ lệ tử vong chung trên 100.000 dân số càng cao
HEXC : Chi tiêu y tế bình quân đầu người càng cao thì, Chi tiêu y tế bình quân đầu
người càng cao nghĩa là người dân sẽ chi cho khám chữa bệnh cao, từ đó có thể
phát hiện ra bệnh sớm, phòng ngừa và chữa trị bệnh kịp thời dẫn đến tỉ lệ tử vong
chung trên 100.000 dân số càng thấp
URB : Tỉ lệ dân số sống tại các khu vực thành thị cao nghĩa là nhiều người sống
ở khu vực thành thị, nơi có đầy đủ cơ sở vật chất hạ tầng, có đủ lực lượng y tế
khám chữa bệnh cho người dân từ đó có thể làm giảm tỉ lệ tử vong chung trên
100.000 dân số
AGED : Tỉ lệ dân số có độ tuồi trên 65càng cao, tức là số người cao tuổi cao dẫn
đến tỉ lệ tử vong chung trên 100.000 dân số cao do người già thì sức khỏe yếu, dễ
mắc bệnh….
PHYS : Các cán bộ y tế trên 1000.000 dân càng cao nghĩa là số người được 1 cán
bộ y tế chăm sóc càng ít,khi mà 1 cán bộ y tế chỉ chăm sóc ít bệnh nhân hơn thì
người cán bộ y tế đó sẽ dồn hết tâm sức của mình cho người bệnh đó để mà khám
chữa bệnh, từ đó có thể làm giảm tỉ lệ tử vong chung trên 100.000 dân số
2. Ước lượng mô hình hồi qui đa biến bao gồm tất cả những biến giải thích
đang có? Thực hiện kiểm định cho mức ý nghĩa tổng quát – Nhận xét sự
thích hợp ? Kiểm định mức ý nghĩa đối với từng hệ số hồi qui ở mức =
10% và xác định các biến mà anh chị có thể muốn bỏ qua.
Dependent Variable: MORT
Method: Least Squares
Date: 04/19/11 Time: 21:19
Sample: 1 51
Included observations: 51
Variable Coefficient Std. Error t-Statistic Prob.
C 46.59555 168.2097 0.277009 0.7832
AGED 4126.895 322.3451 12.80272 0.0000

ALCC -25.91511 11.09681 -2.335366 0.0246
EDU1 68.77913 196.8405 0.349415 0.7286
EDU2 -1180.217 548.8868 -2.150201 0.0376
HEXC 0.073889 0.034127 2.165088 0.0364
INCC 0.004511 0.005817 0.775551 0.4426
PHYS 0.640384 0.263636 2.429044 0.0197
POV 549.8647 308.5540 1.782069 0.0823
TOBC 1.470480 0.353504 4.159732 0.0002
URB -32.45556 35.64423 -0.910542 0.3680
R-squared 0.948570 Mean dependent var 855.0059
Adjusted R-squared 0.935713 S.D. dependent var 137.9660
S.E. of regression 34.98117 Akaike info criterion 10.13592
Sum squared resid 48947.30 Schwarz criterion 10.55259
Log likelihood -247.4660 F-statistic 73.77592
Durbin-Watson stat 1.597995 Prob(F-statistic) 0.000000
MORT = 46.59554973 + 4126.895059*AGED - 25.91510605*ALCC +
68.7791315*EDU1 - 1180.217201*EDU2 + 0.07388858751*HEXC +
0.00451136983*INCC + 0.6403836367*PHYS + 549.8646857*POV +
1.470480259*TOBC - 32.45555872*URB
Kiểm định cho mức ý nghĩa tổng quát
Giả thiết: Ho: R
2
= 0
H1: R
2
> 0
F
R
= 73.77592
Với mức ý nghĩa 10%, tra bảng phân phối Fisher: F > F

0.05
(9,41)  bác bỏ giả
thiết Ho, tức là mô hình có ý nghĩa thống kê ở mức 10%.
Qua mô hình ta thấy: R
2
= 0.948570  mức độ phù hợp của mô hình này cao, mô
hình có ý nghĩa thống kê.
Kiểm định mức ý nghĩa đối với từng hệ số hồi qui:
Giả thiết: Ho: b
i
= 0
H1: b
i
# 0
Với mức ý nghĩa 10%, tra bảng phân phối student: T
0.05
(40) = 1.684
Hệ số hồi qui Trị thống kê So sánh Kết luận
b2 12.80272 T > T
0.05
(40) Bác bỏ Ho
b3 -2.335366 T > T
0.05
(40) Bác bỏ Ho
b4 0.349415 T < T
0.05
(40) Chấp nhận Ho
b5 -2.150201 T > T
0.05
(40) Bác bỏ Ho

b6 2.165088 T > T
0.05
(40) Bác bỏ Ho
b7 0.775551 T < T
0.05
(40) Chấp nhận Ho
b8 2.429044 T > T
0.05
(40) Bác bỏ Ho

×