KTNL07_07401067_LE DINH NGUYEN
Bài 1
Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như sau
:
ĐVT:%
Nam US Anh Nhat Duc Phap
1960 1.5 1 3.6 1.5 3.6
1961 1.1 3.4 5.4 2.3 3.4
1962 1.1 4.5 6.7 4.5 4.7
1963 1.2 2.5 7.7 3 4.8
1964 1.4 3.9 3.9 2.3 3.4
1965 1.6 4.6 6.5 3.4 2.6
1966 2.8 3.7 6 3.5 2.7
1967 2.8 2.4 4 1.5 2.7
1968 4.2 4.8 5.5 18 4.5
1969 5 5.2 5.1 2.6 6.4
1970 5.9 6.5 7.6 3.7 5.5
1971 4.3 9.5 6.3 5.3 5.5
1972 3.6 6.8 4.9 5.4 5.9
1973 6.2 8.4 12 7 7.5
1974 10.9 16 24.6 7 14
1975 9.2 24.2 11.7 5.9 11.7
1976 5.8 16.5 9.3 4.5 9.6
1977 6.4 15.9 8.1 3.7 9.4
1978 7.6 8.3 3.8 2.7 9.1
1979 11.4 13.4 3.6 4.1 10.7
1980 13.6 18 8 5.5 13.3
Nguồn tin : khoa tóan thống kê – ĐHKT
a. Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian .
Cho nhận xét tổng quát về lạm phát của 5 nước ?
KTNL07_07401067_LE DINH NGUYEN
0
2
4
6
8
10
12
14
1956 1960 1964 1968 1972 1976 1980 1984
NAM
US
2
4
6
8
10
12
14
16
1956 1960 1964 1968 1972 1976 1980 1984
NAM
PHAP
0
4
8
12
16
20
24
28
1956 1960 1964 1968 1972 1976 1980 1984
NAM
NHAT
0
4
8
12
16
20
1956 1960 1964 1968 1972 1976 1980 1984
NAM
DUC
0
5
10
15
20
25
1956 1960 1964 1968 1972 1976 1980 1984
NAM
ANH
KTNL07_07401067_LE DINH NGUYEN
Nhận xét: Tỉ lệ lạm phát của các nước Hoa Kì, Anh , Pháp có xu hướng ngày
càng tăng. Còn các nước Nhật và Đức thì tỉ lệ lạm phát tuy có những biến
động qua các năm nhưng không lớn và không có xu hướng tăng.
b. Lạm phát nước nào biến thiên nhiều hơn giải thích ?
ANH DUC NHAT PHAP US
Mean 8.547619 4.638095 7.347619 6.714286 5.123810
Median 6.500000 3.700000 6.300000 5.500000 4.300000
Maximum 24.20000 18.00000 24.60000 14.00000 13.60000
Minimum 1.000000 1.500000 3.600000 2.600000 1.100000
Std. Dev. 6.321046 3.458248 4.632992 3.579146 3.694984
Skewness 0.941799 2.852530 2.603757 0.653541 0.784310
Kurtosis 2.866323 11.83415 10.29502 2.214858 2.672861
Jarque-Bera 3.120083 96.76612 70.29363 2.034298 2.246638
Probability 0.210127 0.000000 0.000000 0.361625 0.325199
Sum 179.5000 97.40000 154.3000 141.0000 107.6000
Sum Sq. Dev. 799.1124 239.1895 429.2924 256.2057 273.0581
Observations 21 21 21 21 21
Từ bảng tính các thống kê mô tả, ta thấy độ lệch chuẩn lạm phát của nước
Anh là lớn nhất nghĩa là lạm phát của nước Anh biến thiên nhiều nhất.
KTNL07_07401067_LE DINH NGUYEN
c. Ươc lượng mô hình hồi qui: Lạm phát theo thời gian cho từng quốc
gia theo giả địn: (Lamphat)
i
=
1
+
2
(Thoigian)
i
+ U
i
Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết
luận tổng quát về tác động lạm phát tại từng quốc gia ? Vẽ đồ thị ?
Dependent Variable: ANH
Method: Least Squares
Date: 05/14/10 Time: 20:56
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 0.322944 1.612211 0.200311 0.8434
NAMMOHINH 0.822468 0.137908 5.963871 0.0000
R-squared 0.651809 Mean dependent var 8.547619
Adjusted R-squared 0.633483 S.D. dependent var 6.321046
S.E. of regression 3.826801 Akaike info criterion 5.612328
Sum squared resid 278.2437 Schwarz criterion 5.711806
Log likelihood -56.92945 F-statistic 35.56776
Durbin-Watson stat 1.141176 Prob(F-statistic) 0.000010
ANH = 0.3229437229 + 0.8224675325*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm
phát của nước Anh tăng thêm gần 0.823%.
KTNL07_07401067_LE DINH NGUYEN
0
5
10
15
20
25
0 4 8 12 16 20 24
NAMMOHINH
ANH
Đức
Dependent Variable: DUC
Method: Least Squares
Date: 05/14/10 Time: 20:57
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 3.593939 1.468324 2.447648 0.0243
NAMMOHINH 0.104416 0.125600 0.831332 0.4161
R-squared 0.035098 Mean dependent var 4.638095
Adjusted R-squared -0.015687 S.D. dependent var 3.458248
S.E. of regression 3.485266 Akaike info criterion 5.425359
Sum squared resid 230.7945 Schwarz criterion 5.524837
Log likelihood -54.96626 F-statistic 0.691114
Durbin-Watson stat 2.328057 Prob(F-statistic) 0.416112
DUC = 3.593939394 + 0.1044155844*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm
phát của nước Đức tăng thêm 0.104%.
KTNL07_07401067_LE DINH NGUYEN
0
4
8
12
16
20
0 4 8 12 16 20 24
NAMMOHINH
DUC
Nhật
Dependent Variable: NHAT
Method: Least Squares
Date: 05/14/10 Time: 21:00
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 5.215152 1.919155 2.717421 0.0137
NAMMOHINH 0.213247 0.164164 1.298984 0.2095
R-squared 0.081565 Mean dependent var 7.347619
Adjusted R-squared 0.033226 S.D. dependent var 4.632992
S.E. of regression 4.555374 Akaike info criterion 5.960885
Sum squared resid 394.2773 Schwarz criterion 6.060364
Log likelihood -60.58929 F-statistic 1.687359
Durbin-Watson stat 1.175297 Prob(F-statistic) 0.209493
NHAT = 5.215151515 + 0.2132467532*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm
phát của nước Nhật tăng thêm 0.213%.
KTNL07_07401067_LE DINH NGUYEN
0
4
8
12
16
20
24
28
0 4 8 12 16 20 24
NAMMOHINH
NHAT
pháp
Dependent Variable: PHAP
Method: Least Squares
Date: 05/14/10 Time: 21:00
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 1.853247 0.832871 2.225130 0.0384
NAMMOHINH 0.486104 0.071244 6.823112 0.0000
R-squared 0.710166 Mean dependent var 6.714286
Adjusted R-squared 0.694912 S.D. dependent var 3.579146
S.E. of regression 1.976933 Akaike info criterion 4.291363
Sum squared resid 74.25703 Schwarz criterion 4.390842
Log likelihood -43.05931 F-statistic 46.55486
Durbin-Watson stat 0.961869 Prob(F-statistic) 0.000002
PHAP = 1.853246753 + 0.4861038961*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm
phát của nước Pháp tăng thêm 0.486%.
KTNL07_07401067_LE DINH NGUYEN
2
4
6
8
10
12
14
16
0 4 8 12 16 20 24
NAMMOHINH
PHAP
Hoa Kì
Dependent Variable: US
Method: Least Squares
Date: 05/14/10 Time: 21:02
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C -0.164502 0.734285 -0.224030 0.8251
NAMMOHINH 0.528831 0.062811 8.419444 0.0000
R-squared 0.788624 Mean dependent var 5.123810
Adjusted R-squared 0.777499 S.D. dependent var 3.694984
S.E. of regression 1.742926 Akaike info criterion 4.039401
Sum squared resid 57.71804 Schwarz criterion 4.138879
Log likelihood -40.41371 F-statistic 70.88704
Durbin-Watson stat 1.131804 Prob(F-statistic) 0.000000
US = -0.1645021645 + 0.5288311688*NAMMOHINH
KTNL07_07401067_LE DINH NGUYEN
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm
phát của nước Hoa Kì tăng thêm gần 0.529%.
0
2
4
6
8
10
12
14
0 4 8 12 16 20 24
NAMMOHINH
US
d. Ươc lượng mô hình hồi qui: Lạm phát của từng quốc gia theo tỉ lệ lạm
phát của Mỹ
(Lamphat)
i
=
1
+
2
(lamphat-USA)
i
+ U
i
Đọc và đánh giá từng mô hình ước lượng? Đưa ra kết luận tổng
quát về tác động lạm phát tại từng quốc gia so với lạm phát của USA ?
Dependent Variable: ANH
Method: Least Squares
Date: 05/14/10 Time: 21:04
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 3.942998 1.029230 3.831018 0.0011
ANHLP 1.344882 0.199758 6.732569 0.0000
R-squared 0.704636 Mean dependent var 8.547619
Adjusted R-squared 0.689091 S.D. dependent var 6.321046
S.E. of regression 3.524566 Akaike info criterion 5.447784
Sum squared resid 236.0287 Schwarz criterion 5.547263
Log likelihood -55.20174 F-statistic 45.32748
Durbin-Watson stat 0.439091 Prob(F-statistic) 0.000002
KTNL07_07401067_LE DINH NGUYEN
ANH = 3.942998281 + 1.344882282*ANHLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng
thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Anh tăng thêm 1.345%
Dependent Variable: DUC
Method: Least Squares
Date: 05/14/10 Time: 21:05
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 4.860462 0.627216 7.749263 0.0000
DUCLP 0.457815 0.142581 3.210916 0.0046
R-squared 0.351757 Mean dependent var 4.638095
Adjusted R-squared 0.317639 S.D. dependent var 3.458248
S.E. of regression 2.856691 Akaike info criterion 5.027598
Sum squared resid 155.0530 Schwarz criterion 5.127076
Log likelihood -50.78978 F-statistic 10.30998
Durbin-Watson stat 1.202348 Prob(F-statistic) 0.004600
DUC = 4.860462352 + 0.4578146464*DUCLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng
thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Đức tăng thêm 0.46%
Dependent Variable: NHAT
Method: Least Squares
Date: 05/14/10 Time: 21:06
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 5.795073 0.866538 6.687612 0.0000
NHATLP 0.698147 0.177928 3.923768 0.0009
R-squared 0.447610 Mean dependent var 7.347619
Adjusted R-squared 0.418536 S.D. dependent var 4.632992
S.E. of regression 3.532831 Akaike info criterion 5.452469
Sum squared resid 237.1370 Schwarz criterion 5.551947
KTNL07_07401067_LE DINH NGUYEN
Log likelihood -55.25092 F-statistic 15.39596
Durbin-Watson stat 0.534453 Prob(F-statistic) 0.000912
NHAT = 5.795072835 + 0.6981471192*NHATLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng
thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Nhật tăng thêm khoảng
0.7%
Dependent Variable: PHAP
Method: Least Squares
Date: 05/14/10 Time: 21:06
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 6.251776 1.212106 5.157778 0.0001
PHAPLP 0.290800 0.574747 0.505961 0.6187
R-squared 0.013294 Mean dependent var 6.714286
Adjusted R-squared -0.038637 S.D. dependent var 3.579146
S.E. of regression 3.647635 Akaike info criterion 5.516428
Sum squared resid 252.7996 Schwarz criterion 5.615906
Log likelihood -55.92249 F-statistic 0.255996
Durbin-Watson stat 0.273299 Prob(F-statistic) 0.618704
PHAP = 6.25177575 + 0.2907996784*PHAPLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng
thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Pháp tăng thêm khoảng
0.29%
nhận xét chung: Từ kết quả cho thấy có mối quan hệ khá chặt chẽ giữa tỉ lệ
lạm phát của Anh với tỉ lệ lạm phát của Hoa Kì, tỉ lệ lạm phát của Anh chịu
ảnh hưởng nhiều bởi tỉ lệ lạm phát của Hoa Kì, còn tỉ lệ lạm phát của Nhật
và Đức, Pháp ít chịu ảnh hưởng bởi tỉ lệ lạm phát của Hoa Kì.
Bài tập 2 :
Nhà phân tích học viện nghiên cứu Anh ngữ đã thu thập dữ liệu từ 8
sinh viên khác nhau trong một lớp . Bảng dữ liệu gốc được trình bài như
sau :
KTNL07_07401067_LE DINH NGUYEN
Sinh
viên
Điểm
tóan
Điểm khoa
học
điểm Anh
Văn
1 13.5 9.9 13.3
2 13.7 6.8 10
3 7 5.5 8.9
4 7.4 5.7 2.4
5 13.2 10.3 8.2
6 7.3 1.8 6.3
7 5.2 5.2 7.7
8 8.4 6.9 2.9
Người ta muốn xem xét xem là có mối quan hệ nào giữa điểm môn
Anh văn và điểm môn Khoa học của sinh viên . Cụ thể là chúng ta có thể
dựa vào điểm môn Khoa học và của sinh viên có thể dự đóan điểm của môn
Anh văn hay không - Cũng như dựa vào điểm môn Tóan của sinh viên có
thể dự đóan điểm của môn Anh văn hay không ?
Cho từng cặp môn học tương ứng , anh chị :
a. Ươc lượng mô hình hồi qui tuyến tính cho tập dữ liệu nói trên? - Đọc
và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng
quát ?
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 05/14/10 Time: 21:13
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C 3.762656 3.422463 1.099400 0.3137
DIEMKHOAHOC 0.568114 0.489567 1.160442 0.2900
R-squared 0.183299 Mean dependent var 7.462500
Adjusted R-squared 0.047182 S.D. dependent var 3.605130
S.E. of regression 3.519055 Akaike info criterion 5.566580
Sum squared resid 74.30247 Schwarz criterion 5.586440
Log likelihood -20.26632 F-statistic 1.346627
Durbin-Watson stat 1.325655 Prob(F-statistic) 0.289950
DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC
KTNL07_07401067_LE DINH NGUYEN
Mô hình trên đây thể hiện mối quan hệ thuận giữa điểm Anh Văn và điểm
Khoa Học. Cụ thể là khi điểm môn Khoa Học tăng thêm 1điểm thì về trung
bình điểm môn Anh Văn tăng thêm 0.57 điểm.
Khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn
là 3.76 điểm.
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 05/14/10 Time: 21:13
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C 1.691257 3.486802 0.485045 0.6448
DIEMTOAN 0.609907 0.348935 1.747907 0.1311
R-squared 0.337396 Mean dependent var 7.462500
Adjusted R-squared 0.226962 S.D. dependent var 3.605130
S.E. of regression 3.169724 Akaike info criterion 5.357484
Sum squared resid 60.28290 Schwarz criterion 5.377344
Log likelihood -19.42994 F-statistic 3.055180
Durbin-Watson stat 2.104833 Prob(F-statistic) 0.131069
DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN
Mô hình trên cũng thể hiện mối quan hệ thuận giữa điểm Anh Văn và điểm
Toán. Cụ thể là khi điểm môn Toán tăng thêm 1 điểm thì về trung bình điểm
môn Anh Văn tăng thêm 0.61 điểm.
Khi điểm môn Toán bằng không thì về trung bình điểm môn Anh Văn là
1.69 điểm.
Nhận xét tổng quát: Do hệ số tương quan của 2 mô hình là rất thấp
(R
2
<0.5) cho thấy mức độ phù hợp của 2 mô hình là rất thấp. Các biến đưa
vào mô hình hầu như không có tác động đến biến phụ thuôc, mô hình đưa ra
không có ý nghĩa nhiều về mặt thống kê. Hay điểm môn Khoa Học hoặc
môn Toán không có ảnh hưởng đến điểm của môn Anh văn.
b. Giải thích ý nghĩa của hệ số tương quan ? Giải thích ý nghĩa của hệ số
độ dốc và tung độ gốc của phương trình hồi qui ?
ý nghĩa của hệ số tương quan:
KTNL07_07401067_LE DINH NGUYEN
R
2
đo lường mối tương quan giữa biến phụ thuộc (điểm Anh Văn) với biến
độc lập (điểm Khoa Học, điểm Toán). R
2
ở 2 mô hình trên đều rất nhỏ điều
đó chứng tỏ điểm của môn Anh Văn không phụ thuộc vào môn khoa học hay
môn toán.
Ý nghĩa của hệ số độ dốc v à tung độ gốc:
DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC
+ b1= 3.762656345: khi điểm môn Khoa Học bằng không thì về trung bình
điểm môn Anh Văn bằng 3.76
+ b2 = 0.5681141889 : khi điểm môn Khoa Học tăng thêm 1 điểm thì về
trung bình điểm môn Anh Văn tăng thêm 0.57 điểm
DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN
+ b1= 1.691256533: khi điểm môn Khoa Học bằng không thì về trung bình
điểm môn Anh Văn bằng 1.69
+ b2 = 0.6099068394: khi điểm môn Khoa Học tăng thêm 1 điểm thì về
trung bình điểm môn Anh Văn tăng thêm 0.61 điểm
Bài tập 3:
Ta có tập dữ liệu sau bao gồm 64 quan sát của các quốc gia với các biến số
được giải thích bên dưới của bảng số liệu :
obs CM FLR PGNP TFR obs CM FLR PGNP TFR
1 128 37 1870 6.66 33 142 50 8640 7.17
2 204 22 130 6.15 34 104 62 350 6.6
3 202 16 310 7 35 287 31 230 7
4 197 65 570 6.25 36 41 66 1620 3.91
5 96 76 2050 3.81 37 312 11 190 6.7
6 209 26 200 6.44 38 77 88 2090 4.2
7 170 45 670 6.19 39 142 22 900 5.43
8 240 29 300 5.89 40 262 22 230 6.5
9 241 11 120 5.89 41 215 12 140 6.25
10 55 55 290 2.36 42 246 9 330 7.1
11 75 87 1180 3.93 43 191 31 1010 7.1
KTNL07_07401067_LE DINH NGUYEN
12 129 55 900 5.99 44 182 19 300 7
13 24 93 1730 3.5 45 37 88 1730 3.46
14 165 31 1150 7.41 46 103 35 780 5.66
15 94 77 1160 4.21 47 67 85 1300 4.82
16 96 80 1270 5 48 143 78 930 5
17 148 30 580 5.27 49 83 85 690 4.74
18 98 69 660 5.21 50 223 33 200 8.49
19 161 43 420 6.5 51 240 19 450 6.5
20 118 47 1080 6.12 52 312 21 280 6.5
21 269 17 290 6.19 53 12 79 4430 1.69
22 189 35 270 5.05 54 52 83 270 3.25
23 126 58 560 6.16 55 79 43 1340 7.17
24 12 81 4240 1.8 56 61 88 670 3.52
25 167 29 240 4.75 57 168 28 410 6.09
26 135 65 430 4.1 58 28 95 4370 2.86
27 107 87 3020 6.66 59 121 41 1310 4.88
28 72 63 1420 7.28 60 115 62 1470 3.89
29 128 49 420 8.12 61 186 45 300 6.9
30 27 63 19830 5.23 62 47 85 3630 4.1
31 152 84 420 5.79 63 178 45 220 6.09
32 224 23 530 6.5 64 142 67 560 7.2
Trong đó: - CM : Tỉ lệ tử vong của trẽ sơ sinh (%)
- FLR : Tỉ lệ biết chử của dân số (%)
- PGNP : GNP bình quân đầu người (Đô la)
- TFR : Tỉ lệ sinh chung của dân số (%)
1. Hãy giải thích mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các
biến khác đã cho, bằng những lập luận mang tính cách kinh tế và lô gic ? -
Sau đó vẽ biểu đồ phân tán giữa CM và FLR; CM và PGNP; CM và TFR.
Rồi từ đó đối chiếu đồ thị với các giải thích của anh chị lúc ban đầu ( nêu lên
sự phù hợp và không phù hợp với lời giải thích ban đầu)
Trả lời:
Mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến khác đã cho:
+ Tỉ lệ biết chữ của dân số (FLR): đây là mối quan hệ tỉ lệ nghịch. Tỉ lệ
biết chữ của dân số càng cao thì tỉ lệ tử vong của trẻ sơ sinh càng thấp. Khi
dân trí cao thì người dân sẽ tiếp thu được nhiều tri thức hơn trong việc chăm
sóc, bảo vệ sức khỏe cho trẻ sơ sinh, dân trí cao thì con người sẽ phá bỏ
những phong tục tập quán lạc hậu, những điều lệ cổ hũ gây nguy hiểm đến
tính mạng của trẻ sơ sinh, từ đó làm giảm tỉ lệ tử vong ở trẻ sơ sinh.
+ GNP bình quân đầu người (PGNP): đây cũng là mối quan hệ tỉ lệ nghịch.
GNP bình quân đầu người càng cao thì người dân sẽ có điều kiện hơn trong
KTNL07_07401067_LE DINH NGUYEN
việc chăm sóc, bảo vệ sức khỏe của trẻ sơ sinh. Khi thu nhập của người dân
được tăng lên thì người ta sẽ quan tâm hơn đến vấn đề dinh dưỡng cho trẻ sơ
sinh, họ sẽ có điều kiện hơn để đi khám chữa bệnh…. từ đó làm giảm tỉ lệ tử
vong của trẻ sơ sinh.
+ Tỉ lệ sinh chung của dân số (TFR): đây là mối quan hệ tỉ lệ thuận. Khi tỉ lệ
sinh chung càng cao thì số trẻ sơ sinh sinh ra càng nhiều, đây là một vấn đề
khó khăn cho công tác chăm sóc và bảo vệ sức khỏe cho trẻ sơ sinh. Từ đó
có thể làm tăng tỉ lệ tử vong ở trẻ sơ sinh.
0
40
80
120
160
200
240
280
320
0 20 40 60 80 100
FLR
CM
Qua đồ thị cho thấy tỉ lệ biết chữ của dân số càng cao thì tỉ lệ tử vong của trẻ
sơ sinh càng thấp và ngược lại.
Tuy nhiên có chỗ chưa phù hợp với nhận xét ở chỗ: có một số trường hợp,
khi ti lệ biết chữ của dân số không phải là cao nhất nhưng tỉ lệ tử vong của
trẻ sơ sinh là thấp nhất.
KTNL07_07401067_LE DINH NGUYEN
0
40
80
120
160
200
240
280
320
0 4000 8000 12000 16000 20000
PGNP
CM
Qua đồ thị cho thấy GNP bình quân đầu người càng cao thì tỉ lệ tử vong
càng thấp. Mức độ phân tán của GNP bình quân đầu người thấp còn khá cao,
điều này chứng tỏ GNP bình quân đầu người ở đây còn thấp và tỉ lệ tử vong
của trẻ sơ sinh ở đây còn cao. Đây hoàn toàn phù hợp với nhận xét ban đầu
0
40
80
120
160
200
240
280
320
1 2 3 4 5 6 7 8 9
TFR
CM
KTNL07_07401067_LE DINH NGUYEN
Qua đồ thị ta thấy tỉ lệ sinh chung của dân số càng cao thì tỉ lệ tử vong
của trẻ sơ sinh càng cao. Tuy nhiên cũng có một số trường hợp, tỉ lệ sinh
chung cao nhưng tỉ lệ tử vong của trẻ sơ sinh vẫn thấp, điều này cho thấy:
mặc dù tỉ lệ sinh cao nhưng công tác chăm sóc và bảo vệ sức khỏe tốt hạn
chế được tỉ lệ tử vong ở trẻ sơ sinh.
2. Anh chị hãy xây dựng mô hình hồi qui đơn cho CM va PGNP .
Nhận xét các thông tin chính từ mô hình nầy như ý nghĩa thống kê của hệ số
hồi qui, hệ số xác định R
2
.
Dependent Variable: CM
Method: Least Squares
Date: 05/14/10 Time: 21:15
Sample: 1 64
Included observations: 64
Variable Coefficient Std. Error t-Statistic Prob.
C 157.4244 9.845583 15.98935 0.0000
PGNP -0.011364 0.003233 -3.515661 0.0008
R-squared 0.166217 Mean dependent var 141.5000
Adjusted R-squared 0.152769 S.D. dependent var 75.97807
S.E. of regression 69.93413 Akaike info criterion 11.36374
Sum squared resid 303228.5 Schwarz criterion 11.43120
Log likelihood -361.6396 F-statistic 12.35987
Durbin-Watson stat 1.931458 Prob(F-statistic) 0.000826
Mô hình hồi qui đơn:
CM = 157.4244406 - 0.01136445358*PGNP
Qua phương trình hồi qui ta thấy mối quan hệ giữa tỉ lệ tử vong của trẻ sơ
sinh và GNP bình quân đầu người là mối quan hệ tỉ lệ nghịch.
+ Trong điều kiện GNP bình quân đầu người không đổi, về trung bình tỉ lệ
tử vong của trẻ sơ sinh là 157.43%.
+ Khi GNP bình quân đầu người tăng thêm 1 USD thì về trung bình tỉ lệ tử
vong của trẻ sơ sinh giảm 0.114%.
+ R
2
= 0.166217 cho thấy mô hình đưa ra không phù hợp, không có ý nghĩa
thống kê, biến đưa vào không giải thích nhiều về biến phụ thuộc, hay nói
cách khác tỉ lệ tử vong của trẻ sơ sinh ít chịu ảnh hưởng bởi GNP bình quân
đầu người mà phụ thuộc vào nhiều nhân tố khác nữa.
KTNL07_07401067_LE DINH NGUYEN
3. Hãy xây dựng mô hình hồi qui bội cho quan hệ CM; FLR và
PGNP. Nhận xét thông tin chính từ mô hình nầy , như ý nghĩa thống kê của
hệ số , hệ số xác định R
2
.
Dependent Variable: CM
Method: Least Squares
Date: 05/14/10 Time: 21:16
Sample: 1 64
Included observations: 64
Variable Coefficient Std. Error t-Statistic Prob.
C 263.6416 11.59318 22.74109 0.0000
FLR -2.231586 0.209947 -10.62927 0.0000
PGNP -0.005647 0.002003 -2.818703 0.0065
R-squared 0.707665 Mean dependent var 141.5000
Adjusted R-squared 0.698081 S.D. dependent var 75.97807
S.E. of regression 41.74780 Akaike info criterion 10.34691
Sum squared resid 106315.6 Schwarz criterion 10.44811
Log likelihood -328.1012 F-statistic 73.83254
Durbin-Watson stat 2.186159 Prob(F-statistic) 0.000000
CM = 263.6415856 - 2.231585732*FLR - 0.005646594817*PGNP
Phương trình hồi qui cho thấy:
+ Trong điều kiện GNP bình quân đầu người và tỉ lệ biết chữ của dân số
không đổi thì về trung bình tỉ lệ tử vong của trẻ sơ sinh là 263.64%
+ Trong điều kiện GNP bình quân đầu người không đổi, khi tỉ lệ biết chữ
của dân số tăng 1% thì về trung bình tỉ lệ tử vong của trẻ sơ sinh giảm
2.23%.
+ Trong điều kiện tỉ lệ biết chữ của dân số không đổi, khi GNP bình quân
đầu người tăng thêm 1 USD thì về trung bình tỉ lệ tử vong của trẻ sơ sinh
giảm 0.0056%.
+ R
2
= 0.707665 cho thấy mức độ phù hợp của mô hình là khá cao. Các biến
đưa vào mô hình đã giải thích được phần lớn biến phụ thuộc, hay nói cách
khác tỉ lệ tử vong của trẻ sơ sinh chịu phần lớn vào tỉ lệ biết chữ của dân số
và GNP bình quân đầu người.
4 . So sánh mô hình đơn và mô hình bội anh chị có nhận xét gì về hệ
số hồi qui tìm được của biến PGNP, nếu phải chọn hệ số PGNP của mô hình
nào để giải thích tác động của PGNP lên CM ? Tại sao?
KTNL07_07401067_LE DINH NGUYEN
So sánh 2 mô hình hồi qui cho thấy: hệ số hồi qui của biến PGNP của
phương trình hồi qui đơn nhỏ hơn hệ số hồi qui của phương trình hồi qui
bội. Điều này cho thấy hệ số hồi qui của biến PGNP của phương trình hồi
qui bội giải thích biến CM rõ hơn của phương trình hồi qui đơn.
nếu phải chọn thì ta nên chọn hệ số PGNP của mô hình hồi qui bội để giải
thích tác động của PGNP lên CM. Vì ở mô hình hồi qui bội hệ số của biến
PGNP giải thích rõ hơn tác động của biến PGNP lên CM , R
2
lớn cho thấy
mô hình phù hợp hơn và có ý nghĩa thống kê.
5. Hồi qui CM cho tất cả các biến trong tập dữ liệu ? Nhận xét va cho
ý kiến của anh chị?
Dependent Variable: CM
Method: Least Squares
Date: 05/14/10 Time: 21:17
Sample: 1 64
Included observations: 64
Variable Coefficient Std. Error t-Statistic Prob.
C 168.3067 32.89165 5.117003 0.0000
FLR -1.768029 0.248017 -7.128663 0.0000
PGNP -0.005511 0.001878 -2.934275 0.0047
TFR 12.86864 4.190533 3.070883 0.0032
R-squared 0.747372 Mean dependent var 141.5000
Adjusted R-squared 0.734740 S.D. dependent var 75.97807
S.E. of regression 39.13127 Akaike info criterion 10.23218
Sum squared resid 91875.38 Schwarz criterion 10.36711
Log likelihood -323.4298 F-statistic 59.16767
Durbin-Watson stat 2.170318 Prob(F-statistic) 0.000000
CM = 168.3066897 - 1.768029221*FLR - 0.00551122506*PGNP +
12.86863633*TFR
Nhận xét:
Qua phương trình hồi qui cho thấy tất cả các biến đưa vào (FLR, PGNP,
TFR) đều giải thích được cho biến phụ thuộc (CM).
Hệ số hồi qui của các biến trong mô hình này lớn hơn các mô hình trên,
chứng tỏ các biến đưa ra ở mô hình này giải thích rõ biến phụ thuộc hơn so
với các mô hình trên.
R
2
= 0.747372 cao hơn các mô hình trên, cho thấy mức độ phù hợp này khá
cao, có ý nghĩa thống kê hơn cả các mô hình trên vì CM không chịu tác động
KTNL07_07401067_LE DINH NGUYEN
riêng lẽ bởi bất kì yếu tố nào mà CM chịu tác động cộng gộp bởi các nhân
tố: FLR, PGNP, TFR và nhiều nhân tố khác.
+ Mô hình này thể hiện giải thích rõ nhất tác động của các biến đến biến
phụ thuộc cho nên mô hình này nên lựa chọn là mô hình giải thích nguyên
nhân biến động của tỉ lệ tử vong của trẻ sơ sinh
Bài 4 :Ta có tập dữ liệu sau: Baitap 4 – cau 2 - luan
obs AGE
D
ALC
C
EDU1 EDU2 HEX
C
INCC MORT PHYS POV TOB
C
URB
1 0.122 1.9 0.565 0.122 1620 1067
3
934.9 142 0.189 114.5 0.675
2 0.034 3.86 0.825 0.211 1667 1818
7
396.2 127 0.107 128.9 0.417
3 0.123 3.08 0.724 0.174 1473 1279
5
771.5 184 0.132 107.1 0.764
4 0.149 1.78 0.555 0.108 1552 1047
6
1022.8 136 0.19 125.8 0.397
5 0.106 3.19 0.735 0.196 2069 1606
5
766 235 0.114 102.8 0.957
6 0.09 3.09 0.786 0.23 1664 1481
2
625.7 196 0.101 112.4 0.817
7 0.133 2.8 0.703 0.207 1945 1808
9
888.4 275 0.08 111 0.926
8 0.114 3.17 0.686 0.175 1691 1427
2
880.2 185 0.119 144.5 0.659
9 0.122 5.34 0.671 0.275 3872 1816
8
1120.5 552 0.186 122.1 1
10 0.177 3.12 0.667 0.149 1886 1374
2
1065.6 191 0.135 124.2 0.908
11 0.1 2.48 0.564 0.146 1755 1254
3
814.3 159 0.166 128.8 0.648
12 0.097 2.97 0.738 0.203 1693 1381
4
554.2 212 0.099 69.8 0.763
13 0.112 2.43 0.737 0.158 1288 11120 708.7 118 0.126 100.7 0.2
14 0.12 2.77 0.665 0.162 1864 1473
8
886.5 199 0.11 121.6 0.825
15 0.119 2.19 0.664 0.125 1625 1244
6
876.3 142 0.097 135.3 0.681
16 0.145 2.09 0.715 0.139 1758 1259
4
966.1 136 0.101 109.4 0.434
17 0.134 1.95 0.733 0.17 1820 1377
5
900.3 162 0.101 115.7 0.534
18 0.12 1.85 0.531 0.111 1404 1082
4
935 149 0.176 182.4 0.461
19 0.101 2.63 0.577 0.139 1716 11274 825.4 173 0.186 125 0.692
20 0.133 2.57 0.687 0.144 1641 11887 979.4 165 0.13 127.9 0.361
KTNL07_07401067_LE DINH NGUYEN
21 0.106 2.84 0.674 0.204 1732 1586
4
833.6 303 0.098 121.9 0.929
22 0.136 3.04 0.722 0.2 2289 1638
0
955.4 300 0.096 117.2 0.906
23 0.114 2.6 0.68 0.143 1996 1360
8
866.2 174 0.104 126.6 0.799
24 0.125 2.68 0.731 0.174 1888 1408
7
830.2 203 0.095 113 0.666
25 0.12 2.06 0.548 0.123 1519 9187 944.6 117 0.239 115.3 0.305
26 0.137 2.27 0.635 0.139 1858 1324
4
1000.4 179 0.122 129.2 0.66
27 0.121 2.95 0.744 0.175 1494 1097
4
815 136 0.123 103.6 0.242
28 0.136 2.41 0.734 0.155 1766 1328
1
928.5 156 0.107 105.1 0.476
29 0.103 5.19 0.755 0.144 1946 1448
8
772.3 155 0.087 146.7 0.826
30 0.116 4.91 0.723 0.182 1417 1496
4
849.1 179 0.085 201.1 0.563
31 0.129 2.83 0.674 0.183 1702 17211 940.7 219 0.095 116.9 1
32 0.098 2.75 0.689 0.176 1385 1091
4
672.8 161 0.176 88 0.489
33 0.128 2.67 0.663 0.179 2412 1605
0
969.9 287 0.134 115.9 0.912
34 0.115 2.13 0.548 0.132 1380 11617 846.3 168 0.148 156.3 0.554
35 0.13 2.55 0.664 0.148 1872 1205
2
821.6 157 0.126 103.2 0.384
36 0.123 2.26 0.67 0.137 1833 1322
8
920.6 182 0.103 126.7 0.789
37 0.124 1.91 0.66 0.151 1644 1223
2
900.8 138 0.134 124.2 0.588
38 0.134 2.63 0.756 0.179 1654 1262
2
889.7 189 0.107 118.6 0.677
39 0.146 2.25 0.647 0.136 1894 1343
7
1043.9 214 0.105 115.8 0.848
40 0.146 2.92 0.611 0.154 2054 1390
6
997.6 223 0.103 133.4 0.926
41 0.105 2.5 0.537 0.134 1341 1058
6
812.6 146 0.166 125.4 0.605
42 0.139 2.33 0.679 0.14 1617 11161 932.6 130 0.169 104.4 0.291
43 0.123 1.95 0.562 0.126 1671 11243 906.8 176 0.165 128.7 0.671
44 0.095 2.82 0.626 0.169 1577 1348
3
722.2 160 0.147 115.9 0.813
45 0.08 1.53 0.8 0.199 1203 1049
3
550.1 171 0.103 66.5 0.774
KTNL07_07401067_LE DINH NGUYEN
46 0.119 3.12 0.71 0.19 1481 12117 871.4 232 0.121 144.5 0.232
47 0.105 2.55 0.624 0.191 1498 1454
2
794.1 194 0.118 134.6 0.722
48 0.117 2.71 0.776 0.19 1660 1387
6
782.8 196 0.098 96.5 0.816
49 0.136 1.68 0.56 0.104 1542 1019
3
1003.8 156 0.15 109.1 0.365
50 0.13 3.19 0.696 0.148 1862 1315
4
868.8 172 0.087 107 0.665
51 0.084 2.86 0.779 0.172 1453 1322
3
642.9 125 0.079 125.7 0.292
Trong đó : - MORT : Tỉ lệ tử vong chung trên 100.000 dân số
- INCC : Thu nhập đầu người tính bằng USD
- POV : Tỉ lệ của những người dân trong nước sống dưới mức
nghèo khó
- EDU1 : Tỉ lệ dân số đã học trung học
- EDU2 : Tỉ lệ dân số đã học trung học và đại học.
- ALCC : Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người.
- TOBC : Tiêu dùng thuốc lá đầu người tíng bằng bao
- HEXC : Chi tiêu y tế bình quân đầu người (USD)
- URB : Tỉ lệ dân số sống tại các khu vực thành thị
- AGED : Tỉ lệ dân số có độ tuồi trên 65
- PHYS : Các cán bộ y tế trên 1000.000 dân
Yêu cầu :
1. Chọn biến Mort là biến phụ thuộc – Đối với từng biến giải thích,
hãy lý giải tại sao nó có thể có tác động lên tỉ lệ tử vong tổng thể
và chỉ ra hướng tác động nầy?
+ Đối với INCC: thu nhập đầu người càng thấp thì tỉ lệ tử vong chung trên
100.000 dân số càng cao, do thu nhập thấp thì người dân có ít điều kiện hơn
trong việc chăm sóc sức khỏe cho bản thân và gia đình về dinh dưỡng, y
tế… từ dó có thể làm tăng khả năng tỉ lệ tử vong.
+ POV: Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó
càng cao thì việc chăm lo của người dân đến dinh dưỡng và tiếp cận đến các
dịch vụ y tế càng thấp, làm cho tỉ lệ suy dinh dưỡng cao, nếu người dân
mắc các bệnh tật thì cũng ít có khả năng chạy chữa, từ đó có thể làm tỉ lệ tử
vong chung trên 100.000 dân số càng cao,
KTNL07_07401067_LE DINH NGUYEN
+ EDU1 và EDU2: Tỉ lệ dân số đã học trung học và tỉ lệ dân số đã học trung
học và đại học càng cao cho thấy trình độ dân trí của người dân càng cao,
dân trí cao thì người dân mới tiếp thu được những kiến thức tiến bộ về sức
khỏe, y tế, khoa học….từ đó có thể giảm bớt được tỉ lệ tử vong chung trên
100.000 dân số do họ có thể bỏ nhưng hủ thục lạc hậu, những cách chữa
bệnh không khoa học… có thể ảnh hưởng đến sức khỏe người dân.
nhưng EDU2 tác động mạnh hơn.
+ ALCC v à TOBC : khi tiêu dùng cồn ( rượu) tính bằng lít trên đầu người
và tiêu dùng thuốc lá đầu người càng cao thì người dân sẽ dễ bị mắc các
bệnh dạ dày, ung thư phổi…. nhiều từ đó tỉ lệ tử vong chung trên 100.000
dân số càng cao
HEXC : Chi tiêu y tế bình quân đầu người càng cao thì, Chi tiêu y tế bình
quân đầu người càng cao nghĩa là người dân sẽ chi cho khám chữa bệnh cao,
từ đó có thể phát hiện ra bệnh sớm, phòng ngừa và chữa trị bệnh kịp thời dẫn
đến tỉ lệ tử vong chung trên 100.000 dân số càng thấp
URB : Tỉ lệ dân số sống tại các khu vực thành thị cao nghĩa là nhiều người
sống ở khu vực thành thị, nơi có đầy đủ cơ sở vật chất hạ tầng, có đủ lực
lượng y tế khám chữa bệnh cho người dân từ đó có thể làm giảm tỉ lệ tử
vong chung trên 100.000 dân số
AGED : Tỉ lệ dân số có độ tuồi trên 65càng cao, tức là số người cao tuổi
cao dẫn đến tỉ lệ tử vong chung trên 100.000 dân số cao do người già thì sức
khỏe yếu, dễ mắc bệnh….
PHYS : Các cán bộ y tế trên 1000.000 dân càng cao nghĩa là số người được
1 cán bộ y tế chăm sóc càng ít,khi mà 1 cán bộ y tế chỉ chăm sóc ít bệnh
nhân hơn thì người cán bộ y tế đó sẽ dồn hết tâm sức của mình cho người
bệnh đó để mà khám chữa bệnh, từ đó có thể làm giảm tỉ lệ tử vong chung
trên 100.000 dân số
2. Ước lượng mô hình hồi qui đa biến bao gồm tất cả những biến giải
thích đang có? Thực hiện kiểm định cho mức ý nghĩa tổng quát –
Nhận xét sự thích hợp ? Kiểm định mức ý nghĩa đối với từng hệ số
hồi qui ở mức = 10% và xác định các biến mà anh chị có thể muốn
bỏ qua.
Dependent Variable: MORT
Method: Least Squares
Date: 05/14/10 Time: 21:19
Sample: 1 51
Included observations: 51
Variable Coefficient Std. Error t-Statistic Prob.
KTNL07_07401067_LE DINH NGUYEN
C 46.59555 168.2097 0.277009 0.7832
AGED 4126.895 322.3451 12.80272 0.0000
ALCC -25.91511 11.09681 -2.335366 0.0246
EDU1 68.77913 196.8405 0.349415 0.7286
EDU2 -1180.217 548.8868 -2.150201 0.0376
HEXC 0.073889 0.034127 2.165088 0.0364
INCC 0.004511 0.005817 0.775551 0.4426
PHYS 0.640384 0.263636 2.429044 0.0197
POV 549.8647 308.5540 1.782069 0.0823
TOBC 1.470480 0.353504 4.159732 0.0002
URB -32.45556 35.64423 -0.910542 0.3680
R-squared 0.948570 Mean dependent var 855.0059
Adjusted R-squared 0.935713 S.D. dependent var 137.9660
S.E. of regression 34.98117 Akaike info criterion 10.13592
Sum squared resid 48947.30 Schwarz criterion 10.55259
Log likelihood -247.4660 F-statistic 73.77592
Durbin-Watson stat 1.597995 Prob(F-statistic) 0.000000
MORT = 46.59554973 + 4126.895059*AGED - 25.91510605*ALCC +
68.7791315*EDU1 - 1180.217201*EDU2 + 0.07388858751*HEXC +
0.00451136983*INCC + 0.6403836367*PHYS + 549.8646857*POV +
1.470480259*TOBC - 32.45555872*URB
Kiểm định cho mức ý nghĩa tổng quát
Giả thiết: Ho: R
2
= 0
H1: R
2
> 0
F
R
= 73.77592
Với mức ý nghĩa 10%, tra bảng phân phối Fisher: F > F
0.05
(9,41) bác
bỏ giả thiết Ho, tức là mô hình có ý nghĩa thống kê ở mức 10%.
Qua mô hình ta thấy: R
2
= 0.948570 mức độ phù hợp của mô hình này
cao, mô hình có ý nghĩa thống kê.
Kiểm định mức ý nghĩa đối với từng hệ số hồi qui:
Giả thiết: Ho: b
i
= 0
H1: b
i
# 0
Với mức ý nghĩa 10%, tra bảng phân phối student: T
0.05
(40) = 1.684
Hệ số hồi qui Trị thống kê So sánh Kết luận
b2 12.80272 T > T
0.05
(40) Bác bỏ Ho
b3 -2.335366 T > T
0.05
(40) Bác bỏ Ho
b4 0.349415 T < T
0.05
(40) Chấp nhận Ho