Tải bản đầy đủ (.pdf) (16 trang)

BÁO CÁO KINH TẾ LƯỢNG: PHÂN TÍCH ẢNH HƯỞNG CỦA CÁC NHÂN TỐ ĐẾN TỈ LỆ TỬ VONG Ở TRẺ SƠ SINH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.23 MB, 16 trang )

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
 

PHÂN TÍCH ẢNH HƯỞNG CỦA CÁC NHÂN TỐ
ĐẾN TỈ LỆ TỬ VONG Ở TRẺ SƠ SINH
Báo cáo Kinh tế lượng

Hà Nội, tháng 04 năm 2014


Nhóm 10.1 – Bộ số liệu 58

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
 

BÁO CÁO KINH TẾ LƯỢNG
Bộ số liệu 58 – LOWBRTH

PHÂN TÍCH CÁC NHÂN TỐ ẢNH HƯỞNG ĐẾN TỈ LỆ
TỬ VONG Ở TRẺ SƠ SINH

Họ và tên

GV hướng dẫn

: Tiến sỹ Đinh Thị Thanh Bình

Lớp

: KTE309.11


MSV

Nguyễn Đình Khương

1213310052

Hoàng Khánh Lam

1211110330

Nguyễn Thị Liên

1213320083

-

Nhiệm vụ
Chạy hồi quy (II.1, II.2)
Phân tích kết quả hồi quy (II.4)
Làm phần mô tả (I)
Kiểm định F đa ràng buộc tuyến tính và hồi quy đơn
biến (II.5.b và II.5.c)
Kiểm định phương sai sai số thay đổi (III.1) và đa
cộng tuyến (III.2).
Viết lời mở đầu, Tổng hợp Báo cáo
Phân tích tương quan giữa các biến độc lập (II.3)
Kiểm định sự phù hợp của mô hình (II.5.a)
Kiểm định phân phối chuẩn (III.3)
Viết Kết luận


1


Nhóm 10.1 – Bộ số liệu 58

BÁO CÁO KINH TẾ LƯỢNG
Bộ số liệu 58 – LOWBRTH
- Nội dung: Phân tích ảnh hưởng của các nhân tố đến tỉ lệ tử vong ở trẻ sơ sinh.
Đây là một vấn đề nhận được nhiều sự quan tâm ở nhiều quốc gia trên thế giới. Việc
nghiên cứu để giảm tỉ lệ tử vong ở trẻ sơ sinh mang tính xã hội và nhân văn sâu sắc. Nó
không chỉ giúp giảm nỗi đau cho các gia đình mà còn giảm gánh nặng cho xã hội, và quan
trọng hơn cả là cải thiện chất lượng dân số; góp phần cải thiện số lượng và chất lượng nguồn
lao động.
Trong báo cáo thường niên về tình trạng sức khỏe bà mẹ và trẻ sơ sinh State of World
Mothers ra số 14 của tổ chức. Save the Children cho biết tỷ lệ từ vong trẻ sơ sinh tại Việt
Nam đã giảm 48% từ năm 1990 đến 2011. Việt Nam xếp thứ 86 trong bảng xếp hạng về
những nơi tốt nhất cho các bà mẹ. Việt Nam đang trong tiến trình đạt được mục tiêu thiên
niên kỷ về giảm tỷ lệ tử vong ở bà mẹ và trẻ em. Chính vì vậy, việc nghiên cứu về Tỉ lệ tử
vong ở trẻ sơ sinh cùng các nhân tố ảnh hưởng để tìm ra biện pháp hữu hiệu giảm thiểu tỉ lệ
này càng cần thiết hơn bao giờ hết.
- Các biến được chọn:
+ infmort
+ lowbrth
+ popul
+ pcinc
+ afdcpay
+ physicpc
- Bài cáo cáo gồm 4 phần:
+ Phần I: Mô tả biến với lệnh DES, TAB, SUM
+ Phần II: Phân tích hồi quy và tương quan

1. Mô hình tổng quát
2. Quan hệ tương quan giữa các biến độc lập (Dùng lệnh Corr)
3. Chạy hồi quy
4. Phân tích kết quả chạy hồi quy
5. Một số kiểm định F
+ Phần III: Kiểm tra khuyết tật của mô hình
1. Kiểm định phương sai sai số thay đổi
2. Kiểm định đa cộng tuyến (bằng phương pháp khác ngoài lệnh Corr)
3. Kiểm định phân phối chuẩn của nhiễu
+ Kết luận

I. Phần I – MÔ TẢ BIẾN
1. Sử dụng lệnh DES
- Thông tin quan trọng nhất thu được khi chạy lệnh Des đó là ý nghĩa của các biến (Variable
label)

2


Nhóm 10.1 – Bộ số liệu 58
des infmort lowbrth popul pcinc afdcpay physicpc
Variable name
infmort
lowbrth
popul
pcinc
afdcpay
physicpc

Storage

type

Display
format

float
float
int
int
int
float

%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g

Value
label

Variable label
infant mortality rate
perc births low weight
population, 1000s
per capita income
avg monthly AFDC payment
physicians per capita


Bảng I.1. Kết quả chạy lệnh mô tả DES

-

Sử dụng lệnh des giúp chúng ta hiểu rõ ý nghĩa các biến. Theo kết quả trên thì:
Biến infmort: Tỉ lệ trẻ sơ sinh tử vong.
Biến lowbrth: Tỉ lệ trẻ (sơ sinh) sinh thiếu cân.
Biến popul: Dân số (nghìn người).
Biến pcinc: Thu nhập bình quân trên đầu người.
Biến afdcpay: Trợ cấp trung bình hàng tháng từ AFDC (tổ chức hỗ trợ cho gia đình có con
nhỏ còn phụ thuộc)
Biến physicpc: tỷ lệ bác sĩ/ người dân.

2. Sử dụng lệnh SUM
- Kết quả của lệnh Sum cho ta biết số quan sát (Obs), giá trị trung bình (Mean), độ lệch chuẩn
(Std. Dev.), giá trị lớn nhất (Max), giá trị nhỏ nhất (Min) của các biến.
sum infmort lowbrth popul pcinc afdcpay physicpc

Bảng I.2. Kết quả chạy lệnh mô tả SUM
Theo kết quả ở bảng trên, ta thấy:
- Infmort: Tỉ lệ tử vong ở trẻ sơ sinh của 100 quan sát có giá trị trung bình là 9.503% với độ
lệch chuẩn là 1.461524%. Tỉ lệ này đạt nhỏ nhất là 6.2% và cao nhất là 13.7%
- Lowbrth: Tỉ lệ trẻ sinh thiếu cân trung bình là 6.707% với độ lệch chuẩn 1.166039; tỉ lệ nhỏ
nhất là 4.8% và lớn nhất lên tới 9.6%.
- Popul: Dân số trung bình là 4910.01 (nghìn người), độ lệch chuẩn là 5317.505 nghìn người;
dân số lúc thấp nhất là 454 nghìn người và lúc cao nhất là 29760 nghìn người.
- Phân tích tương tự với các biến còn lại.
3. Sử dụng lệnh TAB1
- Sử dụng lệnh Tab1 cho phép miêu tả cùng lúc nhiều biến với các thông tin tần số (Freq.),
tần suất (Percent) của các giá trị của mỗi biến, tổng cộng gộp Si (Cum.)


3


Nhóm 10.1 – Bộ số liệu 58
tab1 infmort lowbrth popul pcinc afdcpay physicpc
 tabulation of infmort
infant
mortality
rate

Freq.

Percent

Cum.

6.2
6.4
6.7
7
7.1
7.2
7.3
7.5

9.9

11.8
11.9

12.1
12.2
12.4
12.7
13.7

1
1
1
1
1
1
1
1

2

1
1
1
1
1
2
1

1.00
1.00
1.00
1.00
1.00

1.00
1.00
1.00

2.00

1.00
1.00
1.00
1.00
1.00
2.00
1.00

1.00
2.00
3.00
4.00
5.00
6.00
7.00
8.00

65.00

93.00
94.00
95.00
96.00
97.00

99.00
100.00

Total

100

100.00

Bảng I.4. Kết quả chạy lệnh mô tả TAB1 với biến infmort
- Ví dụ về phân tích dữ liệu trong bảng:
+ Tỉ lệ tử vong ở trẻ sơ sinh có giá trị từ 6.2% đến 13.7%
+ Có 65% trong tổng số quan sát mà tỉ lệ tử vong ở trẻ sơ sinh < 9.9%.
 tabulation of lowbrth
Perc births
low weight

Freq.

Percent

Cum.

4.8
4.9
5
5.1
5.2
5.3
5.4

5.5

2
3
2
4
1
5
4
3

2.00
3.00
2.00
4.00
1.00
5.00
4.00
3.00

2.00
5.00
7.00
11.00
12.00
17.00
21.00
24.00



8.2
8.4
8.6
8.7
9
9.2
9.6


3
1
1
3
1
1
1


3.00
1.00
1.00
3.00
1.00
1.00
1.00


92.00
93.00
94.00

97.00
98.00
99.00
100.00

Total

100

100

Bảng I.3. Kết quả chạy lệnh mô tả TAB1 với biến lowbrth

4


Nhóm 10.1 – Bộ số liệu 58
- Dấu … đại diện cho các dữ liệu ở khoảng giữa nhưng không liệt kê ra do số lượng quan sát
lớn.
- Ví dụ về phân tích dữ liệu trong bảng:
+ Tỉ lệ trẻ sinh thiếu cân có giá trị từ 4.8% đến 9.6% đối với 100 quan sát
+ Ý nghĩa của Cum. : có 24% trong tổng số 100 số quan sát mà tỉ lệ trẻ sinh thiếu cân
< 5.5%.
 tabulation of popul
population,
1000s

Freq.

Percent


Cum.

454
490
524
547
550
563

4244

16781
16987
17835
17990
27653
29760

1
1
1
1
1
1

1

1
1

1
1
1
1

1.00
1.00
1.00
1.00
1.00
1.00

1.00

1.00
1.00
1.00
1.00
1.00
1.00

1.00
2.00
3.00
4.00
5.00
6.00

60.00


95.00
96.00
97.00
98.00
99.00
100.00

Total

100

100.00

Bảng I.5. Kết quả chạy lệnh mô tả TAB1 với biến popul
- Có 95% trong tổng số quan sát mà dân số < 16781 nghìn người
 tabulation of pcinc
Per capita
income

Freq.

Percent

Cum.

10301
11013
11421
11506
11530

11797
11889

17422

21258
21258
21915
22068
22558
24977
25528

1
1
1
1
1
1
1

1

1
1
1
1
1
1
1


1.00
1.00
1.00
1.00
1.00
1.00
1.00

1.00

1.00
1.00
1.00
1.00
1.00
1.00
1.00

1.00
2.00
3.00
4.00
5.00
6.00
7.00

69.00

94.00

95.00
96.00
97.00
98.00
99.00
100.00

Total

100

100.00

Bảng I.6. Kết quả chạy lệnh mô tả TAB1 biến pcinc

5


Nhóm 10.1 – Bộ số liệu 58
 tabulation of afdcpay
avg monthly
AFDC payment

Freq.

Percent

Cum.

114

115
117
120
149
165
167

571
581
637
651

1
1
1
1
1
1
1

1
1
1
1

1.00
1.00
1.00
1.00
1.00

1.00
1.00

1.00
1.00
1.00
1.00

1.00
2.00
3.00
4.00
5.00
6.00
7.00

97.00
98.00
99.00
100.00

Total

100

100.00

Bảng I.7. Kết quả chạy lệnh mô tả TAB1 với biến afdcpay
 tabulation of physicpc
physicians

per capita

Freq.

Percent

Cum.

.0081989
.0087513
.0100709
.010302
.0160767
.0168857

.2947531
.2987988
.3061674
.4460695
.4493783

1
1
1
1
1
1

1
1

1
1
1

1.00
1.00
1.00
1.00
1.00
1.00

1.00
1.00
1.00
1.00
1.00

1.00
2.00
3.00
4.00
5.00
6.00

96.00
97.00
98.00
99.00
100.00


Total

100

100.00

Bảng I.8. Kết quả chạy lệnh mô tả TAB1 với biến physicpc

II. PHẦN II – HỒI QUY VÀ TƯƠNG QUAN
1. Thiết lập mô hình tổng quát
a. Mô hình tổng quát
Hàm hồi quy tổng thể biểu diễn mối liên hệ giữa biến phụ thuộc là lowbrth với các biến
độc lập infmort, popul, pcinc, afdcpay, physicpc có dạng:
𝒊𝒏𝒇𝒎𝒐𝒓𝒕 = 𝛽0 + 𝛽1 × 𝒍𝒐𝒘𝒃𝒓𝒕𝒉 + 𝛽2 × 𝒑𝒐𝒑𝒖𝒍 + 𝛽3 × 𝒑𝒄𝒊𝒏𝒄 + 𝛽4 × 𝒂𝒇𝒅𝒄𝒑𝒂𝒚 +
𝛽5 × 𝒑𝒉𝒚𝒔𝒊𝒄𝒑𝒄 + 𝒖𝒊
b. Ý nghĩa các biến
 Biến phụ thuộc:

6


Nhóm 10.1 – Bộ số liệu 58
Infmort (Y): Tỷ lệ tử vong ở trẻ sơ sinh (%)
 Biến độc lập (𝑋𝑖 )

Tên biến

Biến
định
lượng


Dấu

vọng

Ý nghĩa

Đơn vị tính

Lowbrth
(𝑿𝟏 )

Tỷ lệ trẻ sinh
thiếu cân

+

%

Popul (𝑿𝟐 )

Dân số

+

1000 người

Pcinc (𝑿𝟑 )

Thu nhập bình

quân

-

USD

Afdcpay (𝑿𝟒 )

Trợ cấp trung
bình hàng tháng
nhận được từ
AFDC

-

USD

Physicpc (𝑿𝟓 )

Tỷ lệ bác sỹ
trên đầu người

-

%

Diễn giải

Tỷ lệ trẻ sinh
thiếu cân càng

cao thì tỉ lệ tử
vong
trung
bình ở trẻ sơ
sinh càng cao
Dân số càng
cao thì tỉ lệ tử
vong
trung
bình ở trẻ sơ
sinh càng cao
Thu nhập bình
quân càng cao
thì tỉ lệ tử vong
trung bình ở trẻ
sơ sinh càng
thấp
Trợ cấp hàng
tháng càng cao
thì tỉ lệ tử vong
trung bình ở trẻ
sơ sinh càng
thấp
Tỷ lệ bác sỹ
trên đầu người
càng cao thì tỉ
lệ tử vong
trung bình ở trẻ
sơ sinh càng
thấp


Bảng II.1. Ý nghĩa các biến độc lập
2. Phân tích mối tương quan giữa các biến độc lập
- Sử dụng lệnh:
corr lowbrth popul pcinc afdcpay physicpc

 Kết quả thu được:
lowbrth
popul

lowbrth
1.0000
0.1789

popul

pcinc

1.0000

7

afdcpay

physicpc


Nhóm 10.1 – Bộ số liệu 58
pcinc
afdcpay

physicpc

-0.1395
-0.5808
-0.3821

0.2658
0.1798
-0.5520

1.0000
0.6150
0.0094

1.0000
0.2702

1.0000

Bảng II.2. Kết quả khi chạy lệnh corr giữa các biến đốc lập
Theo kết quả ở trên, các hệ số tương quan 𝑟𝑖𝑗 đều có giá trị tuyệt đối nhỏ hơn 0.8
 Không có hiện tượng đa cộng tuyến trong mô hình.
3. Chạy hồi quy
- Sử dụng lệnh
reg infmort lowbrth popul pcinc afdcpay physicpc

 Kết quả thu được:
Source |
SS
df

MS
-------------+-----------------------------Model | 110.351338
5 22.0702675
Residual | 101.117751
94 1.07572076
-------------+-----------------------------Total | 211.469089
99
2.1360514

Number of obs
F( 5,
94)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

100
20.52
0.0000
0.5218
0.4964
1.0372


-----------------------------------------------------------------------------infmort |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lowbrth |
.7119426
.1230073
5.79
0.000
.4677087
.9561765
popul |
.0000113
.0000265
0.43
0.671
-.0000413
.0000639
pcinc | -.0001369
.0000459
-2.98
0.004
-.0002281
-.0000457
afdcpay |
-.000353
.001489

-0.24
0.813
-.0033094
.0026033
physicpc | -.9808367
1.499449
-0.65
0.515
-3.958029
1.996355
_cons |
7.098026
1.063575
6.67
0.000
4.986273
9.209779
------------------------------------------------------------------------------

Bảng II.3. Kết quả chạy hồi quy
Từ kết quả ở bảng trên, ta có:
- Phương trình hồi quy tổng thể:
𝒊𝒏𝒇𝒎𝒐𝒓𝒕 = 7.098026 + 0.7119426 × 𝒍𝒐𝒘𝒃𝒓𝒕𝒉 + 0.0000113 × 𝒑𝒐𝒑𝒖𝒍 − 0.0001369
× 𝒑𝒄𝒊𝒏𝒄 − 0.000353 × 𝒂𝒇𝒅𝒄𝒑𝒂𝒚 − 0.9808367 × 𝒑𝒉𝒚𝒔𝒊𝒄𝒑𝒄 + ̂
𝒖𝒊
- Phương trình hồi quy mẫu:
̂ = 7.098026 + 0.7119426 × 𝒍𝒐𝒘𝒃𝒓𝒕𝒉 + 0.0000113 × 𝒑𝒐𝒑𝒖𝒍 − 0.0001369
𝒊𝒏𝒇𝒎𝒐𝒓𝒕
× 𝒑𝒄𝒊𝒏𝒄 − 0.000353 × 𝒂𝒇𝒅𝒄𝒑𝒂𝒚 − 0.9808367 × 𝒑𝒉𝒚𝒔𝒊𝒄𝒑𝒄
Hay

̂ = 7.098026 + 0.7119426 × 𝑿𝟏 + 0.0000113 × 𝑿𝟐 − 0.0001369 × 𝑿𝟑 − 0.000353
𝒀
× 𝑿𝟒 − 0.9808367 × 𝑿𝟓
4. Phân tích kết quả hồi quy
- Phần tổng bình phương các độ lệch giữa giá trị quan sát Yi với giá trị trung bình của nó TSS
= 211.469089
- Phần tổng bình phương được giải thích bởi mô hình (biến giải thích) ESS = 110.351338
- Phần tổng bình phương không giải thích được (phần dư) RSS = 101.117751
- R2 = 52.18% có nghĩa là các yếu tố: Tỷ lệ trẻ sinh thiếu cân, Dân số, Thu nhập bình quân
đầu người, Trợ cấp trung bình hàng tháng nhận được từ AFDC, Tỷ lệ bác sỹ trên đầu người
đã giải thích được 52.18% tỷ lệ trẻ tử vong ở trẻ sơ sinh.

8


Nhóm 10.1 – Bộ số liệu 58
- Trong các giá trị p-value ở bảng trên, giá trị p-value của biến popul, afdcpay và physicpc
lần lượt là 0.671, 0.813 và 0.515 đều lớn hơn mức ý nghĩa α = 0.05
 Không có cơ sở để bác bỏ Ho (giả thuyết 𝛽𝑖 = 0). Như vậy ba biến popul, afdcpay và
physicpc không có ý nghĩa thống kê, tức là có thể không gây ảnh hưởng đến tỉ lệ tử vong
ở trẻ sơ sinh.
- Ý nghĩa các tham số trong mô hình.
 𝛽0= 7.098026 có nghĩa là trong điều kiện các nhân tố khác không đổi và giá trị các
biến độc lập bằng 0 thì tỷ lệ tử vong ở trẻ sơ sinh trung bình là 7.098026 %.
 𝛽1= 0.7119426 có nghĩa là trong điều kiện các nhân tố khác không đổi, nếu tỷ lệ trẻ
sinh thiếu cân tăng 1 % thì tỷ lệ tử vong trung bình ở trẻ sơ sinh tăng 0.7119426%.
 𝛽2= 0.0000113, không có ý nghĩa thông kê.
 𝛽3= -0.0001369 có nghĩa là trong điều kiện các yếu tố khác không đổi, nếu thu nhập
bình quân tăng 1 đơn vị thì tỷ lệ tử vong trung bình ở trẻ sơ sinh giảm 0.0001369 %.
 𝛽4 = -0.000353, không có ý nghĩa thống kê.

 𝛽5= -0.9808367, không có ý nghĩa thống kê.
5. Một số kiểm định F
a. Kiểm tra sự phù hợp của mô hình.
Ta có giả thuyết: {
- Dùng công thức:

𝐻0 : 𝑅2 = 0
𝐻1 : 𝑅2 ≠ 0

0,5218⁄
𝑅2⁄
𝑘
F=
= (1−0,5218) 5
= 20.514
2
(1−𝑅 )⁄
⁄(100−5−1)
(𝑛−𝑘−1)

Mà F= 20.514> 2.32  Bác bỏ H0.

5,94
𝐶0,05
= 2.32

Vậy mô hình hồi quy tìm được là phù hợp.
- Kiểm tra lại bằng lệnh trong stata :
test lowbrth popul pcinc afdcpay physicpc


 Kết quả thu được:
(1)
(2)
(3)
(4)
(5)

infmort = 0
popul = 0
pcinc = 0
afdcpay = 0
physicpc = 0
F (5, 94) = 20.52
Prob > F = 0.0000

Kiểm định F cho toàn bộ hệ số hồi quy là 20.52; Prob > F có giá trị nhỏ hơn α = 0.05 nên
bác bỏ giả thuyết Ho.
Kết quả thu được từ stata cũng giống với khi dùng công thức.

9


Nhóm 10.1 – Bộ số liệu 58
b. Kiểm định 𝛽𝑖 = 0
𝐻𝑜: 𝛽𝑖 = 0
Cặp giả thuyết thống kê: {
𝐻1: 𝛽𝑖 ≠ 0
̂
𝛽 −𝛽
Sử dụng thống kê 𝑇 = 𝑖 ̂ 𝑖, giá trị của kiểm định này chính là cột t trong bảng kết quả

𝑠𝑒 𝛽𝑖
chạy hồi quy.
 Cách 1: Dùng khoảng tin cậy
Ho
𝛽1 = 0

H1
𝛽1 ≠ 0

T
5.79

Khoảng tin cậy
0.4677087
0.9561765

𝛽2 = 0

𝛽2 ≠ 0

0.43

-0.0000413

0.0000639

𝛽3 = 0

𝛽3 ≠ 0


-2.98

-0.0002281

-0.0000457

𝛽4 = 0

𝛽4 ≠ 0

-0.24

-0.0033094

0.0026033

𝛽5 = 0

𝛽5 ≠ 0

-0.56

-3.958029

1.996355

𝛽0 = 0

𝛽0 ≠ 0


6.67
4.986273
9.209779
Bảng II.4. Kiểm định dùng khoảng tin cậy

Kết luận
Bác bỏ Ho
Không đủ cơ
sở bác bỏ Ho
Bác bỏ Ho
Không đủ cơ
sở bác bỏ Ho
Không đủ cơ
sở bác bỏ Ho
Bác bỏ Ho

 Như vậy 𝛽2 , 𝛽4 , 𝛽5 có thể bằng 0.
 Cách 2: Sử dụng P-value
Ho
𝛽1 = 0
𝛽2 = 0
𝛽3 = 0
𝛽4 = 0
𝛽5 = 0
𝛽0 = 0

H1
𝛽1 ≠ 0
𝛽2 ≠ 0
𝛽3 ≠ 0

𝛽4 ≠ 0
𝛽5 ≠ 0
𝛽0 ≠ 0

P-value
α
Kết luận
0.000
Bác bỏ Ho
Không đủ cơ sở bác bỏ Ho
0.671
Bác bỏ Ho
0.004
0.05
Không đủ cơ sở bác bỏ Ho
0.813
Không đủ cơ sở bác bỏ Ho
0.515
Bác bỏ Ho
0.000
Bảng II.5. Kiểm định dùng P-value

 Cách 3: Sử dụng phương pháp giá trị tới hạn
(𝟗𝟒)

𝑪𝟎.𝟎𝟐𝟓 = 𝒕𝟎.𝟎𝟐𝟓 = 𝟐. 𝟑𝟔𝟖
Ho
𝛽1 = 0

H1

𝛽1 ≠ 0

Miền bác bỏ

T
5.79

Kết luận
Bác bỏ Ho
Không đủ cơ
0.43
𝛽2 = 0
𝛽2 ≠ 0
sở bác bỏ Ho
Bác bỏ Ho
-2.98
𝛽3 = 0
𝛽3 ≠ 0
-2.368
2.368
Không đủ cơ
-0.24
𝛽4 = 0
𝛽4 ≠ 0
sở bác bỏ Ho
Không đủ cơ
-0.56
𝛽5 = 0
𝛽5 ≠ 0
sở bác bỏ Ho

Bác bỏ Ho
6.67
𝛽0 = 0
𝛽0 ≠ 0
Bảng II.6. Kiểm định dùng phương pháp giá trị tới hạn
 Kiểm tra lại bằng stata
- Dùng lệnh: test [var]

10


Nhóm 10.1 – Bộ số liệu 58
Bản chất của lệnh test này trong stata là chạy lại mô hình hồi quy sau khi đã bỏ đi biến
đang cần kiểm định, sau đó tính F.
Ví dụ: Kiểm định 𝛽2 = 0
test popul

 Kết quả thu được:
(1) popul = 0
F (1,94) =
Prob > F =

0.18
0.6710

Prob > F có giá trị lớn hơn α = 0.05 nên chúng ta không có cơ sở bác bỏ Ho, tức là 𝛽2 có
thể bằng 0.
c. Kiểm định 𝛽𝑖 = 𝛽𝑗 = 0
𝐻𝑜: 𝛽𝑖 = 𝛽𝑗 = 0
Cặp giả thuyết thống kê: {

𝐻1: 𝑀ộ𝑡 𝑡𝑟𝑜𝑛𝑔 ℎ𝑎𝑖 𝛽 ≠ 0
Ví dụ: Kiểm định 𝜷𝟏 = 𝜷𝟐 = 𝟎
 Cách 1: Chạy hồi quy mô hình mới
𝑆𝑆𝑅𝑢𝑟 = 101.117751
𝑆𝑆𝑅𝑟 = 140.302815
Áp dụng công thức:
(𝑆𝑆𝑅𝑟 − 𝑆𝑆𝑅𝑢𝑟) /𝑞 (140.302815 − 101.117751)/2
𝐹=
=
= 18.2134
𝑆𝑆𝑅𝑢𝑟 /(𝑛 − 𝑘 − 1)
101.117751/(100 − 5 − 1)
(2,94)

𝐶0.05

= 3.10

(2,94)

F > 𝐶0.05 => Bác bỏ Ho, tức là có ít nhất một trong hai β có giá trị khác 0.

 Cách 2: Dùng lệnh trong stata
test lowbrth popul

 Kết quả thu được:
(1)
(2)

infmort = 0

popul = 0
F (2, 94) = 18.21
Prob > F = 0.0000

Prob > F nhỏ hơn α = 0.05 nên bác bỏ Ho, tức là có ít nhất một trong hai 𝛽1 ℎ𝑜ặ𝑐 𝛽2 khác 0.

III. PHẦN III – KIỂM TRA CÁC KHUYẾT TẬT
1. Kiểm định phương sai sai số thay đổi
a. Dựa vào đồ thị
- Bước 1: Chạy hồi quy mô hình đầy đủ
- Bước 2: Dùng lệnh rvfplot
 Kết quả thu được

11


Nhóm 10.1 – Bộ số liệu 58

Hình III.1. Kết quả chạy lệnh rvfplot
Dựa vào đồ thị trên ta thấy mô hình bị mắc “bệnh” phương sai sai số thay đổi. Các điểm
phân bố không theo quy luật.
b. Sử dụng lệnh imtest, white
 Kết quả thu được:
White's test for Ho: homoscedasticity
against Ha: unrestricted heteroskedasticity
chi2(19) = 47.41
Prob > chi2 = 0.0005
Cameron & Trivedi's decomposition of IM-test
Source
Heteroskedasticity

Skewness
Kurtosis
Total

chi2

df

p

47.41
16.55
1.80

20
5
1

0.0005
0.0054
0.1792

65.76

26

0.0000

Bảng III.1. Kết quả chạy lệnh imtest, white
Prob ( >chi2) = 0.0005 < α=0.05 nên bác bỏ Ho (có phương sai sai số thay đổi).

Như vậy mô hình có thể có hiện tượng phương sai sai số thay đổi, hay nói cách khác giả
thuyết phương sai thuần nhất không được thỏa mãn.
c. Sử dụng kiểm định Breusch-Pagan
- Lệnh hettest
 Kết quả:
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of lowbrth
chi2(1)
= 3.16
Prob > chi2 = 0.0753

 Kết quả của lệnh hettest cũng cho thấy có phương sai sai số thay đổi.
d. Cách sửa: chạy lại hồi quy với lệnh robust
reg infmort lowbrth popul pcinc afdcpay physicpc, robust

 Kết quả thu được:

12


Nhóm 10.1 – Bộ số liệu 58
Linear regression

Number of obs = 100
F (5, 94)
= 14.95
Prob > F
= 0.0000
R-squared

= 0.5218
Root MSE
= 1.0372

infmort

Coef.

Robust
Std.
Err.

lowbrth
popul
pcinc
afdcpay
physicpc
__cons

.7119426
.0000113
-.0001369
-.000353
-.9808367
7.098026

.1333468
.0000258
.0000372
.0018645

1.636684
1.139736

t
5.34
0.44
0.44
-0.19
-0.60
6.23

P>|t|
0.000
0.663
0.000
0.850
0.550
0.000

[95% Conf. Interval]
.4471794
-.00004
-.0002109
-.0040551
-4.230511
4.835054

.9767059
.0000626
-.0000629

.0033491
2.268838
9.360998

Bảng III.2. Kết quả chạy lệnh hồi quy với robust
Ta thu được ác giá trị se (𝛽𝑗 ) mới mà ở đó phương sai sai số thuần nhất.
2. Kiểm định đa cộng tuyến
a. Dùng lệnh corr
Dựa vào bảng kết quả trên có thể thấy các biến độc lập không có tương quan mạnh với nhau,
mô hình không có hiện tượng đa cộng tuyến.
b. Vif (variance inflation factor)
- Chạy hồi quy phụ để tính 𝑅𝑗2
Chạy hồi quy lên 𝑿𝒋
𝑹𝟐𝒋
VIF (𝑿𝒋 ) = 𝟏/(𝟏 − 𝑹𝟐𝒋 )
0.4718
1.89322
𝑋1
0.4528
1.82748
𝑋2
0.4582
1.84570
𝑋3
0.6781
3.10655
𝑋4
0.4537
1.83050
𝑋5

Bảng III.3. Kết quả sử dụng phương pháp nhân tử phóng đại phương sai
Các giá trị của VIF < 10 -> Không có hiện tượng đa cộng tuyến.
3. Kiểm định phân phối chuẩn
Cặp giả thuyết:
𝐻:
𝐶ó 𝑝ℎâ𝑛 𝑝ℎố𝑖 𝑐ℎ𝑢ẩ𝑛
{ 0
𝐻1 : 𝐾ℎô𝑛𝑔 𝑝ℎâ𝑛 𝑝ℎố𝑖 𝑐ℎ𝑢ẩ𝑛
a. Dùng đồ thị
- Bước 1: dùng lệnh predict r, resid
- Bước 2: dùng lệnh kdensity r, normal
 Kết quả thu được đồ thị dưới đây

13


Nhóm 10.1 – Bộ số liệu 58

Hình III.2. Đồ thị thu được khi chạy kdensity r, normal

- Dựa vào đồ trị trên ta thấy hai đồ thị không trùng nhau
 Nhiễu không phân phối chuẩn.
b. Dùng lệnh Sktest r
 Kết quả thu được:

Bảng III.4. Kết quả khi chạy Sktest r
Prob>chi2 = 0.0315 < α = 0.05
 Bác bỏ Ho (giả định là phân phối chuẩn)
Như vậy kết quả này giống với cách dùng đồ thị ở trên.
Vậy giả thuyết nhiễu phân phối chuẩn không thỏa mãn với mô hình trên.

- Cách chữa: cần phải chạy lại một mẫu khác.

14


Nhóm 10.1 – Bộ số liệu 58

KẾT LUẬN
Sau khi phân tích số liệu, ta có thể nhận thấy ảnh hưởng của các nhân tố đến tỉ lệ trẻ sơ
sinh bị tử vong và mức độ ảnh hưởng của chúng. Trong đó, quan trọng nhất là 2 nhân tố: tỉ
lệ trẻ sinh thiếu cân và thu nhập bình quân trên đầu người.
● Tỉ lệ trẻ sinh thiếu cân ảnh hưởng tiêu cực đến tỉ lệ trẻ sơ sinh tử vong vì trẻ sinh ra
thiếu cân sẽ rất yếu và có thể không đủ sức khỏe để thích nghi ngay được với môi trường
bên ngoài sau khi chào đời.
● Thu nhập bình quân trên đầu người cũng ảnh hưởng đến tỉ lệ trẻ sơ sinh tử vong. Thu
nhập bình quân trên đầu người phần nào phản ảnh mức độ cuộc sống của người dân một
quốc gia. Thu nhập cao thì các gia đình sẽ có điều kiện đầy đủ hơn, tốt hơn để chăm sóc
sức các thành viên, đặc biệt là đối với người mẹ và trẻ sơ sinh.
Từ bài phân tích trên kết hợp với việc tìm hiểu thông tin, có thể đưa ra một số phương
pháp để hạn chế tỉ lệ trẻ sơ sinh tử vong:
- Chăm sóc cho bà mẹ đang mang thai theo đúng cách và hợp lí, để trẻ được cung cấp đủ
chất dinh dưỡng và năng lượng, không bị thiếu cân.
- Nâng cao đời sống vật chất cũng như tinh thần của người dân
- Xây dựng cơ sỏ vật chất hiện đại và đầy đủ cho các bệnh viện, cơ sở y tế khám chữa bệnh
để đáp ứng được đủ và tốt nhu cầu khám, chữa bệnh.

15




×