Tải bản đầy đủ (.docx) (41 trang)

tiểu luận kinh tế lượng các yếu tố ảnh hưởng đến chất lượng sinh sản ở mỹ năm 1988

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (384.23 KB, 41 trang )

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
------o0o-----

TIỂU LUẬN
MÔN KINH TẾ LƯỢNG

CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN CHẤT LƯỢNG
SINH SẢN Ở MỸ NĂM 1988

NHÓM 2
STT
1
2
3
4
5
6

Họ và tên
Hà Hải Anh
Hoàng Thị Hạnh
Lê Thị Anh Phương
Ngô Đắc Thắng
Hoàng Thị Thơ
Nguyễn Thị Trang

MSSV
1711110012
1711110229
1711110553
1711110617


1711110662
1711110721

Giảng viên hướng dẫn : ThS. Nguyễn Thúy Quỳnh

Hà Nội, 05/2019


ĐÁNH GIÁ THÀNH VIÊN TRONG NHÓM
Hải Anh
Hạnh
Phương
Thắng
Thơ
Trang
Điểm TB
cá nhân

Hải Anh
10
10
10
10
9

Hạnh
9.5
10
10
10

10

Phương
10
9
10
10
10

Thắng
10
10
9.5
10
10

Thơ
9.5
10
10
10
10

Trang
10
10
10
9.5
10
-


9.8

9.9

9.8

9.9

9.9

9.9

1


MỤC LỤC
LỜI MỞ ĐẦU......................................................................................................5
CHƯƠNG I. CƠ SỞ LÝ LUẬN VÀ GIẢ THUYẾT NGHIÊN CỨU VỀ
CHẤT LƯỢNG SINH SẢN Ở MỸ NĂM 1988................................................7
1.

Tổng quan về chất lượng sinh sản ở Mỹ (cân nặng khi sinh – bwght)
7

2.

Cơ sở lý luận về ảnh hưởng của các nhân tố đã chọn tới chất lượng

sinh sản ở Mỹ...................................................................................................7

2.1.

Thu nhập trong gia đình (faminc)....................................................7

2.2.

Trình độ học vấn của bố, mẹ (fatheduc, motheduc)........................8

2.3.

Thứ tự đứa bé được sinh trong gia đình (parity).............................8

2.4.

Chủng tộc (Màu da – White)............................................................8

2.5.

Số điếu thuốc được hút bởi bà mẹ mang bầu (cigs)........................9

CHƯƠNG II. PHƯƠNG PHÁP NGHIÊN CỨU VÀ MÔ HÌNH...............10
1.

2.

3.

Xác định phương pháp nghiên cứu......................................................10
1.1.


Phương pháp thu thập số liệu........................................................10

1.2.

Phương pháp xử lý số liệu..............................................................10

1.3.

Phương pháp sử dụng trong nghiên cứu.......................................10

Xây dựng mô hình.................................................................................10
2.1.

Mô hình gốc.....................................................................................10

2.2.

Mô hình hồi quy tổng quát..............................................................11

Giải thích các biến.................................................................................12
3.1.

Mô tả tổng quan..............................................................................12

3.2.

Mô tả thống kê.................................................................................12

3.3.


Mô tả chi tiết....................................................................................13
2


3.3.1.

Cân nặng khi sinh (bwght).........................................................13

3.3.2.

Thu nhập của hộ gia đình (faminc)............................................14

3.3.3.

Trình độ học vấn của bố (fatheduc)...........................................14

3.3.4.

Trình độ học vấn của mẹ (motheduc).........................................15

3.3.5.

Thứ tự đứa trẻ được sinh (parity)..............................................16

3.3.6.

Chủng tộc (white).......................................................................16

3.3.7.


Số điếu thuốc bà mẹ hút khi mang thai (cigs)............................17

3.4.

Ma trận tương quan giữa các biến.................................................17

Dựa vào ma trận hệ số tương quan giữa các biến ta thấy:......................18
CHƯƠNG III.

ƯỚC LƯỢNG, KIỂM ĐỊNH MÔ HÌNH VÀ SUY DIỄN

THỐNG KÊ

20

1.

2.

Mô hình ước lượng................................................................................20
1.1.

Mô hình hồi quy tổng thể và mô hình hồi quy mẫu......................20

1.2.

Bảng kết quả....................................................................................20

1.3.


Phân tích kết quả.............................................................................21

Kiểm định và khắc phục các khuyết tật của mô hình........................22
2.1.

Đa cộng tuyến..................................................................................22

2.2.

Kiểm định phương sai sai số thay đổi............................................24

2.3.

Kiểm định tự tương quan................................................................25

2.4.

Kiểm định phân phối chuẩn của nhiễu..........................................25

2.5.

Kiểm định các biến số bị bỏ sót (kiểm định dạng đúng của mô

hình) 26
2.6.

Kiểm định giả thuyết.......................................................................26

2.6.1.


Kiểm định đơn biến (kiểm định giả thuyết về hệ số hồi quy).....26

2.6.2.

Kiểm định sự phù hợp của mô hình (kiểm định đa biến)...........32
3


KẾT LUẬN........................................................................................................34
PHỤ LỤC...........................................................................................................35

DANH MỤC BẢNG
Bảng 1: Các biến trong mô hình các nhân tố ảnh hưởng đến chất lượng sinh
sản ở Mỹ năm 1988............................................................................................11
Bảng 2: Thống kê dữ liệu mô tả nghiên cứu...................................................12
Bảng 3: Thống kê dữ liệu biến bwght..............................................................12
Bảng 4: Thống kê dữ liệu biến faminc.............................................................13
Bảng 5: Thống kê dữ liệu biến fatheduc..........................................................14
Bảng 6: Thống kê dữ liệu biến motheduc........................................................14
Bảng 7: Thống kê dữ liệu biến parity..............................................................15
Bảng 8: Thống kê dữ liệu biến white...............................................................16
Bảng 9: Thống kê dữ liệu biến cigs..................................................................16
Bảng 10: Kết quả xây dựng ma trận tương quan giữa các biến...................17
Bảng 11: Bảng tương quan giữa các biến........................................................22
Bảng 12: Kết quả thừa số tăng phương sai VIF.............................................23
Bảng 13: Kết quả kiểm định Imtest, White phương sai sai số thay đổi........24
Bảng 14: Kết quả kiểm định Hettest................................................................24
Bảng 15: Kết quả kiểm định phân phối chuẩn của nhiễu..............................25
Bảng 16: Kết quả kiểm định Ramsey’s RESET.............................................25


4


LỜI MỞ ĐẦU
Lý do lựa chọn đề tài
Trẻ sơ sinh ở Mỹ có cân nặng trung bình 7,5 pounds, cao nhất trong các
quốc gia phát triển. Đó là theo một nghiên cứu được công bố trên tạp chí Health
Affairs. Các nhà nghiên cứu phân tích dữ liệu về chất lượng sinh sản. Các thông
số thống kê được năm 1988, được trích xuất từ Cơ sơ dữ liệu sinh sản của con
người và Cơ sở dữ liệu sinh sản của Tổ chức Y tế Thế giới
Chất lượng sinh sản ảnh hưởng rất lớn đến đời sống, kinh tế, giáo dục của
mỗi quốc gia, vì vậy cần nắm bắt được các yếu tố ảnh hưởng đến chất lượng
sinh sản và giữ chất lượng này ở mức phù hợp với mỗi đất nước. Thông qua
nghiên cứu thực nghiệm, các biến ảnh hưởng đến chất lượng sinh sản ở Mỹ năm
1988 cũng được xác định. Vì vậy, chúng em đã lựa chọn đề tài nghiên cứu: “Các
yếu tố ảnh hưởng đến chất lượng sinh sản ở Mỹ năm 1988”
Hy vọng bài tiểu luận này sẽ phần nào giúp mọi người có thêm sự hiểu
biết về chất lượng sinh sản ở Mỹ cũng như các yếu tố ảnh hưởng đến chất lượng
này. Từ đó có những bài học rút ra cho Việt Nam trong việc nâng cao chất lượng
sinh sản.
Mục tiêu nghiên cứu
Mục tiêu tổng quát của đề tài là xác định và phân tích sự ảnh hưởng của
các nhân tố đến chất lượng sinh sản ở Mỹ.
Hệ thống hóa cơ sở lý thuyết và những nghiên cứu thực nghiệm về sự ảnh
hưởng của các nhân tố như: thu nhập hộ gia đình 1998, trình độ học vấn của bố
mẹ, thứ tự đứa bé trong gia đình, chủng tộc, số điếu thuốc được hút bởi bà mẹ
mang bầu đến chất lượng sinh sản ở Mỹ.
Ước lượng mô hình hàm hồi quy và phân tích ảnh hưởng của các biến đến
chất lượng sinh sản ở Mỹ (infmort). Kiểm định và khắc phục các khuyết tật của
mô hình đã được ước lượng.

Những gợi ý về chính sách để Mỹ nâng cao chất lượng này và bài học rút
ra cho Việt Nam.
Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: Sự ảnh hưởng của các biến thu nhập hộ gia đình
1998, trình độ học vấn của bố mẹ, thứ tự đứa bé trong gia đình, chủng tộc, số
điếu thuốc được hút bởi bà mẹ mang bầu đến chất lượng sinh sản.
Phạm vi nghiên cứu: Nghiên cứu ảnh hưởng của các biến đến chất lượng
sinh sản ở Mỹ.
Phương pháp nghiên cứu
Tiểu luận sử dụng phương pháp nghiên cứu định lượng, áp dụng kỹ thuật
hồi quy đa biến với dữ liệu chéo (Cross Data) để xem xét mức độ ảnh hưởng của
5


các yếu tố đến chất lượng sinh sản ở Mỹ, chạy mô hình hồi quy bội, phương
pháp bình phương nhỏ nhất (OLS). Kết quả thực nghiệm từ việc chạy mô hình
và các kiểm định sẽ được sử dụng làm cơ sở để chấp nhận hay bác bỏ các giả
thuyết của nghiên cứu, đảm bảo tính phù hợp của mô hình. Tiểu luận tiến hành
xây dựng mô hình nghiên cứu, trình bày các biến độc lập và biến phụ thuộc
trong mô hình ở chương 3, Cơ sơ dữ liệu sinh sản của con người và Cơ sở dữ
liệu sinh sản của Tổ chức Y tế Thế giới, Statisticstime, Numbeo. Phần mềm
được chúng em sử dụng để phân tích định lượng là Stata 12
Nội dung và cấu trúc tiểu luận
Tiểu luận nghiên cứu sẽ được trình bày trong ba chương, bao gồm:
Chương I: Cơ sở lý luận và giả thuyết nghiên cứu về chất lượng sinh sản ở Mỹ
năm 1988
Chương II: Phương pháp nghiên cứu và mô hình
Chương III: Ước lượng, kiểm định mô hình và suy diễn thống kê
Các yếu tố được chọn trong mô hình là những khái niệm khá mới lạ. Do
đó quá trình thu thập tài liệu gặp nhiều khó khăn: rất ít số liệu và tài liệu tham

khảo bằng Tiếng Việt, số liệu được tìm kiếm hoàn toàn bằng Tiếng Anh.
Ngoài ra, do kiến thức chuyên ngành nói chung và kiến thức về môn kinh
tế lượng nói riêng còn hạn chế nên bài tiểu luận này có rất nhiều sai sót. Mong
cô sẽ thông cảm cho chúng em.
Chúng em xin chân thành cảm ơn cô!

6


CHƯƠNG I.

CƠ SỞ LÝ LUẬN VÀ GIẢ THUYẾT NGHIÊN

CỨU VỀ CHẤT LƯỢNG SINH SẢN Ở MỸ NĂM 1988
1.

Tổng quan về chất lượng sinh sản ở Mỹ (cân nặng khi sinh – bwght)
Chất lượng sinh sản luôn là vấn đề đáng quan tâm của xã hội, của cộng đồng

và đặc biệt là sự quan tâm của mỗi gia đình. Chất lượng sinh sản phụ thuộc vào
vô vàn các yếu tố khác nhau. Sau những lần bàn luận kỹ lưỡng, chúng em đã
chọn ra những nhân tố tiêu biểu tác động đến chất lượng sinh sản (thể hiện qua
cân nặng khi sinh) bao gồm thu nhập của gia đình, trình độ học vấn của bố, trình
độ học vấn của mẹ, màu da, thứ tự đứa trẻ được sinh ra trong gia đình và việc
người mẹ có hút thuốc hay không.
2.

Cơ sở lý luận về ảnh hưởng của các nhân tố đã chọn tới chất lượng
sinh sản ở Mỹ
Dựa trên cơ sở lý thuyết và những nghiên cứu trước đó, chất lượng sinh sản


ở Mỹ năm 1988 (cân nặng của trẻ khi sinh) phụ thuộc vào các yếu tố thu nhậр
bình quân đầu người, số lượng bác sỹ trên cả nước, yếu tố di truyền, nòi giống,
chủng tộc, sức khỏe và thể lực của người mẹ, thứ tự sinh, … Tuy nhiên trong
phạm vi bài nghiên cứu này, nhóm chúng em chọn các biến sau có ảnh hưởng
đến chất lượng sinh sản tại Mỹ năm 1988: thu nhập của hộ gia đình (faminc),
trình độ học vấn của bố (fatheduc), trình độ học vấn của mẹ (motheduc), thứ tự
sinh của đứa bé trong gia đình (parity), chủng tộc (white) và số điếu thuốc được
hút bởi bà mẹ mang bầu (cigs).
2.1.

Thu nhập trong gia đình (faminc)
Thu nhập hộ gia đình có yếu tố ảnh hưởng rất lớn lên chất lượng sinh sản

của các bà mẹ. Mỗi quốc gia có một mức độ phát triển kinh tế khác nhau, vì thế
thu nhập của các hộ gia đình cũng khác nhau. Kinh tế luôn là yếu tố ảnh hưởng
rất lớn đến các dịch vụ sức khỏe. Chính vì thế, tiềm lực kinh tế, thu nhập bình
quân đầu người cũng phần nào quyết định tới quá trình mang thai của em bé khi
7


sinh. Nếu thu nhập của các hộ gia đình thấp, trong quá trình mang thai người mẹ
không đảm bảo đủ dinh dưỡng và tham gia khám sức khỏe thường xuyên theo
định kì, đặc biệt khi vừa sinh trẻ không đảm bảo các điều kiện, các thủ tục chăm
sóc thiết yếu thì rất có khả năng chất lượng sinh sản sẽ rất thấp.
2.2.

Trình độ học vấn của bố, mẹ (fatheduc, motheduc)
Số năm học vấn cũng phần nào thể hiện trình độ của bố mẹ. Với trình độ cao


hơn dẫn đến nhận thức về sức khỏe sinh sản tốt hơn. Khi có trình độ cao thì bố
mẹ sẽ cách cách chăm sóc sức khỏe của bà mẹ khi đang mang thai từ đó có chế
độ ăn uống sinh hoạt hợp lý và biết các cách phòng tránh các bệnh ảnh hưởng
đến sức khỏe của thai nhi và bà mẹ. Trình độ học vấn của bố mẹ càng cao thì
càng tiếp cận nhanh được với các thông tin để tìm hiểu về các kinh nghiệm cũng
như kĩ năng chăm sóc trẻ khi đang mang thai.
2.3.

Thứ tự đứa bé được sinh trong gia đình (parity)
Số lượng cân nặng của em bé khác nhau bắt nguồn từ thứ tự được sinh trong

gia đình .Đứa bé đầu tiên trong gia đình thường có cân nặng thấp nhất , những
đứa trẻ kế tiếp cũng có sự khác biệt nhất định về cân nặng. Khi mang thai đứa
nhỏ đầu tiên bà mẹ vẫn chưa có nhiều kinh nghiệm và vẫn bỡ ngỡ trong quá
trình mà mình mang thai và đến khi sinh con. Nhưng đến khi mang thai đứa trẻ
thứ hai bà mẹ đã có được kinh nghiệm được rút ra từ khi mang thai lứa đầu từ đó
sẽ có cách để chăm sóc thai nhi được tốt hơn do vậy mà chất lượng sinh sản
cũng sẽ cao hơn.
2.4.

Chủng tộc (Màu da – White)
Năm 1988 vẫn còn dư âm của nạn phân biệt chủng tộc, phân biệt chủng tộc

là nguyên nhân dẫn đến các bà mẹ da đen không nhận được các chính sách xã
hội ở Mỹ như các bà mẹ da trắng. Khi bà mẹ nhận được sự quan tâm của chính
quyền được hỗ trợ chắc chắc chất lượng sinh sản sẽ cao hơn đối với những bà
mẹ ở khu vực không được hưởng các chính sách xã hội. Ví dụ được hỗ trợ về
kinh tế sẽ tăng được một khoản trợ cấp, từ đó tăng cơ hội về các dịch vụ y tế,
8



chăm sóc trẻ em tốt hơn, hay đơn giản là tăng chế độ ăn dinh dưỡng trong khẩu
phần ăn của trẻ.
2.5.

Số điếu thuốc được hút bởi bà mẹ mang bầu (cigs)
Các nhà nghiên cứu cho biết có khoảng 4.000 hóa chất có trong khói thuốc

khi người mẹ hút thuốc sẽ gây hại đến sưc khỏe của mẹ lẫn con. Việc đó ảnh
hưởng đến cân nặng của em bé là điều không tránh được.

9


CHƯƠNG II.
1.

PHƯƠNG PHÁP NGHIÊN CỨU VÀ MÔ HÌNH

Xác định phương pháp nghiên cứu

1.1.

Phương pháp thu thập số liệu
Số liệu đã thu thập thuộc dạng thông tin thứ cấp, dạng số liệu chéo, thể hiện

thông tin về một hay nhiều yếu tố được thu thập tại Mỹ. Số liệu được lấy từ bộ
số liệu DULIEU_KTL có sẵn (file excel có trong phần phụ lục).
1.2.


Phương pháp xử lý số liệu
Sử dụng phần mềm Excel và Stata để xử lý sơ lược số liệu và tính ma trận

tương quan giữa các biến.
1.3.

Phương pháp sử dụng trong nghiên cứu
Chạy phần mềm Stata hồi quy mô hình bằng phương pháp bình phương tối

thiểu thông thường (OLS) để ước lượng ra tham số của các mô hình hồi quy đa
biến. Từ phần mềm Stata ta dễ dàng:
 Xét phân tử phóng đại phương sai VIF nhận biết khuyết tật đa cộng tuyến.
 Dùng kiểm định White để kiểm định khuyết tật phương sai sai số thay đổi
và Robust Standard Errors hồi quy mô hình theo phương pháp sai số chuẩn
mạnh.
 Dùng kiểm định F nhận xét sự phù hợp của mô hình và kiểm định t để ước
lượng khoảng tin cậy cho các tham số trong mô hình.
 Dùng Correlation matrix trong phần mềm Stata để tìm ma trận tương quan
giữa các biến.
 Kiểm định Ramsey’s RESET để kiểm định mô hình có bỏ sót biến không.
 Kiểm định Jacque-Bera để kiểm định phân phối không chuẩn của Ui.

10


2.

Xây dựng mô hình

2.1.


Mô hình gốc
bwght= f(faminc, fatheduc, motheduc, parity, white, cigs)
Mô hình nghiên cứu sự phụ thuộc của chất lượng sinh sản tại Mỹ (cân nặng

khi sinh) với các biến độc lập: thu nhập của hộ gia đình (faminc), trình độ học
vấn của bố (fatheduc), trình độ học vấn của mẹ (motheduc), thứ tự sinh của đứa
bé trong gia đình (parity), chủng tộc (white) và số điếu thuốc được hút bởi bà mẹ
mang bầu (cigs).
2.2.

Mô hình hồi quy tổng quát
Để kiểm tra ảnh hưởng các biến độc lập đến chất lượng sinh sản tại Mỹ,

chúng em vận dụng cơ sở lý thuyết và đề xuất dạng mô hình toán nghiên cứu
như sau:
 Mô hình hồi quy tổng thể ngẫu nhiên:
(PRF)
Trong đó:
Biến phụ thuộc:
- bwght: cân nặng khi sinh (bwght, đơn vị: Ounces)
Biến độc lập:
- faminc: thu nhập của hộ gia đình (faminc, đơn vị: 1000USD)
- fatheduc : trình độ học vấn của cha (fatheduc, đơn vị: năm)
- motheduc : trình độ học vấn của mẹ (motheduc, đơn vị: năm)
- parity : thứ tự sinh của đứa bé trong gia đình
- white : chủng tộc
- cigs : số điếu thuốc được hút bởi bà mẹ mang bầu (cigs, đơn vị: điếu thuốc)
Các chỉ số khác:
11



- ui : Sai số ngẫu nhiên (nhiễu).
- : Hệ số chặn của mô hình
- , , , , , : Hệ số góc ( Hệ số hồi quy riêng)

 Mô hình hồi quy mẫu ngẫu nhiên:
(SRF)
3.

Giải thích các biến

3.1.

Mô tả tổng quan

Bảng 1: Các biến trong mô hình các nhân tố ảnh hưởng đến chất lượng sinh
sản ở Mỹ năm 1988
BIẾN SỐ

TÊN BIẾN

Y

bwght

X1

faminc


X2

fatheduc

X3

motheduc

X4

parity

X5

white

X6

cigs

GIẢI THÍCH
Cân nặng khi sinh

ĐƠN VỊ
Ounces (1ounce =
28,3495 g)

Thu nhập của hộ gia
đình
Trình độ học vấn của bố

Trình độ học vấn của
mẹ
Thứ tự sinh của đứa bé
trong gia đình
Chủng tộc
= 1 nếu da trắng
= 0 nếu da màu
Số điếu thuốc bà mẹ hút
khi mang thai

1000USD

+

Năm

+

Năm

+

-

+

-

+


Điếu thuốc

-

Trong đó: bwght là biến phụ thuộc, các biến còn lại là biến độc lập
3.2.

Mô tả thống kê
Mô tả thống kê số liệu: dùng lệnh sum trong stata:

sum bwght faminc fatheduc motheduc parity white cigs
Ta có bảng sau:

12

KỲ
VỌNG
DẤU


Bảng 2: Thống kê dữ liệu mô tả nghiên cứu
Tên biến
(Variable)

Số quan sát
(Obs)

bwght
faminc
fatheduc

motheduc
parity
white
cigs

1388
1388
1192
1387
1388
1388
1388

Giá trị
trung bình
(Mean)
118.6996
29.02666
13.18624
12.93583
1.632565
0.7845821
2.087176

Độ lệch
chuẩn
(Std. Dev.)
20.35396
18.73928
2.745985

2.376728
0.8940273
0.4112601
5.972688

Giá trị nhỏ
nhất
(Min)
23
0.5
1
2
1
0
0

Giá trị lớn
nhất
(Max)
271
65
18
18
6
1
50

Từ bảng thống kê trên, ta có thể thấy được sự chênh lệch lớn giữa giá trị nhỏ
nhất và giá trị lớn nhất của các biến.
3.3.


Mô tả chi tiết
Dùng lệnh:

tab để mô tả chi tiết từng biến bao gồm các thông tin tần suất (Freq.), phần trăm
(Percent), phần trăm tích lũy cộng phần trăm từ trên xuống (Cum.)
3.3.1. Cân nặng khi sinh (bwght)
Bảng 3: Thống kê dữ liệu biến bwght
Cân nặng khi sinh
(ounces)
23
30
35
38
43
50
52
54
56
58
60
61
64
68
69
-more-

Tần suất
(Freq.)
1

1
1
1
1
1
1
1
1
2
2
1
3
3
1

Phần trăm
(Percent)
0.07
0.07
0.07
0.07
0.07
0.07
0.07
0.07
0.07
0.14
0.14
0.07
0.22

0.22
0.07

 Cân nặng khi sinh từ 23-72 ounces
13

Phần trăm tích lũy
(Cum.)
0.07
0.14
0.22
0.29
0.36
0.43
0.50
0.58
0.65
0.79
0.94
1.01
1.22
1.44
1.51


 Đa số các giá trị của biến chiếm tỷ trọng là 0.07% - nhỏ nhất và 0.14%,
0.22% theo thứ tự tăng dần
3.3.2. Thu nhập của hộ gia đình (faminc)
Bảng 4: Thống kê dữ liệu biến faminc
Thu nhập hộ gia đình

(1000USD)
0.5
1.5
2.5
3.5
4.5
5.5
6.5
7.5
8.5
9.5
10.5
11.5
12.5
13.5
14.5
15.5
16.5
17.5

Tần suất

Phần trăm

Cum.

19
13
22
20

27
22
34
22
23
28
24
18
27
27
22
31
21
30

1.37
0.94
1.59
1.44
1.95
1.59
2.45
1.59
1.66
2.02
1.73
1.30
1.95
1.95
1.59

2.23
1.51
2.16

1.37
2.31
3.89
5.33
7.28
8.86
11.31
12.90
14.55
16.57
18.30
19.60
21.54
23.49
25.07
27.31
28.82
30.98

-more Giá trị biến thu nhập giao động từ 0.5- 17.5 nghìn đôla
 Thu nhập trung bình chủ yếu rơi vào 6.5 nghìn đôla (2.45%) và thu nhập trải
khá đều từ 0.5- 17.5 nghìn đôla
3.3.3. Trình độ học vấn của bố (fatheduc)

Bảng 5: Thống kê dữ liệu biến fatheduc
Số năm đi học của bố

(năm)

Tần suất

Phần trăm
14

Cum.


1
2
4
3
4
10
10
22
17
49
64
443
87
115
43
189
32
97

1

2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

0.08
0.17
0.34
0.25
0.34
0.84
0.84
1.85
1.43
4.11
5.37
37.16

7.3
9.65
3.61
15.86
2.68
8.14

0.08
0.25
0.59
0.84
1.17
2.01
2.85
4.70
6.12
10.23
15.60
52.77
60.07
69.71
73.32
89.18
91.86
100.00

Tổng
1192
100
 Số năm học vấn của bố trải dài từ 1-18 năm , trình độ học vấn chủ yếu của bố

chủ yếu là 12 năm với tỷ lệ khá cao
 Vẫn tồn tại số năm học vấn của bố chỉ từ 1-7 năm , thể hiện thời gian học tập
ngắn ,nhưng chỉ chiếm tỷ lệ là dưới 1%
 Qua đây, ta thấy trình độ học vấn của bố theo số liệu nghiên cứu nằm ở mức
trung bình, chủ yếu mang tính phổ thông.
3.3.4. Trình độ học vấn của mẹ (motheduc)
Bảng 6: Thống kê dữ liệu biến motheduc
Số năm đi học của mẹ
(năm)
2
3
4
5
6
7
8
9
10

Tần suất

Phần trăm

Cum.

1
1
1
2
9

7
21
43
70

0.07
0.07
0.07
0.14
0.65
0.50
1.51
3.10
5.05

0.07
0.14
0.22
0.36
1.01
1.51
3.03
6.13
11.18

15


11
12

13
14
15
16
17
18
Tổng

67
562
122
151
41
198
37
54
1387

4.83
40.52
8.80
10.89
2.96
14.28
2.67
3.89
100.00

16.01
56.52

65.32
76.21
79.16
93.44
96.11
100.00

 Số năm học vấn của mẹ được nghiên cứu từ 2 đến 18 năm , khác với số
học vấn của bố , trình độ học vấn của mẹ không bao gồm số năm là 1
 Giống với số năm học vấn của bố , số năm học vấn của mẹ chủ yếu là 12
năm chiếm dến ( 40.52%)
 Người mẹ có trình độ học vấn khá cao cũng chiếm 14.28% trong dữ liệu
nghiên cứu với 16 năm học vấn
3.3.5. Thứ tự đứa trẻ được sinh (parity)
Bảng 7: Thống kê dữ liệu biến parity
Thứ tự đứa trẻ được
Tần suất
Phần trăm
Cum.
sinh
1
795
57.28
57.28
2
389
28.03
85.30
3
146

10.52
95.82
4
39
2.81
98.63
5
15
1.08
99.71
6
4
0.29
100.00
Tổng
1388
100.00
 Thứ tự sinh của các đứa bé được nghiên cứu hoàn toàn chỉ từ 1 đến 6
 Phần trăm số đứa bé được nghiên cứu theo thứ tự 1 đến 6 giảm dần và bắt
đầu giảm mạnh từ thứ tự sinh thứ 3
 Nghiên cứu tập trung nhiều vào cân nặng của đứa bé là đứa bé đầu lòng
với 57.28%
 Con đầu lòng thường có xu hướng nhỏ hơn so với các bé sinh sau này.
Tuy nhiên, nếu khoảng cách giữa hai lần sinh quá ngắn, cơ thể người mẹ
chưa kịp hồi phục, thai nhi ở lần sinh sau có thể bị nhẹ cân.
16


3.3.6. Chủng tộc (white)
Bảng 8: Thống kê dữ liệu biến white

= 1 if white
Tần suất
Phần trăm
Cum.
0
299
21.54
21.54
1
1089
78.46
100.00
Tổng
1388
100.00
 Biến giả white nhận giá trị là 1 khi đứa bé được nghiên cứu có màu da
trắng chiếm 78.46 % trong tất cả đứa bé được nghiên cứu
 Biến gải white nhận giá trị là 0 khi đứa bé mang màu da đen và tỷ lệ màu
da này được nghiên cứu chưa được một phần ba màu da trắng, chỉ với
21.54%
3.3.7. Số điếu thuốc bà mẹ hút khi mang thai (cigs)
Bảng 9: Thống kê dữ liệu biến cigs
Số điếu thuốc hút bà mẹ
hút khi mang bầu
(mỗi ngày)
0
1
2
3
4

5
6
7
8
9
10
12
15
20
30
40
46
50

Tần suất
1176
3
4
7
9
19
6
4
5
1
55
5
19
62
5

6
1
1

Phần trăm

Cum.

84.73
0.22
0.29
0.50
0.65
1.37
0.43
0.29
0.36
0.07
3.96
0.36
1.37
4.47
0.36
0.43
0.07
0.07

84.73
84.94
85.23

85.73
86.38
87.75
88.18
88.47
88.83
88.90
92.87
93.23
94.60
99.06
99.42
99.86
99.93
100.00

Tổng
1388
100.00
 Số điếu thuốc được hút mỗi ngày khi mang bầu từ 0 đến 50 điếu

17


 Hầu như các bà mẹ đều không hút thuốc khi mang bầu , chiếm 84.73%
 Tuy nhiên , số điếu thuốc vẫn được hút mỗi ngày bởi các bà mẹ khác , đặc
biệt 20 điếu thuốc mỗi chiếm đến 4.4%
3.4.

Ma trận tương quan giữa các biến

Sử dụng lệnh Corr trong Stata để tìm ra ma trận tương quan giữa các biến

độc lập và biến phụ thuộc của mô hình.
. corr bwght faminc fatheduc motheduc parity cigs
(obs=1191)
Bảng 10: Kết quả xây dựng ma trận tương quan giữa các biến
bwght
faminc
fatheduc motheduc parity
bwght
1.0000
faminc
0.0799
1.0000
fatheduc 0.0830
0.4477
1.0000
motheduc 0.0451
0.4271
0.6435
1.0000
parity
0.0695
-0.0567
-0.0452
-0.0960
1.0000
cigs
-0.1646
-0.1554

-0.1803
-0.2167
0.0419
Dựa vào ma trận hệ số tương quan giữa các biến ta thấy:

cigs

1.0000

- r(bwght, faminc)= 0.0799
 Sự tương quan tương đối thấp.
 Hệ số này dương, điều này cho thấy mối quan hệ tỉ lệ thuận giữa cân
nặng khi sinh và thu nhập của hộ gia đình.
- r(bwght, fatheduc)= 0.083
 Sự tương quan tương đối thấp.
 Hệ số này dương, điều này cho thấy mối quan hệ tỉ lệ thuận giữa cân
nặng khi sinh và trình độ học vấn của bố.
- r(bwght, motheduc)= 0.0451
 Sự tương quan tương đối thấp.
18


- Hệ số này dương, điều này cho thấy mối quan hệ tỉ lệ thuận giữa cân nặng
khi sinh và trình độ học vấn của mẹ.
- r(bwght, parity)= 0.0695
 Sự tương quan tương đối thấp.
 Hệ số này dương, điều này cho thấy mối quan hệ tỉ lệ thuận giữa cân
nặng khi sinh và thứ tự sinh của trẻ.
- R(bwght, cigs)= -0.1646
 Sự tương quan tương đối cao.

- Hệ số này âm, điều này cho thấy mối quan hệ tỉ lệ nghịch giữa cân nặng
khi sinh và số điếu thuốc người mẹ hút khi mang thai.
Ta thấy biến cigs (-16,46 %) có tác động mạnh nhất tới biến phụ thuộc hay
số điếu thuốc được hút mỗi ngày lúc mang thai tác động mạnh nhất đến cân
nặng của bé khi sinh (chất lượng sinh sản). Dấu âm thể hiện mối quan hệ ngược
chiều hay nói cách khác nếu số điếu thuốc hút mỗi ngày tăng lên thì cân nặng
đứa bé khi sinh cũng giảm xuống (đứa bé sinh ra yếu hơn). Hệ số tương quan
với các biến con lại đều mang dấu dương tức là các biến có mối quan hệ cùng
chiều với nhau.
Mối quan hệ tương quan giữa các biến độc lập nhìn chung không cao. Hơn
nữa không có hệ số tương quan nào > 0,8 nên sẽ không xảy ra hiện tượng đa
cộng tuyến.

19


CHƯƠNG III. ƯỚC LƯỢNG, KIỂM ĐỊNH MÔ HÌNH VÀ SUY
DIỄN THỐNG KÊ
1.

Mô hình ước lượng

1.1.

Mô hình hồi quy tổng thể và mô hình hồi quy mẫu
Hàm hồi quy tổng thể (PRF) biểu diễn mối liên hệ giữa biến phụ thuộc

bwght với các biến độc lập faminc, fatheduc, motheduc, parity, white, cigs như
sau:


Hàm hồi quy mẫu tương ứng (SRF):

1.2.

Bảng kết quả
Sử dụng phần mềm Stata, hồi quy mô hình bằng phương pháp bình phương

nhỏ nhất OLS, ta thu được kết quả như sau:
Tổng bình phương sai số
tổng cộng TSS
Tổng bình phương sai số
Hệ số xác định
0.0453
được giải thích ESS
Tổng bình phương sai số
Hệ số xác định hiệu chỉnh 0.0405 không giải thích được
RSS
P-value
0.0000 Sai số chuẩn của phần dư
Fquan sát F(6, 1184)
9.37
Số quan sát

1191

482746.69
2
21874.571
3
460872.12

1
19.729

 Bậc tự do của phần được giải thích Dfm= 6.
 Bậc tự do của phần dư Dfr = 1184.

Tên biến

Hệ số ước
lượng ()

Sai số
chuẩn

Thống kê
t

20

P-value

Khoảng tin cậy với
mức ý nghĩa 5%


faminc
fatheduc
motheduc
parity
white

cigs
Hệ số tự
do

1.3.

0.0368
0.4344
-0.3304
1.8643
4.6058
-0.6105

se()
0.0371
0.2821
0.3192
0.6579
1.6142
0.1101

0.99
1.54
-1.04
2.83
2.85
-5.54

0.322
0.124

0.301
0.005
0.004
0.000

-0.0359
-0.1190
-0.9567
0.5734
1.4388
-0.8265

0.1095
0.9879
0.2958
3.1553
7.7728
-0.3944

111.1363

3.9023

28.48

0.000

103.4801

118.7925


Phân tích kết quả
Từ kết quả ước lượng trên, ta thu được hàm hồi quy mẫu như sau:

Mô hình cho ta thấy: Biến parity, white, cigs thật sự có ảnh hưởng đến biến
phụ thuộc bwght. Còn các biến faminc, fatheduc và motheduc có ảnh hưởng hay
không, ta sẽ tìm hiểu ở mục kiểm định hệ số hồi quy.
Hệ số xác định R2 = 4.53% thể hiện mức độ phù hợp của hàm hồi quy mẫu.
Ngoài ra, giá trị của R2 còn cho biết các biến X (faminc, fatheduc, motheduc,
parity, white, cigs) giải thích được 4.53 % sự giao động của biến Y (bwght). Nói
cách khác, 4.53% sự giao động của cân nặng đứa bé khi sinh (chất lượng sinh
sản) được giải thích bởi: thu nhập gia đình, trình độ học vấn của cha, trình độ
học vấn của mẹ, thứ tự sinh của đứa bé trong gia đình, màu da và số điếu thuốc
lá được hút mỗi ngày khi đang mang thai. Như vậy còn lại sự giao động của biến
Y được giải thích bởi các biến độc lập khác. Các biến này nằm ở .
Ý nghĩa của các hệ số hồi quy riêng phần:
Đối với: Khi các biến số faminc, fatheduc, motheduc, parity, white, cigs có
giá trị bằng không, cân nặng khi sinh của trẻ tại Mỹ trung bình là 111.136, đó
chính là trung bình ảnh hưởng của các yếu tố khác không nằm trong mô hình lên
chất lượng sinh sản ở Mỹ.
Đối với : Khi fatheduc, motheduc, parity, white, cigs không đổi và nếu
faminc tăng (giảm) 1 đơn vị thì tỷ lệ bwght trung bình tăng (giảm) 0.037 đơn vị.
21


Đối với : Khi faminc, motheduc, parity, white, cigs không đổi và nếu
fatheduc tăng (giảm) 1 đơn vị thì bwght trung bình tăng (giảm) 0.434 đơn vị.
Đối với : Khi faminc, fatheduc, parity, white, cigs không đổi và nếu
motheduc tăng (giảm) 1 đơn vị thì bwght trung bình giảm (tăng) 0.330 đơn vị.
Đối với : Khi faminc, fatheduc, motheduc, white, cigs không đổi và nếu

parity tăng (giảm) 1 đơn vị thì bwght trung bình tăng (giảm) 1.864 đơn vị.
Đối với : Khi faminc, fatheduc, motheduc, parity, cigs không đổi và nếu
white tăng (giảm) 1 đơn vị thì bwght trung bình tăng (giảm) 4.606 đơn vị.
Đối với : Khi faminc, fatheduc, motheduc, parity, white không đổi và nếu
cigs tăng (giảm) 1 đơn vị thì bwght trung bình giảm (tăng) 0.611 đơn vị.
2.

Kiểm định và khắc phục các khuyết tật của mô hình

2.1.

Đa cộng tuyến
Bản chất:
Mô hình tốt là mô hình phải đạt được các tính chất BLUE ( tuyến tính,

không chệch, hiệu quả nhất ). Tuy nhiên trên thực tế do xây dựng sai mô hình
hoặc do bản chất của dữ liệu, dẫn tới mô hình không đạt được đầy đủ các tính
chất trên.
Một trong những vấn đề ảnh hưởng đến mô hình mà ta gọi là vi phạm các
giải định, đó là đa cộng tuyến.
Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các
biến độc lập Xi trong mô hình hồi quy đa biến có tương quan tuyến tính với
nhau.
Nguyên nhân:
Có 3 nguyên nhân gây ra vấn đề đa cộng tuyến:
- Đa cộng tuyến hoàn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện
tượng đa cộng tuyến hoàn hảo ít khi xảy ra

22



- Đa cộng tuyến không hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã
hội mà các biến độc lập đã có sẵn mối quan hệ cộng tuyến với nhau
- Đa cộng tuyến không hoàn hảo xảy ra do số liệu điều tra không đủ lớn,
hay số liệu điều tra không ngẫu nhiên
Cách phát hiện đa cộng tuyến:
Cách 1: Tương quan cao giữa các biến
Dùng lệnh corr[indep] để kiểm định đa cộng tuyến. Nếu giữa 2 biến có giá
trị corr > 0.8 thì mô hình có khả năng xảy ra đa cộng tuyến.
Sử dụng phần mềm stata và lệnh corr, “corr bwght faminc fatheduc
motheduc parity white cigs”, ta thu được kết quả như sau:
Bảng 11: Bảng tương quan giữa các biến
(obs=1,191)

bwght
faminc
fatheduc
mothedu
c
parity
white
cigs

fathedu
c

mothedu
c

bwght


faminc

1.0000
0.0799
0.0830

1.0000
0.4477

1.0000

0.0451

0.4271

0.6435

1.0000

0.0695 -0.0567 -0.0452
0.0877 0.2052 0.1111
-0.1646 -0.1554 -0.1803

-0.0960
0.0644
-0.2167

parity


white

1.0000
-0.0472 1.0000
0.0419 0.0139

cigs

1.0000

Có thể thấy hệ số tương quan giữa các biến đều tương đối thấp, do vậy có cơ
sở để kết luận không có đa cộng tuyến trong mô hình.
Cách 2: Sử dụng VIF:
Chúng ta biết rằng nếu VIF>10 thì cũng có thể xảy ra đa cộng tuyến.
Sử dụng Stata để tính VIF: estat vif
Bảng 12: Kết quả thừa số tăng phương sai VIF
Biến độc lập
Faminc
Fatheduc

VIF
1.83
1.82

1/VIF
0.546944
0.549333
23



Motheduc
Parity
White
Cigs
Giá trị TB VIF

1.35
1.06
1.05
1.01
1.35

0.738140
0.944363
0.951810
0.987656

Ta thấy VIF đều tương đối nhỏ, như vậy có cơ sở để kết luận mô hình không
có đa cộng tuyến.
Như vậy, cả 2 cách kiểm định đều cho cùng một kết luận: mô hình không có
đa cộng tuyến.
2.2.

Kiểm định phương sai sai số thay đổi
Nhận biết: Hồi quy mô hình gốc ta thu được mô hình mẫu và các phần dư .
Giả sử mô hình mắc khuyết tật phương sai sai số thay đổi, và sự thay đổi của

phương sai đó phụ thuộc vào biến độc lập, bình phương biến độc lập và tích
chéo giữa các biến độc lập với nhau (tích chéo giữa 2 biến độc lập).
Thực hiện hồi quy phụ mô hình:


Trong đó: X1: faminc, X2: fatheduc, X3: motheduc, X4: parity, X5: white,
X6: cigs.
Tiến hành kiểm định Imtest, White bằng phần mềm Stata ta thu được kết
quả:
Bảng 13: Kết quả kiểm định Imtest, White phương sai sai số thay đổi
Kiểm định Imtest, White phương sai sai số thay đổi
Giả thuyết H0: Không có hiện tượng phương sai sai số thay đổi
chi2(26) = 7.10
Prob > chi2 =

0.9999

Xét cặp giả thuyết:
tại
24


×