TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ & KINH DOANH QUỐC TẾ
TIỂU LUẬN
CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN SỐ LƯỢNG CON TRONG GIA ĐÌNH
Hà Nội, 12/2016
Mục lục
MỞ ĐẦU
Gia tăng dân số đang ngày càng ảnh hưởng sâu sắc hơn đối với nền kinh tế xã hội của không chỉ riêng một quốc gia nào mà còn mang ảnh hưởng tới toàn cầu.
Một trong những yếu tố cốt lõi của sự gia tăng dân số ngày càng có xu hướng đi
lên mạnh mẽ này xuất phát từ số lượng con cái trong mỗi hộ gia đình.
Các quốc gia trên thế giới ngày nay đều đề cao việc nhận thức của mỗi cặp vợ
chồng về việc kế hoạch hóa gia đình đảm bảo không chỉ cho điều kiện sinh sống,
sự ổn định và kinh tế của mỗi hộ gia đinh mà còn cho góp phần vào sự phát triển
an sinh xã hội.
Bên cạnh các yêu tố chính trị-xã hội ảnh hưởng đến số lượng thành viên trong mỗi
gia đình, nhóm chúng em còn nhận thấy có nhiều yếu tố ảnh hưởng một cách sâu
sắc như : Độ tuổi, trình độ học vấn, tôn giáo, nơi sinh sống … Và để đưa ra một cái
nhìn tổng quan về vấn đề này cũng như phân tích đánh giá về mức độ ảnh hưởng
của một số yếu tố đặc biệt được rút ra từ các quan sát thông qua bộ dữ liệu
DTA.19. Nhóm chúng em đã cân nhắc chọn đề tài này
Trong quá trình làm báo cáo không thể tránh khỏi những sai sót, kính mong nhận
được sự góp ý để nhóm chúng em hoàn thiện hơn
Chúng em xin chân thành cảm ơn cô
NỘI DUNG
I)
1.
Mô tả dữ liệu
Tổng quan
Sau khi xem xét ý nghĩa các biến trong file 19.dta, nhóm chúng em quyết định
chọn mô hình để phân tính hồi quy gồm các biến như sau:
• Biến phụ thuộc: children
• Biến độc lập:
- X1: age
- X2: edu
- X3: agefbrth
- X4: agefm
- X5: heduc
- X6: urban
Dưới đây là kết quả thu được khi tiến hành mô tả biến phụ thuộc và các biến độc
lập trên bằng lệnh des
. des age educ agefbrth agefm heduc urban
storage display
variable name type format
age
educ
agefbrth
agefm
heduc
urban
Tên biến
Age
Edu
Agefbrth
byte
byte
byte
byte
byte
byte
%8.0g
%8.0g
%8.0g
%8.0g
%8.0g
%8.0g
value
label
variable label
age in years
years of education
age at first birth
age at first marriage
husband's years of education
=1 if live in urban area
Định dạng hiển Đơn vị tính
thị
%0,8g
năm
%0,8g
năm
%0,8g
năm
4
Ý nghĩa biến
Số tuổi
Số năm học
Tuổi ở lần sinh đầu
Agefm
%0,8g
năm
Heduc
%0,8g
năm
Urban
%0,8g
tiên
Tuổi ở lần cưới
đầu tiên
Số năm học của
chồng
=1 nếu sống ở
ngoại ô
Sau đó, ta sử dụng lệnh sum để tiếp tục mô tả các biến trên:
. sum children age educ agefbrth agefm heduc urban
Variable
Obs
Mean
Std. Dev.
Min
Max
children
age
educ
agefbrth
agefm
4361
4361
4361
3273
2079
2.267828
27.40518
5.855996
19.0113
20.68639
2.222032
8.685233
3.927075
3.092333
5.002383
0
15
0
10
10
13
49
20
38
46
heduc
urban
1956
4361
5.144683
.5166246
4.803028
.4997808
0
0
20
1
Dựa theo kết quả trên, ta có bảng tổng hợp sau:
Biến
Children
Age
Edu
Agefbrth
Agefm
Số
quan Giá
trị
sát
trung bình
4361
2.267828
4361
27.40518
4361
5.855996
3273
19.0113
2079
20.68639
Độ
lệch
chuẩn
2.222032
8.685233
3.927075
3.092333
5.002383
5
Giá trị nhỏ Giá trị lớn
nhất
nhất
0
13
15
49
0
20
10
38
10
46
Heduc
Urban
1956
4361
5.144683
0.5166246
4.803028
0.4997808
0
0
20
1
2.
Mô tả chi tiết các biến trong mô hình
Để mô tả chi tiết các biến đã chọn, ta sử dụng lệnh tab đối với từng biến:
6
2.1) Age: Tuổi
. tab age
age in
years
Freq.
Percent
Cum.
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
151
205
141
243
205
219
172
206
156
196
184
201
149
192
153
163
118
138
106
118
105
103
70
102
73
75
72
42
35
48
44
48
44
50
34
3.46
4.70
3.23
5.57
4.70
5.02
3.94
4.72
3.58
4.49
4.22
4.61
3.42
4.40
3.51
3.74
2.71
3.16
2.43
2.71
2.41
2.36
1.61
2.34
1.67
1.72
1.65
0.96
0.80
1.10
1.01
1.10
1.01
1.15
0.78
3.46
8.16
11.40
16.97
21.67
26.69
30.64
35.36
38.94
43.43
47.65
52.26
55.68
60.08
63.59
67.32
70.03
73.19
75.62
78.33
80.74
83.10
84.71
87.04
88.72
90.44
92.09
93.05
93.85
94.96
95.96
97.06
98.07
99.22
100.00
Total
4,361
100.00
ge
Độ tuổi dao động từ 15 đến 49 tuổi. Trong đó, độ tuổi 18 có quan sát lớn nhất là
243 quan sát, chiếm 5,57% và độ tuổi 49 có số quan sát nhỏ nhất là 34 quan sát
7
chiếm 0,78%. Số quan sát giảm dần đều khi độ tuổi tăng dần lên, hơn 50% số liệu
thu thập được phân bố ở độ tuổi 18 – 26.
2.2) Edu: Trình độ học vấn
. tab educ
years of
education
Freq.
Percent
Cum.
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
906
60
104
142
194
234
298
1,162
184
232
527
33
165
19
36
25
17
15
3
4
1
20.78
1.38
2.38
3.26
4.45
5.37
6.83
26.65
4.22
5.32
12.08
0.76
3.78
0.44
0.83
0.57
0.39
0.34
0.07
0.09
0.02
20.78
22.15
24.54
27.79
32.24
37.61
44.44
71.08
75.30
80.62
92.71
93.46
97.25
97.68
98.51
99.08
99.47
99.82
99.89
99.98
100.00
Total
4,361
100.00
.
Biến educ dao động từ 0-20 chỉ số năm học của mỗi cá nhân. Giá trị 0 thể hiện số
người không có giáo dục phổ thông chiếm tỷ lệ khá lớn 20,78% với 906 quan sát.
Số quan sát lớn nhất ở giá trị 7 năm với 1162 quan sát và chiếm tỷ lệ 26,65% . Tỷ
lệ quan sát giảm dần khi số năm tăng và thấp nhất là tại giá trị 20 chỉ với 1 quan sát
và chiếm 0,02%
8
2.3) Agefbrth: Số tuổi khi lần đầu sinh
. tab agefbrth
age at
first birth
Freq.
Percent
Cum.
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
37
38
1
3
17
19
50
171
301
488
558
504
368
274
176
99
68
37
51
25
17
15
11
3
5
3
4
2
1
2
0.03
0.09
0.52
0.58
1.53
5.22
9.20
14.91
17.05
15.40
11.24
8.37
5.38
3.02
2.08
1.13
1.56
0.76
0.52
0.46
0.34
0.09
0.15
0.09
0.12
0.06
0.03
0.06
0.03
0.12
0.64
1.22
2.75
7.97
17.17
32.08
49.13
64.53
75.77
84.14
89.52
92.55
94.62
95.75
97.31
98.08
98.59
99.05
99.39
99.48
99.63
99.73
99.85
99.91
99.94
100.00
Total
3,273
100.00
.
Biến agefbrth thể hiện độ tuổi sinh con đầu lòng của các bà mẹ. Độ tuổi thấp nhất
là 10 tuổi trải dài đến cao nhất là 38 tuổi. Ở độ tuổi 18, số quan sát chiếm tỷ lệ cao
nhất là 17,05% với 558 quan sát. Ở độ tuổi 10, số quan sát thu được ít nhất là 1
chiếm 0,03%. Số liệu thu được chủ yếu tập trung ở độ tuổi 15 đến 22 tuổi, độ tuổi
từ vị thành niên đến mới trưởng thành và tập trung rất ít ở 2 phía còn lại.
9
2.4) Agefm: Số tuổi khi lập gia đình
. tab agefm
age at
first
marriage
Freq.
Percent
Cum.
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
43
44
46
5
5
13
38
42
111
170
190
205
212
190
180
125
114
88
73
74
43
32
37
32
19
24
14
9
8
5
5
3
4
2
1
1
3
2
0.24
0.24
0.63
1.83
2.02
5.34
8.18
9.14
9.86
10.20
9.14
8.66
6.01
5.48
4.23
3.51
3.56
2.07
1.54
1.78
1.54
0.91
1.15
0.67
0.43
0.38
0.24
0.24
0.14
0.19
0.10
0.05
0.05
0.14
0.10
0.24
0.48
1.11
2.93
4.95
10.29
18.47
27.61
37.47
47.67
56.81
65.46
71.48
76.96
81.19
84.70
88.26
90.33
91.87
93.65
95.19
96.10
97.26
97.93
98.36
98.75
98.99
99.23
99.37
99.57
99.66
99.71
99.76
99.90
100.00
Total
2,079
100.00
.
Biến agefm mô tả độ tuổi kết hôn lần đầu tiên của những người phụ nữ được quan
sát. Giá trị của biến dao động từ 10 đến 46 tuổi. Số quan sát thu được chủ yếu tập
10
trung trong khoảng 15 – 23 tuổi, chiếm khoảng 66,67%. Số lượng quan sát giảm
dần về 2 biên của giá trị.
2.5) Heduc
. tab heduc
husband's
years of
education
Freq.
Percent
Cum.
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
692
25
47
64
73
62
102
396
17
35
210
9
99
8
29
35
26
17
4
4
2
35.38
1.28
2.40
3.27
3.73
3.17
5.21
20.25
0.87
1.79
10.74
0.46
5.06
0.41
1.48
1.79
1.33
0.87
0.20
0.20
0.10
35.38
36.66
39.06
42.33
46.06
49.23
54.45
74.69
75.56
77.35
88.09
88.55
93.61
94.02
95.50
97.29
98.62
99.49
99.69
99.90
100.00
Total
1,956
100.00
.
Biến heduc thể hiện số năm theo học hay được giáo dục của người chồng. Biến
heduc cũng chạy từ 0 đến 18 . Có sự tương đồng với biến educ khi số lượng quan
sát chiếm tỷ lệ lớn nhất tại giá trị 7 với 20,25% và nhỏ nhất tại 20 với 2 quan sát
chiếm 0,1%.
11
2.6) Urban: Ngoại ô
. tab urban
=1 if live
in urban
area
Freq.
Percent
Cum.
0
1
2,108
2,253
48.34
51.66
48.34
100.00
Total
4,361
100.00
Biến urban = 1 nếu sống ở khu vực thành thị chiếm 48,34 %
Biến urban = 0 nếu không sống ở khu vực thành thị chiếm tỷ lệ lớn hơn với
51,66%
12
1.
II. Mô hình hồi quy và phân tích hồi quy
Hàm hồi quy tổng thể và hàm hồi quy mẫu
Hàm hồi quy tổng thể (PRF) biểu diễn mối liên hệ giữa biến phụ thuộc children
(số con cái) với các biến độc lập age, educ, agefbrth, agefm, heduc, urban như sau:
Children= �0 + �1 * age + �2 * educ+ �3 * agefbrth+ �4 * agefm + �5 *heduc +
�6 *urban + � �
Hàm hồi quy mẫu tương ứng (SRF):
Children=
+
βˆ
βˆ
0+
βˆ
1 * age +
βˆ
2 * educ+
βˆ
3* agefbrth+
βˆ
4* agefm +
βˆ
5 *heduc
6 *urban + ��
2.
Kiểm định khuyết tật của mô hình :
2.1) Kiểm tra tính đa cộng tuyến
Bảng tương quan và mối quan hệ tương quan giữa các biến
Dùng lệnh corr để biểu diễn mỗi quan hệ tương quan giữa các biến, ta có bảng
tương quan dưới đây:
children
age
educ
agefbrth
agefm
heduc
urban
children
age
1.0000
0.5843
-0.3238
-0.1643
0.0406
-0.2997
-0.2227
1.0000
-0.1620
0.2889
0.3316
-0.1241
-0.1251
educ agefbrth
1.0000
0.2093
0.0656
0.6509
0.3108
13
1.0000
0.4097
0.1629
0.0183
agefm
heduc
1.0000
0.0706
0.0347
1.0000
0.3722
- Hệ số tương quan giữa biến children và age là 58,43%
- Hệ số tương quan giữa biến children và educ là -32,38%
- Hệ số tương quan giữa biến children và agefbrth là -16,43%
- Hệ số tương quan giữa biến children và agefm là 4,06%
- Hệ số tương quan giữa biến children và heduc là -29,97%
- Hệ số tương quan giữa biến children và urban là -22,27%
Ta thấy biến age (58,43%) có tác động mạnh nhất tới biến phụ thuộc
Các biến có mối liên hệ tương quan rất yếu với biến phụ thuộc naffairs (relig là
-14.45% và ratemarr là -27.95%), dấu âm thể hiện mối quan hệ giữa biến phụ
thuộc với các biến này là ngược chiều nhau.
Có thể tính được hệ số phóng đại phương sai VIF (Variance inflation factor) như
sau :
Từ bảng trên ta nhận thấy mô hình có tính cộng tuyến thấp hay mô hình không có
tính đa cộng tuyến do vif của các tham số đều nhỏ hơn mức cho phép là 10 nhiều
lần. Nhìn chung mối quan hệ tương quan giữa các biến độc lập không cao, do vậy
chúng em dự đoán mô hình không có bệnh đa cộng tuyến.
14
2.2) Kiểm tra phương sai sai số thay đổi :
Chạy mô hình hồi quy
Trong Stata, sử dụng lệnh reg để chạy hồi quy mối quan hệ giữa biến phụ
thuộc và các biến độc lập ta nhận thấy kết quả như sau:
15
. reg children age educ agefbrth agefm heduc urban
Source
SS
df
MS
Model
Residual
4330.88775
4374.14227
6
1825
721.814626
2.39679028
Total
8705.03002
1831
4.75424906
children
Coef.
age
educ
agefbrth
agefm
heduc
urban
_cons
.1869834
-.0338148
-.2053728
-.0157083
-.0425124
-.3438606
2.447507
Std. Err.
.00529
.0115488
.012752
.0081481
.0102084
.0788093
.2449416
Number of obs
F( 6, 1825)
Prob > F
R-squared
Adj R-squared
Root MSE
t
P>|t|
35.35
-2.93
-16.11
-1.93
-4.16
-4.36
9.99
0.000
0.003
0.000
0.054
0.000
0.000
0.000
=
=
=
=
=
=
1832
301.16
0.0000
0.4975
0.4959
1.5482
[95% Conf. Interval]
.1766084
-.0564651
-.2303827
-.0316888
-.0625337
-.4984264
1.967112
.1973585
-.0111644
-.1803628
.0002723
-.0224911
-.1892948
2.927902
Ứng dụng kiểm định Breusch-Pagan-Godfrey trong việc kiểm định phương sai sai
số thay đổi:
Đặt giả thuyết :
•
•
Ho : =const
H1 :
Nhận thấy Prob > chi2 < mức ý nghĩa , suy ra ta bác bỏ giả thiết H0 về tính
phương sai sai số thuần nhất của mô hình.
Chạy lại mô hình với lệnh robust, ta có :
16
3.
Phương trình hồi quy
Dựa vào kết quả chạy hồi quy ở trên ta có bảng sau:
Tên biến
Hệ số tự do
Age
Edu
Agefbrth
Agefm
Giá trị tới hạn
2.447507
0.1869834
-0.0338148
-0.2053728
-0.0157083
Khoảng tin cậy
P-value
(1.965788 ; 2.929226 )
0.000
(0.1745316 ; 0.1994353)
0.000
(-0.0553169 ; 0.123126)
0.002
(0.230946
; -0.1797995 ) 0.000
(0.035091
; 0.0036796 ) 0.112
17
Heduc
Urban
-0.0425124
-0.3438606
(0.061638
(0.499281
; -0.0233891 ) 0.000
; -0.1884402 ) 0.000
Phương trình hồi quy ở mô hình mẫu
Children =
2.447507 + 0.1869834*age -0.0338148*edu -0.2053728*agefbrth
-0.0157083*agefm -0.0425124 *heduc -0.3438606*urban + u
4.
•
Phân tích kết quả
Số quan sát (obs) = 1832
•
Tổng bình phương sai số tổng cộng SST = 8705.03002
•
Tổng bình phương sai số được giải thích SSE = 4330.88775
•
Tổng bình phương các phần dư SSR = 4374.14227
•
Bậc tự do của phần dư Dfr = 1825
•
Hệ số xác định R2 = 0,4975 tức 49,75% số vụ ngoại tình được giải thích bởi
các yếu tố độc lập đang nghiên cứu: ít nhất 1 lần ngoại tình, số tuổi, số năm
kết hôn, số đứa con, tôn giáo, chất lượng hôn nhân. Đồng thời R 2 thể hiện sự
phù hợp của mô hàm hồi quy mẫu là cao.
Ý nghĩa của các hệ số hồi quy :
= 2.447507 có nghĩa là khi giá trị của các biến độc lập bằng 0 thì số lượng con cái
trung bình sẽ bằng 2.447507
βˆ
1 = 0.1869834 có nghĩa là khi độ tuổi trung bình tăng lên 1 đơn vị thì số con cái
trung bình tăng lên 1 lượng là 0.1869834
βˆ
2 = -0.0338148 có nghĩa là số năm được giáo dục của các bà mẹ tăng lên 1 thì
số con cái trung bình giảm 1 lượng là 0.0338148 đơn vị
18
βˆ
3 = -0.2053728 có nghĩa là độ tuổi trung bình khi sinh con đầu lòng tăng lên 1 thì
số con trung bình giảm 0.2053728 đơn vị
βˆ
4 = -0.0157083 có nghĩa là độ tuổi kết hôn lần đầu tăng lên 1 thì số con trung
bình giảm 0.0157083 đơn vị
βˆ
5 = -0.0425124 có nghĩa là số năm được giáo dục của người chồng tăng lên 1
đơn vị thì số con trung bình sẽ giảm 0.0425124 đơn vị
βˆ
6 = -0.3438606 có nghĩa là nếu sinh sống ở khu vực thành thị thì số con trung
bình trong gia đình sẽ thấp hơn khoảng 0.3438606 đơn vị so với vùng ngoại ô.
5.
Kiểm định mô hình hồi quy
5.1) Kiểm định sự phù hợp của mô hình :
Kiểm định này nhằm xem xét trường hợp các tham số của biến độc lập �� đồng
thời bằng 0 có thể xảy ra hay không. Cặp giả thuyết thống kê như sau:
Nếu giá trị Prob > F nhỏ hơn mức ý nghĩa � = 0.05 thì bác bỏ H0, chấp nhận H1
tức là hàm hồi quy mẫu phù hợp. Chạy kiểm định F bằng lệnh test trong Stata, màn
hình hiển thị kết quả sau:
Vì Prob > F = 0.0000 < mức ý nghĩa 5% nên ta bác bỏ giả thiết H0, suy ra có ít
nhất 1 trong 6 yếu tố trên ảnh hưởng đến số lượng con cái trong gia đình.
19
•
5.2) Kiểm định đa ràng buộc tuyến tính :
Giả sử biến agefm không có ảnh hưởng tới children tức là số lượng con trung bình
là như nhau ở mọi , ta có cặp giả thiết:
Dùng lệnh test với biến agefm để kiểm định, kết quả thu được như sau:
Vì Prob > F = 0,1122 > mức ý nghĩa là 5% nên ta chưa đủ cơ sở bác bỏ giả thiết
H0 về việc có thể loại bỏ biến age ra khỏi mô hình. Vậy biến agefm có thể không
ảnh hưởng mang ý nghĩa thống kê tới biến phụ thuộc Children
20
•
Chứng minh tương tự đối với các biến độc lập còn lại là : educ, agefbrth, agefm,
heduc và urban cho kết quả lần lượt là :
Nhận thấy các giá trị p-value đều nhỏ hơn mức ý nghĩa 5% nên ta có thể bác bỏ giả
thuyết H0 về việc các biến độc lập không có ảnh hưởng tới biến phụ thuộc
Children
Ta có thể đi đến kết luận : 5 biến độc lập ( age , educ, agefbrth, agefm, heduc và
urban ) đều ảnh hưởng mang ý nghĩa thông kê tới biến phụ thuộc children. Biến
agefm có thể không ảnh hưởng trực tiếp tới biến phụ thuộc.
21
Kết Luận
Kết quả thực hành báo cáo đã thực hiện như trên cho chúng ta một cái nhìn
khái quát và tương đối đầy đủ về ảnh hưởng từ các yếu tố độ tuổi của các bà mẹ,
độ tuổi kết hôn lần đầu, độ tuổi sinh con đầu lòng, trình độ học vấn và nơi sinh
sống đến số lượng con cái trong mỗi gia đình. Thông qua việc phân tích và đánh
giá mô hình hồi quy ta có thể thấy những tác động trực tiếp và đang kể từ những
yếu tố này đến vấn đề được quan tâm là sự gia tăng của số lượng con trong mỗi gia
đình. Điều này ở một mức độ nào đó có thể giúp ta có một cái nhìn đúng đắn hơn
cũng như điều chính các yếu tố đó để áp dụng cho chính bản thân mình, thực hiện
tốt và đảm bảo cho hạnh phúc gia đình và xã hội.
Qua đây, nhóm xin được gửi lời cảm ơn đến giảng viên bộ môn Kinh tế
lượng TS.Đinh Thị Thanh Bình đã có những chỉ dẫn sát sao giúp nhóm hoàn thành
được bản báo cáo này
22
TÀI LIỆU THAM KHẢO
1. PGS.TS. Nguyễn Quang Dong, Giáo trình Bài giảng kinh tế lượng, NXB Giao
thông vận tải, 1998.
2. PGS.TS. Nguyễn Quang Dong, Bài tập Kinh tế lượng, NXB Khoa học kỹ thuật,
1998.
3. PGS.TS. Nguyễn Cao Văn, TS. Trần Thái Ninh, Giáo trình Lý thuyết xác suất
và thống kê toán, NXB Thống kê, 2006.
4. Ph.D Lawrence C Hamilton, Statistics with Stata: Version 10, Cengage
Learning, 7th edition, 2008.
5. Một số tài liệu khác trên Internet
23