Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
Phân tích hồi quy bội:
Biến định tính
Phân tích hồi quy bội với biến
định tính
7.1 Mô tả thông tin định tính
Ví dụ: giới tính, chủng tộc, công nghiệp, khu vực, đánh giá cấp độ, ...
Chương 7
Một cách để kết hợp thông tin định tính là sử dụng biến giả
Chúng có thể xuất hiện như là biến phụ thuộc hay biến độc lập
7.2 Trường hợp đơn giản: Có một biến độc lập là biến giả
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
7.1
= mức lương thu được/mất đi nếu
người này là nữ chứ không phải là
nam (các yếu tố khác giữ cố định)
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Biến giả:
=1 nếu là nữ
=0 nếu là nam
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Biến định tính
Đồ thị minh họa
Cách giải thích khác của hệ số:
7.2
nghĩa là, sự khác biệt về mức lương trung
bình giữa nam và nữ có cùng một trình độ
giáo dục (nữ so với nam).
female=0 : nhóm cơ sở (tham chiếu)
Cùng hệ số góc, khác tung độ gốc
3
/>
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
Phân tích hồi quy bội:
Biến định tính
Bẫy biến giả
09.12.2017
Phân tích hồi quy bội:
Biến định tính
Mô hình này không thể ước lượng được (đa cộng
tuyến hoàn hảo do Male + female = 1)
VD 7.1: Ước lượng phương trình tiền lương với sự khác biệt về hệ số chặn
7.4
Khi sử dụng biến giả, một thuộc tính luôn luôn phải được loại bỏ:
Cố định các biến giáo dục, kinh
nghiệm, và thâm niên chức vụ, tiền
lương trung bình của nữ ít hơn nam
là 1,81 USD/giờ
Nhóm cơ sở là nam
Nhóm cơ sở là nữ
Nhược điểm:
Ngoài ra, có thể bỏ qua tung độ gốc:
1) Khó khăn hơn để kiểm định sự
khác biệt giữa các tham số
2) Công thức R2 chỉ có ý nghĩa
nếu hồi quy có tung độ gốc
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Biến định tính
So sánh trung bình của các tổng thể con được mô tả bằng biến giả
7.5
Thảo luận
Điều đó có nghĩa rằng có sự phân biệt đối xử với nữ giới?
Không hẳn vậy. Bởi vì yếu tố giới tính nữ có thể tương quan với các đặc điểm
lao động khác chưa được kiểm soát.
H0: βfemale = 0 ; H1: βfemale ≠ 0 Xét xem yếu tố giới tính có ảnh hưởng đến lương không
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Biến định tính
Ví dụ 7.3: Ảnh hưởng của trợ cấp đào tạo lên số giờ đào tạo
Giờ đào tạo mỗi nhân viên
Biến giả biểu thị công ty có nhận trợ cấp đào tạo nghề hay không
Trong điều kiện không kiểm soát các yếu tố khác,
tiền lương trung bình của nữ ít hơn nam là 2,51
USD/giờ; nghĩa là, sự khác biệt giữa mức lương
trung bình của nam và nữ là 2,51 USD/giờ.
Có thể dễ dàng kiểm định sự chênh lệch trung bình giữa hai tổng thể con có ý nghĩa thống kê hay
không (|t|= 9.65).
Sự khác biệt về mức lương giữa nam và nữ sẽ lớn hơn nếu không kiểm soát các yếu tố khác; nghĩa
là một phần của sự khác biệt là do sự khác nhau trong giáo dục, kinh nghiệm và thâm niên chức vụ
giữa nam và nữ. Số 1.81 trong (7.4) nhỏ hơn 2.51 trong (7.5).
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
7.7
Đây là một ví dụ về đánh giá chương trình
nhóm tác động (= có nhận trợ cấp) so với nhóm đối chứng (= không có nhận trợ
cấp). Nhóm đối chứng còn gọi là nhóm kiểm soát.
Liệu có phải tác động của chương trình đến biến phụ thuộc là quan hệ nhân quả?
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
2
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
Phân tích hồi quy bội:
Biến định tính
Phân tích hồi quy bội:
Biến định tính
Sử dụng biến độc lập là biến giả trong phương trình log(y)
7.3 Sử dụng biến giả cho trường hợp biến định tính có nhiều lựa chọn
VD 7.4: Hàm hồi quy giá nhà
7.8
Biến giả biểu thị ngôi
nhà kiểu colonial
colonial = 1 nếu ngôi
nhà có phong cách
thuộc địa
Khi biến giả colonial thay đổi
từ 0 đến 1, giá nhà trung bình
tăng 5,4 (%)
1) Xác định thành phần trong mỗi nhóm bằng một biến giả
2) Bỏ ra một nhóm (nhóm này sẽ trở thành nhóm cơ sở)
VD 7.6: Phương trình log tiền lương theo giờ
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Giữ những yếu tố khác cố định, tiền lương trung bình của nam đã kết hôn nhiều hơn nam độc thân là 21,3%
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Dùng bao nhiêu biến giả là đủ?
B) Tương tác giữa các biến giả
1) Giới tính (nữ, nam), dùng 2-1 = 1 biến giả
Giới tính (nữ, nam)
1) Các biến giả có 2 thuộc tính
A) Biến định tính có nhiều thuộc tính
Tình trạng hôn nhân (có gia đình, độc thân)
nu (nu=1: nữ)
Kết hợp giới tính và tình trạng hôn nhân: 2*2 = 4 trường hợp,
Nhóm cơ sở là: nam
dùng 4-1 = 3 biến giả
2) Giới tính (nữ, nam, hifi), dùng 3-1 = 2 biến giả
nu*cogd: nữ và có gia đình
nu (nu=1: nữ)
nu*docthan: nữ và độc thân
nam (nam=1: nam)
/>
7.11
Giữ những yếu tố khác cố định, tiền lương
trung bình của nữ đã kết hôn ít hơn nam
độc thân (= nhóm cơ sở) là 19,8%
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Nhóm cơ sở là: hifi
Câu hỏi: Nên dùng
bao nhiêu biến giả?
nam*cogd: nam và có gia đình
11
Nhóm cơ sở là: nam*docthan
12
3
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
Phân tích hồi quy bội:
Biến định tính
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
B) Tương tác giữa các biến giả
Sử dụng biến giả cho trường hợp biến thứ bậc
2) Các biến giả có 2, 3 thuộc tính
Ví dụ: Xếp hạng tín dụng của thành phố và lãi suất trái phiếu đô thị
Giới tính (nữ, nam)
Chủng tộc (da trắng, da vàng, da đen)
Lãi suất trái phiếu đô thị
Kết hợp Giới tính và Chủng tộc: 2*3 = 6 trường hợp,
Xếp hạng tín dụng từ 0-4 (0=tệ, 4=rất tốt)
dùng 6-1 = 5 biến giả
Nu*datrang: nữ và da trắng
Mô tả này có lẽ không phù hợp nếu như xếp hạng tín dụng chỉ chứa thông tin thứ bậc.
Một cách tốt hơn để đưa thông tin thứ bậc này vào hồi quy là sử dụng nhiều biến giả:
Nu*davang: nữ và da vàng
Nu*daden: nữ và da đen
7.12
Nam*datrang: nam và da trắng
Nam*davang : nam và da vàng
Nhóm cơ sở là: nam*daden
13
Phân tích hồi quy bội:
Biến định tính
7.4 Thành phần tương tác có biến giả
Cho phép hệ số góc khác nhau giữa các nhóm
= hệ số chặn của nam
= hệ số chặn của nữ
Thành phần tương tác
Đồ thị minh họa
7.17
= hệ số góc của nam
= hệ số góc của nữ
Tiền lương là như nhau giữa nam và nữ, có cùng mức học
vấn. Hay yếu tố giới tính không tác động đến tiền lương
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Biến định tính
Giả thuyết quan tâm
Tác động của học vấn là như nhau giữa nam
và nữ. Mức chênh lệch tiền lương giữa nữ và
nam là như nhau ở mọi mức học vấn.
Các biến giả được đặt tương ứng với các mức xếp hạng tín dụng. Nghĩa là, CR1 = 1 nếu CR = 1
và CR1 = 0 cho các trường hợp khác.
Tất cả các tác động được so sánh với mức xếp hạng tệ nhất (= nhóm cơ sở).
Việc sử dụng vừa biến giả vừa biến
tương tác cho phép hai phương trình
tiền lương hoàn toàn khác nhau giữa
nam và nữ
Khác hệ số góc,
khác tung độ gốc
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
Phân tích hồi quy bội:
Biến định tính
PHÂN TÍCH HỒI QUY BỘI: BIẾN
ĐỊNH TÍNH
• Tập tin wage1.wf1
Dependent Variable: WAGE (khác tung độ gốc)
Included observations: 526
Variable
C
FEMALE
EDUC
Coefficient
0.622817
-2.273362
0.506452
Ước lượng phương trình lương với thành phần tương tác
VD 7.10: phương trình log tiền lương theo giờ
Std. Error
0.672533
0.279044
0.050391
7.18
Dependent Variable: WAGE (khác hệ số góc)
Included observations: 526
Variable
C
EDUC
FEMALE*EDUC
Coefficient
-0.285264
0.575483
-0.177639
Std. Error
0.650415
0.050389
0.021828
khác hệ số góc
Dependent Variable: WAGE (khác hệ số góc và khác tung độ gốc)
Included observations: 526
Variable
Coefficient
Std. Error
C
FEMALE
EDUC
FEMALE*EDUC
0.200496
-1.198523
0.539476
-0.085999
0.843562
1.325040
0.064223
0.103639
17
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Coefficient
Std. Error
t-Statistic
Prob.
C
FEMALE
EDUC
FEMALE*EDUC
EXPER
EXPER^2
TENURE
TENURE^2
0.388806
-0.226789
0.082369
-0.005565
0.029337
-0.000580
0.031897
-0.000590
0.118687
0.167539
0.008470
0.013062
0.004984
0.000108
0.006864
0.000235
3.275892
-1.353643
9.724919
-0.426013
5.885973
-5.397767
4.646956
-2.508901
0.0011
0.1764
0.0000
0.6703
0.0000
0.0000
0.0000
0.0124
0.440964
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Dependent Variable: LOG(WAGE)
Method: Least Squares
Included observations: 526
(EQ01)
Variable
R-squared
Liệu điều này có hàm ý rằng khi có cùng trình độ học vấn, số
năm kinh nghiệm, và thâm niên chức vụ, thì không có bằng
chứng thống kê cho thấy tiền lương của nữ sẽ thấp hơn nam
(|t|= 1.35)? Không: đây chỉ là tác động khi educ= 0. Để
trả lời câu hỏi này, người ta phải quy tâm thành phần tương
tác, ví dụ xét educ = 12,5 (= mức học vấn trung bình).
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
• Tập tin wage1.wf1
Dependent Variable: LOG(WAGE)
Method: Least Squares
Included observations: 526
Không có bằng chứng thống kê
chống lại giả thuyết rằng tác động
học vấn là như nhau cho nam và nữ
(thống kê |t|= 0.43)
Mean dependent var
/>
1.623268
Variable
Coefficient Std. Error
C
0.388806
-0.296345
FEMALE
EDUC
0.082369
FEMALE*(EDUC-12.5) -0.005565
EXPER
0.029337
EXPER^2
-0.000580
TENURE
0.031897
TENURE^2
-0.000590
19
R-squared
0.440964
0.118687
0.035836
0.008470
0.013062
0.004984
0.000108
0.006864
0.000235
t-Statistic
3.275892
-8.269516
9.724919
-0.426013
5.885973
-5.397767
4.646956
-2.508901
Prob.
0.0011
0.0000
0.0000
0.6703
0.0000
0.0000
0.0000
0.0124
Mean dependent var 1.623268
20
5
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
Phân tích hồi quy bội:
Biến định tính
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Wald Test:
Equation: EQ01
Test Statistic
F-statistic
Chi-square
Value
34.32555
68.65110
Null Hypothesis: C(2)=0, C(4)=0
Null Hypothesis Summary:
Normalized Restriction (= 0)
C(2)
C(4)
df
(2, 518)
2
Kiểm định sự khác nhau trong hàm hồi quy giữa các nhóm
Mô hình chưa gán ràng buộc (chứa toàn bộ các thành phần tương tác)
Probability
0.0000
0.0000
Điểm trung bình đánh giá (GPA)
Xếp hạng của sinh viên
tại trường trung học
điểm thi SAT
7.20
Value
-0.226789
-0.005565
Restrictions are linear in coefficients.
Std. Err.
Tổng số giờ học
chính khóa
0.167539
0.013062
Mô hình đã gán ràng buộc (hàm hồi quy giống nhau cho cả 2 nhóm)
p-value = 0,0000 < 0,05 : bác bỏ H0
21
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Phân tích hồi quy bội:
Biến định tính
Giả thuyết không
7.21
Ước lượng mô hình chưa gán ràng buộc
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
• Tập tin gpa3.wf1
Tất cả tác động của thành phần tương
tác là bằng 0, nghĩa là, các hệ số hồi quy
giống nhau cho cả nam và nữ. Không có
sự chênh lệch về hệ số chặn và hệ số góc
trong hồi quy của nữ và nam.
7.22
Kiểm định riêng lẻ từng hệ
số của từng thành phần
tương tác, giả thuyết cho
rằng tác động của thành
phần tương tác bằng 0
không thể bị bác bỏ
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
(UR)
Dependent Variable: CUMGPA
Method: Least Squares
Sample: 1 732 IF SPRING=1
Included observations: 366
Variable
C
FEMALE
SAT
FEMALE*SAT
HSPERC
FEMALE*HSPERC
TOTHRS
FEMALE*TOTHRS
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Coefficient
1.480812
-0.353486
0.001052
0.000751
-0.008452
-0.000550
0.002344
-0.000116
0.405927
0.394311
0.467833
78.35451
Std. Error
0.207334
0.410529
0.000181
0.000385
0.001370
0.003162
0.000862
0.001628
t-Statistic
7.142168
-0.861050
5.807324
1.948755
-6.167404
-0.173878
2.718228
-0.071164
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Prob.
0.0000
0.3898
0.0000
0.0521
0.0000
0.8621
0.0069
0.9433
2.334153
0.601126
1.340203
1.425507
24
6
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Dependent Variable: CUMGPA
Method: Least Squares
Sample: 1 732 IF SPRING=1
Included observations: 366
Variable
C
SAT
HSPERC
TOTHRS
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Coefficient
1.490850
0.001185
-0.009957
0.002343
0.351636
0.346263
0.486034
85.51507
Std. Error
0.183678
0.000165
0.001245
0.000755
Test Statistic
t-Statistic
8.116641
7.191040
-8.000114
3.101564
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Chi-square
Prob.
Normalized Restriction (= 0)
C(2)
C(4)
C(6)
C(8)
2.334153
0.601126
1.405794
1.448446
Giả thuyết H0 bị bác bỏ
Cách khác để tính thống kê F trong trường hợp đã cho
Chạy hồi quy riêng biệt cho nam và nữ ; tính SSR cho mô hình chưa gán ràng
buộc bằng cách lấy tổng SSR của hai hàm hồi quy này.
Chạy hồi quy cho mô hình đã gán ràng buộc và tính SSR cho mô hình này
Kiểm định theo cách làm này được gọi là kiểm định Chow
Quan trọng: Kiểm định Chow giả định rằng phương sai của nhiễu là như nhau
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
df
Probability
(4, 358)
4
Value
-0.353486
0.000751
-0.000550
-0.000116
Restrictions are linear in coefficients.
Phân tích hồi quy bội:
Biến định tính
giữa các nhóm
Value
8.179111
32.71644
Null Hypothesis: C(2)=0, C(4)=0, C(6)=0, C(8)=0
Null Hypothesis Summary:
0.0000
0.0000
0.0000
0.0021
25
Kiểm định đồng thời với thống kê F
(UR)
Wald Test:
Equation: EQ01
(R)
0.0000
0.0000
Std. Err.
0.410529
0.000385
0.003162
0.001628
p-value = 0,0000 < 0,05 : bác bỏ H0
26
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Dependent Variable: CUMGPA
Method: Least Squares
Sample: 1 732 IF (SPRING=1) AND (FEMALE=1)
Included observations: 90
Variable
C
SAT
HSPERC
TOTHRS
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Coefficient
1.127326
0.001802
-0.009001
0.002228
0.401430
0.380550
0.477430
19.60279
Std. Error
0.361595
0.000347
0.002908
0.001409
t-Statistic
3.117646
5.195036
-3.095606
1.581710
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Prob.
0.0025
0.0000
0.0027
0.1174
2.666000
0.606606
1.402628
1.513731
28
7
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Dependent Variable: CUMGPA
Method: Least Squares
Sample: 1 732 IF (SPRING=1) AND (FEMALE=0)
Included observations: 276
Variable
C
SAT
HSPERC
TOTHRS
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Coefficient
1.480812
0.001052
-0.008452
0.002344
0.316852
0.309317
0.464757
58.75172
Std. Error
0.205971
0.000180
0.001361
0.000857
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Dependent Variable: CUMGPA
Method: Least Squares
Sample: 1 732 IF SPRING=1
Included observations: 366
t-Statistic
7.189434
5.845756
-6.208219
2.736217
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Variable
Prob.
C
SAT
HSPERC
TOTHRS
0.0000
0.0000
0.0000
0.0066
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
2.225942
0.559225
1.319782
1.372252
Coefficient
1.490850
0.001185
-0.009957
0.002343
0.351636
0.346263
0.486034
85.51507
Std. Error
0.183678
0.000165
0.001245
0.000755
t-Statistic
8.116641
7.191040
-8.000114
3.101564
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Prob.
0.0000
0.0000
0.0000
0.0021
2.334153
0.601126
1.405794
1.448446
29
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
7.24
Variable
C
SAT
HSPERC
TOTHRS
Ví dụ về cumGPA:
85,515 (19, 603 58, 752) (366 2* 4)
.
8,18
19, 603 58, 752
4
R-squared
31
/>
Chow
Dependent Variable: CUMGPA
Method: Least Squares
Sample: 1 732 IF SPRING=1
Included observations: 366
Công thức F của kiểm định Chow:
F
30
Coefficient
1.490850
0.001185
-0.009957
0.002343
0.351636
Std. Error
0.183678
0.000165
0.001245
0.000755
t-Statistic
8.116641
7.191040
-8.000114
3.101564
Mean dependent var
Prob.
0.0000
0.0000
0.0000
0.0021
2.334153
32
8
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Chạy lệnh sort female để tách nữ và nam riêng ra, nữ bắt đầu ở
Chow Breakpoint Test: 553
Null Hypothesis: No breaks at specified breakpoints
Varying regressors: All equation variables
Equation Sample: 1 732 IF SPRING=1
quan sát thứ 553.
Lưu ý: trước khi chạy lệnh sort phải sao lưu file dữ liệu gốc lại.
F-statistic
Log likelihood ratio
Wald Statistic
8.179111
32.00637
32.71644
Chow
Prob. F(4,358)
Prob. Chi-Square(4)
Prob. Chi-Square(4)
0.0000
0.0000
0.0000
33
Phân tích hồi quy bội:
Biến định tính
Phân tích hồi quy bội:
Biến định tính
7.5 Biến phụ thuộc nhị phân: mô hình xác suất tuyến tính (tự đọc)
Hồi quy tuyến tính khi biến phụ thuộc nhị phân
7.26
7.27
Hay:
Ví dụ: Việc tham gia lực lượng lao động của phụ nữ đã kết hôn
=1 có việc làm, =0 ngược lại
Thu nhập của người chồng (nghìn USD mỗi năm)
7.29
Nếu biến phụ thuộc chỉ có 2
giá trị 1 và 0
= P(y=1/x)
7.28
34
Mô hình xác suất
tuyến tính (LPM)
Trong mô hình xác suất tuyến tính, các
hệ số cho biết tác động của biến độc lập
lên xác suất y=1
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
Nếu số con dưới sáu tuổi tăng
thêm 1, xác suất người phụ nữ
có việc làm giảm 26,2%
Có vẻ không có ý nghĩa, |t|= 0,98 (nhưng xem slide kế tiếp)
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
9
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
Phân tích hồi quy bội:
Biến định tính
Phân tích hồi quy bội:
Biến định tính
Ví dụ: Tham gia lực lượng lao động của phụ nữ đã kết hôn (tt)
Nhược điểm của mô hình xác suất tuyến tính
Xác suất dự đoán có thể lớn hơn 1 hoặc nhỏ hơn 0
Tác động biên lên xác suất là hằng số đôi khi không đúng về mặt logic
Đồ thị với nwifeinc=50, exper=5,
age=30, kidslt6=1, kidsge6=0
Học vấn cao nhất trong mẫu là
educ = 17. Khi đó, xác suất có
việc làm dự đoán của phụ nữ đã kết
hôn là 50%.
17
Xác suất dự đoán âm nhưng không
sao vì không có người phụ nữ nào
trong mẫu có educ <5.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Biến định tính
7.30
Phương sai của biến
ngẫu nhiên Bernoulli
Cần tính sai số chuẩn cải thiện cho trường hợp phương sai thay đổi này (Chương 8)
Ưu điểm của mô hình xác suất tuyến tính
Dễ dàng ước lượng và giải thích
Tác động ước lượng và dự đoán thường khá tốt trong thực tế
Xem mô hình Logit và Probit ở Chương 17
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Biến định tính
7.6 Bàn thêm về phân tích chính sách và đánh giá chương trình
Ví dụ: Tác động tài trợ đào tạo nghề đến năng suất lao động của công nhân
Tỷ lệ sản phẩm lỗi
Mô hình xác suất tuyến tính thì luôn có phương sai thay đổi
=1 nếu công ty có nhận tài trợ đào tạo, =0 ngược lại
7.33
Không có tác động rõ ràng
của tài trợ lên năng suất,
|t|=0,12
Nhóm tác động: được nhận tài trợ, nhóm đối chứng: các công ty không nhận được tài trợ
Tài trợ được đưa ra trên cơ sở: đến trước phục vụ trước. Điều này không giống như tài trợ
một cách ngẫu nhiên. Có thể là những doanh nghiệp với năng suất thấp sẽ xin nhận tài trợ
đầu tiên vì họ nhận thấy cơ hội cải thiện năng suất.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
Nội sinh do vấn đề “tự lựa chọn” (self-selection) tham gia vào chương trình
Trong ví dụ trên và các ví dụ tương tự, việc tham gia vào chương trình có thể liên quan đến các
đặc điểm khác mà các đặc điểm này cũng ảnh hưởng đến biến phụ thuộc
Lý do là các đối tượng tự lựa chọn việc tham gia vào chương trình phụ thuộc vào đặc điểm và
triển vọng cá nhân của họ. Sự tham gia này không được xác định ngẫu nhiên.
Đánh giá thực nghiệm
Trong các thí nghiệm, việc tham gia vào nhóm tác động là ngẫu nhiên
Trong trường hợp này, tác động nhân quả có thể được suy ra bằng cách sử dụng hồi quy đơn
7.34
partic=1: có tham gia
Biến giả biểu thị có hay không có tham gia thì
không liên quan đến các yếu tố khác ảnh hưởng
đến biến phụ thuộc
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
10
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
Phân tích hồi quy bội:
Biến định tính
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Ví dụ khác về biến độc lập là biến giả bị nội sinh
Có phải khách hàng da màu bị phân biệt đối xử?
Biến giả biểu thị vốn vay có
được phê duyệt không
Biến giả chủng tộc
7.7 Diễn giải kết quả hồi quy với biến phụ thuộc rời rạc
H0: 1 = 0
H1: 1 < 0
Sự giàu có
7.35
Xếp hạng tín dụng
Cố định tuổi, nếu số năm đi học tăng 1 năm thì số con trung bình của phụ nữ
giảm 0,09 con.
Hay: Xét 1 nhóm 100 phụ nữ (cùng tuổi), nếu mỗi người có số năm đi học tăng 1
thì tổng số con trung bình của nhóm này sẽ giảm 9 người.
Điều cần thiết là kiểm soát các đặc điểm quan trọng khác có thể tác động đến
việc phê duyệt vốn vay (ví dụ nghề nghiệp, thất nghiệp)
Việc bỏ qua đặc điểm quan trọng mà có tương quan với biến giả da màu sẽ tạo
ra bằng chứng thống kê giả cho sự phân biệt đối xử
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Cố định số năm đi học, nếu tuổi tăng 1 năm thì số con trung bình của phụ nữ
tăng 0,175 con.
Hay: Xét 1 nhóm 1000 phụ nữ (cùng số năm đi học), nếu mỗi người có số tuổi
tăng 1 thì tổng số con trung bình của nhóm này sẽ tăng 175 người.
42
Môøi gheù thaêm trang web:
44
/>
7.7 Diễn giải kết quả hồi quy với biến phụ thuộc rời rạc
7.37
/>
electric= 1: phụ nữ sống trong ngôi nhà có điện
Cố định tuổi và mức học vấn. Phụ nữ sống trong nhà có điện có số con
trung bình ít hơn phụ nữ sống trong ngôi nhà không có điện là 0,362 người.
Hay: Cùng tuổi và mức học vấn. Xét nhóm 1000 phụ nữ sống trong nhà có
điện so với nhóm 1000 phụ nữ sống trong nhà không có điện. Số con trung
bình của nhóm 1 ít hơn nhóm 2 là 362 người.
Cùng tuổi, nếu mức học vấn tăng 1 năm thì số con trung bình của người phụ
nữ giảm 0,079 người.
/>
43
11