Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
1
Bài giảng 7
HỒI QUI VỚI BIẾN GIẢ
Mục tiêu học tập:
Bản chất của biến giả
Hồi qui với một biến đònh lượng và một biến giả có hai tính tính
Hồi qui với một biến đònh lượng và một biến giả có hơn hai đặc tính
Hồi qui với một biến đònh lượng và hai biến giả
Mô hình tổng quát về hồi qui biến giả
Ý nghóa hệ số hồi qui biến giả
Biến giả và phân tích ổn đònh cấu trúc
Biến giả mùa vụ
Tài liệu tham khảo:
Domodar Gujarati, 1999, Essentials of Econometrics, Chapter 9
Domodar Gujarati, 2003, Basic Econometrics, Chapter 9
Ramanathan, 2002, Introductory Econometrics with Applications, Chapter 7
Phạm Chí Cao, 2006, Kinh tế lượng ứng dụng, Chương 5
Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
2
7. 1 BẢN CHẤT CỦA BIẾN GIẢ
Đònh nghóa: Biến giả (dummy variables) ở đây được hiểu là các biến giải thích
đònh tính (qualitative)
Trong phân tích hồi qui, biến phụ thuộc không chỉ phụ thuộc vào các biến đònh
lượng mà còn các biến đònh tính như giới tính, chủng tộc, tôn giáo, dân tộc,
chính trò, …)
Ví dụ
Q = f(P, Ps, Pc, Sex, Edu, …)
W = f(T, Exp, Prod, Edu, …)
Ý nghóa biến giả: Các biến đònh tính trong mô hình chỉ ra “sự hiện diện” hay
“không hiện diện” của một thuộc tính (attribute) nào đó và thường được gán các
giá trò bằng số như 1 và 0 lần lượt thể hiện có và không có thuộc tính đó.
Ký hiệu: D (để phân biệt với các biến đònh lượng X)
Tạo biến giả bằng Eviews?
Nhập giá trò 1 và 0 cho các quan sát tương ứng (cách nhập từ bàn phím)
Ví dụ: Sử dụng file Table7-6ee.txt
Trước hết, tạo biến xu thế
T=@trend(1969)
Sau đó, tạo biến giả DUM=t>12
Nghóa là D=0 nếu các quan sát trong giai đoạn 1970 - 1981 và D=1 nếu
các quan sát trong giai đoạn 1982 - 1995
Các biến giả được sử dụng trong hồi qui tương tự như các biến đònh lượng. Cho
nên, cũng có thể ước lượng mô hình mà các biến giải thích chỉ là biến giả (gọi là
mô hình phân tích phương sai (ANOVA))
Ví dụ 9.1: Lương khởi điểm của người có bằng đại học và chưa có bằng đại học
(Y = lương khởi điểm, D = biến giả về trình độ giáo dục)
Y
i
= B
1
+ B
2
D
i
+ u
i
(9.1)
Y
i
= lương khởi điểm
D
i
= 1 nếu tốt nghiệp đại học
= 0 nếu chưa tốt nghiệp đại học
Lương trung bình của người chưa tốt nghiệp đại học?
E(Y|D=0) = B
1
+ B
2
*(0)
Lương trung bình của người tốt nghiệp đại học?
Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
3
E(Y|D=1) = B
1
+ B
2
*(1)
B
2
= differential intercept coefficient
Kiểm đònh và giải thích ý nghóa?
Lưu ý: Chỉ thực sự khác biệt về lương khởi điểm giữa 2 nhóm nếu hệ số của
biến giả có ý nghóa thống kê
7.2 HỒI QUI VỚI MỘT BIẾN ĐỊNH LƯNG VÀ MỘT BIẾN GIẢ
CÓ HAI ĐẶC TÍNH
Xét phương trình sau:
Y
i
= B
1
+ B
2
D
i
+ B
3
X
i
+ u
i
(9.6)
Y
i
= lương trung bình hàng năm
D
i
= 1 nếu là nam
= 0 nếu là nữ
X
i
= số năm kinh nghiệm
Lương trung bình
Của một giáo viên nữ?
E(Y
i
|D=0,X
i
) = B
1
+ B
3
X
i
Của một giáo viên nam?
Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
4
E(Y
i
|D=1,X
i
) = B
1
+ B
2
+ B
3
X
i
Sử dụng file table9-2ee.txt để lượng phương trình trên
Kiểm đònh và giải thích ý nghóa?
LƯU Ý HỒI QUI BIẾN GIẢ:
Để phân biệt 2 thuộc tính, ta dùng một biến giả vì nếu dùng 2 biến giả sẽ
dẫn đến hiện tượng cộng tuyến hoặc đa cộng tuyến (D
2
= 1 – D
1
, hoặc D
1
= 1
– D
2
).
Nguyên tắc chung: Nếu một biến đònh tính có
m
thuộc tính thì ta tạo (
m-1
)
biến giả.
Gán giá trò 1 và 0 chỉ là ngẫu nhiên, nhưng các hệ số ước lượng có thể thay
đổi khi ta qui ước khác. Khi gán giá trò cần đònh nghóa rõ ràng.
Thuộc tính được gán giá trò 0 được xem như thuộc tính cơ sở (base,
benchmark, comparison, …) và hệ số tung độ gốc (chung) B
1
là hệ số tung
độ gốc của thuốc tính cơ sở.
Hệ số B
2
(của biến D) được gọi là hệ số cắt chênh lệch (differential intercept
coefficient)
Ví dụ 9.4: Tác động của khác biệt sản phẩm (product differentiation) lên suất
sinh lợi của vốn chủ sở hữu (Y)?
Y = 1.399 + 1.49D
i
+ 0.246X
2i
– 9.507X
3i
– 0.016X
4i
Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
5
se (1.380) (0.056) (4.244) (0.017)
t (1.079) (4.285) (-2.240) (-0.941)
n = 48 R
2
= 0.26
D = 1 nếu có khác biệt sản phẩm
= 0 nếu không có khác biệt sản phẩm
X
2
= Market share (thò phần)
X
3
= Firm size (qui mô doanh nghiệp)
X
4
= Industry growth rate (tốc tộ tăng trưởng của ngành)
Kiểm đònh và giải thích ý nghóa?
7.3 HỒI QUI VỚI MỘT BIẾN ĐỊNH LƯNG VÀ MỘT BIẾN GIẢ
CÓ HƠN HAI ĐẶC TÍNH
Ta có phương trình sau:
Y
i
= B
1
+ B
2
D
2i
+ B
3
D
3i
+ B
4
X
i
+ u
i
(9.13)
Y
i
= chi tiêu cho du lòch hàng năm
D
2i
= 1 nếu tốt nghiệp cấp 3
= 0 nếu chưa tốt nghiệp cấp 3
D
3i
= 1 nếu tốt nghiệp đại học
= 0 nếu chưa tốt nghiệp đại học
X
i
= thu nhập hàng năm
Như vậy, chưa tốt nghiệp cấp 3 được xem như thuộc tính cơ sở và B
1
là hệ số
tung độ gốc của thuộc tính này.
Ví dụ 9.5: File table9-3ee.txt về mối quan hệ giữa chi tiêu cho du lòch với thu
nhập và giáo dục:
Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
6
Kiểm đònh và giải thích ý nghóa?
7.4 HỒI QUI VỚI MỘT BIẾN ĐỊNH LƯNG VÀ HAI BIẾN GIẢ
Ta có phương trình sau:
Y
i
= B
1
+ B
2
D
2i
+ B
3
D
3i
+ B
4
X
i
+ u
i
Y
i
= lương hàng năm
D
2i
= 1 nếu là giáo viên nam
= 0 nếu là giá viên nữ
D
3i
= 1 nếu có học vò tiến sỹ
= 0 nếu chưa có học vò tiến sỹ
X
i
= số năm kinh nghiệm
Lương trung bình
Giáo viên nữ, chưa có học vò tiến sỹ:
E(Y
i
|D
2
=0,D
3
=0,X
i
) = B
1
+ B
4
X
i
(9.19)
Giáo viên nam, chưa có học vò tiến sỹ:
E(Y
i
|D
2
=1,D
3
=0,X
i
) = (B
1
+ B
2
) + B
4
X
i
(9.20)
Giáo viên nữ, có học vò tiến sỹ:
E(Y
i
|D
2
=0,D
3
=1,X
i
) = (B
1
+ B
3
) + B
4
X
i
(9.21)
Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
7
Giáo viên nam, có học vò tiến sỹ:
E(Y
i
|D
2
=1,D
3
=1,X
i
) = (B
1
+ B
2
+ B
3
) + B
4
X
i
(9.21)
Các trường hợp mở rộng:
Mô hình với nhiều biến đònh lượng và nhiều biến giả
Ngoài ra, có thể sử dụng các biến giả để kiểm đònh xem có sự khác biệt giữa
hệ số của biến giải thích đònh lượng, ví dụ:
Y
i
= B
1
+ B
2
D
2i
+ B
3
X
i
+ B
4
D
2i
X
i
+ u
i
Y
i
= lương hàng năm
D
2i
= 1 nếu có học vò tiến sỹ
= 0 nếu chưa có học vò tiến sỹ
X
i
= số năm kinh nghiệm
(Sẽ được làm rõ hơn ở phần bài tập)
7.5 Ý NGHĨA CỦA CÁC HỆ SỐ HỒI QUI BIẾN GIẢ
7.5.1 Hàm tuyến tính
Y
i
= B
1
+ B
2
D
2i
+ B
3
X
i
+ B
4
D
2i
X
i
+ u
i
Y
i
= lương hàng năm
D
2i
= 1 nếu có học vò thạc sỹ
= 0 nếu có bằng cử nhân
X
i
= số năm kinh nghiệm
B
1
= Lương khởi điểm trung bình của giáo viên có bằng cử nhân
B
2
= Chênh lệch về lương khởi điểm trung bình của giáo viên có bằng thặc ỹ
so với có bằng cử nhân
B
3
= Mức thay đổi tiền lương trung bình của giáo viên có bằng cử nhân theo
số năm kinh nghiệm
B
4
= Chênh lệch về mức thay đổi tiền lương trung bình theo số năm kinh
nghiệm của giáo viên có bằng thạc sỹ so với có bằng cử nhân
7.5.2 Dạng hàm log - lin
Xét phương trình sau đây:
lnY
i
= B
1
+ B
2
D
2i
+ B
3
lnX
i
+ u
i
Y
i
= lương hàng năm
D
2i
= 1 nếu có học vò thạc sỹ
Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
8
= 0 nếu có bằng cử nhân
X
i
= số năm kinh nghiệm
Phần trăm thay đổi của Y khi biến giả thay đổi từ 0 lên 1 = (antilog(B
2
) - 1)*100
(phần trăm chênh lệch về lương trung bình của giáo viên có bằng thạc sỹ so với
cử nhân)
7.6 ỔN ĐỊNH CẤU TRÚC VÀ HỒI QUI BIẾN GIẢ
Thay vì ước lượng 3 phương trình (7.55), (7.56), và (7.57) và thực hiện kiểm đònh
Chow, ta có thể sử dụng phương pháp biến giả và kiểm đònh ý nghóa của hệ số
biến giả (kiểm đònh t)
Hạn chế của kiểm đònh Chow: Không cho biết sự khác nhau giữa các giai đoạn
là do hệ số cắt hay hệ số gốc
Giả sử 2 phương trình cho 2 giai đoạn khác nhau như sau:
1970 – 1981:
Y
t
= A
1
+ A
2
X
t
+ u
1t
(9.23)
1982 – 1995
Y
t
= B
1
+ B
2
X
t
+ u
2t
(9.24)
Có 4 khả năng:
A
1
= B
1
và A
2
= B
2
: Hai phương trình giống nhau hoàn toàn
A
1
≠ B
1
và A
2
= B
2
: Hai phương trình có đồ thò song song
A
1
= B
1
và A
2
≠ B
2
: Hai phương trình có cùng hệ số cắt
A
1
≠ B
1
và A
2
≠ B
2
: Hai phương trình hoàn toàn khác nhau
Sử dụng biến giả?
Y
t
= C
1
+ C
2
D
t
+ C
3
X
t
+ C
4
(D
t
.X
t
) + u
t
(9.25)
C2 = hệ số cắt chênh lệch (differential intercept)
C4 = độ dố chênh lệch (differential slope)
Ví dụ 9.7: Sử dụng file table9-5ee.txt và ước lượng phương trình (9.25)
Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
9
Kiểm đònh và giải thích ý nghóa?
Viết phương trình của 2 giai đoạn?
1970 – 1981
1982 – 1995
7.7 BIẾN GIẢ VÀ PHÂN TÍCH MÙA V
Ví dụ 9.9: Mối quan hệ giữa chi tiêu và thu nhập ở Úc giai đoạn từ 1977Q1-
1980Q4 (Y = chi tiên cho tiêu dùng cá nhân (PCE), X = thu nhập khả dụng cá
nhân (PDI)
Cách đặt biến giả mùa? 3 biến D
2
, D
3
, D
4
hoặc D
1
, D
2
, D
3
, hoặc D
1
, D
3
, D
4
, …
Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
10
Kiểm đònh và giải thích ý nghóa?
Kiểm đònh xem hệ số gốc có khác nhau giữa các q hay không?
Kinh t lng ng dng Bi ging 7: Hi qui vi bin gi
Phựng Thanh Bỡnh, UEH
11
Kieồm ủũnh vaứ giaỷi thớch yự nghúa?
Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
12
BÀI TẬP NHÓM SỐ 5
Yêu cầu làm theo nhóm, nộp bài làm qua email: và nộp bản in
(hoặc viết tay) và buổi học tiếp theo. Bài tập này sẽ được tính vào điểm quá trình của
môn học.
5.1 Xem xét hai mô hình sau đây:
Y
i
= B
0
+ B
1
X
i
+ B
2
D
2i
+ B
3
D
3i
+ u
i
(5.1a)
Y
i
= B
0
+ B
1
X
i
+ B
2
D
2i
+ B
3
D
3i
+ B
4
(D
2i
X
i
) + B
5
(D
3i
X
i
) + u
i
(5.1b)
Y = thu nhập hàng năm của người tốt nghiệp MBA (Thạc sĩ quản trị kinh doanh)
X = Số năm làm việc
D
2
= 1 nếu tốt nghiệp MBA Harvard
= 0 nếu không phải Harvard
D
3
= nếu tốt nghiệp MBA ở Wharon
= 0 nếu không tốt nghiệp Wharton
a. Dấu kỳ vọng của các hệ số hồi qui của mô hình (5.1a) là gì?
b. Giải thích ý nghĩa các hệ số B
2
và B
3
ở mô hình (5.1a)?
c. Giải thích ý nghĩa các hệ số B
4
và B
5
ở mô hình (5.1b)?
d. Nếu các hệ số B
4
và B
5
có ý n ghĩa thống kê, thì Anh/Chị sẽ sử dụng mô hình
(5.1a) hay (5.1b)?
e. Trình bày các bước kiểm định giả thiết H
0
: B
4
= B
5
= 0?
5.2 Huang và cộng sự đã xây dựng hàm cầu cà phê ở Mỹ giai đoạn quí I – 1961 đến
quí II – 1977 như sau:
t
^
Q
ln
= 1.2789 - 0.1647lnP
t
+ 0.5115lnI
t
+ 0.1483lnP
’
t
- 0.0089T
t (2.14) (1.13) (0.55) (-3.36)
- 0.0961D
1t
- 0.1570D
2t
- 0.0097D
3t
(-3.74) (-6.03) (-0.37) R
2
= 0.80
Trong đó:
Q = Lượng cầu cà phê/người
P = Giá so sánh của 1 cân cà phê (giá gốc năm 1967)
I = Thu nhập khả dụng/người
P’ = Giá so sánh của 1 cân trà (giá gốc năm 1967)
T = Biến xu thế
D
1
= 1 cho quí I
Kinh tế lượng ứng dụng Bài giảng 7: Hồi qui với biến giả
Phùng Thanh Bình, UEH
13
D
2
= 1 cho quí II
D
3
= 1 cho quí III
ln = log tự nhiên
a. Giải thích các hệ số của P, I, và P’?
b. Cầu cà phê có co giãn theo giá không?
c. Anh chị giải thích ý nghĩa của hệ số của biến T như thế nào?
d. Kiểm định giả thiết: Độ co giãn của cầu cà phê theo thu nhập bằng 1?
e. Giải thích ý nghĩa các biến giả D
1
, D
2
, và D
3
?
f. Viết phương trình cầu cà phê cho từng quí?
5.3 Trong nghiên cứu về số giờ lao động của công ty bảo hiểm ký gởi liên bang
(FDIC) đã bỏ ra để thanh tra hoạt động của 91 ngân hàng, R.J.Miller đã ước
lượng được hàm số sau đây:
Y
ln
^
= 2.41 + 0.3674lnX
1
+ 0.2217lnX
2
+ 0.0803lnX
3
- 0.1755D
1
se (0.047) (0.062) (0.028) (0.290)
+ 0.2799D
2
+ 0.5634D
3
- 0.2572D
4
(0.104) (0.165) (0.078) R
2
= 0.766
Trong đó:
Y = Số thời gian lao động của thanh tra FDIC
X
1
= Tổng tài sản của ngân hàng
X
2
= Tổng số văn phòng ở ngân hàng
X
3
= Tỷ số giữa vốn cho vay nhỏ lẻ/tổng vốn cho vay của ngân hàng
D
1
= 1 nếu xếp loại quản lý là “tốt”
D
2
= 1 nếu xếp loại quản lý là “khá”
D
3
= 1 nếu xếp loại quản lý là “được”
D
4
= 1 nếu việc thanh tra được thực hiện kết hợp với cơ quan nhà nước
a. Giải thích kết quả nghiên cứu
b. Giải thích ý nghĩa các hệ số hồi qui của các biến giả?
5.4 Sử dụng file Table9-7be.wfl để kiểm định giả thiết rằng các phương sai của
nhiễu (error variances) trong hai giai đoạn từ quí IV 1958 đến quí III 1966 và quí
IV 1966 đến quí II 1971 là như nhau?