Tải bản đầy đủ (.pdf) (14 trang)

Tài liệu Hồi qui sừ dụng biến giả docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (395.71 KB, 14 trang )

Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Hồi qui sừ dụng biến giả

Nguyễn Trọng Hoài 1

Hồi qui sừ dụng biến giả

Trước đây chúng ta chỉ sừ dụng biến giải thích định lượng. Trong bài giảng này chúng ta đề cập
trong mô hình biến giải thích định tính nhằm giải quyết các tình huống như: tìm hiểu sự khác biệt
về giới tính trong việc thanh tóan lương, sư khác biệc về doanh số giữa các mùa trong năm, và sự
khác biệt giữa hai giai đọan chính sách khác nhau . . .

Công cụ xừ lý đó chính là biến giả (dummy). Chúng ta giải thích trong nhiếu trường hợp khác nhau
từ đơn giản đến phức tạp. Biến giả thể hiện các biến định tính.

1) Mô hình chỉ có biến giải thích là biến giả
2) Mô hình có biến giải thích định lượng và biến giả. Trong mô hình này lại có nhiều trường
hợp khác nhau mà chúng ta sẽ đề cập sau.

Trường hợp 1: Hồi qui với một biến giả duy nhất là biến độc lập

Y
i
= β
1
+ β
2
D
i
+


i
ε
(11.1)

Nam: E(Y
i
|D = 1) = β
1
+ β
2

Nữ: E(Y
i
|D = 0) = β
1



Ý nghĩa của α là lương trung bình của nhóm D= 0 và β là khác biệt kỳ vọng của lương
trung bình của hai nhóm trong tổng thể.

Dựa vào mô hình hồi qui đơn chúng có
∑Y
i
= nβ
^
1
+ β
^
2

∑D
t
(11.2)
∑YiD
i
= β
^
1
∑D
i
+ β
^
2
∑Di
2
= β
^
1
∑Di + β
^
2
∑Di (11.3)

Lưu ý rằng do D là biến giả và chỉ nhận giá trị 1 và 0, D
2
cũng có giá trị giống D. Trong
Phương trình (11.3), ∑D
t
ở vế bên phải bằng số nam nhân viên (gọi là n
m

) và ∑YiD
i
ở vế
bên trái bằng tổng lương của họ. Chia hai vế cho n
m
ta có
β
^
1
+ β
^
2
= Y

m
(11.4)
với Y

m
là lương trung bình của nam nhân viên. Vì vậy, tổng các hệ số hồi qui là một ước
lượng của E(Yi|D = 1), trung bình tổng thể lương của nam nhân viên.
Vì ∑D
i
= n
m
, Phương trình (11.2) và (11.3) có thể viết lại thành
∑Yi = nβ
^
1
+ n

m
β
^
2

∑YiDi = n
m

^
1
+ β
^
2
) (11.5)



Lấy phương trình thứ nhất trừ phương trình thứ hai và bỏ đi những số hạng chung ở vế bên
phải, ta có

∑Y
i



∑YiDi = (n

n
m
) β

^
1
= n
f
β
^
1
(11.6)


Chương Trình Giảng Dạy Kinh Tế Fulbright

Các phương pháp phân tích Hồi qui sừ dụng biến giả

Nguyễn Trọng Hoài 2
2
với n
f
là số nhân viên nữ. Lưu ý là vế bên trái của phương trình đơn giản là tổng lương của
nữ nhân viên (tổng của toàn bộ lương trừ tổng lương của nam nhân viên). Vì vậy, chia hai
vế cho n
f
, chúng ta có β
^
1
= Y

f
, trung bình mẫu của lương nữ nhân viên, đây là một ước
lượng của trung bình tổng thể E(Yi|D = 0).


Sừ dụng dữ liệu và ứng dụng EViews chúng ta có:

Trong đó WAGE: tiền lương, DUMMY (= 0 nếu quan sát là nữ và = 1 nếu quan sát là
nam)

Kiểm tra lại bằng cách tìm giá trị lương trung bình của nữ trong tập hợp nữ
Chương Trình Giảng Dạy Kinh Tế Fulbright

Các phương pháp phân tích Hồi qui sừ dụng biến giả

Nguyễn Trọng Hoài 3
3

Ở đây do mẫu bao gồm cả nam và nữ nên ta dùng lệnh sample với if như sau



Kiểm tra lại bằng cách tìm giá trị lương trung bình của nam trong tập hợp nam

Chương Trình Giảng Dạy Kinh Tế Fulbright

Các phương pháp phân tích Hồi qui sừ dụng biến giả

Nguyễn Trọng Hoài 4
4


Như vậy thì dữ liệu chúng ta kiểm tra phù hợp với giải thích về lý thuyết ở trên


Trường hợp 2: Hồi qui với một biến giả và một biến định lượng

Giả sừ rằng chúng ta phải ước lượng mối quan hệ giữa tiền lương của các giáo sư và số
năm công tác của họ.


ii21i
ε Xβ β Y ++=
(11.7)

Y
i
= tiền lương hàng năm của giáo sư i.
X
i
= số năm công tác của giáo sư i.

Ở đây chúng ta hòan tòan chưa nói là giáo sư là nam hay nữ.

Bây giờ giả sừ rằng chúng ta muốn tìm hiểu xem xem liệu có phải các giáo sư nữ bị phân
biệt đối xừ về việc trả lương của họ không. Chúng ta có hai cách để làm việc này:

Cách 1:ước hai hàm hồi qui riêng biệt, có nghĩa là một hàm hồi qui cho các giáo sư nam
có trong mẫu n
M
và một hàm hồi qui cho các giáo sư nữ có trong mẫu n
F
)

Có hai khó khăn trong cách giải quyết này. Một là, mỗi phép hồi qui là kém hiệu quả

hơn
so với phép hồi qui sừ dụng toàn bộ dữ liệu. Hai là , tương đối không thuận tiện
khi kiểm
định liệu rằng hai phép hồi qui này là khác nhau.

Chương Trình Giảng Dạy Kinh Tế Fulbright

Các phương pháp phân tích Hồi qui sừ dụng biến giả

Nguyễn Trọng Hoài 5
5
Cách 2: ước lượng chung cho cả giáo sư nam và nữ bằng cách xác định một biến mới ghi
nhận sự có mặt hay vắng mặt của thuộc tính "nữ "

D
i
= 0 nếu quan sát i thuộc về một giáo sư nam
D
i
= 1 nếu quan sát i thuộc về một giáo sư nữ

Như vậy phương trình 11.1 trở thành mô hình sau:


iii21i
ε Dδ Xβ β Y +++=
11.8

Hãy ghi nhận rằng bậc tự do của mô hình này là n
M

+ n
F
- 3. Sự có mặt của biến giả này
làm có thể thể hiện cả hai mô hình hồi qui riêng biệt nói trên (ở cách 1) trong một mô hình
(theo cách 2). Xét các giá trị kỳ vọng có điều kiện sau:


[]
Xβ β 0 D | Y E
i21ii
+==
nữ 11.9



[]
()
Xβ δ β 1 D | Y E
i21ii
++==
nam 11.10


Chúng ta thấy rằng nếu
δ
là dương thì các giáo sư nữ có một hàm hồi qui tổng thể có
tung độ gốc cao hơn sovới các giáo sư nam.

Hệ số
δ

là chênh lệch tung độ gốc và nó cho thấy chênh lệch của các tung độ gốc đối với
hai mẫu phụ. Dễ dàng kiểm định xem liệu chênh lệch này có ý nghĩa thống kê hay không:
đơn giản là tính giá trị thống kê t
c
cho
δ
ˆ
rồi so với giá trị tới hạn tra bảng t* như chúng ta
đã làm như thường lệ khi kiểm định ý nghĩa thống kê của các hệ số hồi qui.

Chúng ta có thể sừ dụng dữ liệu và minh họa khi hồi qui lương theo kinh nghiệm EXPER
và GENDER như sau

×