Tải bản đầy đủ (.ppt) (36 trang)

KINH TẾ LƯỢNG - CHƯƠNG 7 HỒI QUI VỚI BIẾN GIẢ VÀ BIẾN BỊ CHẶN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.27 MB, 36 trang )

CHƯƠNG 7
HỒI QUI VỚI BIẾN GIẢ VÀ BIẾN BỊ CHẶN











Bản chất của biến giả - Biến giả cho sự thay đổi
trong hệ số chặn
Biến giả cho sự thay đổi trong hệ số góc
Biến giả và Kiểm định tính ổn định cấu trúc của mơ
hình
Hồi qui tuyến tính từng khúc
Biến phụ thuộc là biến giả
Mơ hình xác suất tính tuyến tính (LPM)
Mơ hình Probit và Logit
Biến bị chặn: mơ hình Tobit


Bản chất của biến giả - Biến giả cho sự thay
đổi trong hệ số chặn
Trong phân tích hồi qui, có 2 loại biến chính: biến định
lượng và biến định tính.
 Các biến định lượng: giá trị của những quan sát đó
là những con số.


 Biến định tính thường biểu thị có hay khơng có một
tính chất hoặc biểu thị các mức độ khác nhau của
một tiêu thức thuộc tính nào đó, chẳng hạn như giới
tính, tơn giáo, chủng tộc, nơi cư trú, …
 Những biến định tính này cũng có sự ảnh hưởng
đối với biến phụ thuộc và phải được đưa vào mơ
hình hồi quy.


Bản chất của biến giả - Biến giả cho sự thay
đổi trong hệ số chặn


Biến giả (D) thường có 2 giá trị:







D = 1: nếu quan sát có một thuộc tính nào đó, và
D = 0: nếu khơng có thuộc tính đó.

Biến giả cũng được đưa vào mơ hình hồi quy
giống như một biến định lượng,
Chúng được dùng để chỉ sự khác biệt giữa 2
nhóm quan sát: có và khơng có một thuộc tính
nào đó.



Bản chất của biến giả - Biến giả cho sự thay
đổi trong hệ số chặn
Ví dụ: giả sử ta muốn xem có sự khác biệt nào khơng
về tiền cơng giữa nam và nữ với những điều kiện về
công việc như nhau.
 Hàm hồi quy ngẫu nhiên cho một quan sát:
wagei = β0 + β1Di + α’X + ui,
Trong đó D là biến giả về giới tính: D = 1 nếu là nam và 0
nếu là nữ; X là vector chỉ những đặc điểm cá nhân và
công việc.







Nếu D=1: wagei = β0 + β1 + α’X + ui,
Nếu D=0: wagei = β0 + α’X + ui,

Vậy hệ số β1 đo lường sự khác biệt của hệ số β0 giữa
nhóm nam và nữ.




Biến giả cho sự thay đổi trong hệ số chặn
(hệ số tự do)
Wagei = β0 + β1 + α’X + ui


y












°

°
°

°
°



°
°

°
°




Wagei = β0 + α’X + ui
°

°

x

Hình 7.1 Đường hồi qui với hệ số góc giống nhau và
hệ số chặn khác nhau












Nếu biến định tính được chia ra m nhóm, chúng ta
phải sử dụng (m -1) biến giả.
Ví dụ: Ta có thể chia trình độ học vấn thành các cấp
học: 1) cấp một trở xuống, 2) cấp hai, 3) cấp ba và
4) cao hơn.
để so sánh tiền công của những người lao động có
các trình độ học vấn khác nhau, ta dùng 3 biến giả:

D1: cấp hai; D2: cấp ba và D3: cấp học cao hơn.
Các hệ số ước lượng của D1; D2 và D3: sẽ chỉ ra sự
khác biệt về tiền công giữa các cấp học tương ứng
và cấp một trở xuống.
Nhóm khơng được biểu diễn bởi biến giả đgl nhóm
cơ sở, hay nhóm đối ứng, hay nhóm so sánh, …
Giả định rằng hệ số góc β là giống nhau cho các
nhóm và phần sai số ngẫu nhiên u có cùng phân
phối cho các nhóm


Biến giả cho sự thay đổi trong hệ số chặn






Lưu ý: mơ hình hồi quy có thể chỉ bao gồm
những biến giả.
Khi đó, mơ hình đgl “Mơ hình phân tích
phương sai” (ANOVA model).
Hệ số của các biến giả sẽ cho biết sự khác
biệt về giá trị trung bình của biến phụ thuộc
giữa các nhóm.


Một ví dụ khác, giả sử rằng chúng ta có số
liệu về tiêu dùng C và thu nhập Y của một số
hộ gia đình. Thêm vào đó, chúng ta cũng có

số liệu về:
1) S: giới tính của chủ hộ
2) A: tuổi của chủ hộ, được chia ra như sau: <
25 tuổi, từ 25 đến 50, > 50 tuổi.
3) E: trình độ học vấn của chủ hộ, cũng được
chia thành 3 nhóm: < trung học, ≥ trung học
nhưng < đại học, ≥ đại học.





Chúng ta sẽ sử dụng những biến định tính
này bằng các biến giả như sau:
D1 =

1 nếu giới tính là nam
0 nếu là nữ

D2 =

1 nếu tuổi nhỏ hơn 25
0 nhóm tuổi khác

D3 =

1 nếu tuổi từ 25 đến 50
0 nhóm tuổi khác

D4 =


1 nếu học vấn < trung học
0 nhóm học vấn khác

D5 =

1 nếu học vấn ≥ trung học nhưng < đại học trở lên
0 nhóm học vấn khác




Khi đó chúng ta chạy phương trình hồi qui:
C = α + βY + γ1D1 + γ2D2 + γ3D3 + γ4D4 +
γ5D5 + u



Ví dụ, khi chủ hộ là nam, nhỏ hơn 25 tuổi, có
một bằng đại học, chúng ta có D1 = 1, D2 = 1,
D3 = 0, D4 = 0, D5 = 0 => hệ số chặn sẽ là α +
γ1 + γ2.



Khi chủ hộ là nữ, lớn hơn 50 tuổi, có một
bằng đại học, chúng ta có D1 = 0, D2 = 0, D3 =
0, D4 = 0, D5 = 0 và như vậy hệ số chặn sẽ
chỉ là α.



Biến giả cho sự thay đổi trong hệ số góc


Ví dụ, phương trình hồi qui cho 2 nhóm:
y1 = α + β1x + u
cho nhóm thứ nhất

và y2 = α + β2x + ucho nhóm thứ hai
Giả sử có sự khác biệt về hệ số góc giữa 2 nhóm:
y2 = α + (β1 + δ)x + u = α + β1x + δx +u
Phương trình hồi quy cho một quan sát i là:
yi = α + β 1xi + ∆βDixi + ui = α + β 1xi + δDixi + ui
Do vậy, hệ số của biến Dixi (δ) sẽ cho biết sự khác
biệt về hệ số góc giữa hai nhóm.


Biến giả và Kiểm định tính ổn định cấu trúc
của mơ hình








Ta có bảng số liệu sau về thu nhập và tiết
kiệm ở Mỹ từ năm 1970 – 1995.
Vào năm 1982, Mỹ rơi vào khủng hoảng kinh

tế
Ta có thể giả định có sự thay đổi cấu trúc
trong mối quan hệ giữa tiết kiệm và thu nhập,
Ta chia số liệu ra 2 giai đoạn và đặt:


D = 1: cho số liệu từ 1982 và 0 cho giai đoạn trước
đó.



Biến giả và Kiểm định tính ổn định cấu trúc
của mơ hình


Ta có mơ hình hồi quy:
Yt = α1 + α2Dt + β1Xt + β2(DtXt) + ut


Hồi qui tuyến tính từng khúc







Hệ số góc của biến độc lập, X, có thể thay đổi khi
X đạt một mức ngưỡng nào đó.
Phân tích mơ hình có sự thay đổi về độ dốc,

nhưng cũng chỉ giới hạn trong trường hợp đoạn
thẳng được ước lượng vẫn là liên tục.
Công ty trả hoa hồng cho các đại lý dựa vào
doanh thu, nếu doanh thu dưới mức x* thì cách
tính tiền hoa hồng khác với cách tính tiền hoa
hồng khi doanh thu trên mức x*.


y tiền hoa hồng
















0

















x*

Hình 7.3: Đường hồi qui tuyến tính từng
khúc

x doanh thu






Ước lượng hàm:
y = α + βx + γxD + u
(7.8)
Trong đó: y: tiền hoa hồng; x: doanh thu
x*: giá trị ngưỡng của doanh thu
D=


Kiểm định γ = 0

1 nếu x > x*
0 nếu x ≤ x*


Biến phụ thuộc là biến giả





Biến giả có thể có 2 hoặc nhiều giá trị nhưng
trong trường hợp này chúng ta chỉ xem xét
trường hợp nó chỉ có 2 giá trị: 0 hoặc 1.
mơ hình xác suất tuyến tính (LPM)
Ví dụ:

y=

y=

1 nếu một sinh viên tốt nghiệp ra trường
0 nếu khơng tốt nghiệp
1 nếu một gia đình có vay được vốn từ ngân hàng
0 nếu không vay được


Mơ hình xác suất tuyến tính và hàm phân

biệt tuyến tính


Chúng ta viết mơ hình xác suất tuyến
tính dưới dạng hồi qui thông thường như
sau:
yi = Pi = E(yi|xi) = βi’xi + ui
(7.9)
với E(ui) = 0.



Kỳ vọng có điều kiện E(yi|xi) = β’ixi được
giải thích như là xác suất có điều kiện để
sự kiện xảy ra khi biến xi đã xảy ra.


Mơ hình xác suất tuyến tính


Vì E(yi|xi) là một xác suất nên:








0 ≤ E(yi|xi) ≤ 1


Tuy OLS khơng địi hỏi ui phải có phân phối
chuẩn, nhưng ta vẫn giả định nó có phân
phối chuẩn để phục vụ cho việc suy diễn.
Giả định này bị vi phạm, vì thực sự ui theo
phân phối Bernoulli.
Xét mơ hình LPM 2 biến, ta có:


Mơ hình xác suất tuyến tính
ui = Yi - β1 - β2Xi
Khi Yi = 1, ui = 1 - β1 - β2Xi, với xác suất pi,
Khi Yi = 0, ui = -β1 -β2Xi, với xác suất 1- pi,



Ước lượng OLS vẫn không chệch, nên nếu dùng để
ước lượng điểm, kết quả vẫn tin cậy.
Có hiện tượng phương sai sai số thay đổi, do ui theo
phân phối Bernoulli nên:
Var(ui) = Pi(1 – Pi) với Pi = β’iXi



E(yi|xi) có thể vượt khoảng (0,1) nếu Xi có giá trị lớn.



R2 sẽ rất nhỏ





y

Đường hồi qui tuyến tính

1









Đường hồi qui thích hợp hơn






0
Hình 7.4: Dự báo từ mơ hình xác suất tuyến
tính

x



Mơ hình Probit và Logit


Trong mơ hình LPM, ta có:
yi = Pi = E(yi|xi) = F(β i’xi) = β i’xi + ui,

Trong đó: β i’xi = β0 + β1x1 + β2x2 + … + βkxk





Do yi là một xác suất nên thay vì ta dùng F(βi’xi) là
hàm tuyến tính như LPM, ta có thể cho F(xi) là một
hàm tích lũy xác suất (c.d.f).
Khi đó, chắc chắn 0 ≤ E(yi|xi) = F(β i’xi) ≤ 1.
Tùy theo dạng của F(β i’xi) được chọn, ta có các mơ
hình: “lựa chọn nhị phân” (binary choice) khác nhau:


F(β i’xi) là c.d.f của phân phối chuẩn: probit model



F(β i’xi) là c.d.f của phân phối logistic: logit model


“Biến ẩn” và Mơ hình Probit và Logit



Gọi yi* là một “biến ẩn”, không quan sát được từ quan
sát i:
yi* = xi’β + vi,

Trong đó vi thỏa các giả định của CLRM.


Giả sử ta quan sát được yi khi yi* vượt một ngưỡng
nào đó, chẳng hạn, 0, với:
yi = 1 khi yi* > 0, và
yi = 0 khi yi* ≤ 0.



Do vi có p.d.f đối xứng nên: 1-F(-xi’β) = F(xi’β). Ta có:
P(y = 1|xi) = P(y* > 0|xi) = P(vi > -xi’β) = 1 - F(-xi’β) = F(xi’β)


Mơ hình logit và probit


Tác động biên (marginal effect) của xi lên Pi là:

(

)

∂Pi ∂F x'i β
=

= β i f x'i β
∂x i
∂x i

(

)

Trong đó f(.) là p.d.f của F(.).
 Ta thấy tác động từng phần này có cùng dấu với
βi và phụ thuộc vào giá trị của xi, không giống như
các mơ hình tuyến tính.
 Do vậy, ta chỉ có thể tính tác động biên của x lên
i
Pi ứng với các giá trị cụ thể của các xi.


×