Giới thiệu mô hình logit probit – how to STATA

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (197.53 KB, 3 trang )

9/15/21, 2:53 PM

Giới thiệu Mơ hình logit/probit – How to STATA

How to STATA
A set of guides and tutorials for beginners on using Stata
effectively

Giới thiệu Mơ hình logit/probit
Posted on April 9, 2020April 9, 2020 by Chung Mai
Một trong những mơ hình kinh tế lượng khá phổ biến bên cạnh OLS là mô hình Logit/Probit. Hơm nay,
mình sẽ chia sẻ với các bạn các đặc điểm của mơ hình này nhé.
1. Mơ hình này thường được sử dụng khi nào?
Mơ hình này được sử dụng khi biến phụ thuộc (mình tạm gọi là biến Y nhé) chỉ nhận giá trị 0 và 1. Lưu ý là
chỉ có 2 giá trị 0 và 1 thôi, chứ ko phải là nhận giá trị chạy từ 0 đến 1 nha. Ví dụ như chúng ta thực hiện hồi
quy để tìm ra các nhân tố ảnh hưởng đến hành vi hút thuốc lá. Nếu Y=1 thì nghĩa là người đó có hút thuốc,
và ngược lại là khơng hút. Biến phụ thuộc này được gọi là biến giả (trong tiếng Anh được gọi là dummy/
binary/ dichotomous variable).
Sau khi hồi quy, giá trị dự báo của Y (predicted Y hoặc là Y^) được giải thích là xác suất xảy ra sự kiện Y = 1
(hay là xác suất hút thuốc lá). Xác suất thì PHẢI nằm trong khoảng (0,1) nghĩa là từ 0% đến 100%.
2. Vì sao khơng nên dùng OLS?
Giống như mình nói ở trên, giá trị ước lượng của Y phải nằm trong khoảng (0,1). Tuy nhiên, ước lượng OLS
không xem xét đến giới hạn này. Vậy nên, xác suất Y =1 theo các hệ số ước lượng OLS hồn tồn có thể
vượt q giới hạn này, dẫn đến kết quả ước lượng không hợp lý. Đây có lẽ là lý do rõ ràng nhất để giải thích
vì sao chúng ta khơng nên dùng OLS trong trường hợp biến phụ thuộc là biến giả.
Bên cạnh đó là các lý do về mặt kỹ thuật kinh tế lượng. Ví dụ như, ước lượng OLS ln giả định là xác suất
xảy ra Y = 1 ln ln tuyến tính với các biến giải thích. Giả định về sai số (error term) tuân theo phân phối
chuẩn không thể đạt được khi biến phụ thuộc chỉ nhận giá trị 0 và 1. Và cuối cùng, sai số của mơ hình đối
với các quan sát là khác nhau nên các kiểm định độ tin cậy sẽ khơng chính xác.
Tóm lại là, khi biến phụ thuộc chỉ nhận hai giá trị 0 và 1, chúng ta cần phải dùng mơ hình logit hoặc probit.
3. Chuyện gì xảy ra ở phía sau các câu lệnh?

Mình sẽ nói về mơ hình logit trước nhé. Giả sử mơ hình chúng ta cần ước lượng là:
Y = BX + u
/>
1/3

9/15/21, 2:53 PM

Giới thiệu Mơ hình logit/probit – How to STATA

Trong đó, biến Y là biến chỉ nhận hai giá trị 0 và 1.
Mơ hình logit sẽ dựa trên giả định rằng sai số của mơ hình sẽ tn theo phân phối logistic. Khi đó:
Xác suất để Y = 1 sẽ được tính là:

Hoặc xác suất để Y = 0 sẽ được tính là:

Cả 2 mơ hình này đều là mơ hình hồi quy phi tuyến tính vì hệ số hồi quy beta nằm trong số mũ. (Nếu các
bạn muốn ôn lại các khái niệm trong mô hình hồi quy tuyến tính thì có thể tham khảo ở video này nhé
( />Vậy nên, một bước biến đổi mơ hình nữa sẽ được thực hiện. Chúng ta sẽ lấy xác suất Y = 1 chia cho xác suất
Y = 0. Ta sẽ có:

Mơ hình vẫn chưa về dạng tuyến tính được, nên chúng ta sẽ tiếp tục thực hiện thêm một bước biến đổi mơ
hình nữa – đó là lấy log ở cả hai vế của mơ hình. Ta sẽ có:

Lúc này, mơ hình đã trở về dạng tuyến tính. Hệ số Pi/1-Pi được gọi là Odd ratio. Hệ số này được định nghĩa
theo cách mà nó được tính tốn ln đó các bạn.
Tất nhiên là chúng ta sẽ khơng cần phải thực hiện các bước này. STATA sẽ tự động thực hiện tất cả các bước
này. Khi thực hiện hồi quy logit nghĩa là ta đang thực hiện hồi quy tuyến tính giữa log của odd ratio
với các biến độc lập X.
4. Giải thích mơ hình logit như thế nào?

Ta khơng thể nào giải thích mơ hình logit giống như mơ hình tuyến tính khác được bởi vì biến phụ thuộc
của chúng ta bây giờ là log của odd ratio. (Các bạn có thể xem thêm trong video này về cách giải thích hệ số
hồi quy tuyến tính nhé ( />Nhưng nếu muốn giải thích sát nghĩa nhất thì chúng ta cần phải nói rõ: Khi biến X tăng 1 đơn vị thì log
của hệ số odd sẽ thay đổi beta đơn vị.

/>
2/3

9/15/21, 2:53 PM

Giới thiệu Mơ hình logit/probit – How to STATA

Cách giải thích này hơi ngộ đúng khơng. Vậy nên, thơng thường chúng ta chỉ giải thích về mối quan hệ giữa
biến độc lập và biến phụ thuộc thôi. Khi biến phụ thuộc tăng (nghĩa là hệ số hồi quy dương) với các điều kiện
khác khơng đổi (ceteris paribus) thì hệ số odd cũng tăng theo (nghĩa là xác suất Y = 1 tăng). Trong ví dụ hút
thuốc lá ở trên thì chúng ta giải thích là xác suất hút thuốc lá sẽ tăng. Ngược lại, khi hệ số hồi quy là âm thì
xác suất của Y = 1 sẽ giảm với các điều kiện khác không đổi.
Khi ước lượng được các hệ số hồi quy rồi, ta có thể dễ dàng tính được xác suất của Y=1 dựa trên cơng thức
(1) ở trên nhé.
5. Mơ hình Logit và Probit khác nhau như thế nào?
Mơ hình Logit và Probit thường cho các kết quả hồi quy tương tự nhau và cách thức ước lượng của hai mơ
hình này cũng khá giống nhau. Điểm khác nhau của hai mơ hình nằm ở cơng thức tính xác suất Y = 1 và Y =
0. Mơ hình Probit giả định sai số sẽ tuân thủ phân phối chuẩn. Trên cơ sở đó, xác suất Y = 1 sẽ được tính như
sau:

Và xác suất Y = 0 sẽ bằng 1-Pi.
Cách giải thích hệ số hồi quy của hai mơ hình này là tương tự nhau. Khi có ước lượng của các hệ số hồi quy
rồi thì ta có thể đưa vào cơng thức trên để tính ra xác suất. Thấy có vẻ phức tạp quá đúng ko? Đừng lo, các
phần mềm phân tích dữ liệu như STATA đều giúp chúng ta tính được tất cả các xác suất cho tất cả các quan

sát trong nháy mắt thơi.
Các bạn hãy đợi bài viết của mình về cách sử dụng lệnh trong STATA để ước lượng mơ hình logit/probit nhé.
Nguồn tham khảo: Econometrics by example – Damodar Gujarati (2012)


Posted in Kinh tế lượng căn bảnTagged mô hình logit, probit

One thought on “Giới thiệu Mơ hình logit/probit”
1. Pingback: Cách chạy mơ hình logit/probit trong STATA – How to STATA

Website Powered by WordPress.com.

/>
3/3

Giới thiệu mô hình logit probit – how to STATA

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về