Tải bản đầy đủ (.pdf) (12 trang)

Bài giảng Nhập môn Kinh tế lượng: Chương 3 - Phạm Trí Cao

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.37 MB, 12 trang )

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG

Phân tích hồi quy bội:
Vấn đề ước lượng

• Hồi quy đơn (hồi quy 2 biến)
• y = β0+β1x1+u

• β0: hệ số chặn
• β1: hệ số góc

Chương 3

• Hồi quy bội 3 biến
• y = β0+β1x1+β2x2+u

• Hồi quy bội 4 biến

3.3

• y = β0+β1x1+β2x2+β3x3+u

Wooldridge: Introductory Econometrics:
A Modern Approach, 5e

• β0: hệ số chặn



• β1, β2, β3: hệ số góc
• y: biến phụ thuộc

• x1, x2, x3: biến độc lập

• u: sai số ngẫu nhiên, nhiễu
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

3.1 Sự cần thiết nghiên cứu hồi quy bội

Sự cần thiết của hồi quy bội

Định nghĩa mô hình hồi quy bội (k+1 biến)
Hệ số chặn

theo các biến

Đưa thêm nhiều biến giải thích vào mô hình



Thực hiện phân tích trong điều kiện giữ các yếu tố khác không đổi,
trừ các yếu tố trong

Các hệ số góc

3.6
Biến phụ thuộc
Biến được giải thích,

Biến phản ứng,…

Biến độc lập,
Biến giải thích,
Biến kiểm soát,…

3.8

Sai số ngẫu nhiên,
Nhiễu,
Phần chưa quan sát được,…

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

/>
2

Phân tích hồi quy bội:
Vấn đề ước lượng

Phân tích hồi quy bội:
Vấn đề ước lượng
“Giải thích biến

• β0, β1, β2, β3: hệ số hồi quy

Cho phép sử dụng dạng hàm đa dạng hơn

Ví dụ: Phương trình tiền lương


Cho phép đo lường tác động của trình độ học vấn lên lương trong điều kiện kinh nghiệm là không đổi

Tiền lương (USD/giờ)

Số năm đi học

3.1

Tất cả các yếu tố khác

Kinh nghiệm lao động

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

1


Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

Phân tích hồi quy bội:
Vấn đề ước lượng

Phân tích hồi quy bội:
Vấn đề ước lượng

Ví dụ: Điểm kiểm tra trung bình và chi phí trên mỗi sinh viên

Ví dụ: Thu nhập và chi tiêu của hộ gia đình


3.2

Điểm trung bình của
bài thi chuẩn hóa

Chi phí trên mỗi sinh
viên của trường

Thu nhập trung bình
của gia đình các sinh
viên trong trường

Các yếu tố khác

Chi phí trên mỗi sinh viên có thể tương quan với thu nhập trung bình của
các gia đình do vấn đề tài chính

Nếu bỏ biến thu nhập trung bình của gia đình ra khỏi hàm hồi quy có thể
dẫn tới ước lượng tác động của chi phí trên mỗi sinh viên đến điểm trung
bình bị chệch.

Trong hồi quy đơn, tác động của biến chi phí trên mỗi sinh viên đến điểm số
có thể đã bao gồm luôn tác động của biến thu nhập trung bình của gia đình

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ: tiền lương của CEO, doanh thu và thâm niên của CEO


Log của thu nhập CEO

Log của doanh thu

Các yếu tố khác

Chi tiêu của hộ

Thu nhập của hộ

Thu nhập của hộ bình phương

Mô hình có hai biến giải thích: thu nhập và thu nhập bình phương
Chi tiêu được giải thích bằng hàm bậc hai của thu nhập

Cần cẩn thận khi diễn giải ý nghĩa của các hệ số hồi quy:
Phụ thuộc vào
mức chi tiêu cụ

Mức chi tiêu tăng thêm bao
nhiêu đơn vị nếu thu nhập
tăng thêm một đơn vị?

thể đang xét

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:
Vấn đề ước lượng


3.2 Cách thực hiện và diễn giải của phương pháp OLS

3.7

Hàm bậc hai của số năm thâm niên làm CEO

Mô hình giả định rằng hệ số co giãn của tiền lương CEO theo doanh
thu của doanh nghiệp là hằng số.

Mô hình giả định rằng mối quan hệ giữa tiền lương CEO và thâm niên
làm CEO có dạng hàm bậc hai

Ý nghĩa của sự “tuyến tính“ trong hồi quy

Mô hình phải tuyến tính theo tham số (không phải theo biến số)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

/>
3.4

Ước lượng OLS của mô hình hồi quy bội:
Mẫu ngẫu nhiên
Phần dư

3.11’

Cực tiểu tổng bình phương phần dư


3.12’

Việc tìm giá trị cực tiểu sẽ được thực hiện bởi phần mềm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

2


Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

Phân tích hồi quy bội:
Vấn đề ước lượng
Diễn giải ý nghĩa của mô hình hồi quy bội
Cho biết lượng thay đổi của biến phụ thuộc khi biến độc
lập thứ j thay đổi một đơn vị, trong điều kiện các biến độc
lập khác và sai số không đổi

Mô hình hồi quy bội cho phép giữ nguyên giá trị của các biến giải
thích khác không đổi, ngay cả khi trong thực tế có thể các biến giải
thích này là có tương quan với nhau.
Cách diễn giải này được gọi là “Các yếu tố khác không đổi“

Chúng ta vẫn cần giả định rằng các yếu tố không quan sát được u sẽ
không thay đổi khi biến giải thích thay đổi.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:
Vấn đề ước lượng
Cách diễn giải tác động riêng phần trong hồi quy bội:


Hệ số hồi quy của biến giải thích trong mô hình hồi quy bội có

thể được ước lượng và có thể tính toán được bằng hai bước sau:
1) Hồi quy biến giải thích này theo tất cả các biến giải thích còn lại
2) Hồi quy

theo phần dư của hàm hồi quy ở bước 1

Tại sao cách này có thể thực hiện được?

Phần dư của hàm hồi quy ở bước 1 đó chính là phần còn lại của biến
giải thích và phần còn lại này không tương quan với các biến giải
thích khác trong mô hình

09.12.2017

Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ 3.1: Các yếu tố tác động đến điểm GPA

Điểm GPA trung bình của
sinh viên ở đại học

Diễn giải

Điểm GPA trung bình khi
học phổ thông trung học

3.15
Kết quả bài kiểm tra thành tích


Trong điều kiện ACT không đổi, mỗi điểm GPA trung học tăng thêm có thể
làm tăng 0,453 điểm GPA đại học

Hoặc: Nếu chúng ta so sánh hai sinh viên có cùng ACT nhưng điểm hsGAP
của sinh viên A cao hơn 1 điểm so với sinh viên B, thì chúng ta dự đoán rằng
sinh viên A sẽ có colGPA cao hơn 0,453 điểm so với sinh viên B
Trong điều kiện điểm hsGPA như nhau, mỗi 10 điểm ACT cao hơn có thể làm
điểm colGAP cao hơn 0,0094*10 = 0,094 điểm

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
• Tập tin gpa1.wf1
Dependent Variable: COLGPA
Method: Least Squares
Included observations: 141
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
HSGPA

ACT
SKIPPED
AGE

0.902058
0.433794
0.014486
-0.080661
0.019904

0.650366
0.097088
0.010578
0.026173
0.022838

1.387001
4.468031
1.369538
-3.081854
0.871566

0.1677
0.0000
0.1731
0.0025
0.3850

R-squared


0.237850

Mean dependent var

3.056738

Hệ số góc trong hàm hồi quy ở bước 2 chính là tác động đã tách biệt
của riêng biến giải thích đó đến biến phụ thuộc

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

/>
12

3


Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Dependent Variable: HSGPA
Method: Least Squares
Included observations: 141
Variable

C
ACT

SKIPPED
AGE

R-squared

Coefficient

3.793037
0.038582
-0.043514
-0.061095
0.194848

PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG

Std. Error

t-Statistic

0.471721
0.008705
0.022730
0.019407

8.040848
4.432224
-1.914419
-3.148103


Mean dependent var

Dependent Variable: COLGPA
Method: Least Squares
Included observations: 141

Prob.

Variable

0.0000
0.0000
0.0577
0.0020

C
VM

3.402128

R-squared

• HSGPA = β0 + β1 ACT + β2 SKIPPED + β3 AGE + v

Coefficient
3.056738
0.433794
0.111875

Std. Error

0.029654
0.103668

t-Statistic

103.0787
4.184439

Mean dependent var

Prob.

0.0000
0.0001

3.056738

• Dùng lệnh Genr: vm=resid

13

Phân tích hồi quy bội:
Vấn đề ước lượng

Phân tích hồi quy bội:
Vấn đề ước lượng

Tính chất của ước lượng OLS với một mẫu dữ liệu bất kỳ
Giá trị ước lượng (Fitted values) và phần dư
3.20

Giá trị ước lượng/Giá trị dự đoán

Mức độ phù hợp của hàm SRF so với mẫu khảo sát
3.21

Phần dư

Tính chất đại số của hồi quy OLS

Tổng phần dư bằng 0

Tương quan giữa biến độc
lập xj và phần dư bằng 0

14

Sự phân rã của tổng mức biến động
R bình phương (R2)

3.27

Các biểu diễn khác của R bình phương

Trung bình mẫu của biến phụ
thuộc và các biến độc lập nằm
trên đường hồi quy

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

/>

Lưu ý rằng R2 luôn tăng khi thêm
biến độc lập vào hàm hồi quy

3.28

R2 bằng bình phương của hệ số
tương quan giữa giá trị thực tế và
giá trị ước lượng của biến phụ thuộc

= ( r(y,y^)2 )

3.29

Tính chất: 0  R2  1

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

4


Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge

Phân tích hồi quy bội:
Vấn đề ước lượng

Phân tích hồi quy bội:
Vấn đề ước lượng

Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ
Số lần bị bắt giữ

trong năm 1986

Tỷ lệ số lần bắt
giữ có dẫn đến bị
buộc tội trước đó
(khơng phải %)

09.12.2017

Số tháng bị giam
trong năm 1986

Số q làm việc
trong năm 1986

Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ (tt)
Nếu thêm một biến giải thích khác avgsen vào mơ hình:

Mức phạt trung bình của các lần phạm tội trước

Diễn giải:
Tỷ lệ số lần bị bắt giữ trước đó tăng 0,5 lần thì dẫn đến số lần bị bắt giữ
giảm đi 0,15*0,5 = 0,075 lần (trên 1 người) hay 7,5 lần (trên 100 người)
Số tháng bị giam tăng 12 tháng thì dẫn đến số lần bị bắt giữ của người đó
giảm 0,034*12 = 0,408 lần
Số q làm việc trong năm tăng 1 dẫn đến số lần bị bắt giữ của người đó
giảm 0,104 lần (trên 1 người) hay 10,4 lần (trên 100 người)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.


Phân tích hồi quy bội:
Vấn đề ước lượng

Mức phạt trung bình của các lần phạm tội trước có làm tăng số lần bị bắt giữ (?)
Vai trò của biến giải thích mới thêm vào khá hạn chế khi R2 tăng rất ít

Lưu ý chung về R2

Ngay cả khi R2 khá nhỏ (như trong ví dụ), hàm hồi quy vẫn có thể dùng để phân
tích tác động nhân quả riêng phần theo dạng “giữ các yếu tố khác cố định“

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG

Khái niệm đa cộng tuyến
Xét mô hình hồi quy bội:
y = β0 + β1x1 + β2x2 + u

3.3 Giá trị kỳ vọng của ước lượng OLS
Các giả thiết của mơ hình hồi quy bội:

Giả thiết MLR.1 (Tuyến tính theo tham số)
3.31
Giả thiết MLR.2 (Mẫu ngẫu nhiên)

R2 chỉ tăng nhẹ

Diễn giải:


y

Trong tổng thể, mối liên hệ giữa
biến phụ thuộc y và các biến độc
lập là tuyến tính theo tham số

Mẫu dữ liệu được chọn
ngẫu nhiên từ tổng thể

3.32
Vì vậy, mỗi quan sát đều tn theo hàm hồi quy tổng thể
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

/>
x1

y
x2

x1

Không có ĐCT
y
x1

ĐCT thấp

x2


y
x2

ĐCT vừa

x1

x2

x2

ĐCT cao

x1

ĐCT hoàn hảo

20

5


Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ ƯỚC LƯỢNG

Xét mô hình hồi quy bội với hai biến độc lập x1, x2:
y = β0+β1x1+ β2x2+u

Cách tiếp cận đại số của vấn đề đa cộng tuyến:

Nếu tồn tại các số thực 1, …, k không đồng thời bằng
0 và “số thực” c sao cho:
1x1 + 2x2 + … + kxk = c
thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng
tuyến hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ tuyến
tính chính xác.

Nếu tồn tại các số thực 1, ..., k không đồng thời bằng
0 và “số thực” c sao cho:
0 + 1x1 + 2x2 + … + k1xk1 + v = c
với v là sai số ngẫu nhiên
thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng
tuyến không hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ
tuyến tính không chính xác.

* Nếu có đa cộng tuyến hoàn hảo, tồn tại ít nhất một i  0
(i= 1, 2) và c sao cho:

1x1+2x2 = c

Giả sử 2 ≠ 0 

2

* Nếu có đa cộng tuyến không hoàn hảo, tồn tại ít nhất một i  0
(i= 1, 2) và c sao cho:

1x1+2x2+v = c

21

PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG

x1
10
15
18
24
30

r = 0: x1, x2 không có đa cộng tuyến
r ≠ 0: x1, x2 có đa cộng tuyến

– |r| càng gần 1 thì mức độ ĐCT càng cao
– |r| càng gần 0 thì mức độ ĐCT càng thấp
– |r|=1: ĐCT hoàn hảo

/>
(v là sai số ngẫu nhiên)

22

Ví dụ:

Ta có dữ liệu giả định của các biến sau:

Xét hệ số tương quan r = r(x1,x2), ta có: 0  |r|  1

Lưu ý:
Chỉ đúng cho mô hình có 2 biến độc lập.


Giả sử 2 ≠ 0  x   1 x  1 v  c   x  v ' c '
2 2 1  2 2
1

PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG

Xét mô hình hồi quy bội với hai biến độc lập x1, x2:
y = β0+β1x1+ β2x2+u




c

x   1 x 
  x  c'
2
1
2 1 

23


x2
50
75
90
120
150

x2*
52
75
97
129
152

x1, x2 có đa cộng tuyến hoàn hảo?
x1, x2* có đa cộng tuyến hoàn hảo?

v
2
0
7
9
2

24

6



Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

Phân tích hồi quy bội:
Vấn đề ước lượng

PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Ví dụ (tt):
Ta có x2 = 5x1 nên x1 và x2 có đa cộng tuyến hoàn hảo.
Ta thấy hệ số tương quan r(x1,x2) = 1.

Các giả thiết của mô hình hồi quy bội: (tt)

Ta có x2*= 5x1+v, nên x1 và x2* có đa cộng tuyến không hoàn hảo.
Ta thấy r(x1,x2*) = 0,9959 nên x1 và x2* có đa cộng tuyến cao, gần
hoàn hảo.

Giả thiết MLR.3 (Không có cộng tuyến hoàn hảo)

Trong mẫu (và vì vậy trong tổng thể), không có biến độc lập nào là hằng
số và không có phụ thuộc tuyến tính chính xác giữa các biến độc lập

Lưu ý về giả thiết MLR.3

Giả thiết này chỉ loại trừ trường hợp cộng tuyến/tương quan hoàn
hảo giữa các biến độc lập; các tương quan không hoàn hảo vẫn có
thể xảy ra


Nếu một biến độc lập là tổ hợp tuyến tính chính xác của các biến
độc lập khác thì biến độc lập đó là không cần thiết và sẽ bị loại bỏ ra
khỏi hàm hồi quy
25

Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ về cộng tuyến hoàn hảo: trường hợp mẫu nhỏ

Trong mẫu nhỏ, biến avginc có thể vô tình là bội số của biến expend; khi đó
không thể tách bạch tác động riêng phần cho từng biến vì biến động của chúng là
như nhau

Ví dụ về cộng tuyến hoàn hảo: mối liên hệ giữa các biến độc lập

Biến hằng số cũng bị loại bỏ (vì cộng tuyến hoàn hảo với hệ số chặn)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:
Vấn đề ước lượng
Các giả thiết của mô hình hồi quy bội: (tt)

Giả thiết MLR.4 (Trung bình có điều kiện bằng 0)
3.36

Giá trị của các biến giải thích không chứa
bất kỳ thông tin nào về giá trị trung bình
của các yếu tố không quan sát được


Trong mô hình hồi quy bội, giả thiết trung bình có điều kiện bằng 0
có nhiều khả năng được thỏa mãn hơn vì có ít yếu tố được gộp vào
sai số ngẫu nhiên hơn so với hồi quy đơn.

Ví dụ: Điểm kiểm tra trung bình
Hoặc shareA hoặc shareB sẽ bị loại ra khỏi mô hình vì có mối liên hệ tuyến tính
chính xác giữa chúng: shareA + shareB = 1
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

/>
Nếu avginc không được đưa vào mô hình, biến này sẽ nằm trong sai số; khi
đó, khó có thể khẳng định rằng biến expend không có tương quan với sai số.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

7


Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

Phân tích hồi quy bội:
Vấn đề ước lượng

Phân tích hồi quy bội:
Vấn đề ước lượng

Thảo luận về giả thiết trung bình có điều kiện bằng 0

Các biến giải thích có tương quan với sai số được gọi là biến nội sinh; Sự
nội sinh là trường hợp vi phạm giả thiết MLR.4
Các biến giải thích không tương quan với sai số được gọi là biến ngoại

sinh; MLR.4 được thỏa mãn nếu tất cả các biến giải thích là ngoại sinh

Sự ngoại sinh là giả thiết quan trọng cho việc diễn giải quan hệ nhân quả
của hồi quy bội, và cho tính không chệch của ước lượng OLS

Định lý 3.1 (Tính không chệch của OLS)

3.37

Tính không chệch là tính chất về trung bình của các mẫu; còn khi xét một
mẫu cụ thể, ước lượng tính được từ mẫu đó có thể khác xa giá trị đúng.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:
Vấn đề ước lượng
Chệch do bỏ sót biến

09.12.2017

Việc thêm biến không liên quan vào mô hình hồi quy
3.38

= 0 trong tổng thể

Không có vấn đề gì vì

Tuy nhiên, việc thêm biến không liên quan có thể làm tăng phương sai mẫu.
Bỏ sót biến có liên quan: trường hợp đơn giản
3.40

Mô hình đúng (chứa x1 và x2)
Mô hình ước lượng (x2 bị bỏ sót)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:
Vấn đề ước lượng

Giả sử x1 và x2 có tương quan và mối quan
hệ giữa chúng là tuyến tính

Ví dụ: Bỏ sót biến năng lực khi hồi quy tiền lương
3.42

Cả hai đều có thể mang dấu dương

Đây là hệ số chặn ước
lượng được khi y chỉ
hồi quy theo x1

Đây là hệ số góc của
x1 khi y chỉ hồi quy
theo x1

Phần sai số

Kết luận: Tất cả các hệ số ước lượng được đều bị chệch
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

/>
Suất sinh lợi giáo dục

sẽ bị ước lượng cao hơn thực tế do
.t
. . Kết quả hồi
quy cho thấy rằng người càng có nhiều năm đi học thì tiền lương sẽ rất cao, nhưng kết
quả này có thể đúng một phần, nhưng cũng có thể là do người có trình độ học vấn càng
cao thì nhìn chung năng lực cũng càng cao.

Khi nào bỏ sót biến không gây ra sự chệch cho ước lượng?

Khi biến bỏ sót không liên quan hoặc không tương quan với các biến
giải thích trong mô hình.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

8


Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

Phân tích hồi quy bội:
Vấn đề ước lượng

Phân tích hồi quy bội:
Vấn đề ước lượng

Tính chệch do bỏ sót biến: trường hợp tổng quát hơn
3.49

09.12.2017


Mô hình đúng (gồm x1, x2 và x3)

3.4 Phương sai của ước lượng OLS

Các giả thiết của mô hình hồi quy bội: (tt)
Giả thiết MLR.5 (Phương sai thuần nhất)

Mô hình ước lượng (x3 bị bỏ sót)

Không thể xác định rõ được chiều hướng của phần chệch

Phân tích như trường hợp đơn giản nếu một biến độc lập không
tương quan với các biến độc lập khác

Ví dụ: Bỏ sót biến ability trong phương trình hồi quy tiền lương
Nếu exper gần như không tương quan với educ và abil, thì chiều hướng của
phần chệch do bỏ sót biến có thể được phân tích như trong trường hợp đơn
giản chỉ có hai biến đã xét trước đó.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:
Vấn đề ước lượng
Định lý 3.2 (Phương sai mẫu của các hệ số góc ước lượng OLS)

Dưới các giả thiết từ MLR.1 đến MLR.5:

Phương sai của sai số

Ví dụ: phương trình tiền lương


Cách ký hiệu ngắn gọn

với

Giá trị của các biến giải thích không hàm
chứa bất kỳ thông tin nào về phương sai
của các yếu tố chưa quan sát được.
Giả thiết này có thể sẽ khó kiểm
chứng trong nhiều trường hợp
Tất cả các biến giải thích được ký
hiệu chung dưới dạng vector

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:
Vấn đề ước lượng
Các thành phần của phương sai ước lượng OLS (vấn đề đa cộng tuyến):
1) Phương sai của sai số

Phương sai sai số càng lớn sẽ càng làm tăng phương sai ước lượng vì có nhiều
“nhiễu“ hơn trong phương trình

Phương sai sai số lớn sẽ làm cho việc ước lượng kém chính xác
Phương sai sai số không giảm khi kích thước mẫu tăng lên

Tổng biến động trong mẫu
của biến giải thích xj:

R2 có được khi hồi quy biến độc lập xj theo tất cả

các biến độc lập khác (hồi quy có hệ số chặn)

2) Tổng biến động trong mẫu của biến giải thích

Tổng biến động trong mẫu của biến giải thích càng nhiều thì ước lượng thu được
càng chính xác (more precise)

Tổng biến động trong mẫu sẽ tự động tăng khi kích thước mẫu tăng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

/>
Vì vậy, tăng kích thước mẫu sẽ làm tăng sự chính xác (precision) của ước lượng

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

9


Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

Phân tích hồi quy bội:
Vấn đề ước lượng

Phân tích hồi quy bội:
Vấn đề ước lượng

3) Mối quan hệ tuyến tính giữa các biến độc lập
Hồi quy

Một ví dụ về đa cộng tuyến


theo tất cả các biến độc lập khác (có hệ số chặn)

Phương sai mẫu của

09.12.2017

Chi phí cho
giáo viên

Điểm trung bình bài thi
chuẩn hóa của trường

Các chi phí cho
nguyên vật liệu
dạy học

Các chi phí khác

R2 của phương trình này càng cao thì xj càng được
giải thích nhiều hơn bởi các biến độc lập khác

sẽ càng lớn khi

bởi các biến độc lập khác

càng được giải thích nhiều

Vấn đề các biến độc lập gần như phụ thuộc tuyến tính nhau được gọi
là vấn đề đa cộng tuyến (nghĩa là .


với một vài

nào đó)

Các loại chi phí sẽ có tương quan mạnh với nhau bởi vì một trường học có nguồn lực lớn sẽ
chi tiêu lớn cho tất cả các khoản chi.
Rất khó để ước lượng tác động riêng phần của từng loại chi phí bởi vì tất cả các khoản chi
thường cùng cao hoặc cùng thấp. Để ước lượng tác động một cách chính xác (precise),
chúng ta cần thêm các quan sát mà các khoản chi phí này khác nhau một cách đáng kể.
Kết quả là, phương sai mẫu của các hệ số hồi quy ước lượng được sẽ lớn.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:
Vấn đề ước lượng

PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG

• Tập tin gpa1.wf1

Thảo luận về vấn đề đa cộng tuyến

Trong các ví dụ trên, có thể sẽ tốt hơn nếu gom tất cả các khoản chi phí vào
thành một yếu tố vì không thể tách biệt tác động của từng khoản chi

Trong một số trường hợp, việc loại bỏ một số biến độc lập có thể làm giảm

đa cộng tuyến (nhưng cách làm này có thể dẫn tới sự chệch do bỏ sót biến)

Chỉ có phương sai mẫu của biến bị đa cộng tuyến bị “phóng đại“, ước lượng
của các biến giải thích khác có thể không bị ảnh hưởng.

Lưu ý rằng đa cộng tuyến không vi phạm giả thiết MLR.3

Đa cộng tuyến có thể được phát hiện thông qua “nhân tử phóng đại phương
sai“

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Kinh nghiệm: nhân tử phóng đại
phương sai không nên lớn hơn 10

VIF > 10: có đa cộng tuyến cao ; VIF < 10: có đa cộng tuyến thấp

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

/>
Dependent Variable: COLGPA
Method: Least Squares
Included observations: 141
Variable

C
HSGPA
ACT
SKIPPED
AGE

R-squared


Coefficient
0.902058
0.433794
0.014486
-0.080661
0.019904
0.237850

Variance Inflation Factors
Included observations: 141
Variable

C
HSGPA
ACT
SKIPPED
AGE

Coefficient
Variance
0.422975
0.009426
0.000112
0.000685
0.000522

Std. Error
0.650366
0.097088

0.010578
0.026173
0.022838

t-Statistic

1.387001
4.468031
1.369538
-3.081854
0.871566

Mean dependent var

Uncentered
VIF
548.3964
142.6962
85.81015
2.074317
296.0775

Prob.

0.1677
0.0000
0.1731
0.0025
0.3850


3.056738

Centered
VIF

NA
1.242002
1.165185
1.045578
1.084732

VIF < 10 : các biến độc lập có đa cộng tuyến thấp

40

10


Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

Phân tích hồi quy bội:
Vấn đề ước lượng

PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG







• Cách phát hiện đa cộng tuyến:
Dấu của hệ số hồi quy bị sai
Hệ số xác định R2 cao nhưng tỷ số |t| thấp
Hệ số tương quan cặp giữa các biến độc lập cao
Kiểm định sử dụng hồi quy phụ
Nhân tử phóng đại phương sai VIF








Sử dụng thông tin tiên nghiệm
Thu thập thêm số liệu hoặc lấy thêm mẫu mới
Kết hợp số liệu chéo và số liệu chuỗi thời gian
Bỏ bớt biến độc lập
Dùng sai phân cấp 1
Thay đổi dạng hàm của biến

Phương sai trong mô hình bị định dạng sai

Việc thêm hay không thêm một biến độc lập nào đó vào mô hình có
thể được xem xét dựa trên sự đánh đổi giữa tính chệch và tính
hiệu quả của ước lượng
Mô hình đúng của tổng thể


• Cách khắc phục đa cộng tuyến:

3.52
3.53

41

Phân tích hồi quy bội:
Vấn đề ước lượng
Xét điều kiện theo x1 và x2 ,
phương sai trong mô hình 2
luôn nhỏ hơn trong mô hình 1

3.55
Trường hợp 1:

Trường hợp 2:

p

Mô hình ước lượng 2

Sự chệch do bỏ sót biến ở mô hình bị định dạng sai (mô hình 2) được
bù đắp bằng phương sai nhỏ của ước lượng thu được
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:
Vấn đề ước lượng


Phương sai trong mô hình bị định dạng sai (tt.)
3.54

Mô hình ước lượng 1

Kết luận: Không thêm biến không liên quan vào mô hình

Sự đánh đổi giữa tính chệch và tính hiệu quả
Lưu ý: tính chệch không biến mất ngay cả khi xét mẫu lớn

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

/>
Ước lượng phương sai của sai số
3.56
Ước lượng không chệch của phương sai sai số có thể tính được dựa trên việc xem xét bậc tự
do của mô hình (df). Bậc tự do có được bằng cách lấy số quan sát trừ cho số tham số.
Có n sai số bình phương nhưng các thành phần này không hoàn toàn độc lập mà liên quan với
nhau thông qua k+1 phương trình xác định bởi điều kiện bậc nhất của bài toán tìm cực tiểu.

df = n-(k+1) = số quan sát – số tham số cần ước lượng

3.57

Định lý 3.3 (Ước lượng không chệch của phương sai sai số)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

11



Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

Phân tích hồi quy bội:
Vấn đề ước lượng

Phân tích hồi quy bội:
Vấn đề ước lượng

Ước lượng phương sai mẫu của các ước lượng OLS

3.5 Tính hiệu quả của OLS: Định lý Gauss-Markov

Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là không chệch

Độ lệch chuẩn
đúng của ước
lượng của

Tuy nhiên, dưới các giả thiết này, cũng có nhiều ước lượng khác là
Thay

không chệch

Ước lượng không chệch nào có phương sai nhỏ nhất?

cho phương sai chưa biết


Độ lệch chuẩn ước
lượng của ước lượng
của

3.58

Lưu ý rằng các công thức này chỉ đúng dưới các giả thiết từ MLR.1
đến MLR.5 (cụ thể là phải có giả thiết phương sai thuần nhất)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:
Vấn đề ước lượng
Định lý 3.4 (Định lý Gauss-Markov)

Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là ước lượng tuyến
tính không chệch tốt nhất (BLUE) của các hệ số hồi quy.

Để trả lời câu hỏi này, chúng ta thường xét trong lớp các ước lượng

tuyến tính, nghĩa là ước lượng là tuyến tính theo biến phụ thuộc.
3.60

Mặc dù có thể có dạng hàm bất kỳ theo giá trị mẫu
của tất cả các biến giải thích; ước lượng OLS luôn
có thể đưa về dạng này

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Môøi gheù thaêm trang web:


48

 /> />
“Tốt nhất“ nghĩa là “có phương sai nhỏ nhất“ :

với mọi

sao cho.

OLS chỉ có thể là ước lượng tốt nhất nếu MLR.1 – MLR.5 thỏa
mãn; nếu các giả thiết này vi phạm, ví dụ phương sai thay đổi, sẽ
có ước lượng khác tốt hơn.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

/>
12



×