Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge
09.12.2017
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Phân tích hồi quy bội:
Vấn đề ước lượng
• Hồi quy đơn (hồi quy 2 biến)
• y = β0+β1x1+u
• β0: hệ số chặn
• β1: hệ số góc
Chương 3
• Hồi quy bội 3 biến
• y = β0+β1x1+β2x2+u
• Hồi quy bội 4 biến
3.3
• y = β0+β1x1+β2x2+β3x3+u
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
• β0: hệ số chặn
• β1, β2, β3: hệ số góc
• y: biến phụ thuộc
• x1, x2, x3: biến độc lập
• u: sai số ngẫu nhiên, nhiễu
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
3.1 Sự cần thiết nghiên cứu hồi quy bội
Sự cần thiết của hồi quy bội
Định nghĩa mô hình hồi quy bội (k+1 biến)
Hệ số chặn
theo các biến
Đưa thêm nhiều biến giải thích vào mô hình
“
Thực hiện phân tích trong điều kiện giữ các yếu tố khác không đổi,
trừ các yếu tố trong
Các hệ số góc
3.6
Biến phụ thuộc
Biến được giải thích,
Biến phản ứng,…
Biến độc lập,
Biến giải thích,
Biến kiểm soát,…
3.8
Sai số ngẫu nhiên,
Nhiễu,
Phần chưa quan sát được,…
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
2
Phân tích hồi quy bội:
Vấn đề ước lượng
Phân tích hồi quy bội:
Vấn đề ước lượng
“Giải thích biến
• β0, β1, β2, β3: hệ số hồi quy
Cho phép sử dụng dạng hàm đa dạng hơn
Ví dụ: Phương trình tiền lương
Cho phép đo lường tác động của trình độ học vấn lên lương trong điều kiện kinh nghiệm là không đổi
Tiền lương (USD/giờ)
Số năm đi học
3.1
Tất cả các yếu tố khác
Kinh nghiệm lao động
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge
09.12.2017
Phân tích hồi quy bội:
Vấn đề ước lượng
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ: Điểm kiểm tra trung bình và chi phí trên mỗi sinh viên
Ví dụ: Thu nhập và chi tiêu của hộ gia đình
3.2
Điểm trung bình của
bài thi chuẩn hóa
Chi phí trên mỗi sinh
viên của trường
Thu nhập trung bình
của gia đình các sinh
viên trong trường
Các yếu tố khác
Chi phí trên mỗi sinh viên có thể tương quan với thu nhập trung bình của
các gia đình do vấn đề tài chính
Nếu bỏ biến thu nhập trung bình của gia đình ra khỏi hàm hồi quy có thể
dẫn tới ước lượng tác động của chi phí trên mỗi sinh viên đến điểm trung
bình bị chệch.
Trong hồi quy đơn, tác động của biến chi phí trên mỗi sinh viên đến điểm số
có thể đã bao gồm luôn tác động của biến thu nhập trung bình của gia đình
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ: tiền lương của CEO, doanh thu và thâm niên của CEO
Log của thu nhập CEO
Log của doanh thu
Các yếu tố khác
Chi tiêu của hộ
Thu nhập của hộ
Thu nhập của hộ bình phương
Mô hình có hai biến giải thích: thu nhập và thu nhập bình phương
Chi tiêu được giải thích bằng hàm bậc hai của thu nhập
Cần cẩn thận khi diễn giải ý nghĩa của các hệ số hồi quy:
Phụ thuộc vào
mức chi tiêu cụ
Mức chi tiêu tăng thêm bao
nhiêu đơn vị nếu thu nhập
tăng thêm một đơn vị?
thể đang xét
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
3.2 Cách thực hiện và diễn giải của phương pháp OLS
3.7
Hàm bậc hai của số năm thâm niên làm CEO
Mô hình giả định rằng hệ số co giãn của tiền lương CEO theo doanh
thu của doanh nghiệp là hằng số.
Mô hình giả định rằng mối quan hệ giữa tiền lương CEO và thâm niên
làm CEO có dạng hàm bậc hai
Ý nghĩa của sự “tuyến tính“ trong hồi quy
Mô hình phải tuyến tính theo tham số (không phải theo biến số)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
3.4
Ước lượng OLS của mô hình hồi quy bội:
Mẫu ngẫu nhiên
Phần dư
3.11’
Cực tiểu tổng bình phương phần dư
3.12’
Việc tìm giá trị cực tiểu sẽ được thực hiện bởi phần mềm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
2
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge
Phân tích hồi quy bội:
Vấn đề ước lượng
Diễn giải ý nghĩa của mô hình hồi quy bội
Cho biết lượng thay đổi của biến phụ thuộc khi biến độc
lập thứ j thay đổi một đơn vị, trong điều kiện các biến độc
lập khác và sai số không đổi
Mô hình hồi quy bội cho phép giữ nguyên giá trị của các biến giải
thích khác không đổi, ngay cả khi trong thực tế có thể các biến giải
thích này là có tương quan với nhau.
Cách diễn giải này được gọi là “Các yếu tố khác không đổi“
Chúng ta vẫn cần giả định rằng các yếu tố không quan sát được u sẽ
không thay đổi khi biến giải thích thay đổi.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
Cách diễn giải tác động riêng phần trong hồi quy bội:
Hệ số hồi quy của biến giải thích trong mô hình hồi quy bội có
thể được ước lượng và có thể tính toán được bằng hai bước sau:
1) Hồi quy biến giải thích này theo tất cả các biến giải thích còn lại
2) Hồi quy
theo phần dư của hàm hồi quy ở bước 1
Tại sao cách này có thể thực hiện được?
Phần dư của hàm hồi quy ở bước 1 đó chính là phần còn lại của biến
giải thích và phần còn lại này không tương quan với các biến giải
thích khác trong mô hình
09.12.2017
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ 3.1: Các yếu tố tác động đến điểm GPA
Điểm GPA trung bình của
sinh viên ở đại học
Diễn giải
Điểm GPA trung bình khi
học phổ thông trung học
3.15
Kết quả bài kiểm tra thành tích
Trong điều kiện ACT không đổi, mỗi điểm GPA trung học tăng thêm có thể
làm tăng 0,453 điểm GPA đại học
Hoặc: Nếu chúng ta so sánh hai sinh viên có cùng ACT nhưng điểm hsGAP
của sinh viên A cao hơn 1 điểm so với sinh viên B, thì chúng ta dự đoán rằng
sinh viên A sẽ có colGPA cao hơn 0,453 điểm so với sinh viên B
Trong điều kiện điểm hsGPA như nhau, mỗi 10 điểm ACT cao hơn có thể làm
điểm colGAP cao hơn 0,0094*10 = 0,094 điểm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
• Tập tin gpa1.wf1
Dependent Variable: COLGPA
Method: Least Squares
Included observations: 141
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
HSGPA
ACT
SKIPPED
AGE
0.902058
0.433794
0.014486
-0.080661
0.019904
0.650366
0.097088
0.010578
0.026173
0.022838
1.387001
4.468031
1.369538
-3.081854
0.871566
0.1677
0.0000
0.1731
0.0025
0.3850
R-squared
0.237850
Mean dependent var
3.056738
Hệ số góc trong hàm hồi quy ở bước 2 chính là tác động đã tách biệt
của riêng biến giải thích đó đến biến phụ thuộc
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
12
3
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge
09.12.2017
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Dependent Variable: HSGPA
Method: Least Squares
Included observations: 141
Variable
C
ACT
SKIPPED
AGE
R-squared
Coefficient
3.793037
0.038582
-0.043514
-0.061095
0.194848
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Std. Error
t-Statistic
0.471721
0.008705
0.022730
0.019407
8.040848
4.432224
-1.914419
-3.148103
Mean dependent var
Dependent Variable: COLGPA
Method: Least Squares
Included observations: 141
Prob.
Variable
0.0000
0.0000
0.0577
0.0020
C
VM
3.402128
R-squared
• HSGPA = β0 + β1 ACT + β2 SKIPPED + β3 AGE + v
Coefficient
3.056738
0.433794
0.111875
Std. Error
0.029654
0.103668
t-Statistic
103.0787
4.184439
Mean dependent var
Prob.
0.0000
0.0001
3.056738
• Dùng lệnh Genr: vm=resid
13
Phân tích hồi quy bội:
Vấn đề ước lượng
Phân tích hồi quy bội:
Vấn đề ước lượng
Tính chất của ước lượng OLS với một mẫu dữ liệu bất kỳ
Giá trị ước lượng (Fitted values) và phần dư
3.20
Giá trị ước lượng/Giá trị dự đoán
Mức độ phù hợp của hàm SRF so với mẫu khảo sát
3.21
Phần dư
Tính chất đại số của hồi quy OLS
Tổng phần dư bằng 0
Tương quan giữa biến độc
lập xj và phần dư bằng 0
14
Sự phân rã của tổng mức biến động
R bình phương (R2)
3.27
Các biểu diễn khác của R bình phương
Trung bình mẫu của biến phụ
thuộc và các biến độc lập nằm
trên đường hồi quy
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
Lưu ý rằng R2 luôn tăng khi thêm
biến độc lập vào hàm hồi quy
3.28
R2 bằng bình phương của hệ số
tương quan giữa giá trị thực tế và
giá trị ước lượng của biến phụ thuộc
= ( r(y,y^)2 )
3.29
Tính chất: 0 R2 1
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4
Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge
Phân tích hồi quy bội:
Vấn đề ước lượng
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ
Số lần bị bắt giữ
trong năm 1986
Tỷ lệ số lần bắt
giữ có dẫn đến bị
buộc tội trước đó
(khơng phải %)
09.12.2017
Số tháng bị giam
trong năm 1986
Số q làm việc
trong năm 1986
Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ (tt)
Nếu thêm một biến giải thích khác avgsen vào mơ hình:
Mức phạt trung bình của các lần phạm tội trước
Diễn giải:
Tỷ lệ số lần bị bắt giữ trước đó tăng 0,5 lần thì dẫn đến số lần bị bắt giữ
giảm đi 0,15*0,5 = 0,075 lần (trên 1 người) hay 7,5 lần (trên 100 người)
Số tháng bị giam tăng 12 tháng thì dẫn đến số lần bị bắt giữ của người đó
giảm 0,034*12 = 0,408 lần
Số q làm việc trong năm tăng 1 dẫn đến số lần bị bắt giữ của người đó
giảm 0,104 lần (trên 1 người) hay 10,4 lần (trên 100 người)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
Mức phạt trung bình của các lần phạm tội trước có làm tăng số lần bị bắt giữ (?)
Vai trò của biến giải thích mới thêm vào khá hạn chế khi R2 tăng rất ít
Lưu ý chung về R2
Ngay cả khi R2 khá nhỏ (như trong ví dụ), hàm hồi quy vẫn có thể dùng để phân
tích tác động nhân quả riêng phần theo dạng “giữ các yếu tố khác cố định“
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Khái niệm đa cộng tuyến
Xét mô hình hồi quy bội:
y = β0 + β1x1 + β2x2 + u
3.3 Giá trị kỳ vọng của ước lượng OLS
Các giả thiết của mơ hình hồi quy bội:
Giả thiết MLR.1 (Tuyến tính theo tham số)
3.31
Giả thiết MLR.2 (Mẫu ngẫu nhiên)
R2 chỉ tăng nhẹ
Diễn giải:
y
Trong tổng thể, mối liên hệ giữa
biến phụ thuộc y và các biến độc
lập là tuyến tính theo tham số
Mẫu dữ liệu được chọn
ngẫu nhiên từ tổng thể
3.32
Vì vậy, mỗi quan sát đều tn theo hàm hồi quy tổng thể
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
x1
y
x2
x1
Không có ĐCT
y
x1
ĐCT thấp
x2
y
x2
ĐCT vừa
x1
x2
x2
ĐCT cao
x1
ĐCT hoàn hảo
20
5
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge
09.12.2017
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Xét mô hình hồi quy bội với hai biến độc lập x1, x2:
y = β0+β1x1+ β2x2+u
Cách tiếp cận đại số của vấn đề đa cộng tuyến:
Nếu tồn tại các số thực 1, …, k không đồng thời bằng
0 và “số thực” c sao cho:
1x1 + 2x2 + … + kxk = c
thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng
tuyến hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ tuyến
tính chính xác.
Nếu tồn tại các số thực 1, ..., k không đồng thời bằng
0 và “số thực” c sao cho:
0 + 1x1 + 2x2 + … + k1xk1 + v = c
với v là sai số ngẫu nhiên
thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng
tuyến không hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ
tuyến tính không chính xác.
* Nếu có đa cộng tuyến hoàn hảo, tồn tại ít nhất một i 0
(i= 1, 2) và c sao cho:
1x1+2x2 = c
Giả sử 2 ≠ 0
2
* Nếu có đa cộng tuyến không hoàn hảo, tồn tại ít nhất một i 0
(i= 1, 2) và c sao cho:
1x1+2x2+v = c
21
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
x1
10
15
18
24
30
r = 0: x1, x2 không có đa cộng tuyến
r ≠ 0: x1, x2 có đa cộng tuyến
– |r| càng gần 1 thì mức độ ĐCT càng cao
– |r| càng gần 0 thì mức độ ĐCT càng thấp
– |r|=1: ĐCT hoàn hảo
/>
(v là sai số ngẫu nhiên)
22
Ví dụ:
Ta có dữ liệu giả định của các biến sau:
Xét hệ số tương quan r = r(x1,x2), ta có: 0 |r| 1
Lưu ý:
Chỉ đúng cho mô hình có 2 biến độc lập.
Giả sử 2 ≠ 0 x 1 x 1 v c x v ' c '
2 2 1 2 2
1
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Xét mô hình hồi quy bội với hai biến độc lập x1, x2:
y = β0+β1x1+ β2x2+u
•
•
c
x 1 x
x c'
2
1
2 1
23
x2
50
75
90
120
150
x2*
52
75
97
129
152
x1, x2 có đa cộng tuyến hoàn hảo?
x1, x2* có đa cộng tuyến hoàn hảo?
v
2
0
7
9
2
24
6
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge
09.12.2017
Phân tích hồi quy bội:
Vấn đề ước lượng
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Ví dụ (tt):
Ta có x2 = 5x1 nên x1 và x2 có đa cộng tuyến hoàn hảo.
Ta thấy hệ số tương quan r(x1,x2) = 1.
Các giả thiết của mô hình hồi quy bội: (tt)
Ta có x2*= 5x1+v, nên x1 và x2* có đa cộng tuyến không hoàn hảo.
Ta thấy r(x1,x2*) = 0,9959 nên x1 và x2* có đa cộng tuyến cao, gần
hoàn hảo.
Giả thiết MLR.3 (Không có cộng tuyến hoàn hảo)
Trong mẫu (và vì vậy trong tổng thể), không có biến độc lập nào là hằng
số và không có phụ thuộc tuyến tính chính xác giữa các biến độc lập
Lưu ý về giả thiết MLR.3
Giả thiết này chỉ loại trừ trường hợp cộng tuyến/tương quan hoàn
hảo giữa các biến độc lập; các tương quan không hoàn hảo vẫn có
thể xảy ra
Nếu một biến độc lập là tổ hợp tuyến tính chính xác của các biến
độc lập khác thì biến độc lập đó là không cần thiết và sẽ bị loại bỏ ra
khỏi hàm hồi quy
25
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ về cộng tuyến hoàn hảo: trường hợp mẫu nhỏ
Trong mẫu nhỏ, biến avginc có thể vô tình là bội số của biến expend; khi đó
không thể tách bạch tác động riêng phần cho từng biến vì biến động của chúng là
như nhau
Ví dụ về cộng tuyến hoàn hảo: mối liên hệ giữa các biến độc lập
Biến hằng số cũng bị loại bỏ (vì cộng tuyến hoàn hảo với hệ số chặn)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
Các giả thiết của mô hình hồi quy bội: (tt)
Giả thiết MLR.4 (Trung bình có điều kiện bằng 0)
3.36
Giá trị của các biến giải thích không chứa
bất kỳ thông tin nào về giá trị trung bình
của các yếu tố không quan sát được
Trong mô hình hồi quy bội, giả thiết trung bình có điều kiện bằng 0
có nhiều khả năng được thỏa mãn hơn vì có ít yếu tố được gộp vào
sai số ngẫu nhiên hơn so với hồi quy đơn.
Ví dụ: Điểm kiểm tra trung bình
Hoặc shareA hoặc shareB sẽ bị loại ra khỏi mô hình vì có mối liên hệ tuyến tính
chính xác giữa chúng: shareA + shareB = 1
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
Nếu avginc không được đưa vào mô hình, biến này sẽ nằm trong sai số; khi
đó, khó có thể khẳng định rằng biến expend không có tương quan với sai số.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
7
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge
Phân tích hồi quy bội:
Vấn đề ước lượng
Phân tích hồi quy bội:
Vấn đề ước lượng
Thảo luận về giả thiết trung bình có điều kiện bằng 0
Các biến giải thích có tương quan với sai số được gọi là biến nội sinh; Sự
nội sinh là trường hợp vi phạm giả thiết MLR.4
Các biến giải thích không tương quan với sai số được gọi là biến ngoại
sinh; MLR.4 được thỏa mãn nếu tất cả các biến giải thích là ngoại sinh
Sự ngoại sinh là giả thiết quan trọng cho việc diễn giải quan hệ nhân quả
của hồi quy bội, và cho tính không chệch của ước lượng OLS
Định lý 3.1 (Tính không chệch của OLS)
3.37
Tính không chệch là tính chất về trung bình của các mẫu; còn khi xét một
mẫu cụ thể, ước lượng tính được từ mẫu đó có thể khác xa giá trị đúng.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
Chệch do bỏ sót biến
09.12.2017
Việc thêm biến không liên quan vào mô hình hồi quy
3.38
= 0 trong tổng thể
Không có vấn đề gì vì
Tuy nhiên, việc thêm biến không liên quan có thể làm tăng phương sai mẫu.
Bỏ sót biến có liên quan: trường hợp đơn giản
3.40
Mô hình đúng (chứa x1 và x2)
Mô hình ước lượng (x2 bị bỏ sót)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
Giả sử x1 và x2 có tương quan và mối quan
hệ giữa chúng là tuyến tính
Ví dụ: Bỏ sót biến năng lực khi hồi quy tiền lương
3.42
Cả hai đều có thể mang dấu dương
Đây là hệ số chặn ước
lượng được khi y chỉ
hồi quy theo x1
Đây là hệ số góc của
x1 khi y chỉ hồi quy
theo x1
Phần sai số
Kết luận: Tất cả các hệ số ước lượng được đều bị chệch
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
Suất sinh lợi giáo dục
sẽ bị ước lượng cao hơn thực tế do
.t
. . Kết quả hồi
quy cho thấy rằng người càng có nhiều năm đi học thì tiền lương sẽ rất cao, nhưng kết
quả này có thể đúng một phần, nhưng cũng có thể là do người có trình độ học vấn càng
cao thì nhìn chung năng lực cũng càng cao.
Khi nào bỏ sót biến không gây ra sự chệch cho ước lượng?
Khi biến bỏ sót không liên quan hoặc không tương quan với các biến
giải thích trong mô hình.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
8
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge
Phân tích hồi quy bội:
Vấn đề ước lượng
Phân tích hồi quy bội:
Vấn đề ước lượng
Tính chệch do bỏ sót biến: trường hợp tổng quát hơn
3.49
09.12.2017
Mô hình đúng (gồm x1, x2 và x3)
3.4 Phương sai của ước lượng OLS
Các giả thiết của mô hình hồi quy bội: (tt)
Giả thiết MLR.5 (Phương sai thuần nhất)
Mô hình ước lượng (x3 bị bỏ sót)
Không thể xác định rõ được chiều hướng của phần chệch
Phân tích như trường hợp đơn giản nếu một biến độc lập không
tương quan với các biến độc lập khác
Ví dụ: Bỏ sót biến ability trong phương trình hồi quy tiền lương
Nếu exper gần như không tương quan với educ và abil, thì chiều hướng của
phần chệch do bỏ sót biến có thể được phân tích như trong trường hợp đơn
giản chỉ có hai biến đã xét trước đó.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
Định lý 3.2 (Phương sai mẫu của các hệ số góc ước lượng OLS)
Dưới các giả thiết từ MLR.1 đến MLR.5:
Phương sai của sai số
Ví dụ: phương trình tiền lương
Cách ký hiệu ngắn gọn
với
Giá trị của các biến giải thích không hàm
chứa bất kỳ thông tin nào về phương sai
của các yếu tố chưa quan sát được.
Giả thiết này có thể sẽ khó kiểm
chứng trong nhiều trường hợp
Tất cả các biến giải thích được ký
hiệu chung dưới dạng vector
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
Các thành phần của phương sai ước lượng OLS (vấn đề đa cộng tuyến):
1) Phương sai của sai số
Phương sai sai số càng lớn sẽ càng làm tăng phương sai ước lượng vì có nhiều
“nhiễu“ hơn trong phương trình
Phương sai sai số lớn sẽ làm cho việc ước lượng kém chính xác
Phương sai sai số không giảm khi kích thước mẫu tăng lên
Tổng biến động trong mẫu
của biến giải thích xj:
R2 có được khi hồi quy biến độc lập xj theo tất cả
các biến độc lập khác (hồi quy có hệ số chặn)
2) Tổng biến động trong mẫu của biến giải thích
Tổng biến động trong mẫu của biến giải thích càng nhiều thì ước lượng thu được
càng chính xác (more precise)
Tổng biến động trong mẫu sẽ tự động tăng khi kích thước mẫu tăng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
Vì vậy, tăng kích thước mẫu sẽ làm tăng sự chính xác (precision) của ước lượng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
9
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge
Phân tích hồi quy bội:
Vấn đề ước lượng
Phân tích hồi quy bội:
Vấn đề ước lượng
3) Mối quan hệ tuyến tính giữa các biến độc lập
Hồi quy
Một ví dụ về đa cộng tuyến
theo tất cả các biến độc lập khác (có hệ số chặn)
Phương sai mẫu của
09.12.2017
Chi phí cho
giáo viên
Điểm trung bình bài thi
chuẩn hóa của trường
Các chi phí cho
nguyên vật liệu
dạy học
Các chi phí khác
R2 của phương trình này càng cao thì xj càng được
giải thích nhiều hơn bởi các biến độc lập khác
sẽ càng lớn khi
bởi các biến độc lập khác
càng được giải thích nhiều
Vấn đề các biến độc lập gần như phụ thuộc tuyến tính nhau được gọi
là vấn đề đa cộng tuyến (nghĩa là .
với một vài
nào đó)
Các loại chi phí sẽ có tương quan mạnh với nhau bởi vì một trường học có nguồn lực lớn sẽ
chi tiêu lớn cho tất cả các khoản chi.
Rất khó để ước lượng tác động riêng phần của từng loại chi phí bởi vì tất cả các khoản chi
thường cùng cao hoặc cùng thấp. Để ước lượng tác động một cách chính xác (precise),
chúng ta cần thêm các quan sát mà các khoản chi phí này khác nhau một cách đáng kể.
Kết quả là, phương sai mẫu của các hệ số hồi quy ước lượng được sẽ lớn.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
• Tập tin gpa1.wf1
Thảo luận về vấn đề đa cộng tuyến
Trong các ví dụ trên, có thể sẽ tốt hơn nếu gom tất cả các khoản chi phí vào
thành một yếu tố vì không thể tách biệt tác động của từng khoản chi
Trong một số trường hợp, việc loại bỏ một số biến độc lập có thể làm giảm
đa cộng tuyến (nhưng cách làm này có thể dẫn tới sự chệch do bỏ sót biến)
Chỉ có phương sai mẫu của biến bị đa cộng tuyến bị “phóng đại“, ước lượng
của các biến giải thích khác có thể không bị ảnh hưởng.
Lưu ý rằng đa cộng tuyến không vi phạm giả thiết MLR.3
Đa cộng tuyến có thể được phát hiện thông qua “nhân tử phóng đại phương
sai“
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Kinh nghiệm: nhân tử phóng đại
phương sai không nên lớn hơn 10
VIF > 10: có đa cộng tuyến cao ; VIF < 10: có đa cộng tuyến thấp
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
Dependent Variable: COLGPA
Method: Least Squares
Included observations: 141
Variable
C
HSGPA
ACT
SKIPPED
AGE
R-squared
Coefficient
0.902058
0.433794
0.014486
-0.080661
0.019904
0.237850
Variance Inflation Factors
Included observations: 141
Variable
C
HSGPA
ACT
SKIPPED
AGE
Coefficient
Variance
0.422975
0.009426
0.000112
0.000685
0.000522
Std. Error
0.650366
0.097088
0.010578
0.026173
0.022838
t-Statistic
1.387001
4.468031
1.369538
-3.081854
0.871566
Mean dependent var
Uncentered
VIF
548.3964
142.6962
85.81015
2.074317
296.0775
Prob.
0.1677
0.0000
0.1731
0.0025
0.3850
3.056738
Centered
VIF
NA
1.242002
1.165185
1.045578
1.084732
VIF < 10 : các biến độc lập có đa cộng tuyến thấp
40
10
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge
09.12.2017
Phân tích hồi quy bội:
Vấn đề ước lượng
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
•
•
•
•
•
• Cách phát hiện đa cộng tuyến:
Dấu của hệ số hồi quy bị sai
Hệ số xác định R2 cao nhưng tỷ số |t| thấp
Hệ số tương quan cặp giữa các biến độc lập cao
Kiểm định sử dụng hồi quy phụ
Nhân tử phóng đại phương sai VIF
•
•
•
•
•
•
Sử dụng thông tin tiên nghiệm
Thu thập thêm số liệu hoặc lấy thêm mẫu mới
Kết hợp số liệu chéo và số liệu chuỗi thời gian
Bỏ bớt biến độc lập
Dùng sai phân cấp 1
Thay đổi dạng hàm của biến
Phương sai trong mô hình bị định dạng sai
Việc thêm hay không thêm một biến độc lập nào đó vào mô hình có
thể được xem xét dựa trên sự đánh đổi giữa tính chệch và tính
hiệu quả của ước lượng
Mô hình đúng của tổng thể
• Cách khắc phục đa cộng tuyến:
3.52
3.53
41
Phân tích hồi quy bội:
Vấn đề ước lượng
Xét điều kiện theo x1 và x2 ,
phương sai trong mô hình 2
luôn nhỏ hơn trong mô hình 1
3.55
Trường hợp 1:
Trường hợp 2:
p
Mô hình ước lượng 2
Sự chệch do bỏ sót biến ở mô hình bị định dạng sai (mô hình 2) được
bù đắp bằng phương sai nhỏ của ước lượng thu được
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
Phương sai trong mô hình bị định dạng sai (tt.)
3.54
Mô hình ước lượng 1
Kết luận: Không thêm biến không liên quan vào mô hình
Sự đánh đổi giữa tính chệch và tính hiệu quả
Lưu ý: tính chệch không biến mất ngay cả khi xét mẫu lớn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
Ước lượng phương sai của sai số
3.56
Ước lượng không chệch của phương sai sai số có thể tính được dựa trên việc xem xét bậc tự
do của mô hình (df). Bậc tự do có được bằng cách lấy số quan sát trừ cho số tham số.
Có n sai số bình phương nhưng các thành phần này không hoàn toàn độc lập mà liên quan với
nhau thông qua k+1 phương trình xác định bởi điều kiện bậc nhất của bài toán tìm cực tiểu.
df = n-(k+1) = số quan sát – số tham số cần ước lượng
3.57
Định lý 3.3 (Ước lượng không chệch của phương sai sai số)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
11
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge
09.12.2017
Phân tích hồi quy bội:
Vấn đề ước lượng
Phân tích hồi quy bội:
Vấn đề ước lượng
Ước lượng phương sai mẫu của các ước lượng OLS
3.5 Tính hiệu quả của OLS: Định lý Gauss-Markov
Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là không chệch
Độ lệch chuẩn
đúng của ước
lượng của
Tuy nhiên, dưới các giả thiết này, cũng có nhiều ước lượng khác là
Thay
không chệch
Ước lượng không chệch nào có phương sai nhỏ nhất?
cho phương sai chưa biết
Độ lệch chuẩn ước
lượng của ước lượng
của
3.58
Lưu ý rằng các công thức này chỉ đúng dưới các giả thiết từ MLR.1
đến MLR.5 (cụ thể là phải có giả thiết phương sai thuần nhất)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề ước lượng
Định lý 3.4 (Định lý Gauss-Markov)
Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là ước lượng tuyến
tính không chệch tốt nhất (BLUE) của các hệ số hồi quy.
Để trả lời câu hỏi này, chúng ta thường xét trong lớp các ước lượng
tuyến tính, nghĩa là ước lượng là tuyến tính theo biến phụ thuộc.
3.60
Mặc dù có thể có dạng hàm bất kỳ theo giá trị mẫu
của tất cả các biến giải thích; ước lượng OLS luôn
có thể đưa về dạng này
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Môøi gheù thaêm trang web:
48
/> />
“Tốt nhất“ nghĩa là “có phương sai nhỏ nhất“ :
với mọi
sao cho.
OLS chỉ có thể là ước lượng tốt nhất nếu MLR.1 – MLR.5 thỏa
mãn; nếu các giả thiết này vi phạm, ví dụ phương sai thay đổi, sẽ
có ước lượng khác tốt hơn.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
/>
12