Chương 3
KIỂM ĐỊNH GIẢ THIẾT MÔ HÌNH
Phương sai thay đổi
Tự tương quan
Đa cộng tuyến
1. Khái niệm: Phương sai của các nhiễu là
trong mô hình có phương sai thay đổi
2. Bản chất (nguyên nhân)
Do sự tác động của các biến độc lập
+ Do sai số dụng cụ
+ Do bản chất các mối quan hệ kinh tế
+ Do kỹ thuật thu thập số liệu.
+ Do ảnh hưởng của các yếu tố khác làm tăng
hay giảm sai số trong mô hình.
PHƯƠNG SAI THAY ĐỔI
taùc ñoäng
¬ →
i i
X U
i
U
i
σ
Thay đổi
3. Phân tích sự thay đổi
Thay đổi
Khoảng tin cậy
Dự báo
Kiểm định
biến độc lập
Thay đổi
PHƯƠNG SAI THAY ĐỔI
i
X
¬ →
taùc ñoäng
2
var( )
σ
=
i i
U
2
ˆ
σ
ˆ
var( )
β
i
¬ →
taùc ñoäng
i
U
ˆ
ˆ
( )
β
β
=
i
i
T
se
0 0 0
ˆ ˆ
var( ); var( )−Y Y Y
4. Hậu quả của phương sai thay đổi
1. Các ước lượng OLS vẫn là các ước lượng
tuyến tính, không chệch nhưng không còn
hiệu quả nữa.
2. Ước lượng của phương sai bị chệch nên các
kiểm định mức ý nghĩa và khoảng tin cậy theo
phân phối Student và Fisher không còn đáng
tin cậy nữa.
3. Kết quả bài toán dự báo không hiệu quả khi sử
dụng các ước lượng OLS.
PHƯƠNG SAI THAY ĐỔI
5 . Cách phát hiện phương sai thay đổi
5.1 Phương pháp đồ thị
Xét mô hình : Yi = β1+ β2Xi +Ui(1)
- Hồi qui (1) thu được các phần dư ei.
- Vẽ đồ thị phân tán của e theo X.
- Nếu độ rộng của biểu đồ rải tăng hoặc giảm khi X
tăng thì mô hình (1) có thể có hiện tượng phương
sai thay đổi.
* Chú ý : Với mô hình hồi qui bội, cần vẽ đồ thị phần
dư theo từng biến độc lập hoặc theo .
PHƯƠNG SAI THAY ĐỔI
ˆ
Y
5.2. Kiểm định Park
Ý tưởng : Park cho rằng là một hàm của X
có dạng :
Do đó :
Vì
chưa biết nên để ước lượng hàm trên Park đề
nghị sử dụng
thay cho
PHƯƠNG SAI THAY ĐỔI
2
i
σ
i
eX
i
22
i
ν
σσ
α
=
2
i
σ
2
i
σ
ii
22
i
Xlnlnln
νσσ
++=
α
2
i
e
Các bước kiểm định Park :
-
Ước lượng mô hình hồi qui gốc (1), thu lấy
phần dư ei tính
- Ước lượng mô hình
* Chú ý: Nếu mô hình gốc có nhiều biến độc lập
thì hồi qui theo từng biến độc lập hoặc theo
-
Kiểm định giả thiết H0 : α = 0
- Nếu chấp nhận H0 mô hình gốc (1) có
phương sai không đổi.
PHƯƠNG SAI THAY ĐỔI
2
i
e
2
ln ln
i i i
e X
ν
= + +
0
α α
2
i
eln
i
Y
ˆ
5.3. Kiểm định Glejser
Nếu chấp nhận H0 : β2 = 0 mô hình gốc
(1) có phương sai không đổi.
PHƯƠNG SAI THAY ĐỔI
Tương tự kiểm định Park, tuy nhiên sau khi thu
các phần dư từ mô hình hồi qui gốc, Glejser sử
dụng các dạng hàm sau
ii21i
ii21i
Xe
Xe
νββ
νββ
++=
++=
i
i
21i
i
i
21i
X
1
e
X
1
e
νββ
νββ
++=
++=
PHƯƠNG SAI THAY ĐỔI
5.4. Phương pháp kiểm định WHITE
Xét mô hình hồi quy ba biến
sau
Kiểm định White được thực hiện theo các bước sau
Bước 1. Ước lượng mô hình và xác định phần dư
Bước 2. Uớc lượng mô hình
Bước 3. Giả thuyết H0 :“MHcó phương sai không
đổi”
Bước 4. Nếu giá trị n*R2 lớn hơn giá trị tới hạn ta
bác bỏ H0
Giá trị tới hạn
tra bảng Chi – bình phương
1 2 2 3 3
Y X X
β β β
= + +
{
2 2 2
1 2 2 3 3 4 2 5 3 6 2 3
soá haïng tích cheùo
X X
i
e X X X X
α α α α α α
= + + + + +
2 2
( ) ( )n R O bs R Squared k
χ
× × −
:
2
( )k
α
χ
Heteroskedasticity Test: White
F-statistic 20.18918 Prob. F(5,12) 0.0000
Obs*R-squared 16.08758 Prob. Chi-Square(5) 0.0066
Scaled explained SS 23.57623 Prob. Chi-Square(5) 0.0003
PHƯƠNG SAI THAY ĐỔI
Ví dụ. Khảo sát số liệu về chi phí cho việc
nghiên cứu và phát triển của 18 ngành công
nghiệp ở Mỹ trong năm 1988.
Dùng phần mềm Eviews, ta có bảng kết quả sau
P_ value = 0.0066, so sánh với mức ý nghĩa cho
trước, ta bác bỏ H0
PHƯƠNG SAI THAY ĐỔI
6. Khắc phục
- Về mặt lý thuyết (SGK)
- Về mặt thực tế
+ Điều tra lại số liệu (tốn kém, khó khăn)
+ Sử dụng mô hình nhưng có kiểm soát về hiện
tượng phương sai thay đổi
TỰ TƯƠNG QUAN
1. Khái niệm: Sai số ngẫu nhiên ở các thời điểm khác
nhau có quan hệ với nhau
Cov(Ui, Uj) ≠ 0 (i ≠ j)
2. Bản chất (nguyên nhân): Do sự tác động của các
biến độc lập lên sai số ngẫu nhiên
- Luật quán tính
- Do mô hình:Không đưa đủ biến vào mô hình
hoặc chọn mô hình không đúng
- Số liệu: Thu thập số liệu và xử lý số liệu
taùc ñoäng
(*)
¬ →
i j
U U
.Hiện tượng tự tương quan bậc 1
Nếu
Nếu
.Hiện tượng tự tương
quan bậc p
Ký hiệu AR(p)
TỰ TƯƠNG QUAN
1
−
↔
i i
U U
1 2
− − −
↔ + + +
i i i i p
U U U U
TỰ TƯƠNG QUAN
3. Phân tích sự tác động
Thay
đổi
Thay
đổi
Thay
đổi
Khoảng tin cậy
Kiểm đònh biến
độc lập
Dự báo
i
X
i
ε
→
tác động
¬ →
tác động
j
ε
2
ˆ
σ
ˆ
var( )
β
i
2
var( )
j i
ε σ
=
→
ˆ
ˆ
( )
β
β
=
i
i
T
se
0 0 0
ˆ ˆ
var( ); var( )
−
Y Y Y
4. Hậu quả của tự tương quan
1. Các ước lượng OLS vẫn là các ước lượng
tuyến tính, không chệch nhưng không còn
hiệu quả nữa.
2. Ước lượng của phương sai bị chệch nên các
kiểm định mức ý nghĩa và khoảng tin cậy theo
phân phối Student và Fisher không còn đáng
tin cậy nữa.
3. Kết quả bài toán dự báo không hiệu quả khi sử
dụng các ước lượng OLS.
TỰ TƯƠNG QUAN
5. Cách phát hiện tự tương quan
TỰ TƯƠNG QUAN
5.1. Phương pháp đồ thị
-
Hồi qui mô hình gốc thu phần dư et.
-
Vẽ đồ thị phần dư et theo thời gian.
-
Nếu phần dư phân bố ngẫu nhiên xung
quanh trung bình của chúng, không biểu
thị một kiểu mẫu nào khi thời gian tăng
mô hình gốc không có tự tương quan.
TỰ TƯƠNG QUAN
5.2. Kiểm định d của Durbin-Watson (SGK)
5.3 . Phương pháp kiểm định B – G
Xét mô hình : Yt = β1+ β2Xt + Ut (1)
với Ut =ρ1Ut-1+ ρ2Ut-2 +…+ ρpUt-p+ εt
εt thỏa mãn các giả thiết của mô hình cổ điển. Cần
kiểm định H0 : ρ1=ρ2=…=ρp=0
(không có tự tương quan)
Bước 1: Ước lượng mô hình (1), thu et.
Bước 2: Ước lượng mô hình sau, thu R2 :
et = β1+ β2Xt + ρ1et-1+ ρ2et-2 +…+ ρpet-p+ Vt
TỰ TƯƠNG QUAN
Bước 3. So sánh , nếu gía trị (n – p)*R2 lớn hơn giá trị
tới hạn. Kết luận mô hình có tự tương quan bậc p
Trong đó
Giá trị tới hạn tra bảng Chi – bình phương
Ví dụ. Cho các số liệu về nhu cầu kem (Y đơn vị :
pints = 0.473 lít) và thu nhập hàng tuần của gia đình
(X đơn vị USD) (số liệu SGK)
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 25.17764 Prob. F(2,26) 0.0000
Obs*R-squared 19.78460 Prob. Chi-Square(2) 0.0001
Dùng phần mềm Eviews, ta có kết quả kiểm định B-G
2 2
( ) ( ) ( )n p R O bs R Squared p
χ
− × × −
:
2
( )p
α
χ
ĐA CỘNG TUYẾN
1. Khái niệm: Do mối quan hệ giữa các biến trong
mô hình
Nghĩa là
2. Bản chất (nguyên nhân): Do sự tác động của các
biến độc lập
- Do bản chất quan hệ giữa các biến độc lập
- Do chọn biến độc lập trong mô hình
Xét hàm hồi qui k biến :
Yi = β1+ β2X2i + …+ βkXki + Ui
+ Nếu tồn tại các số λ2, λ3,…,λk không đồng thời
bằng 0 sao cho :
( )
0cov , ,
i j
X X i j
≠ ∀ ≠
¬ →
taùc ñoäng
(*)
i j
X X
xảy ra hiện tượng đa cộng tuyến hoàn hảo
ĐA CỘNG TUYẾN
+ Nếu tồn tại các số λ2, λ3,…,λk không đồng thời
bằng 0 sao cho :
xảy ra hiện tượng đa cộng tuyến không hoàn hảo
X2
10 15 18 24 30
X3
50 75 90 120 150
X4
52 75 97 129 152
e 2 0 7 9 2
Ví dụ. Xét mô hình có các biến độc lập như sau
2 2 3 3
0
λ λ λ
+ + + =
k k
X X X
2 2 3 3 k k
X X X V 0
λ + λ + + λ + =
2 3
X X
r 1
=
≈
2 4
X X
r 0.996
ĐA CỘNG TUYẾN
3. Hậu quả
- Các hệ số hồi quy không xác đònh (Hoàn hảo),
khó xác đònh hay là các ước lượng chệch , chẳng
hạn với mô hình 3 biến, ta có
Nếu thì
- Phương sai và hiệp phương sai của các ước
lượng hồi quy lớn, chẳng hạn với mô hình 3 biến,
ta có
2
2 3 3 2 3
1 1 1 1
2
2
2 2
2 3 2 3
1 1 1
, , , , ,
, , , ,
ˆ
n n n n
i i i i i i i
i i i i
n n n
i i i i
i i i
y x x y x x x
x x x x
β
= = = =
= = =
−
=
−
÷
∑ ∑ ∑ ∑
∑ ∑ ∑
3 2, ,i i
x x
λ
=
2
0
0
ˆ
β
=
( )
( )
2 3
2
1
2
2 2
2 2 3
1
1
,
, ,
ˆ
var
r
n
i
i
x r
σ
β
→
=
= →+∞
−
∑
- Khoảng tin cậy rộng dẫn đến không có ý
nghóa
- Giá trò thống kê T nhỏ (không có ý nghóa mặc
dù R2 lớn) dẫn đến luôn bác bỏ giả thuyết kiểm
đònh ý nghóa của biến độc lập trong mô hình. (Làm
cho biến độc lập không có ý nghóa), vì
- Các ước lượng rất nhạy cảm khi dữ liệu thay
đổi nhỏ
- Dấu các hệ số hồi quy thay đổi so với thực tế
ĐA CỘNG TUYẾN
ˆ
ˆ ˆ
( ) var( )
i
i i
T
se
β
β β
=
=
ĐA CỘNG TUYẾN
4. Phát hiện : Mô hình xảy ra hiện tượng nếu 1
trong 4 điều sau thoả
Phương pháp 1. Dùng nhân tử phóng đại
phương sai
Phương pháp 2. Dùng hệ số R2
Phương pháp 3. Nếu dấu hệ số hồi quy thay đổi
so với thực tế
Phương pháp 4. Dùng hồi quy phụ
2
1
10
1
,
,
; max
i j
i j
X X
X X
V IF r R
r
= > → ∈
−
≥ ∃ <
2
Nếu R 0.7 và 1t
≠
1 2
Nếu mô hình =f( , , ), 1,2, phù hợp
i
X X X i
ĐA CỘNG TUYẾN
Y 70 65 90 95 110 115 120 140 155 150
X2 80 100 120 140 160 180 200 220 240 260
X3 810 1009 1273 1425 1633 1876 2052 2201 2435 2686
Ví dụ 5. Khảo sát chi tiêu cho tiêu dùng, thu
nhập và sự giàu có ta có bảng số liệu sau
Trong đó
Y : Chi tiêu cho tiêu dùng ($)
X2: thu nhập
X3 : sự giàu có
Dependent Variable: Y
Method: Least Squares
Date: 08/06/13 Time: 11:04
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 24.77473 6.752500 3.668972 0.0080
X2 0.941537 0.822898 1.144172 0.2902
X3 -0.042435 0.080664 -0.526062 0.6151
R-squared 0.963504 Mean dependent var 111.0000
Adjusted R-squared 0.953077 S.D. dependent var 31.42893
S.E. of regression 6.808041 Akaike info criterion 6.917411
Sum squared resid 324.4459 Schwarz criterion 7.008186
Log likelihood -31.58705 Hannan-Quinn criter. 6.817830
F-statistic 92.40196 Durbin-Watson stat 2.890614
Prob(F-statistic) 0.000009
ĐA CỘNG TUYẾN