Tải bản đầy đủ (.ppt) (54 trang)

Phương sai của sai số thay đổi pps

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (284.81 KB, 54 trang )

1
C3. Phương sai của sai số thay đổi
(Heteroscedasticity)

Bản chất của hiện tượng phương sai của sai
số thay đổi

Hậu quả của phương sai sai số thay đổi

Cách phát hiện phương sai sai số thay đổi

Cách khắc phục phương sai sai số thay đổi
2
Bản chất hiện tượng PSSS thay đổi

Xét ví dụ mô hình hồi qui 2 biến trong đó biến
phụ thuộc Y là chi tiêu của hộ gia đình và
biến giải thích X là thu nhập khả dụng của
hộ gia đình
3
Bản chất hiện tượng PSSS thay đổi
X
1
X
2
X
n
X
Y
0
(a)


X
1
X
2
X
n
X
Y
0
(b)
Hình3.1: (a) PS của SS không đổi và (b) PS của SS thay đổi
4
Bản chất hiện tượng PSSS thay đổi
a) Phương sai sai số không đổi
var(u
i
|X) = σ
2
b) Phương sai sai số thay đổi
var(u
i
|X) = σ
i
2
Thu nhập
Thu nhập
Chi tiêu
Chi tiêu
f(u
i

)
f(u
i
)
5

Hình 3.1a chỉ ra rằng khi thu nhập khả dụng tăng
lên, giá trị trung bình của chi tiêu cũng tăng lên
nhưng phương sai của sai số quanh giá trị trung
bình của nó không thay đổi tại mọi mức thu nhập
khả dụng.

Đây là trường hợp của phương sai sai số không đổi,
hay phương sai bằng nhau.
E(u
i
2
) = σ
2


Hình 3.1b, mặc dù giá trị trung bình của chi tiêu
cũng tăng lên nhưng phương sai của sai số không
bằng nhau tại mỗi mức thu nhập khả dụng –
phương sai tăng lên với thu nhập khả dụng.
E(u
i
2
) = σ
i

2

6

Giải thích:

Những người có thu nhập cao, nhìn chung, sẽ
chi tiêu nhiều hơn so với người có thu nhập thấp
nhưng sự biến động của chi tiêu sẽ cao hơn.

Đối với người có thu nhập thấp, họ chỉ có một ít
thu nhập để chi tiêu.

Phương sai sai số của những hộ gia đình có
thu nhập cao có thể lớn hơn của những hộ
có thu nhập thấp.
7
Nguyên nhân

Do bản chất các mối quan hệ kinh tế;

Ví dụ: thu nhập & chi tiêu

Do kỹ thuật thu thập số liệu được cải tiến làm cho σ
2

ngày càng giảm;

Do quá trình “học hỏi từ công việc”;


Ví dụ: số lỗi đánh máy của một thư ký có thể giảm dần
theo thời gian làm việc.

Do có sự hiện diện của các “quan sát dị biệt”
(outlier);

Do định dạng sai mô hình.
Hiện tượng này thường gặp phải đối với “số liệu
theo không gian” (cross-section data).
8
Quan sát dị biệt
x
x
x
x
x
x
x
x
x
x
x
x x
x
x
x
x
x
X
Y

9
Hậu quả của phương sai sai số thay đổi
Nếu các giả thiết khác vẫn đảm bảo thì…
1. Các ước lượng OLS vẫn tuyến tính.
2. Chúng vẫn là ước lượng không chệch
3. Tuy nhiên, chúng sẽ không còn có phương
sai nhỏ nhất nữa, nghĩa là, chúng sẽ
không còn hiệu quả nữa.
4. Công thức thông thường để ước lượng
phương sai của ước lượng OLS, nhìn
chung, sẽ chệch.
10
Hậu quả của phương sai sai số thay đổi
5. Theo đó, các khoảng tin cậy và kiểm định
giả thuyết thông thường dựa trên phân phối
t và F sẽ không còn đáng tin cậy nữa. Do
vậy, nếu chúng ta áp dụng các kỹ thuật
kiểm định giả thuyết thông thường sẽ cho
ra kết quả sai.
11
Phương pháp phát hiện ra PSSS thay đổi
1. Xem xét đồ thị của phần dư
2. Kiểm định Park
3. Kiểm định Glejser
4. Kiểm định tương quan hạng của Spearman
5. Kiểm định Goldfeld – Quandt
6. Kiểm định Breusch – Pagan
7. Kiểm định White
12
Ví dụ 1

stt Y X (thu nhập) stt Y X (thu nhập)
1 19,9 20,3 11 8,0 8,1
2 31,2 32,3 12 33,1 34,5
3 31,8 33,6 13 33,5 38,0
4 12,1 12,1 14 13,1 14,1
5 40,7 42,3 15 14,8 16,4
6 6,1 6,2 16 21,6 24,1
7 38,6 44,7 17 29,3 30,1
8 25,5 26,1 18 25,0 28,3
9 10,3 10,3 19 17,9 18,2
10 38,8 40,2 20 19,8 20,1
13
Kết quả hồi quy…
. reg Y X
Source | SS df MS Number of obs = 20
+ F( 1, 18) = 1501.41
Model | 2184.59892 1 2184.59892 Prob > F = 0.0000
Residual | 26.1904894 18 1.45502719 R-squared = 0.9882
+ Adj R-squared = 0.9875
Total | 2210.78941 19 116.357337 Root MSE = 1.2062

Y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
+
X | .9078664 .02343 38.75 0.000 .8586419 .957091
_cons | .8583391 .644867 1.33 0.200 4964761 2.213154

Có nhận xét gì về kết quả này? Liệu có tồn tại hiện tượng
phương sai sai số thay đổi?
14
1. Xem xét đồ thị của sai số

15
Cách 1: Đồ thị của sai số
-3 -2 -1 0 1 2
Residuals
10 20 30 40 50
thu nhap
Nhận xét gì?
16
2. Kiểm định Park

Park cho rằng
σ
i
2
là một hàm số nào đó của
biến giải thích X.

Park đã đưa ra dạng hàm số giữa
σ
i
2
và X
như sau:

σ
i
2
= B
1
+ B

2
ln|X
i
|+ v
i
trong đó v
i

phần sai số.

Park đã đề nghị chúng ta có thể sử dụng e
i

thay cho u
i
và chạy mô hình hồi qui sau:
lne
i
2
= B
1
+ B
2
ln|X
i
|+ v
i
(*)
17
2. Kiểm định Park


e
i
2
có thể được thu thập từ mô hình hồi qui gốc. Kiểm
định Park được tiến hành theo các bước sau đây:
1) Chạy hàm hồi qui gốc bất chấp vấn đề phương sai của
sai số thay đổi, nếu có.
2) Từ hàm hồi qui này, tính phần dư e
i
, sau đó, bình
phương chúng và lấy log chúng: lne
i
2
.
3) Chạy hàm hồi qui (*), sử dụng biến giải thích của hàm
hồi qui ban đầu. Nếu có nhiều biến giải thích, chúng ta
sẽ chạy hồi qui cho từng biến giải thích đó. Hay cách
khác, chúng ta có thể chạy hồi qui mô hình với biến giải
thích là , ước lượng của Y.

i
Y
18
2. Kiểm định Park
4) Kiểm định giả thuyết H
0
: B
2
= 0, nghĩa là,

không có phương sai của sai số thay đổi.
Nếu giả thuyết H
0
bị bác bỏ, mối quan hệ
giữa lne
i
2
và lnX có ý nghĩa thống kê, có
phương sai của sai số thay đổi.
5) Nếu giả thuyết H
0
được chấp nhận, B
1
trong
mô hình (*) có thể được xem là giá trị chung
của phương sai của sai số không đổi,
σ
2
.
19
Cách 2: Kiểm định Park
Source | SS df MS Number of obs = 20
+ F( 1, 18) = 32.43
Model | 32.7929497 1 32.7929497 Prob > F = 0.0000
Residual | 18.204119 18 1.01133994 R-squared = 0.6430
+ Adj R-squared = 0.6232
Total | 50.9970687 19 2.68405625 Root MSE = 1.0057

lne_sq | Coef. Std. Err. t P>|t| [95% Conf. Interval]
+

lnX | 2.301639 .4041993 5.69 0.000 1.452448 3.15083
_cons | -7.728774 1.266995 -6.10 0.000 -10.39063 -5.066917

Nhận xét gì?
20
3. Kiểm định Glejser

Tương tự như kiểm định Park: Sau khi thu thập
được phần dư từ mô hình hồi qui gốc, Glejser đề
nghị chạy hồi qui giá trị tuyệt đối của e
i
, | e
i
|, theo
biến X nào mà có quan hệ chặt chẽ với σ
i
2
.

Glejser đề xuất một số dạng hàm hồi qui sau:
|e
i
| = B
1
+ B
2
X
i
+ v
i

iii
vXBBe ++=
21
i
i
i
v
X
BBe +
1
+=
21
21
3. Kiểm định Glejser

Giả thuyết H
0
trong mỗi hàm số trên là
phương sai của sai số không đổi, nghĩa là,
H
0
: B
2
= 0. Nếu giả thuyết này bị bác bỏ thì có
thể có hiện tượng phương sai sai số không
đồng đều.
i
i
i
v

X
BBe +
1
+=
21
iii
vXBBe ++=
21
iii
vXBBe ++=
2
21
22
3. Kiểm định Glejser

Goldfeld và Quandt đã chỉ ra rằng sai số v
i
trong
các mô hình hồi qui của Glejser có một số vấn đề,
như giá trị kỳ vọng của nó khác không, nó có tương
quan chuỗi.

4 mô hình đầu cho kết quả tốt khi sử dụng OLS

2 mô hình sau (phi tuyến tính tham số) không sử
dụng OLS được

Do vậy, kiểm định Glejser có thể được dùng để
chẩn đoán đối với những mẫu lớn.
23

4. Kiểm định tương quan hạng của Spearman

Hệ số tương quan hạng của Spearman, r
S
,
được xác định như sau:
trong đó d
i
là hiệu của các hạng được gán cho
2 đặc trưng khác nhau của cùng một phần tử
thứ i và n là số các phần tử được xếp hạng.









−=

)n(n
d
r
i
S
1
61
2

2

24
4. Kiểm định tương quan hạng của Spearman

Xét mô hình hồi qui sau:
Y
i
= β
1
+ β
2
X
i
+ u
i


Các bước thực hiện kiểm định tương quan
hạng như sau:
1. Ước lượng mô hình hồi qui trên dựa trên
bộ mẫu cho trước, thu thập phần dư e
i
.
2. Xếp hạng | e
i
| và X
i
theo thứ tự tăng dần
hay giảm dần, tính d = hạng | e

i
| - hạng X
i
,
sau đó tính hệ số tương quan hạng
Spearman.
25
4. Kiểm định tương quan hạng (tt)
3. Giả sử hệ số tương quan hạng của tổng
thể là ρ = 0 và n > 8 thì ý nghĩa của hệ số
tương quan hạng mẫu r
S
có thể được kiểm
định bằng tiêu chuẩn t sau:
2
S
S
r1
2nr
t


=
Nếu giá trị t tính được lớn hơn giá trị tra bảng t với mức
ý nghĩa đã cho thì chúng ta có thể chấp nhận giả thuyết
phương sai sai số thay đổi; ngược lại chúng ta bác bỏ
giả thuyết này.
với bậc tự do
df = n – 2.

×