Tải bản đầy đủ (.docx) (25 trang)

Khắc phục hiện tượng tự tương quan dựa trên durbin watson

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (374.59 KB, 25 trang )

LỜI MỞ ĐẦU
Một trong các giả thuyết của mô hình hồi quy tuyến tính cổ điển là không có
tự tương quan hay tương quan chuỗi các nhiễu U
i
trong hàm hồi quy tổng thể.
Nhưng trong thực tế hiện tượng đó có xảy ra hay không? Nguyên nhân của hiện
tượng đó là gì? Nếu có hiện tượng tự tương quan thì liệu có áp dụng được phương
pháp bình phương nhỏ nhất nữa hay không? Làm thế nào để biết hiện tượng đó xảy
ra? Cách khắc phục như thế nào? Đó là một loạt các câu hỏi mà nhóm chúng tôi sẽ
giải quyết trong đề tài này.
Áp dụng vào thực tế, Việt Nam đang trên đà hội nhập và phát triển, con
người ngày được quan tâm hơn. Chỉ số HDI là một thước đo tổng quát về phát
triển con người theo ba tiêu chí sau: sức khỏe, tri thức và thu nhập. Chính vì thế,
với những tổng hợp cơ bản về số liệu chỉ số phát triển con người HDI, tuổi thọ trung
bình, tỷ lệ biết chữ, thu nhập bình quân giai đoạn 1993-2005, nhóm chúng tôi đã
thực hiện nghiên cứu sự phụ thuộc giữa các yếu tố này.
CHƯƠNG I: CƠ SỞ LÝ THUYẾT
1.1 Hiện tượng tự tương quan
* Tự tương quan là gì? Là sự tương quan giữa các thành phần của chuỗi các
quan sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc
không gian (trong số liệu chéo).
Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không có sự
tương quan giữa các nhiễu U
i
, nghĩa là:
Cov( U
i
,U
j
) = 0 ( i ≠j )
Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn với một


quan sát khác.
Tuy nhiên trong thực tế có thể xáy ra hiện tượng mà thành phần nhiễu của các
quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:
Cov( U
i
, U
j
) ≠ 0 ( i≠j)
* Nguyên nhân:
- Nguyên nhân khách quan:
+ Quán tính: Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quán
tính. Chúng ta đều biết các chuỗi thời gian như tổng sản phẩm, chỉ số giá, thất
nghiệp mang tính chu kỳ. Chẳng hạn nếu chúng ta ở đầu thời kỳ khôi phục kinh tế,
tổng sản phẩm có xu hướng đi lên. Trong quá trình biến động này, giá tri của chuỗi
ở mỗi thời điểm sau lại cao hơn giá trị cả nó ở thời điểm trước. Vì vậy trong hồi qui
của chuỗi thời gian, các quan sát kế tiếp đó có nhiều khả năng phụ thuộc lẫn nhau.
+ Hiện tượng mạng nhện:
Ví dụ: Vào đầu vụ trồng lạc năm nay, người nông dân bị ảnh hưởng bởi giá
mua lạc năm ngoái của các công ty xuất khẩu. Cho nên cung về lạc có biểu diễn
dưới dạng hàm:
Giả sử ở cuối thời kì t giá lạc
Giả sử ở cuối thời kì t giá lạc do đó trong thời kì t+1 những người nông dân
sẽ quyết định sản xuất lạc ít hơn thời kì t. Rõ ràng trong trường hợp đó, ta không
mong đợi các ngẫu nhiên là ngẫu nhiên, có lẽ nông dân sẽ giảm sản xuất ở năm
t+1 Điều này sẽ dẫn đến mô hình mạng nhện.
+ Trễ: Trong phân tích hồi quy chuỗi thời gian, chúng ta chúng ta có thể có
gặp hiện tượng biến phụ thuộc ở thời kì t phụ thuộc vào chính biến đó ở thời kì t-1
và các biến khác.
-Nguyên nhân chủ quan:
+ Phương pháp ( kỹ thuật) thu thập và xử lí số liệu

+ Sai lầm khi lập ô hình: Bỏ biến ( không đưa biến vào mô hình), dạng hàm
sai,
*Phân loại tự tương quan:
Xét mô hình:
AR(1)
AR(p)
*Hậu quả:
Nếu có hiện tượng tự tương quan xảy ra mà vẫn tiếp tục sử dụng phương pháp
bình phương nhỏ nhất thông thường thì sẽ gây ra một số hậu quả sau:
• Ước lượng bình phương nhỏ nhất thông thường vẫn là ước lượng tuyến tính không
chệch nhưng nó sẽ không hiệu quả nữa.Tức là ước lượng bình phương nhỏ nhất
thông thường không phải là ước lượng tuyến tính không chệch tốt nhất nữa.
• Phương sai ước lượng được của các ước lượng bình phương nhỏ nhất thông
thường là chệch. Đôi khi công thức để tính phương sai và sai số tiêu chuẩn của các
ước lượng bình phương nhỏ nhất thường đưa đến ước lượng quá thấp phương sai
thực và sai số tiêu chuẩn, do đó phóng đại tỷ số t. Hậu quả sẽ ngộ nhận rằng một hệ
số nào đó khác không có ý nghĩa về mặt thống kê, nhưng thực tế lại không phải như
vậy.
• Các kiểm định T và F không còn đáng tin cậy.
• cho ước lượng chệch của thực và trong một số trường hợp, nó dường như ước
lượng thấp .

2
có thể là độ đo không đáng tin cậy cho R
2
thực.
• Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng có thể không
hiệu quả.
1.2. Các cách phát hiện hiện tượng tự tương quan
a. Kiểm định Durbin-Watson

Ý tưởng chung: Để phát hiện hiện tượng tự tương quan tức là xem xét tác
động trễ giữa các biến ngẫu nhiên người ta sử dụng là chất liệu nghiên cứu
Bước 1: Ước lượng mô hình hồi quy ban đầu →
Bước 2: Bài toán kiểm định:

Tiêu chuẩn kiểm định: d =
Ta có: n= ; k’= k-1= ; α= ; = ; =
0 d
L
d
U
4-d
U
4-d
L
4
1 (2) (3) (4) (5)
+ d (1) → có tự tương quan (+)
+ d (2), (4) → không có kết luận
+ d (3) → không có tự tương quan
+ d (5) → có tự tương quan (-)
Bước 3: Kết luận
b. Kiểm định Breusch – Godfrey (BG)
Cách phát hiện hiện tượng tự tương quan trong kiểm định B-G
Bước 1: Ước lượng mô hình hồi quy ban đầu để thu được
= + . +
Trong đó :
= . + . + +. +
Bài toán kiểm định :
Bước 2: Ước lượng mô hình ta được :

= + . + + .+ . + + . +
Từ kết quả ước lượng mô hình này ta thu được
Bước 3 : Tiêu chuẩn kiểm định :
Tiêu chuẩn kiểm định
= ( n-p ) đúng thì
Miền bác bỏ :
=
Bước 4:
= ( n –p)
bác bỏ
không thuộc chấp nhận bác bỏ
1.3 Các biện pháp khác phục hiện tượng tự tương quan
1.3.1 Khi cấu trúc của tự tương quan là đã biết
Vì các nhiễu U
t
không quan sát được nên tính chất của tương quan chuỗi
thường là vấn đề suy đoán hoặc là do những đòi hỏi cấp bách của thực tiễn. Trong
thực hành, người ta thường giả sử rằng U
t
theo mô hình tự hồi quy bậc nhất nghĩa
là:
U
t
= ρ U
t-1
+ ɛ
t
. (1)
Trong đó ǀρǀ˂1 và ɛ
t

thoả mãn các giả thiết của phương pháp bình phương nhỏ nhất
thông thường nghĩa là: Trung bình bằng 0, phương sai không đổi và không tự tương
quan. Giả sử U
t
= ρ U
t-1
+ ɛ
t
là đúng thì vấn đề tương quan chuỗi có thể được giải
quyết thoả đáng nếu hệ số tự tương quan là đã biết. Để làm sáng tỏ vấn đề đó ta
quay lại mô hình hai biến:
Y
t
= β
1
+ β
2
X
t
+ U
t
(2)
Nếu (2) đúng với t thì cũng đúng với t-1 nên:
Y
t-1
= β
1

2
X

t-1
+U
t-1
(3)
Nhân hai vế (3) với ρ ta được:
ρY
t-1
= ρβ
1
+ ρβ
2
X
t-1
+ ρU
t-1

trừ (2) cho (4) ta được:
Y
t
- ρY
t-1
= β
1
(1-ρ) + β
2
( X
t
– ρX
t-1
) + (U

t
– ρU
t-1
)
= β
1
( 1 –ρ) + β
2
(X
t
– ρX
t-1
) + ɛ
t
(5)
Đặt β
*
= β
1
*
(1 –ρ); β
2
*
= β
2
Y
t
*
= Y
t

– ρY
t-1
; X
t
*
= X
t
– ρX
t-1
Thì phương trình (5) có dạng:
Y
t
*
= β
1
*
+ β
2
*
X
t
*
+ ɛ
t
(6)
Vì ɛ
t
thỏa mãn các giả thuyết của phương pháp bình phương nhỏ nhất thông
thường đối với các biến Y
*

và X
*
và các

ước lượng tìm được có tất cả các tính chất
tối ưu nghĩa là ước lượng tuyến tính không chệch tốt nhất.
Phương trình hồi quy Y
t
- ρY
t-1
= β
1
( 1 –ρ) + β
2
(X
t
– ρX
t-1
) + ɛ
t
được gọi là
phương trình sai phân tổng quát.
Việc ước lượng hồi quy Y
*
đối với X
*
có hay không có hệ số chặn phụ thuộc
vào phương trình gốc có hệ số chặn hay không. Trong phương pháp này ( ước lượng
hồi quy ρY
t-1

= ρβ
1
+ ρβ
2
X
t-1
+ ρU
t-1
chúng ta mất đi một quan sát bởi vì quan sát thứ
nhất không có quan sát đứng trước nó. Thủ tục này không chính xác là thủ tục ước
lượng bình phương nhỏ nhất tổng quát sử dụng tất cả các quan sát với:
Y
t
*
= Y
t

X
t
*
= X
t

Nhưng trong thực tế thì ρ chưa biết nên ta xét trường hợp sau đây:
1.3.2 Khi ρ chưa biết
a. Phương pháp sai phân cấp 1
Như ra biết -1 ≤ ρ ≤1 nghĩa là p nằm giữa [-1,0] hoặc [0,1] cho nên người ta có
thể bắt đầu từ các giá trị ở các dấu mút của các khoảng đo. Nghĩa là ta có thể giả
thiết rằng:
ρ = 0 tức là không có tương quan chuỗi.

ρ = ±1 nghãi là có tương quan dương hoặc âm hoàn toàn.
Trên thực tế khi ước lượng hồi quy người ta thường giả thiết rằng không có tự
tương quan rồi sau đó tự tiến hành kiệm định Durbin-Watson hay các kiểm định
khác để xem giả thiết này có đúng không. Tuy nhiên nếu ρ =±1 thì phương trình sau
phân tổng quát quy về phương trình sai phân cấp 1
Y
1
– Y
t-1
= ß
1
( X
1
-X
t-1
) + ( U
1
-U
t-1
)= ß
2
(X
1
-X
t-1
)+ ε
1
Hay ∆Y
t
= ß

2
∆X
t
+ ε
1
Trong đó là toán từ sai số cấp 1. Để ước lượng hồi quy 1 thì cần phải lập các sai
phân cấp 1 của biến phụ thuộc và biến giải thích và sử dụng chúng làm những đầu
vào trong phân tích hồi quy.
Chú ý một nét quan trọng của mô hình sai phân cấp 1 của biến phụ thuộc là
không có số hạng chặn trong mô hình. Vì vậy để ước lượng hồi tquy 1 ta sẽ sử dụng
mô hình hồi quy qua gốc tọa độ.Giả sử mô hình ban đầu là:
Y
t
= ß
1

2
X
1

3
+ ε
1
Trong đó t là biến xu thế còn U
t
theo sơ đồ tự hồi quy bậc nhất.
Thực hiện phép biến đổi sai phân cấp 1 đối với 2 ta đi đến
∆Y
t
= ß

2
∆X
t

3
+ ε
1
Trong đó: ∆Y
t
= Y
1
– Y
t-1
và X
t
= X
1
-X
t-1
Phương pháp ∆Y
t
= ß
2
∆X
t

3
+ ε
1
có hệ số chặn dưới dạng sai phân cấp 1.

Nhưng chú ý ß
1
rằng là hệ số của các biến xu thế trong mô hình ban đầu. Vì vậy có
số hạng chặn ở dạng sai phân cấp 1 thì điều đó có nghĩa là có một số hạng xu thế
tuyến tính trong mô hình gốc và số hạng chặn thực ra là hệ số của biến xu thế.
Thí dụ nếu ß
3
trong ∆Y
t
= ß
2
∆X
t

3
+ ε
1
là dương thì điều đó có nghĩa là có xu
thế tăng trong Y sau khi đã tính đến ảnh hưởng của tất cả các biến khác.
Nếu ρ = -1 nghĩa là có tương quan chuỗi âm hoàn toàn ( đây không phải là
trường hợp điển hình của các chuỗi thời gian trong kinh tế), phương trình sai phân
tổng quát bây giờ có dạng :
Y
1
+Y
t-1
= 2ß
1
+ ß
2

(X
1
+X
t-1
)+ ε
1
Hay (Y
1
+Y
t-1
)/ 2 = ß
1
+ ß
2
(X
1
+X
t-1
)/2+ ε
1
/2
Mô hình này được gọi là mô hình hồi quy trung bình trượ t(2 thời kỳ) vì chúng ta
hồi quy giá trị của một trung bình trượt đối với một trung bình trượt khác.
Phép biến đổi sai phân cấp 1 đã giới thiệu trước đây rất phổ biến trong kinh tế
lượng.
b. Ước lượng ρ dựa trên thống kê d – Durbin – Watson
Trong phần kiểm định d chúng ta đã thiết lập được các công thức:
d 2 ( 1 -
Hoặc 1 -
Đẳng thức này gợi cho ta cách thức đơn giản để thu được ước lượng của từ

thống kê d. Từ (Y
1
+Y
t-1
)/ 2 = ß
1
+ ß
2
(X
1
+X
t-1
)/2+ ε
1
/2 chỉ ra rằng giả thiết sai phân
cấp 1 với = chỉ đúng khi d =0 hoặc xấp xỉ bằng không. Cũng vậy khi d = 2 thì và khi
d = 4 thì Do đó thống kê d cung cấp cho ta một phương pháp sẵn có để thu được
ước lượng của .
Nhưng lưu ý rằng quan hệ 1 - chỉ là quan hệ xấp xỉ và có thể không đúng
với các mẫu nhỏ.
Khi đã được ước lượng thì có thể biến đổi tập số liệu theo phương trình sai phân
tổng quát
Và tiến hành ước lượng theo phương pháp bình phương nhỏ nhất thông
thường. Khi ta sử dụng một ước lượng thay cho giá trị đúng, thì các hệ số ước lượng
thu được từ phương pháp bình phương nhỏ nhất có thuộc tính tối ưu thông thường
chỉ tiệm cận có nghĩa là có thuộc tính đó trong các mẫu lớn. Vì vậy trong các mẫu
nhỏ ta phải cẩn thận trong khi giải thích các kết quả ước lượng.
CHƯƠNG II: BÀI TOÁN ÁP DỤNG
1. Bài toán áp dụng.
Sau khi thu thập số liệu, ta có bảng về chỉ số phát triển con người HDI (Y),

tuổi thọ trung bình (X), tỷ lệ biết chữ (Z) và thu nhập bình quân (T) của Việt Nam
trong giai đoạn 1993-2005. Số liệu được cho ở bảng sau:
Năm HDI (Y)
Tuổi thọ trung bình
(tuổi) X Tỷ lệ biết chữ (%) Z
Thu nhập bình quân
(nghìn đô) T
1993 0.54 65.5 92.5 1.04
1994 0.557 66 93 1.208
1995 0.56 66.4 93.7 1.236
1996 0.61 67 92 1.31
1997 0.664 67.4 91.9 1.52
1998 0.671 67.8 92.2 1.689
1999 0.682 67.8 93.1 1.86
2000 0.688 68.2 93.4 1.996
2001 0.688 68.6 92.7 2.07
2002 0.691 69 90.3 2.3
2003 0.704 70.5 90.3 2.49
2004 0.709 70.8 90.3 2.745
2005 0.733 73.7 90.3 3.071
Nguồn: Báo cáo phát triển con người các năm từ 1995 đến 2007 của UBND
Nhập bảng số liệu vào eview ta có được bảng sau:
Sau khi tiến hành hồi quy mô hình bằng phương pháp bình phương nhỏ nhất với
mức ý nghĩa 5%, ta thu được kết quả như sau:
Mô hình hồi quy mẫu:
Ý nghĩa của các hệ số hồi quy:
β
2
= - 0.010657 Khi tỷ lệ biết chữ và thu nhập bình quân không đổi, tuổi thọ trung
bình tăng lên 1 tuổi thì chỉ số HDI giảm 0.010657.

β
3
= 0.005780 Khi tuổi thọ trung bình và thu nhập bình quân không đổi, tỷ lệ biết
chữ tăng 1% thì chỉ số HDI tăng 0.005780.
β
4
=0.135720 Khi tuổi thọ trung bình và tỷ lệ biết chữ không đổi, thu nhập bình
quân tăng 1 nghìn đô thì chỉ số HDI tăng 0.135720.
2. Phát hiện hiện tượng tự tương quan bằng kiểm đinh d (Dubin-Watson)
Mô hình hồi quy mẫu:
• BTKĐ:

• TCKĐ:
Miền giá trị:
n=13 ; k’= k-1= 3; ; ; 1,816
0 0.715 1.816 2.184 3.285 4
(1) (2) (3) (4) (5)
Ta có: d= 0,600477
 d (1)
• KL: Có hiện tượng tự tương quan dương
3. Phát hiên hiện tượng tự tương quan bằng kiểm định B-G
a. Kiểm định tự tương quan BG bậc 1.
Mô hình hồi quy mẫu:
Ước lượng mô hình :
= ’ + ’ . + ’ . + ’ . + . +
= -0,960630 + 0,020329 . - 0,003061 . - 0,078702. + 0,881341
Bài toán kiểm định

Tiêu chuẩn kiểm định
= (n-1) đúng thì

Miền bác bỏ :
=
Ta có = = 3,84146
Và = 12. 0,557693 = 6,692316
Nhận thấy >
=>>
Bác bỏ , chấp nhận
Kết luận : Mô hình có hiện tượng tự tương quan bậc 1.
b. Kiểm định tự tương quan BG bậc 2.
Mô hình hồi quy mẫu:
Ước lượng mô hình :
= ’ + ’ . + ’ . + ’ . + . +. +
= -1,151084 + 0,014167. +0.002873 . - 0,043078. + 1,061623. - 0,488122.
Bài toán kiểm định

Tiêu chuẩn kiểm định :
= ( n-2 ) đúng thì
Miền bác bỏ :
=
Ta có = = 5,99147
Và = 11.0.624601 = 6,870611
Nhận thấy >
=>>
Bác bỏ , chấp nhận
Kết luận : Mô hình có hiện tượng tự tương quan bậc 2.
4. Cách khắc phục hiện tượng tự tương quan
a. Khắc phục hiện tượng tự tương quan dựa trên Durbin- Watson
Từ phương pháp bình phương nhỏ nhất mô hình hồi quy gốc.
ta có d=0.600477→ = 1- d/2 = 0.699762
Phương trình sai phân tổng quát:

Y
t
- ρY
t-1
= β
1
(1-ρ) + β
2
( X
t
– ρX
t-1
) + β
3
( Z
t
– ρZ
t-1
) + β
4
( T
t
– ρT
t-1
)+ ɛ
t

Đặt
Y
1


= Y
t
– 0.699762Y
t-1

X
1

= X
t
– 0.699762X
t-1
Z
1
= Z
t
– 0.699762Z
t-1
T
1

= T
t
– 0.699762T
t-1
Đặt β
1t

= β

1
(1 –ρ); β
2t

= β
2
; β
3t

= β
3
Bằng exel ta tính được kết quả như sau:
Năm Y X Z T Y
1
X
1
Z
1
T
1
1993
0.54 65.5 92.5 1.04
1994
0.557 66 93 1.208
0.17912
9
20.1655
9
28.2720
2

0.48024
8
1995
0.56 66.4 93.7 1.236
0.17023
3
20.2157
1
28.6221
3
0.39068
8
1996
0.61 67 92 1.31
0.21813
3 20.5358 26.4323
0.44509
4
1997
0.664 67.4 91.9 1.52
0.23714
5
20.5159
5 27.5219
0.60331
2
1998
0.671 67.8 92.2 1.689
0.20635
8

20.6360
4
27.8918
7
0.62536
2
1999
0.682 67.8 93.1 1.86 0.21246 20.3561 28.5819 0.67810
4 4 2
2000
0.688 68.2 93.4 1.996
0.21076
2
20.7561
4
28.2521
6
0.69444
3
2001
0.688 68.6 92.7 2.07
0.20656
4
20.8762
3
27.3422
3
0.67327
5
2002

0.691 69 90.3 2.3
0.20956
4
20.9963
3
25.4320
6
0.85149
3
2003
0.704 70.5 90.3 2.49
0.22046
4
22.2164
2
27.1114
9
0.88054
7
2004
0.709 70.8 90.3 2.745
0.21636
8
21.4667
8
27.1114
9
1.00259
3
2005

0.733 73.7 90.3 3.071
0.23686
9
24.1568
5
27.1114
9
1.15015
3

Ước lượng mô hình trên với các biến Y
1
, X
1
, Z
1
, T
1
ta có kết quả:
Với α=5%, n=12; k’=k-1=3 ta có d
L
=0.658,d
U
=1.834
Ta có khoảng là.
0 d
L
d
U
4-d

U
4-d
L
4
0 0.658 1.834 2.166 3.342 4
2 (2) (3) (4) (5)
 Theo mô hình hồi quy ta có d = 1. 293680 khoảng (2) → không có kết luận tự
tương quan
Tiến hành kiểm định BG để thấy kết quả khắc phục tự tương quan mô hình
trên.
 Kiểm định tự tương quan bậc 1.
với α=5% ta cần kiểm định

Ta có mô hình kiểm định BG như sau.
Theo mô hình kiểm định ta có p-value=0,2351 > α(5%) nên chấp nhận H
0
bác bỏ H
1
→không còn hiện tượng tự tương quan bậc 1.
 Kiểm định tự tương quan BG bậc 2.
với α=5% ta cần kiểm định

Ta có mô hình kiểm định BG như sau.
Theo mô hình kiểm định ta có p-value=0.2907 > α (5%) nên chấp nhận H
0
bác bỏ
H
1
→không còn hiện tượng tự tương quan bậc 2.
Ta thấy rằng kiểm định BG đều cho biết mô hình sai phân tổng quát không có

hiện tượng tự tương quan. Nếu chấp nhận mô hình này thì ước lượng của mô hình ban
đầu là:
Ŷ= 0.251968/ (1- 0.699762) + 0.003390 X – 0.004902 Z + 0.030574 T

TÀI LIỆU THAM KHẢO
1. Giáo trình Kinh tế lượng, Đại học Kinh tế quốc dân.
2. Chương trình phát triển Liên Hợp Quốc tại Việt Nam
/>

×