LỜI MỞ ĐẦU
Một trong các giả thuyết của mô hình hồi quy tuyến tính cổ điển là không có tự
tương quan hay tương quan chuỗi các nhiễu U
i
trong hàm hồi quy tổng thể. Nhưng trong
thực tế hiện tượng đó có xảy ra hay không? Nguyên nhân của hiện tượng đó là gì? Nếu có
hiện tượng tự tương quan thì liệu có áp dụng được phương pháp bình phương nhỏ nhất
nữa hay không? Làm thế nào để biết hiện tượng đó xảy ra? Cách khắc phục như thế
nào? Đó là một loạt các câu hỏi mà nhóm chúng tôi sẽ giải quyết trong đề tài này.
Áp dụng vào thực tế, Việt Nam đang trên đà hội nhập và phát triển, con người
ngày được quan tâm hơn. Chỉ số HDI là một thước đo tổng quát về phát triển con
người theo ba tiêu chí sau: sức khỏe, tri thức và thu nhập. Chính vì thế, với những tổng
hợp cơ bản về số liệu chỉ số phát triển con người HDI, tuổi thọ trung bình, tỷ lệ biết chữ,
thu nhập bình quân giai đoạn 1993-2005, nhóm chúng tôi đã thực hiện nghiên cứu sự phụ
thuộc giữa các yếu tố này.
CHƯƠNG I: CƠ SỞ LÝ THUYẾT
1.1 Hiện tượng tự tương quan
* Tự tương quan là gì? Là sự tương quan giữa các thành phần của chuỗi các quan
sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian
(trong số liệu chéo).
Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không có sự tương
quan giữa các nhiễu U
i
, nghĩa là:
Cov( U
i
,U
j
) = 0 ( i ≠j )
Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn với một quan
sát khác.
Tuy nhiên trong thực tế có thể xáy ra hiện tượng mà thành phần nhiễu của các quan
sát lại có thể phụ thuộc lẫn nhau nghĩa là:
Cov( U
i
, U
j
) ≠ 0 ( i≠j)
* Nguyên nhân:
- Nguyên nhân khách quan:
+ Quán tính: Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quán tính.
Chúng ta đều biết các chuỗi thời gian như tổng sản phẩm, chỉ số giá, thất nghiệp mang
tính chu kỳ. Chẳng hạn nếu chúng ta ở đầu thời kỳ khôi phục kinh tế, tổng sản phẩm có
xu hướng đi lên. Trong quá trình biến động này, giá tri của chuỗi ở mỗi thời điểm sau lại
cao hơn giá trị cả nó ở thời điểm trước. Vì vậy trong hồi qui của chuỗi thời gian, các quan
sát kế tiếp đó có nhiều khả năng phụ thuộc lẫn nhau.
+ Hiện tượng mạng nhện:
Ví dụ: Vào đầu vụ trồng lạc năm nay, người nông dân bị ảnh hưởng bởi giá mua
lạc năm ngoái của các công ty xuất khẩu. Cho nên cung về lạc có biểu diễn dưới dạng
hàm:
Giả sử ở cuối thời kì t giá lạc
Giả sử ở cuối thời kì t giá lạc do đó trong thời kì t+1 những người nông dân sẽ
quyết định sản xuất lạc ít hơn thời kì t. Rõ ràng trong trường hợp đó, ta không mong đợi
các ngẫu nhiên là ngẫu nhiên, có lẽ nông dân sẽ giảm sản xuất ở năm t+1 Điều này sẽ
dẫn đến mô hình mạng nhện.
+ Trễ: Trong phân tích hồi quy chuỗi thời gian, chúng ta chúng ta có thể có gặp
hiện tượng biến phụ thuộc ở thời kì t phụ thuộc vào chính biến đó ở thời kì t-1 và các
biến khác.
-Nguyên nhân chủ quan:
+ Phương pháp ( kỹ thuật) thu thập và xử lí số liệu
+ Sai lầm khi lập ô hình: Bỏ biến ( không đưa biến vào mô hình), dạng hàm sai,
*Phân loại tự tương quan:
Xét mô hình:
AR(1)
AR(p)
*Hậu quả:
Nếu có hiện tượng tự tương quan xảy ra mà vẫn tiếp tục sử dụng phương pháp bình
phương nhỏ nhất thông thường thì sẽ gây ra một số hậu quả sau:
• Ước lượng bình phương nhỏ nhất thông thường vẫn là ước lượng tuyến tính không chệch
nhưng nó sẽ không hiệu quả nữa.Tức là ước lượng bình phương nhỏ nhất thông thường
không phải là ước lượng tuyến tính không chệch tốt nhất nữa.
• Phương sai ước lượng được của các ước lượng bình phương nhỏ nhất thông thường là
chệch. Đôi khi công thức để tính phương sai và sai số tiêu chuẩn của các ước lượng bình
phương nhỏ nhất thường đưa đến ước lượng quá thấp phương sai thực và sai số tiêu
chuẩn, do đó phóng đại tỷ số t. Hậu quả sẽ ngộ nhận rằng một hệ số nào đó khác không
có ý nghĩa về mặt thống kê, nhưng thực tế lại không phải như vậy.
• Các kiểm định T và F không còn đáng tin cậy.
• cho ước lượng chệch của thực và trong một số trường hợp, nó dường như ước lượng
thấp .
•
2
có thể là độ đo không đáng tin cậy cho R
2
thực.
• Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng có thể không hiệu
quả.
1.2. Các cách phát hiện hiện tượng tự tương quan
a. Kiểm định Durbin-Watson
Ý tưởng chung: Để phát hiện hiện tượng tự tương quan tức là xem xét tác động trễ
giữa các biến ngẫu nhiên người ta sử dụng là chất liệu nghiên cứu
Bước 1: Ước lượng mô hình hồi quy ban đầu →
Bước 2: Bài toán kiểm định:
↔
Tiêu chuẩn kiểm định: d =
Ta có: n= ; k’= k-1= ; α= ; = ; =
0 d
L
d
U
4-d
U
4-d
L
4
1 (2) (3) (4) (5)
+ d (1) → có tự tương quan (+)
+ d (2), (4) → không có kết luận
+ d (3) → không có tự tương quan
+ d (5) → có tự tương quan (-)
Bước 3: Kết luận
b. Kiểm định Breusch – Godfrey (BG)
Cách phát hiện hiện tượng tự tương quan trong kiểm định B-G
Bước 1: Ước lượng mô hình hồi quy ban đầu để thu được
= + . +
Trong đó :
= . + . + +. +
Bài toán kiểm định :
Bước 2: Ước lượng mô hình ta được :
= + . + + .+ . + + . +
Từ kết quả ước lượng mô hình này ta thu được
Bước 3 : Tiêu chuẩn kiểm định :
Tiêu chuẩn kiểm định
= ( n-p ) đúng thì
Miền bác bỏ :
=
Bước 4:
= ( n –p)
bác bỏ
không thuộc chấp nhận bác bỏ
1.3 Các biện pháp khác phục hiện tượng tự tương quan
1.3.1 Khi cấu trúc của tự tương quan là đã biết
Vì các nhiễu U
t
không quan sát được nên tính chất của tương quan chuỗi thường là
vấn đề suy đoán hoặc là do những đòi hỏi cấp bách của thực tiễn. Trong thực hành, người
ta thường giả sử rằng U
t
theo mô hình tự hồi quy bậc nhất nghĩa là:
U
t
= ρ U
t-1
+ ɛ
t
. (1)
Trong đó ǀρǀ˂1 và ɛ
t
thoả mãn các giả thiết của phương pháp bình phương nhỏ nhất
thông thường nghĩa là: Trung bình bằng 0, phương sai không đổi và không tự tương
quan. Giả sử U
t
= ρ U
t-1
+ ɛ
t
là đúng thì vấn đề tương quan chuỗi có thể được giải quyết
thoả đáng nếu hệ số tự tương quan là đã biết. Để làm sáng tỏ vấn đề đó ta quay lại mô
hình hai biến:
Y
t
= β
1
+ β
2
X
t
+ U
t
(2)
Nếu (2) đúng với t thì cũng đúng với t-1 nên:
Y
t-1
= β
1
+β
2
X
t-1
+U
t-1
(3)
Nhân hai vế (3) với ρ ta được:
ρY
t-1
= ρβ
1
+ ρβ
2
X
t-1
+ ρU
t-1
trừ (2) cho (4) ta được:
Y
t
- ρY
t-1
= β
1
(1-ρ) + β
2
( X
t
– ρX
t-1
) + (U
t
– ρU
t-1
)
= β
1
( 1 –ρ) + β
2
(X
t
– ρX
t-1
) + ɛ
t
(5)
Đặt β
*
= β
1
*
(1 –ρ); β
2
*
= β
2
Y
t
*
= Y
t
– ρY
t-1
; X
t
*
= X
t
– ρX
t-1
Thì phương trình (5) có dạng:
Y
t
*
= β
1
*
+ β
2
*
X
t
*
+ ɛ
t
(6)
Vì ɛ
t
thỏa mãn các giả thuyết của phương pháp bình phương nhỏ nhất thông
thường đối với các biến Y
*
và X
*
và các
ước lượng tìm được có tất cả các tính chất tối ưu
nghĩa là ước lượng tuyến tính không chệch tốt nhất.
Phương trình hồi quy Y
t
- ρY
t-1
= β
1
( 1 –ρ) + β
2
(X
t
– ρX
t-1
) + ɛ
t
được gọi là phương
trình sai phân tổng quát.
Việc ước lượng hồi quy Y
*
đối với X
*
có hay không có hệ số chặn phụ thuộc vào
phương trình gốc có hệ số chặn hay không. Trong phương pháp này ( ước lượng hồi quy
ρY
t-1
= ρβ
1
+ ρβ
2
X
t-1
+ ρU
t-1
chúng ta mất đi một quan sát bởi vì quan sát thứ nhất không
có quan sát đứng trước nó. Thủ tục này không chính xác là thủ tục ước lượng bình
phương nhỏ nhất tổng quát sử dụng tất cả các quan sát với:
Y
t
*
= Y
t
X
t
*
= X
t
Nhưng trong thực tế thì ρ chưa biết nên ta xét trường hợp sau đây:
1.3.2 Khi ρ chưa biết
a. Phương pháp sai phân cấp 1
Như ra biết -1 ≤ ρ ≤1 nghĩa là p nằm giữa [-1,0] hoặc [0,1] cho nên người ta có thể
bắt đầu từ các giá trị ở các dấu mút của các khoảng đo. Nghĩa là ta có thể giả thiết rằng:
ρ = 0 tức là không có tương quan chuỗi.
ρ = ±1 nghãi là có tương quan dương hoặc âm hoàn toàn.
Trên thực tế khi ước lượng hồi quy người ta thường giả thiết rằng không có tự tương
quan rồi sau đó tự tiến hành kiệm định Durbin-Watson hay các kiểm định khác để xem
giả thiết này có đúng không. Tuy nhiên nếu ρ =±1 thì phương trình sau phân tổng quát
quy về phương trình sai phân cấp 1
Y
1
– Y
t-1
= ß
1
( X
1
-X
t-1
) + ( U
1
-U
t-1
)= ß
2
(X
1
-X
t-1
)+ ε
1
Hay ∆Y
t
= ß
2
∆X
t
+ ε
1
Trong đó là toán từ sai số cấp 1. Để ước lượng hồi quy 1 thì cần phải lập các sai phân
cấp 1 của biến phụ thuộc và biến giải thích và sử dụng chúng làm những đầu vào trong
phân tích hồi quy.
Chú ý một nét quan trọng của mô hình sai phân cấp 1 của biến phụ thuộc là không
có số hạng chặn trong mô hình. Vì vậy để ước lượng hồi tquy 1 ta sẽ sử dụng mô hình hồi
quy qua gốc tọa độ.Giả sử mô hình ban đầu là:
Y
t
= ß
1
+ß
2
X
1
+ß
3
+ ε
1
Trong đó t là biến xu thế còn U
t
theo sơ đồ tự hồi quy bậc nhất.
Thực hiện phép biến đổi sai phân cấp 1 đối với 2 ta đi đến
∆Y
t
= ß
2
∆X
t
+ß
3
+ ε
1
Trong đó: ∆Y
t
= Y
1
– Y
t-1
và X
t
= X
1
-X
t-1
Phương pháp ∆Y
t
= ß
2
∆X
t
+ß
3
+ ε
1
có hệ số chặn dưới dạng sai phân cấp 1. Nhưng
chú ý ß
1
rằng là hệ số của các biến xu thế trong mô hình ban đầu. Vì vậy có số hạng chặn
ở dạng sai phân cấp 1 thì điều đó có nghĩa là có một số hạng xu thế tuyến tính trong mô
hình gốc và số hạng chặn thực ra là hệ số của biến xu thế.
Thí dụ nếu ß
3
trong ∆Y
t
= ß
2
∆X
t
+ß
3
+ ε
1
là dương thì điều đó có nghĩa là có xu thế
tăng trong Y sau khi đã tính đến ảnh hưởng của tất cả các biến khác.
Nếu ρ = -1 nghĩa là có tương quan chuỗi âm hoàn toàn ( đây không phải là trường
hợp điển hình của các chuỗi thời gian trong kinh tế), phương trình sai phân tổng quát bây
giờ có dạng :
Y
1
+Y
t-1
= 2ß
1
+ ß
2
(X
1
+X
t-1
)+ ε
1
Hay (Y
1
+Y
t-1
)/ 2 = ß
1
+ ß
2
(X
1
+X
t-1
)/2+ ε
1
/2
Mô hình này được gọi là mô hình hồi quy trung bình trượ t(2 thời kỳ) vì chúng ta hồi
quy giá trị của một trung bình trượt đối với một trung bình trượt khác.
Phép biến đổi sai phân cấp 1 đã giới thiệu trước đây rất phổ biến trong kinh tế lượng.
b. Ước lượng ρ dựa trên thống kê d – Durbin – Watson
Trong phần kiểm định d chúng ta đã thiết lập được các công thức:
d 2 ( 1 -
Hoặc 1 -
Đẳng thức này gợi cho ta cách thức đơn giản để thu được ước lượng của từ thống
kê d. Từ (Y
1
+Y
t-1
)/ 2 = ß
1
+ ß
2
(X
1
+X
t-1
)/2+ ε
1
/2 chỉ ra rằng giả thiết sai phân cấp 1 với =
chỉ đúng khi d =0 hoặc xấp xỉ bằng không. Cũng vậy khi d = 2 thì và khi d = 4 thì Do đó
thống kê d cung cấp cho ta một phương pháp sẵn có để thu được ước lượng của .
Nhưng lưu ý rằng quan hệ 1 - chỉ là quan hệ xấp xỉ và có thể không đúng với các
mẫu nhỏ.
Khi đã được ước lượng thì có thể biến đổi tập số liệu theo phương trình sai phân tổng
quát
Và tiến hành ước lượng theo phương pháp bình phương nhỏ nhất thông thường. Khi
ta sử dụng một ước lượng thay cho giá trị đúng, thì các hệ số ước lượng thu được từ
phương pháp bình phương nhỏ nhất có thuộc tính tối ưu thông thường chỉ tiệm cận có
nghĩa là có thuộc tính đó trong các mẫu lớn. Vì vậy trong các mẫu nhỏ ta phải cẩn thận
trong khi giải thích các kết quả ước lượng.
CHƯƠNG II: BÀI TOÁN ÁP DỤNG
1. Bài toán áp dụng.
Sau khi thu thập số liệu, ta có bảng về chỉ số phát triển con người HDI (Y), tuổi
thọ trung bình (X), tỷ lệ biết chữ (Z) và thu nhập bình quân (T) của Việt Nam trong giai
đoạn 1993-2005. Số liệu được cho ở bảng sau:
Năm HDI (Y)
Tuổi thọ trung bình
(tuổi) X Tỷ lệ biết chữ (%) Z
Thu nhập bình quân
(nghìn đô) T
1993 0.54 65.5 92.5 1.04
1994 0.557 66 93 1.208
1995 0.56 66.4 93.7 1.236
1996 0.61 67 92 1.31
1997 0.664 67.4 91.9 1. 52
1998 0.671 67.8 92.2 1.689
1999 0.682 67.8 93.1 1.86
2000 0.688 68.2 93.4 1.996
2001 0.688 68.6 92.7 2.07
2002 0.691 69 90.3 2.3
2003 0.704 70.5 90.3 2.49
2004 0.709 70.8 90.3 2.745
2005 0.733 73.7 90.3 3.071
Nguồn: Báo cáo phát triển con người các năm từ 1995 đến 2007 của UNDP
Nhập bảng số liệu vào eview ta có được bảng sau:
Sau khi tiến hành hồi quy mô hình bằng phương pháp bình phương nhỏ nhất với mức
ý nghĩa 5%, ta thu được kết quả như sau:
Mô hình hồi quy mẫu:
Ý nghĩa của các hệ số hồi quy:
β
2
= - 0.010657 Khi tỷ lệ biết chữ và thu nhập bình quân không đổi, tuổi thọ trung bình
tăng lên 1 tuổi thì chỉ số HDI giảm 0.010657.
β
3
= 0.005780 Khi tuổi thọ trung bình và thu nhập bình quân không đổi, tỷ lệ biết chữ
tăng 1% thì chỉ số HDI tăng 0.005780.
β
4
=0.135720 Khi tuổi thọ trung bình và tỷ lệ biết chữ không đổi, thu nhập bình quân
tăng 1 nghìn đô thì chỉ số HDI tăng 0.135720.
2. Phát hiện hiện tượng tự tương quan bằng kiểm đinh d (Dubin-Watson)
Mô hình hồi quy mẫu:
• BTKĐ:
• TCKĐ:
Miền giá trị:
n=13 ; k’= k-1= 3; ; ; 1,816
0 0.715 1.816 2.184 3.285 4
(1) (2) (3) (4) (5)
Ta có: d= 0,600477
d (1)
• KL: Có hiện tượng tự tương quan dương
3. Phát hiên hiện tượng tự tương quan bằng kiểm định B-G
a. Kiểm định tự tương quan BG bậc 1.
Mô hình hồi quy mẫu:
Ước lượng mô hình :
= ’ + ’ . + ’ . + ’ . + . +
= -0,960630 + 0,020329 . - 0,003061 . - 0,078702. + 0,881341
Bài toán kiểm định
Tiêu chuẩn kiểm định
= (n-1) đúng thì
Miền bác bỏ :
=
Ta có = = 3,84146
Và = 12. 0,557693 = 6,692316
Nhận thấy >
=>>
Bác bỏ , chấp nhận
Kết luận : Mô hình có hiện tượng tự tương quan bậc 1.
b. Kiểm định tự tương quan BG bậc 2.
Mô hình hồi quy mẫu:
Ước lượng mô hình :
= ’ + ’ . + ’ . + ’ . + . +. +
= -1,151084 + 0,014167. +0.002873 . - 0,043078. + 1,061623. - 0,488122.
Bài toán kiểm định
Tiêu chuẩn kiểm định :
= ( n-2 ) đúng thì
Miền bác bỏ :
=
Ta có = = 5,99147
Và = 11.0.624601 = 6,870611
Nhận thấy >
=>>
Bác bỏ , chấp nhận
Kết luận : Mô hình có hiện tượng tự tương quan bậc 2.
4. Cách khắc phục hiện tượng tự tương quan
a. Khắc phục hiện tượng tự tương quan dựa trên Durbin- Watson
Từ phương pháp bình phương nhỏ nhất mô hình hồi quy gốc.
ta có d=0.600477→ = 1- d/2 = 0.699762
Phương trình sai phân tổng quát:
Y
t
- ρY
t-1
= β
1
(1-ρ) + β
2
( X
t
– ρX
t-1
) + β
3
( Z
t
– ρZ
t-1
) + β
4
( T
t
– ρT
t-1
)+ ɛ
t
Đặt
Y
1
= Y
t
– 0.699762Y
t-1
X
1
= X
t
– 0.699762X
t-1
Z
1
= Z
t
– 0.699762Z
t-1
T
1
= T
t
– 0.699762T
t-1
Đặt β
1t
= β
1
(1 –ρ); β
2t
= β
2
; β
3t
= β
3
Bằng exel ta tính được kết quả như sau:
Năm Y X Z T Y
1
X
1
Z
1
T
1
1993
0.54 65.5 92.5 1.04
1994
0.557 66 93 1.208
0.17912
9
20.1655
9
28.2720
2
0.48024
8
1995
0.56 66.4 93.7 1.236
0.17023
3
20.2157
1
28.6221
3
0.39068
8
1996
0.61 67 92 1.31
0.21813
3 20.5358 26.4323
0.44509
4
1997
0.664 67.4 91.9 1.52
0.23714
5
20.5159
5 27.5219
0.60331
2
1998
0.671 67.8 92.2 1.689
0.20635
8
20.6360
4
27.8918
7
0.62536
2
1999
0.682 67.8 93.1 1.86 0.21246
20.3561
4
28.5819
4
0.67810
2
2000
0.688 68.2 93.4 1.996
0.21076
2
20.7561
4
28.2521
6
0.69444
3
2001
0.688 68.6 92.7 2.07 0.20656 20.8762 27.3422 0.67327
4 3 3 5
2002
0.691 69 90.3 2.3
0.20956
4
20.9963
3
25.4320
6
0.85149
3
2003
0.704 70.5 90.3 2.49
0.22046
4
22.2164
2
27.1114
9
0.88054
7
2004
0.709 70.8 90.3 2.745
0.21636
8
21.4667
8
27.1114
9
1.00259
3
2005
0.733 73.7 90.3 3.071
0.23686
9
24.1568
5
27.1114
9
1.15015
3
Ước lượng mô hình trên với các biến Y
1
, X
1
, Z
1
, T
1
ta có kết quả:
Với α=5%, n=12; k’=k-1=3 ta có d
L
=0.658,d
U
=1.834
Ta có khoảng là.
0 d
L
d
U
4-d
U
4-d
L
4
0 0.658 1.834 2.166 3.342 4
2 (2) (3) (4) (5)
Theo mô hình hồi quy ta có d = 1. 293680 khoảng (2) → không có kết luận tự
tương quan
Tiến hành kiểm định BG để thấy kết quả khắc phục tự tương quan mô hình trên.
Kiểm định tự tương quan bậc 1.
với α=5% ta cần kiểm định
↔
Ta có mô hình kiểm định BG như sau.
Theo mô hình kiểm định ta có p-value=0,2351 > α(5%) nên chấp nhận H
0
bác bỏ H
1
→không còn hiện tượng tự tương quan bậc 1.
Kiểm định tự tương quan BG bậc 2.
với α=5% ta cần kiểm định
↔
Ta có mô hình kiểm định BG như sau.
Theo mô hình kiểm định ta có p-value=0.2907 > α (5%) nên chấp nhận H
0
bác bỏ H
1
→không còn hiện tượng tự tương quan bậc 2.
Ta thấy rằng kiểm định BG đều cho biết mô hình sai phân tổng quát không có hiện
tượng tự tương quan. Nếu chấp nhận mô hình này thì ước lượng của mô hình ban đầu là:
Ŷ= 0.251968/ (1- 0.699762) + 0.003390 X – 0.004902 Z + 0.030574 T
TÀI LIỆU THAM KHẢO
1. Giáo trình Kinh tế lượng, Đại học Kinh tế quốc dân.
2. Chương trình phát triển Liên Hợp Quốc tại Việt Nam />