1. BẢN CHẤT HIỆN TƯỢNG TỰ TƯƠNG QUAN
1.1. Định nghĩa
Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành
phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các số
liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo).
Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không
có sự tương quan giữa các nhiễu U
i
nghĩa là:
Cov(U
i
, U
j
) = 0 (i
≠
j) (7.1)
Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn
với một quan sát nào đó không bị ảnh hưởng bởi thành phần nhiễu gắn với
một quan sát khác.
Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễu
của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:
Cov(U
i
, U
j
)
≠
0 (i
≠
j) (7.2)
1.2. Nguyên nhân của tự tương quan
1.2.1. Nguyên nhân khách quan
- Quán tính:
Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quán tính.
Chúng ta đều biết các chuỗi thời gian như tổng sản phẩm, chỉ số giá, thất
nghiệp mang tính chu kỳ. Chẳng hạn nếu chúng ta ở đầu của thời kỳ khôi
phục kinh tế tổng sản phẩm có xu hướng đi lên. Vì vậy trong hồi quy của
chuỗi thời gian, các quan sát kế tiếp đó có nhiều khả năng phụ thuộc lẫn
nhau.
- Hiện tượng mạng nhện:
Chẳng hạn vào đầu vụ trồng lạc năm nay, người nông dân bị ảnh hưởng
bởi giá mua lạc năm ngoái của các công ty xuất khẩu. Cho nên cung về lạc có
biểu hiện dưới dạng hàm:
Y
t
=
1
β
+
2
β
P
t – 1
+ U
t
(7.3)
Giả sử ở cuối thời kỳ t giá lạc P
t
< P
t – 1
, do đó trong thời kỳ t + 1 những
người nông dân có thể sẽ quyết định sản xuất lạc ít hơn thời kỳ t. Điều này sẽ
dẫn đến mô hình mạng nhện.
- Trễ:
Chẳng hạn khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập,
chúng ta thấy rằng tiêu dùng ở thời kỳ hiện tại chẳng những phụ thuộc vào
thu nhập hiện tại mà còn phụ thuộc vào tiêu dùng ở thời kỳ trước đó, nghĩa
là:
Y
t
=
1
β
+
2
β
X
t
+
3
β
Y
t – 1
+ U
t
(7.4)
Trong đó: Y
t
: Tiêu dùng ở thời kỳ t.
X
t
: Thu nhập ở thời kỳ t.
Y
t – 1
: Tiêu dùng ở thời kỳ t – 1.
U
t
: Nhiễu.
1
β
,
2
β
,
3
β
: Các hệ số.
Chúng ta có thể lý giải mô hình (7.4) như sau: Người tiêu dùng thường
không thay đổi thói quen tiêu dùng…, như vậy nếu ta bỏ qua số hạng trễ
trong (7.4), số hạng sai số sẽ mang tính hệ thống do ảnh hưởng của tiêu dùng
thời kỳ trước lên tiêu dùng thời kỳ hiện tại.
1.2.2. Nguyên nhân chủ quan
- Xử lý số liệu:
Trong phân tích thực nghiệm, số liệu thô thường được xử lý. Chẳng hạn
trong hồi quy chuỗi thời gian gắn với các số liệu quý, các số liệu này thường
được suy ra từ số liệu tháng bằng cách cộng đơn giản 3 quan sát theo tháng
rồi chia cho 3. Việc lấy trung bình này làm trơn các số liệu và làm giảm sự
dao động trong số liệu tháng. Chính sự làm trơn này gây ra tự tương quan.
- Sai lệch do lập mô hình:
Đây là nguyên nhân thuộc về lập mô hình. Có hai loại sai lầm có thể gây
ra hiện tượng tự tương quan:
Một là: không đưa đủ các biến vào trong mô hình
Hai là: dạng hàm sai có thể gây ra hiện tượng tự tương quan.
1.3. Ước lượng bình phương nhỏ nhất khi có tự tương quan
Ta xét mô hình:
Y
t
=
1
β
+
2
β
X
t
+ U
t
(7.5)
Trong đó: t ký hiệu quan sát ở thời điểm t (giả thiết ta đang nghiên cứu
số liệu dạng chuỗi thời gian).
Với giả thiết tổng quát cov(U
t
, U
t + s
)
≠
0 (s
≠
0). Ta có thể giả thiết
nhiễu sản sinh ra theo cách sau:
U
t
=
ρ
U
t – 1
+
t
ε
(-1 <
ρ
< 1) (7.6)
Trong đó:
ρ
gọi là hệ số tự tương quan,
t
ε
là nhiễu ngẫu nhiên thoả mãn
các giả thiết thông thường của phương pháp bình phương nhỏ nhất:
2
)var(
)0(0),cov(
0)(
σε
εε
ε
=
≠=
=
+
t
stt
t
s
E
(7.7)
Lược đồ (7.7) gọi là lược đồ tự hồi quy bậc nhất Markov. Chúng ta ký
hiệu lược đồ đó là AR(1). Nếu U
t
có dạng:
U
t
=
1
ρ
U
t – 1
+
2
ρ
U
t – 2
+
t
ε
Là lược đồ tự hồi quy bậc 2 và ký hiệu AR(2).
Bằng phương pháp bình phương nhỏ nhất ta tính được:
∑
∑
=
=
=
n
i
i
n
i
ii
x
yx
1
2
1
2
ˆ
β
Nhưng phương sai của nó trong lược đồ AR(1), bây giờ là:
Nếu không có tự tương quan thì:
Ta thấy: cộng với một số hạng phụ thuộc vào ρ .
Nếu ρ = 0 thì:
Nếu tiếp tục dùng phương pháp OLS và điều chỉnh công thức phương sai
thông thường bằng việc sử dụng lược đồ AR(1) thì không còn là ước
lượng không chệch tốt nhất nữa.
1.4. Ước lượng tuyến tính không chệch tốt nhất khi có tự tương quan
Giả sử chúng ta tiếp tục xét mô hình 2 biến và có quá trình AR(1) bằng
phương pháp bình phương nhỏ nhất tổng quát đã xét từ ở chương trước ta thu
được:
C
xx
yyxx
n
t
tt
n
t
tttt
G
+
−
−−
=
∑
∑
=
−
=
−
2
2
1
2
1
2
)(
))((
ρ
ρρ
β
(7.8)
Trong đó C là hiệu số điều chỉnh có thể bỏ qua trong thực tế.
Và phương sai của nó được cho bởi công thức:
Var(
G
2
β
) =
D
xx
n
t
tt
+
−
∑
=
−
2
2
1
2
)(
ρ
σ
(7.9)
Trong đó D cũng là hệ số điều chỉnh mà ta có thể bỏ qua trong thực
hành.
1.5. Hậu quả
- Ước lượng bình phương nhỏ nhất thông thường không phải là ước
lượng tuyến tính không chệch tốt nhất nữa.
- Phương sai ước lượng được của các ước lượng bình phương nhỏ nhất
thông thường là chệch và thông thường là thấp hơn giá trị thực của phương
sai, do đó giá trị của thống kê T được phóng đại lên nhiều lần.
- Các kiểm định t và F nói chung không đáng tin cậy.
-
2
2
2
ˆ
)(
ˆ
σ
σ
σ
kn
−
=
cho ước lượng chệch của
2
σ
thực, và trong một số trường
hợp, nó dường như ước lượng thấp
2
σ
.
- R
2
có thể là độ đo không đáng tin cậy cho R
2
thực.
- Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng có
thể không hiệu quả.
2,PHÁT HIỆN CÓ TỰ TƯƠNG QUAN
2.1. Phương pháp đồ thị
Giả thiết không có tự tương quan trong mô hình hồi quy tuyến tính cổ
điển gắn với các nhiễu U
t
, nhưng không quan sát được, ta chỉ có thể quan
sát các phần dư e
t
. Mặc dù e
t
không hoàn toàn giống như U
t
nhưng quan sát
các phần dư e
t
có thể gợi ý cho ta những nhận xét về U
t
Có nhiều cách khác nhau để xem xét các phần dư. Chẳng hạn chúng
ta có thể đơn thuần vẽ đồ thị của e
t
theo thời gian như hình dưới:
Nhìn vào đồ thị, ta thấy phần dư không biểu thị một kiểu mẫu nào khi thời
gian tăng lên, nó phân bố một cách ngẫu nhiên xung quanh trung bình của
chúng → Nó ủng hộ cho giả thiết không có sự tương quan trong mô hình hồi
quy tuyến tính cổ điển.
Nếu đồ thị của phần dư như hình dưới: ta thấy có xu thế tuyến tính, tăng hoặc
giảm trong các nhiễu → Nó ủng hộ cho giả thiết có sự tương quan trong mô
hình hồi quy tuyến tính cổ điển.
Một cách khác là vẽ đồ thị của phần dư chuẩn hoá theo thời gian.
2.2. Phương pháp kiểm định số lượng
2.2.1. Kiểm định các đoạn mạch
Kiểm định các đoạn mạch là một phép kiểm định thống kê giúp ta xác
định xem có thể coi một dãy các ký hiệu, các khoản mục hoặc các số liệu có
phải là kết quả của một quá trình mang tính ngẫu nhiên hay không.
2.2.2. Kiểm định
2
χ
về tính độc lập của các phần dư
Để kiểm định
2
χ
về tính độc lập của các phần dư ta sử dụng bảng liên
tiếp. Bảng liên tiếp mà chúng ta sử dụng ở đây gồm một số dòng và một số
cột, cụ thể là bảng liên tiếp 2 dòng và 2 cột.
2.2.3. Kiểm định d.Durbin – Watson
Là kiểm định dựa vào giá trị tính toán, thống kê d được định nghĩa như
sau:
d =
∑
∑
=
=
−
−
n
t
t
n
t
tt
e
ee
1
2
2
2
1
)(
(7.10)
d
≈
2(1 -
ρ
ˆ
) (7.11)
Trong đó:
∑
∑
=
=
−
=
n
t
t
n
t
tt
e
ee
1
2
2
1
ˆ
ρ
(7.12)
Vì -1
≤
≤
ρ
1 nên 0
≤≤
d
4.
Nếu
ρ
= -1 thì d =4: tự tương quan ngược chiều
Nếu
ρ
= 0 thì d = 2: không có tự tương quan
Nếu
ρ
= 1 thì d = 0: tồn tại tự tương quan thuận chiều
(1) (2) (3) (4) (5)
0 d
l
d
u
2 4-d
u
4-d
l
4
d
∈
(1): tồn tại tự tương quan thuận chiều
d
∈
(2): không xác định
d
∈
(3): không có tự tương quan
d
∈
(4): không xác định
d
∈
(5): tồn tại tự tương quan ngược chiều
Kiểm định Durbin – Watson chỉ nhận dạng được hiện tượng tương quan
chuỗi bậc 1. Đôi khi Kiểm định Durbin – Watson không cho kết luận.
2.2.4. Kiểm định Breusch – Godfrey (BG)
Để đơn giản ta xét mô hình giản đơn: Y
t
=
tt
UX
++
21
ββ
Trong đó: U
t
=
tptptt
UUU
ερρρ
++++
−−−
...
2211
,
t
ε
thoả mãn các giả thiết
của OLS.
Giả thiết: H
0
:
0...
21
====
p
ρρρ
Kiểm định như sau:
Bước 1: Ước lượng mô hình ban đầu bằng phương pháp OLS. Từ đó thu
được các phần dư e
t
.
Bước 2: Ước lượng mô hình sau đây bằng phương pháp OLS:
e
t
=
tptpttt
veeeX
++++++
−−−
ρρρββ
...
221121
Từ kết quả ước lượng mô hình này thu được R
2
Bước 3: Với n đủ lớn, (n - p)R
2
có phân bố xấp xỉ
2
χ
(p).
Nếu (n - p)R
2
>
2
α
χ
(p) thì H
0
bị bác bỏ, nghĩa là ít nhất tồn tại tự tương
quan một bậc nào đó. Trong trường hợp ngược lại không tồn tại tự tương
quan.
2.2.5. Kiểm định Durbin h