Tải bản đầy đủ (.docx) (25 trang)

Khắc phục hiện tượng tự tương quan

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (517.2 KB, 25 trang )

LỜI MỞ ĐẦU
Trong các giả thiết của mô hình hồi quy tuyến tính cổ điển là không có tự tương
quan hay tương quan chuỗi các nhiễu Ui trong hàm hồi quy tổng thể. Nói một cách
khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn với một quan sát nào đó
không bị ảnh hưởng bởi thành phần nhiễu gắn với một quan sát khác.
Tuy nhiên trong thực tế có xảy ra hiện tượng mà thành phần nhiễu của các quan
sát lại có thể phụ thuộc lẫn nhau. Việc xảy ra hiện tượng này do cả nguyên nhân chủ
quan và khách quan. Bằng cách nào để ta có thể nhận biết được hiện tường tự tương
quan? Các biện pháp khắc phục hiện tường tự tương quan là gì? Đây chính là câu hỏi
nhóm 5 nhận được để thảo luận, ứng dụng lý thuyết đã học vào thực tế để có cái nhìn
rõ hơn về hiện tường tự tương quan.
Sau khi nhận đề tài thảo luận nhóm 5 chúng em đã chọn bộ số liệu về để áp dụng
thực hiện các thao tác phát hiện và khắc phục hiện tường tự tương quan trên phần mềm
eview với ɑ=5 %, các biến
Y : GDP- Tổng sản phẩm quốc dân ( triệu USD)
X: POP: Dân số Việt Nam ( triệu người)
Z: FDI - Đầu tư trực tiếp nước ngoài đã giải ngân ( triệu USD từ năm 2000 đến
2016


Phần I: Cơ sở lý thuyết khắc phục hiện tượng tự tương quan
1. Khái niệm, nguyên nhân và hậu quả của hiện tượng tự tương quan
1.1 Khái niệm hiện tượng tự tương quan
Thuật ngữ tự tương quan có thể hiểu là “quan hệ tương quan giữa các thành
phần của chuỗi của các quan sát được sắp xếp theo thứ tự thời gian (trong dữ liệu
chuỗi thời gian) hoặc không gian (trong dữ liệu chéo). Trong phạm vi hồi quy, mô hình
tuyến tính cổ điển giả thiết rằng không có sự tương quan giữa các nhiễu nghĩa là:
Cov() = 0 ( i ≠ j )

(1.1)


Nói cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn với một
quan sát nào đó không bị ảnh hưởng bởi thành phần nhiễu gắn với một quan sát khác.
Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phàn nhiễu của các
quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:
Cov() = 0

(i≠j)

(1.2)

1.2 Nguyên nhân của sự tương quan
1.2.2 khách quan

- quán tính
- hiện tượng mạng nhện
- trễ
1.2.3

Chủ quan

- Xử lý số liệu
- Sai lệch do lập mô hình
- Đây là những nguyên nhân thuộc về lập mô hình. Có 2 loại sai lầm có thể gây ra hiện
tượng tự tương quan.
+ Một là: Không đưa đủ các biến vào trong mô hình. Việc không đưa đủ các biến vào
mô hình có thể gây ra hiện tượng tự tương quan.
+ Hai là: Dạng hàm sai. Dạng hàm sai có thể gây ra hiện tượng tự tương quan.
1.3 Hậu quả

1) Uớc lượng bình phương nhỏ nhất thông thường không phải là ước lượng tuyến tính

không chệc tốt nhất nữa


2) Phương sai ước lượng được của các ước lượng bình phương nhỏ nhất thông thường
không chệc và thông thường là thấp hơn giá trị thực của phương sai, do đó giá trị của
thống kê T được phóng đại lên nhiều lần.
3) Các kiểm định t và F nói chung không đáng tin cây
= cho ước lượng chệch của thực, và trong một số trường hợp, nó dường như ước
lượng thấp
5) có thể là độ đo không đáng tin cậy cho thực.
6) Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng có thể không
hiệu quả.
2. khắc phục hiện tượng tự tương quan
2.1 K hi cấu trúc của tự tương quan là đã biết
Do các nhiễu ut là không thể quan sát được, bản chất của tương quan chuỗi
thường thường là vấn đề của sự suy đoán hay các yêu cầu cấp thiết của thực tế. Trên
thực tế, người ta thường giả định rằng ut tuân theo sơ đồ tự hồi qui bậc 1, cụ thể là:
= +

(1.3)

Trong đó || < 1 và thoả mãn các giả thiết của phương pháp bình phương nhỏ
nhất thông thường nghĩa là: Trung bình bằng 0, phương sai không đổi và không tự
tương quan. Giả sử phương trình là đúng thì vấn đề tương quan chuỗi có thể được giải
quyết thoả đáng nếu hệ số tự tương quan
quay lại mô hình hai biến: Yt =1 +2 Xt +Ut

ρ

là đã biết. Để làm sáng tỏ vấn đề đó ta

(1.1)

Nếu (1.1) đúng với t thì cũng đúng với t – 1 nên
Yt-1= 1+2Xt-1+Ut-1

(1.2)

Nhân hai vế (1.2) với ta được:
t-1

=1+2Xt-1+Ut-1

(1.3)

Trừ (1.1) cho (1.3) ta được:
Yt - ρYt-1= 1 (1-+2(Xt – Xt-1)+Ut- Ut-1
= 1(1-+2(Xt – Xt-1) +t
Đặt =1(1-

=

(1.4)


Đặt
Thì phương trình (1.4) có thể viết lại dưới dạng:
= + +t

(1.5)


Vìt thoả mãn các giả thiết của phương pháp bình phương nhỏ nhất thông thường
đối với các biến Y* và X* và các ước lượng tìm được có tất cả các tính chất tối ưu
nghĩa là ước lượng tuyến tính không chệch tốt nhất.
Phương trình hồi quy (1.4) được gọi là phương trình sai phân tổng quát.
2.2 khi chưa biết
2.2.1 Phương pháp sai phân cấp I
Như ta đã biết -1 ≤ ≤ 1 nghĩa là nằm giữa [-1,0] hoặc [0,1] cho nên người ta bắt
đầu từ các giá trị ở các đầu mút của các khoảng đó. Hay là:
= 0 tức không có tương quan chuỗi
=

1 là có tương quan dương hoặc âm hoàn toàn

Khi ước lượng hồi quy người ta thường giả thuyết rằng không có tự tương quan
rồi sau đó tiến hành kiểm định Durbin – Waston hay các kiểm định khác để xem giả
thiết này có đúng không. Tuy nhiên nếu = thì phương trình sai phân tổng quát quy về
phương trình sai phân cấp 1.
= ( (+
Hay

Y

Trong đó

= +
là toán tử sai số cấp 1. Để ước lượng hồi quy thì cần phải lập các sai

phân cấp 1 của biến phụ thuộc và biến giải thích và sử dụng chúng làm những đầu vào
trong phân tích hồi quy.
Giả sử mô hình ban đầu là :

Trong đó t là biến xu thế, theo sờ đồ tự hồi quy bậc nhất
Thực hiện phép biến đổi sai phân cấp 1 đối với ta có :


Trong đó
Nếu = -1 nghĩa là có tương quan chuỗi âm hoàn toàn. Phương trình sai phân
tổng quát bây giờ có dạng:
+
Hay
Mô hình này được gọi là mô hình hồi quy trung bình trượt vì chúng ta hồi quy
trung bình trượt đối với một trung bình trượt khác
Phép biến đổi sai phân cấp 1 đã giới thiệu trước đây rất phổ biến trong kinh tế
lượng ứng dụng vì nó dễ thực hiện
2.2.2 Ước lượng dựa trên thống kê D (Durbin Watson)
Trong phần kiểm định chúng đã thiết lập các công thức :
2(1- )
Hoặc: 1 Đẳng thức này gợi cho ta cách thức đơn giản để thu được ước lượng của từ
thông kê . Từ chỉ ra rằng gải thiết sai phân cấp 1 với = chỉ đúng khi hoặc xấp xỉ bằng
0. Cũng vậy khi thì và khi thì .
Do đó thống kê cung cấp cho ta một phương pháp sẵn có để thu được ước
lượng của .
Nhưng lưu ý rằng quan hệ chỉ là xấp xỉ và có thể không đúng với các mẫu nhỏ.
Khi được ước lượng thì có thể biến đổi tập thể số liệu như đã có và tiền hành thep
phương pháp bình phương nhỏ nhất thông thường. Khi ta sử dụng một ước lượng thay
cho giá trị đúng, thì các hệ số ước lượng thu được từ phương pháp bình phương nhỏ
nhất có thuộc tính tối ưu thông thường chỉ tiệm cận có nghĩa là có thuộc tính đó trong
các mẫu lớn.
Vì vậy trong các mẫu nhỏ ta phải cẩn thận trong khi giải thích các kết quả ước
lượng.
2.2.3 Thủ tục lặp Cochrane- Orcutt để ước lượng

Lad một cách khác để ước lượng p từ thống kê d Durbin-Watson là phương
pháp Cochrane-Orcutt. Phương pháp này sử dụng các phần dư ei đã được ước lượng để
thu thập thông tin về p chưa biết.
Ta xét phương pháp này theo mô hình 2 biến như sau:


Giả sử Ui được sinh ra từ lược đồ AR(1) cụ thể là:
Ut =p.Ut-1 +
Các ước lượng p được tiến hành theo các bước như sau:
Bước 1:
Ước lượng mô hình hai biến bằng phương pháp bình phương nhỏ nhất thông thường
và thu được các phần dư et
Bước 2:
Sử dụng các phần dư đẫ ước lượng để được hổi quy:
Et =
Bước 3:
Sử dụng thu được để ước lượng mô hình sai phân tổng quát cụ thể là phương trình

Hoặc đặt:

Ta ước lượng hồi quy:
Bước 4:
Vì chúng ta chưa biết rằng ước lượng vừa thu được có phải là các ước lượng tốt nhất
của hay không, ta thế các giá trị của ) và vừa thu được vào hồi quy gốc ban đầu và
thu được các phần dư mới chẳng hạn :

Các phần dư có thể tính dễ dàng.
Ước lượng phương trình hồi quy tương tự như trên ,ta được:

là ước lượng vòng 2 của



Thủ tục này tiếp tục cho đến khi các ước lượng kế tiếp nhau của khác nha một
lượng rất nhỏ chẳng hặn bé hơn 0.01 hoăc 0.005
Trong thực tế,dùng 3-4 bước lawpk là đủ.
2.2.4 Thủ tục Cochrane – Orcutt hai bước
Đây là một kiểu rút gọn quá trình lặp.Trong bước 1,ta ước lượng từ bước lặp đầu
tiên tức là phép hồi quy
Và trong bước 2 ta sử dụng ước lượng của để ước lượng phương trình sai phân
tổng quát. Đôi khi trong thực hành,phương pháp hai bước này cho ta kết quả hoàn toàn
tương tự với các kết quả thu được từ thủ tục lặp kỹ lưỡng ở trên.
2.2.4 Phương pháp Durbin – Watson 2 bước để ước lượng
Để minh hoạ phương pháp này, chúng ta viết lại phương trình sai phân tổng
quát dưới dạng sau:
Durbin đã đề xuất thủ tục 2 bước như sau để ước lượng ρ:
Bước 1: phương trình trên như là một mô hình hồi qui bội, hồi qui theo , và và
coi giá trị ước lượng được đối với hệ số hồi qui của (= là ước lượng của ρ. Mặc dầu là
ước lượng chệch nhưng ta có ước lượng vững của ρ.
Bước 2: Sau khi thu được, hãy biến đổi: = và =
Và ước lượng hồi qui với các biến đã được biến đổi như trên.
Như vậy, theo phương pháp này thì bước 1 là để ước lượng ρ còn bước 2 là để
thu được các tham số.
2.2.6 Các phương pháp ước lượng khác
Ngoài ra còn có các phướng pháp hợp lí cực đại để ước lượng trực tiếp các
tham số mà không cần dùng đến 1 số các thủ tục lặp đã thảo luận. Nhưng phương pháp
ước lượng hợp lí liên quan đến thủ tục ước lượng phi tuyến và thủ tục tìm kiếm của
Hildreth – Lu nhưng thủ tục này tốn nhiều thời gian và không hiệu quả so với các
phương pháp khác nên không được sử dụng rộng rãi.




PHẦN II. Vận dụng vào thực hành
Đề bài: Cho số liệu về :. GDPTổng sản phẩm quốc dân ( triệu USD), FDI: Đầu tư trực
tiếp nước ngoài đã giải ngân ( triệu USD) và POP: Dân số Việt Nam ( triệu người) từ năm
2000 – 2016, với mức ý nghĩa 5% khắc phục hiện tượng tự tương quan trong mô hình ?
Bảng số liệu thống kê từ 2000 đến 2016
năm
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016

GDP(Y)
31
32
35
39

45
52
60
70
89
91
101
122

136
171
184
204
217

POP(X)
77.63
78.62
79.54
80.47
81.44
82.39
83.31
84.22
85.12
86.03
86.93
87.84
88.78
90.0

90.5
91.9
93.4

FDI (Z)
2.4
2.4
2.5
2.6
2.8
3.3
4.1
8.0
11.5
10.0
11.0
11.0
10.0
11.5
12.35
14.5
15.8

Trong đó:
Y : Tổng sản phẩm quốc dân ( triệu USD)
X: Dân số Việt Nam ( triệu người)
Z : Đầu tư trực tiếp nước ngoài đã giải ngân ( triệu USD)


1. Phát hiện hiện tượng tự tương quan

• ước lượng mô hình

ta có mô hình Yt1 = β1 + β2 X1t

Gõ trên hộp lệnh của Eview: LS Y C X rồi nhấn enter ta được bảng kết quả sau

Từ bảng (2) ta có mô hình hồi quy mẫu là:
Y = -971,2753 + 12,5403*X + 0,226495 *Z


Ý nghĩa của các hệ số hồi quy. Khi vốn đầu tư nước ngoài được giải ngân không đổi, dân
số tăng lên 1 triệu người thì tổng sản phẩm quốc dân tăng 12,5403 triệu USD

1.1 phương pháp đồ thị
Từ cửa sổ Equation, chọn view/Actual,Fitted, Residual/Actual, Residual, table.

Ta được Residual = ei và đồ thị phần dư

t


Lưu lại và vẽ đồ thị phần dư của mô hình theo các bước sau:
Từ cửa sổ equation, chọn proc/make residual series.

- Cửa sổ Make Residual hiện ra, nhập tên cho phần dư là “E”

- Ta được phần dư e


- Từ menu chính chọn Quick/ Graph

- Cửa sổ Series List sẽ xuất hiện, yêu cầu nhập tên biến “E” cần vẽ đồ thị


- Sau khi nhập tên biến xong, chọn “OK” ta được đố thị phần dư dưới đây:

Nhìn Vào đồ thị ta thấy tăng giảm trong các nhiễu. Do đó có hiện tượng tự tương quan
trong mô hình
1.2 Kiểm định Durbin-Watson (DW)


Ta có mô hình hồi quy: Y = -971,2753 + 12,5403*X + 0,226495 *Z +ei
Với ɑ = 5% KĐGT:
Dựa vào bảng (2) ta thấy thống kê d, d =0,270794
Trong khi đó tra bảng giá trị thống kê DW với n=17, k’=2, ɑ=0,05;
ta có du =1,536 ; dl =1,015 ; 4 - du = 2,462; 4 - dl = 2,985
0

4-

4-

Bác bỏ ρ>0
Không kết luận Chấp nhận
Không kết
Tương quan
không có tương
luận
dương
quan chuỗi bậc 1
0

1,015
1,536
2,462

4
Bác bỏ ρ<0
Tương quan âm
2,985

Vì 0 < d < dL nên ta bác bỏ giả thuyết H0, chấp nhận giả thuyết H1 nghĩa là tồn tại hiện
tượng tự tương quan dương
1.3. Kiểm định BG – Breush & Godfrey
Từ của sổ equation, chon view/residual test/ serial correlation LM tesrt

Ta được

4


*Nhập 1 vào ô lags to indude ( tức p = 1) -> ok
Cửa sổ hồi quy mô hình mà B – G đưa ra có dạng

KĐGT:
H0 : ρ=0 (không có hiện tượng tự tương quan)
H1: ρ0(tồn tại hiện tượng tự tương quan bậc 1)
XDTCKĐ : X2=nR2 ; nếu H0 đúng X2~X2(1)
Có p_value(X2) = 0.0015 < ɑ =0,05
Suy ra bác bỏ H0 chấp nhận H1
Kết luân : tồn tại hiện tượng tự tương quan bậc 1
* Nhập 2 vào ô lags to indude ( tức p = 2) -> ok ta có bảng sau:



KĐGT:
H0 : ρ=0 (không có hiện tượng tự tương quan)
H1: ρ0(tồn tại hiện tượng tự tương quan bậc 2)
XDTCKĐ : X2=nR2 ; nếu H0 đúng X2~X2(2)
Có p_value(X2) = 0.0060 < ɑ =0,05
Suy ra bác bỏ H0 chấp nhận H1
Kết luân : tồn tại hiện tượng tự tương quan bậc 2

1.4: Kiểm định Correlogram
- Từ cửa sổ Equation chọn View/Residual Tests/Correlogram-Q-statistics
- Ta được cửa sổ Lag Specification, nhập 22 vào ô Lags to include
Ta được: kiểm đinh LM để nhận dạng AR(1)

Để xem xét sai số ( hay phần dư) có phải là ngẫu nhiên thuần túy ( hay nhiễu trắng) hay
không là xét đồ thị tự tương quan của phẩn dư(ac): nếu tất cả các thanh đồ thị AC đều
nằm trong 2 đường giới hạn thì chứng tỏ sai số là nhiễu trắng hoặc nếu tất cả có giá trị
prob> anpha thì chứng tỏ tất cả giá trị AC đều bằng nhau và bằng 0 hay sai số là nhiễu
trắng


- Ta có Q-stat = 10.958 hay p-value = 0.001< α =0.05→ Có sự tương quan hay có AR(1)
Qua phương pháp đồ thị và các kiểm định trên ta thấy tồn tại hiện tượng tự tương quan
trong mô hình bộ số liệu hay các yếu tố trong mô hình vốn đầu tư trực tiếp nước ngoài
FDI có ảnh hưởng qua lại lần nhau.
2. khắc phục hiện tượng tự tương quan
2.1 ước lượng ρ bằng thủ tục Cochrane – Orcutt
Gõ trên hộp lệnh của Eview: LS Y C X
GENR U=RESID

LS U U(-1)

Nhìn vào kêt quả trên ta có ρ = 0.773248
GENR YM = Y- 0.773248*Y(-1)
GENR XM = X- 0.773248*X(-1)
GENR ZM = Z- 0.773248*Z(-1)
LS YM C XM ZM


Ta kiểm tra tương quan chuỗi bằng kiểm định BG.

Dựa vào bảng trên ta thấy Prob(Obs*R-Squared) = 0,4877 > 0,05
 Hiện tượng tự tương quan đã được khắc phục

2.2. Phương pháp Durbin –Watson 2 bước để tìm ρ:
Bước 1 :ước lượng ρ
Ta viết lại phương trình sai phân dưới dạng sau:
Yt = β1*(1-ρ) + β2*Xt - ρ*β2Xt-1 + β3*Zt - ρ*β3Zt-1 +Yt-1 + et
Gõ trên hộp lệnh của Eview: LS Y C X Z X(-1) Y(-1) Z(-1)


Bước 2: Có =0,834113, đổi biến
Y2t =Yt - 0,834113 Yt-1,
X2t = Xt - 0,834113Xt-1
Z2t = Zt - 0,834113Zt-1

Ước lượng hồi quy Y2t, X2t, Z2t
Gõ trên hộp lệnh của Eview: LS Y2t C X2t Z2t



Mô hình hồi quy mẫu sau khi đã được khắc phục là:
Y2t=13,75146/(1-0,834113) + 0.0047643X2t +0,001819Z2t.


0Ta tiến hành kiểm định Breusch – Gofrey BG bậc 1,ta được bảng eview sau:

- Nhìn vào phần trên của bảng kết quả ta có: prob.chi-square (1) = 0,6963
Với α = 0,05 < 0,6963→ ta chấp nhận giả thiết cho rằng không có tự tương quan ở bậc
1, hay nói cách khác, ta kết luận sau khi khắc phục không còn tồn tại hiện tượng tự
tương quan bậc 1



Tương tự ta kiểm định BG bậc 2 ta được


- Nhìn vào phần trên của bảng kết quả ta có: prob.chi-square (2) = 0.3198
Với α = 0,05 < 0.3198→ ta chấp nhận giả thiết cho rằng không có tự tương quan ở bậc
2, hay nói cách khác, ta kết luận sau khi khắc phục không còn tồn tại hiện tượng tự
tương quan bậc 2.

2.3 Khắc phục dựa trên thống kê d
Từ bảng có: d=0,270794



=1-d/2 =0.864603

Phương trình sai phân tổng quát:
Y1t = Yt - 0.864603*Yt-1

X1t = Xt - 0.864603*Xt-1
Z1t = Zt - 0.864603*Zt-1
Dùng excel ta được bảng số liệu:


năm
2000
2001
2002
2003
2004
2005

Y
31
32
35
39
45
52

X
77,63
78,62
79,54
80,47
81,44
82,39

Z

2,4
2,4
2,5
2,6
2,8
3,3

Y1t

X1t

Z1t

5,197307
7,332704
8,738895
11,28048
13,09287

0,324953
0,424953
0,438493
0,552032
0,879112

2006

60

83,31


4,1

15,04064

2007

70

84,22

8

18,12382

2008

89

85,12

11,5

28,47779

2009
2010

91
101


86,03
86,93

10
11

14,05033
22,32113

2011

122

87,84

11

34,6751

2012

136

88,78

10

30,51843


2013

171

90

11,5

53,41399

2014

184

90,5

12,35

36,15289

2015

204

91,9

14,5

44,91305


2016

217

93,4

15,8

40,62099

11,50087
11,56491
11,69948
11,8654
11,97673
12,0753
6
12,1899
2
12,3031
4
12,4349
9
12,5482
12,6800
6
12,8332
7
13,2405
5

12,6857
3
13,6534
3
13,9429
8

Ước lượng mô hình : Yt1 = β1 + β2 X1t+ β3 Z1t được bảng

1,24681
4,455128
4,583176
0,057066
2,35397
1,489367
0,489367
2,85397
2,407066
3,822153
3,263257




kiểm định Durbin – Watson

Với ɑ = 5% KĐGT:
Dựa vào bảng (2) ta thấy thống kê d, d =1,279050 Trong khi đó tra bảng giá trị thống
kê DW với n=17, k’=2, ɑ=0,05;
ta có du =1,536 ; dl =1,015 ; 4 - du = 2,462; 4 - dl = 2,985

0

4-

4-

Bác bỏ ρ>0
Không kết luận Chấp nhận
Không kết
Tương quan
không có tương
luận
dương
quan chuỗi bậc 1
0
1,015
1,536
2,462

Từ bảng ta có du  không có hiện tượng tự tương quan

4
Bác bỏ ρ<0
Tương quan âm
2,985

4



KẾT LUẬN
Khi nghiên cứu về tổng sản phẩm quốc dân, vốn đầu tư nước ngoài đã giải ngân và tổng
dân số Việt Nam từ các năm 2000- 2016. Ta thấy rằng với mẫu số liệu trên có hiện tượng
tự tương quan.Sau khi tiến hành các biện pháp khắc phục ta thấy rằng hiện tượng tư
tương quan các bậc 1, 2 đã được khắc phục, Tuy nhiên, vẫn chưa thể khẳng định hoàn
toàn là không có hiện tượng tự tương quan nhưng mô hình bộ số liệu ban đầu đã trở lên
tốt hơn. Do vậy các nhà nghiên cứu khi muốn sử dụng bộ số liệu phục vụ cho mục đích
nghiên cứu có thể tiến hành khắc phục theo các phương pháp trên để có được bộ số liệu
chính xác hơn phản ánh đúng ý tưởng nghiên cứu của mình.


×