Tải bản đầy đủ (.pdf) (54 trang)

Khoá luận tốt nghiệp mô hình arima và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.22 MB, 54 trang )

TRƯỜNG ĐẠI HỌC s ư PHẠM HÀ NỘI 2
KHỎA TOÁN
= = = ío fflc 8 ===

LƯƠNG THỊ THOA

MÔ HÌNH ARIMA VÀ ỨNG DỤNG

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC






C h uyên ngành: T oán ử n g dụ ng

HÀ NỘI - 2015




TRƯỜNG ĐẠI HỌC su ' PHẠM HÀ NỘI 2
KHỎA TOÁN
= = = £ o tũ lG a = = =

LƯƠNG THỊ THOA

MÔ HÌNH ARIMA VÀ ỨNG DỤNG

KHÓA LUẬN


TỐT NGHIỆP
ĐẠI


• HỌC

Chuyên ngành: Toán ửng dụng

Người hướng dẫn khoa học
TS. TRẦN TRỌNG NGUYÊN

HÀ NỘI - 2015


LỜI CẢM ƠN
Trong quá trình nghiên cứu khóa luận "Mô hình ARIMA và ứng
dụng" với sự cố gắng của bản thân và sự giúp đỡ nhiệt tình của các thầy cô
trong tổ Toán ứng dụng, các bạn sinh viên khoa Toán em đã hoàn thành
khóa luận này.
Em xin chân thành cảm ơn sự giúp đỡ quý báu của các thầy cô trong
tổ Toán ứng dụng, trường đại học sư phạm Hà Nội 2 và các bạn sinh viên
đã tạo điều kiện cho em trong suốt thời gian làm khóa luận.
Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc tới thầy hướng dẫn, Tiến
sĩ Trần Trọng Nguyên, người đã hướng dẫn em tận tình và đóng góp ý
kiến quý báu cho em trong quá trình thực hiện và hoàn thành khóa luận
này.

Hà Nội, ngày 2 tháng 5 năm 2015
Sinh viên


Lương Thị Thoa


LỜI CAM ĐOAN
Khóa luận này là kết quả của bản thân em trong quá trình học tập và
nghiên cứu. Bên cạnh đó em được sự quan tâm của các thầy cô trong khoa
Toán. Đặc biệt là sự hướng dẫn của thầy: Trần Trọng Nguyên.
Trong khi nghiên cứu hoàn thành khóa luận này em có tham khảo một
số tài liệu đã ghi trong phần tài liệu tham khảo.
Em xin cam đoan kết quả của khóa luận này không có sự trùng lặp với
kết quả của tác giả khác.

Hà Nội, ngày 2 tháng 5 năm 2015
Sinh viên

Lương Thị Thoa


MỤC LỤC
LỜI MỞ Đ Ầ U .................................................................................................. 1
1. Lí do chọn đề tà i.............................................................................................. 1
2. Mục đích nghiên cứu.......................................................................................1
3. Đối tượng và phạm vi nghiên c ú n .................................................................2
4. Phương pháp và công cụ nghiên cứu............................................................ 2
5. Khái quát về nội dung và phạm vi nghiên cứu.............................................2
CHƯƠNG 1. KIẾN THỨC CHUẨN B Ị.......................................................... 3
1.1. Biến ngẫu nhiên và quy luật phân phối xác suất...................................... 3
1.1.1. Biến ngẫu nhiên một chiều...................................................................... 3
1.1.1.1. Định nghĩa biến ngẫu nhiên.......................................................... 3
1.1.1.2. Hàm phân phối xác suất.................................................................3

1.1.2. Biến ngẫu nhiên hai chiều....................................................................... 3
1.1.2.1. Định nghĩa....................................................................................... 3
1.1.2.2. Hàm phân phối xác suất.................................................................3
1.1.2.3. Sự độc lập của hai biến ngẫu nhiên...............................................4
1.1.3. Biến ngẫu nhiên nhiều chiều...................................................................4
1.1.3.1. Định nghĩa.......................................................................................4
1.1.3.2. Hàm phân phối xác suất................................................................4
1.1.3.3. Tính độc lập của nhiều biến ngẫu nhiên....................................... 5
1.1.4. Một số đặc trưng của biến ngẫu nhiên.................................................... 5
1.1.4.1. Kỳ vọng.......................................................................................... 5
1.1.4.2. Phương sai....................................................................................... 6
1.1.4.3. Hiệp phương sa i............................................................................ 6
1.1.4.4. Hệ số tương quan........................................................................... 6
1.1.5. Một số quy luật phân phối....................................................................... 7
1.1.5.1. Quy luật phân phối chuẩn.............................................................. 7


1.1.5.2. Quy luật Khi bình phương............................................................. 7
1.2. Phân tích hồi quy..........................................................................................8
1.2.1. Mô hình hồi quy tuyến tính hai b iế n ....................................................... 8
1.2.2. Hàm hồi quy tổng th ể ...............................................................................9
1.2.3. Hàm hồi quy m ẫu ..................................................................................... 9
1.2.4. Phương pháp ước lượng OLS.................................................................10
1.3. Giới thiệu về chuỗi thời gian và toán tử trễ.......................................... 11
1.3.1. Chuỗi thời gian........................................................................................ 11
1.3.2. Toán tử tr ễ ............................................................................................... 12
1.4. Quá trình ngẫu nhiên dừng và không dừng.......................................... 12
1.5. Hàm tự tương quan và hàm tự tương quan riêng..................................14
1.5.1. Hàm tự tương quan............................................................................... 14
1.5.2. Hàm tự tương quan riêng......................................................................14

1.6 . Nhiễu trắng và bước ngẫu nhiên............................................................ 15
1.6.1. Nhiễu trắng.............................................................................................. 15
1.6.2. Bước ngẫu nhiên......................................................................................15
CHƯƠNG 2. MÔ HÌNH ARIMA VÀ ỨNG DỤNG.................................17
2.1. Mô hình ARIM A.................................................................................... 17
2.1.1. Quá trình

trung bình trượt (M A ).................................................17

2.1.2. Quá trình

tự hồi quy (AR - Autoregressive Process)................17

2.1.3. Quá trình

trung bình trượt tự hồi quy ARM A ............................18

2.1.4. Ọuá trình

trung bình trượt, tích hợp tự hồi quy ARIMA...........19

2.1.5. Dự b á o ......................................................................................................19
2.1.5.1. Dự báo quá trình A R (p).............................................................. 19
2.1.5.2. Dự báo quá trình MA (q).............................................................20
2.1.5.3. Dự báo quá trình ARMA(p,q)..................................................... 21
2.1.5.4. Dự báo quá trình ARIMA(p,d,q).................................................21


2.1.6 . Kiểm định nghiệm đơn v ị...................................................................... 22
2.1.7. Phương pháp Box - Jenkins...................................................................24

2.1.7.1. Định dạng mô hình - xác định tham số p, d, q ...........................24
2.1.7.2. Ước lượng mô hình...................................................................... 30
2.1.7.3. Kiểm định tính thích hợp của mô hình....................................... 32
2.1.7.4. Dự báo và sai số dự b á o ...............................................................35
2.2.

ứ ng dụng mô hình ARIMA dự báo chỉ số VNINDEX....................... 39

2.2.1. Xây dựng mô hình ARIMA cho chuỗi VNINDEX............................. 39
2.2.2. Ước lượng các tham số của mô hình.................................................... 42
2.2.3. Kiểm tra sự phù họp của mô h ìn h ........................................................ 43
2.2.4. Dự báo g iá .............................................................................................. 44
KẾT LUẬN.......................................................................................................47
DANH MỤC TÀI LIỆU THAM KH Ả O ....................................................... 48


LỜI MỞ ĐẦU
1. Lí do chọn đề tài
Chuỗi thời gian đang được sử dụng như một công cụ hữu hiệu để phân
tích và dự báo trong kinh tế xã hội cũng như trong nghiên cứu khoa học.
Chính do tầm quan trọng của phân tích chuỗi thời gian, rất nhiều nghiên
cún đã đề xuất các công cụ để phân tích và dự báo chuỗi thời gian. Trong
những năm trước, công cụ để phân tích chuỗi thời gian là sử dụng các công
cụ thống kê như hồi quy, phân tích Furie và một vài công cụ khác.Nhưng
hiệu quả nhất là mô hình ARIMA của Box-Jenkins. Từ các công trình ban
đầu về chuỗi thời gian, hiện nay mô hình này đang được dùng rất nhiều để
phân tích và dự báo trong các lĩnh vực: kinh tế,tài chính, chứng khoán, giáo
dục, thời tiết, dân số,...
Nghiên cứu phân tích và dự báo chuỗi thời gian luôn là một bài toán
gây được sự chú ý của các nhà toán học, kinh tế, xã hội học,... Các quan

sát trong thực tế thường được thu thập dưới dạng chuỗi số liệu. Từ những
số liệu này, người ta có thế rút ra được những quy luật của một quá trình
được mô tả thông qua chuỗi số liệu.
Xuất phát từ thực tế ứng dụng lớn của mô hình ARIMA, em chọn đề
tài nghiên cứu về: “MÔ HÌNH ARIMA VÀ ỨNG DỤNG” làm đề tài khóa
luận của mình.
2. Mục đích nghiên cứu
-

Nghiên cún một số khái niệm và tính chất cơ bản về chuỗi thời gian;

các quá trình trung bình trượt (MA),quá trình tự hồi quy (AR), quá trình
trung bình trượt tự’ hồi quy (ARMA)và quá trình trung bình trượt, tích hợp
tự hồi quy (ARIMA).
-ứng dụng mô hình ARIMA dự báo chuỗi chỉ số VNINDEX với sự
hỗ trợ của phần mềm Eviews.

1


3. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: Mô hình ARIMA
- Phạm vi nghiên cứu: Mô hình ARIMA, phương pháp Box - Jenkins,
ứng dụng trong dự báo chỉ số VNINDEX
4.Phương pháp và công cụ nghiên cứu
- Phương pháp so sánh, phân tích, tổng hợp kiến thức.
- Phương pháp phân tích thực nghiệm với dữ liệu thực tế.
- Sử dụng phần mềm Excel, Eviews.
5.Khái


quát về nội dung và phạm vi nghiên cứu

Nội dung của khóa luận này bao gồm 2 chương:
- Chương 1. Kiến thức chuẩn bị: Chương này trình bày một số khái
niệm và kiến thức cơ bản sẽ được sử dụng trong chương sau.
- Chương 2.Mô hình ARIMA và ứng dụng: Chương này trình bày các
lớp mô hình ARIMA và thử nghiệm ứng dụng các mô hình này để dự báo
chỉ số VNINDEX.

2


CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
1.1. Biến ngẫu nhiên và quỵ luật phân phối xác suất
1.1.1. Biến ngẫu nhiên một chiều
1.1.1.1. Định nghĩa biến ngẫu nhiên
Định nghĩa 1.1: Cho (Q, F, P) là một không gian xác suất. Neu X là
một ánh xạ đo được từ Q vào K thì X được gọi là một biến ngẫu nhiên
(hoặc một đại lượng ngẫu nhiên).
Nói cách khác: X là một hàm số thực, hữu hạn, xác định trên Q sao
cho với mỗi i g ! thì ịcoe Q : X (&>)< Jt| e F.
1.1.1.2. Hàm phân phoi xác suất
Định nghĩa 1.2. Hàm phân phối xác suất của biến ngẫu nhiên X được
ký hiệu và xác định như sau: Fx (x) = P j í y : I ( í y ) < i Ị ,J í 6 M.
Như vậy hàm phân bố xác suất là sự thu hẹp của độ đo xác suất p lên
lóp các khoảng ( - 00,*) của đường thẳng thực M. Đẻ cho gọn ta sẽ ký hiệu
F(x) = P (X < x ),x e IR .
1.1.2. Biến ngẫu nhỉên hai chiều
ỉ. 1.2.1. Định nghĩa
Định nghĩa 1.3. Cho không gian xác suất (Q, F, P) và hai biến ngẫu

nhiên X và Y xác định trên nó. Khi đó hệ V = (X, Y) được gọi là một biến
ngẫu nhiên 2-chiều, tức là V là một ánh xạ từ Q vào IR2 sao cho với mỗi
Ú)GÍÌ thì V(cò) = (X{ũ)\Y{co)).
1.1.2.2. Hàm phân phổi xác suất
Định nghĩa 1.4. (Hàm phân phối đồng thời) Hàm phân phối xác suất
đồng thời của một biến ngẫu nhiên 2-chiều V = ( X , Y ) được định nghĩa
như sau:

3


F(x,);) = p [ ( x < x ) ( Y < j ) ] ,

(~co
Định nghĩa 1.5. (Các hàm phân phoi biên) Neu F(x,y) là hàm phân
phối xác suất đồng thời của biến ngẫu nhiên 2-chiều V = ( X ,Y ) thì các
hàm:
F(x,+oo) = P(X F(y,+n) = P ( Y < y ) = F2(ỵ)
là các hàm phân phối của các biến ngẫu nhiên thành phần tương ứng X và
Y. Các hàm này gọi là các hàm phân phối biên của V .
ỉ. ỉ.2.3. Sự độc lập của hai biến ngẫu nhiên
Định nghĩa 1.6. Hai biến ngẫu nhiên X và Y được gọi là độc lập với
nhau nếu:
F (x ,y) = Fỵ(x)F2(y ) ( - 00< X, J < +oo).
1.1.3. Biến ngẫu nhiên nhiều chiều
1.13.1. Định nghĩa
Định nghĩa 1.7. Cho X ], X 2,...,Xn là các biến ngẫu nhiên 1-chiều
được xác định trên không gian xác suất (Q, F, P). Nhờ các biến ngẫu nhiên

này, với mỗi ứ )eQ , ta có thể làm phép tương ứng với một điểm
X(cò) = ( X ](ú)),X2(cò),...,Xn(cò)} của không gian ơ-cơ-lít 77-chiều.
Ánh xạ Q —

lập bởi các biến ngẫu nhiên X ]9X 2,...9X n được gọi là

một biến ngẫu nhiên rc-chiều hoặc một véc-tơ ngẫu nhiên rc-chiều.
1.1.3.2. Hàm phân phối xác suất
Định nghĩa 1.8. {Hàm phân phối xác suất đồng thời) Hàm phân phối
xác suất đồng thời của biến ngẫu nhiên rc-chiều được định nghĩa như sau:
F (x,,x 2,...,x J = p [( X 1 < * ,) ( x 2 < * 2)...(x ;l < *„)] với ( - 00 < X,. < +00),
ỉ = (1,72)

4


Định nghĩa 1.9. (Các hàm phân phối biên)
• Hàm phân phối biên của một biến
Hàm phân phối xác suất của biến Xị là
/• (X,) = p [ ( x , < + x ) ( X 2 < +oo)...(Xi < +oo)...{x„ < -H»)]
= lim F(x],x2,...,xn) với ( i * j )
• Hàm phân phối biên của một số biến
Hàm phân phối biên của các biến Xị và XJ và X k
Fi.k(xi,xj ,xk)= lim F(x},x2,...,xn)
J

x r — >--C
r * i,j,k

ỉ. 1.3.3. Tính độc lập của nhiều biến ngẫu nhiên

Định nghĩa 1.10. Các biến ngẫu nhiên X ị,X 2,...,X#ỉ được gọi là độc
lập nếu tại mọi điểm (x 1,x 2,...,x/ỉ) của R" ta đều có:
F(x],x2,...,xn) = F](xị)F2(x2)...Fn(xn).
1.1.4.Một số đặc trưng ciía biến ngẫu nhiên.
1.1.4.1. Kỳ vọng
Định nghĩa 1.11. (Kỳ vọng toán của biến ngâu nhiên một chiều) Trên
không gian xác suất (Q, F, P) cho biến ngẫu nhiên X có hàm phân phối xác
suất F(x). Kỳ vọng toán của X là một số ký hiệu là E(X) và được định
nghĩa như sau:
E ( X ) = |x d F (x ) với giả thiết làj*|x|dF(X) tồn tại.
Q
Q
Định nghĩa 1.12. (Kỳ vọng toán của hàm hai biến ngâu nhiên) Neu
R = ọ ( X , Y) trong đó X và Y là hai biến ngẫu nhiên thì:
E(R) = E [ ẹ { X , Y ) \ = x z < / - ( v,.y,
' j
khi X và Y là hai biến ngẫu nhiên rời rạc và

5


J ị ọ ( x , y ) f (x,y)clxdy

+00 +00

E(R) = E\_ọ(X,Y)~\ =

— 0 0 — 00

khi X và Y là hai biến ngẫu nhiên liên tục với hàm mật độ xác suất đồng

thời là f ( x ,y )
ỉ . 1.4.2. Phương sai
Định nghĩa 1.13. Phương sai của biến ngẫu nhiên X được ký hiệu là
V(X) (hoặc var(X)- viết tắt từ tiếng Anh: variance) và được định nghĩa như
sau:

var(X) = ^ = Ơ2(X) = E[_x - £ ( x )]2 =

i

£(-*0] P(Xj)

với X rời rạc

+O0

ị [ x - E ( X ) f f ( x ) d ( x ) với X liên tục
ỉ. 1.4.3.Hiệp phương sai
Định nghĩa 1.14. Hiệp phương sai của hai biến ngẫu nhiên X và Y
được ký hiệu là cov(X,Y) và được định nghĩa như sau:
cov(X ,r) = K (X Y) = £ { [ x - £ (X )][K - E<7 )]} = n u
Z Z { [ x ,- - £ ( X ) ] [ > v - E ( Y ) ] } p .
i i
+00 +0C

Ỉ J { [ X - £(*)][.y - ^(>")]} f ( x , y)dxáy
— 00 — oc

ỉ. 1.4.4. Hệ số tương quan
Hệ số tương quan cho thông tin về mức độ chặt chẽ của mối quan hệ

tuyến tính giữa hai biến, được định nghĩa như sau:
cov(X,F)

P (X J)
Có thể chỉ ra rằng 0 < p ( X , Y ) < 1.

6


1.1.5. Một số quy luật phân phối
ỉ. 1.5.1. Quy luật phân phối chuấn
Một biến ngẫu nhiên X được gọi là tuân theo quy luật chuẩn với kỳ
vọng //,phương sai ơ 1, ký hiệu là: X ~ N(jU,ơ2) nếu nó là biến ngẫu
nhiên liên tục với hàm mật độ sau đây:
=

/7T-CXP(---- o s
ơ v 2 7t
2-(5

) với

x-

Quy luật chuẩn hóa N(0,1): Một trường hợp đặc biệt và hữu dụng
trong tính toán của họ các phân phối chuẩn là phân phối chuẩn hóa
N(0,l)(là phân phối chuẩn với kì vọng bằng 0 và phương sai bằng 1). Biến
ngẫu nhiên tuân theo quy luật chuẩn hóa thường được kí hiệu là u , hàm
phân phối của quy luật chuẩn hóa thường được kí hiệu bởi O (x ), hàm mật
độ bởi ọ{x)

ỉ. 1.5.2. Quy luật Khỉ bình phưong
Quy luật Khi bình phương (với k bậc tự do) ký hiệu là x l có quan hệ
trực tiếp với quy luật chuẩn và được xác định như sau:
X =ƯỈ + U Ỉ + . . . + U I
trong đó Ưi,U2v..,Ưk là các biến ngẫu nhiên độc lập với nhau và cùng tuân
theo quy luật chuẩn hóa, khi đó X tuân theo quy luật Khi bình phương với
k bậc tự do.
Nếu X ~ x l thì E(X) =k, var(X) = 2k.
Có thể thấy rằng biến ngẫu nhiên tuân theo quy luật Khi bình phương
chỉ nhận giá trị không âm và hàm mật độ của nó là không đối xứng.

7


1.2.

Phân tích hồi quy

1.2.1. Mô hình hồi quy tuyến tính hai biến
Giả sử X và Y là hai biến của một tổng thể nào đó, mô hình hồi quy
tuyến tính hai biến thể hiện mối quan hệ phụ thuộc giữa biến Y và biến X
có dạng như sau:
Y = P ,+ P 2X + u

(1.1)

Như vậy, mô hình hồi quy tuyến tính hai biến bao gồm các thành phần
sau:



Các biến so: mô hình hồi quy gồm hai loại biến số:
- Biến phụ thuộc: là biến số mà ta đang quan tâm đến giá trị của nó,

thường được kí hiệu là Y và nằm ở vế trái của phương trình. Biến phụ
thuộc còn được gọi là biến được giải thích (explained variable) hay biến
phản ímg.
- Biến độc lập: là biến số được cho là có tác động đến biến phụ thuộc,
thường được kí hiệu là X và nằm ở vế bên phải của phương trình. Biến độc
lập còn được gọi là biến giải thích (explanatory variable) hay biến điều
khiển (control variable).
• Sai so ngâu nhiên:
Sai số ngẫu nhiên,thường được ký hiệu là u, là yếu tố đại diện cho các
yếu tố có tác động đến biến Y, ngoài X. Trong mô hình (1.1) chúng ta
không có quan sát về nó, vì thế đôi khi u còn được gọi là sai số ngẫu nhiên
không quan sát được. Do đó, để hàm hồi quy có ý nghĩa cần đưa ra giả thiết
cho thành phần này. Giả thiết được đưa ra là: tại mỗi giá trị của X thì kỳ
vọng của u bằng 0: E ( u |jc) = 0.


Các hệ số hồi quy, bao gồm /?, và /?2, thể hiện mối quan hệ giữa X
và Y khi các yếu tố bao trùm trong u là không đổi.

8


1.2.2. Hàm hồi quy tổng thể
Với giả thiết £(w|x) = 0,ta có thể biểu diễn lại mô hình hồi quy (1.1)
dưới dạng sau:
E ( Y / X ) = ß l + ß 2X


(1.2)

trong đó E(Y/ X ) là kỳ vọng của bien Y khi biết giá trị của bien X, hay còn
gọi là kỳ vọng của Y với điều kiện X.
Phương trình (1.2) biếu diễn kỳ vọng của Y với điều kiện X như một
hàm của bien X và do X và Y thể hiện cho tổng thể nên phương trình (1.2)
còn được gọi là hàm hồi quy tổng the (PRF - population regression
function). Khi đó các hệ số hồi quy /?! và /?2còn được gọi là các tham số
của tổng thể, có ý nghĩa như sau:
Các hệ so hồi quy:
- /?, được gọi là hệ số chặn, nó chính bằng giá trị trung bình của biến
phụ thuộc Y khi biến độc lập X nhận giá trị bằng 0.
- /?2được gọi là hệ số góc, thế hiện quan hệ giữa biến độc lập và giá trị
trung bình của biến phụ thuộc: khi biến độc lập X tăng (giảm) một đơn vị
thì giá trị trung bình của biến phụ thuộc Y tăng (giảm) /?2đơn vị. Hệ số có
thể nhận giá trịdương, âm hoặc bằng 0 .
1.2.3. Hàm hồi quy mẫu
Giả sử có mẫu ngẫu nhiên kích thước n bao gồm các quan sát của biến
X và biến Y: (Yj, Xi), i=l,2,...,n. Từ mẫu ngẫu nhiên này chúng ta xây dựng
các ước lượng cho các hệ số hồi quy tổng thể Д và ß 2, ký hiệu là
ß ] và ß 2 tương ứng. Khi đó biếu diễn dưới đây gọi là hàm hồi quy mẫu
cho hàm hồi quy tổng thể ( 1. 1):
Y = ß , + ß 2X.

9

(1.3)


(1.3)’

Ký hiệu mũ trên đầu ngụ ý rằng đây là giá trị ước lượng từ mẫu chứ
không phải giá trị của tổng thể. Cụ thể hơn:
-yỗp /^ctirợc gọi là hệ số hồi quy mẫu hay hệ số ước lượng, là ước
lượng của các hệ số tổng thể Px, /?2tương ứng.
- Yi được tính như trong (1.3)’ là giá trị ước lượng cho giá trị Y khi
X=Xj.
1.2.4.Phương pháp ưóc lượng OLS
Phương pháp ước lượng OLS lần đầu tiên được giới thiệu bởi Gauss
vào những năm cuối thế kỷ 18 (Haper (1974-1976)) và được sử dụng rộng
rãi trong nhiều lĩnh vực. Tuy trong phân tích kinh tế lượng nói chung và
phân tích hồi quy nói riêng, người ta đã phát triển thêm các phương pháp
ước lượng mới, nhưng OLS vẫn là một phương pháp thông dụng do các iru
việt của nó. Ngoài ra, ước lượng thu được tù’ OLS thường được chon làm
cơ sở khi đánh giá chất lượng của ước lượng thu được từ các phương pháp
khác.
Đe tìm hiểu phương pháp OLS, ta xét mô hình hồi quy tổng thể:
Y = /?! + P2X +u và ta cần ước lượng các hệ số /?!, /?2 •
Giả sử có mẫu ngẫu nhiên có kích thước n {(Yj,

X i),

i=l,2,...,n} thu

được từ tổng thể, khi đó tại mỗi quan sát ta có:
(1.4)
Ký hiệu /?,, P 2 là các ước lượng cân tìm của /?ị, P2 với thông tin từ
mẫu trên, khi đó ta có thể viết thành hàm hồi quy mẫu như sau:
Y , = p i + p i X,.

10


(1.5)


Gọi sai lệch giữa các giá trị thực tế Yj và giá trị ước lượng tương ứng
từ hàm hồi quy mẫu Ỷi là phần dư (residuals), ký hiệu bởi eji
e^Y t-Ỹ i

( 1.6 )

Chúng ta muốn xác định các giá trị /?,, P 2 sao cho sai lệch tổng họp
giữa các giá trị thực tế Yj và các giá trị ước lượng tương ứng từ hàm hồi
quy mẫu (1.4) là nhỏ nhất có thể được. Sai lệch này có thể được định nghĩa
bởi:
n

(1)Tổng các phần dư
/=1
n

(2 ) Tổng các giá trị tuyệt đối của phần dư ^ \ e . \
i=\

n

(3)Tổng bình phương các phần dư ^ e 2
i=1
Trong phạm vi khóa luận này chúng ta sẽ sử dụng phần mem Eviews
để hỗ trợ cho việc xác định các ước lượng OLS.
1.3.GỈỚÌ thiệu về chuỗi thòi gian và toán tử trễ

1.3.1. Chuỗi thời gian
Chuỗi thời gian là dãy các quan sát về một biến số nào đó theo thời
gian. Thường việc thu thập số liệu bắt đầu ở một thời điểm nhất định,
chẳng hạn t=l và kết thúc ở một thời điểm khác t=n:(Y\,Y2,...,Yn)
Có thể tìm được các quan sát (...Y_2 ,Y_],Y0) hoặc các quan sát sau thứ
tự n (K„+1,K„+2,...)
-

Mầu quan sát được có thể được coi như một đoạn hữu hạn của một

chuỗi v Ô h ạ n { y ; } l = ( ...,ỵ ]>F()^ , F 2>. . . , ^ , ^ +l>F„+2...)
'---- '
M a u q u a n sát

Chẳng hạn:

11


Yt = pt là giá một loại /cổ phiếu ở thời điểm t;
Yt = t biến xu thế
Yt = с các thành phần của chuỗi là một hằng số
-Toán tử nhân: Yt = ß X t
-Toán tử cộng: Yt = X t + Wr
1.3.2. Toán tử trễ
Giả sử có chuỗi {X,}!^ bây giờ ta tạo ra chuỗi mới {Yt }* , Yt = X t_x.
Ký hiệu Yt = LXt = X t_ị. L được gọi là toán tử trễ.
L(LX,) = L ( X t_]) = X t_2.
Áp dụng hai lần toán tử trễ ký hiệu là L2,L2X, = X


t_2

Tổng quát, к là một số nguyên bất kỳ, LkX t = X t_k
L ( ß X t) = ß ( L X t) = ß X l_];
Ц Х ' + Щ ) = Х'_]+Щ_];
Yf = (а + bL)LXt = aLXt + bL2X t = aXM + bXt_2
(1 - ị L ) ( 1- ^ L ) X t = (1 - ^ L - ^ L + Ả,Ấ1L2) X t
= ( \ - { Ằ , + Ấ 1)L + ị Ấ 1I } ) X t
= X t - (Л| + Ẩ2)XM + ẲiẲ2X t_2
Một biểu diễn khác (aL+bL2) được xem như là đa thức đối với toán từ
L. v ề mặt đại số, nó tương tự như đathức (az+bz2), z làmột vô hướng.
Nếu như: {X,}!^ ={с}!^ thì:

LXt = X t_x =c; (a + ß L + e ũ ) c = {a + ß + 6)c.
1.4.Quá trình ngẫu nhỉên dừng và không dừng
Xét họ các biến ngẫu nhiên Yi, Y 2,... trong đó các chỉsố là các thời
điểm kế tiếp nhau. Nói chung mỗi biến có một quy luật phân bố xác suất
riêng. Họ Y 1

được gọi là quá trình ngẫu nhiên. Giả sử rằng đối với

12


mỗi thời điểm, biến số tương ứng nhận một giá trị cụ thể. Khi đó ta có một
chuỗi thời gian. Mặc dù chuỗi thời gian chỉ là một phép thử của một quá
trình ngẫu nhiên, nhưng chúng ta cũng gọi chuỗi thời gian là một quá trình
ngẫu nhiên, ký hiệu là {Yt với t = 1, 2 ,...}
E(Yt), Var(Yt) là kỳ vọng và phương sai của Yt, có thể Cov(Yi, Yj) ^
0. Nói chung đối với mỗi Yt thì kỳ vọng, phương sai và hiệp phương sai là

không giống nhau.
Chuỗi Yt được gọi là dừng nếu kì vọng, phương sai, hiệp phương sai
không đổi theo thời gian (Engle và Granger, 1987), nghĩa là:
E(Y,) = ju,\/t

(1.7)

Var (Yt) = E(Yt - j u ) 2 = ơ 2,Vt

(1.8)

ỵk = C o v i X M = E[(Yt - ụ)(Yt-k - //)], Vt

(1.9)

Chuỗi Yt được gọi là chuỗi không dừng nếu nó vi phạm bất kì điều
kiện nào nói ở trên.
p k = — chính là hệ số tương quan Yt và Yt_k.
ĩo
Các p k là một hàm phụ thuộc vào độ dài của trễ, hàm này được gọi là
hàm tự tương quan AFC,

AcF(k)=ptk =czVar(Fr)
(Y::Y'-t)
Điều kiện thứ ba trong định nghĩa chuỗi dừng có nghĩa là hiệp phương
sai, do đó hệ số tương quan giữa Yt và Yt+k chỉ phụ thuộc vào độ dài (k) về
thời gian giữa t và t+k, không phụ thuộc vàothời điểm t.Chẳng hạn:
Cov(Yt, Yt+5) không đổi thìCov(Y7, Y12) = Cov(Y15, Y20) = Cov(Y30, Y35)
= ... = Cov(Y,, Yí+6)không đổi. NhungCov(Yt, Yt+5) có thể khác với
Cov(Y„ Y,+6)


13


1.5. Hàm tự tương quan và hàm tự tương quan riêng
1.5.1. Hàm tự tương quan
Ở mục 1.4 đã nhắc đến hàm tự tương quan, sau đây sẽ trình bày khái
niệm một cách đầy đủ hơn.
“Tự tương quan” được hiểu như là sự tương quan giữa các thành phần
của dãy số thời gian hoặc không gian.
Trong mô hình hồi quy tuyến tính cố điên, ta giả định rằng không có
tương quan giữa các sai số ngẫu nhiên Ujĩighĩa là:

Cov(un iij) = 0 (/ ^ j )
Nói một cách khác, mô hình cổ điển giả định rằng sai số ứng với quan
sát nào đó không bị ảnh hưởng bởi sai số ứng với quan sát khác.
Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà sai số của các
quan sát lại phụ thuộc nhau, nghĩa là:
Cov(Uị,Uj)

0 (/ ^ j )

khi đó xảy ra hiện tượng tự tương quan.
Hàm tụ’ tương quan (ACF) với độ trễ k, kí hiệu bằng pk, được xác
định như sau:
A C F {k )= P t= £ 2 ^ 1
k
Var(Yt)
1.5.2. Hàm tự tương quan riêng
Hàm tự tương quan riêng (PACF) ký hiệu là pkk. Trong khi ACF pk,

k = 1,2,..., là hệ số tương quan không điều kiện giữa Yt và Y
tính đến ảnh hưởng của các quan hệ trung gian Yt.ị, Yt_2,
hệ số tương quan có điều kiện.
p ti =Coư(Y„Y,_k 1 ^ , , ^ , . . . , ^ , ) , k= l,2,...

14

t-k,

nó không
thì pkk là


l.ó.Nhiễu trắng và bước ngẫu nhiên
1.6.1. Nhiễu trắng
Quá trình [ut}T=-oo được gọi là nhiễu trắng nếu thành phần của chuỗi
có kì vọng bằng 0 , phương sai không đổi và không tự tương quan, tức là:
£(wt) = 0 ,Ví

( 1. 10)

Vai(ut) = ơ2y t

(1.11)

Cov(ut j U t+ ầ )

=

(1.12)


0,5 ^ 0, V í

Đôi khi điều kiện (1.12) được thay thế bằng điều kiện mạnh hơn:

ut, UT độc lập với nhau, với t

T.

(1-13)

Quá trình thỏa mãn (1.10), (1.11) và (1.13) được gọi là nhiễu trắng
độc lập. Neu các điều kiện (1.10), (1.11) và (1.13) được thỏa mãn và
ut ~ N(0, ơ2) thì quá trình ngẫu nhiên được gọi là nhiễu trắng Gauss.
Chú ý rằng từ (1.13) suy ra (1.12), điều ngược lại sẽ không đúng.
Nhiễu trắng là một chuỗi dừng.
1.6.2.Bước ngẫu nhiên
Neu Yt = yj_1 + ut , trong đó ut là nhiễu trắng, thì Yt được gọi là bước
ngẫu nhiên
E(Yt) =

+ E(ut) = E(Yt_,)

(1.14)

Điều này có nghĩa là kỳ vọng của Yt không đổi.
Ta hãy xem phương sai của Yt:
Yx =Y0 + Uị
Y2 = Yị


u2 = Yq

Yt — Yq +

Mị

u2

+ u2.. •

15

ut


Do Y0 là hằng số, các ut không tương quan với nhau, có phương sai
không đổi ơ 2, nên:
Vai(Yt) = t a 2,

(1.15)

Điều trên chứng tỏ Yt là chuỗi không dừng.
YY.
Y t-t-1
t t- 1 — Yí-1
t-1
1 -\-Y.
' t-\u t
Cov(Yt,Yt_ị) = Cov(Yt_i,Yt_i) + 0 = (t + ì)cr2
Cov(Yn Yt_k) = (t + k)<72

AFC(k) = p k =(t - k ) / 1 với mọi k

(1.16)

Sai phân bậc nhất của Yt: AYt =Yt - Y t_ị = ut . Trong trường hợp này
AYt là chuỗi dừng. Dùng toán tử trễ L, ta có AYt = (1 - L)Yt
Neu đưa thêm vào mô hình bước ngẫu nhiên một hằng số, thì Ytđược
gọi là bước ngẫu nhiên có bụi (random walk with drift).
Yt —OL+ Yt_\ + ut
Yt = a + ut hay (1 - L)Yt = a + ut
E(Yt) = Y0 + at ; Var(Ff) = t ơ

(1.17)

16


CHƯƠNG 2. MÔ HÌNH ARIMAVÀ ÚNG DỤNG
2.1. Mô hình ARIMA
2.1.1. Quá trình trung bình trượt (MA)
Yt là quá trình trung bình trượt bậc q, nếu Yt có dạng:
Yf —ỊẤ + ut + 0]Ut_I + ... + OqU-Ị-q11= 1, 2, ... ,n

(2.1)

trong đó: utlà nhiễu trắng.
Hay (Yt -ịu) = {\+ 6xL + ... + 6qLq)ut
Hiểnnhiên: E(Yt) = JU
Cov(Yn Yt_k) = E((jU + ut + <9,WM + ... + 6qut_q){ju + ut_k +
+<91wf_ít_1... + ỡqut_k_q))

= E(0kut_k + ớ|ớẢ:+1wf_Ấ:_1 + ỡ2ỡk+2Ut _ k _ 2 + ... + Ỡqỡq_kut_q)
= ( 6Ịt + Ớ,ỚA
.+I + 626k+2 + ... + 6q9q_k) ơ 2
q-k

ớ'ớ'+<’ nếu k - CI
- Cov(Yn Yt_k) = ơ2Z
/=0
0,

(2 .2 )

nếu k > q

ớ0 =1
Với bất kỳ các giá trị của (01; 02, ..., 0q) thì các MA(q) đều là các quá
trình dừng. Điều kiện (1.12) được thỏa mãn.
Quá trình MA(q) là khả nghịch khi -1 < 0 < 1, hay tất cả các nghiệm
của phương trình đặc trung:
1+ ỡịZ + 02z} +. . . + 0qz q = 0
đều nằm trong vòng tròn đơn vị. Khi đó tồn tại toán tử:
y/(L) = (1 + Ớ,L + ... + 0qư y l để U' = iỵ(L)(Yt - /LÌ).
2.1.2. Qiiá trình tự hồi quy (AR - Autoregressive Process)
Quá trình tự hồi quy bậc p có dạng:

17


X -

(2.3)

Ký hiệu: ^(L) = 1- ựỉịL - ợJ2L2 - . . . - ệpư
Ta có: (L)ỉ^ =

+ ut

(2.4)

Điều kiện để quá trình AR(p) hội tụ là -1 < ậ. < 1, i = 1,2, .. .p.
Phương trình đặc trưng đối với AR(p): 1 - ộxz - Ộ2Z2 - . . . - ộpzp = 0,
có thể viết lại: (1 - a }z )(1 - OínZ).. .(1 - ccpz) = 0 .
Với phương trình trên điều kiện dừng tương đương với điều kiện tất cả
các nghiệm«;, i — 1,2 ,...,p đều nằm trong vòng tròn đơn vị.
E(Y,) = M = ^ l ( \ - ệ l - ệ 2- . . . - ệ p)
AFC(k) = ỵk = E((Y, - ju)(Y,_t - /u))
Y, - ụ. = ệị(y,_| - ị ỳ + ệsy,-! - ụ ) + ... + ệp{Y,_p - ụ ) + u,
Nhân hai vế (Yj - n) với (Y,.k - n), sau đó lấy kì vọng ta được phương
trình Yule-Walker:
\<hỵ,-x + ệiỴ,-i +--- + ệpĩ,-p>

Yk = 1[ ệ1ì ĩ ,-1 + ệÁi Y , - 2 + •••+ ệAp ĩ , - p

+ ơ

k=l,2,.„

2 I _í\
, k=0


Pt =
(2-5)
(2.6)

2.1.3. Quá trình trung bình trượt tự hồi quy ARMA
Cơ chế sản sinh ra Y không chỉ là AR hoặc MA mà có thể kết họp cả
hai yếu tố này. Khi kết hợp cả hai yếu tố, mô hình được gọi là mô hình
trung bình trượt tích họp tự hồi quy ARMA. Yt là quá trình ARMA(1,1)
nếu Y có thể biểu diễn dưới dạng:
Yt - 6 + ộ ỵ t_x+ ỡ0ut + 6xỉit_x
trong đó: ut là nhiễu trắng.
Tổng quát, Yt là quá trình ARMA(p,q) nếu Y có biểu diễn dưới dạng:
Yt - 6 + ộ

+... + ệpYt_p + 0ữut + ớịM,_j + 6clut_cl

18

(2.7)


×