Tải bản đầy đủ (.pdf) (64 trang)

Khai thác dữ liệu quan hệ trong tài chính bằng mô hình arima (Khóa luận tốt nghiệp)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.73 MB, 64 trang )

CHUYÊN NGÀNH: KINH T

, THÁNG 5 N M 2016


RIMA

ThS.

, THÁNG 5 N M 2016


L
tài do chúng tôi Tr
Trung Phú th c hi
M i s li u thu th p

is

c và Nguy n

ng d n c a Th

n Anh.

c và k t qu c a bài khóa lu

c công b

b t c công trình nghiên c u nào khác.
Chúng tôi xin ch u trách nhi m v nghiên c u c a mình.



TP. H Chí Minh, ngày 04 tháng 5
Sinh viên th c hi n
Nguy n Trung Phú
Tr

c


L IC
L

c bày t l i c

trong khoa Toán - ng d

c nh

i h

n t t c các th y cô
c bi t là Th y

n Anh và Th

nh

Th.S
ng d n


chúng em trong su t quá trình th c hi n khoá lu n t t nghi p.
il ic

n quý th

cho chúng em trong su t nh

t gi ng d y

cv

i th c

hi n bài khoá lu n này, v i nh ng ki n th c b ích y s là hành trang giúp em
v
Cu

c c

c, các b n trong l p

DTU1121, là nh

t qua nh ng khó
ch

hoàn thành bài khoá lu n này.

V i ki n th c còn h n ch


u, bài khóa lu n

khó có th tránh kh i nh ng thi u xót, kính mong quý th y cô góp ý nh
có th hoàn thi n bài khóa lu n này t

em

a.

TP. H Chí Minh, ngày 04 tháng 5
Sinh viên th c hi n
Nguy n Trung Phú
Tr

c


M CL C
L

i

L IC

............ii

M CL

iii


DANH M C CÁC T

VI T T

..v

DANH M C CÁC B NG

..vii

DANH M

..viii

DANH M

...x

L IM

i

LÝ THUY T VÀ MÔ HÌNH ARIMA.........................1
1.1. BÀI TOÁN D BÁO
1.2. D LI U CHU I TH I GIAN
1.2.1. Khái ni m chu i th i gian th c
1.2.2. Thành ph n xu h

ng dài h n


1.2.3. Thành ph n mùa
1.2.4. Thành ph n chu k

1.2.5. Thành ph n b

ng

1.3. MÔ HÌNH ARIMA
1.3.1. Hàm t
1.3.2. Hàm t
1.3.3. Mô hình AR(p)
1.3.4. Mô hình MA(q)
1.3.5. Sai phân I(d)
1.3.6. Mô hình ARIMA

ng ph n PACF


c phát tri n mô hình ARIMA
1.4. PH N M M NG D NG EVIEWS
1.4.1. Gi i thi u Eviews
nh mô hình
ng mô hình
1.4.2.3. Ki

phù h p và d báo

2: TH C TR NG C A V

NGHIÊN C U ....................31


3.1. D LI U TÀI CHÍNH
3.2.

M C A CHU I D

LI U

C NGHI M........................................................................34
ng th c nghi m
3.3. Ki m tra tính d ng c a chu i ch ng khoán PVD
3.4. Nh n d ng mô hình
3.5.

ng và ki

nh v i mô hình ARIMA

3.6. Th c hi n d báo

K T LU N .........................................................................................................46
TÀI LI U THAM KH O.................................................................................47
PH

L C............................................................................................................48


DANH M C CÁC T

VI T T T


CTCP

: Công ty C ph n

CK

: Ch ng Khoán

T

: Thành ph

S

: Thành ph n mùa (Seasional Component)

C

: Thành ph n chu k (Cyclical Component)

I

: Thành ph n b

ACF

: Hàm t

SACF


: Hàm t

PACF

: Hàm t

ng ph n (Partial Autocorrelation Function)

SPACF

: Hàm t

ng ph n

AR(p)

: T h i quy b c p

I(d)

: Tích h p b c d

MA(q)

ng dài h n (Long term Trend Component)

ng (Irregular Component)
unction)
u


tb cq

ARMA

: T h i quy

t

ARIMA

: T h i quy Tích h p

t

IARMA

: Tích h p

t

AIC

: Tiêu chu n Akaike

BIC

: Tiêu chu n Schwarz

T h i quy



MAE

: Trung bình sai s tuy

ESS

:T

i

MSE
RMSE
MAPE

b
: Trung bình ph

ch


DANH M C CÁC B NG
TT

Tên b ng

Trang

nh b c p, q c a mô hình ARMA


26

1

B ng 1.

2

B ng 2. Th ng kê mô t

33

3

B ng 3. Tiêu chu

42

4

B ng 4.

t qu d báo

45


DANH M C CÁC HÌNH
TT


Tên hình
as

Trang

1

Hình 1.

ng

n 1950 - 1960

2

Hình 2. Thành ph n mùa

6

3

Hình 3. Thành ph n chu k

7

4

Hình 4. Màn hình chính Eviews 8.0


18

5

Hình 5. Thao tác t o Workfile

19

6

Hình 6. L a ch n lo i d li u trong Workfile

19

7

Hình 7.

20

8

Hình 8. C a s Open trong Eviews

21

9

Hình 9. C a s Excel Read


21

10

Hình 10. C a s Excel Read

c2

22

11

Hình 11. C a s Excel Read

c3

22

12

Hình 12. D li

13

Hình 13.

14

Hình 14. Bi


15

Hình 15.

16

Hình 16. K t qu

17

Hình 17. C a s d

18

Hình 18. Bi

ng c a chu i d li u

32

19

Hình 19. Bi

a c phi u PVD

34

20


Hình 20. Ch n d = 0 và 11

21

Hình 21. Bi

22

Hình 22. Ki

23

Hình 23. D li u chu

24

Hình 24. Bi

25

Hình 25. Ki

26

Hình 26. Bi

m c a s Open

c1


a c phi u PVD

th

a

ng mô hình trong c a s Equation Estimation

25
27

ng mô hình

27

a

29

tr

35
a c phi u PVD

35

chu

36


a sai phân b c 1

36

a sai phân b c 1
nh nghi

23
23

a

nh nghi

5

chu i sai phân b c 1
a sai phân b c 1

37
37
38


27

Hình 27

28


Hình 28. K t qu

29

Hình 29. Ki m tra tính nhi u tr ng c a ph

40

30

Hình 30.

ng mô hình ARIMA(1,1,2)

41

31

ng mô hình ARIMA(1,2,1)

41

32

ng mô hình ARIMA(1,2,3)

42

33


ng mô hình ARIMA(1,1,1)
c

ng mô hình ARIMA(1,1,1)

is

ng c a d li u quan sát

ng d li u quan sát

39
39

43

34

Hình 34.

43

35

Hình 35. D báo mô hình ARIMA(1,1,1)

44

36


Hình 36. K t qu d báo mô hình ARIMA(1,1,1)

44


DANH M
TT

Trang

1

Jenkin

16

2

Jenkin tóm t t

16


L IM
1. Lý do ch

U

tài


V i tình hình kinh t

n trên th gi i và tình tr ng n n kinh t

c g p nhi

thách do ti n t i quá trình h i nh

qu c t và khu v
ng s

ng

ng ch ng khoán và th

u ch

ng nh ng r i ro r t l

n nay h

i gian t cu

s ch ng khoán gi m liên t

s

ng b

r t nhi

c nhi

ng b t

ng

báo tài chính

i quan tâm trong b i c nh phát tri n kinh t xã h i. B i

ng ch

i nhi u kinh nghi m và hi u bi t t các

t khai phá d li
trình chuyên d ng nh m d báo s

c áp d ng t các ph n m
ng c a th

ng là m t g

d a trên n n t ng d li

ra quy

nh trong

giao d ch.
2. M


u

Mô hình ARIMA là m t trong nh ng ng d
nh n d

ng tham s , ki

trên các tham s

c xây d ng v i ch
nh d li

t qu d a

c l a ch n m t cách t

Tìm hi

c phát tri n

cm ts

n

-Jenkin), n m
c thi hành mô hình ARIMA b ng Eviews 8.0

và áp d ng vào bài toán khai phá d li u chu i th i gian trong d báo tài chính,
ch ng khoán.

3. N i dung nghiên c u
Trong khóa lu n này, chúng tôi t p trung nghiên c u
mô hình ARIMA và áp d
i s h tr c a ph n m m Eviews 8.0.

c phát tri n c a

ti n hành d báo tài chính, ch ng


u
cs d
nh

tài:

ng

ng h p

5. T ng quan v

tài

V i n i dung trình bày g m nh ng khái ni

n v mô hình ARIMA cho

chu i d li u th i gian th c và cách áp d ng vào bài toán th c t (d báo s dao
ng c a th


ng ch ng khoán). B c c bài khóa lu
LÝ THUY T VÀ MÔ HÌNH ARIMA
C TR NG C A V
3.

M

NGHIÊN C U


:

LÝ THUY T VÀ MÔ HÌNH ARIMA
c

n lý thuy

n v chu i th

s lý thuy t và các y u t
t

ng ph n PACF, mô hình t h i quy AR(p), mô hình trung bình
t MA(q), sai phân I(d). Gi i thi
-

c phát tri n c a mô hình ARIMA

c v ph n m m Eviews 8.0 và m t s thao tác


n ph c v cho bài toán d báo tài chính.
1.1. Bài toán d báo

Cùng v i s phát tri n không ng ng c a khoa h c k thu
s ng, kinh t - xã h i trong nhi u th p k qua c

i
n b không

i vi c ng d ng các s n ph m trí tu

i s ng

i ngày càng quen thu c. M t trong nh ng hành vi h u ích cho n n
kinh t - xã h

c nhà qua nhi

c a t ng th

s li u

ng d ng vào quá trình phân tích và nghiên c u th

ng. T

ph

nh m c c a các th i k trong th i


gian t i s ngày càng hoàn thi

i cho r

n

ch a nh ng giá tr nh
ta ch s d ng m

i
ng nh trong kho d li

ph i làm gì v

t

n ti p t c ghi nh n, thu th p vì trong

m

n có ích khi ta c
ng c

n. M t khác, trong môi

i ta ngày càng c n có nhi u thông tin v i t

tr giúp vi c ra quy


nh và ngày càng có nhi u câu h i mang tính ch

c n ph i tr l i d a trên m t kh

ng d li u kh ng l

n tr
c th c t . T
m

còn l

i nh ng lý do

d li u truy n th ng ngày
phát tri n m

thu t phát hi n tri th c và khai phá d

Discovery and Data Mining).

nh tính

ng k thu t
li u (KDD

Knowledge


K thu t phát hi n tri th c và khai phá d li

d ng trong nhi

c khác nhau

c nghiên c u, ng

c trên th gi i, t i Vi t Nam k thu t

i còn m i m

c nghiên c u và d

ng

c bi

u nh

i th i gian phát tri n h t s c

ng. S phát tri n này liên quan ch t ch
th c hi

n cách th c mà kinh t
c các nhà kinh t

kinh t

ng th c
ng, các nhà


tài chính, các nhà ch

c bi t quan

o ra m t cu c cách m ng trong mô hình hóa các quan h cân b ng,
ng.
D báo là m t nhu c u không th thi u cho nh ng ho

ng c

i

trong b i c nh bùng n thông tin trong n n kinh t h i nh p. D báo s cung c p
nh

c n thi t cho các ho

d báo thì nh ng d
ph

nh, và có th nói r ng n u không có khoa h c

n

i v ch ra s không có s thuy t

.
Trong công tác phân tích d báo, v


n mb tt

quan tr

uc

c d báo. Thông tin

c th g m : (1) các s li u quá kh c
hi n tr

ng thái phát tri n c
nh t các nhân t
vào n

báo thành hai lo

ng c v

t ra là vi c
hi u m t cách

c d báo, (2) di n bi n tình hình
cd
ng l

t
nh tính.

a d báo,


i ta chia d
ng.

ng ph thu c r t nhi u vào kinh nghi m c a m t hay nhi u
c áp d ng, k t


qu d báo s

c liên quan nh

t lu n cu i.
ng s d ng nh ng d li u quá kh theo th i gian, d a
trên d li u l ch s

phát hi n chi

m t mô hình toán h
ng. Ti p c

ng v

ng c

ng phù h p v i

ng th i s d
ng d a trên gi


báo s ph thu c vào xu th v

c

nh r ng giá tr

a bi n s d

ng c

d báo theo chu i th i gian là m

ng.

i th i gian s d a trên vi c phân tích chu i quan sát c a m t
bi n duy nh t theo bi n s
s gi nguyên chi

c l p là th i gian. Gi

ng phát tri

nh ch y u là bi n s d báo

y ra trong quá kh và hi n t i.

Khóa lu n t p trung nghiên c
ch

th c hi n phân tích d li u


ng t i vi c d báo ch

ng

liên k t, t h i quy ARIMA (AutoRegressive Integrate Moving Average) do G. P.
xu

ra m t trang m i trong các công

c d báo, d a trên mô hình t h
ARIMA là mô hình d

ng MA.
ng theo th i gian, giá tr

d báo s ph thu c vào xu th v

ng c

a bi n s
. Mô hình

a các d li
n nh n d
quan sát và ki m tra các tham s

ng các tham s t d li u
cl


tìm ra mô hình thích h p. Mô hình

k t qu c a quá trình trên g m các tham s th hi n m
c ch
d

d báo giá tr
a sai s d báo.

ih

li u,
tin c y c a d

c tính


1.2. D li u chu i th i gian
Chu i th i gian trong th ng kê, x lý tín hi u, kinh t
m t chu

m d li

ng và toán tài chính là

ng kho ng kh c th i gian li n nhau theo

m t t n su t th i gian th ng nh t.
Phân tích chu i th i gian s nghiên c u hành vi, khuôn m u trong quá kh c a
m t bi n s và s d ng nh


d báo nh

lai, bao g
xu

phân tích d li u chu i th
c các thu c tính th

D

m c a d li u.

i th i gian là vi c s d

gian d a vào các s ki

t

d

t trong quá kh

ki n th i

t

m d li u

c khi nó x y ra.

1.2.1. Khái ni m chu i th i gian th c
Chu i th i gian th c (chu i th i gian) là t p h p c a m t bi n s
theo trình t th
li u th

c quan sát

n s theo th i gian có 2 lo i: s li u th i k và s

m.

Chu i th i gian c a bi
th

c ký hi u là

, v i Yt là giá tr c a bi n Y t i
n th

Trên lý thuy t, chu i th i gian có th là liên t c, các bi n s kinh t - xã h i v n
ng liên t c theo th i gian, do v

c xây d ng t ng quát cho bi n

liên t c. Tuy nhiên, trong th ng kê và th c t , không có s li u liên t c mà ch có
k t qu thông tin t i cu i các th i k
Ví d 1. M

nh ho c các th


ng v n c a Vietcombank

nh.

chi nhánh Qu n 5 t

Các thành ph n c a d li u chu i th i gian [1,trang 81]
Các nhà th

ng chia chu i theo th i gian thành 4 thành ph n:


Thành ph

ng dài h n (Long term Trend Component) - T

Thành ph n mùa (Seasional Component) - S
Thành ph n chu k (Cyclical Component) - C
Thành ph n b

ng (Irregular Component)

1.2.2. Thành ph n xu h

ng dài h n

Là thành ph n th hi n khuynh
h n, chu

I


ng bi

m, bi

ng c a m t bi

ng hay suy thoái trong kho ng th i gian

dài.[3, trang 436]
Ví d 2. T
1950T

ng c a v s

ng c a m t s n ph

tính là tri u).
c a Vi

ng gi m.

as

n 1950 - 1960


1.2.3. Thành ph n mùa

Th hi n s


ng c a các th
n

m, th i k nh

ng r t ng n c a m t bi

.[3, trang

436]

Ví d 3. Nhu c u tiêu th

m vào

mùa khô.
ng tiêu th bánh k o s
ng tiêu th ch

p l , t t.

ts

m vào mùa hè.

Hình 2. Thành ph n mùa
1.2.4. Thành ph n chu k
Th hi n s bi


ng c a m t bi

n h n ho c dài h

n này các giá tr c a chu i th i gian ph
[3, trang 436]
Ví d 4.

ng dòng ch

n h Tr An t

n 1985

c quan sát nhi u


Hình 3. Thành ph n chu k

1.2.5. Thành ph n b

ng

Thành ph

ch s

th i gian. S

ib


i này không th d

ng c a các giá tr trong chu i
ng các s li u kinh nghi m trong

quá kh , v m t b n ch t thành ph n này không có tính chu k .
1.3. Mô hình ARIMA
Trong mô hình ARIMA, hàm t
(PACF) là nh

ng không th thi u

chu i th i gian bên

c

ng khác là trung bình và

1.3.1. Hàm t
Hàm t

t

quan gi a giá tr c a chu i t
tr b c k c a nó là

ik

a


.

Hàm t

tr th

=

ACF(k) =

là chu i th i gian

th

c kí hi u b i ACF(k) ho c

=

mt

.




là chu i th i gian

th


m t+k

là giá tr trung bình c a chu i

Cov(

) là hi

a

Trong th c t , chu i th i gian
có các hàm t



.

là không bi
c ti p. Chu i s li u quan sát ch là m t m u c a

chu i th i gian t

ng các công th c tính hàm t

trong m u:
k

u SACF (k ) =

Hàm t


k
0

V i

k

=

;

0

=

Do SACF là hàm tính trong m u, không hoàn toàn gi ng ACF c a t ng th , nên
giá tr có th có sai l ch, tuy nhiên khi s
nhi

mang

c tính c a t ng th .
ki

nh s b ng 0 c a nhi u giá tr hàm ACF, t

th s d ng ki

nh Q, c th


:

=0

=

n ACF(k) có

0(
Th ng kê Q(k) = n

, n u Q(k) >

[3, trang 461, 476, 479]

thì bác b

t c là có t n t i


1.3.2. Hàm t

ng ph n PACF

Hàm t
m

ng ph n (Partial Autocorrelation Function)


t

a



hi u b i PACF(k) hay

khi t t c các giá tr

c kí

c tính b i công th c:
k 1
k

PACF ( k )

k 1, j

k j

k 1, j

j

j 1
k 1

kk


1
j 1

v i

k,j

k 1, j

kk

k 1, j

Bên c nh hàm t

u, hàm t

c tính, kí hi u là SPACF(k) hay

ng ph n c a m

.
k 1
k

k 1, j

k j


k 1, j

j

j 1
k 1

kk

1
j 1

V

nm

c bi t là Eviews thì các giá tr SACF(k),

SPACF(k), th ng kê Q(k) và P-

ng c a ki

toán c th , t

c tính

s khác 0 c a các hàm t

ng


th i tính d ng c a chu i. [3, trang 462, 476]
T p h p t t c giá tr c a hàm t
t ng ph n PACF(k) theo các b

ng quan
c th hi

id

th

,d

cg i
c tính

d ng c a chu i th i gian, c th
Trong ph n m
l

t c t 1 là
ng

gi a là b

c a chu i
th c a c a giá tr SACF(k), k
ng g

c cho theo th t

th c a SPACF(k) v i

ng t i h n

1.96/

;n u


ng g
c t còn l i l

t thì có th nói

0. Các giá tr trong các

t là giá tr c a SACF(k), SPACF(k), th ng kê Q và P-value.

N

có giá tr

t

qua ngoài giá tr t i h n) v i k=1,2. T

i 2 b c này,

còn v i nh ng b c k = 3 tr v sau thì ACF và PACF có th cho là b
có th nói là chu i d ng.


i v i chu i th i gian không d

th n m ra phía ngoài bên ph

u

ng t i h n v i t t c các b c và

SACF(k) gi m ch m.
1.3.3. Mô hình AR(p)
Chu i th

c g i là nhi u tr ng (white noise) n u chu i có trung bình

b

ng 0 v i m i kho ng cách th i

gian. Kí hi u chu i nhi u tr ng là

E ut

, thì

th a mãn:
2

o;Var ut


; Cov ut ; ut

k

t, k

0

Chu i t h i quy b c p, kí hi u là AR(p) là chu i có giá tr ph thu c vào các
giá tr trong quá kh

n p th i k hay nói cách khác là h i quy d a trên nh ng s

li u trong quá kh

ng:
=

là d li u
,
,

th

+

+

+


m hi n t i

là d li u trong quá kh
,

là các tham s phân tích h i quy

là nhi u tr ng
ng h p chu i AR(1), khi giá tr h s

1 thì chu i s d ng.


ng h p t ng quát AR(p) chu i d ng khi
Chu i AR(1) :
t
= (1-

=
=

+
/( 1-

)+

+

1


+
) thì chu

c vi t l

hay

=

)+

y chênh l ch gi a Y và

kì này ph thu c vào chênh

l ch gi a Y và
ng h p t ng quát AR(p)
=
t

+
=

+
/ (1-

+
-

=


-

-

) thì

)+

)+

y s chênh l ch c a Y ra kh i giá tr
chênh l ch c
k

c;

kì này ph thu c tr c ti p vào

c coi là cân b ng dài h n c a chu i, khi các th i

c Y không l ch kh i

không l ch kh i

t tr ng

thái cân b ng dài h n. [3, trang 466, 472-473]
1.3.4. Mô hình MA(q)
Chu


t b c q, ký hi u là MA(q) là chu i có giá tr ph thu c vào

nhi u tr ng cùng k và nhi u tr ng c a p th i k
=

+

là k v ng c a
,
,

+

c

+

c gi s là b ng 0)
là các nhi u tr ng

là các h s

ng

, chu i có d ng:


×