Tải bản đầy đủ (.pdf) (74 trang)

Các phương pháp chia khoảng trong mô hình chuỗi thời gian mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.32 MB, 74 trang )



Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG



NGUYỄN THỊ THÚY LAN



CÁC PHƢƠNG PHÁP CHIA KHOẢNG TRONG MÔ HÌNH
CHUỖI THỜI GIAN MỜ

CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH
MÃ SỐ: 60 48 01


LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH



NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. NGUYỄN CÔNG ĐIỀU




THÁI NGUYÊN - 2012



Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

LỜI CAM ĐOAN

Tôi cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả
nêu trong luận văn là trung thực và chƣa từng đƣợc ai công bố trong bất kỳ công
trình nào khác.





Tác giả luận văn



Nguyễn Thị Thúy Lan
i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

MỤC LỤC
Trang
Trang phụ bìa
Lời cam đoan
MỤC LỤC i
MỞ ĐẦU 1
CHƢƠNG 1: CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN 4
VÀ TẬP MỜ 4

1.1. Chuỗi thời gian và quá trình ngẫu nhiên 4
1.1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên 4
1.1.2. Quá trình ngẫu nhiên dừng 5
1.1.3. Hàm tự tương quan 6
1.1.4. Toán tử tiến, toán tử lùi 7
1.2. Mô hình ARMA 7
1.2.1. Quá trình tự hồi quy 7
1.2.2. Quá trình trung bình trượt 9
1.2.3. Quá trình tự hồi quy trung bình trượt 11
1.3. Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính 13
1.4. Lý thuyết tập mờ 16
1.4.1. Tập mờ 16
1.4.2. Các phép toán trên tập mờ 18
1.5. Các quan hệ và suy luận xấp xỉ, suy diễn mờ 21
1.5.1. Quan hệ mờ 21
1.5.2. Suy luận xấp xỉ và suy diễn mờ 22
1.6 . Hệ mờ 24
1.6.1. Bộ mờ hoá 24
1.6.2. Hệ luật mờ 25
1.6.3. Động cơ suy diễn 25
1.6.4. Bộ giải mờ 26
CHƢƠNG 2: MÔ HÌNH CHUỖI THỜI GIAN MỜ 28
2.1. Chuỗi thời gian mờ 28
ii

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

2.1.1.Một số khái niệm cơ bản 28
2.1.2. Một số định nghĩa liên quan đến chuỗi thời gian mờ 29
2.2. Một số thuật toán trong mô hình chuỗi thời gian mờ 30

2.2.1. Thuật toán của Song & Chissom [5] 30
2.2.2. Thuật toán của Chen [6] 31
2.2.3. Thuật toán Heuristic của Huarng [9] 31
CHƢƠNG 3: CÁC PHƢƠNG PHÁP CHIA KHOẢNG TRONG MÔ HÌNH
CHUỖI THỜI GIAN MỜ 33
3.1. Phƣơng pháp chia khoảng 33
3.1.1. Phương pháp lựa chọn ngẫu nhiên 34
3.1.2. Phương pháp độ dài dựa trên sự phân bố giá trị (Huarng [9]) 34
3.1.3. Phương pháp độ dài dựa trên giá trị trung bình (Huarng [9]) 35
3.1.4. Phương pháp dựa trên mật độ [2] 35
3.2. Ứng dụng trong dự báo. 37
3.2.1. Dự báo chỉ số chứng khoán Đài Loan TAIFEX [8,9]. 37
3.2.2 Dự báo chỉ số VN-Index ở Việt Nam 52
KẾT LUẬN 67
TÀI LIỆU THAM KHẢO 68

iii

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

DANH MỤC HÌNH VẼ, BẢNG BIỂU
Hình 1.1. Chuỗi giá 13
Hình 1.2. Chuỗi tăng trƣởng 14
Hình 1.3. Nhiễu 14
Hình 1.4. Tự tƣơng quan của nhiễu 15
Hình 1.5. Tự tƣơng quan riêng của nhiễu 15
Hình 1.6. Bình phƣơng nhiễu 15
Hình 1.7. Tự tƣơng quan bình phƣơng nhiễu 16
Hình 1.8. Tự tƣơng quan riêng bình phƣơng nhiễu 16
Hình 1.9. Hàm liên thuộc của tập mờ “x gần 1” 17

Hình 1.10. Một số dạng hàm liên thuộc của tập mờ 18
Bảng 1.1. Một số phép kéo theo mờ thông dụng 20
Hình 1.11. Cấu hình cơ bản của hệ mờ 24
Bảng 3.1. Cơ sở ánh xạ 35
Bảng 3.2 Giá trị chỉ số chứng khoán Đài Loan 38
Bảng 3.3. Nhóm mối quan hệ mờ 39
Bảng 3.4. Giá trị mờ và kết quả dự báo 40
Bảng 3.5. Tính giá trị tuyệt đối của hiệu số bậc 1 41
Bảng 3.6. Sự phân phối tích luỹ của sai phân cấp một 42
Bảng 3.7. Nhóm mối quan hệ mờ 44
Bảng 3.8. Kết quả dự báo 45
Bảng 3.9. Nhóm mối quan hệ mờ 47
Bảng 3.10. Kết quả dự báo 47
Bảng 3.11. So sánh với các phƣơng pháp dự báo khác 49
Hình 3.1. Đồ thị so sánh các kết quả dự báo chỉ số chứng khoán với giá trị thực 51
Bảng 3.12. Số liệu chỉ số VN-index trong tháng 4 và tháng 5 năm 2012 52
Bảng 3.13. Phân bố giá trị trong từng khoảng 53
Bảng 3.14. Phân khoảng 54
Bảng 3.15. Nhóm mối quan hệ mờ 55
iv

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Bảng 3.16. Nhóm quan hệ mờ và nhóm quan hệ mờ heuristic và dự báo 56
Hình 3.2. Đồ thị so sánh kết quả dự báo bằng phƣơng pháp dựa trên mật độ 58
và giá trị thực 58
Bảng 3.17. Tính giá trị tuyệt đối của hiệu số bậc 1 58
Bảng 3.18. Sự phân phối tích luỹ của sai phân cấp một 59
Bảng 3.19. Nhóm mối quan hệ mờ 61
Bảng 3.20. Kết quả dự báo 61

Bảng 3.21. Nhóm mối quan hệ mờ 63
Bảng 3.22. Kết quả dự báo 64
Bảng 3.23. So sánh hiệu quả của các thuật toán 65
Hình 3.3. Đồ thị so sánh các kết quả dự báo chỉ số VN-index với giá trị thực 65
- 1 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

MỞ ĐẦU
Chuỗi thời gian mờ và mô hình chuỗi thời gian mờ bậc nhất do Song và
Chissom [1] phát triển từ năm 1993. Sau công trình này, một loạt các bài báo của
nhiều tác giả khác nhau tiếp tục dựa trên ý tƣởng này để dự báo chuỗi thời gian và
ứng dụng trong nhiều lĩnh vực khác nhau nhƣ dự báo dân số, tài chính, nhiệt độ,
nhu cầu điện, vv Gần đây có rất nhiều tác giả liên tục cải tiến mô hình chuỗi thời
gian mờ để dự báo đạt kết quả chính xác hơn.
Chen [2] đã đƣa ra phƣơng pháp mới đơn giản và hữu hiệu hơn so với
phƣơng pháp của Song và Chissom bằng cách sử dụng các phép tính số học thay vì
các phép tính hợp max-min phức tạp trong xử lý mối quan hệ mờ. Phƣơng pháp của
Chen cho hiệu quả cao hơn về mặt sai số dự báo và độ phức tạp của thuật toán.
Nhiều công trình tiếp theo đã sử dụng cách tiếp cận này để dự báo cho chuỗi thời
gian. Huarng đã sử dụng các thông tin có trƣớc trong tính chất của chuỗi thời gian
nhƣ mức độ tăng giảm để đƣa ra mô hình heuristic chuỗi thời gian mờ.
Mô hình chuỗi thời gian mờ đang có nhiều ứng dụng trong công tác dự báo.
Tuy nhiên kết quả dự báo của các phƣơng pháp đề xuất còn chƣa cao. Do đó việc
tìm tòi các mô hình có độ chính xác cao hơn và thuật toán đơn giản hơn đang là một
ƣu tiên.
Để nâng cao hiệu quả và độ chính xác của thuật toán, trong những năm gần
đây đã có hàng loạt công trình đƣa ra nhiều kỹ thuật khác nhau. Những công cụ
trong lý thuyết tính toán mềm, khai phá dữ liệu, mạng nơ ron và các giải thuật tiến
hoá đều đƣợc đƣa vào sử dụng. Một số tác giả sử dụng phƣơng pháp phân cụm nhƣ

công trình của Chen et al, tập thô hay sử dụng khái niệm tối ƣu đám đông để xây
dựng các thuật toán trong mô hình chuỗi thời gian mờ. Ngoài ra, một số tác giả
khác đã sử dụng thêm thông tin khác trong chứng khoán để dự báo chính xác hơn
các chỉ số chứng khoán. Từ đó nảy sinh ra mô hình chuỗi thời gian mờ loại 2 khi
đồng thời với chuỗi thời gian chính còn sử dụng số liệu của các tham số phụ để đƣa
ra dự báo.
- 2 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Một trong các hƣớng đƣợc phát triển là sử dụng mối quan hệ mờ bậc cao
trong mô hình chuỗi thời gian mờ. Chen [3] tiếp tục là ngƣời đi đầu khi xây dựng
đƣợc thuật toán để xử lý mối quan hệ mờ bậc cao. Sau đó hƣớng này đƣợc một số
tác giả khác tiếp cận và ứng dụng trong các công trình của mình.
Trong những năm gần đây một số công trình đã đƣợc hoàn thành theo hƣớng
nâng cao độ chính xác và giảm khối lƣợng tính toán trong mô hình chuỗi thời gian
mờ nhƣ các công trình của Chen và Hsu, Huarng, Singh, Một cách tiếp cận khác
cho mô hình chuỗi thời gian mờ là sử dụng những kỹ thuật khác trong khai phá dữ
liệu nhƣ phân cụm, mạng nơ ron, giải thuật di truyền hay tối ƣu đám đông … để
xây dựng mô hình và làm tăng tính hiệu quả của thuật toán.
Dự báo chuỗi thời gian sử dụng mô hình chuỗi thời gian mờ có một số bƣớc
cơ bản nhƣ sau: Xác định tập nền, Phân chia tập nền thành các khoảng, Mờ hoá các
giá trị lịch sử, Xác định các mối quan hệ mờ, Dự báo và cuối cùng là giải mờ. Nhiều
nhà khoa học đã cho thấy cách phân chia khoảng có ảnh hƣởng rất lớn đến độ chính
xác của thuật toán. Nếu phân các khoảng có độ dài lớn thì số phép tính giảm nhƣng
sẽ có sự phân tán kết quả, còn nếu chia khoảng nhỏ mất ý nghĩa của dự báo. Các tác
giả có đề xuất nhiều cách khác nhau để phân khoảng nhƣ chia ngẫu nhiên, dựa vào
giá trị trung bình, dựa vào phân bố hay dựa vào mật độ phân bố. Mỗi phƣơng pháp
đƣợc sử dụng trong các trƣờng hợp khác nhau và đều cho kết quả tốt hơn so với
phƣơng pháp truyền thống. Từ đây cũng có thể thấy rõ sự ảnh hƣởng của phƣơng

pháp chia khoảng đến kết quả dự báo.
Có thể thấy rằng nhiều tác giả đã đƣa ra phƣơng pháp nâng cao độ chính xác
của mô hình khác nhau nhƣng phƣơng pháp cơ bản đầu tiên là các phƣơng pháp
phân khoảng. Cần thiết phải có những đánh giá và tổng kết các phép phân chia độ
dài khoảng để sử dụng trong nhiều bài toán khác nhau. Đó chính là lý do em đã lựa
chọn đề tài “Các phƣơng pháp chia khoảng trong mô hình chuỗi thời gian mờ” làm
đề tài cho luận văn tốt nghiệp của mình.
Nội dung chính của luận văn có cấu trúc nhƣ sau :
Chƣơng 1: Các kiến thức cơ bản về chuỗi thời gian và tập mờ
- 3 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Chƣơng 2: Mô hình chuỗi thời gian mờ
Chƣơng 3: Các phƣơng pháp chia khoảng trong mô hình chuỗi thời gian mờ
Luận văn này đƣợc hoàn thành dƣới sự hƣớng dẫn tận tình của TS Nguyễn
Công Điều, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối với thầy. Tác
giả xin chân thành cảm ơn các thầy, cô giáo Viện Công nghệ thông tin, trƣờng Đại
học Công nghệ thông tin và Truyền thông đã tham gia giảng dạy, giúp đỡ em trong
suốt quá trình học tập nâng cao trình độ kiến thức. Tuy nhiên vì điều kiện thời gian
và khả năng có hạn nên luận văn không thể tránh khỏi những thiếu sót. Tác giả kính
mong các thầy cô giáo và bạn đóng góp ý kiến để đề tài đƣợc hoàn thiện hơn.






- 4 -


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

CHƢƠNG 1: CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN
VÀ TẬP MỜ

Chƣơng 1 giới thiệu các kiến thức cơ bản về chuỗi thời gian và tập mờ, trọng
tâm là trình bầy về một lớp mô hình chuỗi thời gian hết sức thông dụng trong thực
tế. Đó là mô hình quy trình trƣợt ARMA (Autoregressive Moving Average). Bao
gồm các nội dung: đặc trƣng của quá trình ARMA, phƣơng pháp ƣớc lƣợng tham số
của lớp mô hình này và hạn chế của nó khi áp dụng với chuỗi thời gian tài chính.
Một số kiến thức cơ bản về hệ mờ có liên quan tới mô hình chuỗi thời gian mờ
1.1. Chuỗi thời gian và quá trình ngẫu nhiên
1.1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x
1
, x
2
,…… x
n
} đƣợc
xếp thứ tự diễn biến thời gian với x
1
là các giá trị quan sát tại thời điểm đầu tiên, x
2

là quan sát tại thời điểm thứ 2 và x
n
là quan sát tại thời điểm thứ n.
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay
Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tiêu dùng đều là những thể

hiện rất thực tế của chuỗi thời gian.
Bƣớc đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán
học phù hợp với tập dữ liệu cho trƣớc X:={x
1
, x
2
,……… x
n
} nào đó. Để có thể nói
về bản chất của những quan sát chƣa diễn ra, ta giả thiết mỗi quan sát x
t
là một giá
trị thể hiện của biến ngẫu nhiên X
t
với t

T. Ở đây T đƣợc gọi là tập chỉ số. Khi đó
ta có thể coi tập dữ liệu X:={x
1
, x
2
,……… x
n
} là thể hiện của quá trình ngẫu nhiên
X
t
, t

T. Và vì vậy, ta có thể định nghĩa một quá trình ngẫu nhiên nhƣ sau:
Định nghĩa 1.1(Quá trình ngẫu nhiên)

Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên

X
t
, t

T

được
định nghĩa trên một không gian xác suất(

,

,

).
Chú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví dụ
nhƣ là tập {1,2 } hay tập (-,+). Cũng có những quá trình ngẫu nhiên có T không phải
- 5 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

là một tập con của R nhƣng trong giới hạn của luận văn nàychỉ xét cho trƣờng hợp TR.
Và thƣờng thì ta xem T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số
là Z thay vì T ở trên. Một điểm chú ý nữa là trong luận văn này sẽ dùng thuật ngữ chuỗi
thời gian để đồng thời chỉ dữ liệu cũng nhƣ quá trình có dữ liệu đó là một thể hiện.
1.1.2. Quá trình ngẫu nhiên dừng
Định nghĩa 1.2 (Hàm tự hiệp phƣơng sai)
Giả sử


X
t
, t

Z

là một quá trình ngẫu nhiên có var(X
t
)<

với mỗi t

Z.
Khi đó hàm tự hiệp phương sai của X
t
được định nghĩa theo công thức sau:
)],
s
X)(
r
X[(),cov(:),( E
s
XE
r
XE
s
X
r
Xsr

x


với r, s

Z.
Định nghĩa 1.3 (Quá trình dừng)
Chuỗi thời gian

X
t
, t

Z

được gọi là dừng nếu nó thoả mãn 3 điều kiện
sau:
-
ZtE  ,X
2
t

-
ZtmE  ,X
t

-
Zsrttstrsr
xx
 ,,),,(),(



Định lý 1.1
Nếu

X
t
, t

Z

là một quá trình dừng, và nếu như a
t


R, i

Z thoả mãn
điều kiện



i
i
a
thì hệ thức
ZtaY
i
it





,X:
i-t
sẽ định nghĩa một quá dừng.
Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, dừng theo
nghĩa rộng hay dừng bậc hai. Tuy nhiên trong giới hạn luận văn chỉ xem xét tính
dừng theo định nghĩa ở trên.
Khi chuỗi thời gian

X
t
, t

Z

là dừng thì
,,),0,(),( Zsrsr
x
sr
x
y 


Và vì vậy, với một quá trình dừng thì có thể định nghĩa lại hàm tự hiệp
phƣơng sai bằng cách chỉ thông qua hàm một biến. Khi đó, với quá trình dừng

X
t

, t

Z

ta có:
- 6 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Zht
t
X
ht
XCovh
x
h
x
y 

 ,),,()0,()(


Hàm số
(.)
x
y
đƣợc gọi là hàm tự hiệp phƣơng sai của X
t
, còn 
x

(h)là giá trị
của nó tại “trễ” h. Đối với một quá trình dừng thì ta thƣờng ký hiệu hàm tự hiệp
phƣơng sai bởi (.) thay vì 
x
(.).
Với một quá trình dừng thì hàm hiệp phƣơng sai có các tính chất
(0)  0, (h)(0), hZ
Và nó còn là một hàm chẵn nghĩa là:
(h) = (-h),hZ.
1.1.3. Hàm tự tương quan
Định nghĩa 1.4
Hàm tự tương quan của quá trình ngẫu nhiên

X
t
, t

Z

được định nghĩa tại
trễ h như sau:

(h): = (h)/(0):=corr(X
t+h
,X
t
), t, hZ
Chú ý:
Trong thực tế, ta chỉ quan sát đƣợc một thể hiện hữu hạn X:={x
t

, t = 1,2,…n}
của một chuỗi thời gian dừng nên về nguyên tắc ta không thể biết chính xác đƣợc
các hàm tự hiệp phƣơng sai của chuỗi thời gian đó, muốn ƣớc lƣợng nó ta đƣa vào
khái niệm hàm tự hiệp phƣơng sai mẫu của thể hiện X.
Hàm tự hiệp phƣơng sai mẫu của một thể hiện X đƣợc định nghĩa bởi công
thức:
nhx
hj
xx
hn
j
j
xnnhc 






 0),)(
1
(
11
:)(


,0),(:)(  hnhchc
trong đó





n
j
j
xnx
1
1
là trung bình mẫu.
Khi đó thì hàm tƣơng tự tƣơng quan mẫu cũng định nghĩa thông qua hàm tự
hiệp phƣơng sai mẫu nhƣ sau:
( ): ( ) / (0), .r h c h c h n

- 7 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1.1.4. Toán tử tiến, toán tử lùi
Toán tử lùi B kết hợp với một quá trình ngẫu nhiên

X
t
, t

Z

là quá trình
ngẫu nhiên

Y

t
, t

Z

sao cho
1
::


ttt
XBXY

Toán tử lùi B là toán tử tuyến tính và khả nghịch. Nghịch đảo của nó
B
-1
:=F đƣợc gọi là toán tử tiến, định nghĩa bởi công thức:
FX
t :=
X
t+1
Các toán tử B, F thoả mãn hệ thức
B
n
X
t
= X
t-n,
F
n

X
t :=
X
t+n

i-t
X
0
t
X
0













n
i
i
a
n
i

i
B
i
a

Chú ý:
Một cách tổng quát, ngƣời ta có thể định nghĩa các chuỗi theo toán tử tiến F
hay toán tử lùi B và muốn thế cần hạn chế trong trƣờng hợp các quá trình là dừng.
Khi đó, giả sử ta có quá trình dừng

X
t
, t

Z

và một dãy {a
i
,iZ tuyệt đối khả
tổng, tức là



i
i
a
, thì theo định lý 1.1, quá trình
ZtXaY
it
i

it





,:
cũng là
quá trình dừng. Ta ký hiệu
i
i
i
Ba



là ánh xạ đặt tƣơng ứng quá trình dừng

X
t
, t


Z

với quá trình dừng

Y
t
, t


Z

. Các chuỗi theo B khi đó sẽ có những tính chất
cho phép ta xử lý nó tƣơng tự nhƣ đối với chuỗi nguyên thông thƣờng. Đặc biệt ta
có thể thực hiện phép cộng, phép nhân hay phép lấy nghịch đảo. Điều này có vai trò
quan trọng trong các phép biến đổi của đa thức tự hồi quy, đa thức trung bình trƣợt
và các phép biến đổi xử lý chuỗi thời gian khác.
1.2. Mô hình ARMA
1.2.1. Quá trình tự hồi quy
Định nghĩa 1.5 (Quá trình ồn trắng)
- 8 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Quá trình ngẫu nhiên

t,
t

Z

được gọi là một ồn trắng, ký hiệu

WN(0,

2
), khi nó thoả mãn các điều kiện sau:
E


t

s
= 0 (t s)

22


t
E


0,Et
t



Định nghĩa 1.6 (Quá trình tự hồi quy)
Người ta gọi quá trình ngẫu nhiên

X
t
, t

Z

là một quá trình tự hồi quy cấp
P, viết là X
t


AR(p), là một quá trình dừng {X
t
, t

Z} thoả mãn
X | 0
1 1 2 2 t-p
a X a X a a
t t p t p
X
t

     

. với {

} là một ồn trắng.
Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức
X | 0,
1 1 2 2 t-p
a X a X a a
t t p t p
X
t

    



Hay ở dạng toán tử


ở đây a(z) đƣợc gọi là đa thức hồi quy.
Chú ý:
Nếu đa thức a(z) ở trên có nghiệm nằm ngoài đĩa tròn đơn vị
)1( z
thì X
t

đƣợc gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta chỉ xét các quá trình
nhân quả.
Các đặc trƣng của quá trình tự hồi quy cấp p:
- E(X
t
) = 0
-



p
t
i
ia
1
2
|)()0(


-
0,0)(
1

)( 


 hih
p
i
i
ah


Lần lƣợt cho h = 1,2,….p ta đƣợc


2
( ): 1
12
a
p
z a z a z a z
p
     
- 9 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



















p
p
a
a
a
a
1
2
1
=


















)(
)1(

)2(
)1(
p
p






Hệ phƣơng trình gọi là hệ phƣơng trình Jule – Walker, song tuyến đối với a


.
Nghĩa là nếu cho

ta sẽ tính đƣợc a và ngƣợc lại cho a ta cũng sẽ tính đƣợc


. Trong hệ phƣơng trình Jule – Walker, nếu ta đặt 
pi
= a
i
, i =1,…p thì hệ phƣơng
trình Jule – Walker tƣơng đƣơng với
pjpjj
p
, ,1),()(
1



Đại lƣợng 
pp
ở trên đƣợc gọi là tự tƣơng quan riêng cấp p của quá trình
{X
t
, nó đóng vai trò rất quan trọng trong việc xác định bậc của quá trình tự hồi quy
cũng nhƣ việc ƣớc lƣợng tham số mô hình tự hồi quy sau này.
Trong việc thực tế, khi cho chuỗi quan sát X:=x
1
, t = 1,2…,n thì ta dùng
công thức của tƣơng quan mẫu để tính các r(i), là các giá trị xấp xỉ của

(i). Khi đã
có các tự tƣơng quan mẫu ta thay vào hệ phƣơng trình Jule – Walker và giải nó để
tìm các tham số a
1
. Từ đây ta cũng xác định đƣợc tƣơng quan riêng


p1
….,

pp.
1.2.2. Quá trình trung bình trượt
Định nghĩa1.7 (Quá trình trung bình trƣợt)
Một quá trình trung bình trượt cấp q, ký hiệu X
t


MA(q), là một quá trình


X
t
, t

Z

thoả mãn biểu thức
0,, ,
21
,
111






q
bR
q
bbb
qt
q
b
t
b
t
X


với

t

là một ồn trắng.
Ta cũng có thể viết biểu thức trung bình trƣợt ở trên dƣới dạng toán tử lùi
tƣơng tự nhƣ đối với quá trình tự hồi quy nhƣ sau:
X
t
= b(B)

t,
1

(1) ….

(p-2)


(p-1)
(1) 1 ….

(p-3)

(p-1)
…. …. …. … …

(p-2)….

(p-3) 1

(1)

(p-1)

(p-2)

(1) 1

- 10 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Trong đó hàm b(.) định nghĩa bởi b(z) : = 1+b
1
z+…+b
q
z

q.

Ở đây b(z) đƣợc gọi là đa thức trung bình trƣợt.
Chú ý:
Khác với quá trình AR, biểu thức trên luôn xác định duy nhất một quá trình
MA mà không đòi hỏi thêm điều kiện gì đối với các hệ số b
1
. Và với giả thiết 
t

ồn trắng thì theo định lý 1.1 ta có
b(z)

(z) = 1.
Và khi đó 
1
có thể biểu diễn dƣới dạng














j
j
j
z
j
j
z
j
jt
X
j
t

;)(;

Một chú ý nữa, cũng giống nhƣ trƣờng hợp AR, nếu đa thức trung bình trƣợt
b(z) không có nghiệm có môđun bằng 1 thì ta có thể biểu diễn X
t
dƣới dạng sau:






 j
jtjt
j
jt
XX


;
1

Và có thể xác định
i

bằng cách chia 1 (theo luỹ thừa tăng) cho
b(z),
)1(
0


.
Khi quá trình
t
X
có thể biểu diễn ở dạng trên, tức là khi b(z) chỉ có nghiệm
có môđun lớn hơn 1 thì ta nói
t
X
là một quá trình khả nghịch. Và từ nay về sau,
nếu không nói gì thêm thì khi nói về các quá trình AR và MA thì sẽ đƣợc hiểu đó là
các quá trình nhân quả và khả nghịch.
Các đặc trƣng của quá trình trung bình trƣợt:
Trƣớc hết, dễ dàng thấy rằng
0EX
t

,


2
,
2
( ) , ;1
1
0,
st
E X b s t i i q
tt
s






    






Mặt khác có:
) ( ( ))
1 1 1 1
( ): (X X E X b b
t t h t t h h q h q
hE

  
  
     

- 11 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Từ đó suy ra
2
( ) ( ), : 1;1
1 1 0
( ) 0,
h b b b b b b h q
h h q h q
h h q


      








Đặc biệt có
2 2 2
γ(0):=varX =σ (1+b + +b )

t 1 q

Từ công thức hiệp sai của quá trình trung bình trƣợt suy ra công thức của tự
tƣơng quan nhƣ sau:

1
1
, 1,2
22
1
()
1
0, .
b b b b b
q
h h q h
hq
bb
h
q
hq

   





  








1.2.3. Quá trình tự hồi quy trung bình trượt
Định nghĩa 1.8 (quá trình tự hồi quy trung bình trƣợt)
Một quá trình

X
t
, t

Z

được gọi là quá trình tự hồi quy trung bình trượt
cấp p,q, kí hiệu
t
X

ARMA(p,q) là một quá trình

X
t
, t

Z

thỏa mãn

0,0,, ,
2
,
1
,,
2
,
1
,

11

11










q
b
p
aR
q
bbb
p

aaa
qt
q
b
t
b
tpt
X
p
a
t
Xa
t
X



Trong đó
t

là ồn trắng, a(.) và b(.) lần lƣợt là đa thức tự hồi quy và đa thức
trung bình trƣợt có bậc tƣơng ứng là p và q:
( ): 1
1
p
a z a z a z
p
   

( ): 1

1
q
b z b z b z
q
   

Khi đó ta có thể viết quá trình ARMA ở dạng toán tử nhƣ sau:
( ) ( )a B X b B
tt



Định nghĩa 1.9 (Quá trình nhân khả nghịch)
- 12 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Một quá trình ARMA(p,q) đƣợc gọi là một quá trình nhân quả và khả nghịch
nếu có là một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều kiện:
i) a(z) và b(z) không có nghiệm chung
ii) a(z) và b(z) không có nghiệm có môđun không vƣợt quá 1
Chú ý:
Do tính nhân quả và khả nghịch cộng với tính chất khả đảo của đa thức toán
tử, ta có thể biểu diễn một quá trình
, 1; .
0
01
X
t
i t i i

ii
   

   




Và có thể tính các hệ số
t

bằng cách chia theo lũy thừa tăng a(z) cho b(z).
Các đặc trƣng của quá trình ARMA:
Trƣớc hết ta có
) ( ) ( ) ( )

1
11
( ) (
pq
a h i h b h i
i
XX
ti
h E X X
t
th
  



    





Với
( ): (
.
k E X
t
X
tk





Mặt khác ta có thể biểu diễn
0
X
i
t k t k i
i




  



Và ta có



Lần lƣợt cho h = 0,1, p trong các chƣơng trình trên và chú ý đến tính chẵn
của hàm (h) ta có hệ phƣơng trình tuyến tính đối với (0), , (p) hay
với
).(), 1( p





p
i
i
qhihah
1
),()(


Và vì thế










0,
2
0,0
)(
.
k
k
k
k
Xe



- 13 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

( ) ( ), .
1
p
h a h i h q
i
i

  




1.3. Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính
Mô hình ARMA thu đƣợc thành công lớn khi áp dụng cho các chuỗi thời
gian xuất phát từ các lĩnh vực khoa học tự nhiên và kỹ thuật nhƣng thất bại khi áp
dụng cho các chuỗi thời gian kinh tế tài chính. Nguyên nhân chính là giả thiết về
mặt toán học phƣơng sai của các chuỗi thời gian tài chính không thay đổi theo thời
gian là không phù hợp. Và vì vậy mô hình ARMA có thể dự báo đƣợc kỳ vọng
nhƣng thất bại khi dự báo phƣơng sai của chuỗi thời gian tài chính. Sau đây ta sẽ
xem xét một ví dụ cụ thể để thấy rõ sự không phù hợp của mô hình ARMA đối với
chuỗi thời gian tài chính.
Xét chuỗi số chuỗi số liệu NYSE chứa giá trị của chỉ số chứng khoán giao
dịch hằng ngày trên thị trƣờng NewYork từ tháng ngày 02/01/1990 đến ngày
31/12/2001. Chuỗi gồm 3028 số liệu đƣợc lƣu dƣới tên file là NYSE.txt. Tuy nhiên
thay vì trực tiếp làm việc với chuỗi số liệu gốc, ta lấy logarit tự nhiên của chuỗi gốc
rồi lấy lại sai phân của nó để đƣợc một chuỗi mới mà trong lĩnh vực kinh tế tài
chính ta gọi là chuỗi tăng trƣởng. Từ số liệu ở trên, chuỗi giá và chuỗi tăng trƣởng
đƣợc minh họa nhƣ sau:

Hình 1.1. Chuỗi giá

- 14 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


Hình 1.2. Chuỗi tăng trưởng
Nhìn vào đồ thị của chuỗi giá, rõ ràng ta thấy nó không có tính dừng. Ngƣợc
lại, chuỗi tăng trƣởng có đồ thị rất giống với một quá trình dừng. Khi nhìn vào đồ
thị của chuỗi tăng trƣởng ta cũng thấy có xuất hiện những cụm biến động, có vùng
biến đổi về phƣơng sai của chuỗi thời gian.
Bây giờ giả sử bằng cách nào đó ta tìm đƣợc mô hình ARMA gần nhất với

chuỗi quan sát và đó là mô hình ARMA(1,1). Mục đích ở đây là chúng ta sẽ thấy rõ
ràng sau khi ƣớc lƣợng, nhiễu thu đƣợc sẽ không phải là một ồn trắng nhƣ ta mong
muốn nữa. Thật vậy, kết quả ƣớc lƣợng theo mô hình ARMA(1,1) là
0.00049332y
tt



Nhiễu khi đó đƣợc tính toán và biểu diễn bởi đồ thị sau

Hình 1.3. Nhiễu
Khi đó tự tƣơng quan và tự tƣơng quan riêng của nhiễu cho bởi đồ thị dƣới
đây
- 15 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


Hình 1.4. Tự tương quan của nhiễu


Hình 1.5. Tự tương quan riêng của nhiễu
Ban đầu, do tính ít tƣơng quan của nhiễu ƣớc lƣợng đƣợc nên ta thấy nó
giống với một quá trình ồn trắng. Tuy nhiên khi lấy bình phƣơng nhiễu ta lại thấy
khác.

Hình 1.6. Bình phương nhiễu

- 16 -


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


Hình 1.7. Tự tương quan bình phương nhiễu


Hình 1.8. Tự tương quan riêng bình phương nhiễu
Rõ ràng là nhiễu có hiện tƣợng tạo cụm biến động giống nhƣ chuỗi tăng
trƣởng ban đầu. Còn khi nhìn vào đồ thị tự tƣơng quan của bình phƣơng nhiễu ta
thấy nó thể hiện sự tƣơng quan mạnh nên ta có thể kết luận rằng nhiễu không phải
là một ồn trắng nhƣ mong muốn. Và nhƣ vậy mô hình ARMA sẽ không phù hợp
với chuỗi số liệu này.
Mặc dù mô hình ARMA tỏ ra không phù hợp với chuỗi thời gian tài chính
nhƣng những kỹ thuật mà nó cung cấp là một cơ sở rất quan trọng và mang lại
nhiều gợi ý cho các công trình nghiên cứu về chuỗi thời gian sau Box-Jenkins.
1.4. Lý thuyết tập mờ
1.4.1. Tập mờ
Định nghĩa: Cho Ω( Ω ≠ ) là không gian nền, một tập mờ A trên Ω đƣợc
xác định bởi hàm thuộc (membership function):

A
: Ω [0,1]
- 17 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

0 

A
(x)  1


A
(x): Chỉ độ thuộc (membership degree) của phần tử x vào tập mờ A (để
cho đơn giản trong cách viết, sau này ta ký hiệu A(x) thay cho hàm

A
(x))
Khoảng xác định của hàm

A
(x) là đoạn [0,1], trong đó giá trị 0 chỉ mức độ
không thuộc về còn giá trị 1 chỉ mức độ thuộc về hoàn toàn.
Nhƣ vậy tập mờ A hoàn toàn xác định trên tập các bộ đôi:
A=

(x,

A
(x))

x




Nếu Ω =

x
1
,x

2
, ,x
n
,

là một tập hữu hạn và A là tập mờ xác định trên Ω thì
thông thƣờng ta có ký hiệu:
A =

1
/x
1
+

2
/ x
2
+ +

n


/ x
n

Ví dụ 1: Hàm liên tục của tập mờ A “tập các số thực gần 1” đƣợc định nghĩa nhƣ
sau:

A
(x) =

2
( 1)ax
e



Hình 1.9. Hàm liên thuộc của tập mờ “x gần 1”
Ví dụ 2: Một số dạng hàm liên thuộc liên tục khác
Triangle(x, a, b, c) = max(min(
)0),,1,
bc
xc
ab
ax





Trapezoid(x, a, b, c,d) = max(min(
)0),,1,
cd
xd
ab
ax






Gaussian(x,
,,c

)=
)
2
()
xc
e





Bell(x, a, b, c) =
b
a
cx
2
1
1



- 18 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


Hình 1.10. Một số dạng hàm liên thuộc của tập mờ

1.4.2. Các phép toán trên tập mờ
1.4.2.1. Phần bù của tập mờ
Định nghĩa 1: (Hàm phủ định): Hàm n: [0,1] không tăng thỏa mãn các điều
kiện n(0) = 1, n(1) = 0 đƣợc gọi là hàm phủ định (negation function).
Định nghĩa 2: (Phần bù của một tập mờ): Cho n là hàm phủ định, phần bù
A
c
của tập mờ A là một tập mờ với hàm thuộc đƣợc xác định bởi:
A
c
(x) = n(A(x)), với mỗi x


1.4.2.2. Phép giao hai tập mờ
Định nghĩa 3 (T - chuẩn): Hàm T: [0,1]
2
 [0,1] là một T - chuẩn (phép
hội) khi và chỉ khi thoả mãn các điều kiện sau:
1. T(1, x) = x, với mọi 0  x  1.
2. T có tính giao hoán : T(x,y) = T(y,x), với mọi 0  x, y 1.
3. T không giảm: T(x,y)=T(u,v), với mọi x  u, y v.
4. T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),z), với mọi 0  x,y, z 1.
Ví dụ: T
1
(x,y)=min(x,y) là một T-chuẩn, thật vậy:
- T
1
(1,x)=min(1,x)=x, với mọi 0  x  1.
- T
1

có tính giao hoán: min(x,y)=min(y,x), với mọi 0  x, y 1.
- T
1
không giảm: min(x,y)<=min(u,v), với mọi x  u, y v.
- 19 -

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

- T1 có tính kết hợp: min(x,min(y,z))=min(min(x,y),z)= min(x,y,z), với
mọi 0  x, y, z 1.
Định nghĩa 4 (Phép giao hai tập mờ): Cho hai tập mờ A, B trên cùng không
gian nền  với hàm thuộc A(x), B(x) tƣơng ứng. Cho T là một T-Chuẩn. Phép giao
của hai tập mờ A,B là một tập mờ (ký hiệu (A
T
B)) trên  với hàm thuộc cho bởi
biểu thức:
(A
T
B)(x) = T(A(x), B(x)), với mỗi x  
Ví dụ:
- Với T(x,y)=min(x,y)ta có: (A
T
B)(x) = min(A(x),B(x))
- Với T(x,y) = x.y ta có (A
T
B)(x) = A(x).B(x) (tích đại số)
Ta có thể biểu diễn phép giao của hai tập mờ qua hai hàm
T(x,y)=min(x,y) và T(x,y) = x.y theo các đồ thị hình 1.3 sau đây:
- Hình a: Hàm thuộc của hai tập mờ A và B
- Hình b: Giao của hai tập mờ theo T(x,y)=min(x,y)

- Hình c: Giao của hai tập mờ theo T(x,y)=x.y
1.4.2.3. Phép hợp hai tập mờ
Định nghĩa 5 (T - đối chuẩn): Hàm S:[0,1]
2
đƣợc gọi là một T - đối chuẩn
(phép tuyển) nếu thoả mãn các điều kiện sau:
1. S(0,x) = x, với mọi 0  x  1.
2. S có tính giao hoán : S(x,y)= S(y,x) với mọi 0  x, y  1.
3. S không giảm: S(x,y) = S(u,v), với mọi x  u, y  v.
4. S có tính kết hợp: S(x,S(y,z)) = S(S(x,y),z) với mọi 0  x, y, z1.
Định nghĩa 6 (phép hợp hai tập mờ): Cho hai tập mờ A, B trên cùng không
gian nền  với hàm thuộc A(x), B(x) tƣơng ứng. Cho S là một T - đối chuẩn. Phép
hợp của hai tập mờ A, B là một tập mờ (kí hiệu (A
S
B)) trên  với hàm thuộc cho
bởi biểu thức: (A
S
B)(x)=S(A(x),B(x)), với mỗi x
Ví dụ:
- Với S(x,y) = max(x,y): (A
S
B)(x)= max(A(x), B(x))

×