Tải bản đầy đủ (.pdf) (76 trang)

Mô hình chuỗi thời gian mờ có trọng số bậc cao và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.51 MB, 76 trang )


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG







ĐẶNG THỊ THU THẢO







MÔ HÌNH CHUỖI THỜI GIAN MỜ CÓ TRỌNG SỐ
BẬC CAO VÀ ỨNG DỤNG







LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH















2
THÁI NGUYÊN - 2012


ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG







ĐẶNG THỊ THU THẢO








MÔ HÌNH CHUỖI THỜI GIAN MỜ CÓ TRỌNG SỐ
BẬC CAO VÀ ỨNG DỤNG

Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01





LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH




NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. NGUYỄN CÔNG ĐIỀU






THÁI NGUYÊN - 2012
i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


LỜI CAM ĐOAN

Tôi cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả
nêu trong luận văn là trung thực và chƣa từng đƣợc ai công bố trong bất kỳ công
trình nào khác.
Tác giả luận văn



Đặng Thị Thu Thảo

i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

MỤC LỤC

Trang bìa phụ
Lời cam đoan
MỤC LỤC 3
DANH MỤC BẢNG BIỂU iii
DANH MỤC HÌNH VẼ iv
MỞ ĐẦU 1
CHƢƠNG 1 TỔNG QUAN VỀ CHUỖI THỜI GIAN 5
1.1 Các kiến thức cơ bản về chuỗi thời gian 5
1.1.1. Khái niệm chuỗi thời gian 5
1.1.2 Tính chất của chuỗi thời gian 6
1.1.3 Phân chia chuỗi thời gian 8
1.2 Mô hình chuỗi thời gian 10

1.3 Mô hình hồi quy 10
1.3.1 Mô hình tự hồi quy (AR) 11
1.3.2 Mô hình trung bình trượt (MA) 12
1.1.4 Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính 13
CHƢƠNG 2 14
MÔ HÌNH CHUỖI THỜI GIAN MỜ CÓ TRỌNG SỐ BẬC CAO 14
2.1 Tổng quan về tập mờ 14
2.1.1 Tập mờ 14
2.1.2 Quan hệ mờ 16
2.1.3 Các phép toán của quan hệ mờ 18
2.1.4 Suy luận xấp xỉ và suy diễn mờ 18
2.2 Hệ mờ 20
2.2.1 Bộ mờ hoá 20
2.2.2 Giải mờ 21
2.3 Chuỗi thời gian mờ 22
ii

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

2.3.1 Một số khái niệm cơ bản 22
2.3.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ 23
2.4 Một số thuật toán trong mô hình chuỗi thời gian mờ 24
2.4.1 Một số thuật toán bậc một (thuật toán cơ sở) 24
2.4.2 Một số thuật toán bậc cao 26
2.4.3 Chuỗi thời gian mờ có trọng bậc cao 30
2.4.4 Mô hình chuỗi thời gian mờ có trọng của Hui – Kuang Yu 32
2.4.5 Thuật toán bậc cao có trọng 38
CHƢƠNG 3 41
ỨNG DỤNG MÔ HÌNH CHUỖI THỜI GIAN MỜ 41
CÓ TRỌNG BẬC CAO 41

3.1 Ứng dụng trong bài toán dự báo nhiệt độ 41
3.1.1 Ứng dụng thuật toán chuỗi thời gian mờ có trọng bậc 3 41
3.1.2 Ứng dụng thuật toán chuỗi thời gian mờ có trọng bậc 1, bậc 2 45
3.2 Ứng dụng trong dự báo chỉ số Chứng khoán 48
3.2.1 Dự báo chỉ số chứng khoán Đài Loan 48
3.2.2 Dự báo chỉ số chứng khoán Việt Nam 56
KẾT LUẬN 62
TÀI LIỆU THAM KHẢO 64
PHỤ LỤC 66


iii

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

DANH MỤC BẢNG BIỂU

Bảng 2.1 Số lƣợng sinh viên nhập học 34
Bảng 2.2 Các nhóm mối quan hệ mờ 35
Bảng 2.3 Kết quả dự báo của các phƣơng pháp khác nhau 36
Bảng 2.4 So sánh hiệu quả thuật toán 37
Bảng 3.1 Nhiệt độ trung bình từ 01.6.1996 đến 30.9.1996 41
Bảng 3.2 Các giá trị mờ hóa 42
Bảng 3.3 Nhóm quan hệ mờ có trọng bậc 3 43
Bảng 3.4 Rút gọn của nhóm quan hệ mờ có trọng bậc 3 44
Bảng 3.5 Dự báo nhiệt độ trung bình của tháng 6.1996 44
Bảng 3.6 Dự báo nhiệt độ trung bình của tháng 6.1996 bằng mô hình bậc 1 45
Bảng 3.7 Dự báo nhiệt độ trung bình của tháng 6.1996 bằng mô hình bậc 2 46
Bảng 3.8 So sánh hiệu quả thuật toán 47
Bảng 3.9 Dữ liệu chỉ số chứng khoán TAIFEX 48

Bảng 3.10 Các giá trị mờ hóa 49
Bảng 3.11 Nhóm quan hệ mờ có trọng bậc 3 51
Bảng 3.12 Rút gọn của nhóm quan hệ mờ có trọng bậc 3 52
Bảng 3.13 Kết quả dự báo chỉ số chứng khoán TAIFEX 53
Bảng 3.14 So sánh với các phƣơng pháp dự báo khác 54
Bảng 3.15 Số liệu chỉ số VN-index trong tháng 4 và tháng 5 năm 2012 56
Bảng 3.16 Các giá trị mờ hóa 57
Bảng 3.17 Nhóm quan hệ mờ có trọng bậc 3 59
Bảng 3.18 Rút gọn của nhóm quan hệ mờ có trọng bậc 3 60
Bảng 3.19 Giá trị dự báo 60




iv

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

DANH MỤC HÌNH VẼ

Hình 2.1 Hàm liên thuộc của tập mờ “cao” 16
Hình 2.2 Cấu hình cơ bản của hệ mờ 20
Hình 2.3 Minh hoạ các phƣơng pháp giải mờ 22
Hình 2.4 Đồ thị kết quả dự báo kết quả theo các thuật toán 38
Hình 3.1 Biểu đồ so sánh giá trị dự báo giữa các bậc 48
Hình 3.2 Biểu so sánh giá trị thực và giá trị dự báo 56
Hình 3.3 Biểu đồ so sánh giá trị thực tế và giá trị dự báo chỉ số VN-index 62
Hình PL.1. Giao diện chƣơng trình 66
Hình PL.2. Chƣơng trình dự báo nhiệt độ 67
Hình PL.3. Chƣơng trình dự báo chỉ số VN-Index 67

Hình PL.4. Chƣơng trình dự báo chỉ số chứng khoán 68
1

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

MỞ ĐẦU
Khoa học máy tính ngày nay phát triển luôn gắn liền với cuộc sống kinh tế
xã hội. Nó không còn là việc lập trình ra những phần mềm quản lý để vận hành
máy móc trong một số lĩnh vực cụ thể của ngành công nghệ thông tin đơn thuần.
Giờ đây việc đi sâu vào tính ứng dụng với khả năng phân tích các số liệu trong
kinh tế, xã hội một cách khoa học để có đƣợc những kết quả tính toán tối ƣu
đang trở thành một công cụ đắc lực giúp cho các nhà quản lý, các nhà đầu tƣ dự
báo hay đánh giá đƣợc tính chính xác trong kết quả công việc của mình. Để có
đƣợc những kết quả đánh giá tối ƣu với tính chính xác cao từ kho dữ liệu tích lũy
đƣợc, đòi hỏi các nhà khoa học phải luôn đi tìm các hƣớng tiếp cận để phân tích
cũng nhƣ dự báo số liệu và phƣơng pháp phân tích chuỗi thời gian đang là hƣớng
đi mà các nhà khoa học lựa chọn và kỳ vọng.
Bằng các công cụ hữu hiệu của xác suất thống kê, phân tích chuỗi thời gian
là công cụ quan trọng để phân tích số liệu trong kinh tế, xã hội cũng nhƣ trong
nghiên cứu khoa học và từ đó trích xuất ra những thông tin quan trọng từ các dãy
số liệu thống kê cơ bản.
Phƣơng pháp phân tích chuỗi thời gian trƣớc đây chủ yếu sử dụng các công
cụ thống kê nhƣ hồi qui, phân Fourie và các công cụ phân tích khác nhƣng kết
quả đem lại chƣa cao.
Phƣơng pháp hiệu quả nhất có lẽ phải kể đến là phƣơng pháp sử dụng mô
hình ARIMA của Box-Jenkins. Ƣu điểm của mô hình này là cho kết quả khá tốt
trong phân tích dữ liệu và đang đƣợc sử dụng rất rộng rãi trong thực tế. Tuy
nhiên trong một số lĩnh vực nhất là trong kinh tế, mô hình ARIMA lại chƣa thể
hiện đƣợc tính hiệu quả vì chuỗi số liệu diễn biến mang tính chất phi tuyến. Do
đó để dự báo chuỗi thời gian trong kinh tế, các nhà khoa học phải có những cải

biên nhƣ sử dụng mô hình ARCH để có đƣợc những phân tích và đánh giá về sự
rủi ro gặp phải.
Để vƣợt qua đƣợc những khó khăn trên trong phân tích chuỗi thời gian, gần
đây nhiều tác giả đã sử dụng mô hình chuỗi thời gian mờ. Khái niệm tập mờ
đƣợc Zadeh đƣa ra từ năm 1965 và ngày càng tìm đƣợc ứng dụng trong nhiều
lĩnh vực khác nhau nhất là trong điều khiển và trí tuệ nhân tạo. Trong lĩnh vực
phân tích chuỗi thời gian, Song và Chissom [10-12] đã đƣa ra khái niệm chuỗi
thời gian mờ không phụ thuộc vào thời gian (chuỗi thời gian dừng) và phụ thuộc
2

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

vào thời gian (không dừng) để dự báo. Chen [14] đã cải tiến và đƣa ra phƣơng
pháp mới đơn giản và hữu hiệu hơn so với phƣơng pháp của Song và Chissom.
Trong phƣơng pháp của mình, thay vì sử dụng các phép tính tổ hợp Max-Min
phức tạp, Chen đã thiết lập nhóm các mối quan hệ mờ và qua đó sử dụng các
phép tính số học đơn giản để tính toán dự báo. Phƣơng pháp của Chen cho hiệu
quả cao hơn về mặt sai số dự báo và giảm độ phức tạp của thuật toán.
Từ các công trình ban đầu về chuỗi thời gian mờ đƣợc xuất hiện năm 1993,
hiện nay mô hình này đang đƣợc sử dụng để dự báo trong rất nhiều lĩnh vực của
kinh tế hay xã hội nhƣ dự báo số sinh viên nhập trƣờng, số khách du lịch, dân
số, chứng khoán và trong đời sống nhƣ dự báo mức tiêu thụ điện, hay dự báo
nhiệt độ của thời tiết… Tuy nhiên xét về độ chính xác của dự báo, các thuật toán
trên cho kết quả chƣa cao.
Trong những năm gần đây, một số tác giả đã sử dụng nhiều kỹ thuật khác
nhau để tìm mô hình hữu hiệu cho chuỗi thời gian mờ. Những kỹ thuật trong lý
thuyết tính toán mềm, khai phá dữ liệu, mạng nơ ron và các giải thuật tiến hoá
đều đƣợc đƣa vào sử dụng. Một số tác giả sử dụng phƣơng pháp phân cụm nhƣ
công trình của Chen et al trong [16], tập thô [4] hay sử dụng khái niệm tối ƣu
đám đông nhƣ trong công trình [8] để xây dựng các thuật toán trong mô hình

chuỗi thời gian mờ. Ngoài ra, một số tác giả khác đã sử dụng thêm thông tin
khác trong chứng khoán để dự báo chính xác hơn các chỉ số chứng khoán. Từ đó
nảy sinh ra mô hình chuỗi thời gian mờ loại 2 khi đồng thời với chuỗi thời gian
chính còn sử dụng số liệu của các tham số phụ để đƣa ra dự báo. Có thể kể ra
đây công trình của Chu et.al [6].
Một trong các hƣớng đƣợc phát triển là sử dụng mối quan hệ mờ bậc cao
trong mô hình chuỗi thời gian mờ. Chen [15] tiếp tục là ngƣời đi đầu khi xây
dựng đƣợc thuật toán để xử lý mối quan hệ mờ bậc cao. Sau đó hƣớng này đƣợc
một số tác giả khác tiếp cận và ứng dụng trong các công trình của mình. Trong
các công trình này, các tác giả chủ yếu sử dụng thuật toán của Chen nhƣng có cải
tiến đôi chút trong việc đƣa ra các luật khác nhau để giải mờ. Riêng Singh trong
bài báo [17] đã xây dựng mô hình chuỗi thời gian mờ bậc cao bằng cách mở rộng
thuật toán đơn giản của mình xây dựng trong các công trình trƣớc đây.
Một cải tiến trong mô hình bậc cao là dùng các trọng số để nâng cao độ
chính xác thuật toán. Tƣ tƣởng của nó là khi tạo các nhóm quan hệ mờ, nhiều khi
không tính đến sự lặp lại của các tập mờ trong nhóm. Để tính đến sự đóng góp
3

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

của các tập mờ lặp lại trong các nhóm, ngƣời ta đƣa ra trọng số cho các tập đó.
Kiểu tạo trọng số này đƣợc Yu [7] đƣa ra lần đầu tiên. Sau này, một số kiểu
trọng số khác nhau nhƣ trọng xu hƣớng đƣợc đƣa vào trong [4]. Mô hình chuỗi
thời gian mờ có trọng còn đƣợc tiếp tục nghiên cứu trong các năm gần đây nhƣ
các bài báo [8],[9].
Ở Việt Nam, mô hình chuỗi thời gian mờ là một vấn đề mới chƣa đƣợc sự
quan tâm các nhà khoa học, nhƣng có một số nhóm nghiên cứu đã có ý tƣởng
tiếp tục đi sâu vào lĩnh vực này. Có thể kể đến một số công trình của một số tác
giả thuộc Viện CNTT [1-3]. Trong các công trình của mình, các tác giả đã đề
xuất các phƣơng pháp theo hƣớng sử dụng các mô hình có độ chính xác cao và

thuật toán đơn giản hơn nhƣ: đƣa ra một thuật toán mới cho mô hình chuỗi thời
gian mờ heuristic [1], cải biên một thuật toán đơn giản của Singh cho mô hình
chuỗi thời gian mờ và gần đây nhất trong công trình [3], tác giả đã sử dụng mô
hình chuỗi thời gian mờ bậc cao nhƣng phát triển theo hƣớng đƣa ra khái niệm
mới là nhóm quan hệ mờ bậc cao để có thể sử dụng thuật toán mà tác giả đã xây
dựng trong [2]. Nhờ có mối quan hệ mờ bậc cao này việc tính toán để giải mờ sẽ
đơn giản hơn.
Nhƣ đã trình bầy ở phần tổng quan, mô hình chuỗi thời gian mờ đang có
nhiều ứng dụng trong công tác dự báo. Tuy nhiên kết quả dự báo của các phƣơng
pháp đề xuất còn chƣa cao. Do đó việc tìm tòi các mô hình có độ chính xác cao
hơn và thuật toán đơn giản hơn đang là một ƣu tiên. Trong những năm gần đây
một số công trình đã đƣợc hoàn thành theo hƣớng nâng cao độ chính xác và giảm
khối lƣợng tính toán trong mô hình chuỗi thời gian mờ nhƣ các công trình của
Chen và Hsu, Huarng, Singh, Một cách tiếp cận khác cho mô hình chuỗi thời
gian mờ là sử dụng những kỹ thuật khác trong khai phá dữ liệu nhƣ phân cụm,
mạng nơ ron, giải thuật di truyền hay tối ƣu đám đông … để xây dựng mô hình
và làm tăng tính hiệu quả của thuật toán. Tuy nhiên có một cách tiếp cận tự
nhiên hơn là sử dụng mô hình bậc cao kết hợp với trọng số hứa hẹn thu đƣợc
nhiều kết quả tốt. Trên thế giới và ngay tại Việt nam cũng đã có những kết quả
theo hƣớng này.
Với mục tiêu tìm hiểu về việc sử dụng mô hình chuỗi thời gian mờ trong dự
báo, đặc biệt là việc sử dụng mô hình chuỗi thời gian mờ có trọng số bậc cao, em
đã lựa chọn đề tài “Mô hình chuỗi thời gian mờ có trọng số bậc cao và ứng
dụng” làm đề tài cho luận văn tốt nghiệp của mình.
4

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Luận văn đƣợc chia làm 3 chƣơng với các nội dung nghiên cứu chính:
Chƣơng 1: Tổng quan về chuỗi thời gian.

Chƣơng 2: Mô hình chuỗi thời gian mờ có trọng số bậc cao.
Chƣơng 3: Ứng dụng mô hình chuỗi thời gian mờ có trọng số bậc cao.
Luận văn này đƣợc hoàn thành dƣới sự hƣớng dẫn tận tình của T.S Nguyễn
Công Điều, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối với thầy. Tác
giả xin chân thành cảm ơn các thầy, cô giáo Viện Công nghệ thông tin, Khoa
Công nghệ thông tin - Đại học Thái Nguyên đã tham gia giảng dạy, giúp đỡ em
trong suốt qúa trình học tập nâng cao trình độ kiến thức. Tuy nhiên vì điều kiện
thời gian và khả năng có hạn nên luận văn không thể tránh khỏi những thiếu sót.
Em kính mong các thầy cô giáo và bạn đóng góp ý kiến để đề tài đƣợc hoàn
thiện hơn.
5

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

CHƢƠNG 1 TỔNG QUAN VỀ CHUỖI THỜI GIAN

Chƣơng này giới thiệu các kiến thức cơ bản về chuỗi thời gian. Bên cạnh đó
trình bầy một số lớp mô hình chuỗi thời gian hết sức thông dụng trong thực tế, đó
là: mô hình tự hồi quy, mô hình trung bình trƣợt và mô hình kết hợp của 2 mô hình
này là mô hình ARMA (Autoregressive Moving Average) với những hạn chế của
nó khi áp dụng với chuỗi thời gian tài chính.
1.1 Các kiến thức cơ bản về chuỗi thời gian
1.1.1. Khái niệm chuỗi thời gian
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x
1
, x
2
,…… x
n
} đƣợc xếp

thứ tự diễn biến thời gian với x
1
là các giá trị quan sát tại thời điểm đầu tiên, x
2

quan sát tại thời điểm thứ 2 và x
n
là quan sát tại thời điểm thứ n.
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay Internet
về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tiêu dùng đều là những thể hiện rất
thực tế của chuỗi thời gian.
Bƣớc đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán học
phù hợp với tập dữ liệu cho trƣớc X:={x
1
, x
2
,……… x
n
} nào đó. Để có thể nói về
bản chất của những quan sát chƣa diễn ra, ta giả thiết mỗi quan sát x
t
là một giá trị
thể hiện của biến ngẫu nhiên X
t
với t

T. Ở đây T đƣợc gọi là tập chỉ số. Khi đó ta
có thể coi tập dữ liệu X:={x
1
, x

2
,……… x
n
} là thể hiện của quá trình ngẫu nhiên X
t
,
t

T. Và vì vậy, ta có thể định nghĩa một quá trình ngẫu nhiên nhƣ sau:
Định nghĩa 1.1(Quá trình ngẫu nhiên)
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên

X
t
, t

T

được định
nghĩa trên một không gian xác suất(

,

,

).
Chú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví
dụ nhƣ là tập {1,2 } hay tập (-,+). Cũng có những quá trình ngẫu nhiên có T
không phải là một tập con của R nhƣng trong giới hạn của luận văn này chỉ xét cho

trƣờng hợp TR. Và thƣờng thì ta xem T là các tập các số nguyên, khi đó ta sẽ sử
6

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

dụng ký hiệu tập chỉ số là Z thay vì T ở trên. Một điểm chú ý nữa là trong luận văn
này sẽ dùng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng nhƣ quá trình
có dữ liệu đó là một thể hiện.
1.1.2 Tính chất của chuỗi thời gian
Các tính chất đặc trƣng của chuỗi thời gian là: tính dừng, tuyến tính, xu hƣớng,
và thời vụ. Dù một chuỗi thời gian có thể biểu hiện một hoặc nhiều tính chất nhƣng
khi trình bày, phân tích và dự báo giá trị của chuỗi thời gian thì mỗi tính chất đƣợc
xử lý tách rời.
1.1.2.1 Tính dừng
Tính chất này của quá trình ngẫu nhiên có liên quan đến giá trị trung bình và
phƣơng sai của dữ liệu quan sát, cả hai đều nên bất biến theo thời gian, và hiệp
phƣơng sai giữa quan sát x
t
và x
t-d
chỉ nên phụ thuộc vào khoảng cách giữa hai quan
sát và không thay đổi theo thời gian. Ví dụ trong mối quan hệ dƣới đây:
Với t = 1,2. E{x
t
} = µ, t = 1, 2,
Var(x
t
) = E{(x
t
- µ)

2

} = k
0
, t= 1, 2,
Cov(x
t
, x
t-d
) = E{(x
t
- µ)(x
t-d
- µ

)} = k
d
; d = 2, -1, 0, 1, 2, ; µ, k
0
, k
d
là những hằng số xác định.
Về mặt thống kê, chuỗi thời gian có tính dừng khi quá trình ngẫu nhiên cơ bản
là trạng thái đặc biệt của trạng thái cân bằng thống kê. Chẳng hạn hàm phân bổ kết
nối của X(t) và X(t-

) chỉ phụ thuộc vào

mà không phụ thuộc vào t. Do đó, các
mô hình có tính dừng của một chuỗi thời gian có thể dễ dàng xây dựng nếu quá

trình vẫn còn trong trạng thái cân bằng ở t thời gian xung quanh một mức độ trung
bình liên tục.
Mặc dù phần lớn các chuỗi thời gian đƣợc sử dụng trong thực tế, tính dừng là
một giả định phổ biến, tuy nhiên dự báo chuỗi thời gian không dừng vẫn có tầm
quan trọng đáng kể. Ví dụ, trong kỹ thuật, kinh doanh, và kinh tế các dữ liệu quan
sát đƣợc thể hiện tốt hơn qua chuỗi thời gian không dừng. Ngoài ra, chuỗi thời gian
không dừng có thể đƣợc chuyển đổi thành các chuỗi thời gian có tính dừng tƣơng
đƣơng bằng cách lấy hiệu giữa các giá trị dữ liệu kế tiếp dọc theo mô hình chuỗi
7

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

thời gian. Cách tiếp cận này hay đƣợc sử dụng khi phân tích các chuỗi thời gian
không dừng. Để giải quyết vấn đề tính dừng thực nghiệm, chuỗi thời gian đầu tiên
phải đƣợc phân chia thành hai hoặc nhiều phân đoạn rõ ràng có tính dừng, sau đó
các thuộc tính tự tƣơng quan và quang phổ của mỗi phân đoạn đều đƣợc kiểm tra và
so sánh các kết quả.
1.1.2.2 Tuyến tính
Tính tuyến tính của một chuỗi thời gian chỉ ra hình dạng của chuỗi thời gian
phụ thuộc vào trạng thái của nó, do đó các trạng thái hiện hành xác định các mô
hình chuỗi thời gian. Nếu một chuỗi thời gian là tuyến tính, sau đó nó có thể đƣợc
thể hiện bằng một hàm tuyến tính của các giá trị hiện tại và giá trị quá khứ. Ví dụ
của thể hiện tuyến tính là các mô hình AR, MA, ARMA và ARIMA. Chuỗi thời
gian phi tuyến có thể đƣợc đại diện bởi các mô hình phi tuyến hay song tuyến tính
tƣơng ứng.
Chuỗi thời gian đại diện của mô hình tuyến tính: X
t
=





i
iti
Z


X
t
thƣờng mô tả một quá trình tuyến tính với
i

là một tập các hằng số thỏa
mãn điều kiện:



i
i

và |Z
t
| là một ồn trắng với giá trị trung bình 0 và biến
2

.
Dạng đa biến của một quá trình tuyến tính đƣợc xác định bởi mối quan hệ:
X
t
=





i
iti
ZC

Trong đó: C
i
là chuỗi các ma trận n×n với các phần tử có thể tính tổng; Z
t
là ồn
trắng với giá trị trung bình 0 và hiệp phƣơng sai ma trận

.
1.1.2.3 Tính xu hướng
Phân tích xu hƣớng là quan trọng trong dự báo chuỗi thời gian. Trong thực tế,
nó đƣợc thực hiện bằng cách sử dụng kỹ thuật hồi quy tuyến tính và phi tuyến giúp
xác định thành phần xu hƣớng không đơn điệu trong chuỗi thời gian.
8

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Ví dụ, để xác định các đặc tính của xu hƣớng hiện tại trong một chuỗi thời gian
là tuyến tính, cấp số nhân, hoặc đa thức liên quan thì các hàm dƣới đây đƣợc sử
dụng cho phù hợp với dữ liệu thu thập đƣợc:
x
t
=

tt



x
t
= exp(
tt


)
x
t
=
t
tt


2

1.1.2.4 Tính mùa vụ
Các tính chất mùa vụ của một chuỗi thời gian đƣợc thể hiện thông qua mô hình
dao động định kỳ của nó. Tính chất này là phổ biến hơn trong chuỗi thời gian kinh
tế và các quan sát đƣợc lấy từ cuộc sống thực, nơi mà các mô hình có thể lặp lại
hàng giờ, hàng ngày, hàng tuần, hàng tháng, hàng năm, v.v. Vì vậy, mục đích chính
của phân tích chuỗi thời gian theo mùa vụ là tập trung vào phát hiện của các thành
phần biến động định kỳ của nó và giải thích của chúng. Trong kỹ thuật, chuỗi thời
gian theo mùa đƣợc thấy trong các vấn đề của khí ga, điện, nƣớc, và hệ thống phân
phối khác, dự đoán nhu cầu tiêu dùng.
1.1.3 Phân chia chuỗi thời gian

Dựa vào các đặc tính của dữ liệu mà chuỗi thời gian đƣợc phân thành các loại
sau:
• Dừng và không dừng.
• Theo mùa vụ và không theo mùa vụ.
• Tuyến tính và phi tuyến.
• Đơn biến và đa biến.
• Hỗn loạn.
Chuỗi thời gian trong thực tế có thể có 2 hoặc nhiều hơn các thuộc tính đƣợc liệt kê
ở trên.
1.1.3.1 Chuỗi thời gian tuyến tính
Chuỗi thời gian tuyến tính đƣợc tạo ra thông qua quan sát của các quá trình
tuyến tính, một cách toán học, mô hình tuyến tính đƣợc định nghĩa:
9

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

y
t
=




i
j
jtx )(


Trong đó:




i
i
||


1.1.3.2 Chuỗi thời gian phi tuyến
Nhiều chuỗi thời gian trong kỹ thuật đòi hỏi mô hình phi tuyến. Một số chúng
đƣợc biểu diễn nhƣ mô hình song tuyến:
x
t
= z
t +
jtit
r
i
s
j
ij
q
j
jti
p
i
iti
zxczbxa

 






1 111

1.1.3.3 Chuỗi thời gian đơn biến
Chuỗi thời gian đơn biến là chuỗi thời gian thu đƣợc bằng cách lấy mẫu một
mô hình quan sát duy nhất, ví dụ nhƣ giá trị của một biến vật lý duy nhất hay của
một tín hiệu phụ thuộc vào thời gian duy nhất tại các khoảng thời gian bằng nhau.
Nhƣ vậy, trong chuỗi thời gian đơn biến thì thời gian là một biến ngầm thƣờng đƣợc
thay thế bằng một biến chỉ số. Nếu mẫu dữ liệu đƣợc lấy cách đều thì biến chỉ số có
thể bỏ qua. Trong trƣờng hợp một chuỗi thời gian đơn biến có thể đƣợc biểu diễn
chính xác bởi một mô hình toán học thì chuỗi thời gian đó đƣợc cho là xác định.
Nếu không, nếu chuỗi thời gian chỉ có thể đƣợc biểu diễn bằng một hàm phân bố
xác suất thì chuỗi thời gian đƣợc cho là không xác định hoặc ngẫu nhiên.
1.1.3.5 Chuỗi thời gian đa biến
Chuỗi thời gian đa biến đƣợc sinh ra bằng cách quan sát đồng thời hai hay
nhiều quá trình. Các giá trị quan sát thu đƣợc đƣợc thể hiện nhƣ là giá trị vector.
Các loại quan sát này rất phổ biến trong kỹ thuật, nơi hai hay nhiều biến vật lý
(nhiệt độ, áp suất, dòng chảy, .v.v) phải đƣợc lấy mẫu đồng thời để xây dựng mô
hình của hệ thống động. Chuỗi thời gian đa biến đƣợc hiểu nhƣ là một tập các
chuỗi thời gian xây dựng đồng thời , giá trị của mỗi phần của chuỗi vừa phụ thuộc
vào chính chuỗi đó, vừa phụ thuộc vào giá trị của chuỗi khác.
10

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1.1.3.6 Chuỗi thời gian hỗn loạn
Các thành phần ngẫu nhiên của một chuỗi thời gian chủ yếu rơi vào một trong

hai loại:
• Chúng thực sự ngẫu nhiên, nghĩa là các quan sát rút ra từ phân bổ xác suất
cơ bản đƣợc đặc trƣng bởi một hàm phân phối thống kê hoặc những thời điểm thống
kê dữ liệu, chẳng hạn nhƣ trung bình, phƣơng sai,
• Chúng là hỗn loạn, đặc trƣng bởi giá trị xuất hiện đƣợc phân phối ngẫu
nhiên và không định kỳ, nhƣng thực tế kết quả từ một quá trình hoàn toàn xác định.
Các thuộc tính chính của chuỗi thời gian hỗn loạn là không có tính chu kỳ nhất
định, tức là chúng có thể đƣợc biểu diễn bởi các giá trị có thể lặp lại ngẫu nhiên
nhiều lần mà không thuộc bất kỳ chu kỳ nhất định nào.
1.2 Mô hình chuỗi thời gian
Trong thống kê, hai mô hình hệ thống toán học cơ bản thƣờng đƣợc sử dụng là:
 Mô hình xác định: Về mặt toán học, nó đƣợc xem nhƣ là mô hình phân tích
biểu diễn bởi các quan hệ xác định giống nhƣ: x
t
= f(t) hoặc bởi biểu thức hồi quy:
x
t
= f(x
t-1
, x
t-2
, )
 Mô hình ngẫu nhiên: Về mặt thống kê, nó đƣợc xem nhƣ là hàm của các
biến ngẫu nhiên.
Mô hình toán học dùng cho phân tích chuỗi thời gian thông thƣờng gồm:
 Mô hình hồi quy.
 Mô hình miền thời gian.
 Mô hình miền tần số.
Trong đó mô hình miền thời gian bao gồm:
 Mô hình hàm chuyển.

 Mô hình trạng thái không gian.
1.3 Mô hình hồi quy
Mô hình hồi quy đƣợc xây dựng bằng việc sử dụng phân tích hồi quy. Đây là
phƣơng pháp dùng trong việc nghiên cứu mối quan hệ giữa biến, đánh giá và dự
11

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

đoán các giá trị có thể có của một biến bằng cách sử dụng giá trị của biến khác
trong cùng chuỗi thời gian.
Các mô hình hồi quy phổ biến nhất trong kỹ thuật gồm:
 Mô hình tự hồi quy (AR).
 Mô hình trung bình trƣợt (MA).
 Mô hình ARMA.
 Mô hình ARIMA.
 Mô hình CARIMA.
Trong luận văn này em chỉ đề cập đến 3 mô hình thƣờng gặp là: mô hình tự hồi
quy, mô hình trung bình trƣợt và mô hình ARMA.
1.3.1 Mô hình tự hồi quy (AR)
Mô hình tự hồi quy diễn tả giá trị hiện tại của chuỗi thời gia bằng một tập hợp
tuyến tính hữu hạn của các giá trị trƣớc đó bởi một số
t


x
t =
tvtvtt
xxx





2211
,
với α
1
tới α
v
là những tham số tự hồi quy,
t

là ồn trắng và v là bậc của mô hình.
Mô hình tự hồi quy sẽ có hiệu quả khi chuỗi thời gian để mô hình hóa có tính dừng.
Do một số kết quả có thể tích lũy nội bộ nên quá trình tự hồi quy chỉ ổn định nếu
giá trị của tham số α trong một phạm vi nhất định.
Sai số của phƣơng trình tự hồi quy thƣờng đƣợc tính:
ttt
xx


~

Nếu sử dụng biến Z thì sai số của nó sẽ là:

 ZZ
~
.
Từng số hạng riêng biệt của chuỗi thời gian là:
,
~

,
~
,
~
,
~
321  tttt
ZZZZ
thì kết quả trong
mô hình tự hồi quy:
tptptttt
aZZZZZ 

~

~~~~
332211


Trong đó
2
21
,, ,,,
ap

là những tham số chƣa biết sẽ đƣợc ƣớc lƣợng từ dữ
liệu quan sát. Toán tử tự hồi quy đƣợc đƣa ra:
p
p
BBBB


 1)(
2
21

12

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Mô hình tự hồi quy có thể viết ở dạng rút gọn:
tt
aZB 
~
)(


Mô hình chứa (p+2) tham số chƣa biết:
tpa
a,, ,,,
21
2


1.3.2 Mô hình trung bình trượt (MA)
Một cách tiếp cận khác thƣờng đƣợc dùng trong việc xây dựng mô hình của
chuỗi thời gian đơn biến là dựa trên mô hình trung bình trƣợt:
qtqttttt
aaaaaZ





~
332211

t
Z
~
đƣợc gọi là 1 tổng tuyến tính có trọng vô hạn của a
t
, a
t-1
, a
t-2
, ,a
t-q
.
Với toán tử trung bình trƣợt bậc q:
q
q
BBBBB

 1)(
3
3
2
21

Mô hình trung bình trƣợt có thể đƣợc viết ở dạng ngắn gọn:
tt

aBz )(
~



Trong mô hình có (q+2) tham số chƣa biết
2
321
,, ,,,,
aq

đƣợc ƣớc lƣợng
từ dữ liệu quan sát.
1.3.3 Mô hình ARMA
Sự kết hợp của mô hình tự hồi quy (AR) và mô hình trung bình trƣợt (MA) tạo
thành mô hình ARMA:
qtqttttptpttt
aaaaaZZZZ




~

~~~
3322112211

Mô hình đƣợc viết lại:
qtqttttptpttt
aaaaaZZZZ





~

~~~
3322112211

Sắp xếp lại nhƣ sau:
t
q
qt
p
p
aBBBBZBBB ) 1(
~
) 1(
3
3
2
21
2
21



Mô hình có thể viết gọn lại:
tt
aBZB )(

~
)(



Trong đó B là 1 toán tử trễ. Mô hình rút gọn chứa (p+q+2) tham số chƣa biết
p

, ,,,
21

2
321
,, ,,,
aq

sẽ đƣợc ƣớc lƣợng từ chuỗi dữ liệu thời gian đƣợc
đƣa ra.
13

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1.1.4 Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính
Mô hình ARMA thu đƣợc nhiều thành tựu khi áp dụng cho các chuỗi thời gian
xuất phát từ các lĩnh vực khoa học tự nhiên và kỹ thuật nhƣng chƣa đáp ứng tốt khi
áp dụng cho các chuỗi thời gian kinh tế tài chính. Nguyên nhân chính là giả thiết về
mặt toán học phƣơng sai của các chuỗi thời gian tài chính không thay đổi theo thời
gian là không phù hợp. Giả thiết đƣa ra là quá trình nhiễu là ồn trắng với phƣơng sai
không thay đổi nhƣng thực tế các nhiễu của các chuỗi thời gian tài chính lại có
phƣơng sai thay đổi theo thời gian và đó là dấu hiệu cho thấy mô hình Box-Jenkins

không thực sự phù hợp cho phân tích chuỗi thời gian tài chính. Để mở rộng ứng
dụng, nhiều tác giả đã chọn mô hình ARCH do Engle đƣa ra năm 1982. Mô hình
kiểu ARCH có khả năng giải thích đƣợc những biểu hiện của chuỗi thời gian tài
chính nhƣ tạo cụm biến động (volatility clustering), đặc điểm nặng đuôi (thick tail)
và hiệu ứng đòn bẩy (leverage effect) do đó thích hợp trong phân tích chuỗi thời
gian tài chính.
Mặc dù mô hình ARMA tỏ ra không phù hợp với chuỗi thời gian tài chính
nhƣng những kỹ thuật mà nó cung cấp là một cơ sở rất quan trọng và mang lại
nhiều gợi ý cho các công trình nghiên cứu về chuỗi thời gian sau Box-Jenkins.
14

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

CHƢƠNG 2
MÔ HÌNH CHUỖI THỜI GIAN MỜ CÓ TRỌNG SỐ BẬC CAO

Trong các bộ môn toán cơ bản, suy luận logic nguyên thuỷ hay logic rõ
với hai giá trị đúng/sai hay 1/0 đã rất quen thuộc. Tuy nhiên, các suy luận này
không đáp ứng đƣợc hầu hết các bài toán phức tạp nảy sinh trong thực tế nhƣ
những bài toán trong lĩnh vực điều khiển tối ƣu, nhận dạng hệ thống,… mà các
dữ liệu không đầy đủ, không đƣợc định nghĩa một cách rõ ràng. Trong những
năm cuối thập kỷ 20, một ngành khoa học mới đã đƣợc hình thành và phát triển
mạnh mẽ đó là hệ mờ. Đây là hệ thống làm việc với môi trƣờng không hoàn toàn
xác định, với các tham số, các chỉ tiêu kinh tế kỹ thuật, các dự báo về môi trƣờng
sản xuất kinh doanh chƣa hoặc khó xác định một cách thật rõ ràng, chặt chẽ.
Khái niệm logic mờ đƣợc giáo sƣ Lofti A.Zadeh đƣa ra lần đầu tiên vào năm
1965 tại Mỹ. Từ đó lý thuyết mờ đã đƣợc phát triển và ứng dụng rộng rãi.
Chƣơng này sẽ tập trung trình bày một số kiến thức cơ bản về chuỗi thời gian
mờ có trọng số bậc cao.
2.1 Tổng quan về tập mờ

2.1.1 Tập mờ
L.A. Zadeh đã sáng lập lý thuyết tập mờ, trong đó tập mờ đƣợc xem nhƣ là
một sự mở rộng trực tiếp của tập hợp kinh điển: Tập hợp kinh điển A

U có một
danh giới sắc nét, rõ ràng, và vì vậy nó đƣợc biểu thị bằng hàm đặc trƣng:








Auif
Auif
U
A
0
1
)(


Ví dụ, A là tập những ngƣời có tuổi dƣới 19 tuổi (điều kiện cần để tham gia
đội bóng U19) là một tập hợp kinh điển. Mỗi ngƣời (phần tử) chỉ có hai khả năng rõ
ràng: hoặc là phần tử của A hoặc không.
Tuy nhiên, ta xét tập à gồm những ngƣời là trẻ. Trong trƣờng hợp này sẽ
không có ranh giới rõ ràng để khẳng định một ngƣời có là phần tử của à hay
không: Ranh giới của nó là mờ. Ta chỉ có thể nói một ngƣời sẽ thuộc tập hợp à ở
15


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

một mức độ nào đó. Chẳng hạn, chúng ta có thể đồng ý với nhau rằng một ngƣời 35
tuổi thuộc về tập hợp à với độ thuộc là 60% hay 0,6. Và Zadeh gọi một tập à nhƣ
vậy là tập mờ và đồng nhất tập hợp à với một hàm
tre

:Y

[0,1], gọi là hàm thuộc
của tập à (membership function), trong đó Y là tập số tự nhiên dùng để đo độ tuổi
tính theo năm, gọi là không gian tham chiếu. Từ trẻ gọi là khái nhiệm mờ. Nhƣ vậy
mọi phần tử đều thuộc vào tập trẻ ở mức độ nào đó.
Định nghĩa 2.1: Cho Ω( Ω ≠ ) là không gian nền, một tập mờ A trên Ω
đƣợc xác định bởi hàm thuộc (membership function):

A
: Ω [0,1]
0 

A
(x)  1

A
(x): Chỉ độ thuộc (membership degree) của phần tử x vào tập mờ A (để
cho đơn giản trong cách viết, sau này ta ký hiệu A(x) thay cho hàm

A
(x))

Khoảng xác định của hàm

A
(x) là đoạn [0,1], trong đó giá trị 0 chỉ mức độ
không thuộc về còn giá trị 1 chỉ mức độ thuộc về hoàn toàn.
Nhƣ vậy tập mờ A hoàn toàn xác định trên tập các bộ đôi:
A=

(x,

A
(x))

x




Nếu Ω =

x
1
,x
2
, ,x
n
,

là một tập hữu hạn và A là tập mờ xác định trên Ω thì
thông thƣờng ta có ký hiệu:

n
nA
AA
x
x
x
x
x
x
A
)(

)()(
2
2
1
1




Ví dụ 1:
Xét một tập hợp của chiều cao con ngƣời, lấy tên là “cao”. Nhƣ ở hình 2.1 ta
thấy rằng chiều cao mà nhỏ hơn hoặc bằng 150 cm (điểm a) thì mức độ thuộc của
nó vào tập mờ “cao” là bằng 0. Điều này có nghĩa là những ngƣời mà có chiều cao
nhỏ hơn 150 cm thì không nằm trong tập này. Nếu chiều cao mà lớn hơn hoặc bằng
200 cm (điểm b) thì chắc chắn ngƣời này là cao. Do đó mức độ thuộc của nó vào
tập mờ “cao” là 1. Nếu chiều cao lớn hơn 150 cm và nhỏ hơn 200 cm thì mức độ
thỏa mãn có thể nói là tăng lên hoặc giảm đi. Nếu chúng ta xét một ngƣời cao 185
16


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

cm (điểm u) thì mức độ thuộc là 0,8. Trong toán học, các hàm thuộc này có thể
đƣợc định nghĩa nhƣ sau:













xb
bxa
ab
ax
ax
x
Tall
,1
,
,0
)(




Hình 2.1 Hàm liên thuộc của tập mờ “cao”
Trong trƣờng hợp tập mờ A là một tập bình thƣờng, hàm thuộc đƣợc rút gọn
nhƣ sau:


Hàm này chỉ có 2 đầu ra là 0 hoặc 1. Khi ,

A
(x) =1 thì x thuộc A, ngƣợc lại x
không thuộc A.
2.1.2 Quan hệ mờ
Định nghĩa 2.2: Cho X, Y là hai không gian nền. R gọi là một quan hệ mờ trên
X × Y nếu R là một tập mờ trên X × Y, tức là có một hàm thuộc:

R
: X × Y

[0,1], ở đây

R
(x,y) = R(x,y) là độ thuộc của (x,y) vào quan hệ R.
Quan hệ mờ n ngôi là một tập mờ R trong không gian tích Đe-cac của n không
gian U
1
x U
2
x … x U
n

.
Quan hệ mờ 2 ngôi R(u,v) gọi là:
 Đối xứng nếu
),( vu
R

=
),( uv
R

.






Ax
Ax
x
Tall
,1
,0
)(

17

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

 Phản xạ nếu

),( uu
R

= 1,
Uu
.
 Phản phản xạ nếu
),( uu
R

= 0,
Uu
.
 Bắc cầu Max – Min nếu
),( vu
R



{
),( wu
R

˄
),( vw
R

: w
U
}

 Bắc cầu Min – Max nếu
),( vu
R



{
),( wu
R


),( vw
R

: w
U
}
 Phép hợp thành R

S với R
UWSWU  ,
đƣợc định nghĩa nhƣ sau:

Uwvwwuvu
SRSR
 :),(),(),(



R là quan hệ tƣơng tự (quan hệ tƣơng đƣơng mờ) nếu nó có các tính chất:

- Phản xạ.
- Đối xứng.
- Bắc cầu.
R là quan hệ không tƣơng tự nếu nó là phần bù của một quan hệ tƣơng tự hay
một cách tƣơng đƣơng nó thỏa mãn các tính chất:
- Phản phản xạ.
- Phản đối xứng.
- Bắc cầu Min – Max.
R là quan hệ giống nhau nếu nó thỏa mãn:
- Phản xạ.
- Đối xứng.
R là quan hệ không giống nhau nếu nó là phần bù của quan hệ giống nhau,
tức là:
- Phản phản xạ.
- Đối xứng.
Các quan hệ mờ là cơ sở dùng để tính toán và suy diễn (suy luận xấp xỉ) mờ.
Đây là một trong những vấn đề quan trọng trong các ứng dụng mờ đem lại hiệu quả
lớn trong thực tế, mô phỏng đƣợc một phần suy nghĩ của con ngƣời. Chính vì vậy,
mà các phƣơng pháp mờ đƣợc nghiên cứu và phát triển mạnh mẽ. Một trong số đó

×