ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN NGỌC LINH
XÁC ĐỊNH ĐỘ DÀI KHOẢNG TRONG MÔ HÌNH DỰ BÁO
CHUỖI THỜI GIAN MỜ
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên– 2016
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN NGỌC LINH
XÁC ĐỊNH ĐỘ DÀI KHOẢNG TRONG MÔ HÌNH DỰ BÁO
CHUỖI THỜI GIAN MỜ
Chuyên ngành
: Khoa học máy tính
Mã số
: 60 48 0101
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC:TS. Nguyễn Công Điều
Thái Nguyên – 2016
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết
quảnêu trong luận văn là trung thực và chưa từng được ai công bố trong bất
kỳ công trình nào khác.
Tác giả luận văn
Nguyễn Ngọc Linh
i
MỤC LỤC
Trang
Trang phụ bìa
MỤC LỤC ...................................................................................................... i
MỞ ĐẦU ....................................................................................................... 1
CHƯƠNG 1: CÁC KIẾN THỨC CƠ BẢN VỀ TẬP MỜ, ............................. 4
CHUỖI THỜI GIAN VÀ CHUỖI THỜI GIAN MỜ...................................... 4
1.1. Lý thuyết tập mờ [1] ................................................................................ 4
1.1.1. Tập mờ ................................................................................................. 4
1.1.2. Các phép toán trên tập mờ .................................................................... 5
1.2. Các quan hệ và suy luận xấp xỉ, suy diễn mờ [1] ..................................... 7
1.2.1. Quan hệ mờ .......................................................................................... 7
1.2.2. Suy luận xấp xỉ và suy diễn mờ ............................................................ 9
1.2.3. Bộ mờ hoá .......................................................................................... 10
1.2.4. Hệ luật mờ .......................................................................................... 11
1.2.5. Động cơ suy diễn ................................................................................ 11
1.2.6. Bộ giải mờ .......................................................................................... 12
1.3. Chuỗi thời gian và quá trình ngẫu nhiên ................................................ 13
1.3.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên ............................. 13
1.3.2. Hàm tự tương quan ............................................................................. 14
1.3.3. Quá trình ARMA ................................................................................ 15
1.4. Các khái niệm về chuỗi thời gian mờ..................................................... 19
1.4.1. Các định nghĩa.................................................................................... 19
1.4.2 Một số mô hình chuỗi thời gian mờ ..................................................... 21
CHƯƠNG 2: CÁC PHƯƠNG PHÁP CHIA KHOẢNG CỦA HUARNG .... 25
2.1. Phương pháp tính độ dài phân bố .......................................................... 25
2.2. Phương pháp tính độ dài dựa trên mức trung bình ................................. 28
2.3. Phương pháp tính độ dài khoảng thời gian dựa theo tỷ lệ ...................... 29
ii
CHƯƠNG 3: TÍNH TOÁN THỬ NGHIỆM VÀ CÁC ĐÁNH GIÁ ............. 32
3.1. Tính toán thử nghiệm ............................................................................ 32
3.2 Đánh giá các phương pháp chia khoảng ................................................. 59
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI ............................. 61
PHỤ LỤC .................................................................................................... 63
iii
DANH MỤC HÌNH VẼ, BẢNG BIỂU, ĐỒ THỊ
Hình 1.1. Giao hai tập mờ có cùng không gian nền ........................................ 6
Hình 1.2. Hợp hai tập mờ có cùng không gian nền ........................................ 6
Bảng 1.1 Một số phép kéo theo mờ thông dụng............................................. 7
Hình 1.3.Hình vẽ biểu diễn theo biểu đồ sagital ............................................. 8
Hình 1.4. Số lượng hàng hóa đã bán được trong siêu thị............................... 13
Bảng 2.1 Cơ sở ánh xạ.................................................................................. 26
Bảng 2.2 Bảng cơ sở .................................................................................... 29
Bảng 3.1. Bảng số liệu chỉ số tiêu dùng cả nước trong tháng 1 từ ................. 32
năm 1995 đến năm 2014 .............................................................................. 32
Bảng 3.2. Bảng tính hiệu số tuyệt đối theo phương pháp tính độ dài phân bố33
Bảng 3.3. Bảng tính số lượng các hiệu số sai phân bậc 1 theo phương pháp
tính độ dài phân bố ....................................................................................... 34
Bảng 3.4. Bảng mờ hóa và nhóm mối quan hệ mờ ....................................... 35
Bảng 3.5. Giải mờ và kết quả dự báo theo phương pháp tính độ dài phân bố 36
Bảng 3.6. Bảng mờ hóa và nhóm mối quan hệ mờ ....................................... 38
Bảng 3.7. Giải mờ và kết quả dự báo tính độ dài dựa trên mức trung bình. .. 38
Bảng 3.8. Kết quả tính toán sự khác biệt tương đối cho mỗi sự tuyệt đối ..... 39
Bảng 3.9. Kết quả tính thứ tự ri.................................................................... 39
Bảng 3.10. Mối quan hệ mờ và nhóm mối quan hệ mờ................................. 41
Bảng 3.11. Kết quả dự báo theo phương pháp tính độ dài khoảng thời gian
dựa theo tỷ lệ ................................................................................................ 41
Bảng 3.12. So sánh các phương pháp chia khoảng ....................................... 42
Đồ thị 3.1 So sánh các kết quả dự báo chỉ số giá tiêu dùng của cả nước trong
tháng 1 từ năm 1995 đến năm 2014 .............................................................. 43
Bảng 3.13. Bảng số liệu chỉ số Vn-index trong tháng 9 và tháng 10 năm
2015 ............................................................................................................. 44
iv
Bảng 3.14. Bảng tính hiệu số tuyệt đối theo phương pháp tính độ dài
phân bố ........................................................................................................ 45
Bảng 3.15. Bảng tính số lượng các hiệu sai số phân bậc 1 theo phương pháp
tính độ dài phân bố ....................................................................................... 46
Bảng 3.16 Bảng mờ hóa và nhóm các mối quan hệ mờ ................................ 47
Bảng 3.17. Kết quả dự báo theo phương pháp tính độ dài phân bố ............... 48
Bảng 3.18. Mờ hóa và nhóm mối quan hệ mờ .............................................. 50
Bảng 3.19. Kết quả dự báo theo phương pháp tính độ dài trên mức trung
bình .............................................................................................................. 50
Bảng 3.20. Kết quả tính toán sự khác biệt tương đối cho mỗi sự tuyệt đối ... 52
Bảng 3.21 Bảng kết quả tính thứ tự ri ........................................................... 53
Bảng 3.22. Bảng thiết lập mối quan hệ mờ và nhóm mối quan hệ mờ .......... 55
Bảng 3.23. Kết quả dự báo phương pháp tính độ dài khoảng thời gian ......... 55
dựa theo tỷ lệ ................................................................................................ 55
Bảng 3.24. Bảng so sánh kết quả dự báo các phương pháp chia khoảng ....... 56
Hình 3.2. Đồ thị so sánh các kết quả dự báo chỉ số VN-index với giá trị
thực .............................................................................................................. 58
-1
MỞ ĐẦU
Chuỗi thời gian là một công cụ xử lý dữ liệu hữu hiệu trong thống
kê.Mô hình được sử dụng rộng rãi nhất để phân tích chuỗi thời gian trong
thống kê là mô hình ARMA do Box-Jenkins đề xuất. Tuy nhiên trên thực tế
có khá nhiều chuỗi số liệu không thoả mãn được các tính chất để có thể xử lý
được bằng công cụ thống kê như mô hình ARMA. Do vậy cần có những công
cụ để có thể xử lý được những trường hợp đặc trưng này. Mô hình chuỗi thời
gian mờ là một công cụ được phát triển nhằm đáp ứng nhu cầu này.
Chuỗi thời gian mờ và mô hình chuỗi thời gian mờ bậc nhất do Song và
Chissom [9] phát triển từ năm 1993. Sau công trình này, nhiều bài báo của
nhiều tác giả khác nhau tiếp tục dựa trên ý tưởng này để dự báo chuỗi thời
gian và ứng dụng trong nhiều lĩnh vực khác nhau như dự báo dân số, tài
chính, nhiệt độ, nhu cầu điện, vv...
Sự phát triển của mô hình chuỗi thời gian mờ có tiến bộ vượt bậc khi
năm 1996 Chen [10] đã đưa ra phương pháp mới đơn giản và hữu hiệu hơn so
với phương pháp của Song và Chissom bằng cách sử dụng các phép tính số
học thay vì các phép tính hợp max-min phức tạp trong xử lý mối quan hệ mờ.
Phương pháp của Chen đã làm giảm khá nhiều về độ phức tạp của thuật toán.
Nhiều công trình tiếp theo đã sử dụng cách tiếp cận này để dự báo cho chuỗi
thời gian. Huarng đã sử dụng các thông tin có trước trong tính chất của chuỗi
thời gian như mức độ tăng giảm để đưa ra mô hình heuristic chuỗi thời gian
mờ.
Để nâng cao hiệu quả và độ chính xác của thuật toán, những năm gần
đây đã có hàng loạt công trình đưa ra nhiều kỹ thuật khác nhau. Những công
cụ trong lý thuyết tính toán mềm, khai phá dữ liệu, mạng nơ ron và các giải
thuật tiến hoá, tối ưu bầy đàn đều được đưa vào sử dụng. Một trong các
hướng được phát triển là sử dụng mối quan hệ mờ bậc cao trong mô hình
-2
chuỗi thời gian mờ.Chen [11] tiếp tục là người đi đầu khi xây dựng được
thuật toán để xử lý mối quan hệ mờ bậc cao. Các công trình tiếp theo của
Chen đã đề cập đến khái niệm mô hình chuỗi thời gian mờ hai nhân tố kết hợp
với mối quan hệ logic mờ bậc cao. Sau đó hướng này được một số tác giả
khác tiếp cận và ứng dụng trong các công trình của mình.
Năm 2001 Huarng đã chú ý đến vai trò của việc phân khoảng trong mô
hình chuỗi thời gian mờ. Ông nhận xét rằng: nhiều nhà khoa học đã cho thấy
cách phân chia khoảng có ảnh hưởng rất lớn đến độ chính xác của thuật toán.
Nếu phân các khoảng có độ dài lớn thì số phép tính giảm nhưng sẽ có sự phân
tán kết quả, còn nếu chia khoảng nhỏ mất ý nghĩa của dự báo.Các tác giả có
đề xuất nhiều cách khác nhau để phân khoảng như chia ngẫu nhiên, dựa vào
giá trị trung bình, dựa vào phân bố hay dựa vào mật độ phân bố.Mỗi phương
pháp được sử dụng trong các trường hợp khác nhau và đều cho kết quả tốt
hơn so với phương pháp truyền thống.Như vậy cũng có thể thấy rõ sự ảnh
hưởng của phương pháp chia khoảng đến kết quả dự báo.Ngoài ra còn có một
số công trình khác đề xuất thêm các thuật toán chia khoảng khác nhau như
trong các bài báo [2], [5],[6].
Dự báo chuỗi thời gian sử dụng mô hình chuỗi thời gian mờ có một số
bước cơ bản như sau: Xác định tập nền, phân chia tập nền thành các khoảng,
Mờ hoá các giá trị lịch sử, Xác định các mối quan hệ mờ, Dự báo và cuối
cùng là giải mờ. Vấn đề tính độ dài của khoảng trong phân chia tập nền của
thuật toán có ảnh hưởng lớn đến độ chính xác của mô hình dự báo. Đã xuất
hiện khá nhiều phương pháp tính độ dài của khoảng của các tác giả khác
nhau. Mặc dù vậy các thuật toán này có những ảnh hưởng khác nhau đến kết
quả dự báo. Nghiên cứu ảnh hưởng các cách chọn khoảng của các thuật toán
khác nhau đến độ chính xác của dự báo chuỗi thời gian cũng là một bài toán
khá lý thú và cần có những đánh giá và tổng kết các phép phân chia này để
sử dụng trong nhiều bài toán khác nhau. Chính vì lý do này, em đã lựa chọn
-3
đề tài “Xác định độ dài khoảng trong mô hình dự báo chuỗi thời gian mờ”
làm đề tài cho luận văn tốt nghiệp của mình.
Nội dung chính của luận văn có cấu trúc như sau:
Chương 1: Các kiến thức cơ bản về tập mờ, chuỗi thời gian và chuỗi
thời gian mờ.
Chương 2: Các phương pháp chia khoảng của Huarng
Chương 3: Tính toán thử nghiệm và các đánh giá
Luận văn của em được hoàn thành dưới sự hướng dẫn tận tình của TS.
Nguyễn Công Điều, em xin bày tỏ lòng biết ơn chân thành của mình đối với
thầy. Em cũng xin chân thành cảm ơn các thầy cô giáo Viện Công nghệ thông
tin, trường Đại học Công nghệ thông tin và Truyền thông đã tham gia giảng
dạy, giúp đỡ em trong suốt quá trình học tập nâng cao trình độ kiến thức. Mặc
dù đã có nhiều cố gắng hoàn thiện luận văn bằng tất cả nhiệt huyết và năng
lực của mình, tuy nhiên luận văn không thể tránh khỏi những thiếu sót, em rất
mong nhận được sự đóng góp của quý thầy cô và các bạn./.
-4
CHƯƠNG 1: CÁC KIẾN THỨC CƠ BẢN VỀ TẬP MỜ,
CHUỖI THỜI GIAN VÀ CHUỖI THỜI GIAN MỜ
Chương 1 giới thiệu các kiến thức cơ bản về tập mờ, chuỗi thời gian và
chuỗi thời gian mờ, trình bày về mô hình quy trình trượt ARMA
(Autoregressive Moving Average) và một số mô hình chuỗi thời gian mờ.
1.1. Lý thuyết tập mờ [1]
1.1.1. Tập mờ
Định nghĩa: Cho Ω( Ω ≠ ) là không gian nền, một tập mờ A trên Ω
được xác định bởi hàm thuộc (membership function):
A: Ω [0,1]
0 A(x) 1
A(x): Chỉ độ thuộc (membership degree) của phần tử x vào tập mờ A
(để cho đơn giản trong cách viết, sau này ta ký hiệu A(x) thay cho hàm A(x))
Khoảng xác định của hàm A(x) là đoạn [0,1], trong đó giá trị 0 chỉ mức
độ không thuộc về còn giá trị 1 chỉ mức độ thuộc về hoàn toàn.
Như vậy tập mờ A hoàn toàn xác định trên tập các bộ đôi:
A=(x,A(x))xΩ
Nếu Ω =x1,x2,...,xn,là một tập hữu hạn và A là tập mờ xác định trên Ω
thì thông thường ta có ký hiệu:
A = 1 /x1 + 2 / x2 +...+ n/ xn
Ví dụ 1: Cho Ω = {1, 2, 3, 4, 5}, tập mờ A trên Ω tương ứng với ánh
xạ μA như sau: μA : 1 → 0; 2 → 1; 3 → 0.5; 4 → 0.3; 5 → 0.2. Ta có tập
mờ A = {(1,0), (2,1), (3,0.5), (4,0.3), (5,0.2)}.Cách viết trên là sự liệt kê các
phần tử khác nhau cùng với mức độ thuộc về tập hợp A.
Từ định nghĩa trên chúng ta có thể suy ra: - Tập mờ A là rỗng nếu và
chỉ nếu hàm thuộc về μA(a)= 0 ,∀a∈ Ω - Tập mờ A là toàn phần nếu và chỉ
-5
nếu μA(a) = 1 ,∀a∈ Ω Lý thuyết tập mờ và logic mờ 4/14 - Hai tập mờ A và
B bằng nhau nếu μA(x) = μB(x) với mọi x trong Ω .
1.1.2. Các phép toán trên tập mờ
Xây dựng những phép toán trên tập mờ là việc xác định các hàm thuộc
cho phép hợp, giao, bù từ những tập mờ.Mỗi nguyên tắc cơ bản trong việc
xây dựng các phép toán trên tập mờ là không được mâu thuẫn với phép toán
đã có trong lý thuyết tập hợp kinh điển.
1.1.2.1. Phần bù của tập mờ
Định nghĩa 1.1: (Hàm phủ định): Hàm n: [0,1] không tăng thỏa mãn
các điều kiện n(0) = 1, n(1) = 0 được gọi là hàm phủ định (negation function).
Định nghĩa 1.2: (Phần bù của một tập mờ): Cho n là hàm phủ định,
phần bù Ac của tập mờ A là một tập mờ với hàm thuộc được xác định bởi:
μ AC(a) = n(μA(a)) , với mỗi a∈ Ω
1.1.2.2. Phép giao hai tập mờ
Định nghĩa 1.3 (T - chuẩn): Hàm T: [0,1]2 [0,1] là một T - chuẩn
(phép hội) khi và chỉ khi thoả mãn các điều kiện sau:
1. T(1, x) = x, với mọi 0 x 1.
2. T có tính giao hoán : T(x,y) = T(y,x), với mọi 0 x, y 1.
3. T không giảm: T(x,y)=T(u,v), với mọi x u, y v.
4. T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),z), với mọi 0 x,y, z1.
Định nghĩa 1.4 (Phép giao hai tập mờ): Cho hai tập mờ A, B trên cùng
không gian nền với hàm thuộc A(x), B(x) tương ứng. Cho T là một TChuẩn. Phép giao của hai tập mờ A,B là một tập mờ (ký hiệu (ATB)) trên
với hàm thuộc cho bởi biểu thức:
(ATB)(x) = T(A(x), B(x)), với mỗi x
-6
A∩TB(x)
A (x)
B (x)
Hình 1.1. Giao hai tập mờ có cùng
ùng không gian
1.1.2.3. Phép hợp
ợp hai tập mờ
Định nghĩa 1.5(T
(T - đối chuẩn): Hàm S:[0,1]2 được gọii là một
m T - đối
chuẩn (phép tuyển) nếu
u thoả
tho mãn các điều kiện sau:
1. S(0,x)
(0,x) = x, với
v mọi 0 x 1.
2. S có tính giao hoán ::S(x,y)= S(y,x) với mọi 0 x, y 1.
3. S không giảm:
gi
S(x,y) = S(u,v), với mọi x u, y v.
4. S có tính kết
k hợp: S(x,S(y,z)) = S(S(x,y),z) với mọii 0 x, y, z1.
Định nghĩa 1.6 (phép h
hợp hai tập mờ): Cho hai tập mờ A, B trên cùng
không gian nền vớii hàm thu
thuộc A(x), B(x) tương ứng.
ng. Cho S là một T - đối
chuẩn. Phép hợp củaa hai ttập mờ A, B là một tập mờ (kí hiệu (A
ASB)) trên
với hàm thuộc cho bởii bi
biểu thức: (ASB)(x)=S(A(x),B(x)), vớii mỗi
m x
A
SB(x)
A(x)
B(x)
Hình1.2.
Hình
Hợp hai tập mờ có cùng
ùng không gian nền
n
-7
1.1.2.4. Phép kéo theo
Cho (T, S, n) là một bộ ba DeMorgan với n là phép phủ định, phép kéo
theo lS(x,y) hay xy được xác định trên khoảng [0,1]2 được định nghĩa bằng
biểu thức sau đây: lS(x,y) = S(T(x,y),n(x))
Bảng 1.1dưới đây sẽ liệt kê một số phép kéo theo mờ hay được sử dụng
nhất.
Bảng 1.1 Một số phép kéo theo mờ thông dụng
STT
Tên
Biểu thức xác định
1
Early Zadeh
xy = max(1-x,min(x,y))
2
Lukasiewicz
xy = min(1,1- x+y)
3
Mandani
xy = min(x,y)
4
Larsen
xy = x.y
5
Standard Strict
if
xy = 10
other
Godel
if
xy = 1y other
6
x y
x y
if x y
other
7
Gaines
xy = 1y
x
8
Kleene – Dienes
xy = max(1 –x,y)
9
10
Kleene – Dienes -Lukasiwicz
Yager
xy = 1- x + y
xy = yx
1.2. Các quan hệ và suy luận xấp xỉ, suy diễn mờ [1]
1.2.1. Quan hệ mờ
Quan hệ mờ R trên các tập X và Y là một tập mờ xác định trên tập tích
của các tập nền X x Y. Các phần tử (x,y) của tập X x Y có các mức độ thành
viên lên quan hệ khác nhau. Ta có: µR = X x Y →[0,1]
-8
Mức độ thành viên µR (x,y) chỉ mức quan hệ giữa các phần tử x và y
của tập nền X và Y lên quan hệ R hay mức độ quan hệ của các phần tử x và y
theo ý nghĩa quan hệ đã định.Quan hệ mờ có thể biểu diễn dưới dạng: hàm
thành viên, ma trận quan hệ, biểu đồ Sagital.
Ví dụ: Cho tập X gồm các thành phố: Yên Bái–Y, Lao Cai– L:
X={Y,L}
Cho tập Y gồm các thành phố Yên Bái Y, Cần Thơ- T, Nha Trang-N:
Y = { Y, T, N}
Gọi R là quan hệ mờ “rất xa” giữa các thành phố của tập X và các
thành phố tập Y, được biểu diễn theo hàm thành viên:
Quan hệ có thể liệt kê như sau:
R(X,Y) = 1/<Y, T> +0/<Y, Y>+0.6/<Y, N>+0.9/<L, T >+0.7/< L,
Y>+0.3/<L,N>
Biểu diễn ma trận quan hệ: R = [rx,y]
=
1
0 0,6
0,9 0,7 0,3
Biểu diễn theo biểu đồ sagital:
Y
T
Y
L
N
Hình 1.3.Hình vẽ biểu diễn theo biểu đồ sagital
-9
1.2.2. Suy luận xấp xỉ và suy diễn mờ
Suy luận xấp xỉ hay còn gọi là suy luận mờ - đó là quá trình suy ra
những kết luận dưới dạng các mệnh đề trong điều kiện các quy tắc, các luật,
các dữ liệu đầu vào cho trước cũng không hoàn toàn xác định.
Trong giải tích toán học chúng ta sử dụng mô hình sau để lập luận:
Định lý: “Nếu một hàm số là khả vi thì nó liên tục”
Sự kiện: Hàm khả vi
Kết luận: Hàm là liên tục
Đây là dạng suy luận dựa vào luật logic cổ điển Modus Ponens. Căn cứ
vào mô hình này chúng ta sẽ diễn đạt cách suy luận trên dưới dạng sao cho nó
có thể suy rộng cho logic mờ.
Gọi là không gian tất cả các hàm số, ví dụ ={g:RR}. A là các tập
các hàm khả vi, B là tập các hàm liên tục. Xét hai mệnh đề sau: P=’gA’ và
Q =’gB’. Khi đó ta có:
Luật (tri thức):
PQ
Sự kiện:
P đúng (True)
Kết luận:
Q đúng (True)
Xét bài toán suy luận trong hệ mờ
Hệ mờ n biến vào x1, …..xn và một biến ra y
Cho Un, i= 1..n là các không gian nền của các biến vào, V là không
gian nền của biến ra.
Hệ được xác định bởi m luật mờ:
R1: Nếu x1 là A11và x2 và ….xn là A1n thì y là B1
R2: Nếu x1 là A21 và x2 là A22 và…xn là A2n thì y là B2
...............................................................................
Rm: Nếu x1 là Am1 và x2 là Am2 và ……xn là Amn thì y là Bm
Thông tin đầu vào:
-10
X1 là A01 và x2 là A02 và….x0n là A0n
Tính: y là B0
Trong đó biến mờ ji, i 1, n, j 1, m xác định trên không gian nền U, biến
mờ Bj, ( j 1, n) xác định trên không gian nền V.
Để giải bài toán này chúng ta phải thực hiện qua các bước sau:
1. Xác định các tập mờ của các biến đầu vào.
2. Xác định độ liên thuộc tại các tập mờ tương ứng.
3. Xác định các quan hệ mờ R(A.B)(u,v).
4. Xác định phép hợp thành.
Tính B’ theo công thức: B’ = A’R(A,B)(u,v).
1.2.3. Bộ mờ hoá
Thực hiện việc ánh xạ từ không gian đầu vào S vào các tập mờ xác
định trong S được cho bởi hàm thuộc : S [0,1]. Bộ phận này có chức năng
chính dùng để chuyển một giá trị rõ x X thành một giá trị mờ trong S U
(U là không gian nền). Có hai phương pháp mờ hoá như sau:
Singleton fuzzifiter: Tập mờ A với x1 và hàm liên thuộc được định
nghĩa như sau:
Thực hiện việc ánh xạ từ không gian đầu vào S vào các tập mờ xác
định trong S được cho bởi hàm thuộc : S [0,1]. Bộ phận này có chức
năng chính dùng để chuyển một giá trị rõ x X thành một giá trị mờ trong
S U (U là không gian nền). Có hai phương pháp mờ hoá:
1 if x = xi
A(x) =
0 if x xi
No – Singleton fuzziffier: Với các hàm liên thuộc nhận giá trị lớn nhất là 1
tạo x = xi và giảm dần từ 1 đến 0 với các giá trị dịch chuyển x x1.
-11
1.2.4. Hệ luật mờ
Gồm nhiều mệnh đề dạng:
IF<tập các điều kiện được thoả mãn>THEN<tập các hệ quả>
Giả sử hệ luật gồm M luật Rj (j= 1, M ) dạng
Rj: IF x1 is Ai and x2 is A2 and .....x n is Anj THEN y is Bj
Trong đó xi (i =1, n ) là các biến đầu vào hệ mờ, y là biến đầu ra của hệ
mờ - các biến ngôn ngữ, A j là các tập mờ trong các tập đầu vào X và B j là
i
các tập mờ trong các tập đầu ra Y – các giá trị của biến ngôn ngữ (ví dụ: “Rất
nhỏ”, “nhỏ”, “Trung bình”, “Lớn”, “Rất lớn”,)đặc trưng bởi các hàm thuộc
và . Khi đó R j là một quan hệ mờ từ các tập mờ đầu vào X = X1
j
A
B
i
j
X2...... Xn tới các tập mờ đầu ra Y.
1.2.5. Động cơ suy diễn
Đây là một bộ phận logic đưa ra quyết định sử dụng hệ mờ để thực hiện
ánh xạ từ các tập mờ trong không gian đầu vào X thành tập mờ trong không
gian đầu ra Y.
Khi Rj là một quan hệ mờ, thì Rj có thể là một tập con của tích Decart X
Y = ( x , y ) : x X , y Y , với x ( x1, x2, ......, xn )T . Vì vậy, quan hệ Rj là
một hàm ánh xạ từ tập mờ trong X tới tập mờ trong Y, A1j xA2j ....A j B j
n
được gọi là một dạng suy diễn mờ (để cho gọn, ta ký hiệu Aj = A1j xA2j ...Anj )
Giả sử A là một tập mờ trong X và là đầu vào của bộ suy diễn. Khi đó
mỗi luật Rj tạo ra một tập mờ Bj trong Y như sau:
Bj = A Rj = sup (A*Rj)
Với * là một toán tử T - chuẩn. Do tính kết hợp, ta có thể định nghĩa:
T2(x,y) = T(x,y)
-12
T3(x,y,z) = T(x,T2(y,z)) với 0 x, y, z1
........
Dùng quy nạp ta định nghĩa:
Tn(x1,x2,..., .xn) = T(x1, T n-1(x2,....xn)) với 0 xi 1
Quan hệ Rj được định nghĩa thông qua hàm phụ thuộc sau:
j ( x , y)
A B
R
(
x
,
y
)
T
(
(
j
j x ), j ( y)))
A
B
T (T n ( j ( x1),..., i ( xn )), A ( xn ))
An
n
A
1
Và hàm liên thuộc của tập A là
A ( x ) T n ( ( x1 ), A ( x 2 ),... A ( x n ))
2
n
Do đó, hàm liên thuộc của tập mờ đầu ra được tính như sau:
B ( y ) sup
j
x U
A (x ) *
R
j
( x , y)
1.2.6. Bộ giải mờ
Đây là một ánh xạ từ các từ các tập mờ trong R thành các giá trị rõ ràng
trong R làm đầu ra từ hàm thuộc của giá trị mờ đầu ra. Có nhiều phép giải
mờ, với mỗi ứng dụng sẽ có một phương thức giải mờ khác nhau tuỳ thuộc
yêu cầu ứng dụng.Dưới đây sẽ liệt kê một số phương thức giải mờ thông
dụng.
Phương pháp độ cao:
M j
j
y j (y )
B
'
i
1
yh ( x ) M
j
(y )
i1 B ' j
-13
Với j là chỉ số luật, y-j là điểm có độ liên thuộc lớn nhất trong tập mờ
đầu
ra
B’j,
thứ
j
và
(y
B, j
j
)
được
tính
theo
công
thức
A ( x ) T n ( ( x1 ), A ( x 2 ),... A ( x n )) như sau:
2
n
j ( y j ) j ( y j )* A ( x '1 )* A ( x2' )*....* A ( xn' )
n
B
B'
1
2
Phương pháp trọng tâm:
N
yi B ( yi )
i
1
yc ( x )
N
(y )
i 1 B i
1.3. Chuỗi thời gian và quá trình ngẫu nhiên
1.3.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x1, x2,…… xn}
được xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm
đầu tiên, x2 là quan sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm thứ n.
Ví dụ, số lượng thí sinh dự thi đại học vào Trường Đại học Công nghệ
thông tin và truyền thông Thái Nguyên được lưu trữ theo từng năm, hay số
lượng hàng hóa đã bán được của một siêu thị được lưu trữ theo từng quý, độ
Hàng hóa (cái)
tăng nhiệt độ hàng năm… là các dữ liệu chuỗi thời gian.
Năm
Hình 1.4.Số lượng hàng hóa đã bán được trong siêu thị
-14
Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình
toán học phù hợp với tập dữ liệu cho trước X:={x1, x2,……… xn} nào đó. Để
có thể nói về bản chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan
sát xt là một giá trị thể hiện của biến ngẫu nhiên Xt với tT. Ở đây T được gọi
là tập chỉ số. Khi đó ta có thể coi tập dữ liệu X:={x1, x2,……… xn} là thể hiện
của quá trình ngẫu nhiên Xt, tT. Và vì vậy, ta có thể định nghĩa một quá
trình ngẫu nhiên như sau:
Định nghĩa Quá trình ngẫu nhiên
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên Xt, tT
được định nghĩa trên một không gian xác suất(, ,).
Chú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm,
ví dụ như là tập {1,2..} hay tập (-,+). Cũng có những quá trình ngẫu nhiên có T
không phải là một tập con của R nhưng trong giới hạn của luận văn này chỉ xét
cho trường hợp TR. Và thường thì ta xem T là các tập các số nguyên, khi đó ta
sẽ sử dụng ký hiệu tập chỉ số là Z thay vì T ở trên. Một điểm chú ý nữa là trong
luận văn này sẽ dùng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng như
quá trình có dữ liệu đó là một thể hiện.
1.3.2. Hàm tự tương quan
Việc đánh giá các hệ số tự tương quan có ý nghĩa quan trọng trong việc
phân tích chuỗi thời gian. Hàm tự tương quan của dữ liệu giúp ta xác định
được các thành phần của chuỗi thời gian từ đó có thể lựa chọn mô hình dự
báo hợp lý cũng như việc đánh giá tính đầy đủ của mô hình.
Định nghĩa:Hàm tự tương quan của quá trình ngẫu nhiên Xt, t Z
được định nghĩa tại trễ h như sau:
(h): = (h)/(0):=corr(Xt+h,Xt), t, hZ
Chú ý:
-15
Trong thực tế, ta chỉ quan sát được một thể hiện hữu hạn X:={xt, t =
1,2,…n} của một chuỗi thời gian dừng nên về nguyên tắc ta không thể biết
chính xác được các hàm tự hiệp phương sai của chuỗi thời gian đó, muốn ước
lượng nó ta đưa vào khái niệm hàm tự hiệp phương sai mẫu của thể hiện X.
Hàm tự hiệp phương sai mẫu của một thể hiện X được định nghĩa bởi
công thức:
nh
c(h) : n 1n 1 ( x j x)( x
x),0 h n
j h
j 1
n
Và c(h) : c( h), n h 0, trong đó x n 1 x j là trung bình mẫu.
j 1
Với
* c(h) là hệ số tự tương quan lấy mẫu ở độ trễ h
*
là trung bình mẫu của xj
* j là số phần tử của mẫu.
Khi đó thì hàm tương tự tương quan mẫu cũng định nghĩa thông qua
hàm tự hiệp phương sai mẫu như sau:
r (h) : c(h) / c(0), h n.
1.3.3. Quá trình ARMA
Mô hình ARMA dựa vào các mẫu tự tương quan trong bản thân của
chuỗi thời gian để sinh ra dự đoán. Hệ thống các phương pháp dùng để xác
định, kiểm tra và cải tiến mô hình ARMA có sự đóng góp rất lớn của hai nhà
thống kê, G.E.P.Box và G.M.Jenkins. Do đó việc mô hình và dự đoán dựa
trên mô hình ARIMA còn được gọi là phương pháp luận Box-Jenkins.
1.3.3.1.Quá trình tự hồi quy
Định nghĩa Quá trình ồn trắng
Quá trình ngẫu nhiên t, tZ được gọi là một ồn trắng, ký hiệu
WN(0,2), khi nó thoả mãn các điều kiện sau:
-16
Ets = 0 (t s)
E t2 2
E t 0, t
Định nghĩa Quá trình tự hồi quy
Người ta gọi quá trình ngẫu nhiên Xt, t Z là một quá trình tự hồi
quy cấp P, viết là Xt AR(p), là một quá trình dừng {Xt, tZ} thoả mãn
Xt
a X
a X
... a X | a 0 .với
1 t 1
2 t 2
p t-p
t
p
{} là một ồn trắng.
Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức
X t a1 X t 1 a2 X t 2 .... a p X t-p t | a p
0,
Hay ở dạng toán tử
a ( z ) : 1 a
1
z a z 2 ... a z
2
p
p
ở đây a(z) được gọi là đa thức hồi quy.
Chú ý:
Nếu đa thức a(z) ở trên có nghiệm nằm ngoài đĩa tròn đơn vị ( z 1) thì
Xt được gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta chỉ xét các
quá trình nhân quả.
Các đặc trưng của quá trình tự hồi quy cấp p:
-
E(Xt) = 0
-
( 0 ) a i (i ) | 2
p
t 1
-
p
(h) ai (h i) 0, h 0
i1
1.3.3.2. Quá trình trung bình trượt
Định nghĩa Quá trình trung bình trượt
Một quá trình trung bình trượt cấp q, ký hiệu XtMA(q), là một quá
trình Xt, t Z thoả mãn biểu thức
-17
Xt b
.... bq t q , b b ,..., bq R, bq 0
1 1 t 1
1 2
vớit là một ồn trắng.
Ta cũng có thể viết biểu thức trung bình trượt ở trên dưới dạng toán tử
lùi tương tự như đối với quá trình tự hồi quy như sau:
Xt = b(B)t,
Trong đó hàm b(.) định nghĩa bởib(z) : = 1+b1z+…+bqzq.
Ở đây b(z) được gọi là đa thức trung bình trượt.
Chú ý:
Khác với quá trình AR, biểu thức trên luôn xác định duy nhất một quá
trình MA mà không đòi hỏi thêm điều kiện gì đối với các hệ số b1. Và với giả
thiết t là ồn trắng thì theo định lý 1.1 ta có
b(z)(z) = 1.
Và khi đó 1 có thể biểu diễn dưới dạng
t
j
j X t j ; ( z ) j z ; j
j
j
j
Một chú ý nữa, cũng giống như trường hợp AR, nếu đa thức trung bình
trượt b(z) không có nghiệm có môđun bằng 1 thì ta có thể biểu diễn Xt dưới
dạng sau:
X t j X t j t ;
j 1
j
j
Và có thể xác định i bằng cách chia 1 (theo luỹ thừa tăng) cho b(z),
( 0 1) .
1.3.3.3. Quá trình tự hồi quy trung bình trượt ARMA
Định nghĩa quá trình tự hồi quy trung bình trượt
Một quá trình Xt, t Z được gọi là quá trình tự hồi quy trung bình
trượt cấp p,q, kí hiệu X t ARMA(p,q) là một quá trình Xt, t Z thỏa mãn
-18
X t a1X t 1 .... a p X t p t b1 t 1 ...
bq t q , a1, a2 ,...a p , b1, b2 ,..., bq R, a p 0, bq 0
Trong đó t là ồn trắng, a(.) và b(.) lần lượt là đa thức tự hồi quy và đa
thức trung bình trượt có bậc tương ứng là p và q:
a ( z ) : 1 a z ... a p z
1
b( z) : 1 b1z ... bq z
p
q
Khi đó ta có thể viết quá trình ARMA ở dạng toán tử như sau:
a ( B ) X t b( B ) t
Định nghĩa Quá trình nhân khả nghịch
Một quá trình ARMA(p,q) được gọi là một quá trình nhân quả và khả
nghịch nếu có là một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều
kiện:
i) a(z) và b(z) không có nghiệm chung
ii) a(z) và b(z) không có nghiệm có môđun không vượt quá 1
Chú ý:
Do tính nhân quả và khả nghịch cộng với tính chất khả đảo của đa thức
toán tử, ta có thể biểu diễn một quá trình
X t i t i , 0 1; i .
i 0
i 1
Và có thể tính các hệ số t bằng cách chia theo lũy thừa tăng a(z) cho
b(z).
Các đặc trưng của quá trình ARMA:
Trước hết ta có:
( h) E ( X t X
p
q
) a1 (h i) . X (h) bi . X (h i )
t h t 1
i1
Với
. X ( k ) : E ( t X t k