LỜI CẢM ƠN
Chúng tôi xin gửi lời cảm ơn tới nhóm seminar Đại số gia tử tại Viện Công nghệ
thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã có những góp ý quý
báu, cung cấp nhiều kiến thức để chúng tôi hoàn thiện hiểu biết của mình trong quá
trình nghiên cứu.
Chúng tôi cũng xin gửi lời cảm ơn chân thành tới tập thể Bộ môn Kỹ thuật máy
tính - Mạng, Khoa Toán - Lý - Tin, Trường Đại học Tây Bắc đã đóng góp nhiều ý kiến
thiết thực, tạo điều kiện để chúng tôi hoàn thành đề tài này.
NHÓM TÁC GIẢ
MỤC LỤC
PHẦN MỞ ĐẦU ............................................................................................................. 1
1. Lý do chọn đề tài ..................................................................................................... 1
2. Mục đích, nhiệm vụ nghiên cứu.............................................................................. 1
3. Đối tượng nghiên cứu ............................................................................................. 1
4. Phạm vi nghiên cứu................................................................................................. 2
5. Phương pháp nghiên cứu......................................................................................... 2
6. Cấu trúc đề tài ......................................................................................................... 2
CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN DỰ BÁO VÀ DỮ LIỆU CHUỖI THỜI
GIAN ............................................................................................................................... 3
1.1 Khái quát về dự báo .............................................................................................. 3
1.1.1 Khái niệm về dự báo ...................................................................................... 3
1.1.2 Tính chất của dự báo ...................................................................................... 3
1.1.3 Các phương pháp dự báo ............................................................................... 4
1.1.4 Chức năng và vai trò của dự báo .................................................................... 4
1.2 Chuỗi thời gian ...................................................................................................... 5
1.2.1 Khái niệm chuỗi thời gian .............................................................................. 5
1.2.2 Phân tích chuỗi thời gian và dự báo ............................................................... 7
1.2.3 Mô hình ARMA ............................................................................................. 8
Chương 2: CÁC
PHƯƠNG
PHÁP
DỰ
BÁO
CHUỖI
THỜI
GIAN
MỜ
....................................................................................................................................... 12
2.1 Lý thuyết tập mờ ................................................................................................. 12
2.1.1 Tập mờ ......................................................................................................... 12
2.1.2 Biến ngôn ngữ .............................................................................................. 12
2.1.3 Số mờ ........................................................................................................... 13
2.1.3 Các phép toán trên tập mờ ........................................................................... 16
2.1.5 Giải mờ......................................................................................................... 20
2.2 Suy diễn mờ ........................................................................................................ 23
2.2.1 Kiến trúc cơ bản của hệ suy diễn mờ ........................................................... 23
2.2.2 Các bước suy diễn mờ .................................................................................. 25
2.2.3 Một số phương pháp suy diễn trong hệ mờ ................................................. 25
2.3 Chuỗi thời gian mờ ............................................................................................. 26
2.3.1 Một số khái niệm về chuỗi thời gian mờ ..................................................... 26
2.3.2 Mô hình dự báo Song và Chissom ............................................................... 27
2.3.3 Mô hình dự báo Chen.................................................................................. 28
2.3.4 Luật dự báo chuỗi thời gian mờ ................................................................... 28
Chương 3: CẢI TIẾN PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN MỜ VÀ
ỨNG DỤNG DỰ BÁO SINH VIÊN NHẬP HỌC TẠI TRƯỜNG ĐẠI HỌC TÂY
BẮC .............................................................................................................................. 30
3.1 Một số khái niệm về đại số gia tử và ứng dụng tron bài toán dự báo ................. 30
3.2 Ứng dụng phương pháp dự báo chuỗi thời gian mờ sử dụng đại số gia tử vào bài
toán dự báo số lượng sinh viên nhập học tại Trường Đại học Tây Bắc .................... 34
3.3 Tối ưu tham số mô hình dự báo chuỗi thời gian sử dụng đại số gia tử ............... 39
KẾT LUẬN VÀ KIẾN NGHỊ ...................................................................................... 41
TÀI LIỆU THAM KHẢO............................................................................................. 42
DANH MỤC HÌNH ẢNH
Hình 1.1: Biến động tỷ giá USD/VND trên thị trường ................................................... 7
Hình 1.2: Biểu đồ giá vàng qua các tháng ...................................................................... 7
Hình 2.1: Số mờ Singleton ............................................................................................ 14
Hình 2.2: Số mờ tam giác ............................................................................................. 14
Hình 2.3: Bài toán độ tuổi theo số mờ tam giác............................................................ 15
Hình 2.4: Số mờ hình thang .......................................................................................... 15
Hình 2.5: Bài toán nhiệt độ theo số mờ hình thang ...................................................... 16
Hình 2.6: Số mờ hình Gaussian .................................................................................... 16
Hình 2.7: Hàm thuộc về của tập mờ A.......................................................................... 17
Hình 2.8: Hàm thuộc về của tập mờ ¬ A(x) ................................................................. 17
Hình 2.9: Tuyển của hai tập mờ theo S(x,y) = max(x,y) .............................................. 17
Hình 2.10: Tuyển của hai tập mờ theo S(x,y) = min (1,x+y)........................................ 18
Hình 2.11: Tuyển của hai tập mờ theo S(x,y) = x+y+x.y ............................................. 18
Hình 2.12: Hàm thuộc về của hai tập mờ A,B .............................................................. 18
Hình 2.13: Hội của hai tập mờ theo T(x,y) = min(x,y) ................................................. 19
Hình 2.14: Hội của hai tập mờ theo T(x,y) = x.y .......................................................... 19
Hình 2.15: Giải mờ bằng phương pháp......................................................................... 21
Hình 2.16: Giải mờ bằng phương pháp trung bình ....................................................... 21
Hình 2.17: Giải mờ theo phương pháp trung bình tâm. ................................................ 22
Hình 2.18: Hàm thuộc hợp thành dạng đối xứng. ......................................................... 22
Hình 2.19: Cấu trúc cơ bản của hệ suy diễn mờ ........................................................... 24
Hình 3.1: Biểu đồ so sánh kết quả dự báo .................................................................... 38
Hình 3.2: Biểu đồ so sánh kết quả dự báo sau khi tối ưu .............................................. 40
PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Bài toán dự báo chuỗi thời gian đã và đang được nhiều tác giả trong nước cũng
như ngoài nước quan tâm nghiên cứu [5,6,7,8,9,10,11,14,15]. Việc dự báo được dữ
liệu trong tương lai luôn là tham vọng của con người nhằm đoán biết trước kết quả từ
đó có những giải pháp đi trước để hoạch định tốt hơn trong công việc.
Chuỗi thời gian mờ được Q. Song và B.S. Chissom lần đầu tiên đề cập tới trong
nghiên cứu của mình năm 1993 [1,2]. Chuỗi thời gian mờ là công cụ hữu hiệu để có
thể dự đoán các dữ liệu thu thập được bằng ngôn ngữ tự nhiên, không những thế nó
còn cho thấy những ưu điểm vượt trội khi sử dụng cho những dữ liệu có sự biến động
lớn như giá cổ phiếu trên thị trường chứng khoán [7,8]. Kể từ khi được giới thiệu cho
tới nay, nhiều công trình nghiên cứu đã được đề xuất nhằm nâng cao tính chính xác
của kết quả dự báo và giảm bớt độ phức tạp tính toán của bài toán [7,8,9,10,11].
Đại số gia tử (ĐSGT) được N. Cat Ho và W. Wechler giới thiệu năm 1990 [12]
nhằm đưa ra một mô hình toán học phù hợp với dữ liệu không chắc chắn, theo đó các
giá trị ngữ nghĩa của ngôn ngữ nằm trong một trật tự nhất định và chính thứ tự đó tạo
nên giá trị ngữ nghĩa của từ ngôn ngữ. Đại số gia tử đã được ứng dụng trong các bài
toán điều khiển, hồi quy, trích rút tri thức, tính toán trên từ… và cho nhiều kết quả tốt
[16,17,18,19,20].
Trong nghiên cứu này chúng tôi sẽ tìm kiếm giải pháp cải tiến mô hình dự báo
chuỗi thời gian mờ, cụ thể là việc áp dụng lý thuyết đại số gia tử vào mô hình này. Các
kết quả dự báo khi thực nghiệm áp dụng dự báo số lượng sinh viên nhập học tại
Trường Đại học Tây Bắc cũng sẽ được đưa ra thảo luận nhằm cho thấy tính hiệu quả
của mô hình đề xuất.
2. Mục đích, nhiệm vụ nghiên cứu
- Nghiên cứu về bài toán dự báo và dữ liệu chuỗi thời gian.
- Nghiên cứu về lý thuyết tập mờ và khả năng ứng dụng.
- Nghiên cứu các phương pháp dự báo chuỗi thời gian mờ.
- Thử nghiệm dự báo với dữ liệu sinh viên nhập học tại Trường Đại học Tây Bắc.
3. Đối tượng nghiên cứu
- Bài toán dự báo chuỗi thời gian mờ.
1
4. Phạm vi nghiên cứu
- Nghiên cứu ứng dụng bài toán dự báo chuỗi thời gian mờ vào dự báo dữ liệu
sinh viên nhập học tại Trường Đại học Tây Bắc.
5. Phương pháp nghiên cứu
- Phương pháp phân tích, tổng hợp tài liệu.
- Phương pháp thực nghiệm.
6. Cấu trúc đề tài
Đề tài gồm ba phần:
- Phần 1: Phần mở đầu.
- Phần 2: Phần nội dung của đề tài gồm 3 chương:
Chương 1: Tổng quan về bài toán dự báo và dữ liệu chuỗi thời gian.
Chương 2: Các phương pháp dự báo chuỗi thời gian mờ.
Chương 3: Cải tiến phương pháp dự báo chuỗi thời gian mờ và ứng
dụng dự báo sinh viên nhập học tại Trường Đại học Tây Bắc.
- Phần 3: Kết luận và kiến nghị.
2
CHƯƠNG 1:
TỔNG QUAN VỀ BÀI TOÁN DỰ BÁO VÀ DỮ LIỆU CHUỖI THỜI GIAN
1.1 Khái quát về dự báo
1.1.1 Khái niệm về dự báo
Dự báo là sự tiên đoán có căn cứ khoa học, mang tính chất xác suất về mức độ,
nội dung, các mối quan hệ, trạng thái, xu hướng phát triển của đối tượng nghiên cứu
hoặc về cách thức và thời hạn đạt được các mục tiêu nhất định đã đề ra trong tương lai.
Dự báo là kết quả của sự kết hợp giữa những phân tích định tính và những phân
tích định lượng các quá trình cần dự báo. Chỉ có dự báo khoa học mới đảm bảo độ tin
cậy cao và là cơ sở vững chắc cho việc thông qua các quyết định quản lý khoa học.
Ngày nay vai trò của dự báo trong mọi lĩnh vực đời sống, xã hội ngày càng quan
trọng và được nâng lên đáng kể.
1.1.2 Tính chất của dự báo
- Dự báo mang tính xác suất: Mỗi đối tượng dự báo đều vận động theo một quy
luật, một quỹ đạo nhất định nào đó. Đồng thời trong quá trình phát triển nó luôn chịu
tác động từ môi trường hay các yếu tố bên ngoài mà chính các yếu tố tác động này
cũng không phải là đứng im mà luôn vận động và phát triển không ngừng. Chính vì
vậy dù trình độ dự báo có hoàn thiện đến đâu cũng không thể chắc chắn rằng kết quả
của dự báo là hoàn toàn chính xác, luôn tồn tại những trường hợp không lường trước
được trong tương lai.
- Dự báo là đáng tin cậy: Mặc dù dự báo mang tính xác suất nhưng nó đáng tin
cậy. Vì nó dựa trên những cơ sở lý luận và phương pháp luận khoa học. Ngày nay,
phương pháp và công cụ xử lý thông tin ngày càng hiện đại giúp cho việc tính toán,
phân tích đơn giản, chính xác và độ tin cậy của dự báo không ngừng được nâng cao.
- Dự báo mang tính đa phương án: Dự báo được thực hiện trên những giả thiết dự báo có điều kiện. Tập hợp các giả thiết để dự báo được gọi là phông dự báo. Mỗi
dự báo có thể được tiến hành trên các phông dự báo khác nhau do những nguyên nhân
chủ quan và khách quan khác nhau. Tính đa phương án một mặt là thuộc tính khách
quan của dự báo nhưng mặt khác lại là phù hợp với yêu cầu của công tác quản lý, nó
làm cho việc ra quyết định cũng như chỉ đạo thực hiện quyết định quản lý trở nên linh
hoạt hơn, dễ thích nghi với sự biến đổi vô cùng phức tạp của tình hình thực tế.
3
1.1.3 Các phương pháp dự báo
Theo học giả Gordon, trong hai thập kỷ gần đây, có tám phương án dự báo được
áp dụng rộng rãi trên thế giới như sau:
1. Tiên đoán (Genius forecasitng).
2. Ngoại suy xu hướng (Trend extrapolation).
3. Phương pháp chuyên gia (Consensus methods).
4. Phương pháp mô phỏng (Stimulation).
5. Phương pháp kịch bản (Scenarion).
6. Phương pháp cây quyết định (Decision trees).
7. Phương pháp ma trận tác động qua lại (Cross-impact matrix method).
8. Phương pháp dự báo tổng hợp (Combining methods).
Tuy nhiên theo các phân loại của Việt Nam các phương pháp dự báo thường
được chia thành hai nhóm chính là: Phương pháp định tính và phương pháp định lượng
1.1.3.1 Phương pháp định tính
Phương pháp này dựa trên cơ sở nhận xét của những yếu tố liên quan, dựa trên
những ý kiến về các khả năng có liên hệ của những yếu tố liên quan này trong tương
lai. Từ việc khảo sát ý kiến được tiến hành một cách khoa học để nhận biết các sự kiện
tương lai hay từ ý kiến phản hồi của một nhóm đối tượng hưởng lợi (chịu tác động)
nào đó mà phương pháp định tinh có liên quan đến mức độ phức tạp khác nhau.
1.1.3.2 Phương pháp định lượng
Mô hình dự báo định lượng dựa trên số liệu quá khứ, những số liệu này được giả
sử có liên quan đến tương lai và có thể tìm thấy được. Tất cả các mô hình dự báo theo
định lượng có thể sử dụng thông qua chuỗi thời gian và các giá trị này được quan sát
đo lường các giai đoạn theo từng chuỗi .
Hiện nay, để nâng cao mức độ chính xác của dự báo người ta thường kết hợp cả
hai phương pháp định tính và định lượng. Bên cạnh đó, vấn đề cần dự báo đôi khi
không thể thực hiện được thông qua một phương pháp dự báo đơn lẻ mà đòi hỏi kết
hợp nhiều hơn một phương pháp nhằm mô tả đúng bản chất sự việc cần dự báo.
1.1.4 Chức năng và vai trò của dự báo
1.1.4.1 Chức năng của dự báo
Theo quan điểm của triết học, dự báo là một hình thức nhận thức thế giới, nhận
thức xã hội. Nó có hai chức năng cơ bản:
4
- Chức năng tham mưu: trên cơ sở đánh giá thực trạng, phân tích xu hướng vận
động và phát triển trong quá khứ, hiện tại và tương lai, dự báo sẽ cung cấp thông tin
cần thiết, khách quan làm căn cứ cho việc ra quyết định quản lý và xây dựng chiến
lược, kế hoạch hóa các chương trình, dự án,…người quản lý và hoạch định chiến lược,
người lập kế hoạch có nhiệm vụ lựa chọn trong số các phương án có thể có, tìm ra các
phương án có tính khả thi cao nhất, có hiệu quả nhất. Để thực hiện tốt chức năng này
dự báo phải thật sự đảm bảo được tính khách quan, khoa học và tính độc lập tương đối
với các cơ quan quản lý và hoạch định chính sách.
- Chức năng khuyến nghị hay điều chỉnh: Với chức năng này dự báo tiên
đoán các hậu quả có thể nảy sinh trong quá trình thực hiện các chính sách kinh tế -xã
hội nhằm giúp các cơ quan chức năng kịp thời điều chỉnh mục tiêu cũng như các cơ
chế tác động quản lý để đạt được hiệu quả kinh tế - xã hội cao nhất.
1.1.4.2 Vai trò của dự báo
Trong nền kinh tế thị trường, công tác dự báo là vô cùng quan trọng bởi lẽ nó
cung cấp các thông tin cần thiết nhằm phát hiện và bố trí sử dụng các nguồn lực trong
tương lai một cách có căn cứ thực tế. Với những thông tin mà dự báo đưa ra cho phép
các nhà hoạch định chính sách có những quyết định về đầu tư, các quyết định về sản
xuất, về tiết kiệm và tiêu dùng, các chính sách tài chính, chính sách kinh tế vĩ mô. Dự
báo không chỉ tạo cơ sở khoa học cho việc hoạch định chính sách, cho việc xây dựng
chiến lược phát triển, cho các quy hoạch tổng thể mà còn cho phép xem xét khả năng
thực hiện kế hoạch và hiệu chỉnh kế hoạch.
Sử dụng mô hình dự báo trong hoạt động quản lý là rất quan trọng, nó tạo điều
kiện không những cung cấp thông tin tương lai mà còn có khả năng làm chủ công tác
quản lý. Nhờ có mô hình dự báo mà có thể tăng cường khả năng quản lý một cách
khoa học. Giúp nhận thức sâu sắc hơn các quy luật khách quan, tránh được tính chủ
quan.
1.2 Chuỗi thời gian
1.2.1 Khái niệm chuỗi thời gian
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x1, x2,……… xn} được
xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm đầu tiên, x2 là
quan sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm thứ n.
Ví dụ:
5
Thống kê số lượng sinh viên hệ đại học chính quy nhập học tại Trường Đại học
Tây Bắc qua các năm, ở đây ta có x1 = 672 là giá trị quan sát tại thời điểm thứ nhất
tức là năm 2004, x2 = 1007 là giá trị quan sát tại thời điểm thứ 2 tức là năm 2005... và
x = 680 là giá trị quan sát tại thời điểm thứ 14 tức là năm 2017.
10
STT
Khóa
Năm
TổngsốSV
1
K45
2004
672
2
K46
2005
1007
3
K47
2006
1271
4
K48
2007
1588
5
K49
2008
1481
6
K50
2009
1692
7
K51
2010
1814
8
K52
2011
1995
9
K53
2012
1653
10
K54
2013
1640
11
K55
2014
1129
12
K56
2015
1246
13
K57
2016
902
14
K58
2017
680
Bảng 1: Thống kê số lượng sinh viên hệ Đại học chính quy nhập học
tại Trường Đại học Tây Bắc
Các báo cáo tài chính mà ta thấy hằng ngày trên các phương tiên truyền thông
như: báo, tivi, internet… về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tiêu dùng…
Đó là những thể hiện rất thực tế của chuỗi thời gian.
Trong các thí dụ trên, thứ tự thời gian quan sát thực sự đóng vai trò quan trọng,
vì thế hầu hết các kỹ thuật thống kê cổ điển ít có tác dụng và do đó cần phải đề xuất
những kỹ thuật tính toán mới để bộc lộ được các nét đặc thù của chuỗi thời gian.
6
Hình 1.1: Biến động tỷ giá USD/VND trên thị trường
Hình 1.2: Biểu đồ giá vàng qua các tháng
1.2.2 Phân tích chuỗi thời gian và dự báo
Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán học
phù hợp với tập dữ liệu cho trước X={x1, x2,……… xn} nào đó. Để có thể nói về bản
chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan sát xt là một giá trị thể
hiện của biến ngẫu nhiên Xt với t ∈ T. Ở đây T được gọi là tập chỉ số. Khi đó ta có thể
coi tập dữ liệu X={x1, x2,……… xn} là thể hiện của quá trình ngẫu nhiên{Xt, t ∈ T}.
Và vì vậy, ta có thể định nghĩa một quá trình ngẫu nhiên như sau:
Định nghĩa 1.1 (Quá trình ngẫu nhiên)
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên {Xt, t∈T} được định
nghĩa trên một không gian xác suất(Ω, A, P).
Chú ý:
7
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví dụ
như là tập {1,2..} hay tập (-∞,+∞). Tất nhiên cũng có những quá trình ngẫu nhiên có T
không phải là một tập con của R nhưng ở đây ta chỉ xét cho trường hợp T∈R. Và
thường thì ta xem T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là
Z thay vì T ở trên. Một điểm chú ý nữa là trong luận văn này chúng ta sẽ dùng thuật
ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng như quá trình có dữ liệu đó là một
thể hiện.
Việc phân tích chuỗi thời gian là đi tới xây dựng một mô hình có khả năng: Cung
cấp một đặc tả ngắn gọn của dữ liệu đang quan sát; có thể dùng để suy ra các đặc điểm
của hệ thống; có thể được dùng để suy diễn để tìm ra cơ chế hoạt động của hệ thống;
có thể dùng để dự báo giá trị trong tương lai.
1.2.3 Mô hình ARMA
Trong thống kê học, mô hình autoregressive moving average (ARMA), đôi khi
còn được gọi là mô hình Box-Jenkins. Sau khi phương pháp Box-Jenkins được đưa ra
sử dụng để chạy mô hình, thường được áp dụng cho dữ liệu chuỗi thời gian (time
series) tự tương quan (autocorrelated).
Mô hình ARMA gồm hai phần: Phần tự hồi quy (AR) và phần bình quân dịch
chuyển (MA).
1.2.3.1 Quá trình tự hồi quy
- Định nghĩa 1.2 (Quá trình ồn trắng)
Quá trình ngẫu nhiên {εt, t∈Z} được gọi là một ồn trắng, ký hiệu ε~WN(0,σ2),
khi nó thỏa mãn điều kiện sau:
- Eεtεs = 0 (t ≠ s)
- E ε t2 = σ2
- Eεt = 0, ∀t
- Định nghĩa 1.3 (Quá trình tự hồi quy)
Người ta gọi quá trình ngẫu nhiên {Xt, t ∈ Z} là một quá trình tự hồi quy cấp p,
viết là Xt ~ AR(p), là một quá trình dừng {Xt, t ∈ Z} thỏa mãn:
Xt = a1Xt-1 + a2Xt-2 + …+ apXt-p + εt, ap ≠ 0
Với {ε} là một ồn trắng.
Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức
8
Xt - a1Xt-1 – a2Xt-2 – … – apXt-p = εt, ap ≠ 0
Hay ở dạng toán tử:
a(z):= 1 – a1z – a2 – z2 – … – apzp
ở đây a(z) được gọi là đa thức hồi quy.
Chú ý:
Nếu đa thức a(z) ở trên có nghiệm nằm ngoài đĩa tròn đơn vị (|z| > 1) thì
Xt được gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta chỉ xét các quá trình
nhân quả.
Các đặc trưng của quá trình tự hồi quy cấp p:
- E(Xt) = 0
- γ(0) =
- ρ (h) -
p
∑ a γ (i)+ σ
t=1
2
i
p
∑ a ρ(h− i) =0, ∀h > 0
t=1
i
Lần lượt cho h = 1,2,… p ta được:
X t = a1 X t −1 + ... + a p X t − p + ε t + b1ε t −1 + ... + bqε t −q , a1 , a2 ,..., a p , b1 , b2 ,..., bq ∈ R, a p ≠ 0, bq ≠ 0
Hệ phương trình gọi là hệ phương trình Jule–Walker, song tuyến đối với a và ρ.
1.2.3.2 Quá trình trung bình trượt
- Định nghĩa 1.4 (Quá trình trung bình trượt)
Một quá trình trung bình trượt cấp q, ký hiệu Xt ~ MA(q), là một quá trình {Xt,
t∈Z} thỏa mãn biểu thức
Xt = ε1+b1 εt-1+…+bq εt-q, b1 b2,…, bq ϵ R, bq≠0
Với {εt} là một ồn trắng.
Ta cũng có thể viết biểu thức trung bình trượt ở trên dưói dạng toán tử là tương
tự như đối với quá trình tự hồi quy như sau:
Xt = b(B) εt
Trong đó hàm b(.) định nghĩa bởi
b(z) = 1+ b1z+…+bqzq
Ở đây b(z) được gọi là đa thức trung bình trượt.
Các đặc trưng của quá trình trung bình trượt:
Trước hết, ta dễ dàng thấy rằng:
9
EXt = 0
và
⎧
σ 2 ,s = t
⎪⎪
E(Xt ε t ) = ⎨ σ 2b1 ,s = t − i;1 ≤ i ≤ q
⎪
0,s ≠
⎪⎩
⎫
⎪⎪
⎬
⎪
⎪⎭
Mặt khác ta có:
γ (h):= E(Xt Xt−h ) = E(Xt (ε t+h + b1ε 1+h−1 + bqε 1+h−q ))
Từ đó suy ra:
⎧ γ (h) = σ 2(b + b b + ... + b b ),b := 1;1 ≤ h ≤ q
⎪
h
1 h+1
q−h q
0
⎨
γ (h) = 0,h > q
⎪
⎩
⎫
⎪
⎬
⎪⎭
Đặc biệt ta có:
γ (0) = varXt = σ 2(1+ b12 + ... + bq2 )
Từ công thức hiệp sai của quá trình trung bình trượt ta suy ra công thức của tự
tương quan như sau:
⎧ b + b + b + ... + b b
q−h q
⎪⎪ h 1 h+1
,h = 1,2...q
2
2
ρ(h) = ⎨
1+ b1 + ... + bq
⎪
0,h > q
⎪⎩
⎫
⎪⎪
⎬
⎪
⎪⎭
1.2.3.3 Quá trình tự hồi quy trung bình trượt
- Định nghĩa 1.5 (quá trình tự hồi quy trung bình trượt)
Một quá trình {Xt, t∈Z} được gọi là quá trình tự hồi quy trung bình trượt cấp p, q
kí hiệu Xt ~ ARMA(p,q) là một quá trình {Xt, t ∈ Z) thỏa mãn:
X = a X + ...+ ap Xt−p + ε t + b1ε t−1 + ...+ bqε t−q ,a1 ,a2 ,...,ap ,b1 ,b2 ,...,bq ∈R,ap ≠ 0,bq ≠ 0
t 1 t−1
Trong đó t là ồn trắng, a(.) và b(.) lần lượt là đa thức tự hồi quy và đa thức trung
bình trượt có bậc tương ứng là p và q:
a(z)=1–a1z–…–apzp
b(z)=1+b1z+…+bqzq
Khi đó ta có thể viết quá trình ARMA ở dạng toán tử như sau:
a(B)Xt=b(B)εt
- Định nghĩa 1.6 (Quá trình nhân khả nghịch)
10
Một quá trình ARMA(p,q) được gọi là một quá trình nhân quả và khả nghịch nếu
có một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều kiện:
i) a(z) và b(z) không có nghiệm chung
ii) a(z) và b(z) không có nghiệm có modun không vượt quá 1
Nhưng kỹ thuật mô hình ARMA cung cấp là một cơ sở rất quan trọng và mang
lại nhiều gợi ý cho các công trình nghiên cứu về chuỗi thời gian sau BoxJenkins.
11
Chương 2:
CÁC PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN MỜ
2.1 Lý thuyết tập mờ
2.1.1 Tập mờ
Tập mờ là một tập hợp mà mỗi phần tử cơ bản của nó được gán thêm một giá trị
thực µ A (x)∈[0,1] để chỉ độ thuộc của nó vào tập đã cho. Độ phụ thuộc càng lớn thì
phần tử thuộc về tập càng lớn. Khi độ phụ thuộc bằng 0 thì phần tử đó sẽ không thuộc
về tập đã cho. Ngược lại nếu mức độ phụ thuộc bằng 1 phần tử cơ bản sẽ thuộc về tập
hợp với xác suất 100%.
Định nghĩa 2.1: Cho là U một tập vũ trụ với các phần tử kí hiệu bởi x, U = {x}.
Một tập mờ A trên U là tập được đặc trưng bởi một hàm µA(x) mà nó liên kết mỗi phần
tử x ∈U với một số thực trong đoạn [0,1]. Giá trị của hàm µA(x) biểu diễn mức độ
thuộc của x trong A.
Kí hiệu A = {(x , µ A (x))| x ∈U}
Trong đó µA(x) là một ánh xạ từ U vào [0,1] và được gọi là hàm thuộc của tập mờ
A và µA(x) có giá trị bất kỳ trong đoạn [0,1] là điều khác biệt cơ bản giữa tập rõ và tập
mờ. Giá trị của µA(x) càng gần tới 1 thì mức độ thuộc của x trong A càng cao.
Tập mờ là sự mở rộng của tập kinh điển. Thật vậy, khi A là một tập kinh điển,
hàm thuộc của nó µA(x) chỉ nhận 2 giá trị 0 hoặc 1 tương ứng với x có nằm trong A hay
không.
Thực tế các khái niệm mờ trong các bài toán ứng dụng rất đa dạng và khó để xác
định được các hàm thuộc của chúng một cách chính xác, thông thường dựa trên ngữ
cảnh mà khái niệm mờ đó đang được sử dụng. Một lớp rộng các khái niệm mờ có thể
mô hình qua các tập mờ mà L.A.Zadeh [1] đã đưa ra gọi là biến ngôn ngữ.
2.1.2 Biến ngôn ngữ
Theo Zadeh [1], biến ngôn ngữ là các biến mà giá trị của chúng không phải là số
mà là các từ hoặc các câu trong ngôn ngữ tự nhiên hoặc nhân tạo. Các giá trị của biến
ngôn ngữ được sử dụng “khi có sự thiếu hụt tính chính xác bề ngoài của những vấn đề
phức tạp cố hữu”. Về hình thức biến ngôn ngữ được định nghĩa như sau:
Định nghĩa 2.2: Biến ngôn ngữ là một bộ năm (X, T(X), U, R, M) trong đó X là
tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là không gian tham chiếu hay
12
còn gọi là miền cơ sở của biến X, R là một quy tắc cú pháp sinh các giá trị ngôn ngữ
trong T(X), M là quy tắc gán ngữ nghĩa biểu thị bằng tập mờ trên U cho các từ ngôn
ngữ trong T(X).
Từ những nghiên cứu về biến ngôn ngữ, tác giả đưa ra những đặc trưng cơ bản
của biến ngôn ngữ:
- Tính phổ quát: các biến ngôn ngữ khác nhau về các giá trị nguyên thủy nhưng ý
nghĩa về mặt cấu trúc miền giá trị của chúng vẫn được giữ. Nói cách khác, cấu trúc
miền giá trị của hai biến ngôn ngữ cho trước tồn tại một “đẳng cấu” sai khác nhau bởi
giá trị sinh nguyên thủy.
- Tính độc lập ngữ cảnh của gia tử và liên từ như AND, OR,...: ngữ nghĩa của
các gia tử và liên từ như AND, OR,... hoàn toàn độc lập với với ngữ cảnh, khác với giá
trị nguyên thủy của các biến ngôn ngữ lại phụ thuộc vào ngữ cảnh. Do đó khi tìm kiếm
mô hình cho các gia tử và liên từ như AND, OR,... chúng ta không phải quan tâm đến
giá trị nguyên thủy của biến ngôn ngữ đang xét.
Các đặc trưng này cho phép chúng ta sử dụng cùng một tập gia tử và xây dựng
một cấu trúc toán học duy nhất cho miền giá trị của các biến ngôn ngữ khác nhau.
2.1.3 Số mờ
2.1.3.1 Mờ hóa
Định nghĩa 2.3: Mờ hóa được định nghĩa như là sự ánh xạ (sự làm tương ứng) từ
tập các giá trị thực x* ∈U ⊂ R thành tập các giá trị mờ A ở trong U. Nguyên tắc chung
việc thực hiện mờ hóa là:
- Từ tập giá trị thực x đầu vào sẽ tạo ra tập mờ A với hàm thuộc có giá trị đủ rộng
tại các điểm rõ x * .
- Nếu có nhiễu ở đầu vào thì việc mờ hóa sẽ góp phần khử nhiễu.
- Việc mờ hóa phải tạo điều kiện đơn giản cho tính toán sau này.
Thông thường dùng ba phương pháp mờ hóa sau đây:
- Mờ hóa đơn trị (Singleton fuzzifier). Mờ hóa đơn trị là từ các điểm giá trị thực
x* ∈U lấy các giá trị đơn của tập mờ A, nghĩa là hàm thuộc có dạng:
- Mờ hóa Gauss (Gaussian fuzzifier). Mờ hóa Gauss là từ các điểm giá trị thực
x* ∈U lấy các giá trị trong tập mờ A với hàm thuộc Gauss.
13
- Mờ hóa hình tam giác (Triangular fuzzifier). Mờ hóa hình tam giác là từ các
điểm giá trị thực x* ∈U lấy các giá trị trong tập mờ A với hàm thuộc dạng hình tam
giác (hoặc hình thang).
Ta thấy mờ hóa đơn trị cho phép tính toán về sau rất đơn giản nhưng không khử
được nhiễu đầu vào, mờ hóa Gaus hoặc mờ hóa hình tam giác không những cho phép
tính toán về sau tương đối đơn giản mà còn đồng thời có thể khử nhiễu đầu vào.
2.1.3.2 Các loại số mờ
Tập mờ trên tập số thực Rl là một số thực mờ nếu:
- Mờ chuẩn hóa tức có điểm x’ sao cho µM(x’) = 1.
- Ứng với mỗi α ∈ Rl tập mức {x: µM(x) ≥ α} là đoạn đóng trên Rl.
Có 4 dạng số mờ cơ bản:
- Số mờ hình Singleton:
Hình 2.1: Số mờ Singleton
- Số mờ hình tam giác: M(a,b,c)
Hình 2.2: Số mờ tam giác
Ví dụ:
Nếu coi 25 tuổi là lớp trẻ, 45 tuổi là trung niên và 60 tuổi là già. Xác định độ
thuộc của người đàn ông 30 tuổi vào các lớp trẻ, trung niên, già.
Dựa vào số mờ tam giác ta có đồ thị biểu diễn bài toán như sau:
14
Hình 2.3: Bài toán độ tuổi theo số mờ tam giác
Áp dụng công thức tính số mờ tam giác. Ta có thể tính độ thuộc của người đàn
ông 30 tuổi như sau:
+ Độ thuộc vào lớp trẻ:
⎛
⎛
⎛ 30− 0 45− 30 ⎞ ⎞
⎛ 6 3⎞ ⎞ 3
M30 Tre = max ⎜ min ⎜
,
,0
=
max
min
⎟
⎜
⎜⎝ 5 , 4 ⎟⎠ ,0⎟ = 4 = 0.75
⎝ 25− 0 45− 25 ⎟⎠ ⎠
⎝
⎝
⎠
( )
+ Độ thuộc vào lớp trung niên:
⎛
⎛
⎛ 30− 25 60− 30 ⎞ ⎞
⎛1 ⎞ ⎞ 1
M30 TN = max ⎜ min ⎜
,
,0
=
max
min
⎟
⎜
⎜⎝ 4 ,2⎟⎠ ,0⎟ = 4 = 0.25
⎝ 45− 25 60− 45 ⎟⎠ ⎠
⎝
⎝
⎠
( )
+ Độ thuộc vào lớp già:
⎛
⎛ 30− 45 90− 30 ⎞ ⎞
M30 Gia = max ⎜ min ⎜
,
,0⎟ = 0
⎝ 60− 45 90− 60 ⎟⎠ ⎠
⎝
( )
Kết luận: Vậy độ thuộc của người đàn ông 30 tuổi vào các lớp là: trẻ - 0.75;
trung niên - 0.25; già - 0.
- Số mờ hình thang: M(a,b,c,d)
Hình 2.4: Số mờ hình thang
Ví dụ:
15
Nhiệt độ môi trường được chia theo các mức như hình dưới. Xác định độ thuộc
của 16oC vào các lớp lạnh, trung bình, nóng.
Hình 2.5: Bài toán nhiệt độ theo số mờ hình thang
Áp dụng công thức tính số mờ hình thang ta tính được như sau:
+ Độ thuộc vào lớp lạnh:
⎛
⎛
⎛ 20−16 ⎞ ⎞
⎛4 ⎞ ⎞ 4
M16 (Lanh) = max ⎜ min ⎜
,1⎟ ,0⎟ = max ⎜ min ⎜ ,1⎟ ,0⎟ = = 0.8
⎝ 20−15 ⎠ ⎠
⎝5 ⎠ ⎠ 5
⎝
⎝
+ Độ thuộc vào lớp trung bình:
⎛
⎛
⎛ 16 −15 35−16 ⎞ ⎞
⎛ 1 19 ⎞ ⎞ 1
M16 (TB) = max ⎜ min ⎜
,
,1⎟ ,0⎟ = max ⎜ min ⎜ , ,1⎟ ,0⎟ = = 0.2
⎝ 20−15 35− 30 ⎠ ⎠
⎝5 5 ⎠ ⎠ 5
⎝
⎝
+ Nhiệt độ 16oC không thuộc vào lớp nóng, tức M16(Nong)=0.
- Số mờ hình Gaussian (Bell):
Hình 2.6: Số mờ hình Gaussian
2.1.3 Các phép toán trên tập mờ
2.1.3.1 Phép bù
Định nghĩa 2.4: Cho tập không gian nền (tập vũ trụ) U có hàm thuộc µA(x). Phần
bù (ký hiệu ¬ A) của tập mờ A là một tập mờ với hàm thuộc về được xác định bởi :
µ ¬ A (x) = 1- µA(x) , với mỗi x ∈ U.
16
Đồ thị của hàm thuộc về có dạng sau:
Hình 2.7: Hàm thuộc về của tập mờ A
Hình 2.8: Hàm thuộc về của tập mờ ¬ A(x)
2.1.3.2 Phép tuyển
Định nghĩa 2.5: Cho S là phép tuyển của hai tập mờ A, B (ký hiệu A∪B) có các
hàm liên thuộc µA(x), µB(x) là một tập mờ trên U với hàm thuộc về µA∪B(x) được xác
định:
µA∪B(x) = S(µA(x), µB(x))
∀x ∈ U.
- Với S(x,y) = max(x,y) ta có :
µA∪B(x) = max(µA(x), µB(x))
Hình 2.9: Tuyển của hai tập mờ theo S(x,y) = max(x,y)
17
- Với S(x,y) = min(1, x+y) ta có:
µA∪B(x) = min(1, µA(x) + µB(x))
Hình 2.10: Tuyển của hai tập mờ theo S(x,y) = min (1,x+y)
- Với S(x,y) = x + y + x.y ta có:
µA∪B(x) = µA(x) + µB(x) - µA(x).µB(x)
Hình 2.11: Tuyển của hai tập mờ theo S(x,y) = x+y+x.y
2.1.3.3 Phép hội
Định nghĩa 2.6: Cho A và B là hai tập mờ trên một tập vũ trụ U , có các hàm liên
thuộc µA(x), µB(x). Gọi T là phép hội của hai tập mờ A và B (ký hiệu A∩B) là một tập
mờ có hàm thuộc µA∩B(x) xác định như sau:
µA∩B(x) = = T(µA(x), µB(x)) ∀x ∈ U.
Đồ thị của hàm thuộc về có dạng như sau:
Hình 2.12: Hàm thuộc về của hai tập mờ A,B
18
- Với T(x,y) = min(µA(x), µB(x)) ta có:
µA∩B(x) = min(µA(x), µB(x))
Hình 2.13: Hội của hai tập mờ theo T(x,y) = min(x,y)
- Với T(x,y) = x.y ta có:
µA∩B(x) = µA(x).µB(x)
Hình 2.14: Hội của hai tập mờ theo T(x,y) = x.y
2.1.3.4 Phép kéo theo
Phép kéo theo được xét như một mối quan hệ. Phép kéo theo của hàm số I(x,y)
xác định trên [0,1]2 được định nghĩa như sau:
Định nghĩa 2.7:
Phép kéo theo của một hàm số I: [0,1]2 ! [0,1] thỏa các điều kiện sau:
- Nếu x ≤ z thì I(x,y)≥ I(z,y) ∀y ∈ [0,1].
- Nếu y ≤ u thì I(x,y) ≤ I(z,y) ∀x ∈ [0,1].
- I(0,x) = 1, ∀x ∈ [0,1].
- I(x,1) = 1, ∀x ∈ [0,1].
- I(1,0) = 0.
19
Định nghĩa 2.8:
Cho T là t-chuẩn, A là t-đối chuẩn, n là phép phủ định. Hàm IS(x,y) xác định trên
[0,1]2 bằng biểu thức:
IS(x,y) = S(n(x),y)
2.1.5 Giải mờ
Giải mờ được định nghĩa như là sự ánh xạ (sự làm tương ứng) từ tập mờ B trong
tập cơ sở V thuộc tập số thực R (V ⊂ R ) đó là đầu ra của khối hợp thành và suy luận
mờ) thành giá trị rõ đầu ra y ∈V . Như vậy nhiệm vụ của giải mờ là tìm một điểm rõ
y ∈V làm đại diện tốt nhất cho tập mờ B. Có ba điều lưu ý sau đây lúc chọn phương
pháp giải mờ:
- Tính hợp lý của kết quả. Điểm rõ y* ∈V là điểm đại diện (cho “năng lượng”)
của tập mờ B, điều này có thể cảm nhận trực giác tính hợp lý của kết quả khi đã có
hàm liên thuộc của tập mờ B.
- Việc tính toán đơn giản. Đây là điều quan trọng để tính toán nhanh, vì các bộ
điều khiển mờ thường làm việc ở thời gian thực.
- Tính liên tục. Một sự thay đổi nhỏ trong tập mờ B chỉ làm thay đổi nhỏ kết quả
giải mờ, nghĩa là không gây ra thay đổi đột biến giá trị giải mờ y ∈V .
Như vậy, giải mờ là quá trình xác định một giá trị rõ ở đầu ra theo hàm liên thuộc
hợp thành đã tìm được từ các luật hợp thành và điều kiện đầu vào. Có ba phương pháp
giải mờ thường dùng là: phương pháp cực đại, phương pháp trọng tâm và phương
pháp trung bình tâm.
2.1.5.1 Phương pháp cực đại
Phương pháp cực đại gồm hai bước:
Bước 1: Xác định miền chứa giá trị rõ đầu ra. Đó là miền G, mà giá trị rõ đầu ra
y có hàm liên thuộc đạt giá trị cực đại, nghĩa là:
G={y ∈ Y | µB(y)=max}
Bước 2: Xác định giá trị y từ miền G. Lúc này có ba cách tính:
20
Hình 2.15: Giải mờ bằng phương pháp
Hình 2.16: Giải mờ bằng phương pháp trung bình
+ Cách tính trung bình:
M
y=
∑y
−1
l=1
.hl
M
∑h
l=1
l
+ Lấy giá trị cận trái. Trên hình 2.15 lấy y = y1.
+ Lấy giá trị cận phải. Trên hình 2.15 lấy y = y2.
2.1.5.2 Phương pháp trọng tâm
Lúc này giá trị rõ đầu ra được lấy theo điểm trọng tâm của hình bao bởi hàm liên
thuộc hợp thành và trục hoành:
21