BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUY NHƠN
ĐỖ ĐIỆN SÁNG
XÂY DỰNG MƠ HÌNH DỰ BÁO
CHUỖI THỜI GIAN BẬC CAO
VÀ THỬ NGHIỆM
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01
Người hướng dẫn: TS. LÊ XUÂN VIỆT
LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng
được ai cơng bố trong bất kỳ cơng trình nào khác.
Học viên Đỗ Điện Sáng
LỜI CẢM ƠN
Để có thể hồn thành đề tài luận văn thạc sĩ một cách hoàn chỉnh, bên
cạnh sự nỗ lực cố gắng của bản thân cịn có sự hướng dẫn nhiệt tình của q
Thầy Cơ, cũng như sự động viên ủng hộ của gia đình và bạn bè trong suốt
thời gian học tập nghiên cứu và thực hiện luận văn thạc sĩ.
Xin chân thành bày tỏ lòng biết ơn đến Thầy TS. Lê Xuân Việt người
đã hết lòng giúp đỡ và tạo mọi điều kiện tốt nhất cho tôi hồn thành luận văn
này. Xin chân thành bày tỏ lịng biết ơn đến tồn thể q thầy cơ trong khoa
Khoa học máy tính – Trường Đại học Quy Nhơn đã tận tình truyền đạt những
kiến thức quý báu cũng như tạo mọi điều kiện thuận lợi nhất cho tôi trong
suốt quá trình học tập nghiên cứu và cho đến khi thực hiện đề tài luận văn.
Bản thân đã nỗ lực rất nhiều, nhưng chắc chắn sẽ không tránh khỏi
những thiếu sót, tồn tại, em rất mong nhận được sự cảm thơng, chỉ dẫn, và
đóng góp ý kiến của q thầy cô, cũng như các bạn đồng nghiệp
Cuối cùng, tôi xin chân thành cảm ơn đến gia đình, các anh chị và các
bạn đồng nghiệp đã hỗ trợ cho tôi rất nhiều trong suốt quá trình học tập,
nghiên cứu và thực hiện đề tài luận văn thạc sĩ một cách hoàn chỉnh nhất.
Bình Định, tháng 10 năm 2020
Học viên thực hiện
Đỗ Điện Sáng
MỤC LỤC
Trang
LỜI CAM ĐOAN
LỜI CẢM ƠN
DANH MỤC CÁC BẢNG BIỂU
MỞ ĐẦU ........................................................................................................... 1
1. Lý do chọn đề tài ....................................................................................... 1
2. Mục đích và nhiệm vụ nghiên cứu ............................................................ 2
3. Đối tượng và phạm vi nghiên cứu ............................................................. 2
4. Phương pháp nghiên cứu ........................................................................... 2
5. Kết cấu luận văn ........................................................................................ 2
CHƯƠNG 1. TỔNG QUAN VỀ DỰ BÁO VÀ CHUỖI THỜI GIAN ........... 4
1.1. TỔNG QUAN VỀ DỰ BÁO ..................................................................... 4
1.1.1. Khái niệm dự báo ................................................................................ 4
1.1.2. Đặc điểm của dự báo ........................................................................... 5
1.1.3. Các loại dự báo .................................................................................... 5
1.1.4. Quy trình dự báo .................................................................................. 9
1.2. TỔNG QUAN VỀ CHUỖI THỜI GIAN .................................................. 9
1.2.1. Chuỗi thời gian và quá trình ngẫu nhiên ............................................. 9
1.2.2. Quá trình ARMA ............................................................................... 12
1.2.3. Ước lượng tham số mơ hình ARMA ................................................. 13
Kết luận Chương 1 .......................................................................................... 15
CHƯƠNG 2. XÂY DỰNG MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ
BẬC CAO ....................................................................................................... 17
2.1. SƠ LƯỢC VỀ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ ............... 17
2.1.1. Lý thuyết tập mờ................................................................................ 17
2.1.2. Đại số gia tử....................................................................................... 18
2.2. MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ ..................................... 22
2.2.1. Một số khái niệm cơ bản của mơ hình dự báo chuỗi thời gian mờ ... 22
2.2.2. Mơ hình dự báo Song và Chissom .................................................... 23
2.2.3. Mơ hình dự báo Chen ........................................................................ 24
2.3. MƠ HÌNH DỰ BÁO THEO TIẾP CẬN ĐẠI SỐ GIA TỬ .................... 25
Kết luận Chương 2 .......................................................................................... 35
CHƯƠNG 3. CÀI ĐẶT VÀ THỬ NGHIỆM ................................................. 36
3.1. MƠ TẢ BÀI TỐN ................................................................................. 36
3.2. LỰA CHỌN NGƠN NGỮ ...................................................................... 37
3.3. CÁC GIAO DIỆN CHÍNH ...................................................................... 40
3.4. ĐÁNH GIÁ KẾT QUẢ THỬ NGHIỆM ................................................. 50
Kết luận Chương 3 ........................................................................................ 522
KẾT LUẬN CHUNG .................................................................................... 533
DANH MỤC TÀI LIỆU THAM KHẢO ...................................................... 555
QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (bản sao)
DANH MỤC CÁC BẢNG BIỂU
Bảng 2.1: Sản lượng xăng dầu tiêu thụ theo tháng (từ năm 2018 đến 2019) . 26
Bảng 2.2: Giá trị đầu và giá trị cuối của các khoảng giải nghĩa được chọn. .. 33
Bảng 3.1: Sản lượng xăng dầu tiêu thụ theo tháng (từ năm 2018 đến 2019) . 37
Bảng 3.2: Kết quả dự báo dựa trên đại số gia tử ............................................. 51
1
MỞ ĐẦU
1. Lý do chọn đề tài
Chúng ta đều biết dự báo là một sự tiên đoán các sự kiện xảy ra trong
tương lai, và tiên đốn đó cũng có thể là một sự tiên đốn có căn cứ khoa học
hoặc khơng khoa học, tức là sự tiên đốn khơng có cơ sở, thường dựa vào
cảm tính – nhận thức chủ quan của cá nhân. Để có một dự báo khoa học, đảm
bảo độ tin cậy cao thì dự báo đó phải dựa trên cơ sở của các sự kiện trong q
khứ hoặc sử dụng một số mơ hình tốn học để dự đốn kết quả trong tương
lai. Và mơ hình chuỗi thời gian là một cách tiếp cận dự báo đang được sử
dụng như một công cụ hữu hiệu để phân tích trong kinh tế, xã hội cũng như
trong nghiên cứu khoa học.
Dự báo chuỗi thời gian đã được rất nhiều nhà khoa học trên thế giới
quan tâm, với các nhiều mơ hình được đưa ra như mơ hình tính tốn nhóm
quan hệ mờ của Q. Song và B. S. Chissom, mơ hình dự báo với các phép tính
số học đơn giản của Chen, hay đại số gia tử là một tiếp cận mới được các tác
giả N.C.Ho và W. Wechler xây dựng vào những năm 1990, 1992 hoàn toàn
khác biệt so với tiếp cận mờ. Đại số gia tử được sử dụng để mô phỏng biến
ngôn ngữ và có được cấu trúc ngữ nghĩa, trong đó, phép mờ hóa và phép giải
mờ được thay thế bằng phép ngữ nghĩa hóa và phép giải nghĩa tương ứng đơn
giản hơn,… Những ứng dụng của mơ hình chuỗi thời gian bậc cao vào một số
bài toán cụ thể trong lĩnh vực kinh tế, công nghệ thông tin và điều khiển đã
cho ra một số kết quả quan trọng khẳng định tính ưu việt của tiếp cận này so
với những công cụ truyền thống.
Do đó, việc tìm tịi, xây dựng mơ hình dự báo chuỗi thời gian có độ
chính xác cao với thuật tốn đơn giản hơn rất có ý nghĩa và hiệu quả trong việc
ứng dụng vào dự báo. Và đây cũng là lý do mà chúng tôi lựa chọn và thực hiện
2
đề tài“Xây dựng mơ hình dự báo chuỗi thời gian bậc cao và thử nghiệm”.
2. Mục đích và nhiệm vụ nghiên cứu
Tổng hợp các kiến thức cơ bản về dự báo, chuỗi thời gian và trọng tâm
là xây dựng mô hình dự báo chuỗi thời gian bậc cao. Cài đặt và thử nghiệm
cho mơ hình đã xây dựng.
3. Đối tượng và phạm vi nghiên cứu
- Tìm hiểu các khái niệm cơ bản liên quan đến lý thuyết dự báo, chuỗi
thời gian và mơ hình chuỗi thời gian bậc cao.
- Tìm hiểu một số thuật tốn cơ bản trong mơ hình chuỗi thời gian, đặc
biệt ứng dụng mơ hình dự báo chuỗi thời gian bậc cao vào thử nghiệm.
- Tính tốn thử nghiệm cho chuỗi dữ liệu số sản lượng tiêu thụ xăng
dầu tại Cửa hàng 01 – Petrolimex thuộc Công ty xăng dầu Bình Định bằng
mơ hình mới.
- Các cơng cụ lập trình.
4. Phương pháp nghiên cứu
- Với đề tài này, chúng tôi lựa chọn phương pháp nghiên lý thuyết và
phương pháp nghiên cứu thực tế mang tính ứng dụng cao, cụ thể là tích hợp
hai phương pháp định lượng và định tính để làm tăng độ chính xác cho bài
toán dự báo, mà đặc biệt là bài toán dự báo trong khoảng thời gian ngắn như
là dự báo với dữ liệu theo tháng hoặc theo quý.
- Tổng hợp và phân tích dựa trên các tài liệu thu thập được từ sách, báo,
tạp chí, bài nghiên cứu, kỷ yếu hội thảo,…
- Thử nghiệm và đánh giá mơ hình.
5. Kết cấu luận văn
Ngoài phần mở đầu, kết luận, tài liệu tham khảo, luận văn có cấu trúc 3
chương như sau:
3
- Chương 1: Tổng quan về dự báo và chuỗi thời gian.
Chương này sẽ giới thiệu những lý thuyết về dự báo như khái niệm, đặc
điểm và các loại dự báo; lý thuyết về chuỗi thời gian, cụ thể là khái niệm về
chuỗi thời gian và quá trình ngẫu nhiên, q trình ARMA. Bởi việc thiết lập
một mơ hình dự báo chuỗi thời gian bậc cao thì những lý thuyết cơ bản trên là
cần phải quan tâm, bởi để áp dụng một dự báo thành cơng thì phải hiểu tối đa
về lĩnh vực dự báo.
- Chương 2: Xây dựng mô hình dự báo chuỗi thời gian mờ bậc cao.
Mơ tả sơ lược về lý thuyết tập mờ và đại số gia tử, đặc biệt chương sẽ
viết về những mơ hình dự báo chuỗi thời gian mờ như mơ hình dự báo Song
và Chissom, mơ hình dự báo Chen, mơ hình dự báo chuỗi thời gian mờ theo
tiếp cận đại số gia tử. Theo đó, giới thiệu 6 bước xây dựng mơ hình dự báo
chuỗi thời gian mờ theo tiếp cận đại số gia tử, áp dụng dữ liệu của bài toán dự
báo sản lượng tiêu thụ xăng dầu tại Cửa hàng 01– Petrolimex thuộc Cơng ty
xăng dầu Bình Định vào các bước tính để tìm ra kết quả dự báo tối ưu nhất.
- Chương 3: Cái đặt và thử nghiệm
Qua 6 bước áp dụng xây dựng mơ hình dự báo sản lượng tiêu thụ xăng
dầu ở chương 2, cho thấy cách tiếp cận theo đại số gia tử cho bài toán dự báo
chuỗi thời gian phụ thuộc khá nhiều yếu tố: độ đo tính mờ của các gia tử, số
nhãn ngôn ngữ được sử dụng (tương ứng số khoảng chia các đoạn), các tham
số giải nghĩa… Do đó, để kiểm tra hiệu quả của phương pháp, chúng tôi sẽ
thử nghiệm mơ hình trong chương 3. Chương này, chúng tơi tiến hành mơ tả
bài tốn một cách kỹ lưỡng hơn qua số liệu sản lượng tiêu thụ xăng dầu theo
từng tháng của hai năm liên tiếp. Áp dụng ngôn ngữ lập trình Python để “làm
sạch” dự liệu và hỗ trợ cho việc đánh giá kết quả cuối cùng.
4
CHƯƠNG 1. TỔNG QUAN VỀ DỰ BÁO VÀ
CHUỖI THỜI GIAN
1.1. TỔNG QUAN VỀ DỰ BÁO
1.1.1. Khái niệm dự báo
Dự báo là một sự tiên đoán xu hướng vận động của các hiện tượng,
những việc sẽ xảy ra trong tương lai, dựa trên cơ sở phân tích một cách khoa
học những số liệu đã được thu thập trong quá khứ và hiện tại. Dự báo đó có
thể là một dự báo mang tính chất chính xác nhờ vào một số mơ hình tốn học
(định lượng), hoặc dư báo chỉ là một dự đốn chủ quan, trực giác (định tính).
Dù dự báo mang kết quả cuối cùng thế nào, thì nó vẫn thuộc về tư duy
của con người, bởi con người luôn hướng về tương lai. Và trong thời đại bùng
nổ công nghệ thơng tin, dự báo lại đóng một vai trị quan trọng hơn nữa, khi
nhu cầu về thông tin thị trường, tình hình phát triển trong tương lai ngày càng
cao, và đồng thời các phương pháp mô phỏng dự báo hiệu quả hơn nhờ sự hỗ
trợ của máy tính. Chính vì thế mà dự báo được sử dụng trong nhiều lĩnh vực
khác nhau, mỗi lĩnh vực có một yêu cầu về dự báo riêng nên phương pháp dự
báo được sử dụng cũng khác nhau.
Hiện nay, dự báo với tư cách một ngành khoa học độc lập, có hệ thống
lí luận, phương pháp luận và các phương pháp riêng nhằm nâng cao tính hiệu
quả của dự báo. Nếu có hoạch định rõ ràng, và một phương pháp tiếp cận hiệu
quả thì các nhà quản trị sẽ cho ra một kết quả dự báo chính xác, và phương
pháp dự báo mà chúng tôi sẽ đề cập đến trong đề tài này là phương pháp phân
tích cơ bản dựa trên dữ liệu chuỗi thời gian. Các nghiên cứu liên quan đến dữ
liệu chuỗi thời gian và dự báo có rất nhiều, rất đa dạng, ở nhiều lĩnh vực khác
nhau. Trong luận văn này có thể tóm tắt một số nghiên cứu liên quan tiêu biểu
dựa vào mơ hình tự hồi quy AR (Auto Regressive).
5
1.1.2. Đặc điểm của dự báo
Đặc điểm cốt yếu của dự báo chính là để đo các mức độ phát triển của
các hiện tượng, sự việc trong tương lai, qua đó giúp các nhà quản trị doanh
nghiệp chủ động hơn trong việc đề ra các kế hoạch và các quyết định cần thiết
để phục vụ cho quá trình sản xuất kinh doanh, đầu tư, quảng bá, phân phối
sản phẩm, nguồn cung cấp tài chính… và chuẩn bị đầy đủ điều kiện cơ sở vật
chất, kỹ thuật cho sự phát triển trong thời gian tới như: lao động, nguyên vật
liệu, tư liệu lao động…
Những ưu điểm của dự báo, bao gồm:
Trong các doanh nghiệp nếu công tác dự báo được thực hiện một
cách nghiêm túc thì sẽ tạo điều kiện nâng cao khả năng cạnh tranh trên
thị trường.
Dự báo chính xác sẽ giảm bớt mức độ rủi ro cho doanh nghiệp
nói riêng và tồn bộ nền kinh tế nói chung.
Dự báo chính xác là căn cứ để các nhà hoạch định các chính sách
phát triển kinh tế văn hố xã hội trong tồn bộ nền kinh tế quốc dân.
Nhờ có dự báo mà các chính sách kinh tế, các kế hoạch và chương
trình phát triển kinh tế được xây dựng có cơ sở khoa học và mang lại
hiệu quả kinh tế cao. Đồng thời, nhờ có dự báo thường xuyên và kịp
thời, các nhà quản trị doanh nghiệp có thể đưa ra những biện pháp
điều chỉnh các hoạt động kinh tế trong quá trình vận hành mình nhằm
thu được hiệu quả sản xuất kinh doanh cao nhất.
1.1.3. Các loại dự báo
Phân loại dự báo được căn cứ vào: kết quả dự báo, phương pháp dự báo
và đối tượng dự báo.
1.1.3.1. Căn cứ vào kết quả dự báo
Dựa vào kết quả dự báo chúng ta có thể chia dự báo thành dự báo điểm
6
và dự báo khoảng. Dự báo điểm là kết quả được biểu hiện bằng một giá trị
duy nhất, dự báo khoảng là kết quả dự báo được cho trong một khoảng giá trị
với xác suất tin cậy cho trước. Dự báo có thể là ngắn hạn, trung hạn hoặc dài
hạn.
Dự báo dài hạn là những dự báo có thời gian dự báo từ 5 năm trở
lên. Thường dùng để dự báo những mục tiêu, chiến lược về kinh tế
chính trị, khoa học kỹ thuật trong thời gian dài ở tầm vĩ mơ.
Dự báo trung hạn là những dự báo có thời gian dự báo từ 3 đến 5
năm. Thường phục vụ cho việc xây dựng những kế hoạch trung hạn về
kinh tế văn hố xã hội… ở tầm vi mơ và vĩ mô.
Dự báo ngắn hạn là những dự báo có thời gian dự báo dưới 3
năm, loại dự báo này thường dùng để dự báo hoặc lập các kế hoạch
kinh doanh trong khoảng thời gian ngắn nhằm phục vụ cho công tác
chỉ đạo kịp thời.
Cách phân loại này chỉ mang tính tương đối tuỳ thuộc vào từng loại
hiện tượng để quy định khoảng cách thời gian cho phù hợp với loại hiện
tượng đó: ví dụ trong dự báo kinh tế, dự báo dài hạn là những dự báo có tầm
dự báo trên 5 năm, nhưng trong dự báo thời tiết, khí tượng học chỉ là một
tuần. Thang thời gian đối với dự báo kinh tế dài hơn nhiều so với thang thời
gian dự báo thời tiết. Vì vậy, thang thời gian có thể đo bằng những đơn vị
thích hợp (như quý, năm đối với dự báo kinh tế và ngày đối với dự báo thời
tiết).
1.1.3.2. Dựa vào các phương pháp dự báo
Phương pháp dự báo thường chia thành 2 nhóm chính là phương pháp
định tính (phương pháp chun gia) và phương pháp định lượng (phương
trình hồi qui, dãy số thời gian, …).
Cụ thể, dự báo có thể chi thành 3 nhóm chính sau:
7
Dự báo bằng phương pháp chuyên gia: Loại dự báo này được
tiến hành trên cơ sở tổng hợp, xử lý ý kiến chủ quan của các chuyên
gia thông thạo với hiện tượng được nghiên cứu, từ đó có phương pháp
xử lý thích hợp đề ra các dự đốn. Phương pháp này có ưu thế trong
trường hợp dự đốn những hiện tượng hay quá trình bao quát rộng,
như sự thay đổi của môi trường, thời tiết, chiến tranh trong khoảng
thời gian dài. Để dự báo bằng phương pháp chuyên gia được chính
xác hơn, các nhà quản trị đã cải tiến bằng phương pháp Delphi – là
phương pháp dự báo cũng dựa trên ý kiến chuyên gia, nhưng thay vì
lắng nghe ý kiến từ những cá nhân thì nay sử dụng một tập hợp những
đánh giá của một nhóm chuyên gia. Mỗi chuyên gia được hỏi ý kiến
và rồi dự báo của họ được trình bày dưới dạng thống kê tóm tắt. Việc
trình bày những ý kiến này được thực hiện một cách gián tiếp (khơng
có sự tiếp xúc trực tiếp) để tránh những sự tương tác trong nhóm nhỏ
qua đó tạo nên những sai lệch nhất định trong kết quả dự báo. Sau đó
người ta yêu cầu các chuyên gia duyệt xét lại những dự báo của họ
trên cơ sở tóm tắt tất cả các dự báo có thể có những bổ sung thêm.
Dự báo theo phương trình hồi quy: Theo phương pháp này, mức
độ cần dự báo phải được xây dựng trên cơ sở xây dựng mơ hình hồi
quy, mơ hình này được xây dựng phù hợp với đặc điểm và xu thế phát
triển của hiện tượng nghiên cứu. Để xây dựng mơ hình hồi quy, địi
hỏi phải có tài liệu về hiện tượng cần dự báo và các hiện tượng có liên
quan. Loại dự báo này thường được sử dụng để dự báo trung hạn và
dài hạn ở tầm vĩ mô.
Dự báo dựa vào dãy số thời gian: Là dựa trên cơ sở dãy số thời
gian phản ánh sự biến động của hiện tượng ở những thời gian đã qua
để xác định mức độ của hiện tượng trong tương lai.
8
1.3.3.3. Căn cứ vào đối tượng dự báo
Có thể chia dự báo thành: Dự báo khoa học, dự báo kinh tế, dự báo xã
hội, dự báo tự nhiên, thiên văn học…
- Dự báo khoa học: Là sự nghiên cứu khoa học về những triển vọng của
một hiện tượng nào đó, chủ yếu là những đánh giá số lượng và chỉ ra khoảng
thời gian mà trong đó hiện tượng có thể diễn ra những biến đổi.
- Dự báo kinh tế: Là khoa học dự báo các hiện tượng kinh tế trong
tương lai. Dự báo kinh tế được coi là giai đoạn trước của công tác xây dựng
chiến lược phát triển kinh tế - xã hội và dự án kế hoạch dài hạn; không đặt ra
những nhiệm vụ cụ thể, nhưng chứa đựng những nội dung cần thiết làm căn
cứ để xây dựng những nhiệm vụ đó. Các kết quả dự báo kinh tế cho phép hiểu
rõ đặc điểm của các điều kiện kinh tế - xã hội để đặt chiến lược phát triển
kinh tế đúng đắn, xây dựng các chương trình, kế hoạch phát triển một
cách chủ động, đạt hiệu quả cao và vững chắc.
- Dự báo xã hội: Dự báo xã hội là khoa học nghiên cứu những triển
vọng cụ thể của một hiện tượng, một sự biến đổi, một qúa trình xã hội, để đưa
ra dự báo hay dự đốn về tình hình diễn biến, phát triển của một xã hội.
- Dự báo tự nhiên, thiên văn học, loại dự báo này thường bao gồm:
+ Dự báo thời tiết: Thông báo thời tiết dự kiến trong một thời gian nhất
định trên một vùng nhất định. Trong dự báo thời tiết có dự báo chung, dự báo
khu vực, dự báo địa phương, v.v. Về thời gian, có dự báo thời tiết ngắn (1-3
ngày) và dự báo thời tiết dài (tới một năm).
+ Dự báo thuỷ văn: Là loại dự báo nhằm tính để xác định trước sự phát
triển các qúa trình, hiện tượng thủy văn xảy ra ở các sơng hồ, dựa trên các tài
liệu liên quan tới khí tượng thủy văn. Dự báo thủy văn dựa trên sự hiểu biết
những quy luật phát triển của các q trình, khí tượng thuỷ văn, dự báo sự
xuất hiện của hiện tượng hay yếu tố cần quan tâm. Căn cứ thời gian dự kiến,
9
dự báo thuỷ văn được chia thành dự báo thủy văn hạn ngắn (thời gian không
quá 2 ngày), hạn vừa (từ 2 đến 10 ngày); dự báo thủy văn mùa (thời gian dự
báo vài tháng); cấp báo thủy văn: thông tin khẩn cấp về hiện tượng thủy văn
gây nguy hiểm. Theo mục đích dự báo, có các loại: dự báo thuỷ văn phục vụ
thi công, phục vụ vận tải, phục vụ phát điện, v.v. Theo yếu tố dự báo, có: dự
báo lưu lượng lớn nhất, nhỏ nhất, dự báo lũ, v.v.
+ Dự báo địa lý: Là việc nghiên cứu về hướng phát triển của mơi
trường địa lí trong tương lai, nhằm đề ra trên cơ sở khoa học những giải pháp
sử dụng hợp lí và bảo vệ mơi trường.
+ Dự báo động đất: Là loại dự báo trước địa điểm và thời gian có khả
năng xảy ra động đất. Động đất không đột nhiên xảy ra mà là một quá trình
tích lũy lâu dài, có thể hiện ra trước bằng những biến đổi địa chất, những hiện
tượng vật lí, những trạng thái sinh học bất thường ở động vật, v.v. Việc dự
báo thực hiện trên cơ sở nghiên cứu bản đồ phân vùng động đất và những dấu
hiệu báo trước. Cho đến nay, chưa thể dự báo chính xác về thời gian động đất
sẽ xảy ra [16].
1.1.4. Quy trình dự báo
Thông thường trong các dự báo về kinh tế, quy trình dự báo được chia
thành các bước sau.
1) Xác định mục tiêu dự báo
2) Xác định loại dự báo
3) Chọn mơ hình dự báo
4) Thu thập số liệu và tiến hành dự báo
5) Ứng dụng kết quả dự báo
6) Theo dõi kết quả dự báo
1.2. TỔNG QUAN VỀ CHUỖI THỜI GIAN
1.2.1. Chuỗi thời gian và quá trình ngẫu nhiên
1.2.1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên
10
Khái niệm chuỗi thời gian
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x 1, x2,………
xn} được xếp thứ tự diễn biến thời gian với x 1 là các giá trị quan sát tại thời
điểm đầu tiên, x2 là quan sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm
thứ n. Diễn giải chi tiết thì chuỗi thời gian là một tập hợp gồm các số liệu có
cùng khái niệm và phạm vi được thu thập liên tục thường kỳ (ngày, tuần,
tháng, quý, năm) trong một khoảng thời gian dài và được sắp xếp theo thứ tự
thời gian.
Các báo cáo tài chính về chỉ số chứng khoán, chỉ số tiêu dùng, hay sản
lượng tiêu thụ của một mặt hàng thống kê theo thời gian đều là những thể
hiện rất thực tế của chuỗi thời gian.
Với khái niệm như trên, chuỗi thời gian sẽ có các tính chất sau:
-
Chuỗi thời gian có thể là liên tục hoặc rời rạc.
-
Các quan sát kế tiếp nhau thường có mối quan hệ với nhau vì thế
giá trị tương lai thường được dự đoán từ giá trị trong quá khứ.
-
Chuỗi thời gian có thể được xác định hay ngẫu nhiên.
Khái niệm quá trình ngẫu nhiên
Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mơ hình
tốn học phù hợp với tập dữ liệu cho trước X:={x1, x2,……… xn}nào đó. Để
có thể nói về bản chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan
sát xt là một giá trị thể hiện của biến ngẫu nhiên Xt với t T. Ở đây T được gọi
là tập chỉ số. Khi đó ta có thể coi tập dữ liệu X:={x1, x2,……… xn} là thể hiện
của quá trình ngẫu nhiên {Xt, t T}. Và vì vậy, ta có thể định nghĩa một q
trình ngẫu nhiên như sau: Một quá trình ngẫu nhiên là một họ các biến ngẫu
nhiên {Xt, t T} được định nghĩa trên một không gian xác suất (Ω , A , P).
Như vậy, quá trình ngẫu nhiên được coi là biết rõ khi thu nhận và xử lí
11
được một tập đủ nhiều các giá trị đặc trưng của nó. Giả sử q trình ngẫu
nhiên X(t) có một tập các giá trị mẫu (hay còn được gọi là các biến), khi đó ta
biểu diễn q trình như sau: X(t)={x(t)}x
X
1.2.1.2. Quá trình ngẫu nhiên dừng
Các quá trình ngẫu nhiên mà những tính chất thống kê của chúng khơng
thay đổi theo đối số được gọi là các quá trình ngẫu nhiên dừng. Chính xác
hơn, q trình ngẫu nhiên được gọi là dừng nếu tất cả các quy luật phân bố
hữu hạn chiều của nó khơng thay đổi khi thêm vào mọi giá trị của đối số với
cùng một số.
Cụ thể: Xét quá trình ngẫu nhiên {Xt}t T. Với bất kỳ số nguyên dương
n, gọi t1 , t2 , t3 ,..., tn là một dãy chỉ số thời gian tăng. Ta nói q trình ngẫu
nhiên {Xt}t
T
là q trình dừng nếu hàm phân phối đồng thời có tính chất sau:
FXt1 Xt2... Xtn (x1, x2,..., xn ) = FXt1+sXt2+s ...Xtn + s (x1, x2,..., xn) , với s sao cho tk+s
T ,k.
1.2.1.3. Hàm tự tương quan
Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành
phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các số
liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo).
Hàm tự tương quan đo lường phụ thuộc tuyến tính giữa các cặp quan
sát y(t) và y(t+k), ứng với thời đoạn k = 1, 2, …(k còn gọi là độ trễ). Với mỗi
độ trễ k, hàm tự tương quan tại độ trễ k được xác định qua độ lệch giữa các
biến ngẫu nhiên Yt. Yt+k so với các giá trị trung bình, và được chuẩn hóa qua
phương sai.
1.2.1.4. Toán tử tiến, toán tử lùi
Toán tử lùi B kết hợp với một quá trình ngẫu nhiên Xt, tZlà quá
trình ngẫu nhiên Yt, tZsao cho Yt:BX t:X t1.
12
Tốn tử lùi B là tốn tử tuyến tính và khả nghịch. Nghịch đảo của nó
B-1:=F được gọi là tốn tử tiến, định nghĩa bởi cơng thức: FXt:=Xt+1
Các tốn tử B, F thoả mãn hệ thức [15].
BnXt = Xt-n, FnXt :=Xt+n
n
n
i 0
Và ai Bi X t ai X t i
i 0
1.2.2. Quá trình ARMA
Với lĩnh vực nghiên cứu xử lý tín hiệu số thì việc quan tâm đến các
chuyển dịch trạng thái trên dòng dữ liệu được thực hiện bởi các bộ lọc là một
việc làm rất cần thiết. Và nếu một chuỗi thời gian có tính dừng, ta có thể lập
mơ hình theo nhiều cách khác nhau, cụ thể là: Mơ hình tự hồi quy AR (auto
regressive), Mơ hình trung bình trượt MA (moving average) và Mơ hình tự
hồi quy trung bình trượt ARMA (autoregressive - moving average).
1.2.2.1. Quá trình tự hồi quy (AR)
a. Quá trình ồn trắng
Quá trình ngẫu nhiên t, tZđược gọi là một ồn trắng, ký hiệu
WN(0,2), khi nó thoả mãn các điều kiện sau:
Ets = 0 (ts)
E2t2
Et0,t
b. Quá trình tự hồi quy
Người ta gọi quá trình ngẫu nhiên Xt, tZlà một quá trình tự hồi quy
cấp P,viết là Xt AR(p), là một quá trình dừng {Xt, tZ} thoả mãn biểu thức:
Xta1Xt-1 + a2Xt-2 + …+ apXt-p +t | ap 0
với {} là một ồn trắng.
Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức
Xt–a1Xt-1 – a2Xt-2 – …– apXt-p = t | ap 0
13
Hay ở dạng toán tử: a(z) := 1 – a1z – a2z2 – …– apzp
ở đây a(z) được gọi là đa thức hồi quy.
1.2.2.2. Quá trình trung bình trượt (MA)
Một quá trình trung bình trượt cấp q, ký hiệu Xt MA(q), là một quá
trình Xt,tZthoả mãn biểu thức:
Xt1b1t1....bqtq,b1b2,… bqR bq 0
vớitlà một ồn trắng.
Ta cũng có thể viết biểu thức trung bình trượt ở trên dưới dạng tốn tử
lùitương tự như đối với quá trình tự hồi quy như sau :
Xt = b(B)t,
Trong đó hàm b(.) định nghĩa bởi
b(z) : 1+b1z+…+bqzq.
Ở đây b(z) được gọi là đa thức trung bình trượt.
1.2.2.3. Quá trình tự hồi quy trung bình trượt (ARMA)
Một quá trình Xt, tZđược gọi là quá trình tự hồi quy trung bình
trượt cấp p,q, kí hiệu Xt ARMA(p,q) là một quá trình Xt, tZthỏa mãn
Xt a1Xt1.... apXtp + t + b1t-1 + …
+bqt q,=,a1a2,… ,ap,b1b2,… bqR, ap0, bq0
Trong đó t là ồn trắng, a(.) và b(.) lần lượt là đa thức tự hồi quy và đa
thức trung bình trượt có bậc tương ứng là p và q:
a(z) :1 – a1z – … – apzp
b(z) :1 – b1z + … + bqzq
Khi đó ta có thể viết q trình ARMA ở dạng toán tử như sau:
a(B)Xtb(B)t
1.2.3. Ước lượng tham số mơ hình ARMA
Giả sử ta cần ước lượng các tham số của mơ hình ARMA(p,q)
14
Xt a1Xt1.... apXtp + t + b1t-1 + …+bqt qa1a2,… ,ap,b1b2,… bqR, ap0,
bq0, trong đó t đóng vai trị là sai số.
Đối với mơ hình ARMA, có nhiều phương pháp ước lượng tham số
hiệu quả và một trong số đó là phương pháp bình phương cực tiểu theo kiểu
thuật tốn Hannan – Rissanen. Ý tưởng của thuật toán này là sử dụng hồi quy
tuyến tính để ước lượng các tham số. Nếu q>0 ta còn phải ước lượng các giá
trị chưa biết t.
Thuật toán Hannan – Rissanen
Bước 1:
Dùng ước lượng Yule Walker để ước lượng các tham số mơ hình
AR(m), với m >max(p,q).
Xt a1Xt1.... amXtm + t ,t m+1,…,n.
Bước 2:
Ước lượng vecto tham số (a1,…,ap,b1…,bq)t trên cơ sở cực tiểu hóa
hàm
Giải hệ Gauss-Markov, kết quả thu được ở dạng sau:
(Zt Z)-1 ZtXn ,
Ta cũng có thể dùng phương pháp trực giao hóa Househoder để tìm
[15].
Ở đây,
Xn = (Xm+1+q,…,Xn)
Và
15
Ước lượng phương sai ɛt theo công thức
s
Kết luận Chương 1
Dự báo trước được những sự việc, hiện tượng xảy ra trong tương lai
giúp cho con người hoạch định tốt hơn cơng việc của mình, giúp nâng cao
hiệu quả, tiết kiệm thời gian và giảm bớt công sức trong công việc. Hiện nay,
đã có rất nhiều nghiên cứu trong và ngồi nước được đưa ra nhằm giải quyết
bài tốn dự báo. Những nghiên cứu đó dù đi theo hướng nào đi chăng nữa thì
mục tiêu cũng nhằm nâng cao độ chính xác của kết quả dự báo và giảm bớt
khối lượng tính tốn của bài tốn này. Những dữ liệu con người thu thập được
có rất nhiều loại, và dữ liệu mà con người dùng cho bài toán dự báo cũng vậy.
Dữ liệu dạng số liệu, rõ ràng và chính xác thường được dự báo bằng các
phương pháp toán học, thống kê, tuy nhiên, với những dữ liệu có sự biến
động lớn hay những dữ liệu trong thực tế được ghi nhận bằng các nhãn ngơn
ngữ thì khó có thể giải quyết được bằng các phương pháp toán học, thống kê
truyền thống. Do đó, việc thiết lập một mơ hình dự báo chuỗi thời gian bậc
cao là cần thiết, và để hiểu một mơ hình dự báo chuỗi thời gian thì những lý
thuyết cơ bản về dự báo và chuỗi thời gian là điều cần quan tâm, vì để một dự
báo được áp dụng thành cơng thì vấn đề quan trọng hàng đầu được đặt ra là
việc nắm bắt tối đa thông tin về lĩnh vực dự báo. Thông tin ở đây bao gồm:
các số liệu quá khứ trong lĩnh vực dự báo; diễn biến tình hình, động thái phát
triển của lĩnh vực dự báo; đánh giá một cách đầy đủ các nhân tố đến việc dự
16
báo. Chương 1 đưa ra những lý thuyết như khái niệm, đặc điểm, quy trình dự
báo, khái niệm chuỗi thời gian cũng khơng nằm ngồi mục đích trên.
17
CHƯƠNG 2. XÂY DỰNG MƠ HÌNH DỰ BÁO CHUỖI THỜI
GIAN MỜ BẬC CAO
2.1. SƠ LƯỢC VỀ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ
2.1.1. Lý thuyết tập mờ
Mỗi tập hợp A X được xác định bởi một hàm đặc trưng:
1 nếu x A
0
nếu x A
A (x)
Đây là một ánh xạ từ X vào 0,1 . Như vậy có thể biểu diễn A bằng các
cặp
( x, A ( x))
với mỗi x X và
A ( x) 0,1 .
Ở đây, ứng với giá trị 0 là phần tử
không thuộc A , ứng với giá trị 1 là phần tử thuộc A . Mặt khác, một tập hợp
A có thể xác định thơng qua một vị từ P(x) mơ tả tính chất của các phần tử
trong A . Đơn giản, trong trường hợp trên có thể lấy
đó, với mỗi
x
cụ thể mệnh đề
P(x)
P(x) ”x
x
thuộc A”. Khi
có giá trị chân lý chính là
A (x) .
Giá trị
chân lý của mệnh đề chỉ nhận 1 hoặc 0 ứng với đúng hoặc sai trong logic kinh
điển.
Tập mờ là mở rộng của khái niệm tập hợp nói trên. Giả sử biên của tập
A là “mờ”, khi đó sẽ có phần tử hồn tồn thuộc A , có những phần tử khơng
hồn tồn thuộc A , nhưng cũng có phần tử thuộc A khơng chắc lắm. Đánh
giá mức độ này ta sẽ dùng một số thực trong đoạn 0,1 . Thay cho hàm đặc
trưng chúng ta dùng hàm thành viên (Membership function) - một ánh xạ
A
từ X vào 0,1 . Tương tự như trên, tập mờ A được xác định bởi các cặp
( x, A ( x))
với x X và
A ( x) [0,1] .
Giá trị 0 ứng với phần tử khơng hồn tồn
thuộc A , giá trị 1 ứng với phần tử hoàn toàn thuộc A , những giá trị khác ứng
với những phần tử không chắc thuộc A hay không. Mỗi giá trị
mỗi
x
gọi là mức độ thuộc của
x
A (x) ứng
với
trong A . Và giá trị chân lý của mệnh đề
18
P(x) ”x
thuộc A” có thể nhận khơng chỉ là 1 hoặc 0 mà cịn có thể nhận một
giá trị tùy ý trong khoảng (0,1). Đây là điểm khác nhau đầu tiên của logic mờ
đối với logic kinh điển. Để tiện cho việc trình bày sau này, từ đây chúng ta sẽ
ký hiệu U thay cho không gian X .
Định nghĩa: Cho U là một tập hợp khác rỗng. Tập mờ A trên U được
xác định bởi một hàm
Hàm
A (x)
A : U 0,1 .
được gọi là hàm thành viên biểu diễn mức độ thuộc của
đối với tập mờ A , có thể dùng kí hiệu tương đương là
x
A(x) .
Một cách khác, một tập mờ A hoàn toàn xác định bởi các cặp
( x, A ( x)) ,
tức là
A ( x, A ( x) | x U
Về kí hiệu, nếu U là tập rời rạc gồm các phần tử x1 ,..., xn thì ta dùng
kí hiệu như sau để chỉ cho tập mờ A trên U
n
A A ( xi ) / xi ,
i 1
Và nếu U liên tục thì dùng kí hiệu A
A ( x)
U
Ví dụ. A là “số gần bằng 1” biểu diễn
A
x
dx
0.1 0.6 1 0.6 0.1
.
1
0 1 2
3
Hoặc A cũng có thể xác định qua hàm thành viên, chẳng hạn
A ( x) e k ( x1) với k>0, k . Để ý rằng chúng ta đang biểu diễn một tính chất
2
mờ “gần bằng 1”, tính chất này khơng thể biểu diễn như những tính chất rõ
“bằng 1” được. Như vậy, tập mờ có thể dùng để biểu diễn các khái niệm
“mờ”.
2.1.2. Đại số gia tử
Đại số gia tử được giới thiệu bởi N.C. Ho và W.Wechler nhằm giải
quyết vấn đề phương pháp luận và cung cấp một mô hình tốn học mềm dẻo,
linh hoạt và hiệu quả cho việc xử lý dữ liệu mờ. Tiếp cận đại số gia tử là cách
19
tiếp cận khác biệt so với tiếp cận mờ và khá hiệu quả trong lĩnh vực điều
khiển, công nghệ thông tin. Để làm cơ sở cho việc ứng dụng dụng đại số gia
tử trong dự báo chuỗi thời gian mờ, chúng ta cùng điểm qua một số khái niệm
cơ bản của đại số gia tử như sau:
Gọi AX = ( X, G, C, H, ≤ ) là một cấu trúc đại số, với X là tập nền của
AX; G = {c-,c+} là tập các phần tử sinh; C = {0, W, 1}, trong đó 0, W và 1
tương ứng là những phần tử đặc trưng cận trái (tuyệt đối nhỏ), trung hòa và
cận phải (tuyệt đối lớn); H là tập các tốn tử một ngơi được gọi là các gia tử;
≤ là biểu thị quan hệ thứ tự trên các giá trị ngôn ngữ. Gọi H là tập hợp các gia
tử âm và H+ là tập hợp các gia tử dương của AX.
Ký hiệu H = {h-1, h-2, …h-q}, trong đó h-1< h-2< … < h-q và H+ = {h1, h2,
…,hp}, trong đó h1< h2< … < hp.
Định nghĩa Độ đo tính mờ:
fm: X → [0, 1] gọi là độ đo tính mờ nếu thỏa mãn các điều kiện sau:
fm(c-)+fm(c+) = 1 và ∑h∈Hfm(hx) = fm(x), với∀X∈ X
Với các phần tử 0, W và 1, fm(0) = fm(W) = fm(1) = 0
Và với ∀x,y X, ∀h∈H,
Đẳng thức trên không phụ thuộc vào phần tử x,y và do đó ta có thể ký
hiệu là
và đây là độ đo tính mờ của gia tử h. Tính chất của fm(x) và
như sau:
+) fm(hx)=µ(h)fm(x), ∀x X
, với c∈{c-, c+}
+)
+)
+)
và
, với α,β>0 và α+β=1