Tải bản đầy đủ (.pdf) (125 trang)

Dự báo dữ liệu chuỗi thời gian có tính hỗn loạn sử dụng mạng nơ ron rbf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.83 MB, 125 trang )

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
----------------------------

NGUYỄN VĂN TRỰC

DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN
LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

Chun ngành: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01

LUẬN VĂN THẠC SĨ

TP. HỒ CHÍ MINH, tháng 8 năm 2016


CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI
TRƯỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM
Cán bộ hướng dẫn khoa học : PGS. TS. Dương Tuấn Anh
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Cán bộ chấm nhận xét 1 : PGS. TS. Đỗ Phúc
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Cán bộ chấm nhận xét 2 : PGS. TS. Hồ Bảo Quốc
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp.
HCM ngày 19 tháng 07 năm 2016.

Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)
1. PGS. TS. Quản Thành Thơ


2. TS. Võ Thị Ngọc Châu
3. PGS. TS. Đỗ Phúc
4. PGS. TS. Hồ Bảo Quốc
5. TS. Nguyễn An Khương

Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý
chuyên ngành sau khi luận văn đã được sửa chữa (nếu có).
CHỦ TỊCH HỘI ĐỒNG

TRƯỞNG KHOA KH&KTMT


ĐẠI HỌC QUỐC GIA TP.HCM

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

TRƯỜNG ĐẠI HỌC BÁCH KHOA

Độc lập – Tự do – Hạnh phúc

NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Nguyễn Văn Trực

MSHV: 12070552

Ngày, tháng, năm sinh: 10/08/1986

Nơi sinh: Nam Định

Chuyên ngành: Khoa Học Máy Tính


Mã số: 60.48.01

I. TÊN ĐỀ TÀI: DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CÓ TÍNH HỖN LOẠN
SỬ DỤNG MẠNG NƠ-RON RBF
II. NHIỆM VỤ VÀ NỘI DUNG
- Tìm hiểu lý thuyết về dữ liệu chuỗi thời gian có tính hỗn loạn (chaotic time
series).
- Tìm hiểu về mạng nơ-ron RBF và phương pháp huấn luyện mạng nơ-ron RBF.
- Ứng dụng mạng nơ-ron RBF để dự báo dữ liệu chuỗi thời gian có tính hỗn loạn.
- Hiện thực và thử nghiệm chương trình dự báo dữ liệu chuỗi thời gian có tính hỗn
loạn.
- So sánh hiệu quả của mạng nơ-ron truyền thẳng và mạng nơ-ron RBF trong dự
báo dữ liệu chuỗi thời gian có tính hỗn loạn.
III. NGÀY GIAO NHIỆM VỤ: 17/08/2015
IV. NGÀY HOÀN THÀNH NHIỆM VỤ: 17/06/2016
V. CÁN BỘ HƯỚNG DẪN:

PGS. TS. Dương Tuấn Anh
Tp. HCM, ngày . . . . tháng . . . năm 2016

CÁN BỘ HƯỚNG DẪN

TRƯỞNG KHOA KH&KTMT

(Họ tên và chữ ký)

(Họ tên và chữ ký)



DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

LỜI CẢM ƠN


Trước hết, tôi xin đặc biệt gửi lời cảm ơn chân thành và sâu sắc đến PGS.TS
Dương Tuấn Anh, người đã trực tiếp hướng dẫn tơi trong q trình làm luận văn này.
Thầy khơng chỉ hướng dẫn chu đáo, tận tình mà cịn cung cấp cho tôi những kiến thức,
những tài liệu hay và những lời khuyên quý giá trong suốt quá trình tơi học tập cũng như
q trình tìm hiểu và làm đề tài luận văn này. Đây chính là một trong những nhân tố
không thể thiếu để tạo động lực cho tơi hồn thành đề tài này.
Tơi cũng xin gửi lời cảm ơn đến gia đình, bạn bè, những bạn đồng nghiệp, những
bạn học viên các khóa cao học đã chia sẻ kiến thức cho tôi, những người luôn sát cánh,
động viên và tạo mọi điều kiện tốt nhất để tôi có thể học tập và hồn tất được luận văn
tốt nghiệp này.
Tơi chân thành biết ơn sự tận tình dạy dỗ và sự giúp đỡ của tất cả quý thầy cơ
trong khoa Khoa học và Kỹ thuật Máy tính trường Đại học Bách khoa TP. HCM.
Cuối cùng tôi đã cố gắng hồn thành tốt nhất có thể cho luận văn này, tuy nhiên
khó tránh khỏi thiếu sót do tầm nhìn của bản thân còn hạn hẹp, rất mong nhận được sự
góp ý của q thầy cơ và các bạn.

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

i


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

TÓM TẮT LUẬN VĂN


Trong những thập niên gần đây các mơ hình dự báo cho dữ liệu chuỗi thời gian
không ngừng phát triển và được cải tiến thường xuyên. Trong đó có nhiều phương pháp
nhằm giúp tối ưu các giải thuật cũng như cho khả năng dự báo tốt hơn. Mạng nơ-ron
nhân tạo nói chung và mạng nơ-ron RBF (Radial Basis Function) nói riêng cũng được
nghiên cứu trong rất nhiều đề tài và được áp dụng vào các mơ hình dự báo thực tiễn của
dữ liệu chuỗi thời gian nhờ vào khả năng xấp xỉ hàm phi tuyến. Tuy nhiên, nhiều nghiên
cứu cho thấy đối với dữ liệu chuỗi thời gian có tính hỗn loạn thì chất lượng dự báo của
mạng nơ-ron nhân tạo khơng được cao.
Trong luận văn này, chúng tôi xây dựng và hiện thực mơ hình dự báo dữ liệu
chuỗi thời gian có tính hỗn loạn sử dụng mạng nơ-ron RBF. Ý tưởng chính là sử dụng
mạng nơ-ron RBF để tận dụng khả năng huấn luyện nhanh của nó và kết hợp với việc
phân tích các kỹ thuật của q trình xây dựng lại không gian pha (phase space) dựa trên
các đặc tính hỗn loạn của dữ liệu chuỗi thời gian sẽ giúp cho việc dự báo có kết quả tốt
hơn. Quá trình xây dựng lại khơng gian pha là q trình hình thành nên các chuỗi dữ liệu
với số chiều đủ lớn dựa trên lý thuyết hỗn loạn mà đảm bảo để mạng nơ-ron RBF thích
nghi và đáp ứng được khả năng học trên các chuỗi dữ liệu này.
Trong quá trình thực nghiệm của việc huấn luyện mạng và dự đoán với các bộ dữ
liệu thực tế có đặc tính hỗn loạn, mơ hình này đã cho thấy khả năng dự đốn tốt hơn so
với mơ mạng nơ-ron nhân tạo thuần túy cũng như mơ hình mạng nơ-ron RBF khi chưa
được xây dựng lại khơng gian pha.
Các từ khóa: Mạng nơ-ron RBF, Lý thuyết hỗn loạn, Xây dựng lại không gian
pha, Chuỗi thời gian có tính hỗn loạn, Dự báo dữ liệu chuỗi thời gian.

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

ii


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF


ABSTRACT
In recent decades, the forecast models for time series data have been continuously
developed and improved. Among them, there are many methods to optimize the
algorithms as well as to enhance predictability. Artificial neural network in general and
RBF (Radial Basis Function) neural network in particular have been studied in a variety
of domains and applied in several practical time series data due to their learning and
nonlinear function approximation ability. However, many studies show that the simple
forecast models of neural network can not forecast well the chaotic time series data.
In this work, we study to use RBF neural network for forecasting chaotic time
series data. The main idea of using RBF neural network is to exploit its fast training
capability and to combine this advantage with the process of phase space reconstruction
in order to bring out better forecasting precision. The process of phase space
reconstruction aims to form the time series data in the dimension which is large enough.
This process which is based on chaos theory can ensure RBF neural network to be able to
capture the features of the time series data.
Experimental results on several real and synthetic datasets of chaotic time series
reveal that RBF neural network with phase space reconstruction outperforms MLP neural
network as well as RBF neural networks without phase space reconstruction.
Keywords: RBF Neural Network, Chaos Theory, Phase Space Reconstruction,
Chaotic Time Series, Time Series Prediction.

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

iii


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

LỜI CAM ĐOAN
Tôi xin cam đoan rằng ngoại trừ các kết quả tham khảo từ các cơng trình khác như

đã ghi trong mục tham khảo của luận văn, các cơng việc trình bày trong luận văn này là
do chính chúng tơi thực hiện và chưa có phần nội dung nào của luận văn này được nộp
để lấy một bằng cấp ở trường đại học nào khác.

Hồ Chí Minh, ngày ….. tháng …. năm…….
Ký tên

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

iv


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

MỤC LỤC
LỜI CẢM ƠN ............................................................................................................. i
TÓM TẮT LUẬN VĂN ............................................................................................ ii
ABSTRACT .............................................................................................................. iii
LỜI CAM ĐOAN...................................................................................................... iv
MỤC LỤC .................................................................................................................. v
DANH MỤC HÌNH ẢNH....................................................................................... viii
DANH MỤC BẢNG ................................................................................................ xii
CHƯƠNG 1. GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI ........................................... 1
1.1. GIỚI THIỆU ĐỀ TÀI ..................................................................................... 1
1.2. MỤC TIÊU VÀ GIỚI HẠN ĐỀ TÀI.............................................................. 3
1.3. TÓM LƯỢC NHỮNG KẾT QUẢ ĐẠT ĐƯỢC ............................................ 3
1.4. CẤU TRÚC BÁO CÁO .................................................................................. 4
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT .......................................................................... 6
2.1. DỮ LIỆU CHUỖI THỜI GIAN ..................................................................... 6
2.2. DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN .............................. 6

2.1.1.

Tính hỗn loạn ...................................................................................... 7

2.1.2.

Các khái niệm cơ bản về phân tích chuỗi thời gian có tính hỗn loạn . 9

2.3. MẠNG NƠ-RON RBF ................................................................................. 20
2.3.1.

Sơ lược về mạng nơ-ron ................................................................... 20

2.3.2.

Hàm cơ sở xuyên tâm RBF............................................................... 21

2.3.3.

Huấn luyện một mạng RBF. ............................................................. 22

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

v


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

CHƯƠNG 3. NHỮNG CƠNG TRÌNH LIÊN QUAN ............................................ 26
3.1. NHỮNG CƠNG TRÌNH VỀ DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN

BẰNG ANN. ................................................................................................. 26
3.1.1.

Áp dụng mạng Nơ-ron vào dự báo dữ liệu chuỗi thời gian.............. 26

3.1.2.

Các bước xây dựng một mơ hình mạng nơ-ron cho dự báo dữ liệu
chuỗi thời gian .................................................................................. 27

3.2. NHỮNG CƠNG TRÌNH VỀ DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ
TÍNH HỖN LOẠN BẰNG ANN. ................................................................ 28
3.2.1.

Xây dựng không gian pha cho chuỗi thời gian chất lượng nước...... 29

3.2.2.

Thời gian trễ tối thiểu. ...................................................................... 30

3.2.3.

Số chiều nhúng tối ưu. ...................................................................... 30

3.2.4.

Tiêu chuẩn đặc trưng có tính hỗn loạn của chuỗi thời gian độ đục của
nước. ................................................................................................. 31

3.2.5.


Mơ hình cục bộ (local model) và k - láng giềng gần nhất. ............... 31

3.3. NHỮNG CƠNG TRÌNH VỀ DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ
TÍNH HỖN LOẠN BẰNG MẠNG NƠ-RON RBF. .................................... 32
3.3.1.

Số chiều nhúng tối ưu. ...................................................................... 33

3.3.2.

Dự báo dựa vào số chiều tối ưu. ....................................................... 33

CHƯƠNG 4. XÂY DỰNG MƠ HÌNH HUẤN LUYỆN VÀ DỰ BÁO SỬ DỤNG
MẠNG NƠ-RON RBF............................................................................................. 35
4.1. GIẢI THUẬT LAN TRUYỀN NGƯỢC ĐƯỢC HIỆU CHỈNH ................. 35
4.2. MỘT SỐ KỸ THUẬT XÁC ĐỊNH YẾU TỐ ĐỘ RỘNG ........................... 40
4.3. KỸ THUẬT KHỞI TẠO CÁC TRỌNG SỐ ĐẦU RA ................................ 41
4.4. XÂY DỰNG MƠ HÌNH DỰ BÁO .............................................................. 44
HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

vi


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

4.4.1.

Ý tưởng ............................................................................................. 44


4.4.2.

Hiện thực .......................................................................................... 45

CHƯƠNG 5. THỰC NGHIỆM VÀ ĐÁNH GIÁ .................................................... 51
5.1. CÁCH THỨC THỰC NGHIỆM .................................................................. 51
5.2. KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ ............................................. 53
5.2.1.

Dữ liệu chuỗi thời gian không có tính hỗn loạn ............................... 53

5.2.2.

Dữ liệu chuỗi thời gian có tính hỗn loạn .......................................... 59

5.2.3.

Nhận xét chung ................................................................................. 86

CHƯƠNG 6. KẾT LUẬN........................................................................................ 88
6.1. ĐÁNH GIÁ KẾT QUẢ................................................................................. 88
6.1.1.

Những công việc đã làm được .......................................................... 88

6.1.2.

Những đúc kết về mặt lý luận ........................................................... 88

6.1.3.


Các mặt hạn chế ................................................................................ 90

6.2. HƯỚNG PHÁT TRIỂN ................................................................................ 91
TÀI LIỆU THAM KHẢO ........................................................................................ 92
PHỤ LỤC A. BẢNG ĐỐI CHIẾU THUẬT NGỮ ANH – VIỆT ......................... A-1
PHỤ LỤC B. HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH THỰC NGHIỆM . B-1

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

vii


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

DANH MỤC HÌNH ẢNH
Hình 1.1. Biểu đồ thể hiện lượng mưa hàng năm ghi nhận tại Los Angeles – California . 2
Hình 1.2. Biểu đồ Logistic thể hiện dự báo dữ liệu chuỗi thời gian có tính hỗn loạn, dựa
vào dữ liệu thực tế (Actual) và đưa ra dữ liệu được dự báo (Forecast).............................. 2
Hình 2.1. Chuỗi thời gian có tính hỗn loạn {𝒙𝒏 } từ biểu đồ Hénon. ............................... 8
Hình 2.2. Chuỗi thời gian {𝝋𝒏} nhận được từ phương trình Lorenz ................................ 8
Hình 2.3. (a) Không gian attractor của biểu đồ Hénon; (b) Độ dốc của đường thẳng đại
diện cho chiều đếm hộp D0 ............................................................................................... 10
Hình 2.4. Sơ đồ minh họa làm thế nào để tính tốn số lượng mũ Lyapunov tối đa. ........ 14
Hình 2.5. Sơ đồ minh họa làm thế nào để tính tốn số mũ Lyapunov tối đa từ chuỗi thời
gian hoặc dữ liệu thực nghiệm. ........................................................................................ 15
Hình 2.6. Sơ đồ minh họa giao nhau của hai không gian con với 𝒅𝟏 = 𝒅𝟐 = 𝟏 và 𝒎 =
𝟐. ...................................................................................................................................... 17
Hình 2.7. Sơ đồ minh họa giao nhau của hai không gian con với 𝒅𝟏 = 𝒅𝟐 = 𝟏 và 𝒎 =
𝟑. ...................................................................................................................................... 17

Hình 2.8. Sơ đồ minh họa giao nhau của hai không gian con với 𝒅𝟏 = 𝟏, 𝒅𝟐 = 𝟑 và
𝒎 = 𝟑. ............................................................................................................................ 18
Hình 2.9. Cấu hình một mạng nơ-ron RBF. ..................................................................... 21
Hình 2.10. Minh họa của hai hàm nhân Gauss trong 1 chiều........................................... 22
Hình 2.11. Tách đối tượng hai chiều thành các cụm. ....................................................... 23
Hình 3.1. Mơ hình học với chuỗi thời gian. ..................................................................... 27
Hình 3.2. Chuỗi thời gian độ đục của nước. ..................................................................... 29
Hình 3.3. Mối quan hệ giữa MSE và m. ........................................................................... 33
Hình 3.4. Dự báo với m = 10. ........................................................................................... 34
HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

viii


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

Hình 4.1. Giải thuật lan truyền ngược được hiệu chỉnh cho mạng RBF .......................... 37
Hình 4.2. Sơ đồ giải thuật lan truyền ngược được hiệu chỉnh cho mạng RBF ................ 39
Hình 4.3. Độ dốc của tỉ lệ lỗi là khác nhau ứng với độ rộng khác nhau. (a) Trường hợp sử
dụng độ rộng với R-láng giềng gần nhất. (b) Trường hợp sử dụng độ rộng với độ đo
trung bình của các khoảng cách tối thiểu giữa tất cả các cặp dữ liệu. (c) Trường hợp sử
dụng độ rộng với heuristic do Benoudjit và các cộng sự đề xuất. (d) Trường hợp sử dụng
độ rộng là trung bình của khoảng cách giữa các điểm dữ liệu và các trọng tâm tương ứng.
.......................................................................................................................................... 41
Hình 4.4. Các bước xây dựng ma trận trọng số ban đầu sử dụng pseudo-inverse ........... 43
Hình 4.5. Độ dốc của hàm lỗi ứng với hai trường hợp, (a) sử dụng kỹ thuật khởi tạo ngẫu
nhiên trọng số ban đầu sau nhiều lần và (b) sử dụng kỹ thuật pseudo-inverse trong lần
huấn luyện đầu tiên ........................................................................................................... 43
Hình 4.6. Mơ hình dự báo dữ liệu chuỗi thời gian có tính hỗn loạn ................................ 44
Hình 4.7. Tập tin định dạng dữ liệu .................................................................................. 46

Hình 4.8. Thời gian trễ được xác định từ hàm tự tương quan .......................................... 47
Hình 4.9. Thời gian trễ được xác định từ thơng tin tương hỗ........................................... 48
Hình 4.10. Số chiều nhúng từ dữ liệu chuỗi thời gian...................................................... 48
Hình 4.11. Xác định số mũ Lyapunov từ dữ liệu chuỗi thời gian .................................... 49
Hình 5.1. Lượng khách hàng đặt chỗ hàng tháng của hãng hàng khơng Pan Am từ năm
1946 đến năm 1960........................................................................................................... 53
Hình 5.2. Kết quả dự đốn của hai mơ hình cho chuỗi số lượng khách hàng đặt chỗ hàng
tháng của hãng hàng không Pan Am. Đường nét đứt là giá trị dự đoán, đường nét liền là
giá trị quan sát thực tế....................................................................................................... 55
Hình 5.3: Mật độ khí cacbonic trong khí quyển hàng tháng ở Mauna Loa (Hawaii) ...... 57

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

ix


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

Hình 5.4. Kết quả dự đốn của hai mơ hình cho chuỗi mật độ khí cacbonic trong khí
quyển hàng tháng ở Mauna Loa (Hawaii). Đường nét đứt là giá trị dự đoán, đường nét
liền là giá trị quan sát thực tế ............................................................................................ 58
Hình 5.5: Chuỗi dữ liệu thời gian có tính hỗn loạn sử dụng phương trình Lorenz .......... 60
Hình 5.6. Kết quả dự đốn của ba mơ hình cho chuỗi dữ liệu thời gian có tính hỗn loạn
sử dụng phương trình Lorenz. Đường màu nét đứt là giá trị dự đoán, đường nét liền là giá
trị quan sát thực tế ............................................................................................................ 62
Hình 5.7: Chuỗi dữ liệu thời gian có tính hỗn loạn sử dụng phương trình Mackey-Glass
.......................................................................................................................................... 64
Hình 5.8. Kết quả dự đốn của ba mơ hình cho chuỗi dữ liệu thời gian có tính hỗn loạn
sử dụng phương trình Mackey-Glass. Đường nét đứt là giá trị dự đoán, đường nét liền là
giá trị quan sát thực tế....................................................................................................... 65

Hình 5.9: Chuỗi dữ liệu thời gian có tính hỗn loạn sử dụng phương trình Rossler ......... 68
Hình 5.10. Kết quả dự đốn của ba mơ hình cho chuỗi dữ liệu thời gian có tính hỗn loạn
sử dụng phương trình Rossler. Đường nét đứt là giá trị dự đoán, đường nét liền là giá trị
quan sát thực tế ................................................................................................................. 69
Hình 5.11: Chuỗi dữ liệu thời gian có tính hỗn loạn về độ đo trung bình các vệt đen mặt
trời (bão mặt trời) hàng tháng từ tháng 1 năm 1749 tới tháng 3 năm 1977 ..................... 72
Hình 5.12. Kết quả dự đốn của ba mơ hình cho chuỗi dữ liệu thời gian có tính hỗn loạn
về độ đo trung bình các vệt đen mặt trời (bão mặt trời) hàng tháng từ tháng 1 năm 1749
tới tháng 3 năm 1977. Đường nét đứt là giá trị dự đoán và đường nét liền là giá trị quan
sát thực tế .......................................................................................................................... 73
Hình 5.13: Chuỗi dữ liệu thời gian có tính hỗn loạn về chỉ số giá tiêu dùng (CPI) mỗi
tháng ở Tây Ban Nha từ tháng 1 năm 1960 đến tháng 6 năm 2005 ................................. 76
Hình 5.14. Kết quả dự đốn của ba mơ hình cho chuỗi dữ liệu thời gian có tính hỗn loạn
về chỉ số giá tiêu dùng (CPI) mỗi tháng ở Tây Ban Nha từ tháng 1 năm 1960 đến tháng 6
năm 2005. Đường nét đứt là giá trị dự đoán, đường nét liền là giá trị quan sát thực tế ... 77
HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

x


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

Hình 5.15: Chuỗi dữ liệu thời gian có tính hỗn loạn về tỉ giá trung bình của đơ la Mỹ với
Bảng Anh từ tháng 1 năm 1981 đến tháng 7 năm 2005 ................................................... 80
Hình 5.16. Kết quả dự đốn của 3 mơ hình cho chuỗi dữ liệu thời gian có tính hỗn loạn
về tỉ giá trung bình của đơ la Mỹ với Bảng Anh từ tháng 1 năm 1981 đến tháng 7 năm
2005. Đường nét đứt là giá trị dự đoán, đường nét liền là giá trị quan sát thực tế. .......... 81
Hình 5.17: Chuỗi dữ liệu thời gian có tính hỗn loạn về giá (đóng cửa) hàng ngày của cổ
phiếu IBM từ tháng 6 năm 1959 đến tháng 6 năm 1960 .................................................. 83
Hình 5.18. Kết quả dự đốn của 3 mơ hình cho chuỗi dữ liệu thời gian có tính hỗn loạn

về giá (đóng cửa) hàng ngày của cổ phiếu IBM từ tháng 6 năm 1959 đến tháng 6 năm
1960. Đường nét đứt là giá trị dự đoán, đường nét liền là giá trị quan sát thực tế ........... 84

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

xi


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

DANH MỤC BẢNG
Bảng 5-1: Kết quả thực nghiệm cho chuỗi số lượng khách hàng đặt chỗ hàng tháng của
hãng hàng không Pan Am từ năm 1946 đến năm 1960 .................................................... 54
Bảng 5-2: Kết quả thực nghiệm cho chuỗi mật độ khí cacbonic trong khí quyển hàng
tháng ở Mauna Loa (Hawaii) ............................................................................................ 57
Bảng 5-3: Kết quả thực nghiệm cho chuỗi dữ liệu thời gian có tính hỗn loạn sử dụng
phương trình Lorenz ......................................................................................................... 61
Bảng 5-4: Kết quả thực nghiệm cho chuỗi dữ liệu thời gian có tính hỗn loạn sử dụng
phương trình Mackey-Glass ............................................................................................. 66
Bảng 5-5: Kết quả thực nghiệm cho chuỗi dữ liệu thời gian có tính hỗn loạn sử dụng
phương trình Rossler ........................................................................................................ 70
Bảng 5-6: Kết quả thực nghiệm cho chuỗi dữ liệu thời gian về độ đo trung bình các vệt
đen mặt trời (bão mặt trời) hàng tháng từ tháng 1 năm 1749 tới tháng 3 năm 1977 ....... 74
Bảng 5-7: Kết quả thực nghiệm cho chuỗi dữ liệu thời gian về chỉ số giá tiêu dùng (CPI)
mỗi tháng ở Tây Ban Nha từ tháng 1 năm 1960 đến tháng 6 năm 2005 .......................... 78
Bảng 5-8: Kết quả thực nghiệm cho chuỗi dữ liệu thời gian về tỉ giá trung bình của đơ la
Mỹ với Bảng Anh từ tháng 1 năm 1981 đến tháng 7 năm 2005 ...................................... 82
Bảng 5-9: Kết quả thực nghiệm cho chuỗi dữ liệu thời gian về giá (đóng cửa) hàng ngày
của cổ phiếu IBM từ tháng 6 năm 1959 đến tháng 6 năm 1960 ....................................... 85


HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

xii


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

CHƯƠNG 1. GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI
Phần đầu của chương giới thiệu sơ lược về đề tài sẽ thực hiện những gì, tại sao
lại thực hiện và thực hiện như thế nào. Một số khái niệm cơ bản được giới thiệu sơ
lược trong chương này như: Dữ liệu chuỗi thời gian, Dữ liệu chuỗi thời gian có tính
hỗn loạn.
Phần thứ hai giới thiệu sơ lược về mục tiêu và phạm vi nghiên cứu.
Phần cuối của chương sẽ trình bày tổng quan về cấu trúc tổng thể của toàn bộ
đề cương.
1.1. GIỚI THIỆU ĐỀ TÀI
Trước bối cảnh bùng nổ thông tin như hiện nay thì các ứng dụng cơng nghệ
thơng tin cũng khơng ngừng gia tăng nhằm đáp ứng việc khai thác và quản lý các
thông tin, dữ liệu một cách hiệu quả. Trong một khối lượng khổng lồ của dữ liệu được
lưu trữ như: các dữ liệu y tế, ngân hàng, giáo dục, địa lý, .vv.. việc đưa ra các quyết
định nhanh chóng và chính xác của các cơng ty và tổ chức là rất khó khăn. Từ đó các
ứng dụng cơng nghệ thông tin hỗ trợ việc dự báo và đưa ra các quyết định hợp lý phải
kể tới là các ứng dụng trong khai phá dữ liệu chuỗi thời gian (Time series Data
mining) và gần đây là chuỗi thời gian có tính hỗn loạn (Chaotic Time Series) cũng rất
quan trọng.
Vấn đề này từ lâu đã được các nhà nghiên cứu quan tâm và đề ra một số biện
pháp giải quyết cụ thể để phân tích khoa học về các dữ liệu đã thu thập được như:
phương pháp thống kê, phương pháp hồi quy, cây quyết định, mạng nơ-ron nhân tạo,
.vv.. Trong đó, việc sử dụng mạng nơ-ron RBF (Radial Basis Function Network - một
dạng của mạng nơ-ron nhân tạo) để dự báo dữ liệu chuỗi thời gian có tính hỗn loạn sẽ

được nghiên cứu cụ thể hơn trong đề tài này.
Chuỗi thời gian là một tập hợp dữ liệu các quan sát đo được một cách tuần tự
theo thời gian. Các quan sát này có thể đo được một cách liên tục theo thời gian hoặc
là có thể được lấy theo một tập rời rạc các thời điểm khác nhau. Ví dụ: trong kinh
doanh, tỷ lệ lãi xuất được lưu trữ hàng tuần, giá cổ phiếu đóng cửa được lưu trữ hàng
ngày, doanh số bán hàng được lưu trữ hàng năm, hoặc trong khí tượng chỉ số lượng
HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

Trang 1


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

mưa, hạn hán được lưu trữ hàng năm, ngoài ra các số liệu về GDP, giá điện, dân số
hay giá trị sản xuất .vv.. là các dữ liệu chuỗi thời gian. Hình 1.1 dưới đây là một ví dụ
về dữ liệu chuỗi thời gian thể hiện lượng mưa hàng năm ghi nhận tại Los Angeles –
California (từ năm 1880 đến năm 1980).

Hình 1.1. Biểu đồ thể hiện lượng mưa hàng năm ghi nhận tại Los Angeles – California

Hình 1.2 dưới đây thể hiện một dự báo về dữ liệu chuỗi thời gian có tính hỗn
loạn sử dụng biểu đồ Logistic1:
1.2
1

0.8
Forecast

0.6


Actual
0.4
0.2
0
1

2

3

4

5

6

7

Hình 1.2. Biểu đồ Logistic thể hiện dự báo dữ liệu chuỗi thời gian có tính hỗn loạn, dựa
vào dữ liệu thực tế (Actual) và đưa ra dữ liệu được dự báo (Forecast).

Dữ liệu chuỗi thời gian có tính hỗn loạn: thuyết hỗn loạn (chaos theory) là một
lĩnh vực nghiên cứu trong toán học và được ứng dụng vào các ngành khoa học khác
như vật lí, cơ khí, kinh tế, sinh học, triết học... Các hệ động lực (dynamical system) có
tính hỗn loạn thường gặp trong tự nhiên như cơn lốc xoáy, thị trường chứng khoán,
thời tiết, .vv.. Chức năng của các hệ này là khác nhau trong mỗi tình huống khác nhau.
1

Nguồn: />
HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552


Trang 2


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

Ví dụ trong trường hợp của một cơn lốc xốy, hành vi mang tính hỗn loạn là có hại đối
với con người và cần phải tránh hoặc phải được điều khiển. Nhưng trong hoạt động
của bộ não người, hành vi mang tính hỗn loại là hữu ích và cần thiết để duy trì các
chức năng bình thường của não. Vì vậy, cơng việc quan trọng là hiểu được tính hỗn
loạn và để nó phục vụ xã hội lồi người tốt hơn [1].
Chuỗi thời gian có tính hỗn loạn thường là một chuỗi quan sát sinh ra từ một hệ
động lực phi tuyến (nonlinear dynamic system) như các ví dụ trên. Điều quan trọng là
việc phân tích các hệ động lực từ chuỗi quan sát để thực hiện các dự báo chính xác về
tương lai [2].
1.2. MỤC TIÊU VÀ GIỚI HẠN ĐỀ TÀI
Mục tiêu nghiên cứu đề tài tập trung vào các vấn đề sau:
 Nghiên cứu dữ liệu chuỗi thời gian có tính hỗn loạn và các vấn đề liên
quan.
 Nghiên cứu về mạng nơ-ron RBF.
 Nghiên cứu về việc sử dụng mạng nơ-ron RBF để dự báo về dữ liệu thời
gian có tính hỗn loạn.
1.3. TĨM LƯỢC NHỮNG KẾT QUẢ ĐẠT ĐƯỢC
Thơng qua q trình nghiên cứu và thực nghiệm chúng tơi đã có được một số
kết quả mong đợi như sau:
 Đánh giá được các đặc tính hỗn loạn trên dữ liệu chuỗi thời gian dựa vào
các kỹ thuật xây dựng lại không gian pha.
 Đồng thời kết hợp được kỹ thuật xây dựng lại khơng gian pha với q
trình huấn luyện mạng nơ-ron RBF đã làm tăng khả năng dự báo đối với
dữ liệu chuỗi thời gian có tính hỗn loạn so với mạng MLP cũng như

mạng nơ-ron RBF khi chưa được xây dựng lại không gian pha.
 Chúng tôi cũng đã xây dựng được ứng dụng hiện thực hệ thống dự báo
dữ liệu chuỗi thời gian có tính hỗn loạn sử dụng mạng nơ-ron RBF.

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

Trang 3


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

1.4. CẤU TRÚC BÁO CÁO
Báo cáo được chia thành 6 phần chính như sau:
CHƯƠNG 1. GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI
Chương này giới thiệu sơ lược về đề tài, mục tiêu và phạm vi
nghiên cứu cũng như cấu trúc của đề tài.
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT
Chương này trình bày chi tiết về các vấn đề lý thuyết sẽ được áp
dụng trong đề tài như: Dữ liệu chuỗi thời gian, Dữ liệu chuỗi thời
gian có tính hỗn loạn, Mạng nơ-ron RBF.
CHƯƠNG 3. NHỮNG CƠNG TRÌNH LIÊN QUAN
Chương này trình bày sơ lược các cơng trình có liên quan đến dự
báo dữ liệu chuỗi thời gian bằng ANN (Artificial Neural
Networks), các cơng trình liên quan đến dự báo dữ liệu chuỗi thời
gian có tính hỗn loạn sử dụng ANN, K-Nearest Neighbor và cuối
cùng là các cơng trình liên quan đến dự báo dữ liệu chuỗi thời
gian có tính hỗn loạn sử dụng mạng nơ-ron RBF.
CHƯƠNG 4. XÂY DỰNG MƠ HÌNH HUẤN LUYỆN VÀ DỰ BÁO
SỬ DỤNG MẠNG NƠ-RON RBF
Chương này trình bày chi tiết hơn thuật toán huấn luyện mạng nơron RBF sử dụng thuật toán huấn luyện lan truyền ngược được

hiệu chỉnh (Modified Backpropagation Algorithm) và một số kỹ
thuật hỗ trợ cho giải thuật này. Đồng thời trình bày ý tưởng và
hiện thực cho mơ hình dự báo dữ liệu chuỗi thời gian có tính hỗn
loạn.

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

Trang 4


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

CHƯƠNG 5. THỰC NGHIỆM VÀ ĐÁNH GIÁ
Chương này trình bày thực nghiệm và đánh giá độ chính xác
trong dự báo cũng như thời gian huấn luyện mạng sử dụng mạng
RBF và mạng ANN thông thường.
CHƯƠNG 6. KẾT LUẬN
Chương này đánh giá kết quả đạt được, các mặt hạn chế và hướng
phát triển của đề tài.

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

Trang 5


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

CHƯƠNG 2. CƠ SỞ LÝ THUYẾT
Phần đầu của chương này trình bày sơ lược về dữ liệu chuỗi thời gian.
Phần thứ hai của chương này trình bày về dữ liệu chuỗi thời gian có tính hỗn

loạn và một số khái niệm cơ bản liên quan tới chuỗi thời gian có tính hỗn loạn.
Phần cuối cùng của chương này trình bày các đặc điểm của mạng nơ-ron RBF,
việc xác định các tham số cũng như phương pháp huấn luyện mạng.
2.1. DỮ LIỆU CHUỖI THỜI GIAN
Chuỗi thời gian có thể được xem là tập hợp dữ liệu trong không gian hai chiều,
với bộ giá trị (T, V), trong đó T là thời điểm giá trị được xác định, V là giá trị quan sát
tương ứng. Vì khoảng thời gian quan sát là bằng nhau nên có thể khơng quan tâm đến
T. Lúc này, chuỗi thời gian có thể xem là dữ liệu n chiều. Trong phạm vi đề tài này,
chuỗi thời gian được nhìn dưới góc độ là dữ liệu n chiều, được ký hiệu là {𝑋𝑡 | t =
1, 2, 3, … , n}
Trong thực tế, khi quan sát chuỗi thời gian ta nhận thấy bốn thành phần ảnh
hưởng lên mỗi giá trị của chuỗi thời gian đó là thành phần xu hướng (trend
component), thành phần chu kỳ (cyclical component), thành phần mùa (seasonal
component) và thành phần bất thường (irregular component).
Việc xác định một chuỗi thời gian có thành phần xu hướng hay thành phần mùa
hay khơng rất quan trọng trong bài tốn dự báo chuỗi thời gian. Nó giúp ta lựa chọn
được mơ hình dự báo phù hợp hay giúp cải tiến mơ hình đã có chính xác hơn. Và các
mẫu quan sát được theo thời gian dựa trên các chuỗi thời gian chính là cơ sở để hiểu
được đặc tính cũng như là dự báo các hành vi tương lai của đối tượng đó.
2.2. DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN
Các nghiên cứu dựa trên dữ liệu chuỗi thời gian được xem như khá phổ biến và
gần đây các nhà nghiên cứu đã bắt đầu chú tâm tới một mơ hình mới của sự hỗn loạn
[3] [4] và dựa trên thuyết hỗn loạn (chaos theory) này cho dữ liệu chuỗi thời gian dẫn
đến vấn đề dữ liệu chuỗi thời gian có tính hỗn loạn.
HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

Trang 6


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF


2.1.1. Tính hỗn loạn
Sự hỗn loạn là một hành vi trong thời gian dài không có tính chu kỳ (aperiodic
long term) phát sinh trong hệ động lực (dynamical system) và phụ thuộc nhạy cảm vào
điều kiện ban đầu [5] hoặc là hiệu ứng bươm bướm (butterfly effect - là cụm từ dùng
để mô tả khái niệm trong lý thuyết hỗn loạn về độ nhạy cảm của hệ thống đối với điều
kiện gốc) trong nghiên cứu ban đầu về dự báo thời tiết và vì vậy được coi là nguồn gốc
của sự hỗn loạn. Sau đó, sự hỗn loạn được mở rộng trong nghiên cứu và có nhiều nội
dung quan trọng được giới thiệu như là số chiều, số mũ Lyapunov, biến đổi Fourier và
biến đổi Hilbert, xây dựng lại không gian pha (phase space reconstruction).
Trong tốn học, sự hỗn loạn có thể được biểu diễn bằng cả hai phương trình rời
rạc và liên tục [1] [6]. Hệ thống rời rạc có thể được diễn tả như sau :

𝑥𝑛−1 = 𝑓(𝑥𝑛 )

(1.1)

trong đó 𝑓 (𝑥𝑛 ) là hàm số thể hiện đầu ra mong muốn tại thời điểm n và có thể
biểu diễn bằng biểu đồ Logistic, biểu đồ Hénon, biểu đồ tiêu chuẩn (standard map),
biểu đồ lều (tent map), biểu đồ vòng tròn (circle map) và biểu đồ Ikeda. Hệ thống liên
tục có thể diễn tả bằng một phương trình khác :
𝑑𝑥(𝑡)
𝑑𝑡

= 𝐹(𝑥(𝑡))

(1.2)

trong đó 𝑥 (𝑡 ) = [𝑥1 (𝑡), 𝑥2 (𝑡), 𝑥3 (𝑡), … , 𝑥𝑚 (𝑡)] là véc-tơ trạng thái tại thời điểm
t. Các phương trình thể hiện cho tính hỗn loạn điển hình là phương trình Lorenz,

phương trình Rưssler, phương trình của Duffing, mạch Chua, .vv..
Một ví dụ đơn giản của một chuỗi thời gian có tính hỗn loạn được đưa ra trong
Hình 2.1, thu được bằng cách quan sát tọa độ x của biểu đồ Hénon [6] [7]

𝑥𝑛+1 = 1 − 𝑎(𝑥𝑛 )2 + 𝑦𝑛

(1.3)

𝑦𝑛+1 = 𝑏𝑥𝑛

(1.4)

trong đó, a và b là các tham số. Trong trường hợp này a = 1.4 và b = 0.3, hàm
quan sát là 𝜑(𝑥𝑛 , 𝑦𝑛 ) = 𝑥𝑛 và 𝜑𝑛 = 𝑥𝑛 .
HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

Trang 7


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

Hình 2.1. Chuỗi thời gian có tính hỗn loạn {𝒙𝒏 } từ biểu đồ Hénon.

Hình 2.2. Chuỗi thời gian {𝝋𝒏 } nhận được từ phương trình Lorenz

Hình 2.2 là một ví dụ khác, lần này được thực hiện bằng cách quan sát tọa độ z
của phương trình Lorenz [6]:
𝑥̇ =10(𝑦−𝑥)
𝑦̇ = −𝑥𝑧+28𝑥−𝑦


(1.5)

8
𝑧̇ =𝑥𝑦− 3𝑧

Trong đó, 𝑥̇ , 𝑦̇ , 𝑧̇ lần lượt là các đạo hàm của x, y và z.
HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

Trang 8


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF

2.1.2. Các khái niệm cơ bản về phân tích chuỗi thời gian có tính hỗn loạn
Việc đánh giá về thời gian được xác định trong một vài khơng gian pha (phase
space – trong tốn học và vật lý, một không gian pha là một không gian trong đó tất
cả các trạng thái có thể có của một hệ thống được biểu diễn, với mỗi trạng thái của hệ
thống tương ứng với một điểm duy nhất trong khơng gian pha, có thể dùng đại lượng
véc-tơ để biểu diễn) [6]. Để phân tích một chuỗi thời gian có tính hỗn loạn chúng ta
lần lượt mơ tả đặc điểm của không gian pha, một vài nội dung cơ bản được giới thiệu
như số chiều và số mũ Lyapunov [8] [9].
2.1.2.1.

Số chiều

Đại lượng chiều tương tự như một đối tượng hình học [6] [10]. Đối với một đối
tượng đồng nhất chiều của nó là một số xác định, trong khi một đối tượng khơng đồng
nhất thì các thành phần của nó có thể có các chiều khác nhau và cần thiết được miêu tả
bằng chiều đa phân hình (multifractal dimension). Ở đây chúng ta tập trung vào đối
tượng đồng nhất. Trong đó, một hữu hạn các điểm có chiều là 0, các đường thẳng có

chiều là 1, mặt phẳng có chiều là 2 và trọng lượng có chiều là 3, .v.v… Một không
gian attractor (đây là một không gian đặc trưng của khơng gian pha) mang tính hỗn
loạn thường có một chiều phân hình (fractal dimension) có thể được miêu tả bằng một
vài cách. Chiều đếm hộp (box-counting dimension), chiều thông tin (information
dimension) và chiều tương quan (correlation dimension) là ba trong số các trường hợp
phù hợp cho tính tốn bằng số.
Để tính tốn chiều đếm hộp 𝐷0 , chúng ra chia khơng gian attractor trong khối
cầu/hộp có bán kính 𝜖 và yêu cầu số lượng hộp chúng ta cần để che phủ tất cả các
điểm trong tập dữ liệu. Nếu 𝑁(𝜖) là một hàm của 𝜖 và định nghĩa chiều đếm hộp bằng:

𝐷0 = 𝑙𝑖𝑚

𝑙𝑛 𝑁(𝜖)
1

∈→0 𝑙𝑛(∈)

(2.1)

Xét ánh xạ Hénon xn+1=yn +1 -1.4𝑥𝑛2 , yn+1=0.3xn là một ví dụ. Không gian
attractor của ánh xạ này thể hiện trong hình 2.3 (a) tại lưới vng có chiều dài 𝜖.
Chúng ta tính tốn số lượng lưới vng chứa ít nhất một điểm của quỹ đạo và thu được
một điểm trong hình 2.3 (b). Sau đó chúng ta thay đổi 𝜖 trong hình 2.3 (a) thành 𝜖/2
HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

Trang 9


DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN CĨ TÍNH HỖN LOẠN SỬ DỤNG MẠNG NƠ-RON RBF


và thực hiện tương tự để đưa ra một điểm trong hình 2.3 (b). Trong phương pháp này,
chúng ta nhận được hình 2.3 (b) trong đường dốc, 𝐷0 ≈ 1.27.

Hình 2.3. (a) Khơng gian attractor của biểu đồ Hénon; (b) Độ dốc của đường thẳng đại
diện cho chiều đếm hộp D0

Để bổ sung cho chiều đếm hộp khi mỗi hộp có nhiều điểm thì chiều thông tin
định nghĩa trong giới hạn của tần số tương đối (relative frequency) của sự xuất hiện
của quỹ đạo bằng:

𝐷1 = 𝑙𝑖𝑚
∈→0

𝐻(𝜖)

(2.2)

1


𝑙𝑛( )′
𝑁(∈)

Trong đó 𝐻(𝜖) = − ∑𝑖=1 𝑃𝑖 𝑙𝑛𝑃𝑖

(2.3)

Pi là tần số tương đối với một quỹ đạo tiêu biểu của hộp bao phủ thứ 𝑖. So sánh
với định nghĩa của D0, chiều đếm hộp khơng có trọng số (weight-free) trong khi chiều
thông tin được thêm trọng số cho tần số xuất hiện trong các hộp đặc biệt. Khi Pi là một

hằng số, D1 sẽ trở thành D0.
Khi chiều đếm họp và chiều thơng tin là lớn thì việc tính tốn cho cả D0 và D1
sẽ tốn thời gian và chiều phù hợp trong trường hợp này là chiều tương quan D2. So
sánh với chiều đếm hộp D0 và chiều thông tin D1, chiều tương quan D2, sẽ dễ dàng tính
tốn hơn và được định nghĩa bằng:

HỌ VÀ TÊN: NGUYỄN VĂN TRỰC – MÃ SỐ HỌC VIÊN: 12070552

Trang 10


×