Tải bản đầy đủ (.docx) (123 trang)

Ứng dụng kỹ thuật học máy để xây dựng mô hình dự báo đầu ra cho dữ liệu khoảng giá trị của chuỗi thời gian

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.34 MB, 123 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT

BÁO CÁO TỔNG KẾT

ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG

ỨNG DỤNG KỸ THUẬT HỌC MÁY
ĐỂ XÂY DỰNG MƠ HÌNH DỰ BÁO ĐA
ĐẦU RA CHO DỮ LIỆU KHOẢNG GIÁ TRỊ

CỦA CHUỖI THỜI GIAN
Mã số: T2019-06-128

Chủ nhiệm đề tài: ThS. Lê Thị Thùy Linh

Đà Nẵng, Tháng 6/2020

0

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT

BÁO CÁO TỔNG KẾT

ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG

ỨNG DỤNG KỸ THUẬT HỌC MÁY
ĐỂ XÂY DỰNG MƠ HÌNH DỰ BÁO ĐA
ĐẦU RA CHO DỮ LIỆU KHOẢNG GIÁ TRỊ


CỦA CHUỖI THỜI GIAN

Mã số: T2019-06-128

Xác nhận của cơ quan chủ trì đề tài Chủ nhiệm
đề tài

1

DANH SÁCH THÀNH VIÊN THAM GIA NGHIÊN CỨU ĐỀ TÀI
1. Lê Thị Thùy Linh

DANH SÁCH ĐƠN VỊ PHỐI HỢP CHÍNH
1. Trường Đại học Sư phạm Kỹ thuật - Đại học Đà Nẵng

2

MỤC LỤC
PHẦN MỞ
ĐẦU...............................................................................................4

CHƯƠNG I. TỔNG QUAN NGHIÊN

CỨU...................................................14 1.1. Cơng nghệ trí

thơng minh nhân tạo trong lĩnh vực dự báo ....................14 1.2.

Dự báo khoảng thời gian

......................................................................16 1.2.1 Chuỗi thời


gian ...............................................................................16 1.2.2

Phân loại dự báo dữ liệu chuỗi thời

gian .........................................18

1.2.3 Tầm quan trọng của dự báo chuỗi thời gian trong thị
trường tài
chính.....................................................................................
...................19

1.2.4. Dự báo khoảng thời gian của dữ liệu chuỗi thời

gian. ....................21 1.3. Các thuật toán tối ưu hóa siêu dữ

liệu ...................................................23 1.3.1 Kỹ thuật học

máy............................................................................23 1.3.2

Các thuật tốn tối ưu hóa siêu dữ

liệu .............................................27

CHƯƠNG II. PHƯƠNG PHÁP NGHIÊN

CỨU .............................................32 2.1. Mơ hình dự báo

....................................................................................32 2.2.


Ứng dụng phương pháp “trễ” cho dự báo chuỗi thời

gian .....................34 2.3. Phương pháp kỹ thuật học

máy.............................................................38 2.3. Thuật

tốn tối ưu hóa để điều chỉnh tham

số.........................................40 2.4. Đánh giá hiệu suất dự

báo.....................................................................43

CHƯƠNG III. MÔ HÌNH LAI ĐA ĐẦU RA CHO DỰ BÁO CHUỖI
THỜI
GIAN ...........................................................................................
...................45

3.1. Đánh giá thuật tốn tối ưu

hóa ..............................................................45 3.2. Cấu trúc mô

hình dự báo.......................................................................47
3.3. Phần mềm ứng

dụng .............................................................................49
CHƯƠNG IV. ỨNG DỤNG MƠ HÌNH DỰ BÁO

.........................................51 4.1 Thu thập dữ liệu
....................................................................................51 4.1.1


Sàn chứng khoáng thành phố Hồ Chí Minh
....................................51 4.1.2 Cặp dữ liệu chứng khoáng VN-

Index 100 và S&P500 ....................54
4.2 Dự báo giá chứng khoáng dựa trên dữ liệu
thực.....................................57 KẾT LUẬN VÀ KIẾN
NGHỊ .........................................................................62 TÀI LIỆU
THAM
KHẢO ...............................................................................64

3

DANH MỤC CÁC BẢNG

Số Tên bảng Trang
hiệu
Khoảng thời gian giá trị của chỉ số VN-Index 100 21
Bảng
2.1 Kết quả kiểm chứng từ các hàm tiêu chuẩn 34
Đánh giá hiệu suất dự báo trước một bước 46
Bảng Đánh giá hiệu suất dự báo trước ba bước 48
3.1

Bảng
4.1

Bảng
4.2

4


DANH MỤC CÁC HÌNH VÀ BIỂU ĐỒ

Số hiệu Tên bảng Trang
3
Hình 1.1 Trí tuệ nhân tạo

Hình 1.2 Chỉ số chứng khống của VN-Index 100 10

Hình 1.3 Đàn cá săn mồi 19

Hình 1.4 Đàn chim bay 20

Biểu đồ Giá trị khoảng thời gian hằng ngày của chỉ số VN-Index 100 22
2.1

Cấu trúc khoảng thời gian 23

Hình 2.1

Xây dựng cửa sổ trượt và khơng gian pha. 24

Hình 2.2 Cửa sổ trượt cho nghiên cứu chuỗi thời 25

Hình 2.3 gian

Hình 2.4 Tái tạo khơng gian pha để phân tích chuỗi 26

thời gian 27


Hình 2.5 Minh họa MLSSVR 39

Hình 3.1 Mơ hình dự báo MIMO-S-LSSVR 42

Biểu đồ Chỉ số VN-Index100 nửa đầu năm 2020 46

4.1

Biểu đồ Chỉ số S&P500 nửa đầu năm 2020 47
4.2
Đánh giá hiệu suất dự báo trước một bước

Hình 4.1 của chỉ số (a) VN-Index 100 và (b) S&P500 48

Hình 4.2 Đánh giá hiệu suất dự báo trước ba bước
của chỉ số (a) VN-Index 100 và (b)
S&P500

5

ABC DANH MỤC CÁC CHỮ VIẾT TẮT
AI Artificial Bee Colony
AIS Artificial intelligence
ANN artificial immune system
ARMA Artificial neural network
ARIMA Autoregressive moving average
CPU Autoregressive integrated moving average
CPSO Central processing unit
DAX Chaotic Particle Swarm Optimization
DE German stock price

DM Differential Evolution
GA Data mining
GANN Genetic algorithm
GRNN Genetic neural network
GUI Generalized neural network
GUIDE Graphical user interface
iMLP Graphical user interface development environment
ITS Multi-layer perceptron model adapted to interval data
LSSVR Interval-valued time series
MAE Least squares support vector regression
MAPE Mean absolute error
MCR Mean absolute percentage error
MIMO MATLAB complier runtime
MISO Multi-Input Multi-Output
Multi-Input Single-Output

6

ML Machine Learning
MLSSVR Multi-Output Least Squares Support Vector Regression
MS Multimodal Separable
MSE Mean square error
OPSO Opposition-based Particle Swarm Optimization
PSO Particle Swarm Optimization
Particle Swarm Optimization - Multi-Output Least Squares
PSO- Support
MLSSVR Vector Regression
Quadratic Programming
QP Correlation coefficient
R Root Mean Squared Error

RMSE Support Vector Regression
SVR Tabu search
TS vector autoregressive
VAR

7

ĐẠI HỌC ĐÀ NẴNG CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
TRƯỜNG ĐH SƯ PHẠM KỸ
THUẬT

THÔNG TIN KẾT QUẢ NGHIÊN CỨU

1. Thông tin chung:

- Tên đề tài: ỨNG DỤNG KỸ THUẬT HỌC MÁY ĐỂ XÂY DỰNG
MƠ HÌNH
DỰ BÁO ĐA ĐẦU RA CHO DỮ LIỆU KHOẢNG GIÁ TRỊ CỦA
CHUỖI THỜI GIAN

- Mã số: T2019-06-128

- Chủ nhiệm: ThS. Lê Thị Thùy Linh

- Cơ quan chủ trì: Trường Đại học Sư phạm Kỹ thuật - Đại

học Đà Nẵng - Thời gian thực hiện: 12 tháng

2. Mục tiêu:


Nghiên cứu này phát triển một mơ hình dự báo đa đầu ra
ứng dụng kỹ thuật máy véc tơ hỗ trợ kết hợp với tối ưu hóa hạt
siêu tốc cho dự báo dạng khoảng thời gian.

3. Tính mới và sáng tạo:

- Mơ hình dự báo theo dạng khoảng thời gian là dạng
mơ hình dự báo mới trên thế giới bởi tính chất dự báo
và nội hàm các thông tin trong dữ liệu đầu ra.

- Mơ hình ứng dụng kỹ thuật chuyển đổi dữ liệu mới “Lag
method” của Brownlee (2017) nhằm hạn chế dữ liệu giúp
tối ưu hóa dữ liệu đầu vào.

4. Tóm tắt kết quả nghiên cứu:

- Xây dựng mơ hình dự báo mới theo dạng đa đầu ra cho dự
báo dữ liệu theo dạng khoảng thời gian, đưa ra được phương
pháp dự báo mới.

- Áp dụng phương pháp mới trong xử lý dữ liệu lớn có
độ khó cao - Thử nghiệm mơ hình trên dữ liệu thực

đạt kết quả tốt.
8

5. Tên sản phẩm:

- Phương pháp dự báo kiểu mới bằng mơ hình đa đầu ra

theo dạng Muti input-Muti output model

- Bài báo khoa học có chỉ số ISSN nằm trong danh mục
Hội đồng Chức danh Giáo sư Nhà nước

6. Hiệu quả, phương thức chuyển giao kết quả nghiên cứu và
khả năng áp dụng:

- Hiệu quả: Nghiên cứu đề xuất một mơ hình dự báo
mới, đặc biệt là phương pháp dự báo đa đầu ra cho
chuỗi dữ liệu thời gian theo dạng khoảng thời gian.
Nghiên cứu này mang tính ứng dụng cao cho thị
trường tài chính và quản lý đầu tư cho thị trường tài
chính. Là tiền đề cho việc mở rộng sang các lĩnh vực
khác như phân tích dự báo nhu cầu, dự báo năng lượng,
dự báo thiên tai. Bên cạnh đó, mơ hình nghiên cứu và
các thuật toán của nó có thể được sử dụng để làm ví
dụ giảng dạy trong cả lĩnh vực kinh tế và kỹ thuật.

- Phương thức chuyển giao kết quả nghiên cứu và khả năng
áp dụng: Nghiên cứu này được chuyển giao cho trường
Đại học Sư phạm Kỹ thuật, Đại học Đà Nẵng sau khi
hoàn thành.

9

7. Hình ảnh, sơ đồ minh họa chính
Mơ hình dự báo MIMO-S-LSSVR

MIMO-S-LSSVR


Dữ liệu đầu vào

Hiệu chỉnh dữ liệu

Dữ liệu kiểm Dữ liệu học
tập chứng

Dữ Dữ liệu đào tạo
liệu
đánh
giá

Thuật toán tối Chạy mơ hình
ưu hóa
PSO

Hàm mục tiêu

Sai Đạt tiêu chí dừng

Mơ hình dự báo đã Đúng
được tối ưu
hóa Tối ưu hóa siêu
tham số của
mơ hình

Kết quả Độ chính
dự xác dự
báo báo


10

Bảng đánh giá hiệu suất dự báo trước một bước

cổ phiếu Khoảng MIMO-S-LSSVR
Tên
MAE MAPE R

VN- RMSE 11.63 1.30% 0.83
Index100 Cận trên 13.56 1.55% 0.77
24.16 0.89% 0.90
S&P500 15.51 32.44 1.21% 0.87
Cận dưới

18.39
Cận trên

33.44
Cận dưới

45.08

Bảng đánh giá hiệu suất dự báo trước ba bước

tock Khoảng MIMO-S-LSSVR
S
RMSE MAE MAPE R
VN100 Cận trên
S&P50 17.53 12.99 1.45% 0.78

0 Cận dưới 15.23 1.73% 0.72
20.52 41.79 1.51% 0.76
Cận trên 52.04 1.92% 0.71
54.11
Cận dưới
65.12

Ngày 09 tháng 6 năm 2020

Hội đồng KH&ĐT Khoa
SPCN

Nguyễn Đức Sỹ Chủ nhiệm đề tài

Lê Thị Thùy Linh
XÁC NHẬN CỦA TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT

11

INFORMATION ON RESEARCH RESULTS

1. General information:

- Project title: BUILDING A MULTI-OUTPUT HYBRID MODEL
FOR INTERVAL-VALUED TIME SERIES FORECASTING

- Code number: T2019-06-128
- Coordinator: Le Thi Thuy Linh
- Implementing institution: University of Technology and


Education, the University of Danang
- Duration: 12
months 2.
Objective(s):

This research develops a Multi-input multi-output system
using ML and PSO to forecast the interval-valued time series data
analysis

3. Creativeness and innovativeness:

- The proposed model is one of the newest forecasting
models in time series data analysis

- Applying a new method to optimize data that was proposed
by Brownlee in 2017 called “Lag method”

4. Research results

A using forecasting model for interval-valued time series
data analysis. This model can be used in many filed as energy,
demand, environment, etc.

5. Products:

- Muti input-Muti output forecasting model
- A journal has ISSN index in the state council for professor
title of vietnam 6. Effects, transfer alternatives of reserach
results and applicability:


- Public papers, participated in the workshop reports, conferences.
- This is a document that can be used to teach forecasting

and mathematical simulation in colledge.


×