Tải bản đầy đủ (.pdf) (26 trang)

Đề tài DỰ ĐOÁN THỊ TRƯỜNG CHỨNG KHOÁNG SỬ DỤNG MẠNG THẦN KINH NHÂN TẠ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.69 MB, 26 trang )

ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH

Đề tài:

DỰ ĐỐN THỊ TRƯỜNG CHỨNG KHỐNG SỬ 
DỤNG MẠNG THẦN KINH NHÂN TẠO

( STOCK MARKET INDEX PREDICTION USING ARTIFICAL NEURAL NETWORK)

Nhóm 14: 
1. Phan Trọng Nghĩa
2. Phạm Hữu Ngà

GVHD: Huỳnh Thái Hồng
MSSV: 1512160
MSSV: 1512115


1/ Giới thiệu:
‐ Trong lĩnh vực nghiên cứu các hiện tượng, hầu hết đối tượng đều là hệ phi tuyến ( Sự thay đổi
của đầu ra không tỉ lệ với sự thay đổi của đầu vào)
‐ Việc mô phỏng các mối quan hệ giữa các tham số đầu vào và đầu ra là 1 công việc rất khó khăn
bởi tính chất phức tạp của các hiện tượng cần nghiên cứu. 
‐ Hệ thông minh nhân tạo như : Mạng thông minh nhân tạo ( Artifical Neural Networks – ANN), 
hệ suy luận mờ ( fuzzy inference system – FIS) , hệ suy luận thần kinh thích nghi mờ ( Adaptive 
neuro‐fuzzy Inference System – ANFIS) đã được áp dụng để model hóa rất nhiều lĩnh vực
phức tạp trong khoa học và kỹ thuật



2/ Những nghiên cứu được công bố khi áp dụng hệ thông minh nhân tạo


vào lĩnh vực kinh tế:
1. Mạng thần kinh nhân tạo (ANN) cho hiệu suất tốt hơn trong việc dự đoán phá sản so với
phương pháp thống kê truyền thống như phương pháp phân tách và hồi quy logistic
(Quah & Srivinasan 1998)
2. Nghiên cứu về xếp hạng tín nhiệm (credit rating) cho thấy ANN dự báo tốt hơn so với
các phương pháp thống kê do mối quan hệ phức tạp giữa tài chính và các biến đầu vào khác
( Hájek, 2011) 
3. Dự đốn phá sản ( Alfaro García, Gámez & Elizondo 2008; Lee, Booth, & Alarm, 2005)
4. Đánh giá rủi ro tính dụng (Yu, L., Wang, S., & Lai,2008)


3/ Hệ thần kinh nhân tạo được áp dụng trong việc dự đoán chứng khoán:
3.1: Nhắc lại về Artifical Neural Network: 
Mạng thần kinh nhân tạo được lấy cảm hứng từ sinh học, gồm các tế bào thần kinh (neurons) để
tiếp nhận và xử lý thông tin, và được kết nối với nhau bằng các dây thần kinh , đại diện bởi
các trọng số (weights) 


Mạng thần kinh nhiều lớp Perceptron ( Multi‐Layer Perceptron – MLP) được ứng dụng khá
phổ biến trong vấn đề kiểu hồi quy. MLP gồm 3 lớp chính:

Ngõ ra được tính bằng cơng thức


4. Dự đoán chỉ số thị trường NASDAQ:
Trong nghiên cứu này, ta sẽ áp dụng mạng thần kinh truyền thẳng được huấn luyện bởi
thuật tốn lan truyền ngược sai số (backward propagation of errors)
Phương trình mơ tả khái quát hệ thống để huấn luyện: 

Input: Giá cổ phiếu các ngày trước đó

Thứ tự của ngày hiện tại trong tuần
Output: giá trị cổ phiếu hiện tại

Chú thích:
y(k) : giá cổ phiếu tại thời điểm k
n: số ngày trong quá khứ
D(k) : thứ tự ngày trong tuần


Hiệu năng của ANN được đánh giá bởi 2 yếu tố :
Hệ số xác định bội R2 :

R2 càng cao: mối liên hệ giữa biến
độc lập và biến phụ thuộc (khi tuyến
tính hóa) càng chặt chẽ

Sai số tồn phương trung bình
(Mean Square Error –MSE)

MSE đại diện cho sai số bình phương trung bình
giữa giá trị dự đốn ( y‐ predicted) và
giá trị thực tế (y‐ experimental) 
M là số lượng data


Phương pháp :
Dữ liệu huấn luyện sẽ được chia làm 2 loại training dataset :
4 prior working day 
9 prior working day
Tạo 1 Mạng Neuron lan truyền ngược với 20 – 40 – 20 neurons ở lớp ẩn

Áp dụng lần lượt các Training function và Transfer function , từ đó tìm được kết quả
tối ưu cho cả 2 loại training dataset
Với training function và transfer function tối ưu, ta sẽ lần lượt thay đổi cấu trúc mạng , 
bao gồm số lớp ẩn và số neuron trong mỗi lớp ẩn
BEST METHOD


5. Kết quả và thảo luận:
Giá cổ phiếu qua từng ngày của NASDAQ được thu thập trong 99 ngày, từ ngày
28 tháng 1,2015 đến 18 tháng 6, 2015 , làm training dataset để huấn luyện cho model
Training function: LM (Levenberg‐Marquardt) ; OSS ( one step secant) ; 
GDA ( gradient descentwith adaptive learning rate) ;
GDM ( gradient descent with momentum)

Transfer function: TANGSIG, PURELIN , LOGSIG


a = tangsig(n)

a = logsig(n)

a = purelin(n)


5.1 : Four prior working day 

Dataset
60%

20%


20%




Lưu ý: Bất kỳ sự thay đổi số lượng tế bào thần kinh sẽ ảnh hưởng đến độ hiệu quả
của model,
nhưng khơng có nghĩa là càng nhiều lớp ẩn hoặc càng nhiều neron trong lớp ẩn sẽ
đạt hiệu quả cao hơn
Ex: Mạng 5 – 5 có giá trị R2 chấp nhận được ( 0.8631)
Nhưng mạng 5 – 10 lại có khả năng dự đốn kém



5.1 : Nine prior working day 

Kết quả: Sử dụng Training function OSS và Transfer function LOGSIG sẽ cho kết quả R2
tối ưu nhất cho Validation dataset (0.9622) 




6. Kết luận:


4 PRIOR WORKING
DAY

OSS


TANSIG

9 PRIOR WORKING
DAY

OSS

LOGSIG

20 – 40 ‐ 20
40 ‐ 40
20 – 40 ‐ 20

‐ Khơng có sự khác biệt nào đáng kể đối với 2 kiểu dữ liệu đầu vào là Four prior working day 
và Nine prior working day 


Dự đốn khá chính xác xu hướng tăng, giảm của thị trường

ƯU ĐIỂM

KHUYẾT ĐIỂM

Trực quan, dễ sử dụng và theo dõi

Training set cố định, càng về lâu xu hướng có thể thay đổi, gây ra sự
khơng chính xác



7. Hướng phát triển
Phần mềm
( Viết bằng python)

Tự lấy dữ liệu từ server
hoặc qua excel

Cập nhật dữ liệu theo
thời gian thực

Sau 1 khoảng thời gian
=> Tự xóa mẫu cũ
=> Cập nhật mẫu mới
=> Auto training


Tài liệu tham khảo thêm:


XIN CẢM ƠN ĐàLẮNG NGHE


×