Tải bản đầy đủ (.pdf) (73 trang)

ỨNG DỤNG SVM và CHUỖI THỜI GIAN dự đoán THỜI điểm MUA bán cổ PHIẾU CHO THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (7.73 MB, 73 trang )

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA KHOA HỌC MÁY TÍNH

TRẦN QUỐC BẢO – CH1301004

LUẬN VĂN THẠC SỸ

ỨNG DỤNG SVM VÀ CHUỖI THỜI GIAN DỰ ĐOÁN THỜI
ĐIỂM MUA BÁN CỔ PHIẾU CHO THỊ TRƯỜNG CHỨNG
KHOÁN VIỆT NAM

THẠC SỸ NGÀNH KHOA HỌC MÁY TÍNH

GIẢNG VIÊN HƯỚNG DẪN
TS. DƯƠNG MINH ĐỨC

TP. HỒ CHÍ MINH, 2017


LỜI CẢM ƠN
Lời đầu tiên, em xin chân thành cảm ơn thầy Dương Minh Đức. Thầy đã rất tận
tâm, nhiệt tình hướng dẫn và chỉ bảo em trong suốt quá trình thực hiện khóa luận. Không
có sự quan tâm, theo dõi chặt chẽ của Thầy chắc chắn em không thể hoàn thành khóa
luận này.
Em xin cảm ơn quí Thầy Cô Khoa Khoa Học Máy Tính, trường Đại học Công
Nghệ Thông Tin – Đại học Quốc gia Thành phố Hồ Chí Minh, trang bị cho em những
kiến thức và kinh nghiệm quí báu trong suốt những năm học tập tại trường.
Con xin cảm ơn ba mẹ đã sinh thành, nuôi dưỡng, và dạy dỗ để con có được thành
quả như ngày hôm nay. Ba mẹ luôn là nguồn động viên, nguồn sức mạnh hết sức lớn lao


mỗi khi con gặp khó khăn trong cuộc sống.
Cuối cùng, chúng tôi xin gửi lời cảm ơn chân thành đến những người bạn đã chia sẽ
và ủng hộ chúng chúng tôi trong thời gian thực hiện khóa luận.

TP. Hồ Chí Minh, tháng 07 năm 2017
Học viên

Trần Quốc Bảo


LỜI CAM ĐOAN
Em xin cam đoan đây là công trình nghiên cứu của bản thân dưới sự hướng dẫn của
Tiến sĩ Dương Minh Đức. Các số liệu, kết quả trình bày trong khóa luận là trung thực.
Các tư liệu được sử dụng trong luận văn có nguồn gốc và trích dẫn một cách rõ ràng, đầy
đủ.
TP. Hồ Chí Minh, tháng 07 năm 2017
Học viên

Trần Quốc Bảo


MỤC LỤC
Chương 1. TỔNG QUAN.........................................................................................5
1.1. Tình hình nghiên cứu .......................................................................................5
1.1.1. Các nghiên cứu ngoài nước .......................................................................5
1.1.2. Các nghiên cứu trong nước ........................................................................6
1.2. Mục tiêu của đề tài ...........................................................................................7
1.3. Đối tượng nghiên cứu:......................................................................................7
1.4. Phạm vi nghiên cứu: .........................................................................................8
1.5. Tính mới và đóng góp của đề tài: .....................................................................8

1.5.1.1. Ý nghĩa khoa học: .............................................................................8
1.5.1.2. Ý nghĩa thực tiễn:..............................................................................8
1.6. Bố cục của đề tài ..............................................................................................8
Chương 2. CƠ SỞ LÝ THUYẾT ..........................................................................10
2.1. Giới thiệu ........................................................................................................10
2.2. Kiến thức cơ bản về thị trường chứng khoán và cổ phiếu .............................10
2.2.1. Các khái niệm cơ bản...............................................................................10
2.2.1.1. Thị trường chứng khoán..................................................................10
2.2.1.2. Cổ phiếu ..........................................................................................11
2.2.1.3. Vai trò của TTCK ...........................................................................11
2.2.2. Nguyên tắc hoạt động của TTCK ............................................................12
2.2.3. Các chỉ số kỹ thuật ...................................................................................13
2.2.3.1. Đường trung bình MA ....................................................................14
2.2.3.2. Đường trung bình động phân kỳ hội tụ MACD ..............................14
2.2.3.3. Đường chỉ số sức mạnh tương đối RSI ...........................................16


2.2.3.4. Đường Stochatics oscillator ............................................................17
2.2.3.5. Đường Williams %R .......................................................................19
2.2.3.6. Khối lượng giao dịch ......................................................................20
2.3. Phương pháp phân tích hồi quy đa biến BMA ...............................................21
2.3.1. Giới thiệu về BMA ..................................................................................21
2.3.2. Chi tiết về BMA.......................................................................................21
2.4. Phương pháp phân đoạn dữ liệu theo xu hướng TBSM .................................22
2.4.1. Giới thiệu về TBSM ................................................................................22
2.4.2. Quy trình thực hiện thuật toán TBSM .....................................................22
2.4.2.1. Ý tưởng thuật toán TBSM .............................................................22
2.4.2.2. Mã giả cài đặt thuật toán TBSM ....................................................23
2.5. Phương pháp hồi quy véc-tơ hỗ trợ SVR .......................................................25
2.5.1. Giới thiệu về SVR....................................................................................25

2.5.2. Mô hình SVR ...........................................................................................26
2.5.3. Các tham số của SVR ..............................................................................27
2.5.4. Xác định bộ tham số tối ưu của SVR bằng thuật toán Grid Search ........27
2.5.5. Ứng dụng SVR vào bài toán dự báo thời điểm mua bán chứng khoán ...28
2.5.6. Kết luận ....................................................................................................30
Chương 3. MÔ HÌNH DỰ BÁO THỜI ĐIỂM MUA BÁN CHỨNG KHOÁN
ĐỀ XUẤT

.........................................................................................................31

3.1. Giới thiệu ........................................................................................................31
3.2. Quá trình huấn luyện ......................................................................................32
3.3. Quá trình dự đoán ...........................................................................................37
3.4. Kết luận ..........................................................................................................38


Chương 4. KẾT QUẢ THỰC NGHIỆM – ĐÁNH GIÁ .....................................40
4.1. Giới thiệu ........................................................................................................40
4.1.1. Mô tả dữ liệu ............................................................................................40
4.1.2. Độ đo chất lượng dự đoán .......................................................................41
4.1.3. Mô phỏng thực hiện giao dịch: ................................................................41
4.1.4. Cài đặt ......................................................................................................41
4.1.5. Kết quả thực nghiệm ................................................................................43
4.2. Đánh giá .........................................................................................................54
Chương 5. KẾT LUẬN – HƯỚNG PHÁT TRIỂN .............................................61
5.1. Kết luận ..........................................................................................................61
5.1.1. Kết quả đạt được ......................................................................................61
5.1.2. Ý nghĩa khoa học .....................................................................................62
5.1.3. Ý nghĩa thực tiễn .....................................................................................62
5.2. Hướng phát triển ............................................................................................62



DANH MỤC HÌNH VẼ
Hình 2.1. Minh họa đường trung bình động đơn giản SMA .....................................14
Hình 2.2. Minh họa đường trung bình động MACD ................................................16
Hình 2.3. Minh họa đường chỉ số sức mạnh tương đối RSI .....................................17
Hình 2.4. Minh họa đường Stochatics oscillator.......................................................18
Hình 2.5. Minh họa đường William %R ...................................................................20
Hình 2.7. Mô phỏng kết quả phân đoạn bằng thuật toán TBSM ..............................23
Hình 2.8. Mã giả cài đặt thuật toán TBSM ...............................................................23
Hình 2.9. Ví dụ minh họa thuật toán TBSM .............................................................24
Hình 2.10. Minh họa hàm lỗi thông thường và hàm lỗi  - insensitive [5] ...............26
Hình 2.11. Minh họa mục tiêu của SVR ...................................................................29
Hình 3.1. Mô hình nghiên cứu [15]...........................................................................32
Hình 3.2. Sơ đồ quá trình huấn luyện .......................................................................32
Hình 3.3. Minh họa dữ liệu thô ban đầu ...................................................................34
Hình 3.4. Mô phỏng quá trình thực hiện TBSM .......................................................35
Hình 4.1. Mối liên hệ giữa tín hiệu giao dịch và giá trị đầu ra của SVR ..................43
Hình 4.2. Mô tả tần suất được chọn của các đặc trưng đầu vào ...............................45
Hình 4.3. Tín hiệu giao dịch dự báo cho BVH và giá trị đầu ra của SVR tương ứng.
...................................................................................................................................46
Hình 4.4. Tín hiệu giao dịch khuyến nghị cho GMD ...............................................47
Hình 4.5. Tín hiệu giao dịch dự báo cho HHS ..........................................................48
Hình 4.6. Tín hiệu giao dịch dự báo cho MBB .........................................................49
Hình 4.7. Tín hiệu giao dịch dự báo cho HVG .........................................................50
Hình 4.8. Tín hiệu giao dịch dự báo cho VNM ........................................................51
Hình 4.9. Tín hiệu giao dịch dự báo cho HHS ..........................................................52
Hình 4.10. Tín hiệu giao dịch dự báo cho PVT ........................................................53
Hình 4.12. Tín hiệu giao dịch dự báo cho STB ........................................................54



DANH MỤC BẢNG
Bảng 3.1. Danh sách các chỉ số kỹ thuật được sử dụng trong huấn luyện dữ liệu ...34
Bảng 4.1. Mô tả dữ liệu thử nghiệm .........................................................................40
Bảng 4.2. Mô tả tham số cài đặt cho SVR ................................................................42
Bảng 4.3. Mô tả tham số cài đặt cho TBSM .............................................................42
Bảng 4.4. Kết quả lựa chọn các đặc trưng đầu vào bằng BMA ................................44
Bảng 4.5. Kết quả so sánh lợi nhuận giữa 2 mô hình và với chiến thuật mua-giữ
(Việt Nam, %) trong giai đoạn 6 tháng đầu tư. .........................................................55
Bảng 4.6. Lợi nhuận thu trong giai đoạn 3 tháng (Việt Nam, tính theo %) với Radial
...................................................................................................................................55
Bảng 4.7. Kết quả so sánh tổng lợi nhuận với chiến thuật mua-giữ của rổ VN30
tháng (Việt Nam, %) trong 6 tháng. ..........................................................................57
Bảng 4.8. Kết quả so sánh tổng lợi nhuận với chiến thuật mua-giữ của rổ VN30
tháng (Việt Nam, %) trong 3 tháng. ..........................................................................59


DANH MỤC TỪ VIẾT TẮT
STT VIẾT
TẮT
1
TTCK
1
ANN
2
EMA
3
MA
4
MACD

5
6
7

MAE
NMSE
PLR

8
9
10

RMSE
RSI
SMA

11

BMA

12
13
14

SVM
SVR
TBSM

MÔ TẢ
Thị trường chứng khoán

Mạng nơ ron nhân tạo (Artificial Neural Network)
Chỉ số trung bình trượt lũy thừa (Exponential Moving Average)
Chỉ số đường trung bình (Moving Average)
Chỉ số trung bình biến đổi hội tụ, phân kỳ (Moving Average
Convergence Divergence)
Sai số trung bình tuyệt đối (Mean Absolute Error)
Tối thiểu hóa trung bình độ lỗi (Normalized Mean Square Error)
Phương pháp phân đoạn dữ liệu (Pieciewise Linear
Representation)
Sai số bình phương trung bình (Root Mean Square Error)
Chỉ số sức mạnh tương đối (Relative Strength Index)
Chỉ số trung bình trượt đơn giản (Simple Moving Average)
Phương pháp phân tích hồi quy dựa theo thuyết thông kê Bayes
(Bayesian Model Average)
Phương pháp máy học véc-tơ hỗ trợ (Support Vector Machine)
Phương pháp hồi quy véc-tơ hỗ trợ (Support Vector Regression)
Phương pháp phân đoạn dữ liệu dựa trên xu hướng (Trend Based
Segmentation Method)


TÓM TẮT ĐỀ TÀI
Trong đề tài nghiên cứu này, chúng tôi dựa trên mô hình TBSM-SVR được xây
dựng bởi nhóm tác giả Pei-Chann Chang, Jheng-Long Wu cùng cộng sự [15] để xây
dựng mô hình dự báo thời điểm mua bán chứng khoán tại thị trường Việt Nam. Mô
hình chúng tôi đề xuất nhằm cải tiến mô hình gốc TBSM-SVR của tác giả bằng
cách ở giai đoạn tiền xử lý chúng tôi sử dụng phương pháp BMA thay thế phương
pháp SRA để chọn các chỉ số kỹ thuật chính xác hơn và thật sự có ảnh hưởng đến
giá cổ phiếu nhằm cải tiến về hiệu xuất của mô hình. TBSM được dùng để phân
đoạn chuỗi dữ liệu thành các xu hướng, những xu hướng này kết hợp với các chỉ số
kỹ thuật được đưa vào SVR huấn luyện để khuyến nghị các điểm mua bán cho nhà

đầu tư. Đây là hướng nghiên cứu khá mới đối với thị trường Việt Nam. Để đánh giá
hiệu suất của mô hình, chúng tôi so sánh lợi nhuận thu được từ mô hình đề xuất với
lợi nhuận thu được từ mô hình gốc của tác giả và đồng thời chúng tôi cũng so sánh
với phương pháp mua và giữ, và kết quả thử nghiệm cho thấy, phương pháp của
chúng tôi đem lại kết quả tốt hơn và phù hợp với nhu cầu của các nhà đầu tư chứng
khoán.

1


MỞ ĐẦU
Một trong những vấn đề quan trọng trong dự đoán xu hướng thị trường chứng
khoán là nhận biết các điểm chuyển tiếp (turning points) trong khi giá cổ phiếu thay
đổi liên tục. Từ các điểm chuyển tiếp này các nhà đầu tư có thể quyết định mua
hoặc bán sao cho lợi nhuận đạt được là cao nhất. Tuy nhiên trong thực tế việc xác
định các điểm chuyển tiếp này khá phức tạp vì có rất nhiều yếu tố ảnh hưởng trực
tiếp cũng như gián tiếp đến sự biến động của giá cả chẳng hạn như yếu tố lãi suất
ngân hàng, môi trường kinh tế, tin đồn hoặc tâm lý không vững của các nhà đầu
tư… Nhờ vào sự phát triển mạnh mẽ của Công nghệ thông tin nói chung và các
công cụ Tính toán thông minh (Computational Intelligence) nói riêng, các mô hình
cộng tác (collaborative model) được xây dựng và phát triển để dự đoán và nhận biết
các điểm chuyển tiếp dựa trên những yếu tố này và từ đó có thể giúp các nhà đầu tư
đưa ra các quyết định mua hoặc bán phù hợp nhất.
Trong những năm gần đây, có nhiều nghiên cứu đã gặt hái được những thành
quả đáng kể nhờ việc sử dụng các phương pháp dự đoán trong lãnh vực Tính toán
thông minh nhằm giảm thiểu rủi ro khi đầu tư dựa vào dữ liệu quá khứ của thị
trường chứng khoán [11] [12]. Trong lãnh vực tài chính, các chỉ số kỹ thuật được áp
dụng để giải thích sự biến động của giá cả và được sử dụng để nhận biết các điểm
chuyển tiếp như William Index hoặc Relative Strength Index… Với dự doán truyền
thống, các nhà nghiên cứu tài chính thường sử dụng các mô hình toán học dự đoán

giá cũng như xu hướng của cổ phiếu, nhưng những mô hình này thường không thể
điểu chỉnh kịp theo những biến động của thị trường [13].
Trong vài năm lại đây, đã có vài phương pháp dựa trên chuỗi thời gian được
đề xuất, trong đó phương pháp được biết đến nhiều nhất là phương pháp Biểu diễn
tuyến tính đoạn lồi - Piecewise Linear Representation (PLR) [11] [12] [13]. Phương
pháp này phân tách dự liệu quá khứ của cổ phiếu thành một danh sách các đoạn
tăng (bottom and peak points). Tuy nhiên, phương pháp này lại không xem xét đa
xu hướng. Để cải tiến phương pháp này nhằm phù hợp với thị trường, cần phải có

2


một phương pháp phân đoạn dữ liệu thành các xu hướng (tăng, giảm, không đổi)
theo thời gian.
Hơn thế nữa, lãnh vực máy học đã cung cấp nhiều phương pháp để giải quyết
vấn đề dự đoán như mạng nơ-ron nhân tạo (Artificial Neural Network - ANN),
logic mờ, máy vector hỗ trợ (Support Vector Machine - SVM) và các phương pháp
Trí tuệ nhân tạo khác. Từ những nghiên cứu trước đây cho thấy SVM cho ra kết quả
hơn hẳn các phương pháp khác. Phương pháp hồi quy vector hỗ trợ (Support Vector
Regression - SVR) là một phương pháp dựa trên nền tảng mô hình hồi quy
(Regression-Based Model) kết hợp với SVM. Phương pháp này lại có khả năng chịu
lỗi cao và cho ra kết quả chính xác cao hơn trong các bài toán phức tạp [14]. Chính
vì vậy tôi muốn xây dựng một phương pháp phân đoạn mới kết hợp với SVR để xây
dụng các hệ thống dự báo trong tài chính.
Mục tiêu nghiên cứu:
Đề tài tập trung nghiên cứu thời điểm mua bán chứng khoán bằng sự hỗ trợ
của dữ liệu giá trong quá khứ và các phương pháp máy học (SVM). Hay nói cách
khác là sẽ giúp nhà đầu tư ra quyết định mua hoặc bán trong từng thời điểm mà
quyết định đó mang lại hiệu quả đầu tư lớn nhất.
Đối tượng nghiên cứu:

Nghiên cứu và cài đặt các thuật toán phân đoạn dữ liệu TBSM (Trend-Based
Segmentation Method), thuật toán BMA (Bayesian Model Average) và thuật toán
máy học SVR.
Phạm vi nghiên cứu:
Nghiên cứu xây dựng mô hình dự đoán và điều chỉnh tham số sao cho phù
hợp với thị trường Việt Nam.
Ý nghĩa khoa học:
Ứng dụng phương pháp thống kê Bayes vào mô hình gốc của tác giả để cải
tiến mô hình, cụ thể phương pháp BMA (Bayesian Model Average) được đưa vào

3


mô hình để cải tiến việc chọn ra các chỉ số phân tích kỹ thuật nào thật sự ảnh hưởng
đến giá cổ phiếu, cũng như thay đổi các khoảng để quét tham số đối với kỹ thuật
TBSM. Theo đó, việc có được ngưỡng phù hợp cho kỹ thuật TBSM sẽ tạo được
những phân đoạn giống với mô hình giá, kèm với việc sử dụng phương pháp vét cạn
đối với SVR để tìm tham số (Cost, gamma) cho mô hình có độ lỗi thấp nhất.
Ý nghĩa thực tiễn:
Ứng dụng mô hình cải tiến trên vào TTCK Việt Nam, đây thật sự là một
hướng nghiên cứu khá mới mẻ tại thị trường này tuy nhiên nó thực sự rất cần thiết
và hữu ích với các nhà đầu tư bởi hệ thống hỗ trợ ra quyết định mua/bán rõ ràng
giúp nhà đầu tư không hoang mang khi quyết định đầu tư chứng khoán. Hơn nữa,
chúng tôi đã chứng minh được sự hữu ích của mô hình này bằng kết quả thực
nghiệm thu được trên 10 mã cổ phiếu của rổ VN30 với lợi nhuận đạt được khá tốt
cùng những khuyến nghị mua/bán hợp lý.
Mô hình dự báo chứng khoán của chúng tôi có tính thực tiễn tại thị trường
Việt Nam rất cao.

4



Chương 1. TỔNG QUAN
1.1. Tình hình nghiên cứu
Dự đoán chứng khoán là một chủ đề thu hút sự quan tâm của nhiều chuyên
gia. Có nhiều phương pháp dự đoán đã được phát triển để dự đoán thời điểm mua
bán chứng khoán cũng như dự báo xu thế biến động giá cổ phiếu, thị trường hoặc
tìm kiếm các chứng khoán tiềm năng. Bên cạnh phân tích kỹ thuật và phân tích cơ
bản là hai phương pháp tài chính truyền thống, lĩnh vực nghiên cứu trí tuệ nhân tạo
trong Công nghệ thông tin đã cho ra đời nhiều phương pháp phân tích khác có khả
năng áp dụng vào dự đoán chứng khoán. Cụ thể đã có nhiều công trình trong và
ngoài nước nghiên cứu về các phương pháp này.
1.1.1. Các nghiên cứu ngoài nước
Hiện nay trên thế giới đã có khá nhiều công trình nghiên cứu liên quan đến dự
đoán thị trường chứng khoán và cụ thể đã có nhiều nghiên cứu về dự đoán thời
điểm mua bán cổ phiếu. Vào năm 2000, nhóm tác giả Trafalis và cộng sự [15] đã
nghiên cứu và ứng dụng SVR để xây dựng mô hình dự đoán thời điểm mua bán cổ
phiếu. Mục đích chính của nghiên cứu này là so sánh kết quả của SVR với các mô
hình khác như ANN và RBF(Radial Basis Function) và kết quả thử nghiệm trên 3
mã cổ phiếu của thị trường Mỹ là IBM, Yahoo và AOL đã cho thấy SVR có độ lỗi
MSE nhỏ hơn ANN.
Kwoon và Moon [16] dùng mô hình lai NN và GA áp dụng trên 36 mã cổ
phiếu của công ty trên sàn NYSE và NASDAQ trong 13 năm cho thấy hiệu suất mô
hình tốt hơn đáng kể so với chiến thuật “mua và giữ”.
Teixeira và Oliveira [16] đã kết hợp phân tích kỹ thuật và thuật toán láng
giềng gần nhất (k-NN). Cụ thể, nhóm tác giả đã xây dựng và so sánh kết quả của
các mô hình k-NN, k-NN+stop loss, k-NN+stop gain, k-NN+stop loss+stop gain, kNN+stop loss+stop gain+RSI-filter. Các mô hình của nhóm tác giả có lợi nhuận đạt
được tốt hơn chiến thuật “mua và giữ” với 12 trong 15 cổ phiếu được thực nghiệm.

5



Cụ thể mô hình k-NN+stop loss và k-NN+stop loss+stop gain+RSI-filter cho lợi
nhuận cao nhất.
Pei-Chann Chang và cộng sự [14] cũng đề xuất mô hình sử dụng phương pháp
phân đoạn chuỗi dữ liệu thời gian là IPLR-BPN với lợi nhuận trung bình của 7 mã
cổ phiếu đã chọn trên sàn NASDAQ 12.32%.
Ngoài ra, còn có nhiều nghiên cứu xây dựng mô hình kết hợp giữa phương
pháp máy học và các kỹ thuật trí tuệ nhân tạo như Huang và Wu [13] sử dụng GA
để chọn các đặc trưng đầu vào kết hợp với SVM, Huang và Tsai [12] dùng kỹ thuật
gom cụm SOFM kết hợp SVR.
1.1.2. Các nghiên cứu trong nước
Hiện nay trong nước cũng có nhiều nghiên cứu trong lãnh vực dự đoán thị
trường chứng khoán như nhóm tác giả Long Van và cộng sự [1] đã ứng dụng một
phương pháp kết hợp giữa K-Means và SVM với ước lượng xác suất lớp, gọi là KSVMeans thực hiện ở chu kỳ 1 ngày và chu kỳ 5 ngày tiếp theo trên 6 mã cổ phiếu
ở thị trường Việt Nam và kết quả cho thấy phương pháp K-SVMeans có độ chính
xác cao hơn so với BPNN truyền thống, bộ phân lớp SVM và SVM với ước lượng
xác suất.
Tác giả Kien Tran và cộng sự [2] đề xuất phương pháp lai giữa thuật giải di
truyền GA và hồi qui véc tơ hỗ trợ SVR để dự đoán giá cổ phiếu trên thị trường
chứng khoán Việt Nam. Với đặc trưng đầu vào là các chỉ số phân tích kỹ thuật khác
nhau, nhiệm vụ của GA là chọn ra các chỉ số quan trọng nhất. Đồng thời, GA cũng
được dùng để xác định bộ tham số tối ưu cho SVR. Sau đó, các chỉ số được chọn và
bộ tham số tối ưu SVR sẽ được sử dụng để huấn huyện SVR và cho ra mô hình dự
đoán. Kết quả thử nghiệm trên 4 mã cổ phiếu Việt Nam, Hit Rate trung bình của
phương pháp lai GA-SVR đạt 65.15% cho thấy khả năng ứng dụng thực tế của
phương pháp này trên thị trường chứng khoán Việt Nam.
Hầu hết các nghiên cứu trên đều tập trung vào giá cổ phiếu và dữ liệu quá khứ
của giá, tuy nhiên có một hướng tiếp cận khác là dự đoán dựa vào các tin tức thông
thường hoặc các tin tức tài chính, điển hình là nghiên cứu của Ngoc Trinh [3] bằng


6


việc sử dụng tập dữ liệu mạng xã hội Twitter kết hợp với SVR để xây dựng mô hình
dự đoán, kế đó là đề tài của Tung Nguyen [4] sử dụng kỹ thuật tương quan chéo, kỹ
thuật phân tích nhân quả dự đoán xu hướng chỉ số chứng khoán dựa trên phân tích
tâm trạng từ phương tiện xã hội, ngoài ra còn có nhiều đề tài nghiên cứu khác.
Hầu hết các nghiên cứu tại Việt Nam chủ yếu tập trung dự báo giá và xu
hướng, và rất ít các nghiên cứu về dự báo thời điểm mua bán chứng khoán trên thị
trường Việt Nam. Vì thế, chúng chúng tôi hy vọng đề tài nghiên cứu của mình sẽ có
ý nghĩa thực tiễn cao và hỗ trợ được các nhà đầu tư ra quyết định giao dịch chứng
khoán với lợi nhuận đạt được cao nhất có thể và hạn chế được nhiều rủi ro nhất.
1.2. Mục tiêu của đề tài
Sự biến động giả cổ phiếu trên thị trường chứng khoán Việt Nam diễn ra rất
khó lường, có những thời điểm chỉ số VNIndex tụt dốc thể thảm nhưng cũng có khí
tăng đến mức khó tin. Chính vì lẽ đó, hiện có khá ít các công trình nghiên cứu và
xây dựng mô hình dự đoán thời điểm mua bán cổ phiếu.
Mục tiêu của đề tài sẽ tập trung vào nghiên cứu và xây dựng mô hình bằng kỹ
thuật máy học để đự đoán các thời điểm mua bán cổ phiếu sao cho lợi nhuận cao
nhất có thể trên thị trường chứng khoán Việt Nam.
Cụ thể trước tiên tập trung vào nghiên cứu mô hình TBSM-SVR được tác giả
Pei-Chann Chang và cộng sự [15] xây dựng, sau đó cải tiến mô hình này sau cho
phù hợp với mô hình chứng khoán Việt Nam.
Ý nghĩ thực tiễn của mô hình chính là sự hỗ trợ được các nhà đầu tư ra quyết
định giao dịch chứng khoán với lợi nhuận đạt được cao nhất có thể và hạn chế rủi ro
ở mức thấp nhất.
1.3. Đối tượng nghiên cứu:
Nghiên cứu và cài đặt các thuật toán phân đoạn dữ liệu TBSM (Trend-Based
Segmentation Method), thuật toán BMA (Bayesian Model Average) và thuật toán

máy học SVR.

7


1.4. Phạm vi nghiên cứu:
Nghiên cứu xây dựng mô hình dự đoán và điều chỉnh tham số sao cho phù hợp
với thị trường Việt Nam.
1.5. Tính mới và đóng góp của đề tài:
1.5.1. Ý nghĩa khoa học:
Ứng dụng phương pháp thống kê Bayes vào mô hình gốc của tác giả để cải
tiến mô hình, cụ thể phương pháp BMA (Bayesian Model Average) được đưa vào
mô hình để cải tiến việc chọn ra các chỉ số phân tích kỹ thuật nào thật sự ảnh hưởng
đến giá cổ phiếu, cũng như thay đổi các khoảng để quét tham số đối với kỹ thuật
TBSM. Theo đó, việc có được ngưỡng phù hợp cho kỹ thuật TBSM sẽ tạo được
những phân đoạn giống với mô hình giá, kèm với việc sử dụng phương pháp vét cạn
đối với SVR để tìm tham số (Cost, gamma) cho mô hình có độ lỗi thấp nhất.
1.5.2 Ý nghĩa thực tiễn:
Ứng dụng mô hình cải tiến trên vào TTCK Việt Nam, đây thật sự là một
hướng nghiên cứu khá mới mẻ tại thị trường này tuy nhiên nó thực sự rất cần thiết
và hữu ích với các nhà đầu tư bởi hệ thống hỗ trợ ra quyết định mua/bán rõ ràng
giúp nhà đầu tư không hoang mang khi quyết định đầu tư chứng khoán. Hơn nữa,
chúng tôi đã chứng minh được sự hữu ích của mô hình này bằng kết quả thực
nghiệm thu được trên 10 mã cổ phiếu của rổ VN30 với lợi nhuận đạt được khá tốt
cùng những khuyến nghị mua/bán hợp lý.
Mô hình dự báo chứng khoán của chúng tôi có tính thực tiễn tại thị trường
Việt Nam rất cao.
1.6. Bố cục của đề tài
Nội dung của đề tài được chia làm 5 phần:
Chương 1. Tổng quan: Khảo sát tình hình nghiên cứu trong và ngoài nước về

bài toán xây dựng mô hình nghiên cứu thời điểm mua bán cổ phiếu. Từ đó đưa ra
mục tiêu và hướng tiếp cận của đề tài.

8


Chương 2. Cơ sở lý thuyết: Trình bày kiến thức cơ bản về thị trường chứng
khoán, cổ phiếu và cơ sở lý thuyết của kỹ thuật máy học được sử dụng trong đề tài.
Chương 3. Mô hình dự đoán thời điểm mua bán cổ phiếu đề xuất: Trình
bày mô hình đề xuất để giải quyết bài toán dự đoán thời điểm mua bán trên thị
trường chứng khoán Việt Nam.
Chương 4. Kết quả thực nghiệm: Trình bày về dữ liệu thử nghiệm, kịch bản
thử nghiệm và kết quả thu được. Từ đó đưa ra nhận xét, đánh giá về mô hình đề
xuất.
Chương 5 Kết luận và hướng phát triển: Tổng kết những kết quả đạt được
và hướng phát triển trong tương lai.

.

9


Chương 2. CƠ SỞ LÝ THUYẾT
2.1. Giới thiệu
Nội dung của chương này có 4 phần chính:
- Thứ nhất là kiến thức cơ bản về thị trường chứng khoán (TTCK) nói chung
và cổ phiếu nói riêng. Cụ thể là các khái niệm về TTCK, cổ phiếu và các chỉ số kỹ
thuật trong chứng khoán được sử dụng trong đề tài.
- Thứ hai, trình bày về cơ sở lý thuyết của phương pháp phân đoạn dữ liệu
theo xu hướng TBSM.

- Thứ ba, giới thiệu sơ bộ về phương pháp chọn lọc thuộc tính tương quan
BMA để chọn lọc các chỉ số kỹ thuật có tương quan đến giá cổ phiếu.
- Cuối cùng là lý thuyết của phương pháp hồi quy véc-tơ hỗ trợ SVR được
dùng để huấn luyện dữ liệu.
2.2. Kiến thức cơ bản về thị trường chứng khoán và cổ phiếu
2.2.1. Các khái niệm cơ bản
Thị trường chứng khoán
TTCK trong điều kiện của nền kinh tế hiện đại được quan niệm là nơi diễn ra
các hoạt động trao đổi, mua bán, chuyển nhượng các loại chứng khoán, qua đó thay
đổi chủ thể nắm giữ chứng khoán.
TTCK là một bộ phận quan trọng của Thị trường vốn, hoạt động của nó nhằm
huy động những nguồn vốn tiết kiệm nhỏ trong xã hội tập trung thành nguồn vốn
lớn tài trợ cho doanh nghiệp, các tổ chức kinh tế và Chính phủ để phát triển sản
xuất, tăng trưởng kinh tế hay cho các dự án đầu tư.
Ví dụ: TTCK New York (NYSE), TTCK Thành phố Hồ Chí Minh (HOSE),
TTCK Hà Nội (HNX)…
Chức năng cơ bản của TTCK:
o Huy động vốn đầu tư cho nền kinh tế.
o Cung cấp môi trường đầu tư cho công chúng.

10


o Tạo môi trường giúp Chính phủ thực hiện các chính sách kinh tế vĩ mô.
o Tạo tính thanh khoản cho các chứng khoán.
o Đánh giá hoạt động của các doanh nghiệp.
Cổ phiếu
Khi môt công ty gọi vốn, số vốn cần gọi đó được chia thành nhiều phần nhỏ
bằng nhau gọi là cổ phần. Người mua cổ phần được gọi là cổ đông. Cổ đông được
cấp một giấy chứng nhận sở hữu cổ phần gọi là cổ phiếu và chỉ có công ty cổ phần

mới phát hành cổ phiếu. Như vậy, cổ phiếu chính là một chứng thư chứng minh
quyền sở hữu của một cổ đông đối với một công ty cổ phần và cổ đông là người có
cổ phần thể hiện bằng cổ phiếu.
Vai trò của TTCK
TTCK đang đóng vai trò ngày càng quan trọng trong nền kinh tế các nước
trên thế giới. Khi nền kinh tế hàng hóa phát triển đến một mức độ nhất định sẽ cần
tới TTCK để hỗ trợ cho quá trình phát triển.
Sự phát triển mạnh mẽ của thị TTCK có tác động tích cực tới sự phát triển của
các quốc gia. Thực tế cho thấy TTCK đã thúc đẩy phát triển kinh tế ở nhiều nước
một cách có hiệu quả thông qua việc góp phần tạo ra vốn khả dụng.
Các yếu tố ảnh hưởng đến TTCK, giá cổ phiếu
Môi trường chính trị cũng có ảnh hưởng đến TTCK, xã hội luôn có những tác
động nhất định đến hoạt động của TTCK. Yếu tố chính trị bao gồm những thay đổi
về chính phủ và các hoạt động chính trị. Tuy nhiên ở nước ta tình hình chính trị
tương đối ổn định nên ta có thể bỏ qua yếu tố này.
Môi trường xã hội và pháp luật : hệ thống chính sách có tác động rất lớn đến
bản thân TTCK và hoạt động của các doanh nghiệp. Mỗi thay đổi chính sách có thể
kéo theo các tác động làm giá chứng khoán tăng hoặc giảm, nhất là những thời điểm
nhạy cảm.
Tỷ giá hối đoái có tác động đến TTCK trên cả 2 góc độ là môi trường tài
chính và chính bản thân hoạt động kinh doanh của doanh nghiệp, đặc biệt là những
doanh nghiệp nhập nguyên liêu hay tiêu thụ sản phẩm ở nước ngoài.

11


Lạm phát là sự mất giá của đồng tiền, nó làm thay đổi hành vi tiêu dùng và
tiết kiệm của dân cư và doanh nghiệp. Tỷ lệ lạm phát không hợp lý sẽ gây khó khăn
cho hoạt động sản xuất kinh doanh, ngăn cản sự tăng trưởng và đổi mới của doanh
nghiệp.

Lạm phát tăng thường là dấu hiệu cho thấy sự tăng trưởng của nền kinh tế sẽ
không bền vững, lãi suất sẽ tăng lên, khả năng thu lợi nhuận của doanh nghiệp bị hạ
thấp khiến giá cổ phiếu giảm. Lạm phát càng thấp thì càng có nhiều khả năng cổ
phiếu sẽ tăng giá và ngược lại.
Thông thường, giá cổ phiếu có xu hướng tăng khi nền kinh tế phát triển tốt và
có xu hướng giảm khi nền kinh tế giảm sút. Như vậy, nếu dự đoán được xu hướng
phát triển của nền kinh tế thì có thể dự đoán được xu hướng phát triển chung của
TTCK. Vì vậy việc dự đoán tình hình kinh tế để xem xét các ảnh hưởng của nó đến
giá chứng khoán cũng rất quan trọng đến các nhà đầu tư.
Lãi suất trái phiếu Chỉnh phủ được coi là lãi suất chuẩn, nhưng thay đổi trong
lãi suất trái phiếu Chính phủ sẽ làm ảnh hưởng tới giá chứng khoán, khi lãi suất
tăng làm cho giá của các loại chứng khoán giảm xuống, ngược lại lãi suất chuẩn
giảm lại làm cho giá của chứng khoán tăng lên.
2.2.2. Nguyên tắc hoạt động của TTCK
Nguyên tắc tập trung: Các giao dịch chứng khoán chỉ diễn ra trên sở giao
dịch và trên thị trường OTC dưới sự kiểm tra giám sát của cơ quan quản lý nhà
nước và các tổ chức tự quản.
Nguyên tắc trung gian: Nguyên tắc này có nghĩa là các giao dịch chứng
khoán được thực hiện thông qua tổ chức trung gian là các công ty chứng khoán.
Trên thị trường sơ cấp, các nhà đầu tư không mua trực tiếp của nhà phát hành mà
mua từ các nhà bảo lãnh phát hành. Trên thị trường thứ cấp, thông qua các nghiệp
vụ môi giới, kinh doanh, các công ty chứng khoán mua, bán chứng khoán giúp các
khách hàng, hoặc kết nối các khách hàng với nhau qua việc thực hiện các giao dịch
mua bán chứng khoán trên tài khoản của mình.

12


Nguyên tắc cạnh tranh: Theo nguyên tắc này, giá cả trên TTCK phản ánh
quan hệ cung cầu về chứng khoán và thể hiện tương quan cạnh tranh giữa các công

ty. Trên thị trường sơ cấp, các nhà phát hành cạnh tranh với nhau để bán chứng
khoán của mình cho các nhà đầu tư, các nhà đầu tư được tự do lựa chọn các chứng
khoán theo các mục tiêu của mình. Trên thị trường thứ cấp, các nhà đầu tư cũng
cạnh tranh tự do để tìm kiếm cho mình một lợi nhuận cao nhất, và giá cả được hình
thành theo phương thức đấu giá.
Nguyên tắc công bằng: Công bằng có nghĩa là mọi người tham gia thị trường
đều phải tuân thủ những qui định chung, được bình đẳng trong việc chia sẻ thông
tin và trong việc gánh chịu các hình thức xử phạt nếu vi phạm vào những qui định
đó.
Nguyên tắc công khai: Chứng khoán là loại hàng hoá trừu tượng nên TTCK
phải được xây dựng trên cơ sở hệ thống công bố thông tin tốt. Theo luật định, các tổ
chức phát hành có nghĩa vụ phải cung cấp thông tin đầy đủ theo chế độ thường
xuyên và đột xuất thông qua các phương tiện thông tin đại chúng, Sở giao dịch, các
công ty chứng khoán và các tổ chức có liên quan.
2.2.3. Các chỉ số kỹ thuật
Phần này sẽ trình bày về các chỉ số phân tích kỹ thuật được sử dụng trong đề
tài. Có rất nhiều loại chỉ số kỹ thuật, có chỉ số chỉ dùng giá đóng cửa để tính, và
ngược lại. Chúng đều có những quyết định mua bán khác nhau gọi là tín hiệu giao
dịch.
Đề tài sử dụng 5 loại chỉ số kỹ thuật cần thiết cho nghiên cứu này là SMA,
MACD, RSI, Stochatics, Williams %R và khối lượng giao dịch. Đây là những loại
chỉ số kỹ thuật được ưa chuộng nhất với các nhà đầu tư.
Mỗi chỉ số kỹ thuật đều có ưu và nhược điểm. Ví dụ, SMA và MACD là chỉ số
xu hướng, vì vậy chúng được dùng với những cổ phiếu tăng và giảm trong chu kỳ
dài hạn. Một cách khác, RSI, Stochastic, Williams %R là loại chỉ số dao động, nên
chúng dùng với những cổ phiếu mà giá nó lên xuống trong thời gian ngắn.

13



Đường trung bình MA
Đường trung bình làm phẳng hoạt động biến động giá theo thời gian. Tức
nMA là giá trị trung bình của giá đóng trong thời gian n. Giống như mọi chỉ số kỹ
thuật khác, MA dùng để dự báo giá chứng khoán trong tương lai. Nhìn vào độ dốc
cũng như sự giao nhau của các đường trung bình bạn cũng có thể đoán giá biến đổi
như thế nào. Đường trung bình làm phẳng hoạt động giá. Có nhiều đường trung
bình và mỗi đường có cách làm phẳng khác nhau. Nhìn chung, đường trung bình
phẳng hơn thì phản ánh mức biến động giá chậm hơn nhưng tránh được các xung
gây nhiễu và tránh sai lầm. Thế nhưng, do nó phản ánh chậm nên có thể làm ta nhận
ra các tín hiệu tốt bị trễ và bỏ lỡ các cơ hội. Đường trung bình ngắn ngày hơn thì
phản ánh giá nhanh hơn. Nhưng vì phản ứng nhanh hơn nên dễ bị các tín hiệu gây
nhiễu làm ảnh hưởng đến việc dự đoán xu hướng.
Có nhiều loại đường trung bình, trong đó hai loại thong dụng nhất là
SMA(Simple Moving Average) và EMA(Exponential Moving Average).

Hình 2.1. Minh họa đường trung bình động đơn giản SMA
(Nguồn: www.vietstock.com.vn)
Đường trung bình động phân kỳ hội tụ MACD
MACD đo độ chênh lệch giữa 2 đường EMA. Đường MACD có giá trị dương
cho biết đường EMA nhanh bên trên đường EMA chậm và đường MACD có giá trị
âm cho biết đường EMA nhanh bên dưới đường EMA chậm.
MACD là chỉ báo về xung lượng đơn giản và hiệu quả nhất đang được sử
dụng. Đường trung bình động biến 2 chỉ báo đi theo xu hướng – đường trung bình
động trở thành công cụ đo độ dao động xung lượng bằng cách lấy đường trung bình

14


động ngắn hơn trừ đi đường trung bình động dài hơn. Thông thường, người ta sử
dụng EMA(12) làm đường trung bình ngắn hạn và EMA(26) làm đường trung bình

dài hạn. Đồ thị của các giá trị MACD hiển thị giao động phản ánh tương quan giữa
trung bình động ngắn hạn và trung bình động dài hạn.
Thông thường đồ thị này được vẽ kèm với đồ thị trung bình động EMA – 9
của chính nó và đồ thị MACD – Histogram là hiệu số giữa MACD và EMA – 9 của
chính nó.
MACD được tính như sau:
• MACD(p)t = EMA(12) – EMA(26)

(2.1)

• Signal Line = EMA(9)

(2.2)

• MACD Histogram(p)t = MACD – Signal Line

(2.3)

So với các phương pháp phân tích khác, MACD thuộc về cả 2 phương pháp
phân tích xu thế và phân tích tương quan. MACD vừa chỉ ra xu thế của thị trường
vừa xác định các tín hiệu mua và bán trên cùng một đồ thị. Khoảng cách giữa trung
bình động ngắn hạn và trung bình động dài hạn thề hiện xu thế tăng hoặc giảm của
thị trường.
• Nếu trung bình động ngắn hạn lớn hơn dài hạn thì xu thế là tăng và MACD
dương. Nếu MACD dương và ngày cang lớn thì xu thế tăng ngày càng mạnh, phe
bò tót (phe tăng giá) ngày càng áp đảo.
• Nếu trung bình động ngắn hạn nhỏ hơn dài hạn thì xu thế là giảm và MACD
âm. Nếu MACD âm và ngày càng nhỏ thì xu thế giảm ngày càng mạnh, phe gấu
(phe giảm giá) ngày càng áp đảo.
• Nếu đường trung bình MACD = 0, nghĩa là MACD dài hạn gặp MACD

ngắn hạn thì tại đây bắt đầu có sự đổi chiều về xu hướng.
Ví dụ về MACD của giá cổ phiếu Công ty Cổ phần nhựa Đồng Nai – Doanh
nhiệp.

15


Hình 2.2. Minh họa đường trung bình động MACD
(Nguồn: www.vietstock.com.vn)
Đồ thị trên tại thời điểm (1), (2) đường MACD (màu xanh dương) giao cắt
đường zero, tại đây các đường trung bình EMA(12) và EMA(26) giao cắt nhau trên
đồ thị giá.
Trên đồ thị MACD, thì đường EMA(9) cũng được vẽ với đường màu tím, còn
MACD – Histogram được vẽ trên cùng đồ thị với vác cột màu xanh lá cây.
Đường chỉ số sức mạnh tương đối RSI
Chỉ số này dùng để nhận biết trạng thái mua vượt và bán vượt trên thị trường.
Miền giá trị của nó là [0,100].
RSI phản ánh quan hệ giữa mức tăng và mức giảm của cổ phiếu trong một
thời kỳ xác định bằng cách lấy tỷ số giá tăng trung bình và giá giảm trung bình. Gọi
n là số các phiên cần tính chỉ số trung bình.
RSI = 100 Trong đó: RS =

100
1+𝑅𝑆

𝐺𝑖á 𝑡ă𝑛𝑔 𝑡𝑟𝑢𝑛𝑔 𝑏ì𝑛ℎ 𝑡𝑟𝑜𝑛𝑔 𝑛 𝑛𝑔à𝑦
𝐺𝑖á 𝑔𝑖ả𝑚 𝑡𝑟𝑢𝑛𝑔 𝑏ì𝑛ℎ 𝑡𝑟𝑜𝑛𝑔 𝑛 𝑛𝑔à𝑦

16


(2.4)


×