Tải bản đầy đủ (.pdf) (94 trang)

Thực hiện dự đoán xu hướng giá của thị trường chứng khoán dựa trên những mẫu lặp tìm được bằng kỹ thuật time series

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.88 MB, 94 trang )

ĐẠI HỌC QUỐC GIA TP.HCM
TRƢỜNG ĐẠI HỌC BÁCH KHOA
-------------------

TRẦN TÚ ANH

THỰC HIỆN DỰ ĐOÁN XU HƢỚNG GIÁ
CỦA THỊ TRƢỜNG CHỨNG KHỐN DỰA
TRÊN NHỮNG MẪU LẶP TÌM ĐƢỢC
BẰNG KỸ THUẬT TIME-SERIES.
Chun ngành: HỆ THỐNG THÔNG TIN QUẢN LÝ

LUẬN VĂN THẠC SĨ

TP.HỒ CHÍ MINH,Tháng 12 năm 2011


ĐẠI HỌC QUỐC GIA TP.HCM
TRƢỜNG ĐẠI HỌC BÁCH KHOA
-------------------

TRẦN TÚ ANH

THỰC HIỆN DỰ ĐOÁN XU HƢỚNG GIÁ
CỦA THỊ TRƢỜNG CHỨNG KHỐN DỰA
TRÊN NHỮNG MẪU LẶP TÌM ĐƢỢC
BẰNG KỸ THUẬT TIME-SERIES.
Chun ngành: HỆ THỐNG THÔNG TIN QUẢN LÝ

LUẬN VĂN THẠC SĨ
GV hƣớng dẫn


TS. Võ Thị Ngọc Châu

TP.HỒ CHÍ MINH, Tháng 12 năm 2011


CƠNG TRÌNH ĐƢỢC HỒN THÀNH TẠI
TRƢỜNG ĐẠI HỌC BÁCH KHOA
ĐẠI HỌC QUỐC GIA TPHCM
Cán bộ hướng dẫn khoa học : TS. Võ Thị Ngọc Châu ...........................................
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Cán bộ chấm nhận xét 1 : TS.Bùi Hoài Thắng ......................................................
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Cán bộ chấm nhận xét 2 : TS.Nguyễn Đức Cường ................................................
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG
Tp.HCMngày07 tháng 01 năm 2012
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)
1. TS. Phạm Trần Vũ (CT)
2. TS. Võ Thị Ngọc Châu (UV)
3. TS. Bùi Hoài Thắng (PB1)
4. TS. Nguyễn Đức Cường (PB2)
5. TS. Phạm Quốc Trung (TK)
Xác nhận của Chủ tịch Hội đồng đánh giá LV và Bộ môn quản lý chuyên ngành
sau khi luận văn đã được sửa chữa (nếu có).

Chủ tịch Hội đồng đánh giá LV

TS Phạm Trần Vũ


Bộ môn quản lý chuyên ngành

PGS TS. Đặng Trần Khánh


TRƯỜNG ĐH BÁCH KHOA TP. HCM

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

PHÕNG ĐÀO TẠO SĐH

Độc lập - Tự do - Hạnh phúc

____________________

_______________________

Tp. HCM, ngày 2 tháng 12 năm 2011

NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên:Trần Tú Anh .............................................. Phái: Nữ ...................
Ngày, tháng, năm sinh:20/11/1985 ...................................... Nơi sinh: Vĩnh Long.
Chuyên ngành: Hệ Thống Thông Tin Quản Lý ................... MSHV: 09320837 ....
I. TÊN ĐỀ TÀI:

Thực hiện dự đoán xu hƣớng giá của thị trƣờng chứng khoán dựa
trên những mẫu lặp tìm đƣợc bằng kỹ thuật timeseries.
II. NHIỆM VỤ ĐỀ TÀI

 Nhiệm vụ chính: Sử dụng kỹ thuật tìm mẫu lặp có kết hợp bài tốn gom cụm

cho chuỗi dữ liệu thời gian để dự đoán xu hướng giá cổ phiếu trong thị trường
chứng khoán Việt Nam.


Nhiệm vụ chi tiết:
o Tìm hiểu lý thuyết ra quyêt định.
o Tìm hiểu các phương pháp thực hiện dự đoán giá cho cổ phiếu đã được thực

hiện trên thế giới.
o Tìm hiểu các hướng nghiên cứu tìm mẫu lặp trong chuỗi dữ liệu thời gian

chọn ra hướng thích hợp để áp dụng vào thị trường Việt Nam.
o Tìm hiểu và vận dụng kỹ thuật khai phá dữ liệu clustering để tối ưu giá trị dự

đoán.


o Tìm hiểu và khai thác phần phân tích kỹ thuật trong thị trường chứng khoán,

ý nghĩa các giá trị chỉ số kỹ thuật.
o Để mang lại ý nghĩa thực tiễn cho luận văn, một chương trình dự đốn xu

hướng giá cổ phiếu cần được xây dựng để hỗ trợ người tham gia thị trường có
thêm thơng tin tham khảo cho quyết định giao dịch của mình.
III. NGÀY GIAO NHIỆM VỤ:14/02/2011
IV. NGÀY HOÀN THÀNH NHIỆM VỤ: 02/12/2011
V. CÁN BỘ HƢỚNG DẪN: TS. Võ Thị Ngọc Châu
CÁN BỘ HƢỚNG DẪN
(Họ tên và chữ ký)


TS. Võ Thị Ngọc Châu

CHỦ NHIỆM BỘ MÔN
QUẢN LÝ CHUYÊN NGÀNH
(Họ tên và chữ ký)

PGS TS. Đặng Trần Khánh

KHOA QL CHUYÊN NGÀNH
(Họ tên và chữ ký)

………………………………..


LỜI CÁM ƠN
Để hồn thành luận văn tốt nghiệp, tơi đã nhận được sự hướng dẫn tận tình
cùng nhiều kiến thức và kinh nghiệm quý báu được truyền đạt từ TS Võ Thị Ngọc
Châu. Xin gửi lời cảm ơn chân thành và sâu sắc nhất đến cô.
Xin chân thành cảm ơn quý thầy cô trong khoa Khoa học và kỹ thuật máy tính
trường Đại học Bách Khoa TP.Hồ Chí Minh đã cung cấp kiến thức và hướng dẫn tôi
suốt quá trỉnh học.
Cảm ơn các anh chị và các bạn học viên lớp MIS K2009 đã chi sẻ tài liệu và
kiến thức trong suốt q trình học tập.
Tơi xin cảm ơn gia đình đã động viên và tạo mọi điều kiện tốt nhất để tơi có
thể tiếp tục theo đuổi việc học tập.
Tp.HCM, ngày 01 tháng 12 năm 2011
Trần Tú Anh

Trangii



TĨM TẮT
Mục tiêu của đề tài này là dự đốn xu hướng giá của các cổ phiếu trong thị
trường chứng khoán Việt Nam. Kết quả của việc dự đoán là khả năng xảy ra của xu
hướng trong tương lai dùng để làm thơng tin tham khảo cho q trình ra quyết định
giao dịch của nhà đầu tư.
Đề tài thực hiện kết hợp kỹ thuật khai phá chuỗi dữ liệu thời gian và kỹ thuật
gom cụm để dự đoán xu hướng giá của cổ phiếu trong tương lai. Dữ liệu sử dụng
trong quá trình hiện thực bao gồm dữ liệu giá, giá trị giao dịch và các chỉ số kỹ thuật.
Để nâng cao tính thực tiễn cho đề tài, một chương trình hỗ trợ ra quyết định cho nhà
đầu tư đã được phát triển.
Kết quả thực nghiệm kiểm tra tất cả các cổ phiếu trong thị trường chứng khoán
Việt Nam cho thấy nếu xu hướng giá được xác định cho một cổ phiếu thì khả năng
đúng của xu hướng giá được dự đoán là tồn tại.

Trangiii


MỤCLỤC
LỜI CÁM ƠN ......................................................................................................... ii
TÓM TẮT .............................................................................................................. iii
MỤCLỤC ............................................................................................................... iv
DANH MỤC CÁC TỪ VIẾT TẮT....................................................................... vii
DANH MỤC BẢNG BIỂU .................................................................................. viii
DANH MỤC HÌNH ẢNH ...................................................................................... ix
CHƢƠNG 1 ..............................................................................................................1
TỔNG QUAN VỀ ĐỀ TÀI ......................................................................................1
1.

Phát biểu vấn đề ............................................................................................1


2.

Phạm vi nghiên cứu ......................................................................................3

3.

Mục tiêu đề tài ..............................................................................................3

4.

Ý nghĩa đề tài ................................................................................................3

5.

Cấu trúc luận văn ..........................................................................................4

CHƢƠNG 2 ..............................................................................................................5
PHƢƠNG PHÁP NGHIÊN CỨU ...........................................................................5
1.

Phương pháp nghiên cứu ...............................................................................5
2. Các bước thực hiện đề tài ...............................................................................7
2.1 Cơ sở lý thuyết ............................................................................................7
2.2 Các cơng trình nghiên cứu ...........................................................................7
2.3 Khảo sát dữ liệu sử dụng trong đề tài ...........................................................7
2.4 Thực hiện chương trình ................................................................................7
2.5 Tổng kết thơng tin hỗ trợ ra quyết định .........................................................8

CHƢƠNG 3 ..............................................................................................................9

CƠ SỞ LÝ THUYẾT ...............................................................................................9
1.

Cơ sở lý thuyết ..............................................................................................9
1.1 Lý thuyết ra quyết định .................................................................................9
1.2 Phân tích kỹ thuật trong thị trường chứng khốn........................................ 10
1.3 Tìm mẫu lặp trong dữ liệu chuỗi thời gian ................................................. 17
1.4 Giới thiệu clustering .................................................................................. 23
Trangiv


CHƢƠNG 4 ............................................................................................................ 28
CÁC CƠNG TRÌNH LIÊN QUAN ....................................................................... 28
1.

Các kết quả nghiên cứu liên quan ................................................................ 28

2.

Tóm tắt ....................................................................................................... 30

CHƢƠNG 5 ............................................................................................................ 32
DỰ ĐOÁN XU HƢỚNG GIÁ CỦA CỔ PHIẾU VÀ CHƢƠNG TRÌNH HỖ
TRỢ RA QUYẾT ĐỊNH ........................................................................................ 32
1.

Dự đoán xu hướng giá của cổ phiếu ............................................................ 32
1.1 Nhập dữ liệu ............................................................................................. 33
1.2 Xử lý dữ liệu .............................................................................................. 34
1.3 Tính tốn các chỉ số kỹ thuật .....................................................................34

1.4 Nhập thơng số để thực hiện tìm kiếm......................................................... 34
1.5 Thực hiện tìm kiếm ................................................................................... 35
1.6 Xuất kết quả ............................................................................................... 38
1.7 Clustering ...................................................................................................38
1.8 Hiển thị kết quả ......................................................................................... 38
1.9 Chức năng kiểm tra chương trình ............................................................... 38
1.10 Chức năng kiểm tra chương trình .............................................................. 41

2.

Hiện thực chương trình ............................................................................... 41
2.1 Nhập dữ liệu ............................................................................................... 43
2.2 Xử lý dữ liệu và tính tốn các chỉ số kỹ thuật ............................................ 44
2.3 Thực hiện tìm kiếm xu hướng .....................................................................45
2.4 Kiểm tra độ chính xác của chương trình .................................................... 51

3. Kết luận........................................................................................................... 58
CHƢƠNG 6 ............................................................................................................ 59
THỰC NGHIỆM....................................................................................................59
1. Tổng quan về thị trường chứng khoán Việt Nam .............................................. 59
1.1 Hình thành ..................................................................................................59
1.2 Quy tắc khớp lệnh ...................................................................................... 61
1.3 Quy tắc giao dịch ....................................................................................... 61

Trangv


2. Thực nghiệm ...................................................................................................62
2.1 Các trường hợp kiểm tra ............................................................................ 62
2.2 Kiểm tra tổng quát ..................................................................................... 62

2.3 Kiểm tra theo ngành .................................................................................. 65
2.4 Kiểm tra trên một số cổ phiếu ....................................................................66
2.5 Lấy mẫu một số cổ phiếu ........................................................................... 70
3. Kết luận........................................................................................................... 75
CHƢƠNG 7 ............................................................................................................ 77
KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................ 77
1. Những kết quả đạt được và đóng góp của luận văn ........................................... 77
2. Kiến nghị hướng mở rộng của đề tài .................................................................78
TÀI LIỆU THAM KHẢO ..................................................................................... 79

Trangvi


DANH MỤC CÁC TỪ VIẾT TẮT
Thuật ngữ tiếng Anh

Thuật ngữ tiếng Việt

Từ viết tắt

Commodity Channel Index

Chỉ số kênh hàng hóa

CCI

Discrete Wavelet transform

Biến đổi Wavelet rời rạc


DWT

Enumeration of Motifs through
Matrix Approximation
Exponential Moving Average
Money Flow Index
Motif tracking algorithm

EMMA
Đường trung bình dịch
chuyển
lũy thừa
Chỉ số dòng tiền tệ

EMA
MFI
MTA

Piecewise aggregate approximation

Chỉ số biến động chênh lệch
hội tụ trung bình trượt
Đường trung bình dịch
chuyển
Xấp sỉ gộp từng đoạn

Rate of change

Tỷ lệ thay đổi


ROC

Relative Strength Indicator

Chỉ số sức mạnh tương đối
Đường trung bình dịch
chuyển
đơn giản
Xấp sỉ gộp ký hiệu hóa

RSI

Moving Average
Convergence-Divergence
Moving Averages

Simple Minving Average
Symbolic aggregate approXimation

MACD
MA
PAA

SMA
SAX

Trangvii


DANH MỤC BẢNG BIỂU

Bảng 1: Tóm tắt các cơng trình nghiên cứu liên quan. .............................................. 31
Bảng 2: Nhóm cổ phiếu có độ chính xác 100% ........................................................ 63
Bảng 3: Nhóm cổ phiếu có độ chính xác trên 50% ................................................... 64
Bảng 4: So sánh thời gian thực nghiệm của nhóm cổ phiếu có độ chính xác dưới 50%
.................................................................................................................................65
Bảng 5: Kết quả thực nghiệm theo ngành .................................................................65
Bảng 6: Kiểm tra một số cổ phiếu – Windowing 5, Scale 6, R 3............................... 66
Bảng 7: Kiểm tra một số cổ phiếu – Thời gian ngắn Windowing 5, Scale 6, R 3 ....67
Bảng 8: Kiểm tra một số cổ phiếu – Windowing 2, Scale 3, R 1............................... 67
Bảng 9: Kiểm tra một số cổ phiếu – Windowing 10, Scale 11, R 3 ........................... 68
Bảng 10: Kiểm tra một số cổ phiếu – Windowing 5, Scale 6, R 2............................. 68
Bảng 11: Kiểm tra một số cổ phiếu – Windowing 5, Scale 6, R 1............................. 69
Bảng 12: Kiểm tra một số cổ phiếu – Windowing 14, Scale 15, R 5 ......................... 69
Bảng 13: Kiểm tra một số cổ phiếu – Windowing 14, Scale 16, R 5 ......................... 70
Bảng 14: Windowing=2, Scale=3 ............................................................................. 71
Bảng 15: Windowing=2, Scale=4 ............................................................................. 71
Bảng 16: Windowing=5, Scale=6 ............................................................................. 72
Bảng 17: : Windowing=5, Scale=7 ........................................................................... 72
Bảng 18: : Windowing=10, Scale=11 ....................................................................... 73
Bảng 19: Windowing=10, Scale=12 ......................................................................... 73
Bảng 20: Windowing=14, Scale=15 ......................................................................... 74
Bảng 21: Windowing=14, Scale=16 ......................................................................... 74

Trangviii


DANH MỤC HÌNH ẢNH

Hình 1: Quy trình thực hiện nghiên cứu của đề tài.....................................................6
Hình 2: : Hai motif có biên độ giao động khác nhau................................................. 20

Hình 3: Minh họa kỹ thuật phân nhóm. ....................................................................23
Hình 4: Cấu trúc data matrix. ................................................................................... 24
Hình 5 : Cấu trúc dissimilarity matrix. .....................................................................24
Hình 6 : Lưu đồ thực hiện dự đoán xu hướng giá của cổ phiếu. ................................ 33
Hình 7 : Hàm tìm mẫu lặp tương tự. ........................................................................ 36
Hình 8: Hàm so trùng ............................................................................................... 37
Hình 9: Hàm co giãn ................................................................................................ 37
Hình 10: Hàm so sánh xu hướng và tính độ lệch. ..................................................... 40
Hình 11: Chương trình dự đốn xu hướng giá cổ phiếu ............................................ 42
Hình 12: Nhập dữ liệu .............................................................................................. 43
Hình 13: Tính tốn các chỉ số kỹ thuật .....................................................................44
Hình 14: Thực hiện tìm kiếm xu hướng....................................................................45
Hình 15: Đồ thị kết quả dự đốn xu hướng............................................................... 47
Hình 16: Kết quả dự đốn xu hướng......................................................................... 48
Hình 17: Dữ liệu tham khảo về giá sửa dụng trong dự đốn xu hướng ..................... 49
Hình 18: Dữ liệu tham khảo chỉ số kỹ thuật cho kết quả dự đoán xu hướng ............. 50
Hình 19: Kiểm tra độ chính xác của chương trình .................................................... 51
Hình 20: Hiển thị kết quả kiểm tra độ chính xác của chương trình trong trường hợp
kiểm tra một cổ phiếu............................................................................................... 53
Hình 21: Kiểm tra độ chính xác của chương trình – Nhập nhiều cổ phiếu ................ 54
Hình 22: Kiểm tra độ chính xác của chương trình – Kết quả kiểm tra nhiều cổ phiếu
.................................................................................................................................55
Hình 23: Kiểm tra độ chính xác của chương trình – Kết quả kiểm tra tất cả cổ phiếu
trên thị trường .......................................................................................................... 56
Hình 24- Kết quả kiểm tra xuất ra Excel ..................................................................57
Trangix


CHƢƠNG 1
TỔNG QUAN VỀ ĐỀ TÀI

1. Phát biểu vấn đề
Thị trường chứng khoán là một bộ phận quan trọng của Thị trường vốn
nhằm huy động những nguồn vốn tiết kiệm nhỏ trong xã hội tập trung thành nguồn
vốn lớn tài trợ cho doanh nghiệp, các tổ chức kinh tế và chính phủ để phát triển sản
xuất, tăng trưởng kinh tế hay cho các dự án đầu tư. Đó là nơi tiến hành hoạt động
giao dịch mua bán các loại cổ phiếu và từ việc mua bán sẽ tạo ra lợi nhuận cho
người tham gia thị trường. Điều quan trọng khi tham gia thị trường chứng khoán là
phải quyết định đúng thời điểm mua và bán để có lợi nhuận. Tuy nhiên thị trường
chứng khoán là một thị trường năng động và giá ln biến động. Do đó việc dự
báo giá cổ phiếu luôn là vấn đề hấp dẫn và luôn được quan tâm của các nhà đầu tư
để ra quyết định mua hay bán đúng thời điểm. Có hai phương pháp tiếp cận thơng
thường là phân tích cơ bản và phân tích kỹ thuật.
 Phân tích cơ bản là dựa vào các số liệu thống kê của kinh tế vĩ mô như lãi
suất, tiền cung cấp, tỷ lệ lạm phát, tỷ giá hối đối và tình hình tài chính cơ
bản của doanh nghiệp để quyết định mua hoặc bán cổ phiếu đó.
 Phân tích kỹ thuật dựa trên chuỗi dữ liệu lịch sử giá giao dịch của cổ phiếu
kết hợp các mơ hình tốn để dự đốn xu hướng giá.
Trong hai phương pháp thường được sử dụng này, thì phương pháp phân
tích kỹ thuật là thích hợp cho việc đầu tư ngắn hạn có khả năng mang lại lợi nhuận
cao và tất nhiên rủi ro cũng cao. Vấn đề cơ bản của phân tích kỹ thuật đó chính là
phân tích các xu hướng giá để biết tâm lý của nhà đầu tư, tại thời điểm như thế nào
mà nhà đầu tư thực hiện mua hoặc bán. Nhìn chung tâm lý của con người thường ít
thay đổi. Thế nên nếu chúng ta có thể nắm bắt được quy luật những hành vi giao
dịch trong quá khứ để có thể áp dụng vào những trường hợp tương tự trong hiện tại
thì ta sẽ dự đoán được hành vi trong tương lai của các nhà đầu tư. Đó chính là xu
hướng giá sẽ diễn ra.Ngồi ra một số nhà đầu tư cịn sử dụng Kinh dịch của Trung
1


Hoa để dự đốn, tuy nhiên phương pháp này khơng có cơ sở khoa học để chứng

minh đúng hay sai.
Tóm lại dự đoán giá và xu hướng giá cổ phiếu luôn là mối quan tâm của các
nhà đầu tư và chủ đề nghiên cứu việc thực hiện dự đốn ln là đề tài hấp dẫn.
Trên thế giới đã có những nghiên cứu dự đoán xu hướng giá của cổ phiếu
bằng nhiều phương pháp khác nhau như Support vector machine, Fuzzy, k-NN,
text mining trên những loại dữ liệu như giá cổ phiếu, chỉ số kỹ thuật, thông tin kinh
tế, tin tức trên báo chí cho những thị trường chứng khốn khác nhau. Tuy nhiên
hiện chưa có nghiên cứu nào thực hiện dự đoán trên thị trường Việt Nam dựa trên
khai phá dữ liệu chuỗi thời gian có kết hợp các chỉ số kỹ thuật.
Vì lý do đó đề tài tơi chọn là: “Thực hiện dự đoán xu hướng giá của thị
trường chứng khốn dựa trên những mẫu lặp tìm được bằng kỹ thuật time-series.”.
Trong đề tài này tôi chọn theo hướng dự đốn giá của cổ phiếu dựa trên việc tìm ra
những hành vi đã xảy ra trong quá khứ. Để kết quả chính xác hơn, q trình thực
hiện sẽ kết hợp với các chỉ số kỹ thuật rút ra từ giá, khối lượng giao dịch và giá trị
giao dịch. Việc phân tích khối lượng giao dịch là một cơng việc cần thiết vì chức
năng cơ bản nhất của phương pháp phân tích khối lượng là nhằm khẳng định các
tín hiệu về giá cả. Giá trị giao dịch là tổng giá trị của cổ phiếu đã được giao dịch
thành công dùng để đánh giá thị trường và được tính tốn bằng cách nhân khối
lượng giao dịch với giá giao dịch.
Đề tài này tập trung vào vấn đề dự đoán xu hướng giá cổ phiếu trong thị
trường Việt Nam. Để thực hiện dự đoán xu hướng giá của cố phiếu đề tài chọn
phương pháp tìm kiếm tương tự trên chuỗi dữ liệu thời gian là giá của cổ phiếu. Để
nâng cao độ chính xác của kết quả dự đốn, đề tài quyết định thực hiện kết hợp sử
dụng giá trị giao dịch của cổ phiếu và các chỉ số kỹ thuật qua phương pháp gom
cụm (clustering) trên dữ liệu chuỗi thời gian.Ngoài ra, để nâng cao tính thực tiễn
cho đề tài, một chương trình hỗ trợ ra quyết định cho nhà đầu tư đã được phát
triển. Chương trình có khả năng dự đoán xu hướng giá của cổ phiếu giúp nhà đầu
tư thực hiện quyết định giao dịch trong hiện tại để đạt lợi nhuận cao.
2



2. Phạm vi nghiên cứu
Đề tài này nghiên cứu việc dự đoán xu hướng giá của các cổ phiếu trên thị
trường chứng khoán và thị trường chứng khoán trong phần minh họa là thị trường
chứng khoán Việt Nam. Dữ liệu sử dụng trong quá trình hiện thực bao gồm dữ liệu
giá, giá trị giao dịch và các chỉ số kỹ thuật. Phương pháp thực hiện gồm tìm kiếm
mẫu lặp(motif) trong chuỗi dữ liệu thời gian và khai phá dữ liệu thời gian với tác
vụ gom cụm.

3. Mục tiêu đề tài
Dự đoán được xu hướng giá của cổ phiếu thị trường Việt Nam là mục tiêu chính
của đề tài. Để đạt được mục tiêu này, đề tài được thực hiện với những phần công
việc sau:
 Áp dụng kết hợp kỹ thuật tìm motif trong chuỗi dữ liệu thời gian và kỹ thuật
clustering để dự đoán xu hướng giá của cổ phiếu trong tương lai dựa trên
những xu hướng đã xảy ra trong dữ liệu q khứ.
 Ngồi việc sử dụng thơng tin về giá của chứng khốn cịn kết hợp với khối
lượng giao dịch và giá trị giao dịch để tăng độ chính xác của việc thực hiện
xu dự đốn hướng giá cho quá trình tìm kiếm trong quá khứ.
 Một chương trình hướng người dùng được xây dựng để hỗ trợ việc ra quyết
định cho nhà đầu tư vào thị trường chứng khốn. Chương trình có khả năng
dự đốn xu hướng giá trong tương lai với thời gian là số ngày mà người
dùng mong muốn dự đoán.

4. Ý nghĩa đề tài
Về ý nghĩa khoa học, luận văn đã linh hoạt kết hợp kỹ thuật tìm kiếm motif
trong chuỗi dữ liệu thời gian và kỹ thuật clustering để tối ưu hóa kết quả dự đoán
xu hướng giá của các cổ phiếu trên thị trường chứng khoán.Kết quả thực nghiệm
cho thấy nếu xu hướng giá có thể được xác định cho một cổ phiếu thì khả năng
đúng của xu hướng giá được dự đốn là tồn tại. Ngồi ra luận văn cũng xem xét

những đặc điểm riêng biệt của thị trường chứng khốn Việt Nam để xác định các
giá trị thơng số phù hợp và cải thiện kết quả dự đốn chính xác hơn. So với các
cơng trình nghiên cứu liên quan khác, luận văn đã đề xuất được một phương pháp
3


khả thi theo hướng tiếp cận mới với khai phá dữ liệu chuỗi thời gian và các chỉ số
kỹ thuật để dự đoán xu hướng giá của các cổ phiếu trên thị trường chứng khốn.
Kết quả đạt được có thể được sử dụng làm tham khảo để hỗ trợ ra quyết định trong
giao dịch chứng khoán.
Về ý nghĩa thực tiễn, đầu tiên đó là nhận biết khả năng dự đốn trước giá
của cổ phiếu trong thị trường Việt Nam. Sau đó là hình thành một chương trình hỗ
trợ ra quyết định cho người tham gia vào thị trường chứng khoán. Khả năng dự báo
xu hướng giá cổ phiếu của chương trình có thể giúp nhà đầu tư ra những quyết
định hợp lý cho những thời điểm khác nhau mà nhà đầu tư có thể lựa chọn cho phù
hợp với ngữ cảnh cụ thể.

5. Cấu trúc luận văn
Luận văn bao gồm 7 chương và được trình bày như sau:
 Chương 1: Tổng quan về đề tài
 Chương 2: Phương pháp nghiên cứu
 Chương 3: Cơ sở lý thuyết
 Chương 4: Các cơng trình liên quan
 Chương 5: Triển khai
 Chương 6: Đánh giá
 Chương 7: Kết luận và kiến nghị

4



CHƢƠNG 2
PHƢƠNG PHÁP NGHIÊN CỨU
Chương 2 sẽ trình bày phương pháp nghiên cứu được sử dụng để thực hiện đề tài.

1. Phƣơng pháp nghiên cứu
Mong muốn dự đoán được xu hướng giá của thị trường luôn là niềm mong
ước của các nhà đầu tư. Cho đến nay nhiều phương pháp dự báo đã được đưa ra
cho nhiều thị trường chứng khốn trên thế giới. Trong đó phương pháp cơ bản nhất
là tính giá trung bình của những ngày cuối để dự đốn giá cho ngày tiếp theo.
Ngồi ra bằng thực nghiệm quan sát, ta cũng nhận ra một số mẫu biến động giá
thường được lặp lại để dự đoán giá cho ngày tiếp theo khi những ngày trước đó có
hình dạng biến động gần giống những mẫu đã biết. Trong phạm vi đề tài này, tơi
thực hiện tìm kiếm những mẫu lặp lại trong biểu đồ giá của các loại chứng khoán
để dự đoán xu hướng giá.
Mẫu lặp sẽ được chia ra làm hai phần tiền tố(prefix) và hậu tố(suffix).
Trong đó prefix là đoạn chuỗi con từ khoảng thời gian trước đó mà ta chọn cho tới
hiện tại và suffix là khoảng thời gian sau hiện tại mà ta muốn dự đốn. Q trình
tìm kiếm trong q khứ sẽ tìm ra những mẫu lặp tương tự như prefix. Sau đó xu
hướng của suffix cần dự đoán sẽ tương ứng với những suffix của những mẫu lặp
trong quá khứ. Do có nhiều mẫu lặp được tìm thấy tương ứng có thể sẽ có nhiều
dạng suffix khác nhau, nên ta sẽ thực hiện phân nhóm những mẫu lặp này lại dựa
trên những chỉ số kỹ thuật tính được từ diễn biến thay đổi của mẫu cần tìm và các
chuỗi con. Những suffix nằm chung nhóm với suffix cần dự đốn dựa trên sự gần
giống nhau về các chỉ số kỹ thuật thì có khả năng đó là suffix có xu hướng gần với
xu hướng thực tại nhất.
Chương trình sẽ thực hiện chạy thử nghiệm trên tập dữ liệu của thị trường
chứng khoán Việt Nam trong khoảng thời gian từ năm 2000 đến 2011. Sau đó
chương trình thực hiện phân tích kết quả tìm được kết hợp với ý nghĩa của chỉ số
5



kỹ thuật để đánh giá độ tin cậy của chương trình trong việc hỗ trợ ra quyết định
giao dịch.
Trong luận văn này, tơi thực hiên quy trình nghiên cứu được trình bày trong
Hình 1.

2.1. Cơ sở lý thuyết
(Chương 3)

2.2. Các cơng trình
nghiên cứu
(Chương 4)

2.3. Khảo sát dữ liệu thị
trường chứng khốn Việt
Nam.
(Chương 6, phần 1)

Thực hiện giải thuật tìm
kiếm mẫu lặp

Thực hiện clustering trên
những chuỗi con và những
mẫu lặp tìm được

2.4. Chương trình hỗ trợ
ra quyết định dựa trên
dự đốn xu hướng giá
của thị trường chứng
khoán.

(Chương 5)

Đánh giá độ tin cậy của
nhóm mẫu dữ liệu với thực
tế

2.5. Thơng tin hỗ trợ ra
quyết định.
(Chương 6, phần 3)

Hình 1: Quy trình thực hiện nghiên cứu của đề tài

6


2. Các bƣớc thực hiện đề tài
2.1 Cơ sở lý thuyết
Tìm hiểu sơ sở lý thuyết của các kiến thức liên quan để hình thành cơ sở
nền tảng thực hiện của đề tài
-

Lý thuyết ra quyết định

-

Giải thuật phù hợp để tìm mẫu lặp cho dữ liệu thị trường chứng khốn.

-

Các phương pháp thực hiện clustering.


-

Các tiêu chí trong phân tích kỹ thuật để ra quyết định trong thị trường chứng
khốn.

2.2 Các cơng trình nghiên cứu
Qua q trình tìm hiểu các cơng trình nghiên cứu với nhiều phương pháp
thực hiện dự đoán giá cổ phiếu khác nhau, đề tài chọn ra một phương pháp kết hợp
kỹ thuật tìm kiếm mẫu lặp trong chuỗi dữ liệu thời gian và kỹ thuật clustering để
tìm ra xu hướng giá trong tương lai của cổ phiếu.Kết quả mong muốnđạt được là
xu hướng giá được dự đốn gần đúng nhất. So với các cơng trình nghiên cứu liên
quan, cách tiếp cận của luận văn này là một thử nghiệm mới cho việc dự đoán
trong lĩnh vực đầu tư chứng khoán.
2.3 Khảo sát dữ liệu sử dụng trong đề tài
Dữ liệu sử dụng trong lĩnh vực dự đoán giá và xu hướng giá cổ phiếu khá đa
dạng, bao gồm dữ liệu giá, thơng tin phân tích kỹ thuật, dữ liệu kinh tế vĩ mô và cả
những thơng tin xuất hiện trên báo. Trong đó đề tài chọn xem xét dữ liệu về giá cổ
phiếu, kết hợp xem xét dữ liệu về khối lượng giao dịch, giá trị giao dịch và các chỉ
số trong phân tích kỹ thuật. Cho phần thực nghiệm của đề tài, dữ liệu về các cổ
phiếu trên thị trường chứng khoán Việt Nam được tìm hiểu và sử dụng. Các đặc
điểm của thị trường chứng khoán Việt Nam cũng được khảo sát.
2.4Thực hiện chƣơng trình
-

Tìm mẫu lặp theo phương pháp biến đổi co giãn khơng thay đổi tính chất
(Uniform Scaling).
7



-

Thực hiện clustering theo phương pháp gom cụm kỳ vọng – cực đại hóa
(Expectation – Maximization (EM)).

-

Xây dựng chương trình hỗ trợ ra quyết định đầu tư chứng khoán dựa trên xu
hướng giá dự đốn.

2.5 Tổng kết thơng tin hỗ trợ ra quyết định
-

Đánh giá độ tin cậy của chương trình với kết quả dự đốn được.

-

Nhận xét những yếu tố ảnh hưởng đặc biệt của thị trường Việt Nam lên kết

-

quả dự đốn.
Những yếu tố cải tiến nếu có.

8


CHƢƠNG 3
CƠ SỞ LÝ THUYẾT
Chương 3 giới thiệu các lý thuyết liên quan về lý thuyết ra quyết định, giải

thuật tìm kiếm mẫu lặp trong dữ liệu thời gian, phương pháp thực hiện clustering
và phân tích kỹ thuật trong thị trường chứng khoán.

1. Cơ sở lý thuyết
1.1 Lý thuyết ra quyết định
1.1.1 Định nghĩa ra quyết định
Quyết định là việc ra sự lựa chọn từ hai hay nhiều lựa chọn thay thế. Mục
đích ra quyết định có thể phân thành hai dạng: giải quyết vấn đề và tìm kiếm cơ
hội.
Lý thuyết quyết định là một phương pháp phân tích có tính hệ thống dùng
để nghiên cứu việc tạo ra các quyết định.
Để có quyết định tốt nhất,chúng ta cần dựa trên:
-

Lý luận

-

Tất cả các số liệu có sẵn

-

Tất cả mọi giải pháp có thể có

-

Phương pháp định lượng

1.1.2 Các bƣớc trong quá trình ra quyết định
Quá trình ra quyết định được tiến hành theo sáu bước sau

-

Xác định rõ vấn đề cần giải quyết

-

Liệt kê tất cả những phương án có thể

-

Nhận ra tất cả các tình huống hay trạng thái

-

Ước lượng tất cả các lợi ích chi phí của từng phương án riêng về trạng thái

-

Lựa chọn một mô hình tốn học trong phương pháp định lượng để tìm ra
giải pháp tối ưu.
9


-

Áp dụng mơ hình để tìm ra lời giải và dựa vào đó để ra quyết định.

1.1.3 Các mơi trƣờng ra quyết định
Có ba loại mơi trường ra quyết định như sau:
-


Ra quyết định trong điều kiện chắc chắn
Trong môi trường này, chúng ta biết chắc chắn trạng thái nào sẽ xảy ra. Do
đó chúng ta dễ dàng nhanh chóng ra quyết định.

-

Ra quyết định trong điều kiện rủi ro
Trong môi trường này, chúng ta biết được xác suất xảy ra của mỗi trạng
thái.

-

Ra quyết định trong điều kiện không chắc chắn.
Trong môi trường này, chúng ta không biết được xác suất xảy ra của mỗi
trạng thái hoặc không biết các dữ liệu liên quan đến vấn đề cần giải quyết.

1.2 Phân tích kỹ thuật trong thị trƣờng chứng khốn
Trong đầu tư chứng khốn, phân tích kỹ thuật là một phương pháp được các
nhà đầu tư coi trọng và sử dụng để giúp nhà đầu tư xác định thời điểm mua, bán và
đưa ra các quyết định đầu tư hợp lý trong ngắn hạn.
Phân tích kỹ thuật nhằm chỉ ra tình trạng hiện tại của thị trường hay của mỗi
cổ phiếu để dự báo biến động của giá bằng cách dựa trên những hình mẫu kỹ thuật
đã xuất hiện trong q khứ và áp dụng lại khi có mơ hình tương tự xuất hiện. Điều
này dựa trên giả thuyết là những kiến thức đã có về giá và hình mẫu đồ thị trong
quá khứ sẽ được sử dụng cho việc tham khảo để xác định xu hướng của giá trong
tương lai đối với mỗi thị trường cụ thể.
Một số mẫu biểu đồ thường xuất hiện trong biểu đồ giá chứng khoán được
quan sát thấy như sau:
 Biểu đồ dạng đường - line chart

 Biểu đồ dạng then chắn - Bar chart
 Biểu đồ dạng nến - Candlestick chart
 Đường xu thế, kênh xu thế, giải giao dịch - mức hỗ trợ và kháng cự.
10


Các mẫu biểu đồ:
 Chart Patterns
 Mơ hình hai đáy - Double bottom
 Mơ hình hai đỉnh - Double top
 Mơ hình hội tụ giảm Falling Wedge
 Mơ hình hội tụ tăng Raising Wedge
 Mơ hình đáy vịng cung - Rounding bottom
 Mơ hình cờ bay

Một số chỉ số thƣờng đƣợc dùng trong phân tích kỹ thuật để dự
đốn xu hƣớng giá
a.

Money Flow Index (MFI) - chì số dịng tiền tệ
MFI là một chỉ số xung. MFI thiên về việc đặt trọng số của khối lượng giao

dịch vào trong nó. Do đó, MFI là một cơng cụ hữu hiệu cho việc đo lường dòng
tiền vào và ra khỏi một cổ phiếu. MFI so sánh “dòng tiền dương” với “dòng tiền
âm” để tạo ra một chỉ số và chỉ số này được dùng để so sánh với giá để xác định xu
hướng hiện tại là mạnh hay yếu. MFI được đo lường trong khoảng 0-100 và
thường dùng khoảng thời gian tính tốn là 14 ngày. Nếu giá tiêu biểu hơm nay lớn
hơn giá hơm qua thì nó được xem là dịng tiền dương. Trong một khoảng thời gian
trung bình 14 ngày, tổng số của tất cả các dòng tiền dương của 14 ngày này gọi là
dòng tiền dương. Và tương tự cho dòng tiền âm. MFI dựa vào tỷ số giữa dịng tiền

dương/âm.
Cơng thức tính như sau:
Giá tiêu biểu = (giá cao + giá thấp + giá đóng cửa)/3
Dịng tiền = giá tiêu biểu*khối lƣợng giao dịch
Tỷ số dòng tiền = dòng tiền dƣơng/dòng tiền âm
MFI = 100 – (100/(1+tỷ số dòng tiền))
11


MFI phụ thuộc cùng lúc vào 2 biến số giá và khối lượng, dùng để đo lường
luồng tiền ra/vào với một cổ phiếu cụ thể trong một thời kỳ (thường là 14 ngày
hoặc 10 ngày tùy thói quen sử dụng và từng cổ phiếu). MFI có giá trị trong khoảng
từ 0 tới 100.
Xác định tình trạng quá mua/quá bán. MFI dưới 20 cho dấu hiệu cổ phiếu
đang trong hiện trạng quá bán và ngược lại trên 80 là quá mua. Với chức năng này
MFI cảnh báo về sự hưng phấn hay quá bi quan của thị trường.
b. Relative Strength Indicator (RSI) – Chỉ số sức mạnh tƣơng đối
Chỉ số RSI giải quyết vấn đề của những dịch chuyển bất thường và giải
quyết nhu cầu về một biên độ giới hạn trên và dưới không đổi. Chỉ số RSI được
xác định theo cơng thức sau:
RSI=100-100/(1+RS)
RS = Trung bình giá đóng cửa tăng của x ngày/Trung bình giá đóng cửa giảm
của x ngày
Số ngày được sử dụng trong tính tốn là 14 ngày theo đồ thị hàng ngày.
RSI là một công cụ rất tốt để dựa vào đó chúng ta có thể xác nhận tín hiệu
mở giao dịch của bất kỳ hệ thống giao dịch đơn giản hay phức tạp. RSI cho chúng
ta tín hiệu mở giao dịch tốt nhưng cơ hội giao dịch không thường xuyên.
Đường 50 ở giữa, là một dấu hiệu nhận biết cổ phiếu sắp tăng giá hay giảm
giá. Nếu đường RSI tăng vượt qua đường này, đó là dấu hiệu giá của loại cổ phiếu
đó có kỳ vọng tăng giá (Bullish). Ngược lại, nếu đường RSI giảm xuống dưới

đường này, đó là dấu hiệu giá của loại chứng khốn đó có kỳ vọng giảm giá
(Bearish).
Đường 70 phía trên được coi là ngưỡng lỗ mua (overbought) nghĩa là đã
mua lỗ quá nhiều so với mức cân bằng của thị trường. Khi đó, nhà đầu tư sẽ bán
bớt ra để trở về mức cân bằng làm cho giá giảm xuống). Thường khi đường RSI
rớt xuống dưới ngưỡng 70, đó là dấu hiệu giá cổ phiếu đó sắp giảm.

12


×