Tải bản đầy đủ (.docx) (42 trang)

88623469 dự bao thị trường chứng khoan bằng phương phap định lượng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.42 MB, 42 trang )

Mục lục
Nội dung
Chương 1: Giới thiệu một số phương pháp phân tích - dự báo thị
trường chứng khoán bằng phương pháp định lượng
1. Một số kĩ thuật áp dụng cho bài toán dự báo
2. Cơ sở lý thuyết về phân tích - dự báo bằng phương pháp định
lượng
3. Các kỹ thuật khai phá dữ liệu
Chương 2: Cơ sở lý thuyết về phân tích - dự báo bằng phương pháp
định lượng

Trang
2
3
4
4
12

1. Giới thiệu

13

2. Các chỉ số quan trọng trong phân tích kĩ thuật

14

3. Thuật toán khai phá luật kết hợp dựa trên đại số gia tử

19

4. Mô hình dự báo



25

Chương 3: Phân tích thiết kế chương trình

28

1. Khảo sát một số phần mềm phân tích chứng khoán

29

2. Phân tích yêu cầu người dùng

31

3. Phân tích thiết kế

32

Chương 4: Hướng dẫn sử dụng

38

Tài liệu tham khảo

42

1



Chương 1
Giới thiệu một số phương pháp phân tích dự báo thị trường chứng khoán bằng phương
pháp định lượng

2


Theo một số kết quả nghiên cứu bước đầu cho thấy phương pháp định lượng
hoàn toàn có thể áp dụng để phân tích - dự báo đối với thị trường Việt
Nam.Sử dụng phương pháp định lượng phân tích - dự báo thị trường khá
hiệu quả và hiệu quả càng tăng lên khi kết hợp với các phương pháp phân tích
- dự báo khác.

1. Một số kĩ thuật áp dụng cho bài toán dự báo
Phân tích - dự báo giá cổ phiếu, biến động của thị trường là một chủ đề thú vị,
thu hút được sự quan tâm của nhiều nhà đầu tư, chuyên gia, nhà khoa học. Hiện
nay, nhiều phương pháp phân tích - dự báo đã được phát triển để phân tích - dự
báo xu hướng biến động giá cổ phiếu, thị trường hoặc tìm kiếm các cổ phiếu
tiềm năng để đầu tư.
Ở Việt Nam, phương pháp phân tích - dự báo được nhiều người biết đến nhất là
phân tích kỹ thuật và phân tích cơ bản.Bên cạnh đó, phương pháp phân tích - dự
báo bằng định lượng thông quá các mô hình toán học đang dần được quan tâm.
Trong phần này chúng tôi giới thiệu những nguyên tắc cơ bản và định hướng về
phương pháp phân tích - dự báo định lượng.Chúng tôi cho rằng đây là một
phương pháp khá hiệu quả và giúp hạn chế những khiếm khuyết của 2 phương
pháp phân tích - dự báo phổ biến phân tích kỹ thuật và phân tích cơ bản.
3


Phân tích - dự báo thị trường bằng phương pháp định lượng được sử dụng một

cách khá phổ biến trên thế giới.Nhiều quỹ đầu tư đã thiết lập các hệ thống giao
dịch tự động bằng phương pháp định lượng (quantitative trading).Hiệu quả từ
phương pháp này đã được chứng minh tại rất nhiều thị trường.
Ưu điểm của phương pháp phân tích - dự báo định lượng là những tín hiệu đưa
khá khách quan, dựa vào tiêu chí của những chỉ tiêu thống kê từ mô hình.
Những tín hiệu mua bán được đưa ra dựa trên những phân tích khách quan nên
giảm thiểu sự sai sót do yếu tố con người. Dù vậy, nếu lạm dụng quá mức
phương pháp này thì cũng sẽ tạo ra những hệ quả xấu.
Tại Việt Nam trong thời gian qua cũng đã có một số nghiên cứu sử dụng
phương pháp định lượng để phân tích - dự báo thị trường chứng khoán và biến
động cổ phiếu.Tuy nhiên, những nghiên cứu này phần lớn mới chỉ dừng lại ở
mục tiêu tham khảo hoặc làm tiền đề cho những nghiên cứu có tính ứng dụng
sâu hơn. Nguyên nhân ngoài hạn chế về kinh nghiệm, trình độ của những nhà
làm phân tích - dự báo, còn do dữ liệu thời gian ngắn và không đầy đủ cũng
khiến cho việc xây dựng mô hình gặp khó khăn.
2. Cơ sở lý thuyết về phân tích - dự báo bằng phương pháp định lượng
Các phương pháp định lượng dùng để phân tích - dự báo dựa trên các mô hình
toán với giả định rằng mối liên hệ giữa các yếu tố được thiết lập trong quá khứ
sẽ lặp lại trong tương lai. Nói cách khác phương pháp định lượng dựa trên dữ
liệu quá khứ để phát hiện chiều hướng vận động trong tương lai của các yếu tố
theo một quy luật nào đó. Để phân tích - dự báo diễn biến trong tương lai của
một biến, người ta có thể sử dụng mô hình chuỗi thời gian hoặc sử dụng biến
nhân quả.Ngoài ra, người ta còn sử dụng phương pháp khá phức tạp là mạng
neural.
a. Phân tích - dự báo chuỗi thời gian
Các mô hình phân tích - dự báo chuỗi thời gian là phân tích - dự báo giá trị
tương lai của một biến số nào đó, bằng cách phân tích số liệu quá khứ và
hiện tại của những biến số đó.Giả định của phân tích - dự báo chuỗi thời
gian là sự vận động trong tương lại của biến phân tích - dự báo sẽ giữ
nguyên xu thế vận động trong quá khứ và hiện tại.Như vậy, chỉ có chuỗi ổn

định mới đưa ra được những phân tích - dự báo tin cậy.Tính ổn định của
chuỗi dữ liệu thể hiện qua tính “dừng”, đây là điều kiện quan trọng để phân
tích và phân tích - dự báo chuỗi thời gian.
4


Phân tích - dự báo quá khứ là phân tích - dự báo hậu nghiệm và phân tích dự báo các giai đoạn trong tương lai gọi là phân tích - dự báo tiền nghiệm.

Toàn bộ phân tích - dự báo được phân chia làm 2 giai đoạn là phân tích - dự
báo hậu nghiệm (ex-post) và phân tích - dự báo tiền nghiệm (ex-ante).
- Giai đoạn phân tích - dự báo hậu nghiệm: Là thời gian từ quan sát đầu tiên
sau khi chấm dứt giai đoạn mẫu Yn+1 tới quan sát mới nhất YN. Giai đoạn
hậu nghiệm là giai đoạn kiểm nghiệm sự chính xác tính phân tích - dự báo
của mô hình. Nếu như mô hình không đảm bảo độ chính xác theo yêu cầu thì
lúc đó người phân tích - dự báo cần tìm các giải pháp khác như tìm kiếm mô
hình thay thế hoặc mở rộng mẫu phân tích - dự báo.
- Giai đoạn phân tích - dự báo tiền nghiệm: Là giai đoạn phân tích - dự báo
tương lai. Đây chính là mục tiêu của phân tích - dự báo, nhưng vì chưa xảy
ra nên không thể so sánh được. Tuy vậy, một số tiêu chí thống kê sẽ cho
chúng ta đánh giá được mức độ tin cậy của mô hình.
Toàn bộ quá trình dự báo được tóm tắt ở sơ đồ sau:

5


b. Phân tích - dự báo mô hình nhân quả
Mô hình phân tích - dự báo này dựa trên sự tác động qua lại giữa các yếu tố
với nhau, trong đó biến phân tích - dự báo (biến phụ thuộc) có quan hệ nhân
quả với các biến khác (biến độc lập).
Để thực hiện được phân tích - dự báotheo mô hình nhân quả người làm phân

tích - dự báo dựa trên các lý thuyết về kinh tế, tài chính, các nghiên cứu thực
nghiệm có liên quan, kinh nghiệm thực tế. Trước khi xây dựng mô hình
người làm phân tích - dự báo phải thiết lập các cơ sở lý thuyết, mối liên hệ
giữa biến phụ thuộc (biến phân tích - dự báo) và biến số khác (biến độc lập).
Sau khi xác định các bước trên sẽ cần phải tiến hành thu thập dữ liệu, xây
6


dựng, ước lượng mô hình, kiểm định giả thuyết và cuối cùng là thực hiện
phân tích - dự báo.

3. Ứng dụng phương pháp định lượng phân tích - dự báo trên thị trường chứng
khoán
Chúng ta vừa tìm hiểu các nguyên lý chung nhất về phân tích - dự báo kinh tế.
Sự biến động của thị trường chứng khoán phản ánh sức khỏe của nền kinh tế và
kỳ vọng của nhà đầu tư. Cơ sở lý thuyết cho việc phân tích - dự báo biến động
của thị trường chứng khoán đã được chứng minh khá rộng rãi.Nhiệm vụ của
nhà phân tích - dự báo là thiết lập các mô hình để có thể phân tích - dự báo
những xu thế thị trường trong tương lai.
Thực tế chúng ta phải chấp nhận rằng không có một mô hình nào là hoàn hảo để
phân tích - dự báo mọi sự biến động của thị trường.Việc phân tích - dự báo bằng
định lượng có thể sai sót khi gặp những cú sốc của các biến số ngoài mô hình
7


khiến thị trường đảo chiều một cách đột ngột. Ngoài ra, nếu nguồn dữ liệu đầu
vào không được thu thập một cách khoa học, chính xác cũng có thể làm cho
tính phân tích - dự báo thiếu chính xác.
Tại Việt Nam, nghiên cứu định lượng để phân tích - dự báo thị trường chứng
khoán xuất hiện chưa nhiều.Nguyên nhân chính là lực lượng những người làm

phân tích - dự báo có đủ trình độ chuyên môn để thực hiện những phép toán
phức tạp là khá ít.Ngoài ra, do số liệu về kinh tế, doanh nghiệp và thị trường
chưa đủ dài và độ tin cậy chưa cao nên việc thực hiện các phân tích - dự báo trở
nên khó khăn hơn.
Dưới đây, chúng tôi xin giới thiệu một số phương pháp phân tích - dự báo phổ
biến.Chúng tôi sẽ có những nghiên cứu sâu hơn về việc áp dụng tại thị trường
Việt Nam.
a. Phân tích - dự báo chuỗi thời gian
Sử dụng chuỗi thời gian để phân tích - dự báo giá cổ phiếu hoặc các chỉ số
thị trường được sử dụng khá nhiều. Phương pháp phân tích - dự báo này có
ưu điểm là chỉ sử dụng số liệu theo chuỗi thời gian nên khá phù hợp cho
phân tích - dự báo thị trường chứng khoán. Tuy nhiên, nhược điểm của nó là
không hiệu quả trong việc phân tích - dự báo được xu thế dài hạn của thị
trường.
Mô hình chuỗi thời gian thường được sử dụng nhất là mô hình ARIMA và
phương pháp Box-Jenkins.Mô hình ARIMA (Autoregressive Integrated
Moving Average - Tự hồi qui tích hợp Trung bình trượt), được George Box
và Gwilym Jenkins (1976) nghiên cứu. Phương pháp Box-Jenkins bao gồm
bốn bước: nhận dạng mô hình thử nghiệm; ước lượng; kiểm định bằng chẩn
đoán; và phân tích - dự báo.
Mô hình sử dụng để phân tích - dự báo rủi ro ARCH/GARCH.
ARCH/GARCH được sử dụng khá phổ biến trong ngành tài chính để phân
tích - dự báo rủi ro. Mô hình này dùng để phân tích - dự báo độ giao động
suất sinh lời của cổ phiếu theo thời gian. Mô hình ARCH (Autogressive
Conditional Heteroskedasticity) do Robert Engle và Clive Granger phát triển
năm 1982. Mô hình GARCH (Generalised Autogressive Conditional
Heteroskedasticity) được Tim Bollerslev đề xuất năm 1986 để khắc phục
những hạn chế của ARCH. Ngày nay, GARCH được sử dụng một cách phổ
biến và phù hợp với số liệu chuỗi thời gian ngắn như giá cổ phiếu trên thị
trường.

8


b. Phân tích - dự báo bằng mô hình nhân quả
Mô hình nhân quả thường sử dụng số liệu bảng.Trong phân tích - dự báo
chứng khoán, biến phụ thuộc (biến cần phân tích - dự báo) là suất sinh lời
của cổ phiếu, thị trường hay giá cổ phiếu và chỉ số thị trường. Trong khi đó,
các biến độc lập là các biến số của nền kinh tế như lạm phát, thất nghiệp,
cung tiền, tăng trưởng công nghiệp, tăng trưởng bán lẻ, niềm tin tiêu dùng
… hoặc là các biến số liên quan đến doanh nghiệp như lợi nhuận, tăng
trưởng, giá hàng hóa liên quan đến quá trình sản xuất của doanh nghiệp. Nói
tóm lại là bất kỳ yếu tố nào tác động đến sự biến động của thị trường, giá cổ
phiếu đều có thể trở thành biến độc lập sử dụng cho phân tích - dự báo.
Phương pháp này sử dụng các mô hình hồi quy để tìm mối liên hệ giữa biến
phụ thuộc và biến độc lập.Qua mô hình hồi quy, chúng ta có thể phân tích dự báo được xu thế và những nhân tố tác động đến biến động của giá chứng
khoán hay thị trường.
Ưu điểm của phương pháp này là có thể phân tích - dự báo một cách khá
chính xác xu hướng biến động dài hạn của giá cổ phiếu hay thị trường. Tuy
nhiên, việc thu thập dữ liệu là một công việc khó khăn và tốn nhiều chi phí.
Đối với Việt Nam, do các dữ liệu về doanh nghiệp và nền kinh tế còn ít nên
áp dụng phương pháp phân tích - dự báo này càng trở nên khó khăn.
c. Phân tích - dự báo bằng mạng thần kinh (Neural Network)
Lý thuyết Neural Network được phát triển từ những năm 1940 đến nay và đã
được ứng dụng rộng rãi trong nhiều lĩnh vực. Lý thuyết Neural Network
nhanh chóng trở thành một hướng nghiên cứu triển vọng trong mục đích xây
dựng các máy thông minh tiến gần tới trí tuệ con người. Đối với lĩnh vực
chứng khoán, Neural Network được sử dụng khá phổ biến để phân tích - dự
báo thị trường, giá cổ phiếu.
Neural Network được xây dựng xuất phát từ một thực tế là bộ não con
người. Có thể coi bộ não là một máy tính hay một hệ thống xử lý thông tin

song song, phi tuyến và cực kỳ phức tạp. Bộ não có khả năng tự tổ chức các
bộ phận cấu thành của nó, như là các tế bào thần kinh (neural) hay các khớp
nối thần kinh (synapse), nhằm thực hiện một số tính toán như nhận dạng
mẫu và điều khiển vận động nhanh hơn nhiều lần các máy tính nhanh nhất
hiện nay. Sự mô phỏng bộ não con người của mạng neural được dựa trên cơ
sở một số tính chất đặc thù rút ra từ các nghiên cứu về thần kinh sinh học.
9


Dữ liệu đầu vào để thực hiện phân tích - dự báo bằng Neural Network khá
đa dạng và tùy thuộc vào trình độ, kinh nghiệm, mục tiêu phân tích - dự báo
và những cơ sở dữ liệu mà người làm phân tích - dự báo có. Thông thường
dữ liệu bao gồm các dữ liệu liên quan đến giao dịch cổ phiếu trên thị trường
như giá, khối lượng…. Ngoài ra, các dữ liệu trong nền kinh tế, dữ liệu của
doanh nghiệp cũng có thể làm đầu vào cho quá trình phân tích - dự báo. Các
thông tin đầu vào sẽ được xử lý bằng những thuật toán phức tạp thông qua
tiến trình mô phỏng việc xử lý thông tin như bộ não con người.
Hiện nay, có khá nhiều phần mền miễn phí về Neural Network được đăng tải
trên mạng Internet.Tuy nhiên việc vận dụng thành thạo để phân tích - dự báo
thị trường là một công việc không dễ dàng.Để làm được điều này người
phân tích - dự báo cần phải có hàng loạt các kiến thức sâu rộng khác để bổ
trợ.

4. Kết luận
Trên đây chúng tôi vừa giới thiệu những cơ sở lý thuyết và một số phương thức
phổ biến sử dụng để phân tích - dự báo trên thị trường chứng khoán. Ưu điểm
của các phương pháp định lượng này là phân tích số liệu để đưa ra được những
phân tích - dự báo khách quan, để giảm thiểu rủi ro của việc phân tích cảm tính
của con người. Tuy nhiên, áp dụng phương pháp định lượng trong phân tích dự báo sẽ có không ít thách thức và nó cũng không phải là phương pháp thay
thế hoàn toàn trực giác trong đầu tư.

10


Chúng tôi cho rằng đây là một hướng phát triển trong tương lai đối với công tác
phân tích - dự báo ở Việt Nam.Tuy vậy, đây là công việc khó khăn và phức tạp,
đòi hỏi người làm công tác phân tích - dự báo cần có trình độ chuyên môn về
kinh tế, tài chính, toán học và kinh nghiệm phân tích - dự báo.
Kết quả nghiên cứu bước đầu của chúng tôi cho thấy phương pháp định lượng
hoàn toàn có thể áp dụng để phân tích - dự báo đối với thị trường Việt Nam.Sử
dụng phương pháp định lượng phân tích - dự báo thị trường khá hiệu quả và
hiệu quả càng tăng lên khi kết hợp với các phương pháp phân tích - dự báo
khác.

11


Chương 2
Ứng dụng lý thuyết đại số gia tử - luật kết hợp
trong việc phân tích - dự báo chứng khoán

12


1. Giới thiệu
Hệ mờ(fuzzy systems) đã được áp dụng rộng rãi trong các hệ chuyên gia,
điều khiển tự động, người máy... Gần đây, việc nghiên cứu ứng dụng hệ
mờ vào các bài toán tài chính đã và đang thu hút được nhiều sự quan tâm
nhờ điểm mạnh của việc xử lý các thuộc tính không rõ ràng trong thông tin
vủa hệ mờ. Trong một nghiên cứu của Zhou và Dong [1] đã đưa ra một mô
hình tri thức không chắc chắn được dùng trong phân tích kỹ thuật theo

hướng tiếp cận logic mờ. Thuật toán của họ có có thể cung cấp độ chính
xác cao hơn trong việc phát hiện và giải thích các mô hình kỹ thuật qua
phân tích mô hình trực quan được thực hiện bởi các chuyên gia. Lin et al
[2].Đã sử dụng một hệ thống mờ với chỉ số kỹ thuật KD để dự đoán chỉ số
chứng khoán.KD là chỉ số một bộ dao động ngẫu nhiên, bao gồm hai dòng
là K và D, trong đó D là Kđược làm mịn.Nghiên cứu của họ cho thấy rằng
lợi nhuận được tạo ra với các hệ thống mờ lớn hơn đáng kể hơn so với các
mô hình hồi quy tuyến tính, mạng lưới thần kinh và chiến lược đầu tư
khác. Hiemstra [3] theo một cách tiếp cận tương tự với một hệ thống suy
luận mờ, nhưng với các chỉ số khác để dự đoán thị trường chứng khoán.
Có thể thấy rằng kết quả kết hợp phân tích kỹ thuật và logic mờ rất hứa
hẹn.
Do các hệ thống dự báo khác nhau đều có điểm mạnh và hạn chế khác
nhau, thế nên hệ thống lai (hybrid) cũng đã được nghiên cứu để có được sự
kết hợp các điểm mạnh của các phương pháp. Abraham và Nath [4] cung
cấp một phương pháp tổng quan về kết hợp các mô hình dự báo khác
nhau.Đặc biệt, sự kết hợp của các hệ thống mờ với các mạng thần kinh
và/hoặc các thuật toán di truyền xuất hiện để triển khai trong các bài toàn
thực tế là hết sức khả thi. Một hệ thống neuron mờ được dùng để dự đoán
chuỗi thời gian tài chính được mô tả trong[5]. Dự đoán giá chứng khoán và
chọn tùy chọn của chỉ số S&P và Dow Jones đã được kiểm chứng, kết quả
trong chiến lược kinh doanh có lợi nhuận. Kết quả từ bài báo cho thấy tiềm
năng của hệ neuron mờ trong lĩnh vực tài chính.Mô hình neuron mờ cũng
đã được sử dụng để dự đoán chuỗi thời gian khác như chỉ số sản xuất Hy
Lạp [6] và chỉ số giá chứng khoán của Hàn Quốc [7]. Phương pháp này
cũng đã được áp dụng cho [8] dùng để đánh giá danh mục đầu tư. Mô hình
lai kết hợp của hệ thống mờ và xác suất cũng đã được đề xuất.Ví dụ, van
den Berg et al. phân tích thị trường tài chính bằng cách sử dụng một mô
hình xác suất mờ [9], trong đó người ta kết hợp giữa xác suất với mô hình
ngôn ngữ không chắc chắn.

13


Các vấn đề của việc tìm kiếm các quy tắc mờ mong muốn là một quá trình
rất quan trọng trong sự phát triển của hệ thống mờ.Trong thực tế, việc đánh
giá lại các quy tắc từ các chuyên gia chỉ là một nhiệm vụ khá khó
khăn.Alcala et al. [10] đưa ra một cái nhìn tổng quan về cách tiếp cận khác
nhau.Cho việc học và điều chỉnh của một hệ thống mờ. Herrera et al
[11].đề xuất một phương pháp để tìm hiểu các quy tắc từ các ví dụ (đầu
vào-đầu ra dữ liệu) bằng cách sử dụng một thuật toán di truyền.
Mohammadian và Kingham [13] phát triển một hệ thống logic mờ phân
cấp bằng cách sử dụng thuật toán di truyền để dự đoán lãi suất tại Úc.Sử
dụng một thuật toán di truyền như là một phương pháp đào tạo cho học tập
quy tắc mờ, số lượng các quy tắc có thể được giảm đáng kể, kết quả trong
các hệ thống hiệu quả hơn.Kết quả cho thấy hệ thống có thể đưa ra dự đoán
chính xác của các mức lãi suất.
Trong phần sau đây, chúng tôi mô tả một hệ thống mờ(dựa trên lý thuyết
đại số gia tử) để dự đoán biến động giá thị trường cho đầu tư trong danh
mục đầu tư cổ phiếu của Việt Nam.Hệ thống này tạo ra một tín hiệu mua
hoặc bán, nhưng nó cũng có thể được kết hợp với cơ chế phân bổ danh
mục đầu tư cho giao dịch tự động.Dưới đây, chúng tôi đầu tiên thảo luận
về phân tích kỹ thuật và các chỉ số mà các hệ thống mờ được đề xuất sử
dụng.
2. Các chỉ số quan trọng trong phân tích kĩ thuật
Theo các chuyên gia trong lĩnh vực tài chính thì có một số chỉ số quan
trọng trong phân tích kĩ thuật có thể giúp ích rất lớn trong việc dự báo xu
hướng của thị trường chứng khoán hoặc một cổ phiếu nhất định.Trong đó,
4 chỉ số quan trọng nhất đó là Commodity Channel Index (CCI), Relative
Strength Index (RSI), Moving Average Hội tụ và phân kỳ (MACD) và
Bollinger Band. Dưới đây, chúng tôi mô tả sơ lược về 4 chỉ số nàytheo lí

thuyết của các nhà đầu tư chứng khoán.
a. CCI
Chỉ số kênh hàng hóa ( CCI) được hình thành dựa trên giá trị trung bình
của giá trong quá khứ, sự phân tán của giá từ giá trị trung bình và độ biến
động
của
giá
trước
đó.
Nếu giá trung bình của một cặp đồng tiền đang tăng lên thì đường CCI
cũng sẽ di chuyển cao hơn. Đường CCI di chuyển lên cao hơn nhanh hay
14


chậm phụ thuộc vào độ biến động của cặp đồng tiền. Nếu cặp đồng tiền
biến động mạnh, đường CCI di chuyển lên nhanh hơn và ngược lại.
Nếu giá trung bình của một cặp đồng tiền đang giảm xuống thì đường CCI
cũng sẽ di chuyển xuống thấp hơn. Đường CCI di chuyển xuống thấp hơn
nhanh hay chậm phụ thuộc vào độ biến động của cặp đồng tiền. Nếu cặp
đồng tiền biến động mạnh, đường CCI di chuyển xuống nhanh hơn và
ngược
lại.
Đường CCI di chuyển ra sau và lên trước, đi qua vùng 100, 0 và -100 trong
chu kỳ của nó.

Dấu

hiệu

kinh


doanh

của

kênh

chỉ

số

hàng

hóa

(

CCI)

Kênh chỉ số hàng hóa chỉ ra các dấu hiệu kinh doanh khi nó di chuyển ra
sau và lên trước ở trên và dưới mốc 100 và -100.
Dấu hiệu vào: Khi CCI tăng lên trên mốc 100 và sau đó đảo chiều đi xuống
dưới mốc 100 thì bạn có thể bán cặp đồng tiền xuống bởi người mua đã hết
động lực theo và giá của cặp đồng tiền sẽ giảm trong tương lai gần.
Khi CCI xuống dưới mốc -100 và sau đó đảo chiều đi lên trên mốc -100 thì
bạn có thể mua cặp đồng tiền lên bởi người bán đã hết động lực theo và giá
của
cặp
đồng
tiền

sẽ
tăng
trong
tương
lai
gần.
Dấu hiệu ra: Khi đường CCI đảo chiều và bắt đầu di chuyển lên cao hơn
sau khi bạn bán một cặp đồng tiền, đặt lệnh dừng lỗ trên một chút so với
15


mức cản gần nhất. Nếu cặp đồng tiền đảo chiều và di chuyển lên trên mức
cản, điểm dừng lỗ sẽ đưa bạn ra ngoài giao dịch.
Khi đường CCI đảo chiều và bắt đầu di chuyển xuống thấp hơn sau khi bạn
mua một cặp đồng tiền, đặt lệnh dừng lỗ dưới một chút so với mức hỗ trợ
gần nhất.Nếu cặp đồng tiền đảo chiều và di chuyển xuống dướ mức hỗ trợ,
điểm dừng lỗ sẽ đưa bạn ra ngoài giao dịch.
Một số luật dựa trên chỉ số CCI do các nhà phân tích rút ra:
 Nếu CCI tăng lên trên 100 thì xu hướng tăng
 Nếu CCI giảm xuống dưới 100 thì xu hướng giảm
 Nếu CCI giảm xuống dưới -100 thì xu hướng giảm
 Nếu CCI tăng lên trên -100 thì xu hướng tang

b. RSI
Chỉ số RSI dùng để đo sức mạnh hoặc độ yếu tương đối của một loại
chứng khoán khi nó tự so sánh với chính nó trong một khoảng thời gian
nhất định (thường dùng là 14 ngày). RSI là một công cụ đo dao động
(oscillator) có biên trên và biên dưới dao động 0-100 (Phần dưới cùng của
biểu đồ trên: RSI – 14 ngày). Đường trung bình nằm giữa màu xám 50.
Biểu đồ RSI có các đường chính đáng chú ý sau:

Đường 50 ở giữa, là một dấu hiệu nhận biết chứng khoán sắp tăng giá hay
giảm giá. Nếu đường RSI tăng vượt qua đường này, đó là dấu hiệu giá của
loại chứng khoán đó có kỳ vọng tăng giá (Bullish). Ngược lại, nếu đường
RSI giảm xuống dưới đường này, đó là dấu hiệu giá của loại chứng khoán
đó có kỳ vọng giảm giá (Bearish).
Ở đây ta nhấn mạnh là kỳ vọng vì biểu đồ thể hiện quá khứ của cổ phiếu.
Khi xác lập xu thế mới sẽ làm cho các nhà đầu tư tin tưởng tăng (hoặc
giảm).
Đường 70 phía trên được coi là ngưỡng lỗ mua (overbought) nghĩa là đã
mua lỗ quá nhiều so với mức cân bằng của thị trường. Khi đó, nhà đầu tư
sẽ bán bớt ra để trở về mức cân bằng làm cho giá giảm xuống).Thường khi
16


đường RSI rớt xuống dưới ngưỡng 70, đó là dấu hiệu giá chứng khoán đó
sắp giảm.
Đường 30 ở dưới được coi là ngưỡng lỗ bán (oversold) nghĩa là lượng bán
ra quá nhiều làm giá giảm xuống thấp hơn so với giá cân bằng. Nhà đàu tư
sẽ mua thêm để đẩy giá lên).Thường khi đường RSI từ dưới lên và vượt
ngưỡng 30, đó là dấu hiệu giá chứng khoán đó sắp tăng.
Công thức tính:

M









Một số luật dựa trên chỉ số RSI:
Nếu RSI tăng trên 70, thì xu hướng tăng
Nếu RSI giảm dưới 70, thì xu hướng giảm
Nếu RSI tăng trên 50, thì xu hướng tăng
Nếu RSI giảm dưới 50, thì xu hướng giảm
Nếu RSI tăng trên 30, thì xu hướng tăng
Nếu RSI giảm dưới 30, thì xu hướng giảm

c. MACD
Công cụ chỉ báo MACD do Gerald Appel phát triển. Điều làm cho công cụ
chỉ báo này hữu dụng đó là nó kết hợp một số nguyên tắc của dao
động.Bạn có thể nhìn qua biểu đồ (ảnh).
Đường di động nhanh hơn (đường MACD) là sự chênh lệch giữa hai
đường trung bình động san bằng hàm mũ của các mức giá đóng cửa
(thường là 12 và 26 ngày hoặc tuần vừa qua).Đường di động chậm hơn
(đường tín hiệu) thì thường sử dụng trung bình động san bằng mũ 9 kỳ của
đường MACD.
17


Các tín hiệu mua và bán thực chất được đưa ra khi hai đường này cắt
nhau.Khi đường MACD cắt hướng lên đường tín hiệu chậm hơn thì đó là
tín hiệu mua.Khi đường MACD cắt xuống dưới đường tín hiệu chậm hơn
thì đó là tín hiệu bán.Trong ý nghĩa đó, đường MACD giống như cách thức
cắt nhau của hai đường trung bình động.Tuy nhiên, giá trị của đường
MACD cũng dao động lên trên và xuống dưới đường 0.Đó là nơi nó bắt
đầu tương đồng với một dao động.Tình trạng mua quá mức được thể hiện
khi hai đường này nằm quá cao so với đường 0.Tình trạng bán quá mức là
khi hai đường này nằm quá thấp so với đường 0.

Tín hiệu mua tốt nhất được cho là khi những đường giá nằm nhiều dưới
đường 0 (tức là khi bị bán quá mức). Những điểm băng lên trên hay xuống
dưới đường 0 là cách thức khác để tạo ra các tín hiệu mua và bán tương
ứng.

Một số luật dựa trên chỉ số MACD:
 Nếu MACD tăng lên trên đường tín hiệu
thì mua
 Nếu MACD giảm xuống dưới đường tín
hiệu thì bán
18


d.

Dải Bollinger

Đường Bollinger giúp cho người dùng so sánh độ biến động và mức giá
tương đối của một chứng khoán hay giá hàng hoá, tiền tệtheo một thời gian
quan sát cụ thể. Các đường biên được tạo nên từ đường trung bình và một
độ lệch chuẩn được áp dụng xung quanh đường trung bình này.Thông
thường mặc định của đường trung bình là 20 ngày và độ lệch chuẩn là 2.
Bởi vì độ lệch chuẩn dùng để đo lường biến động nên Bollinger Bands trở
nên một công cụ linh động có thể điều chỉnh mở rộng hay hẹp lại dựa trên
mức độ biến động thật sự của thị trường.
Thông thường dãy Bollinger band gồm 3 đường:
- Một đường trung bình động ở giữa (hay còn gọi là đường trung tuyến)
- Một đường biên trên
- Một đường biên dưới
(một số phần mềm như phần mềm SAXO Bank không có hiển thị đường

trung bình động ở giữa (đường trung tuyến), trong trường hợp này chúng ta
có thể kết hợp đường trung bình 20 (MA 20) để xác định đường trung
tuyến)

Các Ứng Dụng Của Bollinger Band:
 Chỉ ra thị trường đang ở tình trạng overbought/oversold: giá ở gần
biên dưới tức thị trường đang oversold, ngược lại là overbought
 Dùng kết hợp với đường RSI, Stochastic để chỉ ra dấu hiệu mua/
bán: Dấu hiệu mua/bán xuất hiện khi Bollinger cho thấy dấu hiệu
overbought/oversold, trong khi RSI, Stochastic cho thấy dấu hiệu phân kỳ
(divergence)
 Chỉ ra dấu hiệu cảnh báo sắp có một sự biến động giá mạnh: những
đường biên (bands) thường hẹp trước khi bắt đầu một sự biến động giá
mạnh
3. Thuật toán khai phá luật kết hợp dựa trên đại số gia tử
19


Có thể thấy các luật cơ bản được các nhà phân tích đưa ra ở trên là các luật
được xây dựng dựa trên phương pháp thống kê khi các điều kiện trên đi
kèm với nhau với xác suất cao. Ta dễ dàng nhận thấy cấu trúc của các luật
ở trên là cấu trúc của luật kết hợp trong lĩnh vực khai phá dữ liệu. Vì thế
trong nghiên cứu này, chúng tối đề xuất sử dụng lý thuyết luật kết hợp dựa
trên đại số gia tử để tìm kiếm các luật có độ tin cậy cao trong dữ liệu giao
dịch chứng khoán lịch sử.
Khai phá dữ liệu, cụ thể là trích xuất các luật kết hợp từ cơ sở dữ liệu, có
xuất phát điểm từ bài toán nghiên cứu số liệu bán hàng trong siêu thị. Ở bài
toán này, số liệu được biểu diễn dưới dạng bảng hai chiều, trong đó các cột
thể hiện các loại mặt hàng (item), các hàng thể hiện các giao dịch
(transactions) đã được tiến hành, số 1 cho thấy mặt hàng được mua, số 0

chỉ điều ngược lại. Từ bảng dữ liệu rất lớn này, người ta mong muốn rút ra
được các quy luật giúp cho quản lý, kiểu như "Nếu một người đã mua bánh
mỳ và bơ, khả năng người đó cũng mua giăm bông là rất cao". Luật có
dạng như vậy gọi là luật kết hợp và là hướng nghiên cứu quan trọng trong
lĩnh vực khai phá dữ liệu.Về sau, người ta thấy sẽ là rất không đầy đủ nếu
chỉ xem xét các cơ sở dữ liệu chỉ bao gồm các phần tử 0 và 1. Chẳng hạn,
trong CSDL nhân sự của một cơ quan có các mục như tuổi, thu nhập..có
giá trị trong miền số thực rất rộng. Để trích xuất ra các luật kết hợp, một
phương pháp thường được sử dụng là chuyển số liệu trong CSDL đã cho
về CSDL chỉ chứa các giá trị 0, 1 và áp dụng các kết quả đã có. Thí dụ,
trong mục "tuổi", có thể chia ra các miền "trẻ", "trung niên" và "già" với
các miền giá trị tương ứng là [0,35], [36,55], [56,80] và nếu một giá trị của
CSDL ban đầu rơi vào miền giá trị nào thì ta ghi 1 cho vị trí tương ứng
trong CSDL chuyển đổi, ngược lại gán giá trị 0. Phương pháp này đơn giản
về mặt thực thi nhưng có thể gây băn khoăn do ranh giới cứng mà người ta
đưa ra khi tiến hành chuyển đổi. Chẳng hạn hai người tuổi 35 và 36 tuy rất
gần nhau về mặt tuổi tác nhưng lại thuộc hai lớp khác nhau là "trẻ" và
"trung niên", dẫn tới việc đưa ra những luật kết hợp có thể thiếu tính chính
xác. Và người ta sử dụng cách tiếp cận mờ để khắc phục điều này, theo đó,
một giá trị bất kỳ của CSDL ban đầu không chuyển đổi về giá trị 0 hoặc 1
như trên mà sẽ chuyển về một tập giá trị thực thuộc đoạn [0,1], là độ thuộc
của giá trị đã cho vào các tập mờ được xác định trước. Thí dụ, người tuổi
35 trong ví dụ trên, ở CSDL đã chuyển đổi sẽ nhận tập giá trị (trẻ, 0,8),
20


(trung niên, 0,6), (già, 0,1). Phương pháp này, tuy dẫn tới việc xử lý phức
tạp hơn nhưng dễ chấp nhận hơn về mặt trực quan và hiện đang được nhiều
nhà nghiên cứu quan tâm. Mặc dù vậy, theo ý chúng tôi, phương pháp trích
xuất luật kết hợp mờ vẫn có một số điểm yếu cần khắc phục. Đó là sự phụ

thuộc chủ quan rất lớn vào việc lựa chọn các hàm thuộc cho các tập mờ
dẫn đến việc xử lý vừa phức tạp vừa có thể thiếu chính xác. Trong phần
này chúng tôi trình bày việc giải bài toán trích xuất luật kết hợp mờ theo
cách tiếp cận của Đại số gia tử, ở đó các giá trị độ thuộc mờ sẽ nhận được
thông qua các giá trị định lượng ngữ nghĩa, được xác định dựa trên các kết
quả nghiên cứu lý thuyết về ĐSGT đã có từ trước.

Ký hiệu các tham số của thuật toán như sau.
n: Tổng số giao dịch trong cơ sở dư liệu(được sinh ra sau quá trình
chuyển dữ liệu thô(n’) thành nhãn gia tử tương ứng)
m: Tổng số các thuộc tính(số thuộc tính của dữ liệu thô(m’)* số
nhãn gia tử)
Aj: Thuộc tính thứ j, 1 ≤ j ≤ m, Aj
D(i) dữ liệu giao dịch thứ i, 1 ≤ i ≤ n
vj(i): Giá trị định lượng của Aj trong D(i);
fjk(i) giá trị độ thuộc của vj(i) với nhãn gia tử Rjk, 1 ≤ fjk(i) ≤ m;
Sup(Ajk): Độ hỗ trợ của Ajk
Sup: Giá trị hỗ trợ của mỗi tập mục lớn;
Conf: độ tin cậy của mỗi tập mục lớn
Minsup: Giá trị hỗ trợ tối thiểu cho trước
Minconf: Giá trị tin cậy cho trước
Cr: Tập các tập mục có khả năng với r thuộc tính (tập mục), 1 ≤ r ≤
m;
Lr: Tập các tập mục lớn thỏa mãn với r nhãn gia tử (tập mục) 1 ≤ r ≤
m;
Thuật toán khai phá dữ liệu dựa trên đại số gia tử cho các giá trị
định lượng được thực hiện như sau:
Input: m’,n’, theta(tỉ lệ giữa 2 phần tử sinh), minsup và
minconf
Output: luật kết hợp

21


Bước 1: Chuyển các giá trị định lượng v j(i) của mỗi giao dịch
D(i), i từ 1 tới n, với mỗi thuộc tính A j, nếu Aj nằm ở ngoài 1 trong 2
đầu mút ( 2 nhãn gia tử cực đại và cực tiểu) thì A j chỉ có 1 nhãn gia
tử ứng với đầu mút đó, nếu không thì A j được biểu diễn bởi 2 nhãn
gia tử liên tiếp có đoạn giá trị nhỏ nhất trên trường giá trị của A j, mỗi
nhãn ứng với 1 giá trị biểu diễn độ thuộc f jk(i)(j=1,2) của Aj với nhãn
gia tử đó. Độ thuộc này được tính là khoảng cách của A j tới giá trị
biểu diễn cho nhãn gia tử tương ứng.
Bước 2 : Tính giá trị hỗ trợ ,

Bước 3 : Nếu Sup(Rjk) ≥ minsup thì đưa Rjk vào L1
Bước 4 : Nếu L1 không rỗng, tiếp tục bước sau, nếu rỗng thoát
chương trình.
Bước 5 : Thuật toán xây dựng tập mục lớn mức r từ các tập mục
lớn mức r-1 bằng cách chọn 2 tập mục lớn mức r-1 chỉ khác nhau
duy nhất một mục, hợp 2 tập mục này ta được tập mục ứng viên Cr,
nếu tập mục này xuất hiện trong cơ sở dữ liệu và có giá trị hỗ trợ
thỏa mãn thì nó được đưa vào danh sách các tập mục lớn mức r.
Bước 6: Thực hiện theo các bước con sau đây lặp lại cho các
tập mục lớn mức lớn hơn được sinh ra tiếp theo dạng (r+1) tập mục
lớn S với mục (s1,s2, …, st, …, sr+1) trong Cr+1, 1≤ t ≤ r+1
(a)
Tính giá trị hỗ trợ sup(S) của S trong giao dịch

(b)

Nếu Sup(S) ≥ minsup, thì đưa S vào Lr+1.


Bước 7 : Nếu Lr+1 là rỗng, thì thực hiện bước tiếp theo, ngược
lại, đặt r=r+1, thực hiện lại bước 5 và 6.

22


Bước 8 : Thu thập các tập mục lớn mức lớn hơn nếu có
Bước 9 : Đưa ra các luật kết hợp từ các tập mục lớn vừa thu
thập theo cách sau:
(a)

Với mỗi luật kết hợp khả thi sau đây:

s1∩…∩sx∩sy∩…∩sq → sk (k=1 tới q, x=k-1, y= k+1)
(b) Tính độ tin cậy của luật:

Trên thực tế, trong đầu tư chứng khoán, các quyết định của nhà đầu tư bao
gồm các lệnh: Mua, bán và nắm giữ. Việc ra quyết định cũng phụ thuộc
vào khối lượng cổ phiếu mà nhà đầu tư tác động vào, ví dụ khi nhà đầu tư
quyết định bán mạnh cổ phiếu x tức là họ sẽ bán một lượng lớn số lượng
cổ phiếu x đang nắm giữ. Vì thế để phù hợp với thực tế chúng tôi chỉ trích
xuất các luật có dạng:
A => buy/sell/holdhoặc A => strong_sell/buy
Trong đó A là tập con của {MACD, RSI, CCI, BB} với các nhãn gia tử
tương ứng. Việc tính nhạn gia tử tương ứng của các chỉ số được tính dựa
trên giá trị độ lệch của chỉ số đó so với đường tiêu chuẩn của nó.
Sau đây là một số luật tham khảo với độ tin cậy 60% với giữ liệu cổ phiếu
của công ty nhựa môi trường xanh An Phát(mã AAA – thuộc sở giao dịch
chứng khoán Hà Nội) trong tháng 9 – 10 – 11 – 12 năm 2011, trong thử

nghiệm trạng thái nắm giữ(hold) tạm thời chưa được thử nghiệm:
{Very_low_MACDf, quite_low_RSI, very_hight_RSI¡1 }=> SELL
{very_low_MACDf, middle_RSI} => STRONG SELL
{quite_hight_MACDf, middle_RSI} => BUY
{quite_hight_MACDf ,quite_low_RSI} => BUY
{very_hight_MACDf, very_hight_BB} =>STRONG_ SELL
23


Trong đó khái niệm mua/ mua mạnh hoặc bán/ bán mạnh được hiểu theo
cách:





Mua: 2* khối lượng bán>= khối lượng mua>khối lượng bán
Mua mạnh: khối lượng mua > 2* khối lượng bán
Bán : 2* khối lượng mua >= khối lượng bán>khối lượng mua
Mua mạnh: khối lượng bán > 2* khối lượng mua

24


4. Mô hình dự báo
Mô hình dự báo được xây dựng dựa trên ý tưởng sử dụng thuật toán khai
phá luật kết hợp dựa trên đại số gia tử đã giới thiệu ở phần 3 để khai phá
luật kết hợp giữa 4 chỉ số được nêu ở phần 2 để rút ra các luật nhằm dự báo
xu hướng giá của các cổ phiếu trong tương lai dựa vào dữ liệu lịch sử


Mô hình hệ thống dự báo chứng khoán
25


×