Tải bản đầy đủ (.pdf) (81 trang)

ứng dụng machine learning và phân tích xúc cảm cho giao dịch cổ phiếu việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.67 MB, 81 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b><small>THÀNH PHỐ HỔ CHÍ MINH. NĂM 2023</small></b>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

Cơng trình được hồn thành tạiTrường Đại học Cơng nghiệp TP. Hồ Chí Minh.

Luận văn thạc sĩđược bảo vệ tại Hội đồng chấm bảo vệLuận văn thạc sĩ Trường Đại

<b>CHỦTỊCH HỘI ĐÒNGTRƯỞNG KHOAKHOA MÁY HỌC TÍNH</b>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

BỘ CƠNG THƯƠNG <b>CỘNG HỊA XÃ HỘI CHỦ NGHĨAVIỆTNAMTRƯỜNG ĐẠI HỌC CÔNG NGHIỆPĐộc lập -Tự do - Hạnh phúc</b>

<b>THÀNH PHĨHỊ CHÍMINH</b>

Họ tên học viên: Võ Duy Quí MSHV:

Ngành: Khoa Máyhọc Tính Mã ngành: 8480101

<b>I. TÊN ĐÈTÀI:</b>

<b>NHIỆMVỤVÃ NỘI DƯNG:</b>

Nhiệm vụ: Dựa trên lịch sử giácổ phiếu và dữ liệu tin tứcpháttriển mơ hìnhdự đốngiácổphiếu trong tương lai.

Nội dung: tìm hiểu về cổ phiếu, một số phương pháp tiền xử lý các dữ liệu đầu vàođể xử lý dữ liệu khi đưa vào mơ hình dự đốn. Tìm hiểu và xâydựng, kiểm thử mơ

hình dựa trên các mơ hình máy học thường dùng, các mơ hình học học sâu và mô

chú ý so với các phương pháp khác để tối ưu mơ hình.

<b>II. NGÀYGIAONHIỆM VỤ: 30/10/2022III.NGÀY HỒN THÀNHNHIỆM VỤ:</b>

<b>IV. NGƯỜI HƯỚNG DẪNKHOA HỌC:</b> TS. Nguyễn Chí Kiên

<b>TRƯỞNG KHOA KHOA MÁY HỌC TÍNH </b>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>LỜI CẢMƠN</b>

Trướctiên, tôi xin bàytỏ sự biết ơn chân thành và sâu sắcnhất tớiThầy TS. Nguyễn

trình nghiên cứu, hồn thiện luận văn thạc sĩ của mình.

Cơng Nghiệp Tp. Hồ Chí Minh đã nhiệt tình hướng dẫn và giáo dục tơi trong suốt

thực hiện luận văn tại Trường Đại học Công Nghiệp Tp. Hồ Chí Minh.

cạnh, động viên và khuyến khích tơi trong suốtq trình thực hiện đề tài.

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<b>TÓM TẤTLUẬN VÃN THẠC sĩ</b>

yếu tố đon lẻ mà là sự kếthợp của nhiều yếu tố khác nhau. Khôngthể đon thuần chỉ

xác định một nguyên nhân cụ thể nào đó gây ảnh hưởng, mà thay vào đó, sự tư ongtác của nhiều yếu tố như doanh nghiệp, tình hình kinh tế, biến động chính trị, quan

ảnh hưởng đồng thời đến thị trường chứng khoán. Những yếu tố trên thường đượctrình bày thơng qua tin tức, bài báo. Vì vậy, việc dự đoán hướng phát triển của thị

trường cổ phiếu được coi làmộttrong những lĩnhvực rộng lớn và quý báu nhấttrong

ngữ tự nhiên (NLP) để xử lý dữ liệu đầu vào, gán nhãn cho dữ liệu, kết hợp nhiều

cổ phiếu.

Kết quảcủacác thử nghiệm cho thấy rằng mô hình được đề xuấtđạt đượchiệu suất

các độ đo, bao gồm độ chính xác, giátrị F1, giátrị AUC trên từng mơ hình đon lẽ

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

businesses, economic situations, political fluctuations, and investors' perspectives

Therefore,predictingthe development direction ofthe stock market is consideredone

of the mostextensive and valuable fields in the financial sector.

processing (NLP) models to process input data, label data, and combine many

machine learning technical models (ML) for building calculation models andpredicting stock prices.

closing prices.

The results of the experiments show that the proposed model achieves high

including accuracy, validity Fl, AUC value on each single model

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<b>LỜICAM ĐOAN</b>

Tôi xác nhận rằng kết quả thu đượctrong luận văn là kết quả củacơng trình nghiên

tài liệu(nếu có) đã được thực hiện theo quy định về trích dẫn và ghi nguồn tài liệutham khảo.

Tơi hồn tồn chịu tráchnhiệm và san sàng chấp nhận mọi hình thức kỷ luật theo quy

<i><small>(Chữ ký)</small></i>

<b>Võ Duy Quí</b>

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

1. Đặtvấn đề...xi

2. Mục tiêu nghiên cứu...xiii

3. Đốitượng và phạm vi nghiên cứu...xiii

4. Cáchtiếpcận và phương pháp nghiên cứu...xiii

5. Ý nghĩa thực tiễn của đề tài...xiv

TỔNG QUAN...<small>XV</small>CHƯƠNG 1 TỔNG QUAN VỀ CHÚNGKHOÁN VÀCỔPHIẾU...1

1.1 Tổng quan về thị trườngchứng khốn Việt Nam...1

1.1.1 Vai trị của thị trường chứng khoán...4

1.1.2 Phân loại thị trường chứng khoán...6

1.1.3 Cổ phiếu...6

1.2 Tổng quan vềthông tin của giá cổ phiếu...7

1.2.1 Các nhân tố ảnh hưởng đến tính thơng tin của giá cổ phiếu... 7

1.2.1.1 Các nhằn tố vĩ mô... 7

1.2.1.2 Các nhằn tố vi mơ...8

1.3 Phân tích chứng khốn...8

1.3.1 Phân tích cơbản (Fundamental analysis)...8

1.3.2 Phân tích kỹ thuật(Technical analysis)...9

1.3.3 Các chỉ số của chứng khoán Việt Nam...9

1.3.3.1 Chỉ số VN-index...9

1.3.3.2 Chỉ sốVN30...10

1.3.3.3 Chỉ sốHXN-index...11

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

1.3.3.4 Chỉ số UPCOM-index...11

1.3.4 Các chỉ số phân tích cơbản của chứng khốn...11

1.3.4.1 Chỉ số EPS -Thu nhập trên một cổphiếu...11

1.3.4.2 Chỉ số PE - Hệ số giá trên thu nhập...12

1.3.4.3 Chỉ số P/B - Giá thị trường/Giátrị sổ sách...13

1.3.5 Các chỉ số phân tích kỹ thuật của chứng khốn...13

1.3.5.1 Chỉ số SMA - Simple Moving Average...14

1.3.5.2 MACD - Moving AverageConvergence Divergence...15

1.3.5.3 Bollinger bands...16

1.3.5.4 RSI - Relative Strength Index...17

CHƯƠNG 2 KỸ THUẬT MÁY HỌCVÀ PHÂNTÍCH TIN TỨC TRONG THỊTRƯỜNG CHỨNG KHỐN...20

2.1 Các cơng trình nghiên cứu liên quan...20

2.2 Các phương pháp máy học được sử dụng trong đề tài...23

2.2.1 Phương pháp LogisticRegression...23

2.2.2 Phương pháp Random forest...25

2.2.3 Phương pháp Xgboots...27

2.2.3.1 Thuật toán LightGBM...29

2.2.3.2 Thuật toán CatBoost...30

2.2.4 Phương pháp Support Vector Machine...32

2.3 Phân tích xúc cảm từ tin tức ảnh hưởngđến cổ phiếu chứngkhoán...32

2.3.1 Giới thiệu BERT...36

2.3.2 Giới thiệu FinancialBERT...38

2.4 Một số thư viện được sử dụng trong đề tài...39

2.4.1 Thư viện TA-lib...39

2.4.2 Thư viện Vnstock...39

2.4.3 Thư viện TensorFlow...39

2.4.4 Thư viện beautifulsoup...40

CHƯƠNG 3 THỰC NGHIỆM ĐÁNH GIÁ KẾT QUẢ...41

3.1 Mơ hình đề xuất...41

3.2 Thu thập dữ liệu...42

3.2.1 Dữ liệu quá khứ cổ phiếu...42

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

3.2.2 Dữ liệu chỉ số kĩ thuật và dữ liệu chỉ số cơbản của cổ phiếu...43

3.2.3 Dữ liệu tin tức...45

3.3 Phương tiện và công cụ triển khai...46

3.4 Phương thức...47

3.4.1 Gán nhãn dữ liệu...47

3.4.2 Truy xuất và phân tích dữ liệu tin tức...48

3.4.3 Chuẩn hóa dữ liệu... 50

3.4.4 Phươngthức đánh giá mơ hình...50

3.4.5 Thử nghiệm mơ hình...52

3.4.5.1 Mơ hình thử nghiệm RandomForest chưa cócácdữ liệu phân tíchxúc cảm...52

3.4.5.2 Mơhình thử nghiệm Logistic Regression với tất cảtập dữ liệu...53

3.4.5.3 Mơhình thửnghiệm Support Vector Machinevới tất cả tập dữ liệu...53

3.4.5.4 Mơhình thử nghiệm XGBoost với tất cả tập dữ liệu...54

3.4.5.5 Mơhình thử nghiệm Randomforest với tất cả tập dữ liệu...55

3.4.5.6 Điều chỉnh các tham số trong mơ hình phân loại dự đốn...55

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

Hình 2.2 Mơ hình Random Forest,...25

Hình 2.3 Mơ hình hoạt độngcủa XGBoots...27

Hình 2.4 Cách hoạt động của tính năngtăng cườngcây...29

Hình 2.5 Minh họa sự khác nhau giữa 2 cơ chế Level-wise và Leaf-wise...30

Hình 2.6 Tồn bộ tiến trình pre-training và fine-tuning của BERT...37

Hình 2.7 Thư viên vnstock...39

Hình 3.1 Mơ hình đềxuấttổng qt...41

Hình 3.2 Dữ liệu q khứ của vn-index...42

Hình 3.3 Dữ liệu cổ phiếu của Cty Vinamilk mã chứng khốn VNM...43

Hình 3.4 Dữ liệu chỉ số cơbản của mãcổ phiếu VNM...44

Hình 3.5 Dữ liệu chỉ số kỹ thuật và chỉ số cơbản của mã cổ phiếu VNM...44

Hình 3.6 Nguồn dữ liệu tin tức tài chính liên quan đến mã chứngkhốn VNM....45

Hình 3.7 Nguồn dữ liệu tin tức tài chính liên quan đến mã chứngkhốn SSI...46

Hình 3.8 Dữ liệu tin tức của mã cổ phiếu VNM sau khi thuthập và lưu trữ cục bộ48Hình 3.9 Dữ liệu tin tức của mã cổ phiếu TCB sau khi thu thập và lưu trữ cục bộ..48

Hình 3.10 Dữ liệu tin tứcsau khi được dịch sang tiếnganh...49Hình 3.11 Kết quả sau khi sử dụng model phân tích xúc cảm của mộtcổ phiếu 50

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

<b>DANH MỤC BẢNG BIỂU</b>

Bảng 1.1 Diễn biến chỉ sốVN-INDEX năm 2022...3

Bảng 1.2 Giá trị vốn hóa thị trường cổ phiếu...4

Bảng 2.1 Kích thước của văn bản được thu tập từ nhiều nguồn khác nhau của bàibáo [33]...:... 38

Bảng 3.1 Biểu đồ giácủamãcổ phiếu VNM sau khi gán nhãn dữ liệu...47

Bảng3.2 Kết quả thực nghiệm dữ liệu áp dụng model Randomforestchưathêm dữ liệu phân tích xúc cảm...52

Bảng 3.3 Kết quả thực nghiệm dữ liệu áp dụng model Logistic Regression...53

Bảng3.4 Ket quả thực nghiệm dữ liệu áp dụngmodel Support Vector Machine ....53

Bảng 3.5 Ket quả thực nghiệm dữ liệu áp dụng model XGboost...54

Bảng 3.6 Kết quả thực nghiệm dữ liệu áp dụngmodel Randomforest...55

Bảng3.7 Ket quả thực nghiệm dữ liệu áp dụng model Randomforest + RandomizedSeach...56

Bảng 3.8 Ket quả thực nghiệm dữ liệu áp dụng modelRandomforest + Grid Search...56

Bảng3.9 kết quảthử nghiệm trên các mô hình...57

Bảng3.10 Biểu đồ ROC các mơ hìnhdự đốn phân lóp...57

Bảng 3.11 Thống kê tưong quan các dữ liệu đầu vào trongmơ hình dự đốn...58

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<b>DANH MỤC TỪ VIẾT TẤT</b>

AreaUnderthe Curve

Bidirectional Encoder Representations from Transformers

Deep Learning

Doanh nghiệp nước ngoài

Earning PerShare

Machine learning

Return on Total Assets

Relative Strength Index

Simple Moving Average

Thị Trường Chứng Khoán

Extensible Markup Language

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<b>MỞ ĐẦU</b>

<b>1. Đặt vấn đề</b>

Thị trường chứng khoán ViệtNam từ khi ra đời tới nay đã trải qua các giai đoạn phát

triển thăngtrầm cùng với sự biến độngcủa nền kinh tế trong nước lúc tăng, lúc giảm.

giácổ phiếu làchỉ số được chú ý nhiều nhất trên các TTCK.

Biến động giácổ phiếu rấtquan trọng vì nó có thể ảnh hưởng đến lợi nhuận hoặc thua

có thể bị thua lỗ.

Biến động giá cổ phiếu cũng có thể ảnh hưởng đến sự tin tưởng củacác nhà đầu tưvào công ty. Nếu giá cổ phiếu của một công ty giảm đột ngột, các nhà đầu tư có thể suy nghĩ tiêu cực về tình hình hoạt động của cơng ty đó và có thể bán cổ phiếu ra.

Giá cổ phiếu chịu ảnh hưởng của nhiều yếu tố khác nhau, trong đó có các thông tin

thông tin về cân đối tài sản, thu nhập và dịng tiền củadoanh nghiệp được trình bày trên báo cáo tài chính. Tại các TTCK phát triển, đãcó nhiều nghiên cứu về mối quanhệ giữa giá cổ phiếu với thơng tin kế tốn (lợi nhuận kế tốn, lợi nhuận cơbản trên

mỗi cổphiếu, giátrị sổsách trên mỗi cổ phiếu) điển hình, như: Ball và Brown (1968),

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

phiếu trên TTCK New York. Kết quảcho thấy, lợi nhuận đượccông bố trên báo cáo

Nhắc đến TTCK, nhiều người sẽ nghĩ đến ngay nhữngchiến lược kinh doanh hết sức

lợinhuận củacông ty qua từng thời kỳ nhất định, sự vận độngcủa dòng tiền,... Điều

triển của doanh nghiệp trước khi quyết định đầu tư vào mộtcổ phiếu. Một cơngty cóhoạt động tài chính ổn định và vững mạnh thì cổ phiếu cũng có khả năng sinh lợinhuận tốt hơn và ngược lại. [1]

Thị trường chứng khốn ln thu hút các nhà đầu tư do khả năng sinh lời cao, tuy

giảmthiểu rủi ro với hy vọng có thể tốiđa hóalợi nhuận. Ngày nay, các mơ hình Máy

dữ liệu cho phép các doanh nghiệp gặt hái được nhiều lợi ích nhất có thể. Các mơ

thực tiễn. Chủ đề này đã được nhiều nhà nghiên cứu trong và ngoài nước quan tâm

và đưa ra nhiều giải pháp. Mỗi giải pháp có những ưu nhược điểm khác nhau, tuynhiên sử dụng máy học là giải pháp manglại kếtquả tốt. Vì cáclý do trên tôi đã lựa

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

chọn đề tài “ứng dụng Machine Learning và Phân tích xúc cảm cho giao dịch cổ

<b>2.Mục tiêu nghiên cứu</b>

Luận văn này tập trung nghiên cứu giải quyết bài toán dự đoán giá cổ phiếu trên thị

trường cổ phiếu Việt Nam vói các cổ phiếu như Techcombank, Vinamilk, Cơng ty

Xem xét sự ảnh hưởng của tin tức đến những cơngty có thể được đề cập trực tiếp hay

<b>3. Đối tượng và phạmvinghiên cứu</b>

trí tuệnhântạo, nhằm áp dụng chúng vào phân tích mơhìnhdự đốn giácổ phiếu.

<b>4. Cách tiếp cận và phươngpháp nghiên cứu</b>

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

- Ảp dụng phương pháp nghiên cứu tài liệu, tậptrung vào cáckỹ thuậtxử lý số liệu, trí tuệ nhân tạo và đặcbiệt áp dụng các thuật toán máy học kết hợp xử lý ngôn ngữ

tự nhiên.

<b>5. Ý nghĩa thực tiễn của đề tài</b>

Ýnghĩa khoa học:

trước đây đãthực hiện.

giácổ phiếu.

- Đánh giá hiệu suất của mơ hình bằng các thực nghiệm trên tập dữ liệu thực, từ đó

đưa số hiệu suất mơ hình và phân tích dữ liệu.

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

mơ, chỉ sốnày phản ảnh các quy luật cung cầu của thịtrường chứng khốn (TTCK)

tham giavào thị trường. Phưong pháp phân tích định lượng được sử dụng rộng rãi để

đầu tư tổng thể và tác động đến thị trường chứng khoán như kết quả kinh doanh của

phiếu. Những mẫu tin tứctrong túi từ ngữ khơng gian,trong đó phân tích mối quanhệtiềm ẩn giữa các mẫu thống kê từ và biến động giácổ phiếu.

Các bài báo tin tức được xem là dữ liệu phi cấu trúc. Nó là những thơng tin khơngđược định nghĩatrướcvề mơ hình dữ liệu hay cách thức tổ chức nội dung của dữ liệu,

kiểu dữ liệu và trường dữ liệu rõ ràng. Với sự khởi đầu của công nghệ kỹthuậtsố, dữ liệu đang pháttriển một cách mạnh mẽvà không ngừng nghỉ. Đặc biệt với dữ liệu về

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

Ngồi phần TƠNG QUAN, luận văn gồm các phần sau:

Phần cơ sở lý thuyếtbao gồm:

Chương 1: Tổng quan về chứng khoán và cổ phiếu.

Chương 2: Kỹ thuật máy học vàphân tíchtin tức trong thị trường chứng khốn.

Cuối cùng làphần Kết luận vàKiến nghị, tổng hợp các kết quả chínhcủa luận văn và đề xuấthướng nghiên cứu tiếp theo.

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

<b>CHƯƠNGTỔNG QUANVỀ CHỨNG KHỐN VÀ CỎPHIẾU</b>

phiếu. Ngồi ra, chương này cũng trình bàymộtsố cơ sỡ lý thuyết liên quan.

<b>1.1 Tổng quan về thị trường chứngkhoán Việt Nam</b>

Theo điều 6 củaLuậtchứng khốn Việt Nam thì: <i>“Chứng khốn làbằng chứng xác </i>

Thị trường chứng khoán giúp những người thiếu vốn huy động được vốn vàngười cóvốn chuyển vốn của mình thành vốn đầu tư. Vì thế, thị trường chứngkhốncịn được

Thị trường chứng khoán Việt Nam đã đi vào hoạt động từ năm 2000, đến nay, sau

hơn 20 năm hoạt động đãtrởthành một kênh huy động vốn dài hạn cho đầu tư phát

gần 2,9 triệu đồng, gấp gần 10 lần so với giai đoạn 2000 - 2010, đónggóp bình qn19,5%tổng mức đầu tư tồn xã hội, gópphần cơ cấu lại hệthống tàichính Việt Namtheo hướng cằn đối, bền vững hơn.

Thị trường chứng khoán ngày càng đa dạng về mặt hàng hóa giao dịch. Trên thị

trường cổ phiếu hiện có hơn 1.000 cổ phiếu niêm yết và đăng ký giao dịch (tính đếncuối năm 2020 có 745 cổ phiếu niêm yết và 910 cổ phiếu đăng ký giao dịch), bao

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

cổ phần hóa các doanh nghiệp nhànước (DNNN) quy mô lớn gắn với niêm yết trên

thị trường chứng khoán đãtạo ra một lượng hàng hóa có chất lượng trên thị trường.

Tính đến cuối năm 2020, vốn hóa thị trường đạt 64,1% GDP, gấp 7,3 lần so vói năm2010 .

Thị trường chứng khốn Việt Nam đã khơng ngừng hồn thiện về cấu trúc thơng qua

trường chứng khốn phái sinh đã phát triển nhanh chóng với mức tăng trưởng giao

hữu hiệu.

Thị trườngtrường chứng khốnViệt Nam đãpháttriển mạnh mẽ, trởthành kênh huy

phần cơ cấu lại hệthống tài chínhViệtNam theo hướng cân đối, bền vững hơn. Tính

2010,... [2]

chuẩn và thơng lệ về quản trị cơng ty, năng lực quản lý, giám sát, thanh tra và thực

làm trung tâm. Các chính sách quản lý TTCK đãthực hiện được mục tiêu tăng cường

tính cơng khai, minh bạch thông tin,...

Tiếp nối đàtăng của năm 2021, chỉ số thị trường đã duytrì được mứctăng mạnh mẽ

vào ngày 6/1/2022. Tuy nhiên, sau đó trước những ảnh hưởng đến từ tình hình kinh

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

tế -xã hội trong vàngoàinước,TTCKViệt Nambước vào giaiđoạn điều chỉnh mạnh

và đạt mức thấp nhất vào ngày 15/11/2022 vói chỉ số VN-Index đóng cửa ở mức

chỉ số VNIndexđạt 1007,09 điểm, giảm 34,12% so với mức đỉnh được thiết lập đầunăm và giảm 32,8% so vói cuối năm 2021. Bên cạnh đó, chỉ số HNX-Index cũng

Bảng 1.1 Diễnbiếnchỉ sốVN-INDEX năm 2022

43% sovớinăm 2021. Trong khi đó, khối lượng cổ phiếu hủy NY/ĐKGD đạt3.804triệu cổ phiếu, tăng70% so vói năm 2021 .Tínhđến cuối tháng 12/2022, thịtrường có

757 cổ phiếu, CCQniêm yết trên 2 SởGDCK và 856 cổ phiếu ĐKGD trên UPCoM

với tổng giá trị niêm yết, ĐKGD đạt 1.983 nghìn tỷ đồng, tăng 14% với cuối năm2021 (tương đương 20,8%GDP ướctính năm 2022). [3]

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

Bảng 1.2 Giátrị vốn hóa thị trường cổ phiếu

<small>■ HOSE■■HNX■UPCOM—•—%GDP</small>

<i>ỉ. 1.1 Vai trị của thị trường chứng khoán</i>

Thịtrường này hoạt động thuhút nhũng nhà giao dịch đầu tưtừ cá nhân, doanh nghiệp

Cung cấpchocác nhà đầutư một nơi đểđầu tưan toàn vàlành mạnh, thị trường này phân biệt rấtrõ, vói những ai có nhiềukiến thức và kinh nghiệm sẽ được trả công

bằng lợi nhuận họ kiếm được. Những người mói cần học hỏi nhiếuhơn thì mới có

thề đứng vững ở thị trường biến động này. Thị trườngcũng cung cấp rất nhiều sản

đích và phù hợpvói chiến lược kinhdoanhmà họ mong muốn.

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

Thị trường chứng khoán được nhiều người đầu tư vào thì nó sẽ tạo được một thị

trường cóthanh khoản lớn, họ có thể đổi được tiền mặt hoặc giao dịch chứng khốn

đanghoạt động trên thị trường có tốt haykhơng,giúpcác nhà đầu tư có thể biết cách

Yeu tố thông tin là yếu tố cạnh tranh trên thị trqờng sẽ đảm bảo cho việc phân phối

phủ. Đồng thời,TTCK cũng cung cấp mộtdự báotuyệtvời về các chu kỳ kinh doanh

Ngồi những tác động tích cực trên, TTCK cũng có những tác động tiêu cực nhất

túngthị trường làm nản lịng các nhà đầu tưtác động tiêu cựctói tiết kiệm vàđầu tư.

Nhiệm vụ của các nhà quản lý thị trường là giảm thiểu các tiêu cực của thị trường

nhằm bảo vệquyền lọicủa các nhà đầu tư và đảm bảotính hiệu quả của TTCK

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

Như vậy, vai trị của TTCK được thể hiện ởnhiều khíacạnh khác nhau. Song để vai

<i>ĩ. 1.2 Phân loại thị trường chứng khoán</i>

Thị trường so cấp: Làthị trường muabán các chứng khoán mới phát hành. Trên thị

trường này, vốn từ nhà đầu tư sẽ được chuyển sang nhàpháthành thông qua việc nhà đầu tư mua các chứng khoán mới phát hành

trường socấp.Thị trường thứcấp đảm bảo tính thanh khoản cho các chứng khoán đã

<i>1.1.3 Co phiếu</i>

nhau gọi là cổphần. Người muacổ phần gọi là cổ đông, cổ đông được cấp mộtgiấy

cổ phiếu. Như vậy, cổ phiếu chính là một chứng thư chứng minh quyền sở hữu củamộtcổ đông đối với một cơng ty cổ phần và cổ đơng là người có cổ phần thể hiệnbằng cổ phiếu.

Thông thườnghiện nay các công ty cổ phần thường phát hành 02 dạng cổ phiếu: cổ

</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">

<b>1.2Tổng quan về thôngtin của giá cỗphiếu</b>

cổ phiếu là chỉ dấu giúp các nhà quản trị nhận biết phản ứngcủa thị trườngvềnhữngquyết định của nhà quản trị, dovậy giúp họ đưara những quyết định quản trị tốt hơn

nhằm hướng đến làm tăng giátrị công ty. Tính thơng tin của giácổ phiếu cho phép

Chen, Goldstein & Jiang, 2007)

<i>1.2.1 Các nhân to ảnh hưởng đen tính thơng tin của giá co phiếu</i>

Morck, Yeung & Yu (2000) là một trong những nghiên cứu đầu tiên đưara quan điểmvề ảnh hưởng của môi trường thể chế quốc gia đến tính thơng tin của giá cổ phiếu

có mơi trường thể chế yếu hoặc thiếu sự bảo vệ quyền lợi của nhà đầu tư so với các

với sự yếu kém trong việcbảo vệ quyền lợi nhà đầu tư làm cho tính thơng tincủa giá

cổ phiếu thấphơn. Li và cộng sự(2004) thấy rằng tính thơng tincủa giácổ phiếuthấp

Fernandes & Ferreira (2009) đánh giá tác động của việc thực thi luật giao dịch nộigián đến tính thơng tin của giá cổ phiếu. Brockman, Liebenberg & Schutte (2010)

thấy rằng tính thơng tin của giácổ phiếu giảm trong thời kì suy thối kinh tế và tăng

thấp ở những nước có nhiều ràngbuộc khắt khe về văn hóa và ở những nước đề cao

chủ nghĩatập thể.

</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27">

<i>ỉ. 2. ỉ.2 Các nhân tốvi mô</i>

thông tin của giá cổ phiếu. Brockman & Yan (2009) thấy rằng cổ đông lớn giúp cảithiện vấn đề quản trị công ty và gia tăng chất lượng của thông tin được công bố ra

bằng chứng cho thấy tính thơng tincủa giá cổ phiếu có quan hệ thuận với sở hữu cổ

Trung Quốc. Kim & Shi (2012) thấy rằng cổ phiếu của những công ty áp dụng cácchuẩn mực IFRS mang tính thơng tin cao. Haggard, Martin & Pereira (2008) cung

cấp bằng chứngcho thấy việc tăng cườngcơng bố thơng tin tự nguyện làm tăngtínhthơng tin của giá cổ phiếu.

<b>1.3Phân tích chứngkhốn</b>

cho việc ra quyếtđịnh đầu tư trong thị trường chứng khốn. Phân tích chứng khốn

phưong pháp này vẫn gây khơng ít hiểu lầm cho nhà đầu tư chứng khốn, tuy có rất

nhiều cơsở và cách tiếp cận để phằn tích chứng khốn nhưng hai phương phápđược

<i>1.3.1 Phân tích cơ bản (Fundamental analysis)</i>

Phân tích cơbản là phương pháp nhằm xác định giá trị nội tại củacổ phiếu trên thị

trường bằng cách kiểm tra các tác nhân cơbản cótác động hoặc làm thayđổi đến giácổ phiếu. Cụ thể, nhà phân tích cơ bản tập trung xem xét các báo cáo tài chính củadoanh nghiệp, các phân tích vĩ mơ như phân tích ngành mà cơng ty đang hoạt động,

</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">

phân tích trạngthái nền kinh tế hay phân tích vi mơ như mơ hình hoạt động và hiệu

quả quản lý củacơng ty để ra quyết định đầu tư. Từ đó, hoạt động phân tích co bản

<i>1.3.2 Phân tích kỹ thuật (Technical analysis)</i>

Phân tích kỹ thuật khơng giống với phân tích cơ bản. Ở phương pháp này, cácnhà

phân tích sẽ căn cứ vào biểu đồ, đồ thị diễn biến giá và khối lượng giao dịch của cổ

khuyến nghị mua - bán cổ phiếutrên thịtrường.Xét vềbản chất, quan điểm phân tíchkỹthuật cho rằng có mẫu hìnhtrong q khứcó xu hướng quyluật (lặp lại) vì vậy có

trị vốn hố củathị trường cơ sở(ngày 28/07/2000) nhằm thể hiện xu hướng giá cổ

Hiểu đơn giản làchỉ số Vn-Index cho chúng ta biết được giá trị vốn hoá củathị trường

khi giao dịch ngày đầu tiên (ngày 28/07/2000). [6]

VN- Index được tính theo cơng thức sau:

</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">

<small>Qiì:</small> Khối lượng đang lưu hành (khối lượngniêmyết) của cổphiếu i

Q

:

Khối lượngcủacổ phiếu i tại thờikì gốc

gồm 30 cổ phiếuđã niêm yếttrên sànchứng khốn HSX. Giá trị của 30 cổ phiếu này

thị trường.

trên VN30, nhà đầutư có thể xác đinh cácdoanh nghiệphàng đầu trong mộtlĩnhvực

cụ thể, từ đó nhận biết xu hướng thị trường và đưa ra quyết đinh đầu tư phù hợp.

<b><small>Phụ lục 14: Dự báo tỷ trọng các cốphiếu trong VN30</small></b>

<b><small>tínhchỉ số</small></b>

<b><small>Tý lệ FFGiới hạn tỷ trọng VH%</small></b>

</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">

Hình 1.1 danh sách cổ phiếu VN30

(HASTC), chỉ số HNX-index cịn có tên làHASTC-index.

chúngchưaniêm yết (Unlisted Public Company Market).Các mã cổ phiếu của doanh

<i>ỉ. 3.4 Các chỉ so phân tích cơ bản của chứng khoán</i>

Các chỉ số co bản thường đượcnhữngnhà đầu tư nhắc đến trong trường phái phân tích cơbản. Các nhà đầu tư sẽ sử dụng báo cáo tài chính, xu hướngngành, cũng như

mộtdoanh nghiệp, cũng như triển vọng của doanhnghiệp đótrong tương lai.

Việc phân tích các chỉ số cơ bản sẽ giúp nhà đầu tư xác định được giátrị tương đối

của một doanh nghiệp và nắm bắt cơ hội đầu tư vào cổ phiếu của doanh nghiệp đó.

EPS (Earning Per Share) được hiểu là lợi nhuận mànhà đầu tư cóthể kiếm được trên

mỗi cổ phiếu. Đây là mộtchỉ sốchothấy khảnăngtạo ra lợi nhuận của công ty, như

ty. EPS càng cao, tiềmnăng lợi nhuận của công tycàng lớn.

</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">

EPS = (LỢINHUẬN SAU THUẾ- LỢI TỨC ưu ĐẪI) / SỐ

Có hai loại chỉ số EPS:

Lãi cơbản trên cổ phiếu: là lãi cơbản trên cổ phiếu tính theo tỷ lệ phần trăm

chuyển đổi hoặc cổ phiếu uu đãi hoặc cổ phiếu bổ sung.

một đồng lợinhuận thu được từ cổ phiếu. P/E thấp có thể làdo định giá thấp, doanh

P/E = THỊ GIÁCỔ PHIẾU (PRICE)/ LỢI NHUẬN TRÊN 1

được baonhiêu lợi nhuận từ 1 đồng vốn chủ sở hữu. Chỉ sốnàythường được nhữngnhà đầu tưtrường phái cơbản quantâm vì họquantâm đếnhiệu quả của việc sử dụngvốn của doanh nghiệp như thế nào

Chỉ số ROA (Return on Total Assets): thể hiện tỷsuất sinh lời trêntài sản. Chỉ số này

</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32">

của doanh nghiệp đượchìnhthành dựa trên 2 yếu tố cơbản là vốn vay và vốn chủ sở

hữu.Neu chỉ số ROA đang ởmức cao thì đồngnghĩalà cơng ty đó đang cólợi nhuận caovới lượng đầu tư ít.

Chỉ số P/B (Price to Book ratio) được dùng để so sánh giá trị hiện tại của cổ phiếu

đang lưu hành trên thị trường đối với giátrị theo sổ sách của cổ phiếu đó. Hiểu một

<small>Tống giá trị tài sản - giá trị tài sản vơ hình - nợ</small>

<i>1.3.5 Các chỉ sỗ phân tích kỹ thuật của chứng khốn</i>

Nếu như nhà đầu tư sử dụng phân tích cơbản để nghiên cứu doanh nghiệp, ra quyếtđịnh mua thì phân tíchkỹ thuật sẽ giúp dự đốn xu hướng giá tươnglai, giúpnhà đầu

tư tìm được thời điểm tham giaphù hợp.

Các nhà phân tích kỹ thuật cũng sử dụng rộng rãi nhiều loại chỉ báo thị trường, một vài trong số đó là các biến đổitốn học của giá cả, thường bao gồm cả khối lượnglên

</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33">

xuống, dữ liệu tăng/giảm và các đầu vào khác. Những chỉ sốnày được sử dụng để

giúp đánh giá liệu một tài sản có đang trongxu hướng khơng, vànếu nó là trong xuhướng, khả năng về hướng và sự tiếp diễn của nó lànhư thế nào. Nhà phân tích kỹ

thuật cũng tìm kiếm các mối quan hệ giữa các chỉ số giá/khối lượng và các chỉ báo thị trường.

kỳ thị trường chứng khốn hoặc, theo cách cổ điển, thơng qua sự cơng nhận của các

Hiện nay có rất nhiều chun gia kết hợp nhiều chỉ báo kết hợp trong phân tích kỹ

tương đối, chưa cóthống kê tuyệt đối với xu hướng của giá cổ phiếu.

Trong đề tài này tôi sẽ tiếpcận một số phương pháp phân tích kỹthuật được đề xuất.

Trung bình động (MA)làmộtđường biểu thị giá trị trung bình cộng củadữliệu trước

mức giá mới hơn) hơn.

Chỉ số đứng đầu SMA là chu kỳ giá đóng cửa mà đường trung bình động biểu thị.

Đường trung bình động phân tích biến động trung hạn: SMA 50.

</div><span class="text_page_counter">Trang 34</span><div class="page_container" data-page="34">

Trong đó:

Gi-Gn: là mức giá đóng cửa trong 1 chu kỳcần xác định biến động

vào cuối những năm 1970. Chỉ báo này dùng đểxác địnhđà của một cổ phiếu (hoặc

đã xảy ra trong quá khứ). MACD giúp các nhàgiao dịch phát hiện các diễm vào và

Đường MACD xác định xu hướng thị trường (tăng hoặcgiảm), có giá trị bằng

Đường tín hiệu là một EMA của đường MACD (thường là EMA của 9 giaiđoạn). Phân tích kết hợp EMA với đường MACD có thể phát hiện các điểm đảo

Biểu đồ được tính dựatrên sự chênh lệch giữahai đường MACD và đường tín

<b><small>Moving Average Covergence Divergence (MACD) ■ Chi báo trung binh biền đôi phân kỳ hôi tu 12 26 close 9 -1 59 -1 23</small></b>

</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35">

Chỉ báo Trung bình động Hội tụ Phân kỳ gồm có 3 bộ phận chính: đường MACD

Đường MACDđược tạothành bằng cách lấy đường trung bình động luỹ tiến(EMA) 12 kỳ trừ cho một đường trung bình động nhỏ hon làEMA 26 kỳ.

Đường tín hiệu là đường EMA 9 kỳ của đường MACD.

Biểu đồtần suất cho thấy tưong quan chênh lệch giữa đườngMACD và đường tín hiệu.

phương pháp phân tích kỹ thuật. Nó được phát minh vào đầu năm 1980 bởi John

biến động mạnh/ nhẹ của thị trường mà2 dải trên dưới sẽ mởrộnghoặc thu hẹp.

Trongdải Bollinger, siết chặtlà 1 khái niệm quan trọngchỉ trạng thái các dải đến gần

càng cao.

</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36">

Hình 1.3 Bollinger bands

phátrên hay dưới các dải đều là một sự kiện lớn. Tuy nhiên, cả siếtchặtvà điểm đột

pháđềukhơng phải làmột tín hiệu giao dịch.

Dải giữalà đườngtrung bình độngchu kỳ 20 ngày (SM A20), được tính bằng giá trị

Dải dưới = SMA20 ngày -2x Độ lệchchuẩn 20ngày.

thiệu lần đầuvào 6/1978

</div><span class="text_page_counter">Trang 37</span><div class="page_container" data-page="37">

RSI không thể vượt qua đỉnh cũ. Phânkỳ này là dấu hiệu cho thấy khả năng đảo chiều

đỉnh/đáy trước các đỉnh/đáy của giá cổphiếu.

Failure Swings: Là hiện tượng giá/chỉ báo bứt phá qua ngưỡnghỗtrợ/khángcự nhưng

không thành côngvà quaytrở lại. Mầu hình Failure Swings xuất hiện khi RSI vượt

Ngưỡng hỗtrợ/kháng cự: RSI đôi khi giúp nhận biết các ngưỡng kháng cự và hỗ trợ

<b><small>» XAUUSOA130 1187.9« 1188.52 1187.08 1188.04</small></b>

<b><small>Aug 20183 Aug01:00 3 Aug 05:00 3Aug09:00 3 Aug 13:00 3 Aug 17:00 3 Aug 21006 Aug 02:00 KAu] 08:00 8 Aug 10:00 8 Aug 14:00 6 Aug18:006 Aug 22:007 Aug 03:00 7 Aug 0700 7 Aug11:00 7 Aug 15:00 7 Aug19:00</small></b>

</div><span class="text_page_counter">Trang 38</span><div class="page_container" data-page="38">

Cơng thức tính RSI được tính hai bướcnhư sau :

1 +

<small>Average gainAverage loss.</small>

Trong đó:

Average gain: Mức lãi trung bìnhAverage loss: Mứclỗ trung bình

</div><span class="text_page_counter">Trang 39</span><div class="page_container" data-page="39">

<b>CHƯƠNG 2 KỸ THUẬTMÁY HỌCVÀ PHẲNTÍCH TIN TỨCTRONG THỊ TRƯỜNG CHỨNG KHỐN</b>

Trong chương này, chúng ta sẽ xem xét hai phần chính. Phần đầu tiên tập trung vàogiới thiệu các mơ hình máy học và học sâu, đặc biệt là những kỹ thuật phổ biến được

áp dụng trong mơ hình dự đốn. Phần thứ hai tập trung vào giới thiệu các mô hình

chú ý trong lĩnh vực xử lý ngơn ngữ tự nhiên.

Với sự pháttriển của xã hội Máy học(Machine Learning)là một lĩnh vựccủa trítuệ

thống "học" tự độngtừ dữ liệu để giải quyết những vấn đề cụ thể. Ví dụ nhưcác máy

(statistical inference) tuy có khác nhau vềthuậtngữ.

Thị trường chứng khốn luôn thu hút các nhà đầu tư do khả năng sinh lời cao, tuy

giảm thiểu rủi ro với hy vọngcóthể tối đahóalợi nhuận. Ngày nay, cácmơ hình máy

học (Machine Learning) đã trở thành một cơng cụ phân tích mạnh mẽ được sửdụngđể trợ giúp và quản lý đầu tư hiệu quả. Các mơ hình này đã được sử dụng rộng rãi

trong lĩnh vực tài chính để cung cấp những phương pháp mới nhằm giúp các nhà đầutư đưara quyết định tốt hơn trong việc đầu tư chứng khoán

<b>2.1 Các cơng trìnhnghiêncứuliên quan</b>

</div><span class="text_page_counter">Trang 40</span><div class="page_container" data-page="40">

giữa mức độ dự đốn đúng giáchứng khốn vói việc sử dụng các phương pháp máy

thường được giải quyết bằng mơ hình LSTM (Long Short Term Memory). Nghiên cứu [14] đã thử nghiệm mô hình LSTM áp dụng cho giá mở cửa (open price) hàng

sàn giao dịch chứng khoán New York (NYSE) Kết quả cho thấynếu dữ liệu đào tạo ít nhưng cónhiều lớp mạng hơn có thể cải thiện kết quả thử nghiệm và cungcấp các

bài báo đã xuất bản từ năm 2015 đến đầu năm 2021 về giải quyết bài toán dự đoángiáchứngkhoán. Bàibáo của họ đãđánhgiá các chỉ số hiệu năng chínhcủa mơ hìnhgồm RMSE, MAPE, MAE, MSE, độ chính xác, tỷ lệ Sharpe và tỷ lệ hoàn vốn. Bài

báonày đã chỉ ra rằng phần lớn cácnghiên cứu bài toán dự báo giáchứng khốn sử

Cơngtrình [16] đãáp dụngmơ hình mạng nơ-rơn tíchchập có cải tiến tính năng học

hơn 7,38% so với mơ hình LSTMtruyềnthống. Cơng trình [17] đãsử dụng các thuật

dụng các kỹ thuật Linear Regression, Multivariate Regression, Support Vector

Regression, Decision Tree, Random Forest Regressor and ExtraTree Regressor. Ket

Random Forest chưacungcấp được giátrị dự đốn chính xác cao đối với bộ dữ liệu

</div>

×