Tải bản đầy đủ (.pdf) (34 trang)

đồ án dự báo giá cổ phiếu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.01 MB, 34 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA CÔNG NGHỆ PHẦN MỀM

BÁO CÁO ĐỒ ÁN 1
Đề tài: Dự đoán giá cổ phiếu
Giảng viên hướng dẫn:
ThS. Huỳnh Tuấn Anh

Sinh viên thực hiện:
Đồn Cơng Minh - 18521092
Lương Duy Bảo - 18520484

1


LỜI CẢM ƠN
Sau quá trình học tập và rèn luyện tại khoa Công nghệ phần mềm trường Đại học
Công nghệ Thông tin – ĐHQG TP.HCM, em đã được trang bị các kiến thức cơ bản cùng
các kỹ năng thực tế để có thể hồn thành Đồ án 1 của nhóm.
Để hồn thành đồ án này, với lịng biết ơn sâu sắc em xin gửi lời cảm ơn chân thành đến:
Ban Giám hiệu trường Đại học Công nghệ Thông tin – ĐHQG TP.HCM vì đã tạo
điều kiện thuận lợi để sinh viên tìm kiếm, nghiên cứu thơng tin với hệ thống thư viện hiện
đại, đa dạng các loại sách và tài liệu
Gần gũi hơn là những lời tốt đẹp nhất xin gửi đến đến thầy Huỳnh Tuấn Anh đã tận
tình giúp đỡ, định hướng cách tư duy và hướng làm việc khoa học. Đó là những góp ý hết
sức quý báu khơng chỉ trong q trình thực hiện luận văn mà cịn là hành trang tiếp bước
cho em trong q trình học tập và làm việc sau này.
Sau cùng, xin chúc q Thầy Cơ trong khoa Cơng nghệ Phần mềm nói riêng cũng
như các giáo viên tại trường Công nghệ thông tin nói chung thật dồi dào sức khỏe, niềm
tin để tiếp tục thực hiện sứ mệnh cao đẹp của mình.


Thành phố Hồ Chí Minh, tháng 11 năm 2021
Sinh viên 1
Đồn Công Minh
Sinh viên 2
Lương Duy Bảo

2


Nhận xét
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................
........................................................................................................................................................................

........................................................................................................................................................................
..........................................................................................................................................................................
..........................................................................................................................................................................

……., ngày……...tháng……năm 2021

Người nhận xét
(Ký tên và ghi rõ họ tên)
3


Mục Lục
Chương 1...................................................................................................................................................... 6
Lời mở đầu................................................................................................................................................... 6
1.1.

Lí do chọn đề tài .......................................................................................................................... 6

1.2.

Phương pháp nghiên cứu ........................................................................................................... 7

Chương 2...................................................................................................................................................... 8
CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN ............................................................... 8
2.1. Những vấn đề cơ bản về chứng khoán ........................................................................................... 8
2.1.1. Khái niệm chứng khoán ........................................................................................................... 8
2.1.2. Phân loại chứng khoán .............................................................................................................. 8
2.2. Tổng quan về thị trường chứng khoán .......................................................................................... 10
2.2.1. Khái niệm thị trường chứng khoán ......................................................................................... 10
2.2.2. Chức năng của thị trường chứng khoán ................................................................................. 11

2.2.3. Các chủ thể tham gia thị trường chứng khoán ..................................................................... 11
2.2.4. Các nguyên tắc hoạt động trên thị trường chứng khoán..................................................... 12
2.2.5. Cấu trúc và phân loại cơ bản của thị trường chứng khoán ................................................ 12
2.3. Học máy (Machine Learning) và Thị trường chứng khoán ....................................................... 13
2.4. Học sâu – Deep learning ................................................................................................................ 15
2.5. Mạng nơ-ron hồi quy RNN (Recurrent Neural Network)............................................................... 17
2.6. Vấn đề phụ thuộc xa ....................................................................................................................... 20
2.9. Dự đoán giá cổ phiếu ...................................................................................................................... 26
2.9.1. Tổng quan ................................................................................................................................. 26
Chương 3 .................................................................................................................................................... 27
Thực nghiệm ............................................................................................................................................... 27
3.1. Thu thập dữ liệu ............................................................................................................................. 27
3.2. Tiền xử lý dữ liệu ........................................................................................................................... 28
3.3. Xây dựng model ............................................................................................................................. 30
3.4. Dự đoán dựa trên model ................................................................................................................ 31
Chương 4 .................................................................................................................................................... 32
Kết luận ....................................................................................................................................................... 32
4.1. Kết luận............................................................................................................................................ 32
4


Tài liệu kham thảo ...................................................................................................................................... 33
Danh mục thuật ngữ và các từ viết tắt .................................................................................................... 34

5


Tóm tắt
Thị trường cổ phiếu có một vai trị quan trọng trong sự phát triển của xã hội hiện đại.
Chúng cho phép triển khai các nguồn lực kinh tế. Sự thay đổi giá cổ phiếu phản ánh những thay

đổi trên thị trường. Với khả năng xử lý dữ liệu mạnh mẽ trên nhiều lĩnh vực, học sâu cũng được
sử dụng một cách rộng rãi trong lĩnh vực tài chính như: dự đoán thị trường cổ phiếu, đầu tư tối
ưu, xử lý thơng tin tài chính và thực hiện các chiến lược giao dịch tài chính. Do đó, dự đốn thị
trường cổ phiếu được xem là một trong những lĩnh vực khá phổ biến và quý giá nhất trong lĩnh
vực tài chính.

Chương 1
Lời mở đầu
1.1.

Lí do chọn đề tài

Năm 2020, TTCK Việt Nam được đánh giá là 1 trong 10 thị trường có sức chống chịu và
phục hồi tốt nhất thế giới trong đại dịch, nhà đầu tư khép lại một năm trong trạng thái “thăng
hoa” khi giá trị danh mục đầu tư đã tăng trưởng đáng kể. Tổng giá trị huy động vốn qua thị
trường chứng khoán năm 2020 đạt 413.700 tỷ đồng, tăng 30% so với cuối năm 2019. Quy mơ
vốn hóa của thị trường cổ đạt 84,1% GDP năm 2020, vượt mục tiêu đề ra (đến năm 2020 đạt
70% GDP). Tổng dư nợ trên toàn bộ thị trường trái phiếu tính đến cuối tháng 12 năm 2020 đạt
khoảng 45% GDP, tăng 17,6% so với cuối năm 2019, trong đó dư nợ TPCP là 27,7% GDP, dư
nợ trái phiếu doanh nghiệp (TPDN) là 15,1% GDP.
Bà Tạ Thanh Bình, Vụ trưởng Vụ Phát triển thị trường, Ủy ban Chứng khoán Nhà nước
(UBCKNN) đánh giá, thị trường chứng khoán năm 2021 tiếp tục có nhiều yếu tố hỗ trợ, như: nền
kinh tế Việt Nam năm 2021 được đánh giá là có cơ hội phục hồi cao hơn so với nhiều nước khác
nhờ cơng tác quản lý, kiểm sốt tốt đại dịch COVID-19; việc Việt Nam tham gia các hiệp định
thương mại song phương, đa phương sẽ giúp nền kinh tế đất nước phục hồi nhanh; Việt Nam
cũng có nhiều khả năng hưởng lợi từ sự dịch chuyển hiện nay của các chuỗi cung ứng sang
những quốc gia có chi phí sản xuất thấp. Bên cạnh đó, nội tại TTCK trong nước năm 2021 sẽ có
nhiều thay đổi tích cực về chất; yếu tố nội tại của doanh nghiệp niêm yết cũng tương đối tốt.
“Kết quả kinh doanh của doanh nghiệp niêm yết theo báo cáo tài chính q IV/2020
(chưa kiểm tốn) ghi nhận 82% doanh nghiệp có lãi – mức tương đương với quý IV/2019. Với

việc Việt Nam vươn lên chiếm thị phần số 1 trong nhóm thị trường cận biên của MSCI sau khi
thị trường Kuwait được nâng hạng lên nhóm “mới nổi”, TTCK Việt Nam được kỳ vọng sẽ thu
hút đầu tư các quỹ đầu tư vào thị trường cận biên”, bà Tạ Thanh Bình cho biết.
Ơng Nhữ Đình Hịa, Tổng giám đốc Cơng ty Cổ phần Chứng khốn Bảo Việt (BVSC)
cũng cho rằng, với nền tảng kinh tế, chính trị ổn định, bên cạnh đó, kỳ vọng về tăng trưởng hồi
6


phục mạnh, các doanh nghiệp kinh doanh thuận lợi sẽ củng có thêm cho niềm tin về xu hướng
tích cực.
“Trong làn sóng dịch chuyển của dịng vốn ngoại vào các thị trường mới nổi (EM), Việt
Nam – một nền kinh tế mới nổi được dự báo sẽ trở thành điểm sáng thu hút sự quan tâm của
dòng tiền ngoại trong năm 2021. Bên cạnh đó, Việt Nam nhiều khả năng sẽ thu hút được thêm
dòng vốn ngoại vào thị trường để đón đầu xu thế nâng hạng TTCK Việt Nam từ thị trường cận
biên lên thị trường mới nổi”, ông Nhữ Đình Hịa nhận định.
Sự phát triển của TTCK Việt Nam đã góp phần thúc đẩy q trình cơ cấu lại nền kinh tế
trên cả 3 trụ cột: Cải cách doanh nghiệp nhà nước thơng qua cổ phần hóa, thối vốn nhà nước
bằng các cơ chế đấu giá minh bạch, hiện đại và gắn cổ phần hóa với đăng ký giao dịch, niêm yết
trên TTCK; Tái cơ cấu đầu tư công thông qua việc trở thành kênh huy động vốn quan trọng cho
ngân sách nhà nước; Hỗ trợ quá trình tái cơ cấu các tổ chức tín dụng, đặc biệt là các ngân hàng
thương mại tham gia niêm yết trên TTCK. Qua đó, nhằm giúp các nhà quản lý doanh nghiệp, các
nhà đầu tư và các cá nhân muốn tham gia thị trường chứng khốn có thơng tin đầy đủ và rõ ràng
hơn về giá cổ phiếu giúp mình đưa ra quyết định tham gia TTCK như thế nào để có lợi nhuận
cao và bền vững, cụ thể hơn trong q trình giao dịch cổ phiếu của mình. Từ đó nâng cao lòng
tin, độ tin cậy cao vào thị trường cổ phiếu nhằm đem lại sự thỏa mãn tối đa cho các nhà đầu tư
trên thị trường cũng là làm cho thị trường chứng khoán ngày một hiệu quả và hoạt động tốt hơn.
Chính vì lẽ đó dự đốn thì trường chứng khoán là một nhu cầu cấp thiết và có ý nghĩa thực
tiễn. Chủ đề này đã được nhiều nhà nghiên cứu trong và ngoài nước quan tâm và đưa ra nhiều giải
pháp. Mỗi giải pháp có những ưu nhược điểm khác nhau, tuy nhiên sử dụng học máy là giải pháp
mang lại kết quả tốt. Vì các lí do trên chúng em đã lựa chọn đề tài “Dự đốn giá cổ phiếu” là đề

tài cho mơn đồ án 1.

1.2.

Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý thuyết: Tổng hợp, nghiên cứu các tài liệu về cổ phiếu
chứng khoán; nghiên cứu các phương pháp, thuật toán sử dụng cho dự đoán giá cổ phiếu;
nghiên cứu các phương pháp học sâu vào thị trường cổ phiếu. Tìm hiểu các kiến thức liên
quan như thị trường chứng khoán, học máy, kỹ thuật lập trình trên máy tính.
- Phương pháp so sánh và đánh giá: phân tích đánh giá mơ hình đề xuất với các mơ
hình nghiên cứu trước bằng các độ đo khác nhau

7


Chương 2
CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN
2.1. Những vấn đề cơ bản về chứng khoán
2.1.1. Khái niệm chứng khoán
Chứng khoán là chứng chỉ dưới dạng giấy tờ hoặc bản ghi, có giá và có khả năng chuyển
nhượng, xác định khoản đầu tư dài hạn, xác nhận các quyền và lợi ích hợp pháp của người sở
hữu chứng khoán đối với tài sản hoặc vốn của tổ chức phát hành. Đối với mỗi loại chứng khốn
thường có các tính chất sau:


Thứ nhất, tính thanh khoản:

Tính lỏng của tài sản là khả năng chuyển tài sản đó thành tiền mặt. Khả năng này cao hay thấp
phụ thuộc vào khoảng thời gian và phí cần thiết cho việc chuyển đổi và rủi ro của việc giảm sút
giá trị của tài sản đó do chuyển đổi. Chứng khốn có tính lỏng cao hơn so với các tài sản khác,

thể hiện qua khả năng chuyển nhượng cao trên thị trường và nói chung, các chứng khốn khác
nhau có khả năng chuyển nhượng là khác nhau.


Thứ hai, tính rủi ro

Chứng khốn là các tài sản tài chính mà giá trị của nó chịu tác động lớn của rủi ro, bao gồm
rủi ro có hệ thống và rủi ro khơng có hệ thống. Rủi ro có hệ thống hay rủi ro thị trường là loại rủi
ro tác động tới toàn bộ hoặc hầu hết các tài sản. Loại rủi ro này chịu tác động của các điều
kiện kinh tế chung như: lạm phát, sự thay đổi tỷ giá hối đoái, lãi suất v.v. Rủi ro không hệ thống
là loại rủi ro chỉ tác động đến một tài sản hoặc một nhóm nhỏ các tài sản. Loại rủi ro này thường
liên quan tới điều kiện của nhà phát hành. Các nhà đầu tư thường quan tâm tới việc xem xét, đánh
giá các rủi ro liên quan, trên cơ sở đó đề ra các quyết định trong việc lựa chọn, nắm giữ hay bán
các chứng khoán. Điều này phản ánh mối quan hệ giữa lợi tức và rủi ro hay sự cân bằng về lợi tức
ư người ta sẽ không chịu rủi ro tăng thêm trừ khi người ta kỳ vọng được bù đắp bằng lợi tức tăng
thêm.


Thứ ba, tính sinh lợi

Chứng khốn là một tài sản tài chính mà khi sở hữu nó, nhà đầu tư mong muốn nhận được
một thu nhập lớn hơn trong tương lai. Thu nhập này được bảo đảm bằng lợi tức được phân chia
hàng năm và việc tăng giá chứng khoán trên thị trường. Khả năng sinh lợi bao giờ cũng quan
hệ chặt chẽ với rủi ro của tài sản, thể hiện trong nguyên lý ư mức độ chấp nhận rủi ro càng cao
thì lợi nhuận kỳ vọng càng lớn.

2.1.2. Phân loại chứng khoán

8



Cổ phiếu: Là loại chứng khoán xác nhận quyền sở hữu và lợi ích hợp pháp đối với thu nhập
và tài sản của cơng ty cổ phần. Số vốn đóng góp để thành lập cơng ty được chia ra thành nhiều
phần nhỏ bằng nhau gọi là cổ phần. Người mua cổ phần gọi là cổ đơng. Cổ phiếu có thể được phát
hành dưới dạng chứng chỉ vật chất hoặc bút tốn ghi sổ, chỉ có cơng ty cổ phần mới có cổ phiếu.
Giá trị ban đầu ghi trên cổ phiếu là mệnh giá của cổ phiếu. Mệnh giá là giá trị danh nghĩa. Số tiền
nhận được từ khoản góp vốn gọi là cổ tức. Giá cổ phiếu giao động qua các phiên giao dịch trên thị
trường chứng khoán và tách rời so với mệnh giá. Cổ phiếu được chia thành 2 loại:
- Cổ phiếu thường: Là loại cổ phiếu không có kỳ hạn, tồn tại cùng với sự tồn tại của cơng
ty phát hành ra nó, nó khơng có lãi suất cố định, số lãi được chia vào cuối mỗi niên độ quyết tốn.
Cổ đơng nắm giữ cổ phiếu này có quyền bỏ phiếu, mua cổ phiếu mới, tham gia vào đại hội cổ
đông.
- Cổ phiếu ưu đãi: Gồm 2 loại


Cổ phiếu ưu đãi biểu quyết: Là cổ phiếu dành cho các cổ đông sáng lập. Cổ đông nắm giữ
loại cổ phiếu này phải nắm giữ trong một khoảng thời gian nhất định, khơng được chuyển
nhượng, trao đổi.



Cổ phiếu ưu đãi tài chính: Tương tự như cổ phiếu thường nhưng có một số hạn chế: cổ
đơng nắm giữ cổ phiếu này không được tham gia bầu cử, ứng cử vào hội đồng quản trị,
ban kiểm sốt của cơng ty. Nhưng họ được hưởng ưu đãi về tài chính theo một mức cổ tức
riêng biệt, có tính cố định hàng năm, được ưu tiên chia cổ tức và phân chia tài sản cịn lại
của cơng ty sau khi thanh lý, giải thể trước cổ phiếu thường.

Trái phiếu Là loại chứng khoán quy định nghĩa vụ của người phát hành phải trả cho người
nắm giữ chứng khốn đó một khoản tiền xác định vào những thời hạn cụ thể và theo những điều
kiện nhất định. Đây là những chứng khoán nợ, được phát hành dưới dạng chứng chỉ vật chất hoặc

bút toán ghi sổ. Trái phiếu bao gồm các loại sau:
- Trái phiếu vô danh: Loại này không ghi tên trái chủ trên cả chứng chỉ và sổ sách của các
tổ chức phát hành. Việc chuyển nhượng loại trái phiếu này rất dễ dàng nên nó thường được giao
dịch trên thị trường chứng khoán.
- Trái phiếu ghi danh: Ghi tên, địa chỉ của trái chủ trên chứng chỉ và sổ sách của tổ chức
phát hành. Loại này ít được đem trao đổi trên thị trường.
- Trái phiếu chính phủ: Là loại trái phiếu do chính phủ phát hành nhằm bù đắp cho thâm
hụt ngân sách. Đây là loại chứng khoán mà các nhà đầu tư khơng ưa mạo hiểm rất ưa thích vì nó
hầu như khơng có rủi ro thanh tốn.
- Trái phiếu cơng trình: Là loại trái phiếu được phát hành để huy động vốn xây dựng các
cơng trình cơ sở hạ tầng hay cơng trình phúc lợi cơng cộng.
9


- Trái phiếu công ty: Do công ty phát hành để vay vốn trung và dài hạn. Khi công ty bán
trái phiếu thì cơng ty là người đi vay của người mua, người mua là chủ nợ. Công ty phải cam kết
trả cả lãi và gốc cho trái chủ như đã nêu trong hợp đồng. Nó bao gồm các loại: Trái phiếu có đảm
bảo, trái phiếu khơng có bảo đảm, trái phiếu có thể mua lại…
Chứng chỉ quỹ đầu tư Là chứng khốn được phát hành bởi cơng ty quản lý quỹ để huy
động vốn từ các nhà đầu tư. Vốn được dùng để mua bán kinh doanh các loại chứng khốn khác để
kiếm lời, sau đó chia tiền lời đó cho các nhà đầu tư. Có thể phân loại chứng chỉ quỹ đầu tư thành:
- Quỹ đầu tư chung: Đây là loại quỹ mà tất cả mọi người đều có thể tham gia.
- Quỹ đầu tư riêng: Chỉ giới hạn ở một nhóm người nhất định.
- Quỹ đầu tư dạng mở: Là quỹ đầu tư trong đó nhà đầu tư có quyền bán lại chứng chỉ quỹ
đầu tư cho quỹ phát hành chứng khoán liên tục để huy động vốn và sẵn sàng mua lại số chứng
khốn mà nó đã phát hành ra.
- Quỹ đầu tư cổ phiếu: Quỹ chuyên đầu tư vào một loại cổ phiếu nhất định.
- Quỹ đầu tư trái phiếu: Là quỹ để đầu tư vào một loại trái phiếu nào đó.
- Quỹ đầu tư hỗn hợp: Loại quỹ đầu tư vào bất kì loại chứng khốn nào nếu thấy có hiệu
quả. Ngồi ra, cũng có một số loại chứng khốn khác (thường gọi là công cụ phái sinh) như: Giấy

bảo đảm quyền mua cổ phiếu, các hợp đồng kì hạn, chứng quyền…

2.2. Tổng quan về thị trường chứng khoán
2.2.1. Khái niệm thị trường chứng khoán
Thị trường chứng khoán là một thị trường mà ở đó người ta mua bán, chuyển nhượng, trao đổi
chứng khốn nhằm mục đích kiếm lời.
Thị trường chứng khốn trong điều kiện của nền kinh tế hiện đại, được quan niệm là nơi diễn ra
các hoạt động giao dịch mua bán chứng khoán trung và dài hạn. Việc mua bán này được tiến hành
ở thị trường sơ cấp khi người mua mua được chứng khoán lần đầu từ những người phát hành, và
ở những thị trường thứ cấp khi có sự mua đi bán lại các chứng khoán đã được phát hành ở thị
trường sơ cấp. Như vậy, xét về mặt hình thức, thị trường chứng khốn chỉ là nơi diễn ra các hoạt
động trao đổi, mua bán, chuyển nhượng các loại chứng khốn, qua đó thay đổi chủ thể nắm giữ
chứng khoán.

10


2.2.2. Chức năng của thị trường chứng khốn






Huy động vốn đầu tư cho nền kinh tế
Cung cấp môi trường đầu tư cho cơng chúng
Tạo tính thanh khoản cho các chứng khốn
Đánh giá hoạt động của doanh nghiệp
Tạo mơi trường giúp Chính phủ thực hiện các chính sách kinh tế vĩ mơ


2.2.3. Các chủ thể tham gia thị trường chứng khốn
Nhà phát hành: là các tổ chức thực hiện huy động vốn thơng qua thị trường chứng khốn.
Nhà phát hành có thể là Chính phủ, chính quyền địa phương, Cơng ty.
o
o
o

Chính phủ phát hành các loại trái phiếu chính phủ nhằm huy động tiền bù đắp thâm hụt
ngân sách hoặc thực hiện những cơng trình quốc gia lớn.
Chính quyền địa phương phát hành trái phiếu địa phương để huy động tiền đầu tư cho
các cơng trình hay chương trình kinh tế, xã hội của địa phương.
Các công ty muốn huy động vốn đầu tư phát triển sản xuất phát hành trái phiếu công ty
hoặc cổ phiếu.

Nhà đầu tư:
o
o

Nhà đầu tư cá nhân: Nhà đầu tư chấp nhận rủi ro và Nhà đầu tư khơng thích rủi ro;
Nhà đầu tư có tổ chức: công ty đầu tư, công ty bảo hiểm, quỹ bảo hiểm xã hội, cơng ty
tài chính, ngân hàng thương mại.

Các tổ chức kinh doanh trên thị trường chứng khốn:
o
o
o

Cơng ty chứng khoán
Quỹ đầu tư chứng khoán
Các trung gian tài chính


Các tổ chức liên quan đến chứng khốn:
o
o
o
o
o
o
o

Cơ quan quản lý Nhà nước
Sở giao dịch chứng khoán
Hiệp hội các nhà kinh doanh chứng khoán
Tổ chức lưu ký và thanh toán bù trừ chứng khốn
Cơng ty dịch vụ máy tính chứng khốn
Các tổ chức tài trợ chứng khốn
Cơng ty đánh giá hệ số tín nhiệm

11


2.2.4. Các nguyên tắc hoạt động trên thị trường chứng khốn




Ngun tắc cơng khai
Ngun tắc trung gian
Ngun tắc đấu giá


2.2.5. Cấu trúc và phân loại cơ bản của thị trường chứng khoán
Căn cứ vào sự luân chuyển các nguồn vốn

Thị trường sơ cấp

Thị trường thứ cấp

Thị trường chứng khoán sơ cấp là nơi duy nhất
mà chứng khoán đem lại vốn cho người phát hành

Thị trường thứ cấp không trực tiếp mang lại vốn
cho người đầu tư sản xuất kinh doanh

Giá chứng khoán trên thị trường sơ cấp (giá phát
hành) do tổ chức phát hành quyết định

Giao dịch trên thị trường thứ cấp phản ánh nguyên
tắc tự do, cạnh tranh tự do

Những người bán trên thị trường sơ cấp thường là
kho bạc, ngân hàng nhà nước, cơng ty phát hành,
tập đồn bảo lãnh phát hành,...

Chứng khoán trên thị trường thứ cấp có thể được
mua bán nhiều lần

Căn cứ vào hàng hóa trên thị trường

Thị trường cổ phiếu


Thị trường trái phiếu

Thị trường các cơng cụ chứng
khốn phái sinh

Thị trường giao dịch và mua bán
các loại cổ phiếu, bao gồm cổ
phiếu thường, cổ phiếu ưu đãi.

Thị trường giao dịch và mua bán các trái
phiếu đã được phát hành, các trái phiếu
này bao gồm các trái phiếu công ty, trái
phiếu đô thị và trái phiếu chính phủ

Thị trường phát hành và mua đi
bán lại các chứng từ tài chính
khác như: quyền mua cổ phiếu,
chứng quyền, hợp đồng quyền
chọn.

Căn cứ vào phương thức hoạt động của thị trường
12


Thị trường giao dịch tập trung
(Sở giao dịch chứng khoán)

Thị trường phi tập trung
(Thị trường OTC)


Hình 2. 1: Mơ hình phân loại thị trường chứng khoán

Thị trường tập trung: Là nơi mà việc giao dịch, trao đổi, mua bán chứng khốn được thực
hiện thơng qua sở giao dịch chứng khốn (hay còn gọi là sàn giao dịch).
Thị trường phi tập trung: Hay còn gọi là thị trường OTC, thị trường này diễn ra ở bất kỳ
nơi nào miễn là nơi đó diễn ra các hoạt động mua bán, trao đổi chứng khoán.
Thị trường giao ngay: Là thị trường mà việc mua bán chứng khoán theo giá thoả thuận
khi ký hợp đồng nhưng thanh toán và giao chứng khoán sau ngày ký hợp đồng một khoảng thời
gian quy định. Chức năng của thị trường này là huy động và làm tăng nguồn vốn.
Thị trường giao dịch kỳ hạn: Thị trường mua và bán chứng khoán theo giá thoả thuận
theo hợp đồng nhưng thanh toán và giao nhận chứng khoán sau ngày ký kết hợp đồng một
khoảng thời gian nhất định thường là 30 hoặc 60 ngày.
Thị trường giao dịch tương lai: Giống như là thị trường giao dịch chứng khoán kỳ hạn
nhưng khác ở chỗ, các hợp đồng mua bán đó được tiêu chuẩn hoá nội dung và điều kiện thực
hiện hợp đồng và phải có tiền đặt cọc thơng qua quy chế ký quỹ để đảm bảo hợp đồng.

2.3. Học máy (Machine Learning) và Thị trường chứng khốn
Cách mạng Cơng nghiệp 4.0 mang đến những thay đổi bước ngoặt, toàn diện trong mọi
mặt của cuộc sống. “Thế giới vận hành bằng công nghệ” trở thành xu thế tất yếu, là mục tiêu
tranh đua cho mọi nền kinh tế, mọi doanh nghiệp cùng hướng đến. Trong cuộc cách mạng Công
nghiệp lần thứ IV, Trí tuệ nhân tạo (A.I) và Học máy học (Machine Learning) là những thành
phần quan trọng, nổi bật, đã và đang được nghiên cứu, ứng dụng rộng rãi trong nhiều lĩnh vực
khác nhau trong đó có ngành ngân hàng nói chung và lĩnh vực cơng nghệ tài chính (FinTech) nói

13


riêng, tạo ra những bứt phá mạnh mẽ về tính hiệu quả, kịp thời, chính xác trong cơng tác giám
sát, dự báo và hỗ trợ ra quyết định.
Học máy (tiếng Anh: machine learning) là một lĩnh vực của trí tuệ nhân tạo liên quan đến

việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống "học" tự động từ dữ liệu để giải
quyết những vấn đề cụ thể. Ví dụ như các máy có thể "học" cách phân loại thư điện tử xem có
phải thư rác (spam) hay không và tự động xếp thư vào thư mục tương ứng. Học máy rất gần với
suy diễn thống kê (statistical inference) tuy có khác nhau về thuật ngữ.
Học máy có liên quan lớn đến thống kê, vì cả hai lĩnh vực đều nghiên cứu việc phân tích
dữ liệu, nhưng khác với thống kê, học máy tập trung vào sự phức tạp của các giải thuật trong
việc thực thi tính toán. Nhiều bài toán suy luận được xếp vào loại bài tốn NP-khó, vì thế một
phần của học máy là nghiên cứu sự phát triển các giải thuật suy luận xấp xỉ mà có thể xử lý
được.
Thực tế đã chứng minh, nhờ áp dụng chính xác phương pháp Machine Learning trong
vận hành các hệ thống trí tuệ nhân tạo, các tập đồn và cơng ty lớn trên thế giới như Facebook,
Amazon, Google… đều đạt được những bước phát triển thần kỳ, chỉ trong vịng dưới 10 năm.
Với sự thành cơng rực rỡ của các mơ hình Học máy (Machine Learning) trong nhiều lĩnh
vực, ứng dụng của Học máy trong tài chính ngày càng được chú ý và phát triển khơng ngừng.
Việc áp dụng các mơ hình Học máy để dự báo chứng khoán, cổ phiếu cũng rất phổ biến trên thế
giới, khơng chỉ trong học thuật mà cịn trong thực tiễn. Ở các bài toán dự báo ở những nghiên
cứu trước đây, các tác giả thường sử dụng dữ liệu lịch sử của chuỗi thời gian để cung cấp các
ước lượng cho các giá trị trong tương lai. Gần đây, các nhà nghiên cứu đã bắt đầu phát triển các
kỹ thuật Học máy giống với quá trình sinh học và tiến hóa để giải quyết các vấn đề phức tạp và
phi tuyến. Kỹ thuật này trái ngược với cách tiếp cận truyền thống, tức là các phương pháp thống
kê cổ điển. Ví dụ về các kỹ thuật học máy có thể nhắc đến như Mạng thần kinh nhân tạo
(Artificial Neural Networks - ANN), Máy vectơ hỗ trợ (Support Vector Machines - SVM) và
Lập trình di truyền (Genetic Programming - GP), thuật tốn K-lân cận (K-nearest neighbors KNN), Mơ hình hồi quy Logistic, phân tích phân biệt tuyến tính (Linear Discriminant Analysis –
LDA), phân tích phân biệt tồn phương (Quadratic Discriminant Analysis - QDA).
Trong lĩnh vực tài chính, ngân hàng, TTCK, Machine Learning, khi được kết hợp với các
mơ hình phân tích định lượng, phát huy hiệu quả đặc biệt trong việc tìm kiếm các bộ mẫu dữ
liệu, đưa ra những dự đoán, hỗ trợ hiệu quả ra quyết định giúp đảm bảo hoạt động kinh doanh
liên tục và kiểm soát rủi ro. Trên thế giới, cuộc chạy đua trong ngành Ngân hàng cũng như các
thị trường chứng khoán diễn ra đặc biệt sôi động. Từ các công ty công nghệ mới thành lập như
Feedzai (trong mảng thanh toán), Shift Technology (trong mảng bảo hiểm), tới các tập đồn cơng

nghệ khổng lồ như IBM và nhóm dẫn đầu về cơng nghệ hiện tại như Google, Alibaba và các
Fintech, đang dựa vào ưu thế công nghệ để cạnh tranh, lấn sân sang lĩnh vực ngân hàng, tài
chính, cổ phiếu thị trường.
Rất nhiều ví dụ về ứng dụng hiệu quả Machine Learning trong lĩnh vực tài chính, ngân
hàng, TTCK có thể kể đến như: Monzo - một ngân hàng khởi nghiệp tại Anh, đã xây dựng một
mơ hình phân tích, dự báo đủ nhanh, để kịp thời phát hiện và ngăn chặn những kẻ lừa đảo giả
14


mạo trong q trình hồn tất giao dịch, giúp giảm tỷ lệ lừa đảo trên thẻ trả trước từ 0,85% vào
tháng 6/2016 xuống dưới 0,1% vào tháng 1/2017.
Trong TTCK, với khả năng xử lý dữ liệu mạnh mẽ trên nhiều lĩnh vực, học máy cũng
được sử dụng một cách rộng rãi trong lĩnh vực tài chính như: dự đốn thị trường cổ phiếu, đầu tư
tối ưu, xử lý thông tin tài chính và thực hiện các chiến lược giao dịch tài chính. Do đó, TTCK
được xem là một trong những lĩnh vực khá phổ biến và quý giá nhất trong lĩnh vực tài chính
trong q trình nghiên cứu và phát triển của học máy.

2.4. Học sâu – Deep learning
Học sâu (Deep learning) đề cập đến một kỹ thuật để tạo trí tuệ nhân tạo bằng cách sử
dụng một mạng lưới nơ ron thần kinh dạng lớp, tương tự như trong thiết kế trong bố trí của bộ
não con người.

Hình 2. 2: Minh họa học sâu (Deep learning)

Nó phù hợp với một nhóm lớn hơn các kỹ thuật học máy nhằm mục đích dạy cho một
máy tính để phân tích, thay vì sử dụng các thuật tốn được xác định trước được xây dựng cho
một nhiệm vụ cụ thể.

15



Học sâu dựa trên tân vỏ não (neocortex) của não, sắp xếp các nút phân tích trong một loạt
các đường dẫn cho dữ liệu lưu thông ở giữa, về cơ bản kết nối chúng trong một mạng lưới giống
như các nút lớp phân tầng.
Sức mạnh phân tích mà phương pháp này cung cấp là hỗ trợ công nghệ tương lai như
những chiếc xe không người lái, giúp họ nhận biết dấu hiệu đường bộ hoặc phân biệt giữa các
vật thể chặn đường đi của nó, như những chiếc xe khác và người đi bộ,...
Các mơ hình học sâu có thể đạt được độ chính xác cao, đơi khi vượt q hiệu suất ở cấp
độ con người và thường được đào tạo bằng cách sử dụng một tập hợp lớn dữ liệu có nhãn và kiến
trúc mạng nơron chứa nhiều lớp.
Deep Learning sử dụng một tầng các lớp đơn vị xử lý phi tuyến để trích xuất hoặc chuyển
đổi các tính năng (hoặc biểu diễn) của dữ liệu. Đầu ra của một lớp phục vụ như là đầu vào của
lớp kế tiếp. Deep learning tập trung giải quyết các vấn đề liên quan đến mạng thần kinh nhân tạo
nhằm nâng cấp các cơng nghệ như nhận diện giọng nói, dịch tự động (machine translation), xử lý
ngơn ngữ tự nhiên

Hình 2. 3: Lược sử học sâu Deep learning

Trong số các thuật toán học máy hiện đang được sử dụng và phát triển, học sâu thu hút
được nhiều dữ liệu nhất và có thể đánh bại con người trong một số nhiệm vụ nhận thức. Do
những thuộc tính này, học tập sâu đã trở thành phương pháp tiếp cận có tiềm năng đáng kể trong
lĩnh vực trí tuệ nhân tạo.

16


Học sâu có thể chia thành 3 nhóm chính:
-

Học sâu khơng giám sát

Học sâu có giám sát
Học sâu tăng cường

2.5. Mạng nơ-ron hồi quy RNN (Recurrent Neural Network)
Ý tưởng chính của RNN (Recurrent Neural Network) là sử dụng chuỗi các thông tin. Trong các
mạng nơ-ron truyền thống tất cả các đầu vào và cả đầu ra là độc lập với nhau. Tức là chúng không liên
kết thành chuỗi với nhau. Nhưng các mơ hình này khơng phù hợp trong rất nhiều bài tốn. Ví dụ, nếu
muốn đốn từ tiếp theo có thể xuất hiện trong một câu thì ta cũng cần biết các từ trước đó xuất hiện lần
lượt thế nào chứ nhỉ? RNN được gọi là hồi quy (Recurrent) bởi lẽ chúng thực hiện cùng một tác vụ cho
tất cả các phần tử của một chuỗi với đầu ra phụ thuộc vào cả các phép tính trước đó. Nói cách khác,
RNN có khả năng nhớ các thơng tin được tính tốn trước đó
Ví dụ như ta cần phân biệt các sự kiện trong một đoạn phim, dựa trên sự kiện trước đó đã
chiếu của đoạn phim ấy. Lúc này tín hiệu đầu vào có thể là tồn bộ chi tiết trên bộ phim (một
vector tín hiệu khổng lồ), và cho vào mạng nơ-ron nhân tạo cơ bản ANN (mạng nơ-ron nhân tạo)
để thử giải quyết. Tuy nhiên mạng hồi quy sẽ khơng làm vậy, mà thay vào đó chia nhỏ bộ phim ra
từng thời điểm khác nhau (ví như là từng khung hình). Lúc đó, tín hiệu đầu vào của mạng hồi quy
sẽ là một loạt các vector xt , ứng với tín hiệu đầu vào của mỗi khung hình t từ đầu tới cuối phim.
Khi ấy, mạng hồi quy sẽ sử dụng thơng tin đã dự đốn ở các khung hình trước, để dự đốn tiếp các
khung hình sau
Về bản chất, nó là mạng nơ-ron nhân tạo như bình thường, nhưng dữ liệu đầu ra hiện tại ở
một thời điểm bất kì của nó được giữ lại bằng cách truyền vịng ngược lại, giúp cho thơng tin được
giữ từ điểm thời gian này tới điểm thời gian khác của chung một điểm dữ liệu

Hình 2. 4: Mơ hình mạng hồi qui đơn giản

Trong hình trên, A là mạng neural hồi quy. Nó nhận một đầu vào xt , tiến hành xử lý và đưa ra đầu
ra ht . Điểm đặc biệt của A là nó sẽ lưu lại giá trị của ht để sử dụng cho đầu vào tiếp theo. Có thể
coi một mạng neural hồi quy là một chuỗi những mạng con giống hệt nhau, mỗi mạng sẽ truyền
17



thơng tin nó vừa xử lý cho mạng phía sau nó. Nếu ta tách từng vịng lặp xử lý trong A ra thành
từng mạng con theo cách suy nghĩ như trên thì ta sẽ có một mạng có kiến trúc như sau:

Hình 2. 5: Kiến trúc mạng hồi qui đơn giản

Chuỗi các đầu vào x0, x1, ... , xt là những sự kiện xảy ra theo thứ tự thời gian tương ứng
với tín hiệu đầu vào của điểm dữ liệu tại thời điểm t = 1-> t ở thời điểm hiện tại. Hơn nữa, mạng
cũng sẽ cho ra các kết quả ẩn , tương đương với vector tín hiệu đầu ra tại thời điểm ấy. Những sự
kiện này đều có mối liên hệ về thông tin với nhau và thông tin của chúng sẽ được giữ lại để xử lý
sự kiện tiếp theo trong mạng neural hồi quy. Vì tính chất này, mạng neural hồi quy phù hợp cho
những bài toán với dữ liệu đầu vào dưới dạng chuỗi với các sự kiện trong chuỗi có mối liên hệ với
nhau. Vì vậy, mạng neural hồi quy có ứng dụng quan trọng trong các bài tốn xử lý ngơn ngữ tự
nhiên như: Dịch máy - Neural Machine Translation, Phân loại ngữ nghĩa - Semantic
classification, Nhận dạng giọng nói: Speech Recognition.
Mạng hồi quy ở trên hình sẽ nhận vào tín hiệu đầu vào kết hợp với kết quả ẩn . Hai tín
hiệu khác nhau này sẽ được gộp lại tùy theo ma trận tham số tương ứng của chúng, để tính được
kết quả ẩn . Cứ tiếp tục như vậy cho đến khi kết thúc (tức là đến khi điểm dữ liệu này đã đọc hết
một cách tuần tự từ đầu tới cuối). Công thức cơ bản của mạng hồi quy để tính các vector tín hiệu
ẩn là: ht = φ (WXt + Uht-1) (2.1) Ma trận sẽ tương đương ma trận trọng số như mạng nơ-ron
nhân tạo cơ bản. Ma trận U thể hiện trọng số để tham chiếu các tín hiệu kết quả cũ. Cuối cùng
hàm φ sẽ dùng để “ép” mỗi giá trị của vector ht về một không gian giá trị log (như là từ -1 , và có
thể tính đạo hàm ược). Nó tương đương với các hàm kích hoạt như nói ở phần giải thuật lan
truyền ngược. Thông thường ta hay dùng hàm tanh để giải quyết.
Vấn đề về sự phụ thuộc tới thông tin quá lâu trong quá khứ Với ý tưởng và công thức
trên, mạng hồi quy sẽ gặp một số vấn đề khó giải quyết. Điển hình là vấn đề “mức độ phụ thuộc
bị mất” (vanishing gradient problem) [14]. Thử xét phần tính lan truyền ngược dựa trên ý tưởng
ở phần trên bao gồm một chuỗi các tích các mức độ phụ thuộc. Điều này có nghĩa nếu các mức
độ phụ thuộc có giá trị tuyệt đối nhỏ hơn 1, thì ta có:


Trong đó:
18


E là sai số bình phương.
t là thời điểm đầu ra cho huấn luyện mẫu.
w: ma trận trọng số.
Nói cách khác, với thời gian cần nhớ thông tin đủ dài, thì đến một mức độ nào
đó, đột nhiên mạng sẽ không thể học được nữa. Điều này giống với việc mạng nơ-ron học
q nhiều và bị bão hịa.
Có thể xét ví dụ đơn giản ngồi thực tế như khi nói rằng “Chim bay trên …”, thì
thơng tin từ 3 từ ấy có thể giúp ta đốn từ tiếp theo như là “trời”. Do khoảng cách giữa
thông tin quá khứ cần biết “chim” nó rất gần với thơng tin tương lai, ta có thể đốn “trời”,
cho nên mạng hồi quy có thể học được. Tuy nhiên với ví dụ thứ hai là “Tôi sống ở Việt
Nam từ nhỏ, cho nên tôi có thể nói tiếng Việt”. Ta thấy khoảng cách đang rất là xa nhau,
cho nên để có thể dự đốn chính xác, thì mạng phải nhớ được những thơng tin rất xa như
vậy.
Hiển nhiên theo lý thuyết, ta vẫn có thể giải quyết chúng, nếu ta mở rộng số lượng thông
tin cần phải nhớ, và mở rộng hệ số tốc độ học cho khớp với bài toán. Tuy nhiên trên thực
nghiệm, mạng hồi quy vẫn sẽ không học được thông tin quá xa, và cái lý do chủ yếu là do cái
vấn đề “mức độ phụ thuộc bị mất” như trên.
Khó khăn của mạng RNN là với thơng tin q khứ “quan trọng” cần nhớ ở x0, x1 thì nếu
khoảng cách đủ lâu, mạng sẽ khó sử dụng chúng để dự đốn ht+1, do từ 1 -> t có thể đã quá xa,
khiến cho mức độ phụ thuộc tính được gần thành 0, dẫn tới toàn bộ thời điểm t+ 1 trở đi, mạng
sẽ khơng cịn học được gì nữa.

19


2.6. Vấn đề phụ thuộc xa

Một điểm nổi bật của RNN chính là ý tưởng kết nối các thơng tin phía trước để dự đốn cho
hiện tại. Việc này tương tự như ta sử dụng các cảnh trước của bộ phim để hiểu được cảnh hiện thời.
Nếu mà RNN có thể làm được việc đó thì chúng sẽ cực kì hữu dụng, tuy nhiên liệu chúng có thể làm
được khơng? Câu trả lời là cịn tùy.
Đơi lúc ta chỉ cần xem lại thơng tin vừa có thơi là đủ để biết được tình huống hiện tại. Ví dụ, ta
có câu: “các đám may trên bầu trời” thì ta chỉ cần đọc tới “các đám may trên bầu” là đủ biết được chữ
tiếp theo là “trời” rồi. Trong tình huống này, khoảng cách tới thơng tin có được cần để dự đốn là nhỏ,
nên RNN hồn tồn có thể học được.

Nhưng trong nhiều tình huống ta buộc phải sử dụng nhiều ngữ cảnh hơn để suy luận. Ví dụ, dự
đốn chữ cuối cùng trong đoạn: “I grew up in France… I speak fluent French.”. Rõ ràng là các thông
tin gần (“I speak fluent”) chỉ có phép ta biết được đằng sau nó sẽ là tên của một ngơn ngữ nào đó, cịn
khơng thể nào biết được đó là tiếng gì. Muốn biết là tiếng gì, thì ta cần phải có thêm ngữ cảnh “I grew
up in France” nữa mới có thể suy luận được. Rõ ràng là khoảng cách thông tin lúc này có thể đã khá
xa.
Thật khơng may là với khoảng cách càng lớn dần thì RNN bắt đầu khơng thể nhớ và học được nữa.

20


Về mặt lý thuyết, rõ ràng là RNN có khả năng xử lý các phụ thuộc xa (long-term
dependencies). Chúng ta có thể xem xét và cài đặt các tham số sao cho khéo là có thể giải quyết được
vấn đề này. Tuy nhiên, đáng tiếc trong thực tế RNN có vẻ khơng thể học được các tham số đó. Vấn đề
này đã được khám phá khá sâu bởi Hochreiter (1991) [tiếng Đức] và Bengio, et al. (1994), trong các
bài báo của mình, họ đã tìm được nhưng lý do căn bản để giải thích tại sao RNN khơng thể học được.

2.7. LSTM (Bộ nhớ dài ngắn)
Là phương án để giải quyết vấn đề phụ thuộc thông tin quá khứ xa, vì lý do mạng hồi quy
khơng học được thơng tin quá xa, nên mạng nơron trí nhớ ngắn dài (gọi tắt LSTM) được tạo ra.
Nó được giới thiệu bởi Hochreiter và Schmidhuber (1997), và được nhiều người khác cải tiến

tiếp.
Do kiến trúc của RNN khá đơn giản nên khả năng liên kết các lớp có khoảng cách xa là
khơng tốt. Nó cơ bản khơng có khả năng ghi nhớ thơng tin từ các dữ liệu có khoảng cách xa, và
do đó, những phần tử đầu tiên trong chuỗi đầu vào thường khơng có nhiều ảnh hưởng đến kết
quả dự đốn phần tử cho chuỗi đầu ra các bước sau. Nguyên nhân của việc này là do RNN chịu
ảnh hưởng bởi việc đạo hàm bị thấp dần trong quá trình học – biến mất đạo hàm (vanishing
gradient). Mạng LSTM được thiết kế để khắc phục vấn đề này. Cơ chế hoạt động của LSTM là
chỉ ghi nhớ những thông tin liên quan, quan trọng cho việc dự đốn, cịn các thơng tin khác sẽ
được bỏ đi.
Thay vì một hệ thống lặp lại chỉ chứa một tầng đơn giản như của mạng hồi quy bình
thường, mạng LSTM chưa tới 4 tầng khác nhau trong hệ thống lặp lại của nó, mơ tả đơn giản
như hình sau:

21


Hình 2. 6: Mơ hình của một tế bào LSTM

Một tế bào LSTM gồm 4 tầng khác nhau. Xét tại thời điểm t, ht thể hiện kết quảXt ẩn, thể
hiện tín hiệu vào của dữ liệu, là đầu ra của mạng LSTM. Với sự kết hợp khác nhau của các tầng
(ở đây là các cổng) như trên, mạng LSTM khi lan truyền tiến (để dự đoán kết quả) sẽ phức tạp
hơn một chút so với mạng nơ-ron nhân tạo cơ bản.
Ý tưởng chính của mạng LSTM đó là: Với mỗi thời điểm t, ta sẽ có một trạng thái của ô
LSTM (1 cell) là tương ứng. Thể hiện trên hình đó là đường thẳng chạy ngang từ Ct-1 tới Ct, ứng
với việc ta sẽ truyền kết quả từ trạng thái trước đến trạng thái sau. Tuy nhiên điều đó khơng có
nghĩa là tồn bộ thơng tin đều đi mà khơng bị gì cả. Tương tác với các giá trị Ct-1, ta sẽ có các
cổng (như hình có các hàm kích hoạt sigmoid với kí hiệu σ, và hàm tanh) và các phép toán trên
ma trận (x, +). Danh sách các cổng như sau
Cổng quên (forget gate –ft):
Bước đầu tiên của LSTM là quyết định xem thông tin nào cần bỏ đi từ trạng thái tế bào. Quyết

định này được đưa ra bởi tầng sigmoid - gọi là “tầng cổng quên” (forget gate layer). Nó sẽ lấy đầu vào
là ht-1 và xt rồi đưa ra kết quả là một số trong khoảng [0,1] cho mỗi số trong trạng thái tế bào Ct-1. Đầu
ra là 1 thể hiện rằng nó giữ tồn bộ thơng tin lại, cịn 0 chỉ rằng tồn bộ thơng tin sẽ bị bỏ đi.
Quay trở lại với ví dụ mơ hình ngơn ngữ dự đốn từ tiếp theo dựa trên tất cả các từ trước đó, với những
bài tốn như vậy, thì trạng thái tế bào có thể sẽ mang thơng tin về giới tính của một nhân vật nào đó
giúp ta sử dụng được đại từ nhân xưng chuẩn xác. Tuy nhiên, khi đề cập tới một người khác thì ta sẽ
khơng muốn nhớ tới giới tính của nhân vật nữa, vì nó khơng cịn tác dụng gì với chủ thế mới này.

22


Hình 2. 7: Mơ hình cổng qn

Cổng đầu vào (input gate – it):
Bước tiếp theo là quyết định xem thông tin mới nào ta sẽ lưu vào trạng thái tế bào. Việc này
gồm 2 phần. Đầu tiên là sử dụng một tầng sigmoid được gọi là “tầng cổng vào” (input gate layer) để
quyết định giá trị nào ta sẽ cập nhập. Tiếp theo là một tầng tanh tạo ra một véc-tơ cho giá trị mới
nhằm thêm vào cho trạng thái. Trong bước tiếp theo, ta sẽ kết hợp 2 giá trị đó lại để tạo ra một cập nhập
cho trạng thái.
Chẳng hạn với ví dụ mơ hình ngơn ngữ của ta, ta sẽ muốn thêm giới tính của nhân vật mới này
vào trạng thái tế bào và thay thế giới tính của nhân vật trước đó.

Hình 2. 8: Mơ hình cổng đầu vào

Giờ là lúc cập nhập trạng thái tế bào cũ Ct-1 thành trạng thái mới Ct. Ở các bước trước đó đã
quyết định những việc cần làm, nên giờ ta chỉ cần thực hiện là xong.
Ta sẽ nhân trạng thái cũ với ft để bỏ đi những thông tin ta quyết định quên lúc trước. Sau đó
cộng thêm it *
Trạng thái mơi thu được này phụ thuộc vào việc ta quyết định cập nhập mỗi giá trị
trạng thái ra sao.

23


Với bài tồn mơ hình ngơn ngữ, chính là việc ta bỏ đi thơng tin về giới tính của nhân vật cũ, và
thêm thơng tin về giới tính của nhân vật mới như ta đã quyết định ở các bước trước đó.

Cổng kết quả (output gate – ot):
Cuối cùng, ta cần quyết định xem ta muốn đầu ra là gì. Giá trị đầu ra sẽ dựa vào trạng thái tế
bào, nhưng sẽ được tiếp tục sàng lọc. Đầu tiên, ta chạy một tầng sigmoid để quyết định phần nào của
trạng thái tế bào ta muốn xuất ra. Sau đó, ta đưa nó trạng thái tế bảo qua một hàm tanh để co giá trị nó
về khoảng [-1, 1], và nhân nó với đầu ra của cổng sigmoid để được giá trị đầu ra ta mong muốn.
Với ví dụ về mơ hình ngơn ngữ, chỉ cần xem chủ thể mà ta có thể đưa ra thơng tin về một trạng
từ đi sau đó. Ví dụ, nếu đầu ra của chủ thể là số ít hoặc số nhiều thì ta có thể biết được dạng của trạng
từ đi theo sau nó phải như thế nào.

Hình 2. 9: Mơ hình cổng kết quả

2.8. Mạng nơ ron dài ngắn song song (BiLSTM)
2.8.1. Giới thiệu mạng nơ ron dài ngắn 2 chiều
24


Một hướng tiếp cận với dữ liệu khác nữa, đó là sử dụng hai mạng nơ ron hồi quy
theo hai chiều ngược nhau để xử lý (Bidirectional RNN). Một đơn vị RNN sẽ làm như
thường lệ, tức là ta sẽ dùng nó để học các tín hiệu đầu vào từ thời điểm ban đầu tới thời
điểm kết thúc (đi xuôi). Còn đơn vị RNN còn lại, ta sẽ đọc theo thứ tự thời điểm từ kết thúc
trở lại ban đầu (đi ngược). Sau khi có cả hai kết quả, chúng sẽ được gom lại thành một để
có thể dự đốn. Với ý tưởng như vậy, tại một thời điểm bất kỳ, mạng sẽ có được các thơng
tin trước và sau thời điểm ấy.
Do bản chất LSTM là cải tiến của RNN, cho nên ta có thể áp dụng nó và biến nó

thành mạng nơ ron dài ngắn song song (BiLSTM). Mỗi LSTM sẽ vẫn có khả năng qn
thơng tin cũ (cổng quên), lọc thông tin mới (cổng đầu vào), hoặc giấu bớt kết quả (cổng
đầu ra) như bình thường. Chính vì vậy, các thơng tin từ q khứ tới tương lai của mạng
BiLSTM đều có thể tự học để tự điều chỉnh. Dẫn tới việc với các bài toán mà ta cần biết
nhiều hơn về ngữ cảnh hiện tại của nó, thì mạng BiLSTM cho kết quả tốt hơn.

Hình 2. 10: Mạng Bi-RNN (có thể thế bằng BiLSTM) sau khi được “bung ra”. Ta thấy

đơn vị mạng chính là mạng đi xi, và đơn vị mạng chính là mạng đi ngược

2.8.2. Cách dự đoán kết quả của mạng BiLSTM
Như ý tưởng trên, ta sẽ có kết quả của 2 đơn vị mạng khác nhau (một cái chạy xuôi,
và một cái chạy ngược). Chính vì vậy để có kết quả cuối cùng, ta phải gom được hai kết
quả trên về một cái thống nhất. Một số cách đơn giản để làm điều này đó là:


Tổng: Cộng từng tín hiệu đầu ra của hai mạng



Tích: Nhân từng tín hiệu đầu ra của hai mạng



Ghép: Hai vectơ tín hiệu đầu ra của hai mạng được ghép tiếp nhau (vectơ
kết quả cuối sẽ có số chiều gấp đôi)
25



×