Tải bản đầy đủ (.pdf) (47 trang)

Đề tài ứng dụng thuật giải di truyền vào việc thiết lập danh mục đầu tư hiệu quả

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (721.23 KB, 47 trang )

1



` MỤC LỤC

PHỤ BÌA ii
NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP iii
NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN v
NHẬN XÉT CỦA GIẢNG VIÊN PHẢN BIỆN vi
LỜI CẢM ƠN vii
TÓM TẮT ĐỒ ÁN viii
MỤC LỤC 1
DANH MỤC BẢNG BIỂU 3
DANH SÁCH HÌNH VẼ 4
DANH SÁCH CÔNG THỨC 5
Chương 1. TỔNG QUAN 7
1.1. Đặt vấn đề. 7
1.2. Ý nghĩa khoa học và thực tiễn. 8
1.3. Mục tiêu của nghiên cứu. 9
1.4. Bố cục 10
Chương 2. TỔNG QUAN VỀ QUẢN TRN DANH MỤC ĐẦU TƯ 11
2.1. Giới thiệu về quản trị danh mục đầu tư. 11

2.2. Nội dung quản trị danh mục đầu tư 11
2.1.1. Những giả định nền tảng 11
2.1.2. Lý thuyết danh mục Markowitz. 12
2.1.3. Các khái niệm liên quan tới lý thuyết danh mục 13
Chương 3. TỔNG QUAN VỀ THUẬT GIẢI DI TRUYỀN 20
3.1. Giới thiệu về quá trình tiến hóa tự nhiên. 20
3.2. Giới thiệu về thuật giải di truyền. 20


3.3. Các quá trình chính trong thuật giải di truyền. 21
3.3.1. Tiến trình Chọn lọc 21
2



3.3.2. Quá trình Lai ghép 22
3.3.3. Quá trình Đột biến 23
3.3.4. Hàm Thích nghi 23
3.3.5. Điều kiện kết thúc lặp của GAs 23
3.3.6. Thuật giải di truyền 24
Chương 4. PHƯƠNG PHÁP NGHIÊN CỨU 25
4.1. Mô tả bài toán 25
4.1.1. Xử lý dữ liệu 25
4.1.2. Phát biểu bài toán 25
4.1.3. Mã hóa bài toán. 26
4.1.4. Khởi tạo quần thể. 26
4.1.5. Hàm lượng giá. 27
4.1.6. Các tham số 27
4.2. Phân tích và thiết kế hệ thống 28
4.2.1. Use Case Diagrams 28
4.2.2. Tổ chức các gói (Packages Definitions) 30
4.2.3. Sơ đồ lớp (Class Diagrams) 32
4.2.4. Sơ đồ tuần tự (Sequence Diagrams) 38
4.2.5. Lược đồ cơ sở dữ liệu 40
Chương 5. KẾT QUẢ THỰC NGHIỆM 41
5.1. Phương pháp thực nghiệm 41
5.2. Kết quả chương trình 41
5.3. Đối chiếu thực tế 42
Chương 6. KẾT LUẬN CHUNG 45

TÀI LIỆU THAM KHẢO 47
PHỤ LỤC

P1

Phụ lục A: Giới thiệu về Sàn Giao dịch Chứng khoán HOSE P1
Phụ lục B: Khái quát về tình hình thị trường chứng khoán Việt Nam. P2
Phụ lục C: Các chứng khoán niêm yết trên sàn HOSE (đến ngày 19/11/2008). . P3

3



DANH MỤC BẢNG BIỂU
Bảng 2.1. Ví dụ về cách tính tỷ suất mong đợi. 14
Bảng 2.2. Tính toán phương sai tỷ suất sinh lợi mong đợi đối với một tài sản cụ thể 16
Bảng 5.1. Kết quả chạy thử chương trình. 42
Bảng 5.2. Bảng giá đóng cửa của các cổ phiếu trong thực nghiệm phiên giao dịch
02/01/2008 43
Bàng 5.3. Thống kê tài sản sau khi thực hiện phiên giao dịch 02/01/2008 43
Bàng 5.4. Thống kê giá trị tài sản phiên 01/02/2008 44



4



DANH SÁCH HÌNH VẼ
Hình 3.1. Lưu đồ thuật giải di truyền 24

Hình 4.1.Lược đồ Use Case cho hệ thống 28
Hình 4.2. Tổ chức các gói và sự phụ thuộc 30
Hình 4.3. Sơ đồ Lớp gói Applications::InvestorActivities 32
Hình 4.4.Sơ đồ Lớp BusinessServices::StockArtifacts 33

Hình 4.5.Sơ đồ Lớp BusinessServices::DataTransferObjects 34

Hình 4.6.Sơ đồ Lớp BusinessServices::ExternalSystemInterfaces 35

Hình 4.7.Sơ đồ Lớp BusinessServices::StockSystem 36

Hình 4.8.Sơ đồ Lớp Business::AISystem 37

Hình 4.9.Sơ đồ Tuần tự của use case Choose Candidate Securities 38

Hình 4.10.Sơ đồ Tuần tự của use case Generate Efficient Porfolio 39

Hình 4.11. Lược đồ Cơ sở dữ liệu 40

5



DANH SÁCH CÔNG THỨC
Công thức tính Tỷ suất sinh lợi:
ܴ

ݐ

=

ܲ

ݐ+ ∆ݐ

+ ݀

ݐ

ܲ

ݐ

ሺ2.1ሻ

Công thức tính Tỷ suất sinh lợi mong đợi:
E

R

=

݌




௝ୀଵ
ሺ2.2ሻ
Công thức tính Tỷ suất sinh lợi mong đợi của một Danh mục:
ܧ


ܴ


=

ݓ



ܴ


ሺ2.3ሻ

௜ୀଵ

Phương sai của Tỷ suất sinh lợi:


ߪ


=



− ܧ

ܴ



]




௜ୀଵ
ሺ2.4ሻ
Độ lệch chuNn của Tỷ suất sinh lợi:
ߪ=

ߪ

ሺ2.5.1ሻ
Độ lệch chuNn của Tỷ suất sinh lợi thực nghiệm:
ߪ=
1
ܰ




− ܧ

ܴ


]



௜ୀଵ
ሺ2.5.2ሻ
Hiệp phương sai của những Tỷ suất sinh lợi:


ܥ݋ݒ
஺஻
=ܩ݅á ݐݎị ݇ỳ ݒọ݊݃
ሼ[
ܴ
௜஺
− ܧሺܴ


]

௜஻
− ܧሺܴ

ሻ]



஺஻
ሺ2.6.1ሻ


6





Hiệp phương sai của những Tỷ suất sinh lợi thực nghiệm:
ܥ݋ݒ
஺஻
=
1
ܰ
෍൫
ܴ
௜஺
− ܧ

ܴ



.ሺܴ
௜஻
− ܧ

ܴ




௜ୀ ଵ
ሺ2.6.2ሻ
Hệ số tương quan:

ߩ
஺஻
=
ܥ݋ݒ
஺஻
ߪ

ߪ

ሺ2.7ሻ
Độ lệch chuNn của một danh mục đầu tư:
ߪ

=


ݓ


ߪ



௜ୀଵ
+
෍෍
ݓ

ݓ


ܥ݋ݒ
௜௝

௝ିଵ

௜ୀଵ
ሺ2.8ሻ


7



CHƯƠNG 1. TỔNG QUAN
1.1. Đặt vấn đề
Bên cạnh sự phát triển của thị trường tài chính nói chung, thì với tốc độ phát
triển nhanh chóng của công nghệ thông tin, con người kỳ vọng vào việc làm sao
có thể ứng dụng công nghệ thông tin vào lĩnh vực tài chính một cách hiệu quả
nhất. Đặc biệt là khai thác những giá trị tiềm Nn đằng sau những con số, những
dữ liệu phát sinh,… được thu thập trong suốt quá trình hình thành và phát triển
của nền tài chính.
“…Vào những năm cuối của 1980, phương pháp khai khoáng dữ liệu từ dữ liệu
lịch sử giao dịch nhằm rút trích ra những thông tin hữu ích được đề xướng với sự
trợ giúp của các thiết bị tính toán tiên tiến…”. (Markellos và các cộng sự, 2003)
Thuật giải Di truyền (Genetic Algorithm) là một phương pháp tối ưu để giải
quyết những bài toán tìm kiếm trên không gian lớn, dựa trên việc mô phỏng quá
trình tiến hóa sinh học trong tự nhiên. Các loài đã tồn tại và tiến hóa thông qua
quá trình đấu tranh sinh tồn khắc nghiệt. Ở mỗi thế hệ, các cá thể thực hiện các
quá trình chọn lọc, lai ghép và đột biến một cách bán ngẫu nhiên, để tạo ra
những thế hệ tiếp theo tốt hơn, nhắm tới sự thích nghi với môi trường tự nhiên.

Về mặt tài chính, quản lý danh mục đầu tư là một nghiệp vụ quan trọng trong
kinh doanh chứng khoán, là công cụ hữu hiệu để hạn chế rủi ro và tối đa hóa lợi
nhuận. Vấn đề đặt ra là làm thế nào để có thể quản lý danh mục đầu tư một cách
tối ưu?
Một thuận lợi lớn nhất trong lĩnh vực đầu tư đã và đang được thừa nhận trong
suốt những thập niên vừa qua, đó là, việc thiết lập một danh mục đầu tư tối ưu là
một vấn đề không chỉ đơn giản là sự kết hợp của nhiều chứng khoán riêng lẻ mà
còn có cả những đặc trưng rủi ro – tỷ suất sinh lợi mong đợi.
Chính vì vậy, đặt ra vấn đề, làm cách nào để có thể ứng dụng thuật giải di truyền
vào việc tìm kiếm một (tập hợp các) danh mục đầu tư hiệu quả, với tiêu chí đa
8



dạng hóa danh mục đầu tư, tối thiểu rủi ro và tối đa tỷ suất sinh lợi. Từ đó mở ra
những phương pháp tiếp cận mô hình dự báo trong việc quản trị danh mục năng
động.
Tựu trung lại, bài toán có thể được phát biểu như sau:
Từ một danh sách có ࢔ chứng khoán thuộc các lĩnh vực (được niêm yết
trên sàn HOSE), chúng ta cần thiết lập một danh mục đầu tư hiệu quả có
࢓ ሺ࢓≤࢔ሻ chứng khoán. Chúng ta cũng giả định rằng tỷ trọng giữa các
chứng khoán là như nhau. Sao cho, danh mục kết quả có độ lệch chun
(sẽ được giới thiệu trong chương 2) là nhỏ nhất hoặc thỏa mãn yêu cầu
của nhà đầu tư.
1.2. Ý nghĩa khoa học và thực tiễn
Chúng ta cũng đều biết rằng, mỗi loại tài sản thường mang một độ rủi ro – tỷ
suất sinh lợi khác nhau, và khi được kết hợp lại, danh mục kết quả sẽ mang một
độ rủi ro mới. Dĩ nhiên, nếu một danh mục đầu tư chỉ bao gồm một loại chứng
khoán duy nhất, công việc quản trị danh mục đầu tư sẽ trở nên vô cùng đơn
giản.

Tuy nhiên, “không để chung trứng trong một giỏ” - một nguyên tắc khá nổi
tiếng trong tài chính nói chung, và trong quản lý danh mục đầu tư nói riêng, nó
có nghĩa rằng, phải thực hiện việc đa dạng hóa trong cơ cấu một danh mục đầu
tư. Nói cách khác, một danh mục đầu tư nên kết hợp nhiều loại tài sản (cổ
phiếu, trái phiếu, tài sản cố định…) với những độ rủi ro và tỷ trọng khác nhau.
Do đó, điều mà chúng ta thực sự và cần hướng đến, là một sự kết hợp giữa
nhiều loại tài sản với những rủi ro – tỷ suất sinh lợi khác nhau, sao cho, độ rủi
ro – tỷ suất sinh lợi của danh mục thỏa mãn yêu cầu của nhà đầu tư.
Với một danh sách gồm ݊ chứng khoán, chúng ta có tới ሺ2

− 1ሻ sự kết hợp
(không kể trường hợp một kết hợp không có phần tử nào). Do đó, việc tìm kiếm
một sự kết hợp tối ưu (danh mục đầu tư hiệu quả) từ một danh sách có tới hàng
9



trăm các tài sản (chứng khoán) trở nên khó khăn đối với mỗi nhà đầu tư. Chẳng
hạn, với một danh sách có 3 tài sản A, B, C. Chúng ta có ሺ2

− 1ሻ=7 sự kết
hợp. Đó là: {A}, {B}, {C}, {A, B}, {A, C}, {B, C}, {A, B, C}. Dĩ nhiên chúng
ta sẽ không cần tính tới {∅ሽ, một danh mục không có loại tài sản nào. Chính vì
vậy, hãy tưởng tượng một danh sách gồm 100 tài sản, đồng nghĩa với có
ሺ2
ଵ଴଴
− 1ሻ danh mục có thể được tạo ra. Xem ra việc tìm kiếm một danh mục
đầu tư hiệu quả trở nên khó khăn, nếu như không muốn nói là bất khả thi đối
với những nhà đầu tư.
Đó là chúng ta còn chưa kể tới việc ước lượng mức độ rủi ro của mỗi loại tài

sản, vốn là một công việc quan trọng không kém, và được thực hiện trước khi
tìm một sự kết hợp từ các tài sản rủi ro.
Chính vì vậy, việc tìm hiểu và ứng dụng thuật giải di truyền của đề tài đã mở ra
những ý tưởng, những cách thức… nhằm giải quyết bài toán kết hợp nhiều tài
sản rủi ro đã nêu ở trên, một cách hiệu quả với chi phí thời gian dễ chấp nhận.
1.3. Mục tiêu của nghiên cứu.
Bài toán mà chúng ta đặt ra và cần giải quyết đó là tìm kiếm một sự kết hợp từ
nhiều loại tài sản rủi ro khác nhau, nhằm thiết lập một danh mục đầu tư hiệu
quả, tức là có độ rủi ro phù hợp với chiến lược mua bán của mỗi nhà đầu tư.
Đây cũng chính là mục tiêu quan trọng và trước nhất của đề tài.
Bên cạnh đó, việc nghiên cứu cũng phải mở ra những cách thức, những giải
pháp… nhằm giải quyết bài toán trên một cách hiệu quả hơn, và tất nhiên, là có
thể đáp ứng nhu cầu thực tế trong lĩnh vực đầu tư chứng khoán nói riêng, và các
lĩnh vực khác nói chung.
Ngoài ra, cũng phải kể tới việc đề tài phải cung cấp các kiến thức tài chính cần
thiết như các học thuyết kinh tế, các mô hình toán kinh tế; các kiến thức trong
lĩnh vực Trí tuệ Nhân tạo, Khai khoáng Dữ liệu; cũng như khả năng ứng dụng
và triển khai của công nghệ thông tin vào các lĩnh vực đời sống.
10



1.4. Bố cục
Bố cục đồ án chia thành 6 chương. Chương 1 trình bày các vấn đề tổng quan,
tính cấp thiết và lý do hình thành đề tài, ý nghĩa khoa học và thực tiễn, cũng như
phạm vi, cấu trúc của đồ án. Chương 2 trình bày các học thuyết, lý thuyết kinh
tế cần thiết để giải quyết bài toán được đề cập trong đồ án. Chương 3 trình bày
các kỹ thuật đã đang và sẽ ứng dụng, nhằm giải quyết bài toán xây dựng danh
mục đầu tư hiệu quả, cụ thể là thuật giải di truyền. Chương 4 tập trung vào
phương pháp nghiên cứu, các cách thức giải quyết bài toán, các mô tả về mặt

công nghệ, hệ thống… Chương 5 trình bày các kết quả thực nghiệm thu được,
khi giải quyết bài toán thiết lập danh mục đầu tư hiệu quả. Cuối cùng, chương 6
sẽ nêu những kết luận chung, những kết quả đạt được, hướng phát triển của đồ
án.

11



CHƯƠNG 2. TỔNG QUAN VỀ QUẢN TRN DANH MỤC ĐẦU

2.1. Giới thiệu về quản trị danh mục đầu tư
Trong suốt những thập niên vừa qua, một thuận lợi lớn nhất trong lĩnh vực đầu
tư đã và đang được thừa nhận rằng, việc thiết lập một danh mục đầu tư tối ưu là
một vấn đề không chỉ đơn giản là sự kết hợp của nhiều chứng khoán riêng lẻ,
mà còn có cả những đặc trưng rủi ro – tỷ suất sinh lợi mong đợi. Đặc biệt, điều
đó chỉ ra rằng, chúng ta cần phải xem xét mối quan hệ giữa những phương thức
đầu tư, nếu chúng ta đang xây dựng một danh mục tối ưu, mà danh mục đó sẽ
đáp ứng những mục tiêu đầu tư của chúng ta. Điều quan trọng là sự thừa nhận
trong việc thiết lập danh mục đã được giải thích trong lý thuyết đa dạng hóa
danh mục đầu tư.
2.2. Nội dung của quản trị danh mục đầu tư
2.2.1. Những giả định nền tảng
Trước khi trình bày lý thuyết danh mục, chúng ta cần làm rõ một vài giả
định chung của lý thuyết. Điều này không chỉ bao gồm một danh mục đầu
tư tối ưu mà còn có nghĩa là rủi ro và thái độ rủi ro.
- Một giả định cơ bản của lý thuyết danh mục đó là, một nhà đầu tư mong
muốn tối đa hóa tỷ suất sinh lợi từ việc đầu tư của mình, với mộ mức độ
rủi ro cho phép. Để giải quyết một cách thích đáng giả định này, chắc
chắn những quy tắc nền tảng phải được trình bày. Đầu tiên, danh mục

của bạn nên bao gồm tất cả những tài sản và các khoản nợ phải trả,
không chỉ đơn thuần là cổ phiếu và trái phiếu, mà còn có các khoản mục
như xe hơi, nhà cửa, và những khoản đầu tư có tính thanh khoản thấp
như: tem, đồ cổ, đồ nội thất…
12



Tuy nhiên trong phạm vi đề tài, chúng ta cũng giả định rằng, danh mục đầu
tư của chúng ta chỉ bao gồm các loại chứng khoán cổ phiếu. Tuy nhiên, cục
diện đầu tư cũng cần phải được xem xét lại vì tỷ suất sinh lợi từ hầu hết các
loại chứng khoán này tác động qua lại lẫn nhau, và mối quan hệ giữa những
tỷ suất sinh lợi đối với các tài sản trong danh mục đầu tư là rất quan trọng.
Vì một danh mục đầu tư tốt, không đơn giản chỉ là một bộ sưu tập các
khoản mục đầu tư tốt cá thể.
- Một giả định nữa của lý thuyết danh mục đầu tư, về cơ bản, những nhà
đầu tư luôn từ chối rủi ro. Bằng chứng là, hầu hết các nhà đầu tư không
thích rủi ro, thì họ luôn theo đuổi những hình thức bảo hiểm khác nhau như
bảo hiểm nhân thọ, y tế… nhằm đề phòng những biến cố không chắc chắn
trong tương lai. Và dĩ nhiên, sự lựa chọn giữa hai cổ phiếu có cùng tỷ suất
sinh lợi, nhà đầu tư sẽ chọn tài sản có mức rủi ro thấp hơn. Tuy nhiên, điều
này không ám chỉ rằng mọi người đều từ chối rủi ro. Sự thật là không ai
mua bảo hiểm cho tất cả mọi thứ xung quanh cả. Thậm chí, có người còn
không mua bất kỳ loại bảo hiểm nào, đó có thể là một sự lựa chọn, hoặc là
họ không có khả năng theo đuổi nó. Thêm nữa, một số cá nhân, bên cạnh
việc mua các loại bảo hiểm như tai nạn ô tô, bênh tật… họ đồng thời cũng
mua vé số, đánh bạc… vốn được biết đến như những khoản sinh lợi tiêu
cực. Điều này đồng nghĩa với việc luôn tồn tại những cá nhân sẵn lòng chấp
nhận rủi ro.
Trong khi có nhiều thái độ ứng xử khác nhau về rủi ro, thì giả định cơ bản

của chúng ta cho rằng, hầu hết các nhà đầu tư đều chuyển một khoản tiền
lớn để phát triển danh mục đầu tư mà vẫn từ chối rủi ro. Vì vậy, chúng ta
mong đợi một mối quan hệ đồng thuận giữa tỷ suất sinh lợi mong đợi và rủi
ro mong đợi. Đặc biệt, đây cũng là điều mà nhìn chung, chúng ta luôn tìm
kiếm trong tương lai.
2.2.2. Lý thuyết danh mục Markowitz
13



Vào đầu những năm 1960, những nhà đầu tư đã nói về rủi ro, nhưng không
có những ước lượng cụ thể cho từng khoản mục. Tuy nhiên, để xây dựng
một mô hình danh mục đầu tư, các nhà đầu tư phải xác định lượng rủi ro có
thể có. Mô hình danh mục đầu tư cơ bản được Harry Markowitz phát triển.
Ông là người đoạt giải Nobel kinh tế sau khi phát minh ra thuyết danh mục
hiện đại năm 1952. Học thuyết này nhấn mạnh tầm quan trọng của danh
mục đầu tư, các rủi ro và sự tương quan giữa các cổ phiếu với việc đa dạng
hóa danh mục đầu tư.
Điều này đã thay đổi cách thức mà các nhà đầu tư đang thực hiện. Cụ thể,
Markowitz đã phát hiện, tỷ suất sinh lợi mong đợi đối với một danh mục
của các tài sản, và một ước lượng rủi ro mong đợi. Markowitz chỉ ra rằng,
phương sai của tỷ suất sinh lợi là một ước lượng có ý nghĩa của rủi ro danh
mục với một tập hợp những giả định, và ông đã tìm ra công thức để tính
toán phương sai của danh mục. Công thức tính toán phương sai danh mục
này, đã chỉ ra sự quan trọng của việc đa dạng hóa đầu tư để giảm thiểu rủi
ro tổng thể và cũng chỉ ra cách đa dạng hóa đầu tư hiệu quả.
2.2.3. Các khái niệm liên quan tới lý thuyết danh mục
2.2.3.1. Tỷ suất lợi nhuận (Rate of Return)
Chúng ta định nghĩa tỷ suất sinh lợi qua một thời kỳ t, với thời gian là
∆ݐ, sẽ là tỷ suất sinh lợi được thực hiện từ thời điểm t đến thời điểm

ݐ+ ∆ݐ. Nếu giá của chứng khoán ở thời điểm t là P(t) , ở thời
điểm ݐ+ ∆ݐ là P(ݐ+ ∆ݐሻ, và thu nhập của chứng khoán trong suốt
thời kỳ là d(t). Vậy tổng tỷ suất sinh lợi của chứng khoán sẽ là:
ܴ

ݐ

=
ܲ

ݐ+ ∆ݐ

+ ݀

ݐ

ܲ

ݐ

ሺ2.1ሻ
Do đó tỷ lệ sinh lợi của chứng khoán sẽ là ݎݎ

ݐ

= ܴ

ݐ

− 1

Ví dụ: Giá đóng cửa của cổ phiếu A tháng 10/2008 là 40$ và tháng
11/2008 là 50$. Chi phí phải trả cho giao dịch là 4$ khi mua và bán cổ
14



phiếu, cổ tức nhận được là 2$. Vậy tổng tỷ suất sinh lợi của chứng
khoán sẽ là:
ܴ

ݐ

=
50$ + ሺ2$ − 4$ሻ
40$
=1,2 ݒà ݎݎ

ݐ

=0,2=20%
2.2.3.2. Tỷ suất lợi nhuận mong đợi (Expected Rate of Return)
Tỷ suất lợi nhuận mong đợi đối với một tài sản được tính như trong
bảng 2.1. Tỷ suất sinh lợi mong đợi đối với một tài sản rủi ro cụ thể
với tập hợp tỷ suất sinh lợi tiềm năng, và một giả định các khả năng
xảy ra các mức tỷ suất sinh lợi dự kiến.
Bảng 2.1. Ví dụ về cách tính tỷ suất mong đợi
Khả năng Tỷ suất sinh lợi (%) Tỷ suất sinh lợi mong đợi
0,20 8,0 1,60
0,30 10,0 3,00
0,20 12,0 2,40

0,30 14,0 4,20

E(R)= 11,20
Tỷ suất sinh lợi mong đợi của tài sản rủi ro:
E

R

=

݌




௝ୀଵ
ሺ2.2ሻ
Trong đó:
- R
j
là tỷ suất sinh lợi của tài sản rủi ro trong tình huống j.
15



- P
j
là khả năng xảy ra mức tỷ suất sinh lợi R
j


Tỷ suất sinh lợi mong đợi đối với một danh mục của những khoản đầu
tư, đơn giản là giá trị trung bình theo tỷ trọng của tỷ suất sinh lợi mong
đợi đối với những khoản đầu tư cụ thể trong danh mục. Tỷ trọng này là
sự cân đối tổng giá trị đối với các khoản đầu tư.
Tỷ suất sinh lợi mong đợi đối với một danh mục đầu tư được tính theo
công thức sau:
ܧ

ܴ


=

ݓ



ܴ


ሺ2.3ሻ

௜ୀଵ

Trong đó:
- w
i
: Tỷ trọng đầu tư tài sản i trong danh mục.
- E(R
i)

: Tỷ suất sinh lợi mong đợi của tài sản i.
2.2.3.3. Phương sai (độ lệch chuNn) của tỷ suất sinh lợi đối với một
khoản đầu tư cụ thể (Variance or Standard Deviation).
Phương sai hay độ lệch chuNn, là một phương pháp ước lượng chênh
lệch của những mức tỷ suất sinh lợi có thể có R
i
, so với tỷ suất sinh lợi
mong đợi [E(R
i)
] sau đây.
Phương sai:

ߪ


=



− ܧ

ܴ


]




௜ୀଵ

ሺ2.4ሻ
Trong đó:
- p
i
là khả năng xảy ra tỷ suất sinh lợi.
- Độ lệch chuNn: ߪ=

ߪ

ሺ2.5ሻ
Tuy nhiên, khi tính toán độ lệch chuNn của các giá trị tỷ suất sinh lợi
thực nghiệm, chúng ta có thể lấy tổng bình phương các khoảng chênh
lệch và chia cho N. Với N là số mẫu thực nghiệm.
16



ߪ=
1
ܰ




− ܧ

ܴ


]



௜ୀଵ
ሺ2.6ሻ
Việc tính toán phương sai và độ lệch chuNn của tỷ suất sinh lợi mong
đợi đối với tài sản rủi ro trong bảng 2.1 được tính lại trong
bảng 2.2.
Bảng 2.2. Tính toán Phương sai tỷ suất sinh lợi mong đợi đối với một
tài sản cụ thể.
R
i
[R
i
– E(R
i
)

{R
i
– E(R
i
)}
2
P
i
{R
i
– E(R
i
)}

2
p
i
8,0 -3,20 10,24 0,20 2,048
10,0 -1,20 1,44 0,30 0,432
12,0 0,80 0,64 0,20 0,128
14,0 2,80 7,84 0,30 2,235
4,960
Khi đó

ߪ


= 4,960 và độ lệch chuNn

ߪ

= 2,227%
2.2.3.4. Hiệp phương sai của những tỷ suất sinh lợi (Covariance)
Trong phần này, chúng ta trình bày về hiệp phương sai của tỷ suất sinh
lợi được dự định để ước lượng, đưa ra công thức để tính toán nó. Phân
tích danh mục, chúng ta thường quan tâm tới hiệp phương sai của tỷ
suất sinh lợi hơn là sự thay đổi giá cả và một vài thứ khác.
Hiệp phương sai là một ước lượng để hai mức độ ưu tiên khác nhau
“tiến lại gần nhau” nhằm tạo ra một giá trị có ý nghĩa.
Một giá trị hiệp phương sai dương, có nghĩa là tỷ suất sinh lợi đối với
hai khoản đầu tư có khuynh hướng dịch chuyển về một hướng, so với
mức trung bình của chúng trong suốt một khoảng thời gian. Ngược lại,
17




một giá trị hiệp phương sai âm, chỉ ra tỷ suất sinh lợi đối với hai khoản
đầu tư có khuynh hướng dịch chuyển về hai hướng khác nhau, liên
quan đến mức trung bình vào từng thời điểm cụ thể trong một khoảng
thời gian. Độ lớn của hiệp phương sai phụ thuộc vào phương sai của
những chuỗi tỷ suất sinh lợi cụ thể, cũng như mối quan hệ giữa những
chuỗi tỷ suất sinh lợi.
Đối với hai tài sản A và B, hiệp phương sai của tỷ suất sinh lợi được
định nghĩa là:
ܥ݋ݒ
஺஻
=ܩ݅á ݐݎị ݇ỳ ݒọ݊݃
ሼ[
ܴ
௜஺
− ܧሺܴ


]

௜஻
− ܧሺܴ

ሻ]



஺஻
ሺ2.6.1ሻ

Trong trường hợp tỷ suất sinh lợi của hai tài sản A và B được tính dự
vào thực nghiệm thì hiệp phương sai của chúng được xác định như sau:
ܥ݋ݒ
஺஻
=
1
ܰ
෍൫
ܴ
௜஺
− ܧ

ܴ



.ሺܴ
௜஻
− ܧ

ܴ




௜ୀ ଵ
ሺ2.6.2ሻ
2.2.3.5. Hệ số tương quan của những tỷ suất sinh lợi (Corelation)
Hiệp phương sai bị ảnh hưởng bởi biến thiên của hai chuỗi tỷ suất sinh
lợi riêng lẻ. Vì vậy, một con số hiệp phương sai chỉ có thể nhấn mạnh

một mối quan hệ mờ nhạt, nếu hai chuỗi tỷ suất sinh lợi riêng lẻ không
ổn định nhưng lại phản ánh mối quan hệ bền vững nếu hai chuỗi này
rất ổn định. Hiển nhiên, chúng ta muốn “chuNn hóa” ước lượng hiệp
phương sai này để đưa vào xem xét tính biến thiên của hai chuỗi tỷ
suất sinh lợi riêng lẻ như công thức sau:
ߩ
஺஻
=
ܥ݋ݒ
஺஻
ߪ

ߪ

ሺ2.7ሻ
Trong đó:
- ߩ
஺஻
: Hệ số tương quan của những tỷ suất sinh lợi.
- ߪ

: Độ lệch chuNn của R
iA
18



-

ߪ


: Độ lệch chuNn của R
iB

Như vậy hệ số tương quan là sự “chuNn hóa” ước lượng hiệp phương
sai. Bằng cách chuNn hóa hiệp phương sai bởi những độ lệch chuNn
riêng lẻ sẽ mang lại hệ số tương quan ሺߩ
஺஻
), hệ số tương quan này chỉ
có thể thay đổi trong khoảng từ -1 đến +1. Giá trị +1 có thể nhấn mạnh
mối quan hệ tuyến tính xác định giữa R
A
và R
B
, nghĩa là, tỷ suất sinh
lợi đối với hai cổ phiếu cùng thay đổi trong một kiểu tuyến tính xác
định hoàn toàn. Giá trị -1 có thể nhấn mạnh mối quan hệ phủ định hoàn
toàn giữa hai chuỗi tỷ suất sinh lợi, như khi tỷ suất sinh lợi của một cổ
phiếu cao hơn mức trung bình, tỷ suất sinh lợi của những cổ phiếu
khác sẽ thấp hơn mức trung bình bằng một số lượng lớn.
Để tính toán ước lượng chuNn này, cần tính toán được độ lệch chuNn
đối với hai chuỗi tỷ suất riêng lẻ. Chúng ta đã có những giá trị R
iA
-
E(R
A
) và R
iB
– E(R
B

).
2.2.3.6. Độ lệch chuNn của một danh mục đầu tư
Như đã biết, một tương quan +1,0 có thể nhấn mạnh tương quan xác
định hoàn toàn, và một giá trị -1,0 có nghĩa là tỷ suất sinh lợi đã thay
đổi theo hướng hoàn toàn ngược lại. Một giá trị 0 có nghĩa là tỷ suất
sinh lợi không có mối quan hệ tuyến tính – tương quan độc lập, qua
thống kê chúng không có tương quan với nhau. Nhưng không có nghĩa
là chúng độc lập với nhau. Một giá trị như ߩ
஺஻
=0,108 là rất thấp.
Liên quan đến hệ số tương quan thấp này không khác thường đối với
những cổ phiếu trong những ngành khác nhau (ngành giải khát và
ngành xây dựng). Sự tương quan giữa những cổ phiếu của những công
ty trong phạm vi một vài ngành gần bằng 0,85.
Bây giờ, chúng ta thảo luận về các khái niệm của hiệp phương sai và
hệ số tương quan, chúng ta có thể xem công thức tính toán độ lệch
chuNn của tỷ suất sinh lợi đối với một danh mục những tài sản, phương
19



pháp ước lượng rủi ro của chúng ta đối với một danh mục. Như đã
được ghi nhận, Harry Markowitz tìm thấy công thức để tính toán độ
lệch chuNn của danh mục đầu tư.
ߪ

=


ݓ



ߪ



௜ୀଵ
+
෍෍
ݓ

ݓ

ܥ݋ݒ
௜௝

௝ିଵ

௜ୀଵ
ሺ2.8ሻ
Trong đó:
- ߪ

: Độ lệch chuNn của danh mục đầu tư.
- wi : Tỷ trọng đầu tư của tài sản riêng lẻ trong danh mục, tỷ trọng này
được xác định bởi tỷ lệ của giá trị trong danh mục đầu tư.
- σ


: Phương sai của tỷ suất sinh lợi đối với tài sản i.

- ܥ݋ݒ
௜௝
: Hiệp phương sai giữa tỷ suất sinh lợi đối với tài sản i và tài
sản j, với Covij = ݌
௜௝
ߪ

ߪ

.
Công thức này cho thấy độ lệch chuNn của danh mục đầu tư là một
phần giá trị trung bình của những phương sai riêng lẻ (trong đó tỷ
trọng là bình phương), cộng với tỷ trọng hiệp phương sai giữa những
tài sản trong danh mục. Độ lệch chuNn đối với danh mục của những tài
sản bao gồm, không chỉ phương sai của những tài sản riêng lẻ mà còn
bao gồm hiệp phương sai giữa những cặp tài sản riêng lẻ trong danh
mục.
Công thức (2.8) chính là cơ sở để chúng ta giải quyết bài toán đã đặt ra
bằng thuật giải di truyền, sẽ được trình bày ở chương kế tiếp.

20



CHƯƠNG 3. TỔNG QUAN VỀ THUẬT GIẢI DI TRUYỀN
3.1. Giới thiệu về quá trình tiến hóa tự nhiên
Như chúng ta đều biết rằng, quá trình tiến hóa tự nhiên là quá trình hoàn hảo
nhất, hợp lý nhất và đặc biệt là, tự nó đã mang tính tối ưu. Dù rằng không được
chứng minh, song nó vô cùng phù hợp với hiện thực khách quan. Thực tế cho
thấy, quá trình tiến hóa thể hiện tính tối ưu ở chỗ, thế hệ sau bao giờ cũng tốt

hơn thế hệ trước.
Tiến hóa tự nhiên được duy trì nhờ hai quá trình cơ bản: sinh sản và chọn lọc tự
nhiên. Xuyên suốt quá trình này, các thế hệ mới luôn được sinh ra để bổ sung và
thay thế cho thế hệ cũ. Cá thể nào phát triển hơn, thích ứng hơn đối với môi
trường sẽ tồn tại. Ngược lại, cá thể nào không thích ứng được sẽ bị đào thải.
Các cá thể mới sinh ra trong quá trình tiến hóa nhờ sự lai ghép ở thế hệ cha –
mẹ. Một cá thể mới có thể mang những tính trạng của cha – mẹ (gọi là cơ chế di
truyền), cũng có thể mang những tính trạng hoàn toàn mới (gọi là cơ chế đột
biến). Chính hai cơ chế này giữ vai trò chủ đạo trong tiến trình tiến hóa và có
mức độ quan trọng như nhau. Dù rằng, xác suất xảy ra của hiện tượng đột biến
thấp hơn rất nhiều so với hiện tượng di truyền.
3.2. Giới thiệu về thuật giải di truyền
Thuật giải di truyền (Genetic Algorithms – GAs), do John Holland (1975) và
Goldberg (1989) đề xuất và phát triển. Cũng như những thuật toán tiến hóa khác
nói chung, thuật giải di truyền dựa trên việc mô phỏng quá trình tiến hóa sinh
học. Chính vì vậy, nguyên lý hoạt động của thuật giải sử dụng các nguyên lý di
truyền về sự thích nghi và sự sống của các cá thể thích nghi nhất trong tự nhiên.
Nhìn chung, các thuật toán tiến hóa tuy có có những điểm khác biệt, song về cơ
bản, đều mô phỏng ba quá trình cơ bản: lai ghép, đột biến, và chọn lọc tự nhiên.
Tập hợp tất cả các lời giải trong không gian tìm kiếm gọi là kiểu hình. Các kiểu
hình này khi mã hóa gọi là kiểu gen. Toán tử di truyền sẽ được thực thi trên đối
21



tượng này. Một ánh xạ từ kiểu hình sang kiểu gen gọi là quá trình mã hóa. Mỗi
cá thể trong kiểu gen có nhiều nhiễm sắc thể. Trong mỗi nhiễm sắc thể có chứa
nhiều gen. Mỗi đặc trưng di truyền cụ thể được quy định bởi giá trị và vị trí của
gen trong nhiễm sắc thể. Độ thích nghi là thước đo khả năng sống sót và phát
triển của cá thể trong môi trường.

Toán tử xác định cá thể trong thế hệ hiện tại được giữ lại trong thế hệ tiếp theo,
được gọi là chọn lọc. Toán tử kết hợp ngẫu nhiên hai cá thể được chọn là lai
ghép. Toán tử thay đổi ngẫu nhiên cấu trúc cá thể, tức làm thay đổi giá trị của
gen gọi là đột biến.
3.3. Các quá trình chính trong thuật giải di truyền
3.3.1. Tiến trình Chọn lọc
Đối với tiến trình chọn lọc (chọn quần thể mới thỏa phân bố xác suất dựa
trên các độ thích nghi), ta dùng bánh xe Ru-lét với các rãnh được định kích
thước theo độ thích nghi. Bánh xe Ru-lét được xây dựng như sau:
- Tính độ thích nghi ݁ݒ݈ܽ

ݒ


của mỗi nhiễm sắc thể ݒ


݅=1…݌݋݌_ݏ݅ݖ݁


với pop_size là kích thước quần thể.
- Tính tổng giá trị thích nghi toàn quần thể:
ܨ=

݁ݒ݈ܽሺݒ


௣௢௣_௦௜௭௘
௜ୀଵ
ሺ3.1ሻ

- Tính xác suất chọn p

cho mỗi nhiễm sắc thể v


i=1…pop_size

:
݌

=
݁ݒ݈ܽ

ݒ


ܨ
ሺ3.2ሻ
- Tính vị trí xác xuất q

của mỗi nhiễm sắc thể v


i=1…pop_size


ݍ

=


݌


௝ୀଵ
ሺ3.3ሻ
22



Tiến trình chọn lọc được thực hiện bằng cách quay bánh xe Ru-lét pop_size
lần; mỗi lần chọn một nhiễm sắc thể từ quần thể hiện hành vào quần thể
mới theo cách sau:
- Phát sinh ngẫu nhiên một số r trong đoạn [0 1]
- Nếu r<q

thì chọn nhiễm sắc thể đầu tiên v

; ngược lại thì chọn nhiễm
sắc thể thứ i là v

ሺ2≤i≤pop_sizeሻ sao cho q
୧ିଵ
<ݎ≤q


3.3.2. Quá trình Lai ghép
Phép lai là quá trình hình thành nhiễm sắc thể mới, trên cơ sở các nhiễm sắc
thể cha – mẹ, bằng cách ghép một hay nhiều đoạn gen của hai (hay nhiều)
nhiễm sắc thể cha – mẹ với nhau. Phép lai xảy ra với xác xuất p
c

, có 3 dạng
lai ghép cơ bản: lai một vị trí (lai đơn), lai nhiều vị trí (lai bội) và lai đều.
Đồ án chỉ trình bày kiểu lai đơn. Quá trình lai đơn có thể mô phỏng như
sau:
Đối với mỗi nhiễm sắc thể trong quần thể:
- Phát sinh một số ngẫu nhiên r trong đoạn [0,1].
- Nếu r<p

thì chọn nhiễm sắc thể đó để lai ghép.
Bây giờ, ta ghép đôi các nhiễm sắc thể đã được chọn một cách ngẫu nhiên:
đối với mỗi cặp nhiễm sắc thể được ghép đôi, ta phát sinh ngẫu nhiên một
số ݌݋ݏ trong đoạn [1,݉− 1] với ݉ là chiều dài của mỗi nhiễm sắc thể. Số
݌݋ݏ cho biết vị trí của điểm lai. Hai nhiễm sắc thể:
ܾ

ܾ

…ܾ
௣௢௦
ܾ
௣௢௦ାଵ
…ܾ

ݒà ܿ

ܿ

…ܿ
௣௢௦
ܿ

௣௢௦ାଵ
…ܿ


sẽ được thay bằng cặp con của nó là
ܾ

ܾ

…ܾ
௣௢௦
ܿ
௣௢௦ାଵ
…ܿ

ݒà ܿ

ܿ

…ܿ
௣௢௦
ܾ
௣௢௦ାଵ
…ܾ

.

23




3.3.3. Quá trình Đột biến
Đột biến là hiện tượng cá thể con mang một (số) tính trạng không có trong
mã di truyền của cha – mẹ. Phép đột biến xảy ra với xác suất p
m
, nhỏ hơn
rất nhiều so với xác suất lai p
c
. Phép đột biến có thể được mô phỏng như
sau:
Đối với mỗi nhiễm sắc thể trong quần thể hiện hành (nghĩa là sau khi lai) và
đối với mỗi bit trong nhiễm sắc thể:
- Phát sinh một số r trong đoạn [0,1];
- Nếu r<p

, đột biến bit đó (từ 1 thành 0 hoặc từ 0 thành 1)
3.3.4. Hàm Thích nghi
Sau quá trình chọn lọc, lai ghép và đột biến, quần thể mới cần phải được
lượng giá. Việc lượng giá này được dùng để xây dựng phân bố xác suất
(cho quá trình chọn lọc kế tiếp).
Vì hàm thích nghi phải nhận giá trị không âm, do đó phải xây dựng ánh xạ
hàm mục tiêu đang xét sang hàm thích nghi, thông qua một hay nhiều ánh
xạ. Nếu bài toán tối ưu là cực tiểu một hàm mục tiêu ݃ሺݔሻ thì việc chuyển
݃ሺݔሻ này sang hàm thích nghi ݂ሺݔሻ trong GAs như sau:
݂

ݔ

= ܥ
௠௔௫

− ݃

ݔ

݇ℎ݅ ݃

ݔ

< ܥ
௠௔௫
;ܰ݃ượܿ ݈ạ݅ ݂

ݔ

= 0;

Trong đó, ܥ
௠௔௫
là tham số đầu vào. Có thể lấy ܥ
௠௔௫
là giá trị ݃ሺݔሻ lớn
nhất trong quần thể hiện tại, hoặc lớn nhất sau ݇ vòng lặp.
3.3.5. Điều kiện kết thúc lặp của GAs
Để kết thúc vòng lặp GAs, thường có thể chỉ định trước số thế hệ cần tạo ra,
sau đó kiểm tra độ thích nghi những phần tử tốt nhất bằng cách so sánh với
bài toán ban đầu.

24




3.3.6. Thuật giải di truyền
Tóm lại, một thuật giải di truyền, giải một bài toán được cho phải có năm
thành phần sau:
- Một cấu trúc dữ liệu ܫ biểu diễn không gian lời giải của bài toán.
- Phương pháp khởi tạo quần thể ban đầu ܲሺ0ሻ.
- Hàm định nghĩa độ thích nghi ݁ݒ݈ܽሺ ሻ, đóng vai trò môi trường.
- Các phép toán di truyền như đã mô phỏng ở trên.
- Các tham số thuật giải di truyền sử dụng (kích thước quần thể, xác suất lai,
đột biến…)
Thuật toán GAs có thể được biểu diễn dưới dạng lưu đồ thuật giải (xem
Hình 3.1) như sau:

Hình 3.1: Lưu đồ thuật giải di truyền
25



CHƯƠNG 4. PHƯƠNG PHÁP NGHIÊN CỨU
Trở lại với nhiệm vụ của đồ án, chúng ta sẽ sử dụng thuật giải di truyền để thiết lập
một danh mục đầu tư bao gồm các cổ phiếu hiện đang giao dịch trên sàn HOSE.
4.1. Mô tả bài toán
4.1.1. Xử lý dữ liệu
Dữ liệu được sử dụng là lịch sử giao dịch của các mã chứng khoán được
niêm yết trên sàn HOSE, gồm có 168 mã cổ phiếu các loại (xem phụ lục A).
Dữ liệu giao dịch này có khoảng 100,000 dòng dữ liệu, bắt đầu từ khi mã
chứng khoán đó được giao dịch cho tới ngày 19 tháng 11 năm 2008.
Các thông tin cần có trong file dữ liệu là Mã Chứng khoán, Ngày Giao dịch,
Giá Đóng cửa. Thông thường các file dữ liệu này được cung cấp miễn phí
trên các website ,

Hoặc trên các diễn đàn như
4.1.2. Phát biểu bài toán
Từ một danh sách có ݊ chứng khoán thuộc các lĩnh vực, được niêm yết trên
sàn HOSE, chúng ta cần thiết lập một danh mục đầu tư hiệu quả có
݉ ሺ݉<݊ሻ chứng khoán. Chúng ta cũng giả định tỷ trọng giữa các chứng
khoán là như nhau. Sao cho, danh mục kết quả có độ lệch chuNn (đã được
giới thiệu trong chương 2) là nhỏ nhất hoặc thỏa mãn yêu cầu của nhà đầu
tư.
Dĩ nhiên, người đầu tư mong muốn tìm được một danh mục ưng ý nhất, tuy
nhiên việc đưa ra một lời giải duy nhất trong trường hợp này sẽ không phù
hợp và thiếu sự linh động. Do đó, kết quả bài toán sẽ là một tập các danh
mục hiệu quả thỏa mãn yêu cầu về mức rủi ro mà nhà đầu tư có thể chấp
nhận.

×