Tải bản đầy đủ (.doc) (60 trang)

TIEU LUAN THONG KE BAYES UNG DUNG TRONG TAI CHINH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (542.53 KB, 60 trang )

MỤC LỤC
Trang
Mục lục ....................................................................................................................1
PHẦN I. LÝ THUYẾT CƠ BẢN VỀ THỐNG KÊ BAYES
1.1 Định lý Bayes...............................................................................................3
1.2. Sơ lược về thống kê Bayes.........................................................................5
1.2.1 Giới thiệu.............................................................................................5
1.2.2. Thông tin tiên nghiệm, mối liên hệ giữa phân phối
tiên nghiệm và hậu nghiệm ..................................................................6
1.2.2.1 Tiên nghiệm mang thông tin......................................................8
1.2.2.2 Tiên nghiệm không mang thông tin.........................................9
1.2.2.3 Phân phối tiên nghiệm liên hợp................................................10
1.2.2.4 Phân tích kinh nghiệm Bayes...................................................11
1.2.3. Thông tin hậu nghiệm.........................................................................12
1.2.3.1 Ước lượng điểm hậu nghiệm.....................................................12
1.2.3.2 Khoảng tin cậy Bayes................................................................14
1.2.3.4 So sánh giả thuyết Bayes..........................................................14
1.2.4. Suy luận dự báo Bayes.......................................................................16
PHẦN II: MỘT SỐ MÔ HÌNH THỐNG KÊ BAYES
VÀ ỨNG DỤNG TRONG TÀI CHÍNH
1. Mô hình thống kê Bayes nhị thức.....................................................................17
1.1 Hàm hợp lý..........................................................................................17
1.2 Mô hình nhị thức.................................................................................18
1.3 Ví dụ mô hình thống kê Bayes nhị thức trong tài chính....................19
2. Mô hình dễ biến động trong tài chính..............................................................23
2.1 Mô hình dễ biến động ARCH, GARCH trong dụ báo tài chính..............24
2.1.1 Mô hình ARCH................................................................................28
2.1.2 Mô hình GARCH.............................................................................29
2.1.3 Tính chất và ước lượng của quá trình GARCH(1,1).......................30
2.1.4 Ước lượng Bayes của mô hình GARCH(1,1).................................32
2.1.5 Một số kết quả ước lượng mô hình ARCH và GARCH cho giá


và lợi suất cổ phiếu...........................................................................35
2.1.6 Ý nghĩa mô hình ARCH và GARCH..............................................39
2.2 Mô hình biến động ngẫu nhiên (SV)........................................................39
2.2.1 Ước lượng của mô hình biến động ngẫu nhiên đơn..........................40
2.2.2 Phương pháp hiệu quả moments (EMM)..........................................41


2.2.3 Phương pháp Bayes trong mô hình SV.............................................42
2.2.4 Ước lượng Bayes cho mô hình biến động ngẫu nhiên SV................42
2.2.4.1 Hàm hợp lý..............................................................................43
2.2.4.2 Thuật toán mô hình đơn MCMC ước lượng SV.....................44
2.2.4.3 Thuật toán mô hình đa MCMC ước lượng SV........................47
2.2.5 Biến động dự báo và chu kỳ dự báo..................................................50
2.3 Mô hình rủi ro vốn đa hệ số......................................................................50
2.3.1 Sơ lược về mô hình rủi ro vốn đa hệ số............................................51
2.3.1.1 Mô hình thống kê yếu tố..........................................................52
(Statistical Factor Model)
2.3.1.2 Các mô hình yếu tố kinh tế vĩ mô............................................52
(Macroeconomic Factor Model)
2.3.1.3 Các mô hình yếu tố cơ bản......................................................53
(Fundamental Factor Model)
2.3.2 Phân tích rủi ro của 1 mô hình đa hệ số............................................53
2.3.2.1 Ước tính ma trận hiệp phương sai............................................53
(Covariance Matrix Estimation)
2.3.2.2 Phân hủy rủi ro..........................................................................55
(Risk Decomposition)
2.3.2.3 Đóng góp biên của cổ phiếu i đến tổng số rủi ro.....................56
(Marginal Contribution of stock i to total risk)
2.3.2.4 Đóng góp biên của yếu tố k đến tổng số rủi ro........................56
(Marginal contribution of factor k to total risk)

2.3.3 Phân tích phát sinh lợi tức..................................................................57
(Return Scenario Generation)
2.3.4 Phương pháp Bayes cho mô hình đa hệ số........................................59
(Bayesian methods for multifactor models)
TÀI LIỆU THAM KHẢO ............................................................................ 61

PHẦN I


LÝ THUYẾT CƠ BẢN VỀ THỐNG KÊ BAYES
1.1 Định lý Bayes
Định lý Bayes là nền tảng của thống kê Bayes, đó là sự kết hợp giữa phân phối xác
suất không có điều kiện với phân phối xác suất có điều kiện, cho phép chúng ta cập
nhật lại niềm tin sau khi lượng dữ liệu mới xuất hiện.
 Định lý: Giả sử { H 1 , H 2 ,..., H n } là hệ đầy đủ xung khắc các sự kiện, A là sự kiện
ngẫu nhiên trong cùng một phép thử. Khi đó:
P (H j | A ) =

P (H j ).P (A | H j )
n

∑ P (H
i =1

i

).P (A | H i )

(1.1)


 Chứng minh
Ta có: P (H j | A ) =

P (H j A )
P (A )

(Công thức xác suất có điều kiện)

Mà: + P (H j A ) = P (H j ).P (A | H j ) (Công thức nhân xác suât)
+ P (A ) = P (ΩA ) = P ((H 1 + H 2 + ... + H n )A ) = P (H 1A + ... + H n A )
= P ( H 1A ) + .... + P (H n A ) ( { H i } , i = 1, n đôi một xung khắc)
n

= ∑ P (H i ).P (A | H i )

(công thức nhân xác suất)

i =1

Suy ra:

P (H j | A ) =

P (H j ).P (A | H j )
n

∑ P (H
i =1

i


).P ( A | H i )

Công thức (1.1) còn gọi là công thức Bayes.


Ý nghĩa:
+ Công thức Bayes được sử dụng khi phép thử có nhiều hành động liên tiếp, cho

biết kết quả xảy ra của hành động sau và yêu cầu tính xác suất của hành động trước.
+ Ta có thể mô tả việc áp dụng công thức Bayes bằng sơ đồ sau về chuẩn đoán
bệnh. Giả sử tại bệnh viện nào đó các bệnh nhân mắc một trong n bệnh H 1 , H 2 ,..., H n .
Ta kí hiệu A là tập hợp các triệu chứng có ở bệnh nhân. Trong trường hợp đó xác suất
P (H i ) và P (A | H i ) có thể tìm trên cơ sở số liệu thống kê các năm trước: P (H i ) gần

bằng tần số bệnh H i trong số bệnh nhân của bệnh viện đó, P (A | H i ) gần bằng tần số


thấy tập hợp dấu hiệu A ở những bệnh nhân bị bệnh H i ở bệnh viện. Áp dụng công
thức Bayes cho ta xác suất chuẩn đoán bệnh H i khi thấy các triệu chứng A.
Ta xét các ví dụ cụ thể sau:


Ví dụ:
Ví dụ 1:
Có hai hộp thuốc. Hộp thứ nhất đựng 8 lọ thuốc, trong đó có 3 lọ kém chất lượng;

hộp thứ hai đựng 6 lọ thuốc, trong đó có 2 lọ kém chất lượng.
Lấy ngẫu nhiên một hộp rồi từ hộp đó lấy ra một lọ thì được lọ kém chất lượng.
Tính xác suất để lọ kém chất lượng đó thuộc hộp 2.

Giải
Với i ∈ { 1;2} ta đặt tên các biến cố:
H i : “lấy được hộp thứ i” và B: “lấy được lọ kém chất lượng”.

Ta có: P (H 1 ) = P (H 2 ) =

1
3
1
; P (B | H 1 ) = ; P (B | H 2 ) =
2
8
3

Xác suất phải tính là: P (H 2 | B ) .
Vì B = H 1B + H 2B nên:
P (B ) = P ( H 1 ) P ( B | H 1 ) + P ( H 2 )P (B | H 2 )
1 3 1 1 17
= . + . =
2 8 2 3 48

Vậy P ( H 2 | B ) =

P (H 2 ).P (B | H 2 ) 1 48 8
= . =
≈ 0.47
P (B )
6 17 17

Ví dụ 2:

Một hộp đựng 1 đồng tiên không đồng chất với xác suất mặt phải xuất hiện là 0,2
và 2 đồng tiên đồng chất. Chọn ngẫu nhiên một đồng tiên từ hộp và tung 3 lần thì có
hai mặt phải và một mặt trái xuất hiện. Tính xác suất đồng tiên đã chọn là đồng chất.
Giải
Gọi D là sự kiện khi tung một đồng tiên 3 lần thì xuất hiện 2 lần mặt phải và 1 lần
mặt trái, A là sự kiện đồng tiên được chọn là đồng chất, B là sự kiện đồng tiên được
chọn là không đồng chất.
Khi đó: {A, B} là hệ đầy đủ xung khắc.
Ta có:


1
3

2
3

2
3
+ P (B ) = , P (A ) = , P (D | B ) = 3.(0,2) .0,8 = 0,096, P (D | A ) = 3.(0,5) = 0.375

+ P (D ) = P (A ).P (D | A ) + P (B ).P (D | B ) =

141
500

Khi đó, xác suất đồng tiên được chọn là đồng chất là:
P (A | D ) =

P (A ).P (D | A ) 125

=
≈ 0.89
P (D )
141

Ta mở rộng ví dụ 2 ở trên như sau:
Một hộp đựng đồng tiên không đồng chất với xác suất mặt phải xuất hiện là 0,2 và
đồng tiên đồng chất. Chọn ngẫu nhiên một đồng tiên từ hộp và tung 3 lần thì có hai
mặt phải và một mặt trái xuất hiện. Tính xác suất đồng tiên đã chọn là đồng chất.
Phân tích
Trong trường hợp này ta không thể tính được P(A) vì không biết được số lượng của
đồng tiên trong hộp. Do đó ta không thể xác định được xác suất có điều kiện P(A|D).
Vậy làm thế nào để xác định xác suất đồng tiên đã chọn là đồng chất? Phương pháp
thống kê Bayes sẽ giúp chúng ta giải quyết vấn đề này.
1.2 Sơ lược về thống kê Bayes
1.2.1 Giới thiệu
Những ý tưởng cơ bản của cách tiếp cận thống kê Bayes là:


Bởi vì chúng ta không
chắc chắn về giá trị chính xác của những tham số (như

trung bình, tỉ lệ, độ lệch chuẩn …) cho nên chúng ta sẽ xem chúng như là những biến
ngẫu nhiên và có luật phân phối riêng. Trong khi thống kê cổ điển xem các tham số
này là cố định và vì thế nó không có luật phân phối. Đây chính là điểm khác biệt cơ
bản mang tính toán học giữa thống kê cổ điển và thống kê Bayes.


Quy tắc xác suất được
dùng trực tiếp trong suy luận về các tham số.




Các định lý xác suất về
các tham số phải được hiểu là “mức độ tin tưởng”. Phân

phối tiên nghiệm là chủ quan. Mỗi người có thể có những tiên nghiệm của riêng mình,
trong đó chứa đựng niềm tin của mỗi cá nhân. Điều đó ước lượng mức độ “có thể thừa
nhận” mà người ta xem xét mỗi giá trị tham số trước khi quan sát.
• Chúng ta xem xét lại niềm tin của chúng ta về các tham số sau khi có dữ liệu


bằng cách sử dụng định lý Bayes. Phân phối hậu nghiệm đến từ hai nguồn: phân phối
tiên nghiệm và dữ liệu được quan sát.
Cơ sở của thống kê Bayes chính là dựa trên thông tin tiên nghiệm và dữ liệu quan
sát, từ đó dẫn tới hàm phân phối xác suất hậu nghiệm.Vậy thông tin tiên nghiệm và
thông tin hậu nghiệm là gì?
1.2.2 Thông tin tiên nghiệm, mối liên hệ giữa phân phối tiên nghiệm và hậu nghiệm
Thông tin tiên nghiệm của các tham số là một nhân tố quan trọng trong quá trình
suy luận Bayes. Thông tin hậu nghiệm là kết quả của sự kết hợp chặt chẽ giữa thông
tin tiên nghiệm và dữ liệu quan sát, điều này được thể hiện qua công thức sau:
π (θ | x ) =

f (x | θ ).π (θ )
,
g (x )

(1.2)

trong đó:

• θ là tham số chưa biết mà ta quan tâm.


x là vectơ (hay ma trận) ghi nhận dữ liệu quan sát.



π (θ ) là phân phối tiên nghiệm của θ .



π (θ | x ) là phân phối hậu nghiệm của θ .



f (x | θ ) là hàm mật độ đồng thời của mẫu (cũng được gọi là hàm hợp lý).



g (x ) là phân phối biên duyên được tính theo công thức:

∑ f ( x | θ ) π ( θ ) nÕu θ rêi r ¹c

g( x) = 


∑ f ( x | θ ) π ( θ ) dθ nÕu θ li ª n tôc

Vì ∫ f (x | θ )π (θ )d θ hay


∑ f (x | θ )π (θ ) đều không phụ thuộc vào θ

nên (1.2) có thể

viết:
π (θ | x ) µ L (θ | x )π (θ ) , µ là tỉ lệ, L (θ | x ) là hàm hợp lý.

Ta nhận thấy, lượng dữ liệu quan sát được càng nhiều sẽ làm ảnh hưởng càng lớn
lên phân phối hậu nghiệm (trừ trường hợp phân phối tiên nghiệm chứa đựng đầy đủ
thông tin (rất rõ ràng)). Ngược lại, khi dữ liệu quá ít thì thông tin trong phân phối tiên
nghiệm sẽ đóng vai trò quan trọng trong niềm tin hậu nghiệm.
Trong khái niệm của phương pháp Bayes tất cả thông tin về θ từ dữ liệu quan sát
và thông tin tiên nghiệm được chứa đựng trong phân phối hậu nghiệm π (θ | x ) . Phân
phối hậu nghiệm chính là nhân tố chủ yếu trong suy luận Bayes.
Trở lại với ví dụ mở đầu ta có thể tìm xác suất đồng tiên đã chọn là đồng chất như
sau:


Gọi D là sự kiện khi tung một đồng tiên 3 lần thì xuất hiện 2 lần mặt phải và 1 lần
mặt trái, A là sự kiện đồng tiên được chọn là đồng chất, B là sự kiện đồng tiên được
chọn là không đồng chất.
Ta xem P(A) là một đại lượng ngẫu nhiên, vì không biết giá trị chính xác của nó
nên ta đặt tương ứng nó với một hàm mật độ xác suất π (θ ) . Giả sử rằng trong hộp số
đồng tiên đồng chất và không đồng chất là như nhau. Khi đó, P (A ) =

1
. Đây là xác
2

suất chủ quan vì tùy theo mỗi người mà sẽ có một nhận định riêng về số lượng đồng

tiên đồng chất và không đồng chất có trong hộp. Kí hiệu P (H ) = 0,2 là xác suất xuất
hiện mặt phải đối với đồng tiên không đồng chất và P ( H ) = 0,5 đối với đồng tiên đồng
chất. Tham số θ chưa biết sẽ có hàm mật độ xác suất tiên nghiệm tương ứng:
θ

0,2

0,5

π (θ )

1
= 0,5
2

1
= 0,5
2

Khi đó:
π (θ = 0,2 | D ) =

f ( D | θ = 0, 2).π (θ = 0,2)
g (D )

Mà : π (θ = 0, 2) = 0,5 ; f (D | θ = 0,2) = P (D | θ = 0,2) = 0.096
g (D ) = f (D | θ = 0,2).π (θ = 0,2) + f ( D | θ = 0,5).π (θ = 0,5) =

Vậy π (θ = 0,2 | D ) =


471
2000

32
≈ 0.2038 .
157

Tương tự, ta tính được:
π (θ = 0,5 | D ) =

125
≈ 0.796
157

Ta có bảng sau:
θ

0,2

0,5

π (θ / D )

32
≈ 0.2038
157

125
≈ 0.796
157


Ta thấy xác suất ban đầu để chọn ngẫu nhiên được một đồng tiên đồng chất là 0,5
(thông tin tiên nghiệm), sau khi cập nhật dữ liệu (đồng tiên chọn ngẫu nhiên được tung
3 lần thì 2 lần xuất hiện mặt phải, 1 lần xuất hiện mặt trái) thì xác suất này không còn
0,5 nữa mà đã tăng lên 0,796.


1.2.2.1 Tiên nghiệm mang thông tin
Tiên nghiệm mang thông tin là tiên nghiệm làm thay đổi cơ bản những thông tin
chứa trong dữ liệu. Do đó kết luận dựa vào phân phối hậu nghiệm và kết luận chỉ dựa
vào dữ liệu quan sát là khác nhau. Phương pháp phổ biến nhất để thể hiện thông tin
tiên nghiệm là đưa ra phân phối cho tham số chưa biết mà phân phối đó phản ánh được
các thông tin tiên nghiệm.
 Tiên nghiệm mang thông tin về tham số tỉ lệ
Thông thường khi nghĩ về giá trị trung bình của một biến ngẫu nhiên, nhiều người
sẽ nghĩ trung vị nhiều hơn là kì vọng của nó. Điều này sẽ không có vấn đề gì khi phân
phối là đối xứng, vì trong trường hợp đó hai giá trị này trùng nhau. Tuy nhiên, khi
phân phối chúng ta chọn là không đối xứng thì cần bảo đảm rằng giá trị tham số phản
ánh đúng thông tin tiên nghiệm. Sự thể hiện thông tin tiên nghiệm càng chuẩn càng
làm giảm tính chủ quan (trực giác). Cách dễ nhất là ta trả lời các câu hỏi sau: Giá trị
mà biến ngẫu nhiên nhận những giá trị nhỏ thua (lớn hơn) nó với xác suất ¼ là bao
nhiêu? Kí hiệu biến ngẫu nhiên là X, để trả lời câu hỏi này ta cần xác định các giá trị
x 0,25 và x 0,75 thỏa mãn điều kiện sau:
P ( X < x 0,25 ) = 0, 25
P (X > x 0,75 ) = 0,25.

Trong trường hợp tổng quát, ta cần tìm x α để biến ngẫu nhiên X nhận giá trị nhỏ
thua x α với xác suất α :
P (X < x α ) = α ,


trong đó x α gọi là phân vị mức α sẽ được xác định dựa vào niềm tin ban đầu về tham
số.
Ví dụ:
Giả sử mô hình về lợi nhuận hàng tháng của một loại tài sản tài chính có quy luật
chuẩn, N ( µ ,σ 2 ) (biến lợi nhuận là độc lập và có cùng phân phối tại các thời điểm),
mô tả tốt sự hoạt động của nó. Và giả sử hiện tại phương sai đã biết, σ 2 = σ *2 nên
chúng ta chỉ cần xác định phân phối tiên nghiệm cho tham số kì vọng chưa biết, µ .
Chúng ta biết rằng đó là phân phối đối xứng và một lựa chọn hợp lí cũng như đơn giản
cho phân phối của µ là phân phối chuẩn:
µ : N (η ,τ 2 ),


trong đó η là kì vọng tiên nghiệm và τ 2 là phương sai tiên nghiệm của µ . Chúng ta
cần xác định hai giá trị này để có được phân phối tiên nghiệm của µ .
Chúng ta tin rằng lợi nhuận hàng tháng là khoảng 1% thế nên ta gán cho η là 1%.
Hơn nữa, ta ước lượng được rằng có khoảng 25% trường hợp lợi nhuận hàng tháng ít
hơn 0,5% (nghĩa là µ0,25 = 0,5% ). Từ đây, chúng ta sẽ suy ra được: τ 2 ≈ 0,742 . Do đó
phân phối được chọn làm phân phối tiên nghiệm cho µ là N (0,01;0,742 ) .
 Tiên nghiệm mang thông tin về xác suất nhị thức
Ví dụ:
Ta cần tìm phân phối tiên nghiệm cho θ , với θ là xác suất tăng giá của cổ phiếu.
Biết rằng phân phối của θ là phân phối bêta và với niềm tin ban đầu ta xác định được
xác suất để cổ phiếu tăng giá là khoảng 2% và có khoảng 30% trường hợp xác suất
tăng giá của cổ phiếu là dưới 1%.
Từ những thông tin trên ta có:
α
= 0,02,
α +β
P (θ < 0,01) = 0,3 .


trong đó α , β là hai tham số trong phân phối bêta.
Từ hai điều kiện trên cho phép ta xác định được giá trị của α = 1,6 và β = 78, 4 .
Khi đó phân phối của θ được xác định.
1.2.2.2 Tiên nghiệm không mang thông tin
Trong nhiều trường hợp, niềm tin tiên nghiệm của chúng ta rất mơ hồ. Chính vì thế
rất khó để chuyển thành tiên nghiệm mang thông tin. Trong trường hợp này ta gọi là
tiên nghiệm không mang thông tin hay tiên nghiệm mơ hồ. Thông thường, phân phối
được lựa chọn để thể hiện tiên nghiệm không mang thông tin là phân phối đều xác
định trên các giá trị mà tham số có thể có.
Chẳng hạn, tham số chỉ trung bình µ nhận giá trị trên (−∞; ∞) có phân phối tiên
nghiệm không mang thông tin là:
π ( µ ) µ 1.

Tham số chỉ độ lệch chuẩn σ nhận giá trị trên (0; ∞) có phân phối tiên nghiệm
không mang thông tin là:
π (σ ) µ

1
.
α


Chú ý rằng hàm mật độ trong 2 trường hợp trên không phải là hàm mật độ đúng
quy cách, bởi vì:
+∞

∫ 1d µ = ∞ ,

−∞
+∞


1

∫ σ d σ = ∞.
0

Tuy nhiên ta sẽ tìm được một phân phối hậu nghiệm có hàm mật độ hợp qui cách.
1.2.2.3 Phân phối tiên nghiệm liên hợp
Trong nhiều trường hợp, ta mong muốn chọn được phân phối tiên nghiệm sao cho
việc phân tích và tìm ra phân phối hậu nghiệm được thuận tiện nhất. Giả sử dữ liệu
được sinh ra từ một phân phối xác định nào đó, khi đó ta gọi “phân phối tiên nghiệm
liên hợp” để chỉ phân phối hậu nghiệm và phân phối tiên nghiệm cùng thuộc một lớp
phân phối. Mặc dù có cùng dạng phân phối nhưng tham số của chúng là khác nhau,
tham số của phân phối hậu nghiệm phản ánh sự kết hợp giữa thông tin tiên nghiệm và
dữ liệu quan sát. Bây giờ chúng ta sẽ xét trường hợp dữ liệu có phân phối chuẩn vì nó
là trung tâm cho các vấn đề được thảo luận trong tài chính.
Nếu dữ liệu x có được từ phân phối chuẩn thì phân phối tiên nghiệm liên hợp cho
trung bình µ và phương sai σ 2 lần lượt là phân phối chuẩn và phân phối χ 2 nghịch:
π ( µ | σ 2 ) : N (η |

σ2
)
T


π (σ 2 ) = Inv − χ 2 (v 0 ,c 02 ),

(1.3)

2

2
trong đó Inv − χ (v 0 ,c 0 ) kí hiệu cho phân phối χ 2 nghịch với v 0 bậc tự do và tham số
2
2
tỉ lệ (scale) c 0 . Các tham số tiên nghiệm cần phải xác định là η ,T ,v 0 và c 0 . Tham số T

đóng vai trò là hệ số giảm trong việc phản ánh mức độ phân tán của µ . Thông thường
T sẽ lớn hơn một vì một điều hiển nhiên là mức độ phân tán của trung bình µ (thể
hiện là

σ2
) phải thấp hơn của dữ liệu x (thể hiện là σ 2 ).
T

1.2.2.4 Phân tích kinh nghiệm Bayes
Để chuyển được những thông tin tiên nghiệm thành phân phối tiên nghiệm (trường
hợp tiên nghiệm mang thông tin), chúng ta phải xác định được các tham số tiên
nghiệm trước khi quan sát và phân tích dữ liệu.


Một cách xấp xỉ để suy luận tìm ra các tham số tiên nghiệm được gọi là “xấp xỉ
kinh nghiệm Bayes”. Nhưng trong phương pháp này thông tin từ mẫu lại được dùng
để tính toán ra các giá trị của tham số tiên nghiệm. Bây giờ ta xem xét một ví dụ với
tiên nghiệm liên hợp cho dữ liệu có phân phối chuẩn.
Kí hiệu mẫu gồm n quan sát là x = (x 1 , x 2 ,..., x n ) . Khi đó hàm hợp lý phân phối
chuẩn có dạng:
 n
2 
 ∑ (x i − µ ) ÷
÷

L ( µ , σ 2 | x ) = (2πσ 2 )− n /2 exp  − i =1
2σ 2

÷

÷



(

)

 1
µ )2 
= (2πσ 2 )− n /2 exp  − 2 vs2 + n ( µ − µ
÷
 2σ


(1.4)

trong đó
n

µ =
µ

∑xi
i =1


n

n

, v = n − 1, s2 =

∑ (x
i =1

i

µ )2
−µ

n −1

.

(1.5)

Đại lượng µµ và s 2 lần lượt là ước lượng không chệch cho trung bình µ và phương sai
σ 2 của phân phối chuẩn. Khi đó biểu thức của hàm hợp lí trong (1.4) có thể được xem

là tích của hai phân phối: phân phối chuẩn của µ với điều kiện σ 2 ,
µ ;σ )
µ | σ 2 : N (µ
n
2


và phân phối χ 2 nghịch của σ 2 ,
σ 2 : Inv − χ 2 (v ; s 2 ),

với xấp xỉ kinh nghiệm Bayes thì hai phân phối này được chọn làm phân phối tiên
nghiệm cho các tham số và chúng có dạng như đã được đề cập trong (1.3). Kích thước
mẫu n ở trên đóng vai trò như hệ số giảm T trong (1.3). Dữ liệu quan sát càng nhiều sẽ
làm giảm mức độ phân tán của µ được thể hiện trong phân phối tiên nghiệm (vì
phương sai tiên nghiệm của µ càng giảm).
1.2.3 Thông tin hậu nghiệm
Phân phối hậu nghiệm của tham số (hay vectơ tham số) θ khi cho trước dữ liệu
quan sát x, kí hiệu là π (θ | x ) , được suy ra từ định lí Bayes. Bằng cách hợp nhất dữ liệu


quan sát và thông tin tiên nghiệm, phân phối hậu nghiệm chứa đựng tất cả các thông
tin có liên quan về tham số chưa biết θ .
1.2.3.1 Ước lượng điểm hậu nghiệm
Mặc dù có thể hình dung được tất cả các thông tin từ phân phối hậu nghiệm nhưng
trong thực hành đôi khi chúng ta lại cần những số liệu đặc trưng để diễn tả niềm tin
hậu nghiệm, đặc biệt là những giá trị mà thống kê truyền thống cũng rất quan tâm như
trung bình, phương sai,…Bài toán ước lượng điểm hậu nghiệm nhằm mục đích xác
định trung bình hậu nghiệm, trung vị hậu nghiệm, phuyong sai hậu nghiệm,…Các giá
trị này sẽ được xác định một khi chúng ta tìm được phân phối hậu nghiệm của các
tham số. Khi nghiên cứu về suy luận Bayes cho xác suất nhị thức, ta thấy rằng nếu
chọn phân phối tiên nghiệm cho tham số θ là phân phối bêta thì phân phối hậu nghiệm
của θ cũng là phân phối bêta. Như vậy đây là “tiên nghiệm liên hợp” và từ phân phối
hậu nghiệm của θ ta sẽ tìm được các ước lượng điểm hậu nghiệm cho nó (xét ở ví dụ
phía sau). Bây giờ ta xem xét trường hợp “tiên nghiệm liên hợp” cho dữ liệu có phân
phối chuẩn. Ta có:
• Vectơ dữ liệu x = (x 1 ,..., x n ) có được từ phân phối chuẩn, tức là:
x i : N ( µ ;σ 2 ) (i = 1, n ) là các biến ngẫu nhiên độc lập.


• Phân phối tiên nghiệm cho µ với điều kiện σ 2 là:
π ( µ | σ 2 ) = N (η |

σ2
).
T

• Phân phối tiên nghiệm cho σ 2 là:
π (σ 2 ) = Inv − χ 2 (v 0 ,c 02 ).

Khi đó phân phối hậu nghiệm cho µ với điều kiện σ 2 cũng là phân phối chuẩn:
π ( µ | x ,σ 2 ) = N ( µ * ;

trong đó µ * = µµ

σ2
)
T +n

(*)

n
T

(với µµ là trung bình mẫu).
n +T
n +T

Ta sẽ chứng minh công thức (*), thật vậy:

+ Hàm hợp lí cho µ và σ 2 là:
 1
L ( µ ,σ 2 | x ) = (2πσ 2 )− n /2 exp  − 2
 2σ

n

∑ (x
i =1

+ Với điều kiện σ 2 , hàm mật độ hậu nghiệm của µ là:

i


− µ )2 ÷.



π (µ | x ,σ 2 ) =

π ( µ | σ 2 )L ( µ , σ 2 | x )
g (x | σ 2 )

µ π ( µ | σ 2 )L ( µ , σ 2 | x )
 1
 T

µ exp  − 2 ( µ − η )2 ÷exp  − 2
 2σ


 2σ

 
b
 µ−
 1
a
µ exp − 
 2  1
  a

với

a=

2


÷
÷
÷
÷


n

∑ (x
i =1


i


− µ )2 ÷









µ
T +n
ηT + n µ
;
b
=
σ2
σ2

Từ đây ta suy ra:
E (µ | x ,σ 2 ) = µ * =

b µ n
T


,

a
n +T
n +T

D (µ | x ,σ 2 ) =

1
σ2
=
.
a T +n

Trong nhiều ứng dụng thực tế, ta chỉ quan tâm đến việc suy ra phân phối hậu
nghiệm cho µ . Một trong những lí do là bởi vì việc xác định phân phối tiên nghiệm
cho σ 2 là rất khó khăn (chưa kể đến trong thống kê nhiều chiều thì đó là ma trận hiệp
phương sai). Tuy nhiên, nếu sử dụng phân phối tiên nghiệm như trên cho σ 2 thì phân
phối hậu nghiệm của nó được xác định:
π (σ 2 | x ) = Inv − χ 2 (v * ;c 2* )

(1.6)

trong đó:
v * = v 0 + n , c 2* =

1 2
Tn µ

v c + ( n − 1)s 2 +
( µ − η )2 ÷
*  0 0

v 
T +n


với s2 là ước lượng không chệch của σ 2 đã được đề cập trong (1.5). Sử dụng (1.6) ta
tính được trung bình và phương sai hậu nghiệm của σ 2 lần lượt là:
E (σ 2 | x ) =

v*
c 2*
*
v −2


D (σ 2 | x ) =

1.2.3.2 Khoảng tin cậy Bayes

2v *2
(c 2* )2 .
*
2
*
(v − 2) (v − 4)


Ước lượng điểm hậu nghiệm sẽ không mang lại nhiều thông tin nếu như sự biến
động hậu nghiệm là đáng kể. Để đánh giá mức độ biến động, khoảng hậu nghiệm [a;b]
với độ tin cậy (1 − α ) (gọi tắt là khoảng tin cậy) được xây dựng.
Xác suất để tham số chưa biết θ rơi vào khoảng [a;b] là (1 − α ) :

b

P (a < θ < b | x ) = ∫ π (θ | x )d θ = 1 − α .
a

Để thuận tiện, khoảng tin cậy Bayes được xác định sao cho:
P (θ < a) = P (θ > b ) =

α
.
2

Định nghĩa khoảng tin cậy Bayes được dựa vào khoảng tin cậy truyền thống. Trong
thống kê truyền thống (1 − α ) là xác suất bao phủ - nếu như mẫu dữ liệu được lấy một
cách tùy ý thì 100(1 − α )% θ sẽ rơi vào khoảng tin cậy.
1.2.3.3 So sánh giả thiết Bayes
Ta dùng “so sánh giả thiết” thay cho “kiểm định giả thiết” nhằm nhấn mạnh rằng
phương pháp Bayes mang lại cho chúng ta nhiều thông tin hơn so với việc chỉ đưa ra
quyết định chấp nhận hay bác bỏ một giả thiết như trong thống kê truyền thống.
Trong thống kê truyền thống, xác suất của một giả thiết (giả thiết ban đầu hay đối
giả thiết) chỉ là 0 hoặc 1 vì thống kê truyền thống xem các tham số chưa biết như là
hằng số. Ngược lại trong thống kê Bayes tham số chưa biết được xem như biến ngẫu
nhiên nên xác suất của một giả thiết thông thường thì khác 0 và 1. Điều này ngoài việc
cho phép chúng ta so sánh để tìm ra giả thiết hợp lí mà còn cung cấp thêm xác suất
xuất hiện của nó.
Giả sử chúng ta muốn so sánh giả thiết:
H 0 : θ ∈ Θ0

với đối giả thiết:
H 1 : θ ∈ Θ1 ,


trong đó Θ0 và Θ1 là tập các giá trị có thể có của tham số chưa biết θ .
Cũng như ước lượng điểm hậu nghiệm và khoảng tin cậy Bayes, so sánh giả thiết
Bayes hoàn toàn dựa vào phân phối hậu nghiệm của tham số θ . Dựa vào phân phối
hậu nghiệm, ta sẽ tính được xác suất của giả thiết H 0 và đối giả thiết H 1 lần lượt là:
P (θ ∈ Θ0 | x ) =

∫ π (θ | x )d θ

Θ0



P (θ ∈ Θ1 | x ) = ∫ π (θ | x )d θ
Θ1

.

Xác suất của các giả thiết dựa trên phân phối hậu nghiệm là sự phản ánh khách
quan của niềm tin tiên nghiệm và chứng cứ dữ liệu, điều này giúp chúng ta đưa ra
được quyết định hợp lí nhất trên cơ sở kết hợp chặt chẽ các nguồn thông tin về θ . Đây
là công cụ quan trọng để phân tích rủi ro, giúp chúng ta đánh giá những chuỗi sự kiện
diễn ra liên tiếp rất thường gặp trong tài chính.
Bây giờ chúng ta sẽ đề cập đến phương pháp kiểm định giả thiết Bayes dựa trên tỉ
số chệch hậu nghiệm.
Tỉ số chệch hậu nghiệm là tỉ số giữa mức độ hợp lí cho mô hình tham số dưới giả
thiết H 0 và mức độ hợp lí cho mô hình tham số dưới đối thuyết H 1 nhân với tỉ số
chệch tiên nghiệm.
Nếu kí hiệu xác suất tiên nghiệm của giả thiết H 0 là α thì chệch tiên nghiệm
chính là tỉ số


α
. Khi đó chệch hậu nghiệm, kí hiệu là PO – là chệch tiên nghiệm đã
1−α

cập nhật thêm các thông tin chứa trong dữ liệu, được cho bởi công thức:
PO =

α
∫ L (θ | x , H 0 )π (θ )d θ ,
×
1 − α ∫ L (θ | x , H 1 )π (θ )d θ

trong đó:
L (θ | X , H 0 )

là hàm hợp lí hạn chế trên giả thiết H 0

L (θ | X , H 1 )

là hàm hợp lí hạn chế trên đối thiết H 1

∫ L (θ | x , H
∫ L (θ | x , H

0

)π (θ )d θ

1


)π (θ )d θ

là nhân tố Bayes

Khi không có bằng chứng tiên nghiệm thể hiện sự chấp nhận hay bác bỏ giả thiết
H 0 thì chệch tiên nghiệm (

α
) được gán bằng 1. Một giá trị thấp của tỉ số chệch hậu
1−α

nghiệm (PO) là bằng chứng để bác bỏ giả thiết H 0 .
1.2.4 Suy luận dự báo Bayes
Dựa vào phân phối hậu nghiệm, ngoài việc đưa ra những suy luận cho tham số
chúng ta còn có thể đưa ra mô hình dự báo cho lượng dữ liệu xuất hiện trong thời gian


tới. Mục đích của việc dự báo là để kiểm định lại chính mô hình như là một quá trình
kiểm định ngược (phân tích sự khác biệt giữa mô hình dự báo với thực tiễn dữ liệu
phát sinh).
Cũng như suy luận hậu nghiệm, suy luận dự báo mang đến nhiều thông tin hơn so
với việc chỉ đưa ra dự báo điểm (điều luôn có trong tất cả các phân phối dự báo) và do
đó làm tăng tính linh hoạt của mô hình. Hàm mật độ của phân phối dự báo chính là
phân phối dữ liệu dựa trên mật độ tham số hậu nghiệm. Bằng việc lấy theo trung bình
sự biến động của tham số (chứa trong hậu nghiệm), phân phối dự báo đưa ra sự mô tả
tốt nhất cho khả năng dự báo của mô hình. Ngược lại, trong thống kê truyền thống,
việc dự báo điểm hay dự báo khoảng đều dựa vào tham số được ước lượng từ mẫu
(xem tham số ước lượng được như giá trị chính xác của nó).
Nếu kí hiệu hàm mật độ phân phối mẫu và phân phối hậu nghiệm của tham số lần

lượt là f (x | θ ) và π (x | θ ) thì hàm mật độ dự báo được cho bởi:
f (x +1 | x ) = ∫ f (x +1 | θ ).π (θ | x ).d θ

(1.7)

trong đó x +1 kí hiệu cho lượng dữ liệu xuất hiện trong thời gian sắp tới. Chú ý rằng vì
tích phân trong (1.7) lấy trên tất cả các giá trị của θ nên phân phối dự báo không phụ
thuộc vào θ mà chỉ phụ thuộc vào lượng dữ liệu đã xuất hiện. Hàm mật độ dự báo có
thể được dùng để dự báo điểm (dự báo kỳ vọng) hay dự báo khoảng (khoảng chứa dữ
liệu sẽ phát sinh) và cũng được dùng để so sánh giả thuyết.

PHẦN II
CÁC MÔ HÌNH THỐNG KÊ BAYES
VÀ ỨNG DỤNG TRONG TÀI CHÍNH
1. Mô hình thống kê Bayes nhị thức
1.1 Hàm hợp lý


Giả sử chúng ta cần phân tích lợi nhuận của một loại cổ phiếu mà những thông tin
về lợi nhuận trước đó đã biết. Gọi Y là biến ngẫu nhiên chỉ lợi nhuận của cổ phiếu và
θ là một tham số trong phân phối của Y. Nếu kí hiệu n giá trị lợi nhuận quan sát của Y

là y 1 , y 2 ,..., y n thì hàm mật độ đồng thời của Y với một giá trị θ cho trước là:
f ( y 1 , y 2 ,..., y n | θ ) .

Nếu xem hàm mật độ đồng thời ở trên như một hàm của tham số θ chưa biết với n
giá trị lợi nhuận quan sát đã biết thì ta được một hàm gọi là hàm hợp lý. Kí hiệu:
L (θ | y 1 , y 2 ,..., y n ) = f ( y 1 , y 2 ,..., y n | θ ).

 Hàm hợp lý phân phối Poisson

Phân phối Poisson thường dùng để diễn tả số lần xuất hiện của một sự kiện nào đó
trong một khoảng thời gian nhất định. Biến ngẫu nhiên X được gọi là có phân phối
Poisson với tham số θ nếu:
P (X = k ) =

θ k e −θ
, k = 0,1,2,...
k!

Kí hiệu X : P (θ ) .
Giả sử chúng ta có một mẫu gồm n giá trị quan sát từ một biến ngẫu nhiên X có
phân phối Poisson với tham số θ chưa biết. Khi đó hàm hợp lý của tham số θ được
θ x i −θ
e
i =1 x i !

n

cho bởi:

n

L (θ | x 1 , x 2 ,..., x n ) = ∏ P ( X = x i | θ ) = ∏
i =1

n

∑x i

=


θ i =1
n

∏xi !

e − nθ

(2.1)

i =1

n

∑xi

µ θ i =1 e − nθ .

(2.1′)

Giá trị θ$ làm cực đại biểu thức (2.1) cũng như (2.1′) được gọi là ước lượng hợp lý
cực đại của tham số Poisson θ .
Giải phương trình

∂ ln L
= 0 , ta tìm được:
∂θ

1 n
θ$ = x = ∑ x i

n i =1

 Hàm hợp lý phân phối chuẩn


Phân phối chuẩn (hay phân phối Gauss) là một trong những phân phối quan trọng
nhất của thống kê và cũng là sự lựa chọn chiếm ưu thế trong phân tích tài chính. Biến
ngẫu nhiên Y được gọi là có phân phối chuẩn với tham số µ và σ nếu nó có hàm mật
độ xác suất:
f (y ) =

1

σ 2π

e



( y − µ )2
2σ 2

,

trong đó µ là kỳ vọng, σ là độ lệch chuẩn, y và µ có thể nhận giá trị bất kì còn σ chỉ
nhận giá trị dương.
Kí hiệu: Y : N ( µ ,σ ) .
Giả sử chúng ta có một mẫu gồm n giá trị quan sát từ một biến ngẫu nhiên Y có
phân phối chuẩn với các tham số µ và σ chưa biết. Khi đó hàm hợp lí của µ và σ
được cho bởi:

n

L ( µ ,σ | y 1 , y 2 ,..., y n ) = ∏ f ( y i )
i =1

n

 1  −∑
i =1
=
÷e
 σ 2π 
n

µ

σ − ne



n


i =1

( y i − µ )2
2σ 2

( y i − µ )2
2σ 2


.

(2.2)

Giá trị µµ ,θ$ làm cực đại biểu thức (2.2) được gọi là ước lượng hợp lí cực đại của
tham số µ và σ . Để tìm µµ ,θ$ ta giải hệ phương trình hợp lý sau:
µ 1 n
 ∂ ln L ( µ , σ | y 1 , y 2 ,..., y n )
=
0
µ = n ∑ y i

i =1
∂µ


⇒
.

n
 ∂ ln L ( µ , σ | y 1 , y 2 ,..., y n ) = 0 σµ = 1 ( y − µ
µ )2
∑ i

∂σ

n i =1



1.2 Mô hình nhị thức
Trong mô hình nhị thức, mục đích là ước lượng tỉ số chưa biết của một mẫu từ kết
quả của một dãy phép thử Bernoulli, mỗi một phép thử chỉ có hai kết quả là 0 hoặc 1.
Mô hình này tương đối đơn giản nhưng là điểm bắt đầu quan trọng của suy luận
Bayes.
Ta kí hiệu Y là biến ngẫu nhiên nhận giá trị (y) là số lần thành công trong n phép
thử Bernoulli, θ là tham số chỉ xác suất thành công trong mỗi phép thử. Khi đó, Y có
phân phối nhị thức và kí hiệu là: Y : B ( y , n ,θ )


Ta có hàm mật độ của mẫu là:
n 
f ( y | θ ) = B ( y , n ,θ ) =  ÷θ y (1 − θ )n − y ,
y 
n 

(2.3)

n!

trong đó  ÷ =
.
 y  y !(n − y )!
Để thực hiện suy luận Bayes trong mô hình nhị thức chúng ta phải xác định một
phân phối tiên nghiệm cho θ .
Chúng ta giả sử phân phối tiên nghiệm của θ là phân phối đều trên [0; 1], nghĩa là
π (θ ) = 1 . Theo định lý Bayes và công thức (2.3) ta có hàm mật độ hậu nghiệm của θ

là: π (θ | y ) µ θ y (1 − θ ) n − y .
Từ hàm mật độ hậu nghiệm này ta suy ra:

θ | y : Beta( y + 1, n − y + 1) .

1.3 Ví dụ mô hình thống kê Bayes nhị thức trong tài chính
Giả sử chúng ta quan tâm đến việc phân tích tính biến động trong ngày về giá của
một loại cổ phiếu. Đặc biệt, chúng ta muốn đánh giá xác suất tăng giá liên tiếp của nó.
Để đơn giản ta giả định xác suất để cổ phiếu tăng giá tại các thời điểm là không đổi,
vấn đề này có thể được hình dung như một mô hình nhị thức.
Trong loạt phép thử nhị thức thì mỗi phép thử chỉ có một trong hai khả năng loại
trừ nhau xảy ra và xác suất của mỗi khả năng là không đổi. Biến ngẫu nhiên nhị thức
là biến số chỉ số lần xuất hiện của trạng thái được quan tâm qua loạt phép thử đó.
Kí hiệu θ là xác suất để cổ phiếu tăng giá thì 1 - θ là xác suất cổ phiếu không tăng
giá tại một thời điểm. Gọi X là biến ngẫu nhiên chỉ số lượng thời điểm tăng giá của cổ
phiếu trong n thời điểm quan tâm thì X cũng chính là biến ngẫu nhiên có phân phối nhị
thức với tham số θ .
Khi đó xác suất để trong n thời điểm có đúng x thời điểm cổ phiếu tăng giá là:
n 
P (X = x | θ ) =  ÷θ x (1 − θ )n −x , x = 1,2,..., n ,
x 

(2.4)

Ta xét ví dụ sau:
Hãy tìm phân phối hậu nghiệm của θ (với thông tin tiên nghiệm được xét trong 2
trường hợp bên dưới), biết rằng trong 10.000 thời điểm ghi nhận lại giá cổ phiếu của
công ty A thì thấy có 176 thời điểm cổ phiếu tăng giá. Đồng thời hãy ước lượng tham
số θ .


Từ công thức (2.4) ta tính được:


 10000  176
10000 −176
P (X = 176) = 
.
÷θ (1 − θ )
176



Thông tin này được thể hiện lại trong hàm hợp lí của θ như sau:
L (θ | X = 176) = P (X = 176 | θ ) µ θ 176 (1 − θ )10000 −176 .

Bây giờ chúng ta sẽ kết hợp thông tin thu thập được với xác suất tin cậy trước đó
về sự tăng giá của cổ phiếu để tìm phân phối hậu nghiệm của θ . Trước khi làm điều
đó, ta kí hiệu phân phối tiên nghiệm của tham số chưa biết θ là π (θ ) , phân phối hậu
nghiệm của θ là π (θ | dữ liệu) và hợp hợp lí L (θ | dữ liệu).
Ta xét hai trường hợp θ :
 Trường hợp 1: Ta chưa biết bất kỳ niềm tin nào về xác suất θ thì phân phối tiên
nghiệm của θ được biểu diễn bởi phân phối đều trên đoạn [0;1]. Với giả định này thì
giá trị kì vọng của θ là 0,5 và hàm mật độ của θ được cho bởi:
π (θ ) = 1 ,

0 ≤θ ≤1.

Đồ thị hàm mật độ phân phối đều
 Trường hợp 2: Từ kinh nghiệm chúng ta thấy rằng xác suất để cổ phiếu tăng giá là
khoảng 2%. Khi đó một sự lựa chọn có thể cho phân phối tiên nghiệm của θ là phân
phối bêta. Hàm mật độ của phân phối bêta được cho bởi:
π (θ | α , β ) =


1
θ α −1 (1 − θ )β −1 ,
B (α , β )

0 ≤ θ ≤ 1,

trong đó α > 0, β > 0 là các tham số của phân phối bêta;
1

B (α , β ) = ∫ x α −1 (1 − x )β −1dx là hàm bêta.
0


Với niềm tin ban đầu, ta xác định được xác suất để cổ phiếu tăng giá là 2% và có
khoảng 30% trường hợp xác suất tăng giá của cổ phiếu là dưới 1%, điều đó có nghĩa
là:
α
= 0,02
α+β
P (θ < 0,01) = 0,3.

Từ hai điều kiện trên ta tìm được α = 1,6; β = 78, 4 và phân phối tiên nghiệm của θ
được xác định.

θ

Đồ thị hàm mật độ phân phối B ( 1,6;78, 4 )
Trong hai trường hợp phân phối tiên nghiệm khác nhau của θ đã xét, ta sẽ suy ra
được hai phân phối hậu nghiệm tương ứng:
 Trường hợp 1:

Phân phối hậu nghiệm của θ là:
π (θ | x ) µ L (θ | x ).π (θ )
µ θ 176 (1 − θ )10000 −176
= θ 177−1 (1 − θ )9825−1.

Biểu thức trên cho thấy phân phối hậu nghiệm của θ là phân phối bêta với các
tham số α = 177; β = 9825 .
 Trường hợp 2: Phân phối bêta là phân phối tiên nghiệm liên hợp cho tham số nhị
thức θ . Điều này có nghĩa là khi chọn phân phối bêta làm phân phối tiên nghiệm cho
θ thì phân phối hậu nghiệm của θ cũng là phân phối bêta:
π (θ | x ) µ L (θ | x ).π (θ )
µ θ 176 (1 − θ )10000 −176 θ 1,6 −1 (1 − θ )78,4 −1


= θ 177,6 −1 (1 − θ )9902,4 −1 .

Biểu thức trên cho thấy phân phối hậu nghiệm của θ là phân phối bêta với các
tham số α = 177,6; β = 9902, 4.
* Ước lượng điểm cho tham số θ


Theo thống kê truyền thống thì ước lượng được dùng phổ biến nhất là ước

lượng hợp lí cực đại, với số liệu trên ta tính được ước lượng hợp lí cực đại cho θ là:
176
θ$ =
= 0,0176.
10.000




Trong thống kê Bayes thì giá trị kì vọng của phân phối hậu nghiệm chính là

ước lượng điểm cho θ . Đối với phân phối bêta B(α ; β ) , giá trị kì vọng được tính bởi
công thức:
E (θ ) =

α
.
α +β

* Khi đó với việc dùng phân phối đều làm phân phối tiên nghiệm thì ước lượng
điểm cho θ là:
θ$ =

177
= 0,0177.
177 + 9825

* Trong trường hợp dùng phân phối B(1,6; 78,4) làm phân phối tiên nghiệm thì
ước lượng điểm cho θ là:
θ$ =

177,6
= 0,01762.
177,6 + 9902, 4

Ta thấy rằng, mặc dù với phương pháp ước lượng khác nhau hay thông tin tiên
nghiệm khác nhau khi dùng phương pháp Bayes nhưng ba giá trị ước lượng điểm cho


θ lại rất gần nhau. Điều này nguyên nhân là do kích thước mẫu quá lớn nên thông tin
chứa đựng trong mẫu đã “làm mờ” đi thông tin chứa đựng trong phân phối tiên
nghiệm.

2. Mô hình dễ biến động trong tài chính
Biến động mô tả các biến đổi của một chuỗi thời gian tài chính, đó là mức độ và tốc
độ của sự biến động của chuỗi thời gian. Trong ý nghĩa nào đó nó truyền đạt rõ ràng
nhất sự không chắc chắn trong tài chính ra quyết định được thực hiện. Biến động
thường được thể hiện bằng độ lệch chuẩn của lợi nhuận tài sản và tổng quát hơn lợi


nhuận được giả định là không phân phối chuẩn như quy mô của phân phối lợi nhuận.
Trong mô hình tài chính, biến động là một khái niệm hiện đại, nó là phương sai của lợi
suất tài sản chưa thực hiện trên điều kiện tất cả các thông tin có giá trị liên quan.
Ký hiệu ℑt −1 là tập hợp các thông tin sẵn đến thời gian t − 1 . Ví dụ tập thông tin này
bao gồm lợi nhuận tài sản trong quá khứ và thông tin về khối lượng giao dịch trong
quá khứ. Những biến động tại thời điểm t được cho bởi:
σ t2|t −1 = var ( rt | ℑt −1 ) = E

((r −µ
t

t |t −1

)

2

| ℑt −1


)

với r và µt |t −1 tương ứng là lợi nhuận dự kiến của tài sản và trung bình lợi nhuận có
điều kiện tại thời điểm t.
Khi biến động hôm nay phụ thuộc và biến động hôm qua, điều đó khẳng định rằng
lợi nhuận tài sản hôm nay không độc lập với lợi nhuận tài sản hôm qua. Vì vậy chúng
ta có thể viết một biểu thức mô tả sự biến đổi lợi nhuận thông qua thời gian gọi là các
quá trình ngẫu nhiên, quá trình ngẫu nhiên kết hợp với các biến động có điều kiện với
thời gian khác nhau.
Chúng ta có thể miêu tả cho một giai đoạn, lợi nhuận rt được lấy mẫu rời rạc
(chẳng hạn hàng ngày), khi đó µt |t −1 tổng của lợi nhuận kỳ vọng điều kiện và ut là một
2
thành phần ngẫu nhiên với ut : N ( 0,σ t |t −1 )

rt = µt |t −1 + ut

(2.5)

Cụ thể hơn
rt = µt |t −1 + σ t |t −1εt ,

( σ t |t −1 > 0 )

(2.6)

Thành phần ε t là trở ngại cho việc xây dựng của tất cả các mô hình chuỗi thời gian.
Nó là một quá trình ồn trắng, một dãy biến ngẫu nhiên độc lập cùng phân phối, trung
bình bằng 0 và phương sai bằng 1.
Biểu thức (2.6) là cơ sở nền tảng chung cho hai nhóm chính của các mô hình biến
động: Tự hồi quy với phương sai có điều kiện khác nhau (ARCH) và (SV)- biến động

ngẫu nhiên (Stochastic Volatility). Sự khác biệt về khác niệm giữa hai mô hình ở mức
độ xác định của σ t tại thời điểm t − 1 .
2.1 Mô hình dễ biến động ARCH, GARCH trong dự báo tài chính
Nhu cầu dự báo đang có xu hướng gia tăng bởi vì tính dự báo đã và đang ảnh hưởng
đáng kể đến quyết định hàng ngày của các cơ quan quản lý doanh nghiệp và nhà nước.


Dự báo trở thành hoạt động quan trọng trong các lĩnh vực kinh tế học, tài chính, ngân
hàng, thương mại, tiếp thị và nhiều lĩnh vực sản suất kinh doanh khác.
Đã từ lâu các nhà đầu tư, phân tích tài chính đều mong muốn trả lời câu hỏi: “ Có
thể dụ đoán được sự biến động của giá chúng khoán ?” Có rất nhiều nghiên cứu, phân
tích chuỗi giá chứng khoán đã được thực hiện nhằm tìm lời giải thõa đáng cho vấn đề
trên. Theo lý thuyết định giá chứng khoán, nếu thị trường chứng khoán hoạt động hiệu
quả thì thông tin về giá chứng khoán trong quá khứ không thể dự đoán được diễn biến
của giá chứng khoán trong tương lai. Khi đó, giá chứng khoán vận động hoàn toàn một
cách ngẫu nhiên. Tuy nhiên trong thực tế, kể cả những nước có thị trường kinh tế phát
triển, giả định về thị trường hiệu quả không hẳn là phù hợp. Việc đưa ra phân tích
chuỗi thời gian về xu hướng biến động giá cổ phiếu cho thị trường là rất có ý nghĩa và
đã có rất nhiều nhà kinh tế học đưa ra các mô hình khác nhau để phân tích và dự báo
về giá chứng khoán. Sự phát triển ứng dụng công cụ kinh tế lượng trong lĩnh vực tài
chính đã giới thiệu nhiều mô hình và kỹ thuật phân tích giúp chúng ta không những có
thể dự báo hành vi của những nhà đầu tư qua trung bình suất sinh lợi, mà còn dự báo
rủi ro bằng các chỉ số phương sai hay độ lệnh chuẩn.
Nhiều mô hình định giá tài sản đã nổ lực đã ước lượng trung bình suất sinh lợi của
một tài sản cụ thể (ví dụ cổ phiếu của một công ty) và ứng với mỗi trung bình suất sinh
lợi đều bao hàm yếu tố rủi ro hệ thống và rủi ro phi hệ thống.
Với thực tế như vậy, các mô hình kinh tế lượng và dự báo đòi hỏi phải có khả năng
dự báo mức độ dao động của cac chuỗi thời gian. Các mô hình dự báo vậy thuộc nhóm
các mô hình ARCH/GARCH (Autoregressive Conditionally Heteroskedastic /
Generalize Autoregressive Conditionally Heteroskedastic)

Trong những năm gần đây các mô hình ARCH đã được nhiều nhà nghiên cứu sử
dụng để ước lượng các nhân tố ảnh hưởng đến rủi ro của các tài sản tài chính trên thị
trường chứng khoán, thị trường vàng, thị trường dầu, thị trường bất động sản và nhiều
thi trường khác nhằm cung cấp thông tin cho các quyết định kinh doanh và đặc biệt là
trong quản trị rủi ro.
Mô hình ARCH đặc biệt được xây dựng để lập mô hình và dự báo về phương sai có
điều kiện. Phương sai của biến thụ thuộc là một hàm của biến phụ thuộc thời kỳ trước,
biến độc lập và các biến ngoại sinh. Mô hình ARCH được Engle giới thiệu vào năm
1982 và mô hình GRACH được Bollerslev giới thiệu vào năm 1986. Mô hình này


được sử dụng rộng rãi trong các mô hìn toán kinh tế, đặc biệt là phân tích chuỗi thời
gian trong tài chính.
Biểu thức dễ biến động được cho bởi
σ t2t −1 = ω + αut2−1 + βσ t2−1t −2

(2.7)

Trong đó ut là phần dư được xác định bởi ut = rt − µt t −1 = σ t t −1 ∈t . Các tham số của
2
mô hình GARCH (1,1) không âm ω > 0, α ≥ 0, β ≥ 0 để đảm bảo rằng σ t t −1 dương với

mọi giá trị của “quá trình ồn trắng”.
Ta dự đoán làm thế nào thông tin có thể xảy ra tại thời điểm t − 1 tác động đến
2
phương sai dự báo tại thời điểm t ,σ t t −1 . Thông tin mới tại thời điểm t − 1 được hợp

nhất trong mô hình ARCH, số dư bình phương ut2−1 . Tần số mang thông tin tại thời
2
điểm t − 1 là mô hình GARCH, σ t −1t −2


Viết lại (2.7) ta được
σ t2t −1 = ( 1 − α − β )

ω
+ αut2−1 + βσ t2−1t −2
1−α − β

(2.8)

Có thể thấy rằng mô hình GARCH(1,1) chỉ rõ phương sai dự báo của lợi nhuận như
là trung bình trọng lượng của ba bộ phận cấu thành:
o Phương sai không dự báo ω / ( 1 − α − β )
2
o Phương sai tiên đoán chu kỳ σ t −1t −2

o Thông tin mới tại thời điểm t − 1,ut2−1
2
2
Chi tiết của σ t t −2 trong biểu thức (2.7) là một hàm của bình phương mới, ut −1 chỉ

phù hợp với mô hình ARCH của Engle (1982)
Biểu thức (2.7) có thể dễ dàng mở rộng bằng cách thêm vào bình phương và các
phương sai dự báo để tổng quát thành mô hình GARCH(p,q). Tuy nhiên, mô hình
GARCH(1,1) thường mô tả những biến động lợi nhuận đủ tốt.
Tất nhiên, mô hình trong biểu thức (2.7) chưa đầy đủ cho đến khi chúng ta xác định
một giả định phân phối cho lợi nhuận tại thời điểm t. Khi đó, việc xem xét lợi nhuận
phụ thuộc vào thời gian. Nhiệm vụ của chúng ta là phân phối lợi nhuận có điều kiện.
Những nghiên cứu đầu tiên về mô hình GARCH(1,1) được Bllersev (1986) và Talor
(1986) giả định rằng lợi nhuận có phân phối chuẩn có điều kiện:



×