Tải bản đầy đủ (.pdf) (62 trang)

Phân phối ổn định và một số ứng dụng trong thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (457.84 KB, 62 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN




LÃ THỊ LƯƠNG




PHÂN PHỐI ỔN ĐỊNH VÀ MỘT SỐ ỨNG DỤNG
TRONG THỐNG KÊ











LUẬN VĂN THẠC SĨ KHOA HỌC













Hà Nội - 2012
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN




LÃ THỊ LƯƠNG




PHÂN PHỐI ỔN ĐỊNH VÀ MỘT SỐ ỨNG DỤNG
TRONG THỐNG KÊ



Chuyên ngành: Xác suất thống kê
Mã số: 60 46 15






LUẬN VĂN THẠC SĨ KHOA HỌC





Người hướng dẫn: PGS. TS Hồ Đăng Phúc





Hà Nội - 2012
Mục lục
Lời cảm ơn 1
Lời mở đầu 4
1 Một số kiến thức cơ sở về phân phối ổn định 7
1.1 Định lý giới hạn trung tâm . . . . . . . . . . . . . . . . . . . . . 7
1.1.1 Định lý giới hạn trung tâm cổ điển . . . . . . . . . . . . . 8
1.1.2 Định lý giới hạn trung tâm suy rộng . . . . . . . . . . . . 9
1.2 Phân phối ổn định . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.2 Hàm đặc trưng của phân phối ổn định . . . . . . . . . . . 17
1.3 Các cách tham số hóa khác đối với phân phối ổn định . . . . . . . 22
1.4 Ý nghĩa các tham số c ủa phân phối ổn đị nh . . . . . . . . . . . . 23
1.5 Mômen của phân phối ổn định và các tính chất . . . . . . . . . . 25
1.6 Phép biến đổi tuyến tính của các biến ngẫu nhiên ổn định . . . . . 26
1.7 Hàm mật độ xác suất và hàm phân phối của biến ngẫu nhiên ổn định 27
1.7.1 Các phân phối ổn định đặc biệt . . . . . . . . . . . . . . . 27
1.7.2 Các tính chất giải tích của phân phối ổn định . . . . . . . 28

1.7.3 Khai triển dạng chuỗi của hàm mật độ ổn định . . . . . . 29
1.7.4 Vấn đề tính số . . . . . . . . . . . . . . . . . . . . . . . . 32
2
1.7.5 Mô phỏng . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2 Ước lượng các tham số của phân phối ổn định 34
2.1 Phương pháp phân vị . . . . . . . . . . . . . . . . . . . . . . . . 34
2.2 Phương pháp dựa trên hàm đặc trưng . . . . . . . . . . . . . . . . 36
2.3 Phương pháp hợp lý cực đại . . . . . . . . . . . . . . . . . . . . . 38
2.4 Kiểm định đánh giá dáng điệu đuôi của phân phối ổn định . . . . 40
3 Mô hình thống kê đối với phân phối ổn định 42
3.1 Mô hình tuyến tính với nhiễu ổn định . . . . . . . . . . . . . . . . 42
3.2 Mô hình hồi quy đối với các sai số
α
− ổn định không chuẩn . . . 43
3.3 Mô hình ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4 Áp dụng mô hình ARMA với sai số phân phối ổn định 48
4.1 Công ty cổ phần Xuyên Thái Bình và cổ phiếu PAN . . . . . . . . 48
4.2 Mô hình ARMA đối với mã cổ phiếu PAN . . . . . . . . . . . . . 50
4.3 Ước lượng các tham số phâ n phối ổn định của phần dư . . . . . . 56
4.4 Kiểm định tính phù hợp với phân phối ổn định của sai số . . . . . 57
4.4.1 Sử dụng kiểm định Kolmogorov-Smir nov . . . . . . . . . 57
4.4.2 Sử dụng kiểm định Khi bình phương . . . . . . . . . . . . 58
Kết luận 59
Tài liệu tham khảo 61
3
Lời mở đầu
Trong các phương pháp phân tích thống kê cổ điển, giả thiết phân phối chuẩn
(Gauss) của các tác động ngẫu nhiên thường được sử dụng để xây dựng các công
cụ ước lượng, kiểm định và các mô hình nói chung. Tuy nhiên, khi áp dụng giả
thiết phân phối chuẩn đó sẽ không thấy sự xuất hiện của biến cố phá sản trong các

mô hình kinh tế thông thường. Nhìn vào dữ liệu của giá tài sản, ta thấy số lượng và
kích thước của các thua lỗ hoặc lợi nhuận có biên độ giao động lớn hơn rất nhiều
so với các dự đoán theo mô hình xây dựng theo giả thiết phân phối chuẩn.
Xem xét các dữ liệu liên quan đến diễn biến của các chỉ số lợi nhuận, nếu áp
dụng các tính toán dựa trên giả thiết phân phối chuẩn, ta có thể kì vọng một thua
lỗ lớn hơn bốn lần độ lệch chuẩn (4
σ
) chỉ xuất hiện một lần trong 126 năm. Mặc
dầu vậy, chỉ trong 21 năm, thua lỗ lớn hơn 4 sigma trên chỉ số tổng lợi nhuận
của FTSE100 đã được ghi nhận ở 11 trường hợp của các ngày 22/10/1987 (58%),
30/11/1987 (4.4%), 11/9/2001 (5.9%), 15/ 7/ 2002 (5. 6%), 19/7/2002 (4.7%), 22/7
/2002 (5.1%), 1/8/2002 (4.9%), 30/9/2002 (4.9%), 12/ 3/2003 (4.6%) và 21/1/2008
(5.6%). Chúng t a phải kết luận rằng có vấn đề li ên quan đến sự phù hợp của phân
phối chuẩn đối với lợi nhuận của FTSE100.
Vấn đề đó cũng có thể thấy khi vào năm 2008 Lehman Brothers đưa ra danh
sách các ngân hàng bả o hộ phá sản với số tiền nợ 613 tỷ dolar, vượt quá 150 tỷ
dolar trái phiếu nợ; Merill Lych đồng ý bán tài sản của mình cho ngân hàng của
Mỹ với giá 50 tỷ dolar, chỉ bằng 1/3 giá trị của nó trong 52 tuần cao nhất; cổ phiếu
4
của AIG rơi từ 52 t uần cao nhấ t của 70.13 dolar vào 9/10/2007 đến m ức thấp nhất
1.25 dolar vào 16/9/2008 khi Quỹ Dự trữ Liên bang Mỹ công bố một khoản vay 85
tỷ dolar, theo điều khoản và điề u kiện được thiết kế để bảo vệ lợi ích của chính phủ
Mỹ và người nộp thuế.
Chính độ lớn của các giá trị cực biên như trên sẽ dẫn đến sự xuất hiện của biến
cố phá sản. Một hệ thống đo lường rủi ro tốt có t hể đưa ra một ước lư ợng hợp lý
của xác suất xảy ra của các sự kiện cực biên không biết trước. Các thí dụ trên đây
cho thấy ước lượng của xác suất xảy ra sự kiện cực biên đưa ra bởi phân phối chuẩn
là sai lầm. Từ đó ta thấy sử dụng giả thiết phân phối chuẩn có thể dẫn đến rất nhiều
kết luận sai về việc suất hiện các giá trị cực biên trong tài chính. Bằng chứng trên
đây khiến người ta phải kết luận rằng không nên sử dụng phân phối chuẩn trong

đánh giá rủi ro. Điều này đặt ra một câu hỏi về hiệu l ực của giả thiết phân phối
chuẩn và đòi hỏi tìm kiếm một giả t hiết thay thế.
Một cách giải quyết do nhiều tác giả đề xuất trong thời gian gần đây và được
trình bày một phần trong luận văn là thay thế phâ n phối chuẩn bằ ng phân phối ổn
định. Mục đích của luận văn này là thử nghiệm sử dụng phân phối
α
ổn định trong
phân tích dữ liệu chuỗi thời gian tài chính bằng mô hình tự hồi quy trung bình trượt
(ARMA).
Ngoài phần Mở đầu, Luận văn gồm 4 chương và phần Kết luận. Chương 1 trình
bày một số kiến thức cơ sở của phân phối ồn định. Chương này nêu cụ thể các định
nghĩa, các tính chất của phân phối ổn định, hàm đặc trưng c ủa phân phối ổn định,
các cách tham số hóa đối với phân phối ổn định, các phân phối ổn định đặc biệt,
khai triển dạng chuỗi của hàm mật độ ổn định.
Chương 2 giới thiệu một số phương pháp ước lượng các tham số của phân phối
ổn định như phương pháp phân vị được đưa ra bởi McCulloch (1986); phương
pháp hàm đặc trưng của Press (1972), Paulson, Holcomb và Leitch (1975); phương
pháp ước lượng hợp lý cực đại do DuMouchel (1975), John Nolan(2002), Mittnik,
Rachev, Doganoglu và Chenyao (1999) đề xuất .
Chương 3 giới thiệu một số mô hình thống kê đối với phân phối ổn định như
5
mô hình tuyến tính với nhiễ u ổn định, mô hình hồi quy đối với các sai số
α
- ổn
định không chuẩn, mô hình tự hồi quy trung bình trượt ARMA.
Chương 4 trình bày việc thử nghiệm áp dụng mô hình tự hồi quy trung bình
trượt ARMA với sai số phân phối ổn định cho số liệu chuỗi thời gian của mã chứng
khoán PAN của Công ty cổ phần Xuyên Thái Bình. Chương này lần lượt đưa ra các
nội dung phân tích thống kê để xây dựng mô hình ARMA cho số liệu của mã chứng
khoán PAN, ước lượng các tham số phâ n phối ổn đị nh cho sai số của mô hình đó

bằng ba phương pháp đã trình bày ở Chương 2 và kiểm định tính phù hợp với phân
phối ổn định của sai số. Trong chương này, việc ước l ượng các tham số cho phân
phối ổn định của sai số được thực hiện với sự hỗ trợ của phần mềm stable.exe, việc
đưa ra kết luận về sự phù hợp của số liệu với phân phối chuẩn hay phân phối ổn
định được tiến hành dựa trên phương pháp kiểm định Phương pháp Kolmogorov-
Smirnov và phương pháp Khi-bình phương có sử dụng phần mềm thống kê R.
Phần Kết luận tổng kết lại những kết quả cơ bản của Luận văn và đưa ra một số
ý kiến về khả năng ứng dụng của phân phối ổn định cùng hướng nghiên cứu tiếp
của vấn đề này.
Mặc dù đã rất cố gắng trình bày vấn đề một cách mạch lạc và cô đọng nhưng
chắc chắn luận văn không thể tránh khỏi những t hiếu sót. Vì vậy, tác giả mong nhậ n
được sự nhận xét, đánh giá và góp ý của quý thầy cô và các bạn để luận văn được
hoàn thiện.
6
Chương 1
Một số kiến thức cơ sở về phân
phối ổn định
1.1 Định lý giới hạn trung tâm
Định lý giới hạn trung tâm là một trong những nền tảng của suy luận thống kê.
Dạng cơ bản của định lý này, do Lindeberg và Lévy đưa ra, nói rằng cho trước một
dãy n biến ngẫu nhiên độc lập cùng phân phối với phương sai hữu hạn, tổng của
chúng hội t ụ đến một phân phối chuẩn khi n tăng đế n ∞. Quy l uật này rất quan
trọng trong suy luận thống kê bởi hai lý do sau:
• Hầu hết các thống kê mẫu được xây dựng bằng cách thêm dần các biến ngẫu
nhiên độc lập cùng phân phối tương ứng với các cá thể mới được đưa thêm
vào mẫu;
• Một số hi ện tượng được quan tâm trong thống kê có thể được coi là tổng hợp
đóng góp của nhiều thành phần nhỏ.
7
Do vậy, phân phối chuẩn được dùng khá phổ biến trong c ả suy luận thống kê

và trong mô hình hóa thống kê. Ví dụ, chúng ta đưa ra giả thiết nhiễu trong hồi
quy và các mô hình chuỗi thời gia n l à kết quả của một số lớn các hi ệu ứng nhỏ với
phương sai hữu hạn, dẫn tới phân phối của chúng là chuẩn. Từ đó các ước lượng
thực nghiệm thường được coi là có phân phối gần giống phân phối chuẩn. Tính chất
lý thuyết của phân phối chuẩn như một luật giới hạn phù hợp với bằng chứng thực
nghiệm. Hai khía cạnh trên đây hỗ trợ và khuyế n khích sử dụng rộng rãi phân phối
chuẩn trong các suy luận thống kê.
1.1.1 Định lý giới hạn trung tâm cổ điển
Phần dưới đây trình bày và chứng minh định lý giới hạn trung tâm cổ điển, đây
là một kết quả nổi tiếng nên nhắc lại để so sánh với một vài kết quả sẽ được trình
bày trong phần tiếp theo.
Định lý 1.1 (Lindeberg-Lévy). Cho một dãy các biến ngẫu nhiên độc lập c ùng
phân phối {X
i
}, i = 1, ,n, với trung bình
µ
và phương sai
σ
2
< ∞. Khi đó đại
lượng
S
n
=
1

n
n

i=1

X
i

µ
σ
(1.1)
hội tụ theo phân phối tới luật chuẩn tắc N (0,1).
Chứng minh. Trước hết ký hiệu Z
i
là biến chuẩn hóa của X
i
, có trung bình 0 và
phương sai 1, Z
i
=
X
i

µ
σ
. Các Z
i
được xác định, và chúng có cùng hàm đặc trưng
φ
Z
(t). Khi đó hàm đặc trưng của S
n
được cho bởi
φ
S

n
(t) =
n

i=1
e
itZ
i
n
−1
/
2
=

φ
Z

t

n

n
Khai triển chuỗi McLaurin hàm đặc trưng của Z
i
dẫn tới
φ
Z

t


n

≈ 1+ i
t

n
E (Z
i
) + i
2
t
2
2n
E

Z
2
i

.
8
Bởi vậy hàm đặc trưng của tổng S
n

φ
S
n
(t) ≈

1−

t
2
2n

n
.
Vì lim
n→∞

1+
a
n

n
= e
a
nên
lim
n→∞
φ
S
n
(t) = e

t
2
2
Đây là hàm đặc trưng của phân phối chuẩn N (0,1).
Định lý Lindeberg-Lévy là một trong rất nhiều các phiên bản của định lý giới
hạn trung tâm, được trình bày trong luận văn này như một bước đệm để xây dựng

định lý giới hạn trung tâm tổng quát, sẽ được nghiên cứu trong phần tiếp t heo.
1.1.2 Định lý giới hạn trung tâm suy rộng
Trong định lý giới hạn trung tâm cổ điển trên đây, các biế n ngẫu nhiên X
i
được
giả thiết là có phương sai hữu hạn. Khi phương sai của các thành phần đó bằng vô
cùng, thì chúng ta phải giải quyết như thế nào? Câu hỏi đó sẽ được trả lời trong
phần tiếp theo. Định lý giới hạn trung tâm suy rộng, nới lỏng giả thiết về tính hữu
hạn của phương sai, xác định một họ phân phối mới, mà phân phối chuẩn là một
trường hợp đặc biệ t, chắc chắn phù hợp hơn với điều kiện thực tế.
Trước tiên ta đưa ra khái niệm về tính ổn định của phân phối xác suất như sau:
Định nghĩa 1.1 (Tính ổn đinh, Gnedenko và Komogrov 1954). Hàm phân phối
F(x) được gọi là ổn định nếu với bất kỳ các số dương c
1
, c
2
và các số thực d
1
, d
2
đều tồn tại các số c > 0 và d sao cho
F (c
1
x+ d
1
)F (c
2
x+ d
2
) = F (cx+ d) (1.2)

Cơ sở xuất phát để xây dựng định lý giới hạn trung tâm suy rộng được dựa trên
khẳng định: Phân phối ổn định là luật giới hạn cho tổng chuẩn hóa
S
n
=
X
1
+X
2
+ ···+X
n
C
n
−D
n
.
9
Kết quả này do Lévy (1924) đưa ra và được phát biểu chính t hức trong định lý
sau đây:
Định lý 1.2 (Lévy). Hàm phân phối F(x) là ổn định khi và chỉ khi nó là phân phối
giới hạn của
S
n
=
X
1
+X
2
+ ···+X
n

C
n
−D
n
. (1.3)
với một dãy {X
i
} các biến ngẫu nhiên độc lập cùng phân phối nào đó.
Chứng minh. Ta sẽ chứng minh điều kiện cần của Định lý, còn điều kiện đủ có thể
tham khảo trong [Limit Distributions for Sums of Independent Random Variabl es
Gnedenko, B. & Kolmogorov, A. (1954), Addison-Wesley, Reading (trang163)].
Giả sử S
n
hội tụ đến một phân phối giới hạn xác định F (x). Ta sẽ chỉ ra F (x) là ổn
định. Theo bổ đề được trình bày trong [Limit Distributions for Sums of Indepen-
dent Random Va riabl es Gnedenko, B. & Kolmogorov, A. (1954), Addison-Wesley,
Reading (trang146)], nếu X có phân phối không suy biến, thì đại lượng vô hướng
C
n
phải thỏa mãn
lim
n→∞
C
n
= ∞
lim
n→∞
C
n+1
C

n
= 1
Lấy hai số dương c
1
, c
2
sao cho c
1
< c
2
. Với mọi
ε
, l ≥ l
ε
, chọn một số m sao cho
0 ≤
C
m
C
1

c
2
c
1
<
ε
Cho hai số thực d
1
, d

2
, đặt C
n
=
C
1
c
1
và D
n
=
C
1
D
1
+C
m
D
m
+d
1
C
1
+d
2
C
m
C
n
. Khi đó, tổng

(1.3) được viết lại thành
C
1
C
n

X
1
+ + X
n
C
1
−D
1

δ
1

+
C
m
C
n

X
l+1
+ + X
l+m
C
m

−D
m

δ
2

.
Vì S
n
hội tụ đến F (x), nên hai số hạng trên hội tụ (Định lý 2, trang 42, Limit Distri-
butions for Sums of Independent Random Varia bles Gnedenko, B. & Kolmogorov,
A. (1954), Addison-Wesley, Reading ), tương ứng đến F

c
−1
1
x+ d
1


10
F

c
−1
2
x+ d
2

. Nói một cách khác, vì phân phối gi ới hạn của tổng chuẩn hóa (1.3)

là F (x), do đó
F (x) = F

c
−1
1
x+ d
1

.F

c
−1
2
x+ d
2

Bởi vậy (1.2) được thỏa mãn và F (x) là ổn định.
Theo định lý trên, nếu phân phối giới hạ n của (1.3) tồn tại, thì nó phải là ổn
định. Tuy nhiên, định lý đó không cung cấp thông tin về điều kiện cho sự tồn tại
như vậy, trừ trường hợp các X
i
có phương sai hữu hạn, phân phối chuẩn tắc là phân
phối giới hạn duy nhất.
Kết quả trình bày tiếp sau đây sẽ hoàn thiện phiên bản suy rộng của Định lý
giới hạn trung tâm. Trước tiên ta giới thiệu khái niệm về miền hút.
Định nghĩa 1.2 (Miền hút). Nếu tổng chuẩn hóa (1.3), với các số thực C
n
và D
n

được lựa chọn phù hợp, hội tụ dến phân phối giới hạn S, thì X
i
(hoặc phân phối của
nó) được gọi là bị hút bởi S; miền hút của S là tập hợp tất cả các phân phối được
hút bởi S.
Từ đị nh nghĩa trên và từ Định lý giới hạn trung tâm cổ điển, rõ ràng rằng mọi
phân phối với phương sai hữu hạn đều được hút bởi luật chuẩn. Định lý sau đây
cho thấy khi thay thế điều kiện phương sai hữu hạn bằng một điều kiện nhẹ hơn về
dáng điệu của phân phối ỏ phần đuôi, tổng chuẩn hóa (1.3) sẽ có một phân phối
giới hạn, và theo kết quả của định lý đã nê u phía trên, phân phối giới hạn đó phải
là ổn định.
Định nghĩa 1.3 (Hàm biến đổi chậm). Hàm không âm l (x) được gọi là một hàm
biến đổi chậm ở vô cực, nếu ∀x > 0
lim
t→∞
l (tx)
l (t)
= 1
.
Định lý sau chỉ ra mỗi liên hệ giữa miề n hút và tí nh biến đổi chậm c ủa hàm
phân phối:
11
Định lý 1. 3. Ký hiệu u(x) =
x

−x
t
2
dF (t). Lúc đó hàm phân phối F (x) thuộc miền
hút của một phân phối ổn định nếu và chỉ nếu

1. lim
x→∞
u(x) = x
2−
α
l (x) ,
2. lim
x→∞
1−F(x)
1−F(x)+F(−x)
= p và lim
x→∞
F(−x)
1−F(x)+F(−x)
= q,
với 0 <
α
≤ 2 (được gọi là số mũ đặc trưng của phân phối ổn định), l là hàm biến
đổi chậm và p,q ∈ R.
Có thể chứng minh giả thiết 1 tương đương với
lim
x→∞
x
2
[1−F (x) +F (−x)]
u(x)
=
2−
α
α

< ∞. (1.4)
Điều này về cơ bản có nghĩa định lý trên đúng đối với phân phối có đuôi nặng biến
đổi chính qui. Giả thiết 2 và 3 là tương tự như giả thiết 1, để cập riê ng cho dáng
điệu của đuôi trái và đuôi phải. Khi X đối xứng, ta có ngay p = q =
1
2
.
Chứng minh. Ta chỉ chứng minh điều kiện cần của Định lý, điều kiện đủ có thể
tham khảo trong [Feller,W. (1966), An Introduction to Probability Theory and its
Applications, John Wiley & Sons, New York, trang 304]. Ta sử dụng các định lý
trong [Feller,W. (1966), An Introduction to Probability Theory and its Applica-
tions, John Wiley & Sons, New York, trang 301], li ên quan đến sự hội tụ của tổng
chuẩn hóa (1.3). Sử dụng ký hiệu đại lượng vô cùng bé, có t hể viết lại các điều kiện
của Định lý thành
a) v
2
(x) =

+x

−x
tdF (t)

2
= o[u(x)];
b) lim
n→∞
nt
2
dF

n
(t) = Ω{dt}, với Ω là một độ đo nói chung,
c) n[1−F (
η
) + F (−
η
)] <
ε
, cho mọi n ∈N với
η
đủ lớn.
Chúng ta bắt đầu bằng điều kiện a.
Nếu đồng thời lim
x→∞
v(x) hữu hạn và lim
x→∞
u(x) bằng ∞, khi đó điều kiện (a) được
thỏa mãn.
12
Nếu cả hai giới hạn t rên đề u hữu hạn, ta chỉ cầ n tìm m ột hằng số quy tâm thích hợp
để đưa vế trái của biểu thức về 0, do đó lim
x→∞
v(x) = 0.
Nếu cả hai giới hạn trên đều không t ồn tại, thì điề u kiện 1 được đảm bảo nếu
u(x) tiến ra vô cùng nhanh hơn v
2
(x). Theo bất đẳng thức Schwarz ta có:
[v(x) −v(a)]
2
≤ u(x) [1−F (a)+ F (−a)]

với x > a. Do đó điều kiện là được t hỏa mãn với
lim
x→∞
u(x) = ∞.
Điều kiện c là dễ dàng suy ra từ (1.4). Như vậy chỉ còn kiểm tra điều kiện b, theo
giả thiết 1 có thể chọn C
n
sao cho
lim
n→∞
n
C
2
n
u(C
n
) = 1,
lim
n→∞
n
C
2
n
u(C
n
x) = x
2−
α
.
Nếu

α
= 2, điều kiện b được thỏa mãn nếu lấy độ đo Ω tập trung tại gốc tọa độ.
Nếu
α
< 2, đi ều kiện b và c tương đương với
lim
n→∞
n
C
2
n
u
+
(C
n
x) = px
2−
α
lim
n→∞
n
C
2
n
u

(C
n
x) = qx
2−

α
ký hiệu
u
+
(x) =
+x

0
t
2
dF (t); u

(x) =
0

−x
t
2
dF (t).
Và lập luận tương tự như phần trên, ta có kết quả riêng cho u
+
(x) và u

(x).
Như vậy chúng đã chứng minh tổng chuẩn hóa hội tụ tới một giới hạn. Theo định
lý (1.2), phân phối giới hạn phải là ổn định. Chứng minh đã được hoàn thành.
Ghi chú 1.1. Khi giới hạn (1.4) bằng 0, ta có
α
= 2, tương ứng với phân phối
Gauss, và điều kiện

lim
x→∞
x
2
[1−F (x) +F (−x)]
u(x)
= 0.
13
Có thể được dùng như một sự nới lỏng giả định phương sai hữu hạn trong định lý
giới hạn trung tâm cổ điể n.
Ví dụ 1.1. Ta đưa ra ví dụ mi nh họa, về một phân phối không thỏa m ãn các định
lý giới hạn trung tâm cổ điển nhưng thỏa mãn các điều kiện miề n hút của luật ổn
định. Đó là phân phối Cauchy được định nghĩa là
f (x) =
1
π
(1+ x
2
)
F (x) =
1
2

1
π
arctan(x),
với x ∈R. Phân phối này không có kỳ vọng (và do đó nó không có mômen cấp cao
hơn). Lưu ý rằng phân phối này là đối xứ ng, do đó F (−x) = 1−F (x) và áp dụng
(1.4) ta thu được
lim

x→∞
2x
2
[1−F(x)]
1
π
+x

−x
t
2
1+t
2
dt
= lim
x→∞
2x
2
[
1
2

1
π
arctan(x)
]
1
π
[t−arctan(t)]
+x

−x
= lim
x→∞
2
π
x
2
[
π
2
−arctan(x)
]
2
π
[x−arctan(x)]
= lim
x→∞
x
[
π
2
−arctan(x)
]
1−
arctan(x)
x
= 1
bởi vì cả tử số và mẫu số đều tiến tới 1. Do đó tổng của c ác biến ngẫu nhiên
Cauchy được thu hút bởi một phân phối ổn định với đặc số mũ là 1 (là một phân
phối Cauchy).

Hệ quả sau của đinh lý (1.3), Gnedenko và Kolmogorov (1954) đã đưa ra kết
quả sau, mô tả các đăc tính cần thiết của các hằng số chuẩn hóa C
n
và D
n
trong
(1.3).
Hệ quả 1.1. Các đại lượng vô hướng C
n
và D
n
của (1.3) phải có dạng:
C
n
=
α

n (1.5)
D
n
=












n
α

n
+∞

−∞
xdF (x) nế u 1 <
α
≤ 2


ln
φ

n

1
α

nếu
α
= 1
0 nếu
α
< 1
14
1.2 Phân phối ổn định

Kết quả phần trước chỉ ra tầm quan trọng của phối ổn định: Mặc dù miền hút
của của luật chuẩn l à khá rộng và bao gồm tất cả các phân phối với phương sai hữu
hạn, khi xử lý cá c hiện tượng với phương sai vô hạn cũng có thể tồn tại một phân
phối giới hạn, miễn là các giả thiết của Định lý (1.3) được thỏa mãn, và giới hạn
này thuộc loại phân phối ổn định. Phần tiếp theo tiến hành mô tả các thuộc tính
chính và đặc điểm chính của phân phối ổn định.
1.2.1 Định nghĩa
Mặc dù những tính ổn định đã được xác định trong (1.3), ta sẽ cung cấp thêm
một vài định nghĩa tương đương có tính minh họa nhiều hơn, the o phương pháp
tiếp cận của Samorodnitsky và Taqqu (1994).
Định nghĩa 1.4 (Tính chia được vô hạ n). Một biến ngẫu nhiên X được gọi là chia
được vô hạn nếu và chỉ nếu mọi n ∈ N, nó có thể được biểu diễn dưới dạng tổng
của n biến ngẫu nhiên độc lập có cùng phân phối, nghĩa là
X = X
n,1
+ X
n,2
+ + X
n,n
. (1.6)
Từ định nghĩa trên, điều kiện đủ của chia được vô hạn là hàm đặc trưng c ủa X
được viết bằng lũy thừa bậc n của m ột số hàm đặc trưng khác phụ thuộc vào n. Ví
dụ: phân phối chuẩn, Poisson, Cauchy t ất cả đều có tính chia được vô hạn.
Ví dụ 1.2. Tất cả các phân phối chuẩn là chia được vô hạn.
Nếu xét một biến ngẫu nhiên X ∼N

µ
,
σ
2


, có thể viết dưới dạng tổng của hai
biến ngẫu nhiên X
1
và X
2
với phân phối N

µ
/
2
,
σ
2
/
2

. Tổng quát cho bất kỳ n, X có
thể được viết dưới dạng tổng của n biến ngẫu nhiên X
i
với phân phối N

µ
/
n
,
σ
2
/
n


.
Có thể chứng minh được rằng (xem Gnedenko, B. & Kolmogorov, A. (1954), Limit
Distribut ions for Sums of Independent Random Va riabl es, Addison-Wesley, Read-
15
ing.) hàm đặc trưng c ủa luật chia được vô hạn phải có dạng
φ
(t) = exp



i
δ
t +
+∞

−∞

e
itu
−1−
itu
1+ u
2

1+ u
2
u
2
dG(u)




, (1.7)
với
δ
là một hằng số thực và G(u) là một hàm không giảm có biến phân bị chặn.
Khi u = 0, hàm dưới dấu tích phân được định nghĩa là
−t
2
/
2
. Sau đây là một định
nghĩa tương đương với tính chia được vô hạ n, đôi khi được gọi là công thức Lévy.
Đặt
M(u) =
u

−∞
1+ v
2
v
2
dG(v) ∀u < 0;
N (u) =
+∞

u
1+ v
2

v
2
dG(v) ∀u > 0;
δ
2
= G

0
+

−G

0


.
Khi đó (1.7) đư ợc viết lại thành
φ
(t) = exp

i
δ
t −
δ
2
2
t
2
+
0


−∞

e
iut
−1−
iut
1+ u
2

dM(u)+
+
+∞

0

e
iut
−1−
iut
1+ u
2

dN (u)



(1.8)
Tiếp đây là định nghĩa trực quan hơn của phân phối ổn định.
Định nghĩa 1.5 (Tính ổn định, Samorodnitsky và Taqqu 1994). Một biến ngẫu

nhiên X được gọi là có phân phối ổn định nếu và chỉ nếu cho các số dương bất kỳ
c
1
, c
2
, tồn tại một số dương c và một số t hực d sao cho
cX + d = c
1
X
1
+ c
2
X
2
, (1.9)
với X
1
và X
2
độc lập và có cùng phân phối với X. Nếu d = 0, X được gọi là ổn định
chặt.
16
Chú ý định nghĩa trên là tương đương với (1.3) đã sử dụng trong phần trước.
Một định nghĩa khác tương đương và trực quan hơn, được bắt nguồn từ (1. 9).
Định nghĩa 1.6 (Ổn định). Một biến ngầu nhiên X được gọi là có phân phối ổn
định nếu và chỉ nếu cho một số tự nhiên bất kỳ n ≥ 2, t ồn tại nột số dương C
n

D
n

sao cho
X =
X
1
+ X
2
+ + X
n
C
n
−D
n
(1.10)
X
i
là bản sao độc lập của X. Nếu D
n
= 0, X được gọi là ổn định chặt.
Như vậy, m ột biến ngẫu nhiên là ổn đị nh nếu nó có thể được chia nhỏ ra thành
một loạt các biến ngầu nhiên giống hệt nha u thông qua các hằng số chuẩn hóa.
Từ định nghĩa (1.10), phân phối ổn định đại diện cho trường hợp đặc biệ t chia
được vô hạn. Trái với (1.6), những số hạng X
i
trong (1.10) có phân phối giống X
sau khi điều chỉnh tỉ lệ theo hằ ng số C
n
.
Ví dụ 1.3. Phân phối chuẩn là ổn định. Thật vậy xét biến ngẫu nhiên X ∼N

µ

,
σ
2

.
Tổng của n bản sao độc lập của X có phân phối N

n
µ
,n
σ
2

. Vì vậy thiết lập
C
n
=

n và D
n
= (n−1)
µ
, khi đó X =
X
1
+X
2
+ +X
n
C

n
−D
n
.
Định nghĩa 1.7 (Ổn định, miền hút). Một biến ngẫu nhiên X được gọi là ổn định
nếu nó có một miền hút khác rỗng, tức là nếu có một dãy c ác biến ngẫu nhiên Y
i
độc lập, cùng phân phối sao cho

n
i=1
Y
i
C
n
−D
n
d
−→ X
chọn C
n
> 0 và D
n
.
1.2.2 Hàm đặc trưng c ủa phân phối ổn định
Cách đơn giản nhất để mô tả phân phối ổn định là đưa ra dạng hàm đặc trưng
của nó.
17
Định lý 1.4. Hàm đặc trưng của biế n ngẫu nhiên ổn định S
1

(
α
,
β
,
γ
,
δ
1
) có dạng
φ
1
(t) =





exp

i
δ
1
t −
γ
α
|t|
α

1−i

β
sgn(t)tan
πα
2

nếu
α
= 1
exp

i
δ
1
t −
γ
|t|

1+ i
β
2
π
sgn(t)ln|t|

nếu
α
= 1
(1.11)
với 0 <
α
 2, −1 

β
 1,
γ
> 0 và
δ
∈R. Ngược lại nếu một biến ngẫu nhiên có
hàm đặc trưng dạng (1.11) thì biến ngẫu nhiên đó c ó phân phối ổn định.
Chứng minh. Chú ý định nghĩa ổn định (1.2) có thể hiểu dưới dạng hàm đặc trưng
ln
φ

t
c

= ln
φ

t
c
1

+ ln
φ

t
c
2

+ i
β

t,
với
β
= (d −d
1
−d
2
). Vì phân phối ổn định là chia được vô hạn, nên ta sử dụng
biều thức (1.8) để viế t lại biểu thức trên như sau
ln
φ

t
c

= id
c
t −
σ
2
2c
2
t
2
+
0

−∞

e

iut
−1−
iut
1+ u
2

dM(cu)+
+
+∞

0

e
iut
−1−
iut
1+ u
2

dN(cu),
ln
φ

t
c

= id
c
1
t −

σ
2
2c
2
1
t
2
+
0

−∞

e
iut
−1−
iut
1+ u
2

dM(c
1
u)+
+
+∞

0

e
iut
−1−

iut
1+ u
2

dN (c
1
u) + id
c
2
t −
σ
2
2c
2
2
t
2
+
+
0

−∞

e
iut
−1−
iut
1+ u
2


dM(c
2
u)+
+
+∞

0

e
iut
−1−
iut
1+ u
2

dN (c
2
u).
(1.12)
18
Vì biểu diễn trên có tính duy nhất, nên
σ
2

1
c
2
+
1
c

2
1
+
1
c
2
2

= 0, (1.13)
M(cu) =M (c
1
u) + M(c
2
u) ∀u < 0 (1.14)
N (cu) =N (c
1
u) + N (c
2
u) ∀u > 0 (1.15)
Từ (1.14) và sử dụng tính chất ổn định, ta có
N (cu) = N (c
1
u) + N (c
2
u) + + N(c
n
u),
với số tự nhiên n bất kỳ. Đặc biệt, nếu c
1
= c

2
= = c
n
= 1, thì
N (cu) = nN (u),
c phụ t huộc vào n, và c = c(n). Theo lập luân (t rang 166, Gnedenko, B. & Kol-
mogorov, A. (1954), Limit Distributions for Sums of Independent Random Vari-
ables, Addison-We sley, Reading.) N thỏa mãn
λ
N (u) = N [
γ
(
λ
)u] ∀
λ
> 0, (1.16)
γ
(
λ
) là hàm giảm và liên tục. Trừ trường hợp N(u) là hàm đồng nhất bằng 0, còn
lại N(u) khác 0 ở khắp mọi nơi. Vì vậy từ (1.15) suy ra N(u) có đạo hàm l iên tục
với mọi u, ký hiệu N

(u) là đạo hà m cấp một của N(u),
λ
N

(u) = cN

(cu),

N

(u)
N(u)
= c
N

(cu)
N(cu)
(1.17)
Trong (1.16), nếu u = 1 và xác định
α
= −
N

(1)
N(1)
thì ta nhận được

α
= c
N

(c)
N(c)
Do đó,
N(c) = −k
2
c
α

, (1.18)
19
với k
2
là số dư ơng. Từ các kết quả liên quan tới phâ n phối chia được vô hạn, N(u)
phải thỏa mãn hai yêu cầu:
1. lim
u→∞
N (u) = 0;
2.


0
u
2
dN (u) < +∞

γ
(
λ
) giảm nên theo (1.17) đi ều kiện đầu tiên được thỏa m ãn, khi
α
> 0. Áp
dụng (1.17) điều kiện thứ hai được viết
k
2
d


0

u
1−
α
du;
tích phân đó hội tụ khi
α
< 2. Vì thế ta kết luận 0 <
α
< 2. Tư ơng tự như vậy, từ
(1.13) thu được
M(c) = −
k
1
|c|
α
(1.19)
Lấy logarithm của hàm đặc trưng (1.8) ta có
ln
φ
(t) = i
δ
t −
σ
2
2
t
2
+ k
1
0


−∞

e
iut
−1−
iut
1+ u
2

1
|u|
1+
α
du
+k
2
+∞

0

e
iut
−1−
iut
1+ u
2

1
u

1+
α
du (1.20)
Từ các đẳng thức (1.16), (1.18) và (1.13) cùng với (1.14) ta có c

α
= 2.
Mặt khác, nếu c
1
= c
2
= 1 thì
σ
2

1
c
2
−2

= 0.
Trên đây đã chỉ ra
α
< 2, vì vậy phương trình trên được thỏa mãn khi
σ
= 0. Khi
20
đó, phương trình (1.19) trở thành
ln
φ

(t) = i
δ
t + k
1
0

−∞

e
iut
−1−
iut
1+ u
2

1
|u|
1+
α
du (1.21)
+k
2
+∞

0

e
iut
−1−
iut

1+ u
2

1
u
1+
α
du.
Điều ki ện (1.13) và (1.14) được thỏa mãn bởi vì N(u) = 0 và M(u) = 0, kéo theo
k
1
= k
2
= 0, và bởi vì
σ
> 0, c
−2
= 2, nên
α
= 2. Trong trường hợp này phương
trình (1.19) trở thành
ln
φ
(t) = i
δ
t −
σ
2
2
t

2
. (1.22)
Đây là hàm đặc trưng của phân phối chuẩn.
Đặt
β
=
k
1
−k
2
k
1
+ k
2
,
sao cho −1 <
β
< 1 và
γ
=

























0
e
−u
−1
1
u
1+
α
du(k
1
+ k
2
)cos
πα
2
nếu 0 <

α
< 1



0
e
−u
−1+ u
1
u
1+
α
du(k
1
+ k
2
)cos
πα
2
nếu 1 <
α
< 2
(k
1
+ k
2
)
π
2

nếu
α
= 1
(1.23)
Đến đây, t hực hiện một vài phép biến đổi đại số đơn giản ta thu được (1.11).
Ghi chú 1.2. Chú ý khi
α
= 1, hàm đặc trưng (1.11) chứa số hạng ln|t|. Đây là
nguyên nhân cần xử lý riêng cho trường hợp
α
= 1.
21
1.3 Các cách tham số hóa khác đối với phân phối ổn
định
Hàm đặc trưng (1.11) có biểu thức khá dễ sử dụng và có thể đưa ra thêm một
số kết quả phân tích trực tiếp thú vị. Nhưng tiếc rằng nó không thuận tiện cho việc
ước lượng và rút ra cá c suy luận thống kê, vì nó không liên t ục đối với các tham số,
có một điểm kỳ dị tại
α
= 1.
Một cách viết khác của hàm đặc trưng do Zolotarev (1986) đưa ra là
φ
0
(t) =





exp{ i

δ
0
t −
γ
α
|t|
α

1+ i
β
tan
πα
2
sgn(t)

|
γ
t|
1−
α
−1

nếu
α
= 1
exp{ i
δ
0
t −
γ

|t|

1+ i
β
2
π
sgn(t)ln(
γ
|t|)

nếu
α
= 1
(1.24)
Trong trương hợp này, hàm phân phối được ký hiệu là S
0
(
α
,
β
,
γ
,
δ
0
). Dạng công
thức của hàm đặc trưng tương ứng là khá cồng kềnh, và các tính chất giải tích có ít
ý nghĩa trực quan hơn. Tuy nhiên công thức này hữ u ích hơn cho mục đích thống
kê.
Sự tương ứng giữa

δ
1
trong S
1
với
δ
0
trong S
0

δ
0
=





δ
1
+
βγ
tan
πα
2
nếu
α
= 1
δ
1

+
β
2
π
γ
ln
γ
nếu
α
= 1
(1.25)
Dựa vào mối quan hệ trên, một phân phối S
1
(
α
,
β
,1,0) tương ứng với một phân
phối S
0

α
,
β
,1,−
βγ
tan
πα
2


, với điều kiện là
α
= 1.
Một cách tham số hóa khác (do Zolota rev 1986 đưa ra ), đôi khi được sử dụng,
được ký hiệu là S
2
(
α
,
β
2
,
γ
2
,
δ
1
)
φ
2
(t) =





exp {i
δ
1
t −

γ
α
2
|t|
α
exp

−i
πβ
2
2
sgn(t)min(
α
,2−
α
)

nếu
α
= 1
exp {i
δ
1
t −
γ
2
|t|

1+ i
β

2
2
π
sgn(t)ln(
γ
2
|t|)

nếu
α
= 1
(1.26)
Tuy nhiên trong trường hợp này, hàm mật độ không liên tục với
α
và có điểm kỳ
dị tại
α
= 1. Một đặc t ính không hay của cách biểu diễn hàm đặc trưng này là tham
số đối xứng
β
thay đổi theo giá trị c ủa
α
; Khi
α
∈ (0, 1),
β
đối xứng lệch trái. Với
22
α
∈ (1, 2),

β
là đối xứng lệch phải.
Với
α
= 1, ta có thể chuyển đổi các tham số như sau:
β
= cot
πα
2
tan

πβ
2
2
min(
α
,2−
α
)

γ
=
γ
2

cos

πβ
2
2

min(
α
,2−
α
)

1
/
α
,
(1.27)
trong đó
δ

α
không thay đổi.
1.4 Ý nghĩa các tham số của phân phối ổn định
Theo kết quả đã trình bày ở phần trước, định nghĩa họ phân phối ổn định được
thể hiện với ba biểu diễn giải tích khác nhau phụ thuộc vào bốn tham số:
α

]0,2],
β
[−1,1],
γ
∈ R
+
,
δ
∈ R, sử dụng ký hiệu viết tắt là S

k
(
α
,
β
,
γ
,
δ
), k biểu
thị lựa chọn tham số (0, 1, hoặc 2). Phần tiếp theo là mô tả các tính chất của phân
phối ổn định bằng cách phân tích chính xác ý nghĩa của mỗi tham số. Xin nhắc l ại
sự khác biệt của mỗi tham số 0 và 1 nằm trong tham số
δ
, do đó những tính chất
đối với các tham số khác được giữ nguyên trong cả hai trường hợp.
Ta bắt đầu bằng cách đánh giá tham số
β
để làm việc với tính chất đối xứng của
phân phối.
Tính chất 1.1 (Tính phản chiếu). cho X
1
∼ S
k
(
α
,
β
,1,0), X
2

∼ S
k
(
α
,−
β
,1,0);
X
2
= −X
1
. Ký hiệu f
1
, f
2
là hàm mật độ và F
1
,F
2
là hàm phân phối tích l ũy của
X
1
,X
2
. Khi đó f
2
(x) = −f
1
(x) và F
2

(x) = 1−F
1
(x).
Khi
β
= 0 phân phối là đối xứng. Ngược lại,
β
> 0 phân phối là lệch về phía
phải,
β
< 0 phân phối đối xứng lệch về phía trái. Đặc biệt, nếu
β
= 1 thì phân phối
lệch hoàn toàn về phía phải, hàm mật độ nhận giá trị 0 trên nửa trục bên trái. Tương
tự, khi
β
= −1 phân phối lệch hoàn toàn về phía trái, hàm mật độ nhận giá tr ị 0
trên nửa trục bên phải.
Kết quả sau đây cho thấy
α
là tham số thể hiện độ "nặng đuôi":
23
Tính chất 1.2 (Dáng điệu đuôi). Cho X ∼ S
0
(
α
,
β
,
γ

,
δ
) và
α
< 2. Khi đó
lim
x→∞
P (X > x) =
γ
α
Γ(
α
)
π
sin
πα
2
(1+
β
)x

α
, (1.28)
lim
x→∞
f (x;
α
,
β
) = −

αγ
α
Γ(
α
)
π
sin
πα
2
(1+
β
)x
−(
α
+1)
. (1.29)
Kết quả tương tự cho dáng điệu đuôi trái được suy từ tính chất phản chiếu.
Từ kết quả trên có thể t hấy rằng
1) Theo (1.28), khi
α
tăng đuôi trở nên nhẹ hơn;
2) Đối với phân phối ổn định, dáng điệu tiệm cận của phần đuôi c ó dạng hàm mũ;
3) Khi
β
> 0, mật độ đuôi phải lớn hơn mật độ đuôi trái. Ngược lại, khi
β
> 0, mật
độ đuôi trái lớn hơn mật độ đuôi phải .
Tiếp theo ta chuyển sang
γ


δ
, chúng đại diện tương ứng cho tham số tỷ lệ và
tham số định vị của phân phối.
Tính chất 1.3 (Chuẩn hóa biến ngẫu nhiên). Cho Z ∼ S
1
(
α
,
β
,1,0). Khi đó
X =





γ
Z +
δ
nếu
α
= 1
γ
Z + (
δ
+
β
2
π

γ
ln
γ
) +
δ
nếu
α
= 1
(1.30)
Có phân phối S
1
(
α
,
β
,
γ
,
δ
).
Nếu Z ∼ S
0
(
α
,
β
,1,0) thì
X =






γ
(Z −
β
πα
2
) +
δ
nếu
α
= 1
γ
Z +
δ
nếu
α
= 1
(1.31)
có phân phối S
0
(
α
,
β
,
γ
,
δ

).
Trong phần tiếp theo, ta ký hiệu một phân phối ổn định chuân hóa là S
k
(
α
,
β
) thay
cho S
k
(
α
,
β
,1,0).
24

×