Tải bản đầy đủ (.pdf) (62 trang)

(Luận văn thạc sĩ) phân phối ổn định và một số ứng dụng trong thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (457.91 KB, 62 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
--------------------

LÃ THỊ LƯƠNG

PHÂN PHỐI ỔN ĐỊNH VÀ MỘT SỐ ỨNG DỤNG
TRONG THỐNG KÊ

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội - 2012


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
--------------------

LÃ THỊ LƯƠNG

PHÂN PHỐI ỔN ĐỊNH VÀ MỘT SỐ ỨNG DỤNG
TRONG THỐNG KÊ
Chuyên ngành: Xác suất thống kê
Mã số: 60 46 15

LUẬN VĂN THẠC SĨ KHOA HỌC

Người hướng dẫn: PGS. TS Hồ Đăng Phúc

Hà Nội - 2012



Mục lục
Lời cảm ơn

1

Lời mở đầu

4

1 Một số kiến thức cơ sở về phân phối ổn định

7

1.1

Định lý giới hạn trung tâm . . . . . . . . . . . . . . . . . . . . .

7

1.1.1

Định lý giới hạn trung tâm cổ điển . . . . . . . . . . . . .

8

1.1.2

Định lý giới hạn trung tâm suy rộng . . . . . . . . . . . .


9

Phân phối ổn định . . . . . . . . . . . . . . . . . . . . . . . . . .

15

1.2.1

Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . .

15

1.2.2

Hàm đặc trưng của phân phối ổn định . . . . . . . . . . .

17

1.3

Các cách tham số hóa khác đối với phân phối ổn định . . . . . . .

22

1.4

Ý nghĩa các tham số của phân phối ổn định . . . . . . . . . . . .

23


1.5

Mômen của phân phối ổn định và các tính chất . . . . . . . . . .

25

1.6

Phép biến đổi tuyến tính của các biến ngẫu nhiên ổn định . . . . .

26

1.7

Hàm mật độ xác suất và hàm phân phối của biến ngẫu nhiên ổn định 27

1.2

1.7.1

Các phân phối ổn định đặc biệt . . . . . . . . . . . . . . .

27

1.7.2

Các tính chất giải tích của phân phối ổn định . . . . . . .

28


1.7.3

Khai triển dạng chuỗi của hàm mật độ ổn định . . . . . .

29

1.7.4

Vấn đề tính số . . . . . . . . . . . . . . . . . . . . . . . .

32

2


1.7.5

Mô phỏng . . . . . . . . . . . . . . . . . . . . . . . . . .

2 Ước lượng các tham số của phân phối ổn định

33
34

2.1

Phương pháp phân vị . . . . . . . . . . . . . . . . . . . . . . . .

34


2.2

Phương pháp dựa trên hàm đặc trưng . . . . . . . . . . . . . . . .

36

2.3

Phương pháp hợp lý cực đại . . . . . . . . . . . . . . . . . . . . .

38

2.4

Kiểm định đánh giá dáng điệu đuôi của phân phối ổn định . . . .

40

3 Mơ hình thống kê đối với phân phối ổn định

42

3.1

Mơ hình tuyến tính với nhiễu ổn định . . . . . . . . . . . . . . . .

42

3.2


Mơ hình hồi quy đối với các sai số α − ổn định khơng chuẩn . . .

43

3.3

Mơ hình ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . .

4 Áp dụng mô hình ARMA với sai số phân phối ổn định

46
48

4.1

Cơng ty cổ phần Xuyên Thái Bình và cổ phiếu PAN . . . . . . . .

48

4.2

Mơ hình ARMA đối với mã cổ phiếu PAN . . . . . . . . . . . . .

50

4.3

Ước lượng các tham số phân phối ổn định của phần dư . . . . . .

56


4.4

Kiểm định tính phù hợp với phân phối ổn định của sai số . . . . .

57

4.4.1

Sử dụng kiểm định Kolmogorov-Smirnov . . . . . . . . .

57

4.4.2

Sử dụng kiểm định Khi bình phương . . . . . . . . . . . .

58

Kết luận

59

Tài liệu tham khảo

61

3



Lời mở đầu
Trong các phương pháp phân tích thống kê cổ điển, giả thiết phân phối chuẩn
(Gauss) của các tác động ngẫu nhiên thường được sử dụng để xây dựng các cơng
cụ ước lượng, kiểm định và các mơ hình nói chung. Tuy nhiên, khi áp dụng giả
thiết phân phối chuẩn đó sẽ khơng thấy sự xuất hiện của biến cố phá sản trong các
mơ hình kinh tế thơng thường. Nhìn vào dữ liệu của giá tài sản, ta thấy số lượng và
kích thước của các thua lỗ hoặc lợi nhuận có biên độ giao động lớn hơn rất nhiều
so với các dự đốn theo mơ hình xây dựng theo giả thiết phân phối chuẩn.
Xem xét các dữ liệu liên quan đến diễn biến của các chỉ số lợi nhuận, nếu áp
dụng các tính tốn dựa trên giả thiết phân phối chuẩn, ta có thể kì vọng một thua
lỗ lớn hơn bốn lần độ lệch chuẩn (4σ ) chỉ xuất hiện một lần trong 126 năm. Mặc
dầu vậy, chỉ trong 21 năm, thua lỗ lớn hơn 4 sigma trên chỉ số tổng lợi nhuận
của FTSE100 đã được ghi nhận ở 11 trường hợp của các ngày 22/10/1987 (58%),
30/11/1987 (4.4%), 11/9/2001 (5.9%), 15/7/2002 (5.6%), 19/7/2002 (4.7%), 22/7
/2002 (5.1%), 1/8/2002 (4.9%), 30/9/2002 (4.9%), 12/ 3/2003 (4.6%) và 21/1/2008
(5.6%). Chúng ta phải kết luận rằng có vấn đề liên quan đến sự phù hợp của phân
phối chuẩn đối với lợi nhuận của FTSE100.
Vấn đề đó cũng có thể thấy khi vào năm 2008 Lehman Brothers đưa ra danh
sách các ngân hàng bảo hộ phá sản với số tiền nợ 613 tỷ dolar, vượt quá 150 tỷ
dolar trái phiếu nợ; Merill Lych đồng ý bán tài sản của mình cho ngân hàng của
Mỹ với giá 50 tỷ dolar, chỉ bằng 1/3 giá trị của nó trong 52 tuần cao nhất; cổ phiếu
4


của AIG rơi từ 52 tuần cao nhất của 70.13 dolar vào 9/10/2007 đến mức thấp nhất
1.25 dolar vào 16/9/2008 khi Quỹ Dự trữ Liên bang Mỹ công bố một khoản vay 85
tỷ dolar, theo điều khoản và điều kiện được thiết kế để bảo vệ lợi ích của chính phủ
Mỹ và người nộp thuế.
Chính độ lớn của các giá trị cực biên như trên sẽ dẫn đến sự xuất hiện của biến
cố phá sản. Một hệ thống đo lường rủi ro tốt có thể đưa ra một ước lượng hợp lý

của xác suất xảy ra của các sự kiện cực biên khơng biết trước. Các thí dụ trên đây
cho thấy ước lượng của xác suất xảy ra sự kiện cực biên đưa ra bởi phân phối chuẩn
là sai lầm. Từ đó ta thấy sử dụng giả thiết phân phối chuẩn có thể dẫn đến rất nhiều
kết luận sai về việc suất hiện các giá trị cực biên trong tài chính. Bằng chứng trên
đây khiến người ta phải kết luận rằng không nên sử dụng phân phối chuẩn trong
đánh giá rủi ro. Điều này đặt ra một câu hỏi về hiệu lực của giả thiết phân phối
chuẩn và đòi hỏi tìm kiếm một giả thiết thay thế.
Một cách giải quyết do nhiều tác giả đề xuất trong thời gian gần đây và được
trình bày một phần trong luận văn là thay thế phân phối chuẩn bằng phân phối ổn
định. Mục đích của luận văn này là thử nghiệm sử dụng phân phối α ổn định trong
phân tích dữ liệu chuỗi thời gian tài chính bằng mơ hình tự hồi quy trung bình trượt
(ARMA).
Ngồi phần Mở đầu, Luận văn gồm 4 chương và phần Kết luận. Chương 1 trình
bày một số kiến thức cơ sở của phân phối ồn định. Chương này nêu cụ thể các định
nghĩa, các tính chất của phân phối ổn định, hàm đặc trưng của phân phối ổn định,
các cách tham số hóa đối với phân phối ổn định, các phân phối ổn định đặc biệt,
khai triển dạng chuỗi của hàm mật độ ổn định.
Chương 2 giới thiệu một số phương pháp ước lượng các tham số của phân phối
ổn định như phương pháp phân vị được đưa ra bởi McCulloch (1986); phương
pháp hàm đặc trưng của Press (1972), Paulson, Holcomb và Leitch (1975); phương
pháp ước lượng hợp lý cực đại do DuMouchel (1975), John Nolan(2002), Mittnik,
Rachev, Doganoglu và Chenyao (1999) đề xuất.
Chương 3 giới thiệu một số mơ hình thống kê đối với phân phối ổn định như
5


mơ hình tuyến tính với nhiễu ổn định, mơ hình hồi quy đối với các sai số α - ổn
định khơng chuẩn, mơ hình tự hồi quy trung bình trượt ARMA.
Chương 4 trình bày việc thử nghiệm áp dụng mơ hình tự hồi quy trung bình
trượt ARMA với sai số phân phối ổn định cho số liệu chuỗi thời gian của mã chứng

khốn PAN của Cơng ty cổ phần Xun Thái Bình. Chương này lần lượt đưa ra các
nội dung phân tích thống kê để xây dựng mơ hình ARMA cho số liệu của mã chứng
khoán PAN, ước lượng các tham số phân phối ổn định cho sai số của mơ hình đó
bằng ba phương pháp đã trình bày ở Chương 2 và kiểm định tính phù hợp với phân
phối ổn định của sai số. Trong chương này, việc ước lượng các tham số cho phân
phối ổn định của sai số được thực hiện với sự hỗ trợ của phần mềm stable.exe, việc
đưa ra kết luận về sự phù hợp của số liệu với phân phối chuẩn hay phân phối ổn
định được tiến hành dựa trên phương pháp kiểm định Phương pháp KolmogorovSmirnov và phương pháp Khi-bình phương có sử dụng phần mềm thống kê R.
Phần Kết luận tổng kết lại những kết quả cơ bản của Luận văn và đưa ra một số
ý kiến về khả năng ứng dụng của phân phối ổn định cùng hướng nghiên cứu tiếp
của vấn đề này.
Mặc dù đã rất cố gắng trình bày vấn đề một cách mạch lạc và cô đọng nhưng
chắc chắn luận văn khơng thể tránh khỏi những thiếu sót. Vì vậy, tác giả mong nhận
được sự nhận xét, đánh giá và góp ý của q thầy cơ và các bạn để luận văn được
hoàn thiện.

6


Chương 1

Một số kiến thức cơ sở về phân
phối ổn định
1.1

Định lý giới hạn trung tâm

Định lý giới hạn trung tâm là một trong những nền tảng của suy luận thống kê.
Dạng cơ bản của định lý này, do Lindeberg và Lévy đưa ra, nói rằng cho trước một
dãy n biến ngẫu nhiên độc lập cùng phân phối với phương sai hữu hạn, tổng của

chúng hội tụ đến một phân phối chuẩn khi n tăng đến ∞. Quy luật này rất quan
trọng trong suy luận thống kê bởi hai lý do sau:
• Hầu hết các thống kê mẫu được xây dựng bằng cách thêm dần các biến ngẫu

nhiên độc lập cùng phân phối tương ứng với các cá thể mới được đưa thêm
vào mẫu;

• Một số hiện tượng được quan tâm trong thống kê có thể được coi là tổng hợp
đóng góp của nhiều thành phần nhỏ.

7


Do vậy, phân phối chuẩn được dùng khá phổ biến trong cả suy luận thống kê
và trong mơ hình hóa thống kê. Ví dụ, chúng ta đưa ra giả thiết nhiễu trong hồi
quy và các mơ hình chuỗi thời gian là kết quả của một số lớn các hiệu ứng nhỏ với
phương sai hữu hạn, dẫn tới phân phối của chúng là chuẩn. Từ đó các ước lượng
thực nghiệm thường được coi là có phân phối gần giống phân phối chuẩn. Tính chất
lý thuyết của phân phối chuẩn như một luật giới hạn phù hợp với bằng chứng thực
nghiệm. Hai khía cạnh trên đây hỗ trợ và khuyến khích sử dụng rộng rãi phân phối
chuẩn trong các suy luận thống kê.

1.1.1

Định lý giới hạn trung tâm cổ điển

Phần dưới đây trình bày và chứng minh định lý giới hạn trung tâm cổ điển, đây
là một kết quả nổi tiếng nên nhắc lại để so sánh với một vài kết quả sẽ được trình
bày trong phần tiếp theo.
Định lý 1.1 (Lindeberg-Lévy). Cho một dãy các biến ngẫu nhiên độc lập cùng

phân phối {Xi } , i = 1, ..., n, với trung bình µ và phương sai σ 2 < ∞. Khi đó đại
lượng

1 n Xi − µ
Sn = √ ∑
n i=1 σ

(1.1)

hội tụ theo phân phối tới luật chuẩn tắc N (0, 1).
Chứng minh. Trước hết ký hiệu Zi là biến chuẩn hóa của Xi , có trung bình 0 và
phương sai 1, Zi =

Xi −µ
σ .

Các Zi được xác định, và chúng có cùng hàm đặc trưng

φZ (t). Khi đó hàm đặc trưng của Sn được cho bởi
n

φSn (t) = ∏ e

itZi n−1/2

i=1

= φZ

t


n

n

Khai triển chuỗi McLaurin hàm đặc trưng của Zi dẫn tới

φZ

t

n

2
t
2t
≈ 1 + i √ E (Zi ) + i
E Zi2 .
n
2n

8


Bởi vậy hàm đặc trưng của tổng Sn là
n

t2
φSn (t) ≈ 1 −
2n

Vì lim 1 + na
n→∞

n

.

= ea nên
t2

lim φSn (t) = e− 2

n→∞

Đây là hàm đặc trưng của phân phối chuẩn N (0, 1).
Định lý Lindeberg-Lévy là một trong rất nhiều các phiên bản của định lý giới
hạn trung tâm, được trình bày trong luận văn này như một bước đệm để xây dựng
định lý giới hạn trung tâm tổng quát, sẽ được nghiên cứu trong phần tiếp theo.

1.1.2

Định lý giới hạn trung tâm suy rộng

Trong định lý giới hạn trung tâm cổ điển trên đây, các biến ngẫu nhiên Xi được
giả thiết là có phương sai hữu hạn. Khi phương sai của các thành phần đó bằng vơ
cùng, thì chúng ta phải giải quyết như thế nào? Câu hỏi đó sẽ được trả lời trong
phần tiếp theo. Định lý giới hạn trung tâm suy rộng, nới lỏng giả thiết về tính hữu
hạn của phương sai, xác định một họ phân phối mới, mà phân phối chuẩn là một
trường hợp đặc biệt, chắc chắn phù hợp hơn với điều kiện thực tế.
Trước tiên ta đưa ra khái niệm về tính ổn định của phân phối xác suất như sau:

Định nghĩa 1.1 (Tính ổn đinh, Gnedenko và Komogrov 1954). Hàm phân phối
F(x) được gọi là ổn định nếu với bất kỳ các số dương c1 , c2 và các số thực d1 , d2
đều tồn tại các số c > 0 và d sao cho
F (c1 x + d1 ) F (c2 x + d2 ) = F (cx + d)

(1.2)

Cơ sở xuất phát để xây dựng định lý giới hạn trung tâm suy rộng được dựa trên
khẳng định: Phân phối ổn định là luật giới hạn cho tổng chuẩn hóa
Sn =

X1 +X2 + · · · +Xn
−Dn .
Cn
9


Kết quả này do Lévy (1924) đưa ra và được phát biểu chính thức trong định lý
sau đây:
Định lý 1.2 (Lévy). Hàm phân phối F(x) là ổn định khi và chỉ khi nó là phân phối
giới hạn của
Sn =

X1 +X2 + · · · +Xn
−Dn .
Cn

(1.3)

với một dãy {Xi } các biến ngẫu nhiên độc lập cùng phân phối nào đó.

Chứng minh. Ta sẽ chứng minh điều kiện cần của Định lý, cịn điều kiện đủ có thể
tham khảo trong [Limit Distributions for Sums of Independent Random Variables
Gnedenko, B. & Kolmogorov, A. (1954), Addison-Wesley, Reading (trang163)].
Giả sử Sn hội tụ đến một phân phối giới hạn xác định F (x). Ta sẽ chỉ ra F (x) là ổn
định. Theo bổ đề được trình bày trong [Limit Distributions for Sums of Independent Random Variables Gnedenko, B. & Kolmogorov, A. (1954), Addison-Wesley,
Reading (trang146)], nếu X có phân phối khơng suy biến, thì đại lượng vô hướng
Cn phải thỏa mãn
lim Cn = ∞

n→∞

Cn+1
=1
n→∞ Cn
lim

Lấy hai số dương c1 , c2 sao cho c1 < c2 . Với mọi ε , l ≥ lε , chọn một số m sao cho
0≤
Cho hai số thực d1 , d2 , đặt Cn =

C1
c1

Cm c2
− <ε
C1 c1
và Dn =

C1 D1 +Cm Dm +d1C1 +d2Cm
.

Cn

Khi đó, tổng

(1.3) được viết lại thành
C1 X1 + ... + Xn
Cm Xl+1 + ... + Xl+m
− D1 − δ1 +
− Dm − δ2 .
Cn
C1
Cn
Cm
Vì Sn hội tụ đến F (x), nên hai số hạng trên hội tụ (Định lý 2, trang 42, Limit Distributions for Sums of Independent Random Variables Gnedenko, B. & Kolmogorov,
A. (1954), Addison-Wesley, Reading ), tương ứng đến F c−1
1 x + d1 và
10


F c−1
2 x + d2 . Nói một cách khác, vì phân phối giới hạn của tổng chuẩn hóa (1.3)
là F (x), do đó
−1
F (x) = F c−1
1 x + d1 .F c2 x + d2

Bởi vậy (1.2) được thỏa mãn và F (x) là ổn định.
Theo định lý trên, nếu phân phối giới hạn của (1.3) tồn tại, thì nó phải là ổn
định. Tuy nhiên, định lý đó khơng cung cấp thông tin về điều kiện cho sự tồn tại
như vậy, trừ trường hợp các Xi có phương sai hữu hạn, phân phối chuẩn tắc là phân

phối giới hạn duy nhất.
Kết quả trình bày tiếp sau đây sẽ hồn thiện phiên bản suy rộng của Định lý
giới hạn trung tâm. Trước tiên ta giới thiệu khái niệm về miền hút.
Định nghĩa 1.2 (Miền hút). Nếu tổng chuẩn hóa (1.3), với các số thực Cn và Dn
được lựa chọn phù hợp, hội tụ dến phân phối giới hạn S, thì Xi (hoặc phân phối của
nó) được gọi là bị hút bởi S; miền hút của S là tập hợp tất cả các phân phối được
hút bởi S.
Từ định nghĩa trên và từ Định lý giới hạn trung tâm cổ điển, rõ ràng rằng mọi
phân phối với phương sai hữu hạn đều được hút bởi luật chuẩn. Định lý sau đây
cho thấy khi thay thế điều kiện phương sai hữu hạn bằng một điều kiện nhẹ hơn về
dáng điệu của phân phối ỏ phần đi, tổng chuẩn hóa (1.3) sẽ có một phân phối
giới hạn, và theo kết quả của định lý đã nêu phía trên, phân phối giới hạn đó phải
là ổn định.
Định nghĩa 1.3 (Hàm biến đổi chậm). Hàm không âm l (x) được gọi là một hàm
biến đổi chậm ở vô cực, nếu ∀x > 0
l (tx)
=1
t→∞ l (t)
lim

.
Định lý sau chỉ ra mỗi liên hệ giữa miền hút và tính biến đổi chậm của hàm
phân phối:
11


Định lý 1.3. Ký hiệu u (x) =

x


t 2 dF (t). Lúc đó hàm phân phối F (x) thuộc miền

−x

hút của một phân phối ổn định nếu và chỉ nếu
1. lim u(x) = x2−α l (x) ,
x→∞

1−F(x)
1−F(x)+F(−x)
x→∞

2. lim

F(−x)
1−F(x)+F(−x)
x→∞

= p và lim

= q,

với 0 < α ≤ 2 (được gọi là số mũ đặc trưng của phân phối ổn định), l là hàm biến
đổi chậm và p, q ∈ R.

Có thể chứng minh giả thiết 1 tương đương với
x2 [1 − F (x) + F (−x)] 2 − α
=
lim
< ∞.

x→∞
u (x)
α

(1.4)

Điều này về cơ bản có nghĩa định lý trên đúng đối với phân phối có đi nặng biến
đổi chính qui. Giả thiết 2 và 3 là tương tự như giả thiết 1, để cập riêng cho dáng
điệu của đuôi trái và đi phải. Khi X đối xứng, ta có ngay p = q = 12 .
Chứng minh. Ta chỉ chứng minh điều kiện cần của Định lý, điều kiện đủ có thể
tham khảo trong [Feller,W. (1966), An Introduction to Probability Theory and its
Applications, John Wiley & Sons, New York, trang 304]. Ta sử dụng các định lý
trong [Feller,W. (1966), An Introduction to Probability Theory and its Applications, John Wiley & Sons, New York, trang 301], liên quan đến sự hội tụ của tổng
chuẩn hóa (1.3). Sử dụng ký hiệu đại lượng vơ cùng bé, có thể viết lại các điều kiện
của Định lý thành
a)

v2 (x) =

2

+x

tdF (t)

= o [u (x)] ;

−x

b) lim nt 2 dFn (t) = Ω {dt}, với Ω là một độ đo nói chung,

n→∞

c) n [1 − F (η ) + F (−η )] < ε , cho mọi n ∈ N với η đủ lớn.
Chúng ta bắt đầu bằng điều kiện a.

Nếu đồng thời lim v (x) hữu hạn và lim u (x) bằng ∞, khi đó điều kiện (a) được
thỏa mãn.

x→∞

x→∞

12


Nếu cả hai giới hạn trên đều hữu hạn, ta chỉ cần tìm một hằng số quy tâm thích hợp
để đưa vế trái của biểu thức về 0, do đó lim v (x) = 0.
x→∞

Nếu cả hai giới hạn trên đều khơng tồn tại, thì điều kiện 1 được đảm bảo nếu
u (x) tiến ra vô cùng nhanh hơn v2 (x). Theo bất đẳng thức Schwarz ta có:
[v (x) − v (a)]2 ≤ u (x) [1 − F (a) + F (−a)]
với x > a. Do đó điều kiện là được thỏa mãn với
lim u (x) = ∞.

x→∞

Điều kiện c là dễ dàng suy ra từ (1.4). Như vậy chỉ cịn kiểm tra điều kiện b, theo
giả thiết 1 có thể chọn Cn sao cho
n

2 u (Cn )
C
n→∞ n

lim

= 1,

lim n2 u (Cn x)
n→∞ Cn

= x2−α .

Nếu α = 2, điều kiện b được thỏa mãn nếu lấy độ đo Ω tập trung tại gốc tọa độ.
Nếu α < 2, điều kiện b và c tương đương với
lim n2 u+ (Cn x)
n→∞ Cn
lim Cn2 u− (Cn x)
n→∞ n

= px2−α
= qx2−α

ký hiệu
+x

u+ (x) =

0


t 2 dF (t); u− (x) =

t 2 dF (t).
−x

0

Và lập luận tương tự như phần trên, ta có kết quả riêng cho u+ (x) và u− (x).
Như vậy chúng đã chứng minh tổng chuẩn hóa hội tụ tới một giới hạn. Theo định
lý (1.2), phân phối giới hạn phải là ổn định. Chứng minh đã được hoàn thành.
Ghi chú 1.1. Khi giới hạn (1.4) bằng 0, ta có α = 2, tương ứng với phân phối
Gauss, và điều kiện
x2 [1 − F (x) + F (−x)]
= 0.
x→∞
u (x)
lim

13


Có thể được dùng như một sự nới lỏng giả định phương sai hữu hạn trong định lý
giới hạn trung tâm cổ điển.
Ví dụ 1.1. Ta đưa ra ví dụ minh họa, về một phân phối không thỏa mãn các định
lý giới hạn trung tâm cổ điển nhưng thỏa mãn các điều kiện miền hút của luật ổn
định. Đó là phân phối Cauchy được định nghĩa là
f (x) =

1
π (1 + x2 )


F (x) =

1 1
− arctan (x) ,
2 π

với x ∈ R. Phân phối này khơng có kỳ vọng (và do đó nó khơng có mơmen cấp cao

hơn). Lưu ý rằng phân phối này là đối xứng, do đó F (−x) = 1 − F (x) và áp dụng
(1.4) ta thu được

lim

2x2 [1−F(x)]

x→∞ 1 +x t 2 dt
π
2

= lim

x→∞

−x 1+t
2 2 π
π x 2 −arctan(x)
2
x→∞ π [x−arctan(x)]


= lim
= lim

x→∞

[

2x2 [ 12 − π1 arctan(x)]
+x
1
π [t−arctan(t)]−x

]

x[ π2 −arctan(x)]
1−

arctan(x)
x

=1
bởi vì cả tử số và mẫu số đều tiến tới 1. Do đó tổng của các biến ngẫu nhiên
Cauchy được thu hút bởi một phân phối ổn định với đặc số mũ là 1 (là một phân
phối Cauchy).
Hệ quả sau của đinh lý (1.3), Gnedenko và Kolmogorov (1954) đã đưa ra kết
quả sau, mơ tả các đăc tính cần thiết của các hằng số chuẩn hóa Cn và Dn trong
(1.3).
Hệ quả 1.1. Các đại lượng vô hướng Cn và Dn của (1.3) phải có dạng:

Cn = α n


+∞

n


xdF (x) nếu 1 < α ≤ 2

α

 n −∞
− α1
Dn =
φ

ln
n
nếu α = 1





0 nếu α < 1
14

(1.5)


1.2


Phân phối ổn định

Kết quả phần trước chỉ ra tầm quan trọng của phối ổn định: Mặc dù miền hút
của của luật chuẩn là khá rộng và bao gồm tất cả các phân phối với phương sai hữu
hạn, khi xử lý các hiện tượng với phương sai vô hạn cũng có thể tồn tại một phân
phối giới hạn, miễn là các giả thiết của Định lý (1.3) được thỏa mãn, và giới hạn
này thuộc loại phân phối ổn định. Phần tiếp theo tiến hành mơ tả các thuộc tính
chính và đặc điểm chính của phân phối ổn định.

1.2.1

Định nghĩa

Mặc dù những tính ổn định đã được xác định trong (1.3), ta sẽ cung cấp thêm
một vài định nghĩa tương đương có tính minh họa nhiều hơn, theo phương pháp
tiếp cận của Samorodnitsky và Taqqu (1994).
Định nghĩa 1.4 (Tính chia được vô hạn). Một biến ngẫu nhiên X được gọi là chia
được vô hạn nếu và chỉ nếu mọi n ∈ N, nó có thể được biểu diễn dưới dạng tổng
của n biến ngẫu nhiên độc lập có cùng phân phối, nghĩa là

(1.6)

X = Xn,1 + Xn,2 + ... + Xn,n .

Từ định nghĩa trên, điều kiện đủ của chia được vô hạn là hàm đặc trưng của X
được viết bằng lũy thừa bậc n của một số hàm đặc trưng khác phụ thuộc vào n. Ví
dụ: phân phối chuẩn, Poisson, Cauchy tất cả đều có tính chia được vơ hạn.
Ví dụ 1.2. Tất cả các phân phối chuẩn là chia được vô hạn.
Nếu xét một biến ngẫu nhiên X ∼ N µ , σ 2 , có thể viết dưới dạng tổng của hai


biến ngẫu nhiên X1 và X2 với phân phối N

µ/2, σ 2/2

. Tổng quát cho bất kỳ n, X có

thể được viết dưới dạng tổng của n biến ngẫu nhiên Xi với phân phối N

µ/n, σ 2/n

.

Có thể chứng minh được rằng (xem Gnedenko, B. & Kolmogorov, A. (1954), Limit
Distributions for Sums of Independent Random Variables, Addison-Wesley, Read15


ing.) hàm đặc trưng của luật chia được vô hạn phải có dạng


+∞


1 + u2
itu
itu
dG (u) ,
e −1−
φ (t) = exp iδ t +



1 + u2
u2

(1.7)

−∞

với δ là một hằng số thực và G (u) là một hàm không giảm có biến phân bị chặn.
Khi u = 0, hàm dưới dấu tích phân được định nghĩa là

−t 2/2.

Sau đây là một định

nghĩa tương đương với tính chia được vơ hạn, đôi khi được gọi là công thức Lévy.
Đặt
u

M (u) =
−∞
+∞

N (u) =
u

1 + v2
dG (v)
v2


∀u < 0;

1 + v2
dG (v)
v2

∀u > 0;

δ 2 = G 0+ − G 0− .
Khi đó (1.7) được viết lại thành

δ2 2
t +
φ (t) = exp iδ t −
2

0

−∞

+∞

+
0

iut
dM (u) +
1 + u2



iut
iut
e −1−
dN (u)

1 + u2

eiut − 1 −

(1.8)

Tiếp đây là định nghĩa trực quan hơn của phân phối ổn định.

Định nghĩa 1.5 (Tính ổn định, Samorodnitsky và Taqqu 1994). Một biến ngẫu
nhiên X được gọi là có phân phối ổn định nếu và chỉ nếu cho các số dương bất kỳ
c1 , c2 , tồn tại một số dương c và một số thực d sao cho
cX + d = c1 X1 + c2 X2 ,

(1.9)

với X1 và X2 độc lập và có cùng phân phối với X. Nếu d = 0, X được gọi là ổn định
chặt.
16


Chú ý định nghĩa trên là tương đương với (1.3) đã sử dụng trong phần trước.
Một định nghĩa khác tương đương và trực quan hơn, được bắt nguồn từ (1.9).
Định nghĩa 1.6 (Ổn định). Một biến ngầu nhiên X được gọi là có phân phối ổn
định nếu và chỉ nếu cho một số tự nhiên bất kỳ n ≥ 2, tồn tại nột số dương Cn và


Dn sao cho

X=

X1 + X2 + ... + Xn
− Dn
Cn

(1.10)

Xi là bản sao độc lập của X. Nếu Dn = 0, X được gọi là ổn định chặt.
Như vậy, một biến ngẫu nhiên là ổn định nếu nó có thể được chia nhỏ ra thành
một loạt các biến ngầu nhiên giống hệt nhau thông qua các hằng số chuẩn hóa.
Từ định nghĩa (1.10), phân phối ổn định đại diện cho trường hợp đặc biệt chia
được vô hạn. Trái với (1.6), những số hạng Xi trong (1.10) có phân phối giống X
sau khi điều chỉnh tỉ lệ theo hằng số Cn .
Ví dụ 1.3. Phân phối chuẩn là ổn định. Thật vậy xét biến ngẫu nhiên X ∼ N µ , σ 2 .

Tổng của n bản sao độc lập của X có phân phối N nµ , nσ 2 . Vì vậy thiết lập

n
− Dn .
Cn = n và Dn = (n − 1) µ , khi đó X = X1 +X2C+...+X
n
Định nghĩa 1.7 (Ổn định, miền hút). Một biến ngẫu nhiên X được gọi là ổn định
nếu nó có một miền hút khác rỗng, tức là nếu có một dãy các biến ngẫu nhiên Yi
độc lập, cùng phân phối sao cho
∑ni=1 Yi
d
− Dn −

→X
Cn
chọn Cn > 0 và Dn .

1.2.2

Hàm đặc trưng của phân phối ổn định

Cách đơn giản nhất để mô tả phân phối ổn định là đưa ra dạng hàm đặc trưng
của nó.

17


Định lý 1.4. Hàm đặc trưng của biến ngẫu nhiên ổn định S1 (α , β , γ , δ1 ) có dạng

φ1 (t) =

với 0 < α


πα
α α

i
exp
t

1


i
δ
γ
|t|
β
sgn
(t)
tan
1

2

 exp iδ1t − γ |t| 1 + iβ 2 sgn (t) ln |t|
π

β

2, −1

nếu α = 1
nếu α = 1

(1.11)

1, γ > 0 và δ ∈ R. Ngược lại nếu một biến ngẫu nhiên có

hàm đặc trưng dạng (1.11) thì biến ngẫu nhiên đó có phân phối ổn định.

Chứng minh. Chú ý định nghĩa ổn định (1.2) có thể hiểu dưới dạng hàm đặc trưng
ln φ


t
= ln φ
c

t
c1

t
c2

+ ln φ

+ iβ t,

với β = (d − d1 − d2 ). Vì phân phối ổn định là chia được vô hạn, nên ta sử dụng

biều thức (1.8) để viết lại biểu thức trên như sau

σ2 2
t
ln φ
= idct − 2 t +
c
2c

−∞

+∞


eiut − 1 −

+
0

t
σ2
ln φ
= idc1 t − 2 t 2 +
c
2c1
+

e
0

iut

−∞
+∞

+
0

iut
dM (cu) +
1 + u2

iut
dN (cu) ,

1 + u2

eiut − 1 −

iut
dM (c1 u) +
1 + u2

σ2 2
iut
dN (c1 u) + idc2 t − 2 t +
−1−
1 + u2
2c2

0

+

eiut − 1 −

0

−∞

+∞

0

eiut − 1 −


iut
dM (c2 u) +
1 + u2

eiut − 1 −

iut
dN (c2 u) .
1 + u2

18

(1.12)


Vì biểu diễn trên có tính duy nhất, nên

σ2

1
1
1
+ 2 + 2 = 0,
2
c
c1 c2

(1.13)


M (cu) =M (c1 u) + M (c2 u)

∀u < 0

(1.14)

N (cu) =N (c1 u) + N (c2 u)

∀u > 0

(1.15)

Từ (1.14) và sử dụng tính chất ổn định, ta có
N (cu) = N (c1 u) + N (c2 u) + ... + N (cn u) ,
với số tự nhiên n bất kỳ. Đặc biệt, nếu c1 = c2 = ... = cn = 1, thì
N (cu) = nN (u) ,
c phụ thuộc vào n, và c = c(n). Theo lập luân (trang 166, Gnedenko, B. & Kolmogorov, A. (1954), Limit Distributions for Sums of Independent Random Variables, Addison-Wesley, Reading.) N thỏa mãn

λ N (u) = N [γ (λ )u]

∀λ > 0,

(1.16)

γ (λ ) là hàm giảm và liên tục. Trừ trường hợp N(u) là hàm đồng nhất bằng 0, còn
lại N(u) khác 0 ở khắp mọi nơi. Vì vậy từ (1.15) suy ra N(u) có đạo hàm liên tục
với mọi u, ký hiệu N ′ (u) là đạo hàm cấp một của N(u),

λ N ′ (u) = cN ′ (cu) ,
N ′ (cu)

N ′ (u)
=c
N(u)
N(cu)

(1.17)



(1)
Trong (1.16), nếu u = 1 và xác định α = − NN(1)
thì ta nhận được

N ′ (c)
−α = c
N(c)
Do đó,
N(c) = −k2 cα ,
19

(1.18)


với k2 là số dương. Từ các kết quả liên quan tới phân phối chia được vô hạn, N(u)
phải thỏa mãn hai yêu cầu:
lim N (u) = 0;

1.

u→∞


2

u dN (u) < +∞

2.

0

Vì γ (λ ) giảm nên theo (1.17) điều kiện đầu tiên được thỏa mãn, khi α > 0. Áp
dụng (1.17) điều kiện thứ hai được viết


u1−α du;

k2 d
0

tích phân đó hội tụ khi α < 2. Vì thế ta kết luận 0 < α < 2. Tương tự như vậy, từ
(1.13) thu được
M (c) = −
Lấy logarithm của hàm đặc trưng (1.8) ta có

σ2
ln φ (t) = iδ t − t 2 + k1
2

k1
|c|α


0

eiut − 1 −

−∞
+∞

+k2
0

(1.19)

iut
1
du
2
1 + u |u|1+α

eiut − 1 −

iut
1
du
1 + u2 u1+α

(1.20)

Từ các đẳng thức (1.16), (1.18) và (1.13) cùng với (1.14) ta có c−α = 2.
Mặt khác, nếu c1 = c2 = 1 thì


σ2

1
− 2 = 0.
c2

Trên đây đã chỉ ra α < 2, vì vậy phương trình trên được thỏa mãn khi σ = 0. Khi

20


đó, phương trình (1.19) trở thành
0

ln φ (t) = iδ t + k1
−∞
+∞

eiut − 1 −

+k2
0

1
iut
du
1 + u2 |u|1+α

eiut − 1 −


(1.21)

1
iut
du.
2
1+
1+u u α

Điều kiện (1.13) và (1.14) được thỏa mãn bởi vì N(u) = 0 và M(u) = 0, kéo theo
k1 = k2 = 0, và bởi vì σ > 0, c−2 = 2, nên α = 2. Trong trường hợp này phương
trình (1.19) trở thành

σ2 2
ln φ (t) = iδ t − t .
2

(1.22)

Đây là hàm đặc trưng của phân phối chuẩn.
Đặt

β=

k1 − k2
,
k1 + k2

sao cho −1 < β < 1 và


 ∞

πα
1

−u

nếu 0 < α < 1
du
(k
+
k
)
cos

e

1

1
2
1+α

u
2



0


 ∞
πα
1
γ=

nếu 1 < α < 2
− e−u − 1 + u 1+α du (k1 + k2 ) cos


u
2


0




 (k + k ) π nếu α = 1
1
2
2

(1.23)

Đến đây, thực hiện một vài phép biến đổi đại số đơn giản ta thu được (1.11).
Ghi chú 1.2. Chú ý khi α = 1, hàm đặc trưng (1.11) chứa số hạng ln |t|. Đây là

nguyên nhân cần xử lý riêng cho trường hợp α = 1.


21


1.3

Các cách tham số hóa khác đối với phân phối ổn
định

Hàm đặc trưng (1.11) có biểu thức khá dễ sử dụng và có thể đưa ra thêm một
số kết quả phân tích trực tiếp thú vị. Nhưng tiếc rằng nó không thuận tiện cho việc
ước lượng và rút ra các suy luận thống kê, vì nó khơng liên tục đối với các tham số,
có một điểm kỳ dị tại α = 1.
Một cách viết khác của hàm đặc trưng do Zolotarev (1986) đưa ra là
φ0 (t) =


1−α

 exp{ iδ0t − γ α |t|α 1 + iβ tan πα
−1
2 sgn (t) |γ t|



exp{ iδ0t − γ |t| 1 + iβ π2 sgn (t) ln (γ |t|)

nếu α = 1

(1.24)


nếu α = 1

Trong trương hợp này, hàm phân phối được ký hiệu là S0 (α , β , γ , δ0 ). Dạng công
thức của hàm đặc trưng tương ứng là khá cồng kềnh, và các tính chất giải tích có ít
ý nghĩa trực quan hơn. Tuy nhiên công thức này hữu ích hơn cho mục đích thống
kê.
Sự tương ứng giữa δ1 trong S1 với δ0 trong S0 là


δ1 + β γ tan πα nếu α = 1
2
δ0 =

δ1 + β 2 γ ln γ
nếu α = 1
π

(1.25)

Dựa vào mối quan hệ trên, một phân phối S1 (α , β , 1, 0) tương ứng với một phân
phối S0 α , β , 1, −β γ tan πα
2 , với điều kiện là α = 1.

Một cách tham số hóa khác (do Zolotarev 1986 đưa ra), đôi khi được sử dụng,

được ký hiệu là S2 (α , β2 , γ2 , δ1 )
φ2 (t) =




exp {iδ1t − γ α |t|α exp −i πβ2 sgn(t) min(α , 2 − α )
2
2

exp {iδ1t − γ2 |t| 1 + iβ2 2 sgn(t) ln (γ2 |t|)
π

nếu α = 1
nếu α = 1

(1.26)

Tuy nhiên trong trường hợp này, hàm mật độ không liên tục với α và có điểm kỳ
dị tại α = 1. Một đặc tính không hay của cách biểu diễn hàm đặc trưng này là tham
số đối xứng β thay đổi theo giá trị của α ; Khi α ∈ (0, 1), β đối xứng lệch trái. Với
22


α ∈ (1, 2), β là đối xứng lệch phải.
Với α = 1, ta có thể chuyển đổi các tham số như sau:

πα
πβ2
tan
min(α , 2 − α )
2
2
1/α
πβ2
min (α , 2 − α )

γ = γ2 cos
,
2
β = cot

(1.27)

trong đó δ và α không thay đổi.

1.4

Ý nghĩa các tham số của phân phối ổn định

Theo kết quả đã trình bày ở phần trước, định nghĩa họ phân phối ổn định được
thể hiện với ba biểu diễn giải tích khác nhau phụ thuộc vào bốn tham số: α ∈

]0, 2] , β [−1, 1] , γ ∈ R+ , δ ∈ R, sử dụng ký hiệu viết tắt là Sk (α , β , γ , δ ), k biểu

thị lựa chọn tham số (0, 1, hoặc 2). Phần tiếp theo là mơ tả các tính chất của phân
phối ổn định bằng cách phân tích chính xác ý nghĩa của mỗi tham số. Xin nhắc lại
sự khác biệt của mỗi tham số 0 và 1 nằm trong tham số δ , do đó những tính chất
đối với các tham số khác được giữ nguyên trong cả hai trường hợp.
Ta bắt đầu bằng cách đánh giá tham số β để làm việc với tính chất đối xứng của
phân phối.
Tính chất 1.1 (Tính phản chiếu). cho X1 ∼ Sk (α , β , 1, 0), X2 ∼ Sk (α , −β , 1, 0);

X2 = −X1 . Ký hiệu f1 , f2 là hàm mật độ và F1 , F2 là hàm phân phối tích lũy của

X1 , X2 . Khi đó f2 (x) = − f1 (x) và F2 (x) = 1 − F1 (x).


Khi β = 0 phân phối là đối xứng. Ngược lại, β > 0 phân phối là lệch về phía
phải, β < 0 phân phối đối xứng lệch về phía trái. Đặc biệt, nếu β = 1 thì phân phối
lệch hồn tồn về phía phải, hàm mật độ nhận giá trị 0 trên nửa trục bên trái. Tương
tự, khi β = −1 phân phối lệch hoàn toàn về phía trái, hàm mật độ nhận giá trị 0
trên nửa trục bên phải.

Kết quả sau đây cho thấy α là tham số thể hiện độ "nặng đuôi":
23


Tính chất 1.2 (Dáng điệu đi). Cho X ∼ S0 (α , β , γ , δ ) và α < 2. Khi đó
Γ (α )
πα
sin
(1 + β ) x−α ,
x→∞
π
2
Γ (α )
πα
lim f (x; α , β ) = −αγ α
sin
(1 + β ) x−(α +1) .
x→∞
π
2
lim P (X > x) = γ α

(1.28)
(1.29)


Kết quả tương tự cho dáng điệu đi trái được suy từ tính chất phản chiếu.
Từ kết quả trên có thể thấy rằng
1) Theo (1.28), khi α tăng đuôi trở nên nhẹ hơn;
2) Đối với phân phối ổn định, dáng điệu tiệm cận của phần đuôi có dạng hàm mũ;
3) Khi β > 0, mật độ đuôi phải lớn hơn mật độ đuôi trái. Ngược lại, khi β > 0, mật
độ đuôi trái lớn hơn mật độ đuôi phải.
Tiếp theo ta chuyển sang γ và δ , chúng đại diện tương ứng cho tham số tỷ lệ và
tham số định vị của phân phối.
Tính chất 1.3 (Chuẩn hóa biến ngẫu nhiên). Cho Z ∼ S1 (α , β , 1, 0). Khi đó


γ Z + δ
nếu α = 1
X=
(1.30)

γ Z + (δ + β 2 γ ln γ ) + δ nếu α = 1
π
Có phân phối S1 (α , β , γ , δ ).

Nếu Z ∼ S0 (α , β , 1, 0) thì
X=



γ (Z − β πα ) + δ
2

γ Z + δ


nếu α = 1
nếu α = 1

(1.31)

có phân phối S0 (α , β , γ , δ ).

Trong phần tiếp theo, ta ký hiệu một phân phối ổn định chuân hóa là Sk (α , β ) thay
cho Sk (α , β , 1, 0).

24


×