Tải bản đầy đủ (.pdf) (77 trang)

Đặc trưng họ phân phối Gamma Luận văn ThS. Toán học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (547.63 KB, 77 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

Phạm Quốc Toàn

ĐẶC TRƯNG HỌ PHÂN PHỐI GAMMA

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội - 2012


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

Phạm Quốc Toàn

ĐẶC TRƯNG HỌ PHÂN PHỐI GAMMA

Chuyên ngành: Lý thuyết xác suất và thống kê toán học
Mã số: 60 46 15

LUẬN VĂN THẠC SĨ KHOA HỌC

Người hướng dẫn khoa học:
PGS. TS Đào Hữu Hồ

Hà Nội - 2012


Mục lục


Lời nói đầu

3

1 Một số kết quả cần dùng

5

1.1

Phân phối gamma . . . . . . . . . . . . . . . . . . . . . . . . . .

5

1.2

Hàm giải tích . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6

1.2.1

Định nghĩa hàm giải tích phức . . . . . . . . . . . . . . .

6

1.2.2

Tính giải tích của hàm đặc trưng . . . . . . . . . . . . . .


6

1.3

Một số bổ đề cần sử dụng . . . . . . . . . . . . . . . . . . . . . .

7

1.4

Một số kết quả liên quan đến lý thuyết ước lượng . . . . . . . . .

11

1.4.1

Một số khái niệm cơ bản của lý thuyết ước lượng . . . . .

11

1.4.2

Tham số tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . .

13

2 Đặc trưng họ phân phối Gamma thơng qua tính hồi quy hằng
số

16


2.1

Các bổ đề cơ sở . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

2.2

Đặc trưng của phân phối Gamma . . . . . . . . . . . . . . . . . .

21

2.3

Đặc trưng phân phối gamma thơng qua tính hồi quy hằng số liên
quan đến phân phối Gauss ngược suy rộng . . . . . . . . . . . . .

48

3 Đặc trưng họ phân phối Gamma bởi tính tối ưu của ước lượng 52
3.1

Đặc trưng họ phân phối Gamma thơng qua tính chấp nhận được
của các ước lượng tuyến tính tối ưu của tham số tỷ lệ . . . . . .

3.2

52


Đặc trưng của phân phối gamma thơng qua tính tối ưu của các
hàm của trung bình mẫu . . . . . . . . . . . . . . . . . . . . . . .
1

61


3.3

Sự độc lập của trung bình mẫu và hệ số biến thiên mẫu . . . . .

67

Kết luận

72

Tài liệu tham khảo

73

2


LỜI NÓI ĐẦU
Đặc trưng của các phân phối xác suất là một hướng nghiên cứu mạnh trong
lý thuyết thống kê trong nhiều thập kỷ. Mặc dù đã có rất nhiều kết quả nổi tiếng
đã được biết đến, nhưng một vài kết quả mới về đặc trưng của các phân phối
hay sử dụng cũng có ích trong nhiều ứng dụng. Trong luận văn: “Đặc trưng họ
phân phối Gamma”, chúng tôi chỉ trình bày về đặc trưng của phân phối gamma.

Những kết quả cơ bản của đặc trưng phân phối gamma được trình bày trong
cuốn Characterization Problems in Mathemmatical Statistics của Kagan A. M.,
Linnik YU. V. và Rao C. R. Ngoài ra, chúng tơi cũng trình bày thêm một vài
kết quả gần đây về đặc trưng họ phân phối gamma. Đó là hai bài báo:
• Mutual characterizations of the gamma and the generalized inverse Gaussian laws by constancy of regression của Vanamamalai Seshadri và Jacek
Wesolowski, năm 2001.
• On a characterization of the gamma distribution: The independence of
the sample mean and the sample coefficient of variation của Tea - Yuan
Hwang và Chin - Yuan Hu, năm 1999.
Luận văn của chúng tôi được chia ra làm ba chương.
Chương 1. Kiến thức chuẩn bị
Trong chương này, chúng tôi giới thiệu các kết quả cơ bản nhất của phân
phối gamma, một số kiến thức về hàm giải tích, tính giải tích của các hàm đặc
trưng, một số định lý và bổ đề quan trọng được dùng để chứng minh các định
lý ở các chương sau.
Chương 2. Đặc trưng họ phân phối Gamma thơng qua tính hồi
quy hằng số
Trong chương này, chúng tơi trình bày các nội dung sau đây:
• Đặc trưng của phân phối gamma thơng qua tính hồi quy hằng số.
• Đặc trưng giữa phân phối Gauss ngược tổng quát (GIG) và phân phối
gamma thông qua tính hồi quy hằng số.

3


Chương 3. Đặc trưng họ phân phối Gamma bởi tính tối ưu của
ước lượng
Trong chương này, chúng tơi trình bày các nội dung sau đây:
• Đặc trưng họ phân phối Gamma thơng qua tính chấp nhận được của các
ước lượng tuyến tính tối ưu của tham số tỷ lệ.

• Đặc trưng của phân phối gamma thơng qua tính tối ưu của các hàm
trung bình mẫu.
• Đặc trung của phân phối gamma thơng qua tính độc lập của trung bình
mẫu và hệ số biến thiên mẫu.
Qua đây, tôi xin được gửi lời cảm ơn sâu sắc đến người thầy, người hướng
dẫn luận văn của mình, PGS.TS Đào Hữu Hồ, người đã đưa ra đề tài và tận
tình hướng dẫn trong suốt q trình làm luận văn của tác giả. Tơi cũng xin cảm
ơn các thầy cơ trong khoa Tốn - Cơ - Tin học, đặc biệt là các thầy cô trong bộ
môn Xác suất - Thống kê đã truyền đạt cho tôi nhiều kiến thức quý báu. Cuối
cùng tôi xin cảm ơn các thành viên trong lớp cao học chuyên ngành Lý thuyết
Xác suất và Thống kê tốn học khóa 2009-2011 đã ln động viên, giúp đỡ tơi
trong q trình hồn thành luận văn.
Do thời gian và trình độ cịn hạn chế, chắc chắn bản luận văn không thể
tránh khỏi những thiếu sót, tác giả rất mong nhận được sự chỉ bảo tận tình của
các thầy cơ và các bạn, tác giả xin chân thành cảm ơn!
Hà Nội, tháng... năm 2012
Học viên
Phạm Quốc Toàn

4


Chương 1

Một số kết quả cần dùng
1.1

Phân phối gamma

Phân phối gamma là một họ phân phối xác suất liên tục hai tham số, trong

đó một tham số tỉ lệ θ và một tham số hình thức k. Một biến ngẫu nhiên X
có phân phối gamma với tham số tỷ lệ θ và tham số hình thức k được ký hiệu
là X ∼ Γ(k, θ) hoặc X ∼ Gamma(k, θ). Sau đây là một số tính chất của phân
phối gamma:
1. Các tham số: tỷ lệ θ > 0, hình thức k > 0.
2. Giá: x ∈ [0; +∞).
3. Hàm mật độ xác suất:
+∞

exp(−x/θ)
, ở đây Γ(k) =
f (x, k, θ) = xk−1 ·
Γ(k)θk

xk−1 e−x dx.
0

4. Giá trị trung bình: kθ.
5. Phương sai: kθ2 .
6. Hàm đặc trưng: (1 − θit)−k .

5


7. Rõ ràng f (x, 1, θ) là mật độ mũ. Thật vậy do Γ(1) = 1 nên ta có
f (x, 1, θ) =

1
· exp(−x/θ).
θ


Đây là hàm mật độ của phân phối mũ.
8. Giả sử X1 , ..., Xn độc lập, cùng phân phối mũ với mật độ f (x, 1, θ) thì
n

Xi sẽ có mật độ f (x, n, θ).
i=1

1.2
1.2.1

Hàm giải tích
Định nghĩa hàm giải tích phức

Cho f (z) là một hàm nhận giá trị phức của biến phức z. Hàm f được gọi là

f (n) (z0 )
(z − z0 )n
giải tích tại z0 nếu f khả vi vơ hạn sao cho chuỗi Taylor tại z0 :
n!
n=0
hội tụ tới f (z) với mọi z trong lân cận của z0 .
Hàm f (z) được gọi là giải tích trong tập mở D của mặt phẳng phức nếu f
giải tích tại mọi điểm z của tập D.

1.2.2

Tính giải tích của hàm đặc trưng

Trong mục này, ta ký hiệu t và y là các biến số thực và z = t + iy là biến số

phức. Ta có định nghĩa sau:
Định nghĩa 1.2.1. Một hàm đặc trưng f (t) được gọi là một hàm đặc trưng
giải tích nếu với δ > 0 tồn tại một hàm A(z) của biến phức z, giải tích trong
đường trịn |z| < δ (ở đây |z| là modun của số phức z) sao cho
A(t) = f (t),
với |t| < δ.
Nói một cách khác, một hàm đặc trưng là giải tích nếu nó đồng nhất với
một hàm biến phức giải tích trong một lân cận nào đó của gốc tọa độ trong
mặt phẳng phức.
Một số tính chất đặc biệt của hàm giải tích (xem [19]):
6


10 . Hàm đặc trưng giải tích f thì f (z) sẽ là hàm giải tích trong dải:
−α < Im z < β, trong đó
α = sup r :

erx dF (x) < ∞ ,

β = sup r :

e−rx dF (x) < ∞ ,

và F (x) là hàm phân phối tương ứng với hàm đặc trưng f (t).
20 . Tính giải tích của hàm đặc trưng f tương đương với tính dương của các
số α, β.
30 . Tính giải tích của hàm đặc trưng f tương đương với tồn tại R > 0 sao
cho: 1 − F (x) + F (−x) = O(e−rx ) khi x → ∞, với mọi r: 0 < r < R.
40 . Hai hàm đặc trưng giải tích trùng nhau trong lân cận của gốc tọa độ thì
trùng nhau trong tồn miền xác định.

50 . Giả sử f là hàm đặc trưng giải tích trong dải nào đó. Khi đó nếu một
thành phần của nó cũng giải tích trong dải này và mọi biểu diễn f = f1 + f2
đều đúng trong toàn bộ dải.

1.3

Một số bổ đề cần sử dụng

Bổ đề 1.3.1. [ Xem [6], Chương 1, Bổ đề 1.1.1] Giả sử X và Y là hai biến
ngẫu nhiên và EY tồn tại, Y có hồi quy hằng số đối với X nếu và chỉ nếu hệ
thức
E(Y eitX ) = EY · EeitX

(1.1)

nghiệm đúng với mọi t ∈ R.
Chứng minh. Điều kiện cần: Giả sử Y có hồi quy hằng số đối với X, nghĩa là
E(Y |X) = EY.

(1.2)

Nhân hai vế của biểu thức trên với eitX , ta có E(Y |X) · eitX = EY · eitX .
Lấy kỳ vọng hai vế biểu thức này ta được
E E(Y |X) · eitX = E EY · eitX


7

E(Y · eitX |X) = EY · EeitX . (1.3)



Điều kiện đủ: Giả sử ta có (1.1), ta chứng minh Y có hồi quy hằng số đối
với X. Gọi P là hàm phân phối biên duyên của X.
Giả sử EY khác 0, khi đó điều kiện (1.1) được viết lại như sau
+∞

+∞

E(Y |x)
dP =
eitx ·
EY

eitx dP.

(1.4)

−∞

−∞

E(Y |x)
dP . Q(A) là hàm có biến phân bị chặn. Theo cách
EY

Đặt Q(A) =
A

đặt này thì điều kiện (1.4) được viết lại như sau
eitx dQ =


eitx dP.

(1.5)

Do định lý duy nhất của phép biến đổi Fourier-Stieltjes đối với các hàm có
biến phân bị chặn nên từ điều kiện (1.5) ta có
E(Y |x)
dP =
EY
A

Từ (1.6) suy ra

dP.

(1.6)

A

E(Y |x)
= 1 (hầu khắp nơi). Hay là Y có hồi quy hằng số
EY

đối với X.
Cịn nếu EY = 0 thì điều kiện (1.1) được viết lại như sau
+∞

eitx E(Y |x)dP = 0.


(1.7)

−∞
+∞

eitx dQ = 0. Suy ra Q(A)

E(Y |x)dP . Khi đó từ (1.7) ta có

Đặt Q(A) =

−∞

A
1

là hàm hằng với mọi A. Lấy A = R , ta có
Q(A) = Q(R1 ) = EY = 0.
Hay là E(Y |X) = 0. Vậy ta có điều phải chứng minh.

8


Bổ đề 1.3.2. [ Xem [6], Chương 1, Bổ đề 1.4.3] Giả sử trong phương trình vi
phân
n
n (n)

L(y) ≡ z y


z n−j y (n−j) = f (z),

+

(1.8)

j=1

với aj là các hằng số và f là hàm giải tích trong góc
A = {Re z ≥ a > 0 : |arg z| ≤ π − δ0 , δ0 > 0},
và hơn nữa
|f (z)| ≤ A0 ·

[log |z|]q0
,
|z|β

(1.9)

ở đây q0 ≥ 0 và β > 0 là các hằng số. Khi đó tồn tại một nghiệm riêng của
(1.8) trong A, thỏa mãn các bất đẳng thức:
(j)

|y0 (z)| ≤ AA0

[log |z|]q0 +(j+1)s0
,
|z|β+j

j = 1, 2, ..., n,


(1.10)

ở đây s0 không phụ thuộc vào f . Nếu β ≥ β0 > 0, với β0 đủ lớn thì A cũng
khơng phụ thuộc f .
Bổ đề 1.3.3. [ Xem [6], Chương 1, Bổ đề 1.5.1] Xét phương trình
ψ1 (u + b1 v) + ψ2 (u + b2 v) + · · · + ψr (u + br v) = A(u) + B(v) + Pk (u, v)

(1.11)

với |u| < δ0 , |v| < δ0 , còn Pk là đa thức bậc k; ψi , A và B là các hàm nhận giá
trị phức của hai biến thực u và v. Giả sử rằng
i) các số bj là phân biệt (khơng mất tính tổng qt),
ii) các hàm A, B và ψi là liên tục.
Khi đó, trong một lân cận nào đó của gốc tọa độ, các hàm A, B và ψi là
các đa thức với bậc ≤ max(r, k).
Từ Bổ đề 1.3.3, ta có hệ quả sau đây:
Hệ quả 1.3.4. [ Xem [6], Chương 1, Hệ quả 1.5.2] Nếu phương trình (1.11)
của Bổ đề 1.3.3 có dạng
r

ψi (u + bi v) = au + cv + d,
i=1

9

(1.12)


với r ≤ 3, thì dưới các điều kiện của Bổ đề 1.3.3, tất cả các hàm ψi , i = 1, ..., r

đều là các hàm tuyến tính.
Bây giờ, chúng ta sẽ tổng quát hóa Bổ đề 1.3.3 cho trường hợp có nhiều hơn
hai đối số. Giả sử t, α1 , α2 , ..., αr là các vectơ cột p - chiều. Ký hiệu các thành
T
phần của t là t1 , ..., tp và tích vơ hướng của t với αi bởi αi t. Ta xét phương

trình
T
T
ψ1 (α1 t) + · · · + ψr (αr t) = ξ1 (t1 ) + · · · + ξp (tp )

(1.13)

nghiệm đúng với |ti | < δ, i = 1, p. Ký hiệu A là ma trận cỡ p × r với các cột là
α1 , ..., αr . Để phát biểu Bổ đề 1.3.5 dưới đây, chúng ta định nghĩa một tích ma
trận mới như sau: Cho C là ma trận cấp p × r và D là ma trận cấp q × r, khi
đó tích C

D là ma trận cấp pq × r với các cột là các tích Kronecker γi

δi ,

hay là
C

D = (γ1

δ1 |...|γr

δr ),


(1.14)

ở đây γ1 , ..., γr là các cột của ma trận C và δ1 , ..., δr là các cột của ma trận D.
Ký hiệu C # là ma trận cấp p(p − 1) × r, nhận được bằng cách bỏ đi p hàng
chứa các số hạng bình phương, đó là hàng đầu, hàng thứ p + 1, ... và hàng thứ
p(p − 1) + 1 của ma trận C

C.

Để minh họa cho tích ma trận mới này và ma trận C # , ta xét ví dụ sau:
Giả sử C là ma trận cấp 2 × 3 được cho bởi
C=
Khi đó, ma trận C

C

c11

c12

c13

c21

c22

c23

.


C được xác định như sau


c2
c2
c2
11
12
13


c11 c21 c12 c22 c13 c23 
.
C=
c c
c22 c12 c23 c13 
 21 11

2
2
2
c21
c22
c23

Sau khi bỏ đi hàng đầu và hàng thứ tư, ta nhận được ma trận C # có dạng
C# =

c11 c21


c12 c22

c13 c23

c21 c11

c22 c12

c23 c13

10

.


Bổ đề 1.3.5. [ Xem [6], Chương 1, Bổ đề 1.5.4] Giả sử (1.13) đúng với |ti | < δ,
i = 1, p, ở đây A là ma trận sao cho rank A# = r. Khi đó, các hàm ψi , i = 1, r
và ξ1 , ..., ξp là các hàm tuyến tính.
Bổ đề 1.3.6. [ Xem [6], Chương 1, Bổ đề 1.5.10] Giả sử rằng ψ(t) thỏa mãn
phương trình
a1 ψ(b1 t) + · · · + an ψ(bn t) = 0,
ở đây

(1.15)

ai bi = 0, |b1 | > max{|b2 |, ..., |bn |} và các ai bi với i = 2, ..., n là cùng

dấu, trong khi đó a1 b1 có dấu ngược lại. Thêm nữa ψ(t) = c + tφ(t), ở đây φ(t)
là hàm liên tục tại 0. Khi đó, ψ là hàm tuyến tính.


1.4

Một số kết quả liên quan đến lý thuyết ước
lượng

1.4.1

Một số khái niệm cơ bản của lý thuyết ước lượng

Chúng ta xét một mơ hình thống kê (X , A, Pθ ), ở đây X là không gian các
giá trị quan sát x, A là σ-đại số các biến cố, và {Pθ } là một họ các phân phối
xác suất, phụ thuộc θ ∈ Θ. Giả sử thống kê T (x) được dùng như một ước lượng
cho một hàm của tham số t(θ), và r(T, t) là một hàm tổn thất không âm. Kỳ
vọng toán học của hàm tổn thất được cho bởi
R(T, θ) = Eθ r(T, t)
được gọi là hiểm của ước lượng T khi mà giá trị chân thực của tham số là θ.
Sau đây là một số hàm tổn thất mà chúng ta sử dụng:
a) dạng toàn phương hay Gaussian: r(T, t) = (T − t)2 ,
b) dạng Laplace: r(T, t) = |T − t|,

0 nếu |T − t| ≤ b
c) dạng 0 − 1: r(T, t) =
với b > 0 nào đó.
1 nếu |T − t| > b

11


Định nghĩa 1.4.1. Một ước lượng T (x), thuộc lớp K các ước lượng của hàm

tham số t(θ), được gọi là chấp nhận được trong lớp này, dưới hàm tổn thất
r(T, t), nếu không tồn tại phần tử T thuộc K sao cho
R(T, θ) ≤ R(T , θ) với mọi θ,

(1.16)

và hơn nữa bất đẳng thức chặt đúng với ít nhất một θ.
Nếu một ước lượng T là chấp nhận được trong lớp tất cả các ước lượng, thì khi
đó chúng ta sẽ gọi nó là chấp nhận được tuyệt đối.
Định nghĩa 1.4.2. Một ước lượng T 0 ∈ K được gọi là tối ưu trong lớp K của
các ước lượng của hàm tham số t(θ), dưới hàm tổn thất r(T, t), nếu với mọi
T ∈ K,
R(T 0 , θ) ≤ R(T, θ),

θ ∈ Θ.

Định lý 1.4.3. Giả sử rằng T là một ước lượng cho t(θ) và hàm tổn thất r(T, t)
là lồi theo T . Nếu họ {Pθ } chứa một thống kê đủ S, thì tồn tại một ước lượng
T0 , chỉ phụ thuộc vào S, sao cho
Eθ r(T0 , t(θ)) ≤ Eθ r(T, t(θ)) với θ ∈ Θ.
Định nghĩa 1.4.4. Một ước lượng T0 ∈ K được gọi là tối ưu tại điểm θ0 (hay
tối ưu địa phương) trong lớp K dưới hàm tổn thất r(T, t), nếu với mọi T ∈ K,
R(T0 , θ0 ) ≤ R(T, θ0 ).
Định lý 1.4.5. [ Xem [6], Chương 7, Định lý 7.1.1] (Bất đẳng thức Cramer
- Rao)
Giả sử rằng khơng gian tham Θ là một khoảng nào đó của đường thẳng thực,
tất cả các phân phối Pθ là liên tục tuyệt đối đối với độ đo µ, với p(x, θ) = dPθ /dµ
là hàm mật độ. Nếu T là một thống kê thỏa mãn Eθ T = t(θ) + b(θ), thì khi đó,
dưới các điều kiện “chính quy”,
[t (θ) + b (θ)]2

,
Eθ [T − t(θ)] ≥ [b(θ)] +
I(θ)
2

2

ở đây I(θ) = Eθ (∂ log p/∂θ)2 là lượng thông tin Fisher.
12

(1.17)


Định lý 1.4.6. [ Xem [6], Chương 7, Định lý 7.1.3] Nếu phân phối của thống
kê vectơ đủ S = (S1 , ..., Sm ) được cho trong Rm bởi hàm mật độ (đối với độ đo
Lebesgue)
n

π(s, θ) = c(θ)q(s) exp

ci (θ)si

,

i=1

ở đây s = (s1 , ..., sm ) và vectơ (c1 (θ), ..., cm (θ)) căng trên miền nào đó trong
Rm cũng như θ căng trên Θ, thì họ phân phối {Pθ } là đầy đủ đối với thống kê
đủ S.
Trong mục này, khái niệm về tính tối ưu của ước lượng liên quan đến hàm

tổn thất dạng tồn phương.
Chúng ta ký hiệu L2 là khơng gian Hilbert của các hàm đo được trên (H, A),
θ
các hàm này bình phương khả tích đối với Pθ với tích vơ hướng thông thường.
Đặt L2 =
θ∈Θ

L2 .
θ

Định nghĩa 1.4.7. Một thống kê h = h(x) được gọi là ước lượng không chệch
của 0 (u.e.z) nếu Eθ h ≡ 0 với mọi θ ∈ Θ.
Chúng ta ký hiệu Hθ là tập tất cả các u.e.z trong L2 , và H =
θ

Hθ .
θ∈Θ

Bổ đề 1.4.8. [ Xem [6], Chương 7, Bổ đề 7.2.1] Một ước lượng T ∈ L2 (hoặc,
T ∈ L2 ) là tối ưu (hoặc, tối ưu địa phương tại θ) trong L2 cũng như là một ước
θ
lượng không chệch của t(θ) = Eθ T nếu và chỉ nếu
Eθ (T h) = 0 với tất cả h ∈ H,

θ∈Θ

(1.18)

(hoặc, nếu và chỉ nếu với θ cho trước, Eθ (T h) = 0 với tất cả h ∈ Hθ ).


1.4.2

Tham số tỷ lệ

Nếu hàm phân bố Pσ của vectơ các quan sát (X1 , ..., Xn ) ∈ Rn phụ thuộc
vào tham số σ ∈ R1 (tức là σ > 0) theo nghĩa sau đây:
+
Pσ (A) =

···

dF (x1 /σ, ..., xn /σ)

A

13

(1.19)


thì chúng ta nói rằng σ là một tham số tỷ lệ. Để ước lượng cho tham số tỷ lệ,
một cách tự nhiên là chọn một lớp các ước lượng σ = σ(X1 , ..., Xn ) thỏa mãn
điều kiện sau với mọi λ > 0:
σ(λX1 , ..., λXn ) = λσ(X1 , ..., Xn ).
Những điều này đã được đưa ra bởi Pitman [18]. Ta gọi các ước lượng thỏa
mãn điều kiện trên là chính quy, và ký hiệu lớp các ước lượng chính quy bởi F.
Chúng ta giả sử rằng hàm tổn thất thỏa mãn điều kiện
r(λu) = λm r(u),

r(σ, σ) = r(σ − σ),


(1.20)

với mọi λ > 0, với m nào đó. Khi đó, hiểm của ước lượng σ ∈ F cho tham số σ

R(σ, σ) = Eσ (σ − σ) = σ m E1 r(σ − 1) = σ m R(σ, 1).
Vì vậy, với hàm tổn thất (1.20), một phần tử của lớp F hoặc là tối ưu, hoặc
là không chấp nhận được trong lớp này.
Định nghĩa 1.4.9. Một ước lượng σ = σ(X1 , ..., Xn ) tối ưu trong lớp F, tức
là thỏa mãn
R(σ, σ) = min R(σ, σ)
σ∈F

sẽ được gọi là ước lượng Pitman cho tham số tỷ lệ σ tương ứng với hàm tổn
thất (1.20).
Từ nay trở về sau, chúng ta sẽ giả sử rằng không gian các quan sát X = Rn ,
+
n

tức là xj > 0 với mọi j = 1, n. Khi đó, nếu với mọi j, chúng ta đặt L =

cj Xj ,
1

cj > 0 với mọi j, thì mọi ước lượng σ ∈ F đều có thể được viết dưới dạng
σ =L·ψ

X2
Xn
, ...,

X1
X1

.

(1.21)

2
Bổ đề 1.4.10. [ Xem [6], Chương 7, Bổ đề 7.11.1] Nếu EXj < ∞, thì

(1) ước lượng
σ=L
ˆ

E1 (L|Y )
,
E1 (L2 |Y )

Y =
14

X2
Xn
, ...,
X1
X1

(1.22)



là ước lượng Pitman cho σ, tương ứng với hàm tổn thất dạng toàn phương;
hơn nữa, với σ ∈ F bất kỳ,
Eσ (σ − σ)2 > Eσ (ˆ − σ)2 ,
σ
ˆ
với σ ∈ R1 , trừ khi σ = σ với P1 - xác suất một (và vì vậy với Pσ - xác
+
suất một với mọi σ ∈ R1 );
+
(2) nếu F , hàm phân phối đồng thời của các Xj , là liên tục tuyệt đối, với hàm
mật độ là f thì



un f (ux1 , ..., uxn )du
σ=
ˆ

0


.

(1.23)

un+1 f (ux1 , ..., uxn )du
0

Chúng ta ký hiệu FU là lớp các ước lượng khơng chệch chính quy của σ.
Bổ đề 1.4.11. [ Xem [6], Chương 7, Bổ đề 7.11.2] Dưới các điều kiện của Bổ

đề 1.4.10, ước lượng tối ưu của σ trong FU là
σU = cU σ,

(1.24)

ở đây hằng số cU được xác định bởi điều kiện cU ·E1 σ = 1. Khi đó, với σU ∈ FU ,
Eσ (σU − σ)2 > Eσ (σU − σ)2 , σ ∈ R1 trừ khi σU = σU với P1 - xác suất một.
+

15


Chương 2

Đặc trưng họ phân phối
Gamma thơng qua tính hồi
quy hằng số
2.1

Các bổ đề cơ sở

Nếu X1 , ..., Xn là một mẫu ngẫu nhiên, khi đó sự độc lập của X và S 2 =

1
n

n

(Xi − X)2 (mà không cần thêm bất kỳ điều kiện phụ nào đối với các
i=1


moment của Xi ) dẫn tới tính chuẩn của Xi . Chúng ta có thể sử dụng tính hồi
quy hằng số của S 2 đối với X mà không cần sử dụng tính độc lập của S 2 và X
để phát biểu kết quả trên. Điều kiện này nhẹ hơn so với tính độc lập của S 2 và
X, nhưng lại cần thêm giả thiết về sự tồn tại phương sai của Xi . Tương tự, nếu
X và Y là các biến ngẫu nhiên khơng âm, độc lập thì sự độc lập của X + Y đối
X
với
chỉ ra đặc trưng phân phối gamma (hoặc phân phối thối hóa). Trong
Y
chương này, chúng ta sẽ chỉ ra rằng với các biến ngẫu nhiên độc lập, cùng phân
X
phối X và Y thì tính hồi quy hằng số của X + Y đối với
sẽ chỉ ra đặc trưng
Y
của phân phối gamma (hoặc phân phối thối hóa). Các kết quả này thuộc về
Khatri và Rao (xem [8], [9]).
16


Bổ đề 2.1.1. Cho F là hàm phân phối của biến ngẫu nhiên Y , và g là hàm
liên tục trên R1 , sao cho
gdF = µ

(hữu hạn).

(2.1)

Nếu với số thực ρ khác 0 nào đó, và với mọi t ∈ R,
eity g(y)dF (y) = (µ + iρt)


eity dF (y),

(2.2)

thì F liên tục tuyệt đối và có hàm mật độ là f liên tục thỏa mãn phương trình
vi phân sau đây
ρf (y) = [µ − g(y)]f (y).
Phương trình trên có nghiệm là

f (y) = exp −

y

1
ρ

(2.3)


(g(v) − µ)dv  .

(2.4)

a

Chứng minh. Đặt k(y) =

g(y) − µ
. Khi đó, phương trình (2.2) có dạng sau

ρ

eity k(y)dF (y) = it

eity dF (y).

(2.5)

1 1 − e−iht e−iαt − e−iβt
rồi lấy

it
it
tích phân trên (−T, T ) theo biến t, rồi sau đó cho T → +∞, ta thấy vế phải có
Nhân hai vế của phương trình (2.5) với

dạng
T

1
lim
T →+∞ 2π

1 − e−iht e−iαt − e−iβt
it ·
·
it
it

eity dF (y) dt


−T
T

1
= lim
T →+∞ 2π

1 − e−iht e−iαt − e−iβt
it ·
·
· f (t)dt
it
it

−T
T

1
= lim
T →+∞ 2π

[e−iαt − e−i(α+h)t ] − [e−iβt − e−i(β+h)t ]
f (t)dt
it

−T
T

1

= lim
T →+∞ 2π

e−iαt − e−i(α+h)t
1
f (t)dt − lim
T →+∞ 2π
it

−T

T

−T

17

e−iβt − e−i(β+h)t
f (t)dt.
it


Nếu α + h, α, β + h và β là các điểm liên tục của hàm F thì theo định lý
ngược, biểu thức bên trên bằng với:
[F (α + h) − F (α)] − [F (β + h) − F (β)].

(2.6)

Còn vế trái bằng với
T


1
lim
T →+∞ 2π

β

1 − e−iht
dt
it

e

β

1
T →+∞ 2π

= lim

Do



du
α

eity k(y)dF (y)

du

−∞

α

−T

T


−itu

T

k(y)dF (y)

−∞

(2.7)
−iht

1−e
it

· e−i(u−y)t dt.

−T

1 − e−iht −i(u−y)t
·e
dt bị chặn đều theo T nên qua giới hạn khi T tiến

it

−T

ra +∞ biểu thức trong (2.7), ta có vế trái bằng với
β

f (u, h)du,

(2.8)

α

trong đó
u+h−0

f (u, h) =

k(y)dF (y).
u−0

Từ (2.6) và (2.8), chúng ta có
β

f (u, h)du = [F (α + h) − F (α)] − [F (β + h) − F (β)].

(2.9)

α


Cho h → −∞, do F (−∞) = 0 nên từ (2.9) chúng ta có
β

β

f (u)du = F (β) − F (α) =
α

dF (y).

(2.10)

α

tại mọi điểm liên tục α và β của hàm F , ở đây
u−0

f (u) = −

k(y)dF (y).

−∞

18

(2.11)


Phương trình (2.10) chỉ ra rằng F liên tục tuyệt đối và có hàm mật độ là f .
Hơn nữa, ta có

u−0

f (u) = −

u−0

k(y)dF (y) = −

−∞

k(y)f (y)dy.

(2.12)

−∞

Do g liên tục nên k liên tục, và do vậy hàm f cũng liên tục và khả vi. Lấy
vi phân hai vế của (2.12), chúng ta thu được
f (u) = −k(u)f (u) = −

g(u) − µ
· f (u),
ρ

hay là




u


f (u) = exp −

k(v)dv  .

(2.13)

a

Vậy bổ đề được chứng minh.
Hệ quả 2.1.2. Nếu trong Bổ đề 2.1.1 g(y) = ey , khi đó ρ và µ phải dương, và
1
f (y) = exp − (ey − µy − c) ,
ρ

(2.14)

ở đây c là hằng số. Nếu Y là một biến ngẫu nhiên với hàm mật độ f thì hàm
mật độ của X = eY bằng với
αγ
· e−αx · xγ−1 ,
Γ(γ)

(2.15)

ở đây γ và α phụ thuộc vào ρ và µ, do vậy X có phân phối gamma G(α, γ).
Bổ đề 2.1.3. Cho F là hàm phân phối của biến ngẫu nhiên Y thỏa mãn EeY <
∞. Giả sử rằng
ey eity dF (y) = (c + γt)


eity dF (y),

(2.16)

với |t| ≤ ε. Khi đó (2.16) đúng với mọi số thực t và các hàm số ở cả hai vế của
hệ thức trên giải tích trong miền −1 < Im t < 0.

19


Chứng minh. Do (2.16) đúng với t thỏa mãn |t| ≤ ε nên thay t bởi −t, ta có
ey e−ity dF (y) = (c − γt)

e−ity dF (y).

(2.17)

Cộng hai vế của (2.16) và (2.17), chú ý rằng eity = cos ty + i sin ty, ta thu
được hệ thức sau
(ey − c) cos tydF (y) = iγt

sin tydF (y),

(2.18)

ở đây γ = iρ, với ρ là số thực. Do vậy (2.16) có thể viết dưới dạng sau đây
ey eity dF (y) = (c + iρt)

eity dF (y),


(2.19)

với |t| ≤ ε. Theo giả thiết, EeY tồn tại nên EeuY cũng tồn tại với 0 ≤ u ≤ 1.
iρz
Do hàm eizY giải tích trong miền −1 < Im t < 0, và hàm số 1 +
cũng giải
c
tích trong miền này nên hàm số
g(z) = 1 +

iρz
c

eity dF (y)

cũng giải tích trong miền đó. Hơn nữa g(t) =

(2.20)

eity dH(y) với |t| < ε và

ey
dH(y) =
dF (y). Theo tính chất 50 mục 1.2.2, chúng ta có điều phải chứng
c
minh.
Bổ đề 2.1.4. Cho F là hàm phân phối của biến ngẫu nhiên X. Nếu E(1/X)
tồn tại và hệ thức
eitx x−1 dF (x) = (µ + iρt)


eitx dF (x)

(2.21)

đúng với ρ = 0, µ = 0 nào đó, và |t| < δ, thì khi đó ρ < 0 và X có phân phối
gamma G(α, γ) với γ = 1 − (1/ρ) và α = −µ/ρ.
Chứng minh. Do E(1/X) tồn tại, chúng ta thấy rằng nếu đặt
A(t) =

eitx
dF (x)
x

(2.22)

thì
A (t) =

ieitx dF (x) = i
20

eitx dF (x) = iφ(t),

(2.23)


với φ(t) là hàm đặc trưng của biến ngẫu nhiên X. Từ (2.21), trong lân cận nào
đó của gốc tọa độ, chúng ta có
A (t)
i

=
,
A(t)
µ + iρt

(2.24)

1
iρt ρ
,
A(t) = µ 1 +
µ

(2.25)

hay là

và vì vậy
φ(t) =

1−ρ
iρt
ρ
1+
.
µ

(2.26)

Theo tính chất của hàm đặc trưng, |φ(t)| ≤ 1 điều này dẫn đến (1−ρ)/ρ ≤ 0.

Đặt γ = (ρ − 1)/ρ và α = −µ/ρ. Khi đó
φ(t) =

it
1−
α

−γ

với |t| < ε,

(2.27)

với ε > 0 nào đó. Theo tính giải tích của hàm đặc trưng thì điều này đúng với
mọi t ∈ R. Tính bị chặn của A(t), hay điều kiện tương đương là E(1/X) tồn
tại, dẫn tới ρ < 0 và vì vậy γ > 1. Vậy bổ đề được chứng minh.

2.2

Đặc trưng của phân phối Gamma

Trong mục này, chúng ta xem xét một số đặc trưng của phân phối gamma
thơng qua tính hồi quy hằng số của một thống kê đối với một thống kê khác.
Để tránh rắc rối khi phát biểu các định lý, chúng ta giả sử rằng các biến ngẫu
nhiên được đề cập tới đều khơng thối hóa.
Định lý 2.2.1. Cho X1 , ..., Xn , n ≥ 3, là các biến ngẫu nhiên độc lập, khơng âm
và nói chung không cùng phân phối với kỳ vọng EXj hữu hạn với mọi j = 1, n.
n

Xj đối với vectơ (X2 /X1 , ..., Xn /X1 ) là hằng số, thì Xj


Nếu sự hồi quy của
j=1

có phân phối gamma, cụ thể hơn, Xj ∼ G(α, γj ) với j = 1, ..., n, ở đây tham số
α là giống nhau đối với mọi Xj .

21


Chứng minh. Ta đặt Yj = log Xj , và viết lại điều kiện hồi quy hằng số dưới
dạng sau đây:
E(eY1 + · · · + eYn |Y2 − Y1 , ..., Yn − Y1 ) = m = const.

(2.28)

Theo Bổ đề 1.3.1, điều kiện cần và đủ để (2.28) được thỏa mãn là



n

eYj  eit1 (Y2 −Y1 )+···+itn−1 (Yn −Y1 ) 

E 
j=1

= mEeit1 (Y2 −Y1 )+···+itn−1 (Yn −Y1 ) . (2.29)
Ta biến đổi vế phải của (2.29) như sau:



n



eYj  eit1 (Y2 −Y1 )+···+itn−1 (Yn −Y1 ) 

E 
j=1

= E eY1 + · · · + eYn · E ei(−t1 −···−tn−1 )Y1 +···+itn−1 Yn


n−1
= E  e Y1 · e

i −

ti Y1 +···+itn−1 Yn

 + ···

i=1



n−1

+ E eYn · e


i −

ti Y1 +it1 Y2 +···+itn−1 Yn
i=1


.

Ta có
n−1

E e Y1 · e

i −

ti Y1 +it1 Y2 +···+itn−1 Yn
i=1

n−1

[1+ −

=E e

ti ]Y1
i=1

· E eit1 Y2 · · · E eitn−1 Yn

E eY2 · ei(−t1 −···−tn−1 )Y1 +it1 Y2 +···itn−1 Yn

= E ei(−t1 −···−tn−1 )Y1 · E eY2 (1+it1 ) · · · E eitn−1 Yn
···

E  e Yn · e

n−1

i −

ti Y1 +···itn−1 Yn
i=1





 = E e

22

n−1

i −

ti Y1
i=1


 · · · E eYn (1+tn−1 ) .



Tương tự như vậy, ta cũng có
E eit1 (Y2 −Y1 )+···+itn−1 (Yn −Y1 ) = E ei(−t1 −···−tn−1 )Y1 +it1 Y2 +···+itn−1 Y1
= E ei(−t1 −···−tn−1 )Y1 · E eit1 Y2 · · · E eitn−1 Yn .
Đặt E(eYj (1+it) ) = ψj (t), EeitYj = φj (t) và ξj (t) =

ψj (t)
. Khi đó chia cả hai
φj (t)

vế của (2.29) cho E ei(−t1 −···−tn−1 )Y1 · E eit1 Y2 · · · E eitn−1 Yn , ta thu được
hệ thức sau đây
ξ1 (−t1 − · · · − tn−1 ) + ξ2 (t1 ) + · · · + ξn (tn−1 ) = m,

(2.30)

đúng với |tj | < εj , j = 1, 2, ..., n − 1 với εj > 0 nào đó. Cho t3 = ... = tn−1 = 0,
từ (2.30) chúng ta thu được
ξ1 (−t1 − t2 ) + ξ2 (t1 ) + ξ3 (t2 ) = m1 .

(2.31)

Sử dụng Hệ quả 1.3.4, chúng ta có
ξj (t) = cj + γt,

j = 1, 2, 3.

(2.32)

Tương tự, chúng ta chứng minh được rằng ξj = cj + γt với mọi j = 1, n.

Mặt khác theo cách đặt trên, ta có:
ξj (t) =

ψj (t)
⇒ ψj (t) = ξj (t) · φj (t) = (cj + γt) · φj (t)
φj (t)
⇔ E eYj · eitYj

= (cj + γt) · E eitYj .

(2.33)

Nếu Fj là hàm phân phối của biến ngẫu nhiên Yj thì hệ thức (2.33) có thể
được viết dưới dạng sau đây
ey eity dFj (y) = (cj + γt)

eity dFj (y),

(2.34)

với |t| < ε. Theo cách đặt ban đầu, ta có Yj = log Xj hay là Xj = eYj . Sử dụng
Bổ đề 2.1.3, chúng ta có (2.34) đúng với mọi số thực t. Sau đó áp dụng Hệ quả
2.1.2, ta suy ra điều phải chứng minh.

23


×