ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Nguyễn Hồng Thái
KỲ VỌNG CÓ ĐIỀU KIỆN VÀ MỘT VÀI LỚP BIẾN
NGẪU NHIÊN PHỤ THUỘC
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội - 2012
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Nguyễn Hồng Thái
KỲ VỌNG CÓ ĐIỀU KIỆN VÀ MỘT VÀI LỚP BIẾN
NGẪU NHIÊN PHỤ THUỘC
Chuyên ngành: Lý thuyết xác suất và thống kê toán học
Mã số: 60.46.15
LUẬN VĂN THẠC SĨ KHOA HỌC
Người hướng dẫn khoa học:
PGS. TS Phan Viết Thư
Hà Nội - 2012
Mục lục
Lời nói đầu 2
1 Những kết quả thường dùng 4
2 Kỳ vọng và xác suất có điều kiện 8
2.1 Kỳ vọng có điều kiện . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.1 Các định lý hội tụ tiêu chuẩn đối với kỳ vọng có điều kiện 11
2.1.2 Sự hội tụ của dãy biến ngẫu nhiên khả tích đều có điều kiện 20
2.1.3 Kỳ vọng có điều kiện trên các không gian L
p
. . . . . . . 23
2.2 Xác suất có điều kiện . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2.1 Xác suất có điều kiện chính quy . . . . . . . . . . . . . . 29
2.2.2 Phân phối có điều kiện chính quy . . . . . . . . . . . . . . 32
2.2.3 Cơ sở vi phân . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.2.4 Độc lập có điều kiện . . . . . . . . . . . . . . . . . . . . . 44
3 Sự phụ thuộc Markov 48
4 Sự tồn tại của họ ngẫu nhiên khác nhau 63
5 Những dãy Martingale 82
Kết luận 99
Tài liệu tham khảo 100
1
LỜI NÓI ĐẦU
Sau khi cuốn "Fondations of the Theory of Probability" của Kolmogorov ra
đời, người ta mới công nhận xác suất là một lĩnh vực chặt chẽ. Hệ tiên đề về
xác suất của Kolmogorov dựa trên nền tảng lý thuyết độ đo đã được hầu hết
các nhà khoa học thừa nhận. Trong thời kỳ đầu hình thành lý thuyết xác suất,
các kết quả nghiên cứu chủ yếu dựa trên khái niệm độc lập của các đại lượng
ngẫu nhiên. Tuy nhiên sự cần thiết phải nới lỏng các điều kiện chi phối khái
niệm này được ghi nhận khi nghiên cứu dáng điệu của tổng các đại lượng ngẫu
nhiên độc lập. Một khái niệm tổng quát hóa hiện tượng này được xây dựng bởi
A.A.Markov vào năm 1906, và muộn hơn vào năm 1935 sự phụ thuộc martin-
gale được suy ra bởi P. Lévy. Cùng vào thời kỳ này vào đầu những năm 1930
khái niệm phụ thuộc dừng cấp hai và theo nghĩa chặt được giới thiệu bởi G.D.
Birkhov và Khintchine dựa trên đòi hỏi của lý thuyết ergodic và giải tích điều
hòa của các hàm ngẫu nhiên.
Mục đích của bản luận văn này nhằm giới thiệu hai lớp đại lượng ngẫu
không độc lập với các tính chất cơ bản của chúng đó là martingale và quá trình
Markov. Các lớp này xây dựng dựa trên khái niệm kỳ vọng có điều kiện và
xác suất có điều kiện. Vì vậy hai khái niệm này được trình bày chi tiết. Sự
tồn tại của hai quá trình ngẫu nhiên nói trên được suy từ định lý cơ bản của
Kolmogorov và Bochner, và định lý này được trình bày dưới một vài dạng khác
nhau được đề cập trong chương 4 của luận văn.
Luận văn gồm 5 chương trong đó chương 1 chúng tôi dành để trình bày lại
những kết quả quan trọng trong lý thuyết xác suất mà có sử dụng trong luận
văn. Chương 2 là những khái niệm, những kết quả sâu hơn về kỳ vọng có điều
kiện và xác suất có điều kiện. Các chương 3, 4, 5 là mục đích chính của luận văn
đó là sử dụng những khái niệm, kết quả đã được phát triển ở chương 2 để giới
thiệu về hai lớp biến ngẫu nhiên phụ thuộc là quá trình Markov và Martingale.
2
Dù đã cố gắng, nhưng vì kiến thức và khả năng còn nhiều hạn chế nên chắc
chắn luận văn còn nhiều thiếu sót. Tôi rất mong nhận được những ý kiến phê
bình, đóng góp và chỉ bảo của các thầy cô, đồng nghiệp và bạn bè.
Luận văn này được hoàn thành là nhờ sự hướng dẫn tận tình của thầy PGS.
TS Phan Viết Thư. Với thầy em xin bày tỏ lòng biết ơn chân thành. Em xin
chân thành cảm ơn các thầy cô giáo trong khoa Toán-Cơ-Tin đã truyền đạt
cho em những kiến thức quý báu và tạo điều kiện để em hoàn thành luận văn
này. Cuối cùng, tôi xin cảm ơn các đồng nghiệp ở trường Sỹ quan lục quân I,
các thành viên trong lớp cao học toán 2009-2011, bạn bè và người thân đã luôn
động viên, giúp đỡ tôi trong quá trình học tập và hoàn thành luận văn này.
Hà Nội, ngày 22 tháng 04 năm 2012
Học viên
Nguyễn Hồng Thái
3
Chương 1
Những kết quả thường dùng
Định nghĩa 1.1. Tập Ω = ∅; C là họ những tập con của Ω. Khi đó C được gọi
là
i, một lớp đơn điệu nếu {A
n
, n ≥ 1} ⊂ C, A
n
đơn điệu ⇒ lim
n
A
n
∈ C;
ii, một π-lớp nếu A, B ∈ C ⇒ A ∩B ∈ C;
iii, một λ-lớp nếu
(a) A, B ∈ C, A ∩B = ∅ ⇒ A ∪ B ∈ C;
(b) A, B ∈ C, B ⊂ A ⇒ A −B ∈ C, Ω ∈ C;
(c) A
n
∈ C, A
n
⊂ A
n+1
⇒ ∪A
n
∈ C.
Mệnh đề 1.2. (Định lý (π, λ)-lớp)
(a) Nếu A là một đại số thì lớp đơn điệu cảm sinh bởi A chính là σ-đại số
cảm sinh bởi A.
(b) Nếu A là một λ-lớp và B là một π-lớp, B ⊂ A thì A chứa trong σ-đại số
cảm sinh bởi B.
Định lý 1.3. (i) (Fubini-Stone)
Cho (Ω
i
, Σ
i
, µ
i
), i = 1, 2 là hai không gian đo được; (Ω, Σ, µ) là tích của
4
chúng. Nếu f : Ω → R là hàm đo được, µ-khả tích. Khi đó
Ω
1
f(w
1
, ·)µ
1
(dw
1
) là µ
2
-đo được,
Ω
2
f(·, w
2
)µ
2
(dw
2
) là µ
1
-đo được.
Hơn nữa
Ω
f(w
1
, w
2
)µ(dw
1
, dw
2
) =
Ω
1
Ω
2
f(w
1
, w
2
)µ
2
(dw
2
)µ
1
(dw
1
)
=
Ω
2
Ω
1
f(w
1
, w
2
)µ
1
(dw
1
)µ
2
(dw
2
).
(1.1)
(ii) (Torelli)
Nếu trong trường hợp trên µ
1
, µ
2
là σ-hữu hạn và f : Ω → R
+
là đo được
hoặc µ
i
là những độ đo tùy ý nhưng tồn tại một dãy hàm bậc thang µ-khả tích
f
n
: Ω → R
+
sao cho f
n
→ f µ-h.k.n. Khi đó (1.1) đúng mặc dù cả hai vế có
thể vô hạn.
(iii) (Radon-Nikodym)
Nếu µ là một độ đo σ-hữu hạn trên (Ω, Σ) và ν : Σ → R là σ-cộng tính và
triệt tiêu trên những tập µ-không. Khi đó tồn tại một hàm µ-duy nhất f : Ω → R
sao cho
ν(A) =
A
fdµ, A ∈ Σ.
Định nghĩa 1.4. Tập bất kỳ các biến ngẫu nhiên trên không gian xác suất
(Ω, Σ, P ) {X
t
, t ∈ T } được gọi là khả tích đều nếu
(i) E(|X
t
|) ≤ K
0
< ∞, t ∈ T ;
(ii) lim
P (A)→0
A
|X
t
|dP = 0.
Định lý 1.5. (Vitali)
Cho X
1
, X
2
, là một dãy các biến ngẫu nhiên trên không gian xác suất
5
(Ω, Σ, P ) sao cho X
n
→ X h.c.c. Nếu {X
n
, n ≥ 1} là khả tích đều. Khi đó, ta
có
lim
n→∞
Ω
X
n
dP =
Ω
XdP.
Định lý 1.6. Cho {X
t
, t ∈ T } là một tập những biến ngẫu nhiên khả tích trên
không gian xác suất. Khi đó các khẳng định sau là tương đương.
i, {X
t
, t ∈ T } là khả tích đều;
ii, lim
a→∞
[|X
t
|>a]
|X
t
|dP = 0 đều theo t ∈ T;
iii, Tồn tại một hàm lồi φ : R → R
+
, φ(0) = 0, φ(x) = φ(−x) và
φ(x)
x
↑ ∞
(khi x ↑ ∞) sao cho
sup
t∈T
E(φ(X
t
)) < ∞.
Mệnh đề 1.7. (Bổ đề Scheffe’)
Cho X, X
n
≥ 0 là những biến ngẫu nhiên khả tích trên không gian xác suất
(Ω, Σ, P ) và X
n
→ X h.c.c. Khi đó
E(X
n
)−→E(X) (khi n → ∞) ⇔ {X
n
, n ≥ 1} khả tích đều.
Định nghĩa 1.8. Cho A
i
1
, , A
i
n
là n biến cố khác nhau, n ≥ 2. Khi đó chúng
được gọi là độc lập tương hỗ nếu
P
m
k=1
A
i
k
=
m
k=1
P (A
i
k
), 2 ≤ m ≤ n. (1.2)
Định nghĩa tương tự về tính độc lập tương hỗ cho lớp các biến cố {A
i
, i ∈ I}
và họ các biến cố {A
i
, i ∈ I}.
Định nghĩa 1.9. Cho (Ω, Σ, P) là một không gian xác suất; (S, A) là một
không gian đo được. Các biến ngẫu nhiên {X
i
, i ∈ I}, X
i
: Ω → S được gọi là
độc lập tương hỗ nếu lớp {B
i
, i ∈ I} các σ-đại số trong Σ là độc lập tương hỗ;
B
i
= X
−1
i
(A) là σ-đại số cảm sinh bởi X
i
, i ∈ I.
6
Định lý 1.10. (Tiêu chuẩn (π, λ))
(a) Cho {A, B
i
, i ∈ I} là một lớp các biến cố trong (Ω, Σ, P ) sao cho chúng
độc lập tương hỗ. Nếu với mỗi i ∈ I, B
i
là một π-lớp thì tập con bất kỳ J ⊂ I
cảm sinh σ-đại số σ(B
i
, i ∈ I) và A là độc lập với nhau.
(b) Trong Định nghĩa 1.9, với S = R, {i
1
, , i
n
} ⊂ I; X
i
1
, , X
i
n
là những
biến cố. Khi đó {[X
i
1
< x
1
, , X
i
n
< x
n
], x
i
∈ R, i = 1, n, n ≥ 1} là một lớp độc
lập.
Định nghĩa 1.11. Các biến ngẫu nhiên (X
1
, X
2
, , X
n
) trên (Ω, Σ, P ) được
gọi là đối xứng (hoặc là phụ thuộc đối xứng) nếu với mỗi hoán vị i
1
, , i
n
của (1, 2, , n) thì véctơ (X
i
1
, , X
i
n
) và (X
1
, , X
n
) có cùng phân phối. Dãy
{X
n
, n ≥ 1} là đối xứng nếu {X
k
, 1 ≤ k ≤ n} là đối xứng với mỗi n ≥ 1.
Mệnh đề 1.12. (Bổ đề Doob-Dynkin)
Cho (Ω, Σ) và (S, A) là hai không gian đo được; f : Ω → S là hàm đo được
(tức là f
−1
(A) ⊂ Ω). Khi đó hàm g : Ω → R là đo được đối với σ-đại số f
−1
(A)
(tức là g
−1
(B) ⊂ f
−1
(A)) khi và chỉ khi tồn tại hàm đo được h : S → R sao
cho g = h ◦f.
7
Chương 2
Kỳ vọng và xác suất có điều
kiện
2.1 Kỳ vọng có điều kiện
Cho (Ω, Σ, P ) là một bộ ba xác suất mô tả một thực nghiệm hoặc hiện tượng
vật lý được toán học hóa.
Nếu một biến cố A đã được quan sát thì xác suất cho các biến cố khác thuộc
Ω được tính như thế nào sau khi kết hợp với đã biết về sự xuất hiện của A? Ta
xét tất cả các biến cố của Ω có quan hệ với A, do đó Σ(A) = {A ∩ B : B ∈ Σ}
là một lớp mới, trên đó ta định nghĩa: P
A
: Σ(A) → R
+
như một xác suất.
Giả sử P (A) > 0, yêu cầu P
A
(A) = 1, ta có
P
A
(C) =
P (C)
P (A)
, C ∈ Σ(A).
Vậy P
A
(B) =
P (A ∩B)
P (A)
∈ [0, 1]. Nếu A và B độc lập thì P
A
(B) = P (B). Rõ
ràng Σ(A) là một σ-đại số vết, chứa trong Σ, P
A
: Σ(A) → [0, 1] là một độ đo
xác suất. Vậy (A, Σ(A), P
A
) là một bộ ba mới. Vì P
A
(A
c
) = 0, P
A
: Σ → [0, 1]
cũng được xác định và nó là một độ đo xác suất. Ta gọi P
A
là xác suất điều
kiện cơ sở trên Σ có mối quan hệ với biến cố A thỏa mãn P(A) > 0.
8
Nếu X : Ω → R là một biến ngẫu nhiên khả tích, ta định nghĩa kỳ vọng có
điều kiện cơ sở đối với điều kiện đã biết A là
E
A
(X) =
Ω
X(ω)P
A
(dω) =
1
P (A)
A
X(ω)P (dω),
ở đây P là độ đo xác suất trên (Ω, Σ, P ).
Nếu P (A
c
) > 0 thì E
A
c
(X) được định nghĩa tương tự. Do đó, kỳ vọng có
điều kiện cơ sở của X với A, A
c
nói chung xác định một hàm hai giá trị.
Mở rộng suy luận trên với tập hợp đếm được P = {A
n
: n ≥ 1} của các biến
cố sao cho P(A
n
) > 0, n ≥ 1, ∪
n≥1
A
n
= Ω, A
n
∩ A
m
= ∅ nếu m = n (P là một
phân hoạch của Ω). Khi đó, ta có
E
P
(A) =
∞
n=1
1
P (A
n
)
A
n
X(ω)P (dω)
χ
A
n
. (2.1)
E
P
(A) được gọi là kỳ vọng có điều kiện cơ sở của biến ngẫu nhiên khả tích
X trên (Ω, Σ, P ) đối với phân hoạch P. Đây là một định nghĩa tốt (đúng đắn)
đối với phân hoạch đếm được.
Nhận xét 2.1. Công thức (2.1) là không đủ nếu bộ phận của thí nghiệm mà
ta đã biết không thể biểu diễn được dưới dạng một tập đếm được của các điều
kiện. Đồng thới nếu P (A) = 0 thì định nghĩa ở trên không đúng. Điều này gặp
khi nếu Y là một biến ngẫu nhiên liên tục thì P(Y = a) = 0 ∀a ∈ R. Đặt
A
a
= [Y = a] và ta cần định nghĩa E
A
a
(X).
Ta mở rộng (2.1) một cách tự nhiên. Nếu B = σ(P) là σ-đại số cảm sinh bởi
P thì E
P
(X) trong (2.1) là B-đo được. Tích phân (2.1) trên tập A ∈ P ⊂ B,
A = ∪
k∈J
A
k
, J ⊂ N:
A
E
P
(X)dP =
∞
n=1
1
P (A
n
)
A
n
XdP
P (A
n
∩ A) =
A
XdP. (2.2)
9
Ta viết E
B
(X) thay cho E
P
(X). (2.2) kéo theo ánh xạ
ν
X
: A −→
A
XdP, A ∈ B là P
B
liên tục (ν
X
<< P
B
).
P
B
là hạn chế của P trên B ⊂ Σ. Từ đó, (2.2) trở thành
ν
X
(A) =
A
E
B
(X)dP
B
, A ∈ B. (2.3)
Định nghĩa 2.2. Cho (Ω, Σ, P ) là một không gian xác suất, X : Ω → R là một
biến ngẫu nhiên khả tích (hoặc chỉ X
+
hoặc X
−
khả tích), B ⊂ Σ là một σ-đại
số. Khi đó, một hàm E
B
(X) B-đo được thỏa mãn họ phương trình (với mỗi B
cố định ∈ B ta có một phương trình)
B
E
B
(X)dP
B
=
B
XdP, B ∈ B (2.4)
được gọi là kỳ vọng có điều kiện của X đối với B.
P
B
: A −→ E
B
(χ
A
), A ∈ Σ được gọi là hàm xác suất có điều kiện đối với
B. Vậy P
B
(·) thỏa mãn phương trình hàm
B
P
B
(A)dP
B
= P (A ∩B), A ∈ Σ, B ∈ B. (2.5)
Sự tồn tại của E
B
(X), từ đó là P
B
(·) được suy ra từ Định lý Radon-
Nikodym, vì ν
X
: A −→
A
XdP , A ∈ Σ định nghĩa độ đo có dấu và ν
X
<< P
B
.
Vậy tồn tại
dν
X
dP
B
= E
B
(X) h.c.c [P
B
]
và P
B
duy nhất cũng do định lý này.
Chú ý 2.3. Nếu X không khả tích (tức là E(X
+
) = ∞ nhưng E(X
−
) < ∞
hoặc ngược lại) thì
dν
X
dP
B
= +∞ (hoặc −∞) trên tập của P
B
-đo được dương. Do
vậy, E
B
(X) = E
B
(X
+
) −E
B
(X
−
) được định nghĩa tốt.
10
Mệnh đề 2.4. Cho (Ω, Σ, P) là một không gian xác suất, B ⊂ Σ là một σ-đại
số. Khi đó, toán tử kỳ vọng có điều kiện E
B
: L
1
(P ) → L
1
(P ) có các tính chất
sau (h.c.c). Cho {X, Y, XY } ⊂ L
1
(P ):
i, E
B
(X) ≥ 0 nếu X ≥ 0, E
B
(1) = 1.
ii, E
B
(aX + bY ) = aE
B
(X) + bE
B
(Y ).
iii, E
B
(XE
B
(Y )) = E
B
(X) ·E
B
(Y ).
iv, |E
B
(X)| ≤ E
B
|X|, do đó ||E
B
(X)||
1
≤ ||X||
1
.
v, Nếu B
1
⊂ B
2
⊂ Ω là các σ-đại số thì
E
B
1
(E
B
2
(X)) = E
B
2
(E
B
1
(X)) = E
B
1
(X).
(do vậy toán tử E
B
là phép chiếu co trên L
1
(P )).
vi, Nếu B = (∅, Ω) thì E
B
(X) = EX. Nếu B = Σ thì E
B
(X) = X. Hơn nữa
với mọi σ-đại số B
1
⊂ Ω ta có
E(E
B
1
(X)) = E(X), với mọi X ∈ L
1
(P ).
vii, Nếu X độc lập với B thì E
B
(X) = EX h.c.c.
viii, Nếu Y là B-đo được, E|Y | < ∞; E|XY | < ∞ thì E
B
(XY ) = Y E
B
(X)
h.c.c.
Nhận xét 2.5. Vì
Ω
E
B
(|X|)dP
B
=
Ω
|X|dP nên E
B
(|X|) = 0 khi và chỉ khi
|X| = 0. Vậy E
B
có thể được gọi là toán tử faithful.
2.1.1 Các định lý hội tụ tiêu chuẩn đối với kỳ vọng có
điều kiện
Định lý 2.6. Cho {X
n
: n ≥ 1} là một dãy biến ngẫu nhiên trên (Ω, Σ, P ),
B ⊂ Σ là một σ-đại số. Khi đó, ta có
11
i, Hội tụ đơn điệu:
0 ≤ X
n
↑ X ⇒ E
B
(X
n
) ↑ E
B
(X) h.c.c.
ii, Bổ đề Fatou:
X
n
≥ 0 ⇒ E
B
(lim inf
n
X
n
) ≤ lim inf
n
E
B
(X
n
) h.c.c.
iii, Hội tụ làm trội: |X
n
| ≤ Y , E(Y ) < ∞, X
n
→ X h.c.c. Khi đó
E
B
(X
n
) → E
B
(X) h.c.c
và hội tụ trong L
1
(P ). Nếu X
n
P
→ X thì E
B
(X
n
) → E
B
(X) trong L
1
(P )
(nhưng không h.c.c).
iv, Hội tụ đặc biệt Vitali: {X
n
: n ≥ 1} là khả tích đều, X
n
→ X h.c.c thì
||E
B
(X
n
) − E
B
(X)||
1
→ 0. Do vậy {E
B
(X
n
) : n ≥ 1} là khả tích đều
và E
B
(X
n
)
P
→ E
B
(X). (Sự hội tụ này không nhất thiết là h.c.c cho nên
định lý hội tụ Vitali đầy đủ không đúng cho dãy kỳ vọng có điều kiện).
Chứng minh. i, Ta có E
B
(X
n
) ≤ E
B
(X
n+1
) và tồn tại lim E
B
(X
n
) là B-đo
được. Do vậy với mọi A ∈ B:
A
lim
n
E
B
(X
n
)dP
B
= lim
n
A
E
B
(X
n
)dP
B
= lim
n
A
X
n
dP
=
A
lim
n
X
n
dP =
A
XdP =
A
E
B
(X)dP
B
.
Vậy lim
n
E
B
(X
n
) = E
B
(X) h.c.c.
ii, Cho Y
n
= inf{Y
k
: k ≥ n} ⇒ 0 ≤ Y
n
↑ Y = lim inf
n
X
n
. Vậy do (i) ta có,
vì Y
n
≤ X
n
E
B
(lim
n
inf X
n
) = E
B
(Y ) = lim
n
E
B
(Y
n
)
= lim
n
inf E
B
(Y
n
) ≤ lim inf E
B
(Y
n
) h.c.c.
12
Tương tự nếu X
n
≤ Z h.c.c, E(|Z|) < ∞ thì
E
B
(lim sup
n
X
n
) ≥ lim sup
n
E
B
(X
n
) h.c.c.
iii, Vì −Y ≤ X
n
≤ Y h.c.c, n ≥ 1 áp dụng ii, với X
n
+ Y ≥ 0 và X
n
≤ Y :
lim
n
inf(X
n
+ Y ) = lim
n
inf X
n
+ Y = X + Y = lim
n
sup(X
n
+ Y ).
Ta có
E
B
(X) + E
B
(Y ) = E
B
(lim
n
inf(X
n
+ Y ))
≤ lim
n
inf[E
B
(X
n
) + E
B
(Y )]
≤ lim
n
sup[E
B
(X
n
) + E
B
(Y )] = lim
n
sup E
B
(X
n
+ Y )
≤ E
B
(lim
n
sup(X
n
+ Y )) (vì X
n
+ Y ≤ 2Y h.c.c)
= E
B
(X + Y ) = E
B
(X) + E
B
(Y ) h.c.c.
Bỏ qua biến ngẫu nhiên hữu hạn E
B
(Y ), ta có lim
n
E
B
(X
n
) = E
B
(X) h.c.c.
Cuối cùng khi n → ∞
E(|E
B
(X
n
) −X|) ≤ E(E
B
(|X
n
− X|)) ≤ E(|X
n
− X|) → 0. (2.6)
Điều này cũng suy ra biểu thức sau. Mệnh đề phủ định là rõ ràng vì nếu
B = Σ thì X
n
P
→ X không thể suy ra sự hội tụ hầu chắc chắn.
iv, Ta lại có:
E(|E
B
(X
n
− X)|) ≤ E(E
B
(|X
n
− X|)) = E(|X
n
− x|) → 0.
Theo định lý Vitali cổ điển cho X
n
khả tích đều độ đo hữu hạn suy ra điều
phải chứng minh.
Nếu B ⊂ Σ được cho bởi B = σ(Y ), Y là một biến ngẫu nhiên Ω → R thì
với X ∈ L
1
(P ) ta viết E
σ(Y )
(X) là E(X|Y ).
Mệnh đề 2.7. Cho X là một biến ngẫu nhiên khả tích trên (Ω, Σ, P). Nếu
B ⊂ Σ là một σ-đại số độc lập với X thì E
B
(X) = E(X) h.c.c. Nếu Y là một
13
biến ngẫu nhiên bất kỳ trên Ω thì ta có một ánh xạ Borel g : R → R sao cho
E(X|Y ) = g(Y ) h.c.c, tức là kỳ vọng điều kiện của X đối với Y tương đương
một hàm Borel của Y .
Chứng minh. Nếu X và B độc lập thì với mọi B ∈ B ta có X và χ
B
độc lập.
Vậy
B
E(X)dP
B
= E(X)P (B) = E(X)E(χ
B
) = E(Xχ
B
)
=
B
XdP =
B
E
B
(X)dP
B
, B ∈ B.
Vì các tích phân đầu và cuối là B-đo được, vậy E(X) = E
B
(X) h.c.c. Ta có
E(X|Y ) là σ(Y )-đo được, do Bổ đề Doob-Dynkin ⇒ điều phải chứng minh.
Định lý 2.8. Cho {X, X
n
: n ≥ 1} là một dãy các biến ngẫu nhiên khả tích
trên (Ω, Σ, P ) sao cho X
n
→ X h.c.c. Nhưng nếu U = sup
n≥1
|X
n
|, E(U) = +∞.
Khi đó tồn tại (sau khi mở rộng (Ω, Σ, P ) nếu cần thiết) một dãy biến ngẫu
nhiên khả tích {X
, X
n
: n ≥ 1} mà trên nó có cùng phân phối hữu hạn chiều
như trên dãy {X, X
n
: n ≥ 1}, nghĩa là
P [X
i
1
< x
1
, , X
i
k
< x
k
] = P [X
i
1
< x
1
, , X
i
k
< x
k
], (2.7)
x
i
∈ R, 1 ≤ i ≤ k < ∞,
sao cho với σ-đại số B
0
nào đó ⊂ Σ ta có E
B
0
(X
n
) → E
B
0
(X
) hầu như không
tại điểm nào, hay là
P
lim
n→∞
E
B
0
(X
n
) = E
B
0
(X
)
= 0. (2.8)
Chứng minh. Vì X
n
→ X h.c.c dẫn đến φ(X
n
) → φ(X) h.c.c với φ là một hàm
thực liên tục trên R. Lấy φ(x) = max(x, 0) = x
+
, ta có X
±
n
→ X
±
h.c.c. Vậy
không mất tổng quát, ta giả sử X
n
≥ 0, nghĩa là giả sử dãy đã cho không âm,
ta chứng minh qua bốn bước:
14
Bước 1. Ta xét với X = 0 h.c.c. Đặt Y
n
= (X
n
−X)
+
và Z
n
= −(X
n
−X)
−
,
suy ra X
n
− X = Y
n
+ Z
n
. Rõ ràng E(Y
n
) < ∞, E(−Z
n
) < ∞, Y
n
→ 0 h.c.c,
Z
n
→ 0 h.c.c và
sup
n≥1
Y
n
≥ sup
n≥1
(X
n
− X) = sup
n≥1
X
n
− X = U −X,
vậy E(sup
n≥1
Y
n
) ≥ E(U − X) = E(U) − E(X) = +∞. Nói cách khác, do định
nghĩa
|Z
n
| = (X
n
− X)
−
=
X − X
n
nếu X
n
< X,
0 nếu X
n
≥ X.
Do đó sup
n≥1
|Z
n
| ≤ X và E(X) < ∞ (chú ý là X
n
, X ≥ 0). Vì Z
n
→ 0 h.c.c,
vậy với mọi σ-đại số B ⊂ Σ E
B
(Z
n
) → 0 h.c.c (theo ý iii, của định lý 2.6). Kết
quả là
P
lim
n→∞
E
B
(X
n
− X) = 0
= P
lim
n→∞
E
B
(Y
n
) + lim
n→∞
E
B
(Z
n
) = 0
= P
lim
n→∞
E
B
(Y
n
) = 0
.
(2.9)
Từ đó nếu (Ω, Σ, P) đủ giàu thì tồn tại một σ-đại số B ⊂ Σ sao cho vế phải
(2.9):
P
lim
n→∞
E
B
(Y
n
) = 0
= 0.
Suy ra E
B
(X
n
) → E
B
(X) hầu như không tại điểm nào. Vậy nếu không
gian xác suất được mở rộng đủ lớn (giàu có) thì ta đã xây dựng được một dãy
Y
n
≥ 0, Y
n
→ 0 h.c.c nhưng E
B
(Y
n
) → 0 hầu như không tại điểm nào.
Bước 2. Tiếp theo, ta cần xây dựng một dãy {Y
n
: n ≥ 1} sao cho Y
n
→
Y
= 0, P[Y
n
= a
n
] = p
n
= 1 − P[Y
n
= 0], 0 < p
n
< 1, a
n
> 0,
∞
n=1
p
n
= 1 và
với mỗi ω ∈ Ω: Y
n
(ω) · Y
m
(ω) = 0 nếu m = n, với U
= sup
n≥1
Y
n
=
∞
1
Y
n
thỏa
mãn
E(U
) =
∞
n=1
E(Y
n
) =
∞
n=1
a
n
· p
n
= +∞.
15
Lấy A
k
là biến cố sao cho Y
k
≥ U − 1 lần đầu tiên với Y
k
, U của bước cuối
cùng. Nghĩa là
A
1
= [Y
1
≥ U −1]
và
A
k
= [Y
k
≥ U −1, Y
i
< U −1, 1 ≤ i ≤ k − 1] với k > 1.
Khi đó, A
k
∩ A
l
= ∅ nếu k = l và ∪
k≥1
A
k
= [U ≥ 1]. Đặt A
0
= Ω − ∪
k≥1
A
k
,
và xét Y
k
χ
A
k
, k ≥ 1. Khi đó tồn tại một dãy 0 ≤ f
kn
↑ Y
k
χ
A
k
(theo điểm), f
kn
là hàm đơn giản. Từ đó, tồn tại n
0
= n
0
(k) sao cho h
k
= f
kn
0
≤ Y
k
χ
A
k
. Ta có
E(h
k
) ≥
A
k
Y
k
dP −
1
2
k
, k ≥ 1, (2.10)
ở đây h
k
=
m
i=1
b
i
χ
B
i
(có thể giả sử có dạng chính tắc), B
i
∩B
i+1
= ∅, B
i
⊂ A
k
,
b
i
≥ 0. Từ đó sup
k≥1
h
k
=
∞
k=1
h
k
(vì A
k
đôi một không giao nhau). Vậy
E
sup
k≥1
h
k
=
∞
k=1
h
k
=
∞
sup
k=1
E(h
k
) (do tính hội tụ đơn điệu)
≥
∞
k=1
A
k
Y
k
dP −1 (do (2.10))
≥
∞
k=1
A
k
UdP −2 ≥
Ω
UdP −3 = +∞.
(2.11)
Nhưng h
k
≤ Y
k
, vậy với mỗi B ⊂ Ω (là σ-đại số) ta có
lim
k
E
B
(h
k
) > 0
⊂
lim
k
Y
k
> 0
.
Từ đó
P
lim
k
E
B
(h
k
) = 0
≥ P
lim
k
Y
k
= 0
≥ 0
và nó là đủ để chỉ ra rằng P
lim
k
E
B
(h
k
) = 0
= 0 khi h
k
→ 0, với mỗi h
k
là
một hàm dương đơn giản thỏa mãn (2.11). Vì mỗi h
k
là dạng chính tắc, nó là
16
tổng hữu hạn của những hàm hai giá trị và không triệt tiêu chỉ trên một tập (ở
đây là B
i
), với k khác nhau, h
k
ở trên A
k
(chú ý A
k
là dãy không giao nhau).
Xắp xếp lại những hàm hai giá trị vào một dãy đơn, bỏ qua những hàm đồng
nhất bằng không và đặt B
0
là tập mà trên nó tất cả đều triệt tiêu.
Nếu ta cộng χ
B
0
vào tập hàm hai giá trị trên, ta nhận được một dãy Y
1
, Y
2
, ,
thỏa mãn những điều kiện đã cho ở bước đầu tiên. Vậy nó là đủ để chứng minh
định lý này trong trường hợp với một σ-đại số đo được B
0
⊂ Σ.
Bước 3. Bây giờ, ta xây dựng yêu cầu {Y
k
, k ≥ 1} và B
0
. Vì 0 < p
1
< 1,
chọn một số nguyên k ≥ 1 sao cho
2
−k
< p
1
≤ 2
−k+1
.
Cho a
i
> 0 là những số thỏa mãn
∞
i=1
a
i
p
i
= +∞. Cho
N
n
= {i ≥ 2 : 2
n+k
≤ a
i
< 2
n+k+1
}, n ≥ 1
. (Chú ý N
n
= ∅ có thể xảy ra vì N
n
phụ thuộc vào k). Xét
r
n
=
i∈N
n
p
i
, t
n
= r
n
+ 2
−(n+k)
, r =
n≥1
r
n
. (2.12)
Cho T (= T
n
) = ∪
n
N
n
= {i ≥ 2 : a
i
≥ 2
k+1
}. Đặt
r =
i∈T
p
i
≤ 1 − p
1
< 1 − 2
−k
,
t =
n≥1
t
n
= r +
n≥1
2
−(n+k)
= r + 2
−k
< 1.
Cho {W, Z
n
≥ 0}
∞
1
là một tập các biến ngẫu nhiên độc lập, tương hỗ trên
(Ω, Σ, P ) với phân phối như sau:
P [W = 0] = 1 −t, P [W = n] = t
n
, n ≥ 1,
P [Z
0
= 1] =
p
1
− 2
−k
1 −t
,
P [Z
0
= i] =
p
i
1 −t
nếu i ≥ 2, i /∈ T,
0 trong các trường hợp khác.
(2.13)
17
và với n ≥ 1
P [Z
n
= 1] = (t
n
2
n+k
)
−1
P [Z
n
= i] =
p
i
/t
n
với i ∈ N
n
,
0 nếu trái lại.
(2.14)
Cho B
0
= σ(Z
n
, n ≥ 0), tiếp theo ta xây dựng những biến ngẫu nhiên hai
giá trị muốn có từ {W, Z
n
, n ≥ 0} và thử lại chúng và B
0
này thỏa mãn yêu cầu
của ta.
Xét biến ngẫu nhiên hợp thành
V = Z ◦ W(= Z
W
).
Ta khẳng định
P [V = n] = p
n
.
Thật vậy
P [V = 1] =
∞
n=0
P [Z
n
= 1, W = n]
=
∞
n=0
P [Z
n
= 1] ·P [W = n] (do tính độc lập)
= P [Z
0
= 1] ·P [W = 0] +
∞
n=1
(t
n
2
n+k
)
−1
· t
n
= p
1
− 2
−k
+ 2
−k
= p
1
(do (2.13) và (2.14)).
Tiếp theo với i ≥ 2, i /∈ T
P [V = i] = P [W = 0, Z
0
= i] = (1 −t) ·p
i
· (1 − t)
−1
= p
i
,
và với i ≥ 2, i ∈ T
P [V = i] = P [W = n, Z
n
= i] = p
i
. (2.15)
Điều này chứng minh sự khẳng định. Định nghĩa Y
n
= a
n
χ
[V =n]
. Khi đó Y
n
có hai giá trị 0, a
n
> 0 và [V = n] là những biến cố không giao nhau, với mỗi
18
n chỉ một Y
n
(w) là khác không. Hơn nữa, Y
n
→ 0 h.c.c và
P [Y
n
= a
n
] = P [V = n] = p
n
(2.16)
như yêu cầu trong bước 2. Vậy {Y
n
, n ≥ 0} và B
0
là dãy và σ-đại số đã được
chỉ ra thỏa mãn điều kiện trong bước 2.
Bước 4. E
B
0
(Y
n
) → 0 tại hầu như không điểm nào của Ω. Vì
E
B
0
(Y
n
) = a
n
· E
B
0
(χ
[V =n]
) = a
0
· P
B
0
[V = n]
nó đủ để chỉ ra rằng
P [E
B
0
(Y
n
) ≥ 1, i.o] = P[P
B
0
[V = n] ≥ 1/a
n
, i.o] = 1.
Điều này sẽ được thiết lập bởi trung bình của Bổ đề Borel-Cantelli.
Vì σ(Z
n
) ⊂ B
0
, do Mệnh đề 2.4 và Mệnh đề 2.7, ta có với i ∈ N
n
E
σ(Z
n
)
(P
B
0
[V = i])(k) = P [V = i|Z
n
= k] =
P [V = i, Z
n
= k]
P [Z
n
= k]
=
0 khi k = i,
t
n
khi k = i.
Vậy a
n
P [V = i|Z
n
= i] = a
n
t
n
, i ∈ N
n
. Nhưng t
n
≥ 2
−n−k
và a
i
≥ 2
n+k
với i ∈ N
n
, do vậy a
n
t
n
≥ 1. Kết quả là nếu
A
n
= [Z
n
= 1] và B
n
= [a
n
P [V = i|Z
n
= i] ≥ 1, i ∈ N
n
]
thì A
n
⊂ B
n
với n ≥ 1. Tuy nhiên B
n
không cần thiết phải độc lập. A
n
là độc lập
tương hỗ vì Z
n
, n ≥ 1 là độc lập tương hỗ. Vậy [A
n
, n thường xảy ra hữu hạn] ⊂
[B
n
, n thường xảy ra hữu hạn] và đủ để chỉ ra rằng
P [A
n
, n thường xảy ra hữu hạn] = 1
bằng cách thử lại rằng
∞
n=1
P (A
n
) = ∞ (Bổ đề Borel-Cantelli). Do (2.14)
P (A
n
) =
i∈N
n
p
i
t
n
=
r
n
t
n
.
19
Ta chỉ ra rằng
n≥1
r
n
t
n
= ∞. Từ (2.12), ta có r
n
= t
n
− 2
−(n+k)
.
• Nếu r
n
≥ 2
−(n+k)
với n hữu hạn (nhiều) thì
r
n
t
n
≥
1
2
với mọi n suy ra
n≥1
r
n
t
n
= ∞.
• Nếu r
n
< 2
−(n+k)
với n ≥ n
0
(với một vài n
0
) thì t
n
< 2
−(n+k−1)
, do đó
r
n
t
n
≥ 2
n+k−1
r
n
=
1
4
i∈N
n
2
n+k+1
p
i
≥
1
4
i∈N
n
a
i
p
i
. (2.17)
Kết quả là
n≥1
r
n
t
n
≥
1
4
n≥n
0
i∈N
n
p
i
a
i
=
1
4
i /∈T
0
p
i
a
i
, (2.18)
trong đó T
0
= {i ≥ 2 : a
i
≥ 2
n
0
+k
}. Nhưng
i /∈T
0
p
i
a
i
≤ 2
n
0
+k
·
n≥1
p
i
≤ 2
n
0
+k
do ta chọn
i≥1
p
i
a
i
= +∞, từ đó suy ra
i∈T
0
p
i
a
i
= +∞. Vậy trong tất cả các
trường hợp ta đều có
n≥1
r
n
t
n
= +∞. Từ đó dẫn đến
P [A
n
, n thường xảy ra hữu hạn] = 1.
Chứng minh hoàn tất.
Như vậy, một dãy khả tích đều {X
n
, n ≥ 1} sao cho X
n
→ X h.c.c không
thể suy ra E
B
0
(X
n
) → E
B
0
(X) h.c.c với mỗi σ-đại số B ⊂ Σ khi
E(sup
n
|X
n
|) = +∞.
2.1.2 Sự hội tụ của dãy biến ngẫu nhiên khả tích đều có
điều kiện
Định nghĩa 2.9. Một dãy biến ngẫu nhiên {X
n
, n ≥ 1} được gọi là khả tích
đều có điều kiện với σ-đại số B ⊂ Ω nếu
lim
k→+∞
E
B
|X
n
|χ
[|X
n
|≥k]
= 0 h.c.c (đều theo n).
20
Mệnh đề 2.10. Cho {X, X
n
, n ≥ 1} là một dãy các biến ngẫu nhiên khả tích
trên (Ω, Σ, P ) và B ⊂ Σ là một σ-đại số. Nếu dãy này là khả tích đều có điều
kiện với B và X
n
→ X h.c.c thì E
B
(X
n
) → E
B
(X) h.c.c (và theo chuẩn trong
L
1
(P )).
Chứng minh. Vì dãy {X
n
, n ≥ 1} là khả tích đều có điều kiện với B, suy ra
{X
±
n
, n ≥ 1} cũng có tính chất này, trong đó X
+
n
= max(X
n
, 0) và
X
−
n
= X
+
n
− X
n
≥ 0.
Từ giả thiết, ta có
U
m
= sup
n≥1
E
B
X
−
n
χ
[X
−
n
>m]
→ 0,
V
m
= sup
n≥1
E
B
X
+
n
χ
[X
+
n
>m]
→ 0 h.c.c khi m → ∞.
(2.19)
Nhưng
E
B
(X
n
) = E
B
(X
n
χ
[X
−
n
≤m]
) −E
B
(X
n
χ
[X
−
n
>m]
)
≥ E
B
(X
n
χ
[X
−
n
≤m]
) −U
m
= −E
B
(X
−
n
χ
[X
−
n
≤m]
) −U
m
(vì X
+
n
· X
−
n
= 0). (2.20)
Vì lim inf
n
(−a
n
) = −lim sup
n
(a
n
) với mọi {a
n
, n ≥ 1} ⊂ R, với mọi m > 0,
(2.20) dẫn đến
lim
n
inf E
B
(X
n
) ≥ −lim
n
sup E
B
(X
−
n
χ
[X
−
n
≤m
]) −U
m
≥ −E
B
(lim
n
sup X
−
n
χ
[X
−
n
≤m]
) −U
m
(do Định lý 2.6, vì X
−
n
χ
[X
−
n
≤m]
là bị chặn)
= E
B
(lim
n
inf(−X
−
n
χ
[X
−
n
≤m]
)) −U
m
= E
B
(lim
n
inf X
n
χ
[X
−
n
≤m]
) −U
m
(vì X
−
n
· X
+
n
= 0)
≥ E
B
(lim
n
inf X
n
) −U
m
h.c.c. (2.21)
Vì m > 0 tùy ý và U
m
→ 0 (m → ∞), (2.21) suy ra
lim
n
inf E
B
(X
n
) ≥ E
B
(lim
n
inf X
n
) h.c.c. (2.22)
21
Xét X
+
n
và −X
n
như trên, ta nhận được
lim
n
sup E
B
(X
n
) = −lim
n
inf E
B
(−X
n
)
≤ E
B
(−lim
n
inf(−X
n
)) h.c.c (do (2.22))
= E
B
(lim
n
sup X
n
) h.c.c. (2.23)
Vì X
n
→ X h.c.c, lim sup
n
X
n
= lim inf
n
X
n
= X h.c.c, vậy từ (2.22), (2.23),
ta có
E
B
(X) ≤ lim
n
inf E
B
(X
n
) ≤ lim
n
sup E
B
(X
n
) ≤ E
B
(X) h.c.c. (2.24)
Từ đó
lim
n
E
B
(X
n
) = E
B
(X) h.c.c.
Nhận xét 2.11. Nếu {X
n
, n ≥ 1} là một dãy biến ngẫu nhiên khả tích đều
có điều kiện với mỗi σ-đại số B ⊂ Σ thì dãy được xây dựng trong chứng minh
Định lý 2.8 là không cần thiết. Vì bởi Định lý đó E(sup
n
|X
n
|) < ∞ luôn đúng.
Kết hợp hai điều này ta dẫn tới kết quả sau:
Định lý 2.12. Cho {X, X
n
, n ≥ 1} là một dãy các biến ngẫu nhiên khả tích
trong (Ω, Σ, P ) sao cho X
n
→ X h.c.c. Khi đó, các phát biểu sau là tương
đương:
(i) E(sup
n≥1
|X
n
|) < ∞.
(ii) E
B
(X
n
) → E
B
(X) h.c.c, với mọi σ-đại số B ⊂ Σ.
(iii) {X
n
, n ≥ 1} là khả tích đều có điều kiện với mọi σ-đại số B ⊂ Σ.
Nếu một trong các điều kiện trên được thỏa mãn thì dãy sẽ hội tụ trong L
1
(P ).
Bổ đề 2.13. Cho φ : R
+
→ R
+
là một hàm tăng sao cho
φ(x)
x
↑ ∞ khi x ↑ ∞.
Nếu {X
n
, n ≥ 1} là một tập các biến ngẫu nhiên trên (Ω, Σ, P ) sao cho X
n
→ X
22
h.c.c và E(φ(|X
n
|)) < ∞, giả sử với mỗi σ-đại số B ⊂ Σ có một hằng số C
B
sao cho E
B
(φ(|X
n
|)) ≤ C
B
< ∞ h.c.c. Khi đó E
B
(X
n
) → E
B
(X) h.c.c. Nếu
tập {C
B
: B ⊂ Σ} bị chặn thì E(sup
n
|X
n
|) < ∞.
Chứng minh. Đặt ξ(x) =
φ(x)
x
và A
m
= [|X
n
| > m]. Khi đó
E
B
(|X
n
| ·χ
A
m
) ≤
E
B
(φ(|X
n
|χ
A
m
))
ξ(m)
≤
C
B
ξ(m)
→ 0 (m → +∞) (đều theo n).
Vậy {X
n
, n ≥ 1} là khả tích đều có điều kiện với B. Nếu C
B
≤ C < ∞ với
mọi B tính khả tích đều có điều kiện đúng với mọi B. Theo Định lý 2.12 suy ra
điều phải chứng minh.
2.1.3 Kỳ vọng có điều kiện trên các không gian L
p
Định lý sau là trường hợp có điều kiện cho các bất đẳng thức cổ điển H¨older,
Minkowski và Jensen.
Định lý 2.14. Cho X, Y là các biến ngẫu nhiên trên (Ω, Σ, P ), B ⊂ Σ là một
σ-đại số. Khi đó, với p ≥ 1 ta có
(i)
E
B
(|XY |) ≤
E
B
(|X|
p
)
1/p
·
E
B
(|Y |
q
)
1/q
, h.c.c,
1
p
+
1
q
= 1. (2.25)
(ii)
E
B
(|X + Y |
p
) ≤
(E
B
|X|
p
)
1/p
+ (E
B
(|Y |
p
))
1/p
p
h.c.c. (2.26)
(iii) Nếu φ : R → R là một hàm lồi sao cho E(φ(X)) tồn tại và Y = E
B
(X)
h.c.c hoặc Y ≤ E
B
(X) h.c.c và φ tăng. Khi đó
φ(Y ) ≤ E
B
(φ(X)) h.c.c. (2.27)
Bổ đề 2.15. Với mỗi σ-đại số B ⊂ Σ, toán tử E
B
là một phép co tuyến tính
trên L
p
(Ω, Σ, P ), 1 ≤ p ≤ ∞, nghĩa là E
B
là tuyến tính và
||E
B
(X)||
p
≤ ||X||
p
, X ∈ L
p
(Ω, Σ, P ) = L
p
. (2.28)
23