Lí thuyết xác suất
1 Các khái niệm cơ bản về biến cố ngẫu nhiên
1. Không gian xác suất
Trớc hết chúng ta đa vào khái niệm một họ A các tập con nào đó của không gian các biến cố ngẫu nhiên cơ
bản đợc gọi là -đại số nếu:
1. A
2. A A suy ra \A A
3. Nếu A
1
, A
2
, là dy các tập hợp thuộc A, khi đó
i
A
i
cũng thuộc A.
Trong lí thuyết xác xuất, tập các biến cố ngẫu nhiên là một -đại số A. Một ánh xạ P từ A vào tập các số thực
R
P : A R
thoả mn các tiên đề sau:
1. Với mọi A A 0 P (A) 1
2. P () = 1
3. Nếu A
1
, A
2
, , A
i
, là các biến cố ngẫu nhiên đôi một xung khắc nhau thuộc A, khi đó
P
i
A
i
=
i
P (A
i
)
P (A) đợc gọi là xác suất của biến cố ngẫu nhiên A. Trong lí thuyết xác suất (, A, P ) đợc gọi là không
gian xác suất.
Tính chất của xác suất
(A) P () = 0.
(B) A B P(A) P (B).
(C) P (A) = 1 P (A).
(D) P (A + B) = P(A) + P(B) P(AB).
(E) P (A + B + C) = P (A) + P (B) + P(C) P(BC) P (AB) P(AC) + P(ABC).
(F) P (A
1
+ A
2
+ + A
n
) P(A
1
) + P(A
2
) + ããã + P (A
n
).
(G) Với dy các biến cố giảm dần A
1
A
2
A
3
(hoặc tăng dần A
1
A
2
), khi đó
lim
n
P (A
n
) = P( lim
n
A
n
).
2. ứng dụng để tính xác suất các biến cố ngẫu nhiên
Không gian các biến cố ngẫu nhiên cơ bản gồm n biến cố đồng khả năng
= {
1
,
2
, ,
n
}, P (
1
) = P(
2
) = = P (
n
)
Khi đó do P () = 1, suy ra P (
i
) =
1
n
với mọi i và nếu
A = {
n
1
,
n
2
, ,
n
m
} P(A) =
m
n
.
1
Ta còn nói
P (A) =
Số trờng hợp thuận lợi cho biến cố A
Số trờng hợp đồng khả năng
.
Trờng hợp không gian các biến cố ngẫu nhiên cơ bản là một miền hình học, giả thiết rằng xác suất để
biến cố ngẫu nhiên cơ bản thuộc miền A tỉ lệ với độ đo của A, khi đó
P (A) =
độ đo của A
độ đo của
.
(Độ đo ở đây đợc hiểu nh là độ dài, diện tích hoặc thể tích tùy theo đợc nhắc đến là miền hình học nào).
Bài tập 1
1. Gieo liên tiếp một xúc xắc, kí hiệu A
k
là biến cố: lần gieo thứ k là lần đầu tiên mặt 6 chấm xuất hiện.
a. Hy tính P (A
k
).
b. Tìm xác suất để mặt 6 chấm xuất hiện ở một lần gieo nào đó.
c. Hy tìm xác suất để sau một số lẻ lần gieo, mặt 6 chấm xuất hiện.
2. Một tập 10 vé trong đó có 3 vé có thởng. Chọn ngẫu nhiên 5 vé, tìm xác suất để trong đó có đúng 2 vé có
thởng.
3. Một hộp đựng 3 bi đỏ, 3 bi trắng, 3 bi xanh. Chọn ngẫu nhiên ra 6 viên bi, tìm xác suất để có đủ 3 màu
trong số 6 viên bi đợc chọn ra.
4. Chứng minh rằng
C
n
N
=
Nn+1
k=1
C
n1
Nk
(n N)
5. Một chất điểm xuất phát từ 0, lang thang ngẫu nhiên trên trục số, nó dịch chuyển sang phải hoặc sang trái 1
đơn vị với xác suất bằng
1
2
. Tìm xác suất để sau n bớc, chất điểm tới vị trí k trên trục số.
6. Bài toán gặp gỡ và bài toán gieo kim của Buffon.
3. Xác suất có điều kiện và sự độc lập của các biến cố ngẫu nhiên
Xác suất của A với điều kiện B xảy ra, kí hiệu
P (A/B) =
P (AB)
P (B)
Từ định nghĩa xác suất có điều kiện, suy ra công thức nhân xác suất
P (AB) = P (A/B)P (B)
P (A
1
A
2
ãããA
n
) = P(A
n
/A
1
A
2
ãããA
n1
)P (A
n1
/A
1
A
2
ãããA
n2
) ãããP (A
2
/A
1
)P (A
1
)
Nhận xét rằng với kí hiệu P
(A) = P (A/B) là xác suất có điều kiện của biến cố A với điều kiện B (B cố
định), khi đó (, A, P
) cũng là không gian xác suất.
Hai biến cố A và B độc lập nhau nếu
P (A/B) = P(A) P(AB) = P (A)P(B).
Các biến cố A
1
, A
2
, , A
n
độc lập, nếu với bất kì k biến cố đôi một khác nhau A
i
1
, A
i
2
, , A
i
k
k = 2, 3, n
trong dy các biến cố trên
P (A
i
1
A
i
2
ãããA
i
k
) = P(A
i
1
)P (A
i
2
) ãããP (A
i
k
)
Trong ứng dụng thực tế hệ các biến cố mà mỗi biến cố liên quan tới một phép thử ngẫu nhiên trong dy các
phép thử đợc tiến hành độc lập nhau tạo thành hệ các biến cố độc lập.
Định lí 1 (định lí xác suất đầy đủ) Nếu A
1
, A
2
, , A
n
, là hệ đầy đủ các biến cố ngẫu nhiên, A là biến cố
ngẫu nhiên bất kì, khi đó
P (A) =
i=1
P (A/A
i
)P (A
i
).
2
Bài tập 2
1. Một chất điểm xuất phát từ x = k, lang thang ngẫu nhiên trên trục số, nó dịch chuyển sang phải hoặc sang
trái 1 đơn vị với xác suất bằng
1
2
. Chất điểm dừng lại nếu nó đạt tới các vị trí hút x = 0 hoặc x = n. Tìm xác
suất để một lúc nào đó nó dịch chuyển tới trạng thái hút x = 0. (Xích Markov).
2. Rải ngẫu nhiên N viên bi vào n hộp. Với điều kiện một hộp xác định từ trớc (ví dụ hộp thứ nhất) không
rỗng, tìm xác suất để hộp đó có đúng K viên bi (K 1).
3. Một xạ thủ bắn bia, xác suất trúng bia của xạ thủ bằng p. Tìm xác suất để sau n lần bắn liên tục, lần bắn
thứ n là lần đầu tiên xạ thủ bắn trúng bia.
4. A và B chơi một trò chơi nh sau: A gieo xúc xắc, kết quả giả sử mặt k chấm xuất hiện. A gieo tiếp đồng
thời 2 đồng xu k lần. Nếu ít nhất có một lần xảy ra biến cố cả hai đồng xu cùng xuất hiện mặt ngửa, khi đó A
thắng cuộc, ngợc lại A bị thua. Hỏi trò chơi đó có lợi cho A hay B?
5. A và B chơi một trò chơi nh sau: A gieo đồng thời 2 xúc xắc. Nếu tổng bằng 7 hoặc 11, A thắng cuộc,
nếu tổng bằng 2,3 hoặc 12, A thua cuộc. Các trờng hợp còn lại, A lặp lại trò chơi cho đến khi có ngời thắng
ngời thua. Tìm xác suất để A thắng. (ĐS:
2
3
)
6. Cho n hộp, mỗi hộp chứa đúng a bi trắng và b bi đỏ. Lấy ngẫu nhiên 1 viên bi từ hộp thứ nhất và bỏ sang
hộp thứ hai, sau đó lấy tiếp 1 viên bi từ hộp thứ hai và bỏ sang hộp thứ ba, Cuối cùng lấy 1 viên bi từ hộp
thứ n. Gọi A là biến cố viên bi lấy từ hộp thứ nhất bỏ sang hộp thứ hai là viên bi trắng, B là biến cố viên bi
lấy từ hộp thứ n là viên bi trắng. Kí hiệu p
n
= P (B/A). Chứng minh rằng
p
n
=
a
a + b
+
b
a + b
(a + b + 1)
1n
.
7. Các hộp đợc đánh số 0, 1, 2, , N và hộp mang số k chứa k bi đỏ, N k bi trắng (k = 0, 1, 2, , N).
Chọn ngẫu nhiên một hộp và từ hộp này chọn lần lợt có hoàn lại từng viên bi. Gọi A
n
là là biến cố lần chọn
thứ n lấy đợc viên bi đỏ.
a. Tính P(A
3
/A
1
A
2
)
b. Giả sử từ hộp đ chọn ngẫu nhiên chọn lần lợt hai viên bi không hoàn lại. Tìm xác suất để cả hai bi đ
chọn là bi đỏ.
4. Công thức Bernoulli
Giả sử xác suất xảy ra biến cố A là p. Khi đó xác suất để trong n lần tiến hành phép thử ngẫu nhiên độc
lập nhau có đúng k lần xảy ra A bằng
P
k;n
= C
k
n
p
k
q
nk
(trong đó p + q = 1).
Bài tập 3
1. Tìm xác suất để một gia đình 5 ngời con có đúng 3 trai, 2 gái.
2. Biết xác suất để đấu thủ bóng bàn A thắng B ở mỗi séc là p. Hai đấu thủ đấu với nhau tối đa 5 séc, ngời
nào thắng trớc 3 séc là ngời thắng chung cuộc. Tìm xác suất để đấu thủ A thắng chung cuộc.
ĐS:
p Xác suất cần tìm: P (A) = p
3
(1 + 3q + 6q
2
)
0,3 0,16308
0,4 0,31744
0,5 0,5
0,6 0,68256
0,7 0,83692
2 Đại lợng ngẫu nhiên và phân bố xác suất
1. Khái niệm cơ bản
Một ánh xạ X : R trên không gian xác suất (, A, P ) thỏa mn
{ : X() < x} A với mọi x R
3
đợc gọi là đại lợng ngẫu nhiên X. Hàm
F (x) = P (X < x) với mọi x R
đợc gọi là hàm phân bố xác suất của đại lợng ngẫu nhiên X. Hiển nhiên
P (a X < b) = F (b) F(a)
Nếu tồn tại một hàm không âm f : R [0, +) sao cho hàm phân bố F(x) của đại lợng ngẫu nhiên X thoả
mn
F (b) F(a) = P (a X < b) =
b
a
f(x) dx với mọi a < b R,
khi đó hàm f đợc gọi là mật độ xác suất của đại lợng ngẫu nhiên X. Đại lợng ngẫu nhiên có hàm mật độ
đợc gọi là đại lợng ngẫu nhiên liên tục. Đặc biệt
F (x) =
x
f(x) dx với mọi x R.
Tại các điểm hàm mật độ liên tục F
(x) = f(x). Chú ý rằng đại lợng ngẫu nhiên rời rạc (đại lợng ngẫu
nhiên mà miền giá trị là tập không quá đếm đợc) không có hàm mật độ, phân bố của nó thờng đợc cho dới
dạng
p
n
= P (X = x
n
), n = 0, 1, 2, trong đó
n
p
n
= 1
hoặc dới dạng bảng
X x
1
x
2
x
n
P p
1
p
2
p
n
trong đó
n
p
n
= 1.
Tính chất hàm phân bố, hàm mật độ
1. F () = lim
x
F (x) = 0, F (+) = lim
x+
F (x) = 1.
2. Hàm phâm bố đơn điệu tăng và liên tục trái trên R.
3.
+
f(x) dx = F(+) F() = 1.
4. Với đại lợng ngẫu nhiên liên tục, xác suất để X nhận các giá trị trong một tập hữu hạn hoặc vô hạn
đếm đợc luôn bằng 0. Suy ra
P (a X < b) = P (a < b) = P(a X b) = F (b) F (a).
Bài tập 4
1. X là số lỗi in sai trong một trang sách giáo khoa NXB Giáo dục. Ngời ta biết rằng
P (X = 0) = 0.85, P (X = 1) = 0.1, P (X = 2) = 0.05
Nh vậy X là đại lợng ngẫu nhiên rời rạc nhận các giá trị 0, 1, 2 và bảng phân bố của X thờng đợc viết
dới dạng sau
X 0 1 2
P 0.85 0.1 0.05
Hàm phân bố của X khi đó bằng
F (x) =
0 nếu x 0
0.85 nếu 0 < x 1
0.95 nếu 1 < x 2
1 nếu 2 < x
2. Gọi X là số lần bắn liên tục vào bia cho đến khi trúng bia, p là xác suất trúng bia của mỗi lần bắn. Giả thiết
các lần bắn độc lập nhau, khi đó bảng phân bố của X
X
1 2 n
P p qp pq
n1
(p + q = 1)
4
3. X là điểm chọn ngẫu nhiên trên đoạn [a, b] (giả thiết rằng xác suất để X thuộc khoảng (u, v) [a, b] tỉ lệ
với độ dài đoạn [u, v]). Khi đó X là đại lợng ngẫu nhiên liên tục với hàm mật độ
f(x) =
1
ba
nếu a < x b
0 nếu x a hoặc x > b
(X đợc gọi là đại lợng ngẫu nhiên có phân bố đều trên đoạn [a, b].)
4. Nếu f(x) là hàm mật độ của X, khi đó hàm mật độ của Y = aX + b bằng
g(y) =
1
|a|
f
y b
a
5. Tìm hàm mật độ của
2
, biết phân bố đều trên đoạn [1, 1].
2. Kì vọng, phơng sai của đại lợng ngẫu nhiên
Với các đại lợng ngẫu nhiên rời rạc có phân bố
X x
1
x
2
x
n
P p
1
p
2
p
n
Kì vọng của X, kí hiệu E(X) bằng
E(X) =
i=1
x
i
p
i
nếu chuỗi hội tụ tuyệt đối.
Trờng hợp X là đại lợng ngẫu nhiên liên tục có f (x) là hàm mật độ
E(X) =
+
xf(x)dx nếu tích phân hội tụ tuyệt đối.
Chú ý rằng kì vọng là toán tử tuyến tính và
E((X)) =
+
(x)f(x)dx trong đó f (x) là hàm mật độ của X.
Phơng sai D(X) và độ lệch tiêu chuẩn
X
của X
D(X) = E(X EX)
2
= EX
2
(EX)
2
,
X
=
D(X).
Hiển nhiên phơng sai của hằng số bằng 0 và
D(X) =
2
D(X).
Bài tập 5
1. X là số trẻ sơ sinh trong một ngày ở một bệnh viện nhỏ. Biết phân bố của X
X 0 1 2 3
P 0.3 0.4 0.2 0.1
Khi đó trung bình số trẻ em mới sinh trong một ngày bằng
EX = 0 ì 0.3 + 1 ì0.4 + 2 ì0.2 + 3 ì0.1 = 1.1
2. Gọi X là số lần gieo xúc xắc liên tục cho đến khi mặt 6 chấm xuất hiện. Hy tính số lần gieo trung bình.
3. Một công việc trong xây dựng dự tính sẽ đợc hoàn thành trong khoảng thời gian từ 10 đến 14 ngày. Giả sử
X là số ngày công để hoàn thành công việc đó, phân bố của X đợc dự tính nh sau
X
10 11 12 13 14
P 0.1 0.3 0.3 0.2 0.1
E(X) = 11.9 ngày, D(X) = 1.29
5
Nhà thầu ớc lợng chi phí toàn bộ cho công trình gồm 85 triệu tiền vật liệu xây dựng và tiền nhân công là 1.6
triệu đồng một ngày công. Khi đó chi phí toàn bộ cho công trình bằng
Y = 85 + 1.5X (triệu đồng)
Vậy kì vọng hay giá trị trung bình của toàn bộ chi phí là
E(Y ) = 85 + 1.5E(X) = 85 + 1.5 ì11.9 = 102.85 (triệu đồng)
D(Y ) = 1.5
2
ì D(X) = 1.5
2
ì 1.29 = 2.9025
Y
=
2.9025 = 1.7037
4. Kì vọng và phơng sai của phân bố đều trên [a, b]
EX =
a + b
2
, DX =
(a b)
2
12
3. Các phân bố thờng gặp
1. Phân bố nhị thức
X 0 1 k n
P p
0
p
1
p
k
p
n
trong đó p
k
= P (X = k) = C
k
n
p
k
q
nk
, p + q = 1, k = 0, 1, , n
Nhận xét rằng đại lợng ngẫu nhiên có phân bố nhị thức có thể biểu diễn dới dạng
X =
n
i=1
X
i
trong đó X
i
ghi lại kết quả của việc xuất hiện hay không xuất hiện biến cố A trong dy các phép thử ngẫu
nhiên độc lập (P (A) = p)
X
i
=
1 nếu A xảy ra trong phép thử thứ i
0 nếu A không xảy ra trong phép thử thứ i
2. Phân bố Poisson
X 0 1 2 k
P p
0
p
1
p
2
p
k
trong đó
p
k
= P (X = k) = e
k
k!
, > 0, k = 0, 1, 2,
3. Phân bố hình học
X 1 2 n
P p qp q
n1
p
trong đó p + q = 1.
4. Phân bố mũ
X là đại lợng ngẫu nhiên có phân bố mũ, nếu hàm mật độ của X bằng
f(x) =
e
x
nếu x > 0
0 nếu x 0
với > 0
5. Phân bố chuẩn
X là đại lợng ngẫu nhiên có phân bố chuẩn, kí hiệu X N(m,
2
) nếu hàm mật độ của X bằng
f(x) =
1
2
e
(xm)
2
2
2
trong đó > 0, m R.
6
Sử dụng
I =
0
e
x
2
dx =
2
ta dễ dàng chứng minh hàm f(x) nói trên là hàm mật độ và
EX = m, DX =
2
.
Nhận xét rằng X N(m,
2
) khi và chỉ khi Z =
Xm
N(0, 1). Ngời ta thờng kí hiệu hàm phân bố của
X N (0, 1)
(x) =
1
2
x
e
u
2
2
du.
Tra bảng phân bố chuẩn, ta có
Quy tắc 3 Nếu X N (m,
2
), khi đó
P (m 3 X m + 3) = P (
X m
3) =
1
2
3
3
e
x
2
2
dx = 2(3) 1 = 0, 9973
3 Đại lợng ngẫu nhiên nhiều chiều
1. Hàm phân bố và hàm mật độ chung
Xét một cặp hai đại lợng ngẫu nhiên (, ). Nếu chúng ta đồng thời khảo sát hai đại lợng ngẫu nhiên
và , chúng ta sẽ coi chúng nh các toạ độ của một véc tơ ngẫu nhiên (hay một điểm ngẫu nhiên) (, ). Các
giá trị có thể có của nó là các điểm (x, y) trong mặt phẳng toạ độ xOy. Gọi tập E là một miền phẳng bất kì
E R
2
và P
,
(E) = P ((, ) E) là xác suất để điểm ngẫu nhiên (, ) ri vào tập E. Ngời ta gọi P
,
(E),
với mọi E R
2
là độ đo xác suất của các tập hợp trên mặt phẳng sinh bởi véc tơ ngẫu nhiên (, ).
Định nghĩa 1 Hàm
H(x, y) = P ( < x, < y) = P ({ (, x)} ã { (, y)})
với mọi x, y R là hàm phân bố chung của hai đại lợng ngẫu nhiên và (hay còn gọi là hàm phân bố
đồng thời của véc tơ ngẫu nhiên (, )).
Nếu tồn tại một hàm không âm h(x, y) 0 sao cho
P ((, ) E) =
E
h(x, y) dxdy
với mọi miền E của mặt phẳng. Khi đó ta nói h(x, y) là hàm mật độ của véc tơ ngẫu nhiên (, ) (hay còn gọi
là hàm mật độ chung của và ).
Đối với các đại lợng ngẫu nhiên rời rạc, thay cho hàm phân bố đồng thời H(x, y) là các xác suất
P (x
i
, y
j
) = P ( = x
i
= y
j
) (hoặc viết gọn hơn P ( = x
i
, = y
j
).)
Chúng thờng đợc viết dới dạng bảng. Để minh hoạ, ta xét ví dụ sau.
Ví dụ
Đại lợng ngẫu nhiên X đo mức độ hài lòng của ngời dân sống trong một khu chung c mới xây dựng và Y
biểu thị số năm ngời dân sống trong khu chung c đó. Giả sử mức độ hài lòng của ngời ở biểu thị qua các
giá trị X = 1, X = 2, X = 3 hoặc X = 4 (giá trị X càng lớn tơng ứng với mức hài lòng càng cao). Đại lợng
ngẫu nhiên Y nhận các giá trị 1 nếu ngời dân sống không quá 1 năm trong khu chung c đó và nhận giá trị 2
trong trờng hợp ngợc lại.
X 1 2 3 4 Tổng
Y
1 0.04 0.17 0.18 0.1 0.49
2 0.06 0.15 0.2 0.1 0.51
Tổng 0.1 0.32 0.38 0.2 1
7
Bảng phân bố trên cho biết, chẳng hạn
P (3, 2) = P(X = 3, Y = 2) = 0.2
là xác suất để khi chọn ngẫu nhiên một ngời sống ở khu chung c, ngời đó có mức hài lòng 3 và sống trên
1 năm trong khu chung c đó. Cột tổng cho phân bố của Y
P (Y = 1) = 0.49, P (Y = 2) = 0.51
Hàng tổng xác định phân bố của X
P (X = 1) = 0.1, P (X = 2) = 0.32, P(X = 3) = 0.38, P(X = 4) = 0.2
Trờng hợp tồn tại hàm mật độ chung, hiển nhiên
P ((X, Y ) E) =
E
h(x, y) dxdy với mọi tập E R
2
.
H(x, y) = P (X < x, Y < y) =
x
y
h(u, v) dudv,
2
H
xy
= h(x, y)
F (x) = H(x, +) =
x
+
h(u, v) dv
du là hàm phân bố của X.
G(y) = H(+, y) =
y
+
h(u, v) du
dv là hàm phân bố của Y.
Hàm mật độ của X, Y tơng ứng là
f(x) =
h(x, y) dy, g(y) =
h(x, y) dx
Định nghĩa 2 Các đại lợng ngẫu nhiên và đợc gọi là độc lập nhau nếu với mọi x, y R
H(x, y) = P ( < x, < y) = P ( < x)P( < y) = F (x)G(y) h(x, y) = f(x)g(y)
Định lí 2 Giả sử X, Y có hàm mật độ chung h(x, y), khi đó
E ((X, Y )) =
(x, y)h(x, y) dxdy.
Đặc biệt nếu X, Y là các đại lợng ngẫu nhiên độc lập nhau, khi đó
E(XY ) = EX ã EY, D(X + Y ) = DX + DY.
Ví dụ 1.
Giả sử hàm mật độ chung của X và Y
h(x, y) =
6
5
(x + y
2
) nếu 0 < x < 1, 0 < y < 1
0 trong trờng hợp ngợc lại
Sử dụng f(x) =
h(x, y) dy, hàm mật độ của X
f(x) =
6
5
1
0
(x + y
2
) dy =
6
5
(x +
1
3
) nếu 0 < x < 1
0 nếu x / (0, 1)
hàm mật độ của Y
g(y) =
6
5
1
0
(x + y
2
) dx =
6
5
(
1
2
+ y
2
) nếu 0 < y < 1
0 nếu y / (0, 1)
8
Ví dụ 2.
(X, Y ) phân bố đều trên hình tròn tâm (0, 1) bán kính bằng 1. Hàm mật độ chung của X và Y
h(x, y) =
1
nếu x
2
+ (y 1)
2
< 1
0 trong trờng hợp ngợc lại
Hàm mật độ Y bằng
g(y) =
h(x, y) dx =
2
2yy
2
nếu 0 < y < 2
0 nếu y / (0, 2)
E(Y ) = 1, D(Y ) =
1
4
Bài tập
1. Giả sử X và Y là hai đại lợng ngẫu nhiên độc lập có cùng phân bố chuẩn N(0, 1). Hy tìm hàm mật độ
của Z = |X|signY .
2. Chọn ngẫu nhiên 2 điểm M và N trên đoạn [0, 1], 2 điểm M, N đó chia đoạn [0, 1] thành 3 phần, gọi các
độ dài của 3 đoạn thẳng đó tơng ứng là các đại lợng ngẫu nhiên X
1
, X
2
và X
3
.
a) Hy tìm các hàm mật độ của X
1
, X
2
và X
3
.
b) Hy tính các kì vọng E(X
1
), E(X
2
) và E(X
3
).
2. Phân bố có điều kiện
Giả sử A là biến cố có xác suất P (A) > 0 và X là đại lợng ngẫu nhiên tùy ý. Ta có định nghĩa sau
Định nghĩa 3 Ngời ta gọi hàm
F (x/A) = P (X < x/A) với x
là hàm phân bố có điều kiện của X với điều kiện biến cố A xảy ra. Nếu F (x/A) khả vi, kí hiệu f(x/A) =
F
(x/A) và
F (x/A) = P (X < x/A) =
x
f(t/A) dt với x
khi đó f(x/A) đợc gọi là hàm mật độ có điều kiện của X với điều kiện biến cố A xảy ra (hoặc nói tắt là hàm
mật độ của X với điều kiện A).
Ta có nhận xét rằng nếu A
i
, i = 1, 2, là một hệ đầy đủ các biến cố. Khi đó theo công thức xác suất đầy
đủ, hàm phân bố của X có thể biểu diễn theo các hàm phân bố có điều kiện:
F (x) = P (X < x) =
i
P (X < x/A
i
)P (A
i
) =
i
F (x/A
i
)P (A
i
)
đạo hàm cả hai vế theo x, ta cũng có kết quả tơng tự cho hàm mật độ có điều kiện
f(x) =
i
f(x/A
i
)P (A
i
).
Bài tập
Mỗi ngày số ca cấp cứu tới một bệnh viện là đại lợng ngẫu nhiên N tuân theo luật Poisson với tham số .
Ngời ta phân ra hai loại cấp cứu: cấp cứu do tai nạn giao thông (loại A) và cấp cứu vì các lí do khác (loại B).
Giả thiết rằng p là xác suất để một ca cấp cứu thuộc loại A, cấp cứu do tai nạn giao thông. Kí hiệu X
A
là đại
lợng ngẫu nhiên biểu thị số ca cấp cứu thuộc loại A, X
B
là số ca cấp cứu thuộc loại B trong ngày.
1. Với k, n là hai số nguyên, hy tính P (X
A
= k/N = n).
2. Xác định luật phân bố đồng thời của (N, X
A
).
9
3. Xác định luật phân bố, kì vọng và phơng sai của X
A
.
4. Xác định luật phân bố của X
B
.
5. X
A
và X
B
có độc lập với nhau không?
Giải bài tập: N có phân bố Poisson với tham số .
P (N = n) = e
n
n!
1. Với k, n là hai số nguyên, P (X
A
= k/N = n) = C
k
n
p
k
q
nk
.
2. Xác định luật phân bố đồng thời của (N, X
A
)
P (N = n, X
A
= k) = P (X
A
= k/N = n)P (N = n) = C
k
n
p
k
q
nk
ã e
n
n!
=
=
1
k!(n k)!
e
n
p
k
q
nk
= e
(p)
k
(q)
nk
1
k!(n k)!
với n k.
3. Xác định luật phân bố, kì vọng và phơng sai của X
A
.
P (X
A
= k) =
n=k
P (X
A
= k, N = n) =
n=k
e
(p)
k
(q)
nk
1
k!(n k)!
=
= e
(p)
k
k!
n=k
(q)
nk
(n k)!
= e
(p)
k
k!
i=0
(q)
i
i!
= e
(p)
k
k!
ã e
q
= e
p
(p)
k
k!
4. Tơng tự luật phân bố của X
B
P (X
B
= i) = e
q
(q)
i
i!
5. X
A
và X
B
độc lập với nhau. Thật vậy xét P(X
A
= k, X
B
= i), kí hiệu n = k + i, khi đó
P (X
A
= k, X
B
= i) = P (X
A
= k, N = n) = e
(p)
k
(q)
nk
1
k!(n k)!
=
= e
p
(p)
k
k!
ãe
q
(q)
i
i!
= P (X
A
= k)P (X
B
= i), với mọi k, i 0.
Giả thiết (X, Y ) là véc tơ ngẫu nhiên có h(x, y) là hàm mật độ chung. Khi đó Y là đại lợng ngẫu nhiên
liên tục, hàm mật độ của Y là
g(y) =
h(x, y) dx.
Ta định nghĩa xác suất có điều kiện của biến cố {X < x} với điều kiện Y = y nh là giới hạn của P (X <
x/y Y < y + y) khi y dần tới 0. Hàm
F (x/y) = lim
y0
P (X < x/y Y < y + y)
đợc gọi là hàm phân bố có điều kiện của X với điều kiện Y = y, tất nhiên với giả thiết tồn tại giới hạn trên.
Do định nghĩa xác suất có điều kiện và tính chất của hàm phân bố chung
P (X < x/y Y < y + y) =
P (X < x, y Y < y + y)
P (y Y < y + y)
=
H(x, y + y) H(x, y)
G(y + y) G(y)
(H(x, y) là hàm phân bố chung của X và Y , G(y) là hàm phân bố của Y ). Chia cả tử và mẫu cho y, chuyển
qua giới hạn khi y 0 ta đợc
F (x/y) =
y
H(x, y)
g(y)
f(x/y) =
x
F (x/y) =
2
xy
H(x, y)
g(y)
=
h(x, y)
g(y)
.
f(x/y) đợc gọi là hàm mật độ có điều kiện của X với điều kiện Y = y.
10
Chú ý rằng các hàm mật độ có điều kiện cũng nh phân bố có điều kiện ở đây chỉ đợc xác định tại y sao
cho g(y) > 0. Tại những điểm mà g(y) = 0, hàm mật độ f(x/y) đợc xác định tùy ý (để đơn giản, tại đó
ngời ta thờng gán cho f(x/y) giá trị 0). Viết chính xác hơn, mật độ có điều kiện
f(x/y) =
h(x,y)
g(y)
nếu g(y) > 0
0 nếu g(y) = 0
Tơng tự hàm mật độ có điều kiện của Y với điều kiện X = x
g(y/x) =
h(x,y)
f(x)
nếu f(x) > 0
0 nếu f(x) = 0
Suy ra h(x, y) = f (x/y)g(y) = g(y/x)f(x). Từ đó ta nhận đợc các công thức tơng tự nh công thức xác
suất đầy đủ
f(x) =
h(x, y) dy =
f(x/y)g(y) dy
g(y) =
h(x, y) dx =
g(y/x)f(x) dx
Chú ý rằng nếu X, Y là các đại lợng ngẫu nhiên độc lập nhau khi đó các hàm mật độ có điều kiện
f(x/y) = f(x) không phụ thuộc vào y cũng nh g(y/x) = g(y) không phụ thuộc vào x.
Định lí 3 Giả sử là một song ánh
: D T D R
2
, T R
2
khả vi tại mọi điểm thuộc D. (X, Y ) là véc tơ ngẫu nhiên nhận các giá trị trong D và h(x, y) là hàm mật độ
đồng thời của véc tơ ngẫu nhiên đó. Khi đó hàm mật độ của (U, V ) = (X, Y ) bằng
g(u, v) = h
1
(u, v)
|J(u, v)|
trong đó J(u, v) là Jacobien của
1
.
Kí hiệu (x, y) =
1
(u, v), khi đó Jacobien của
1
bằng J(u, v) =
x
u
x
v
y
u
y
v
=
x
u
y
v
x
v
y
u
Nhận xét 1 Giả sử h(x, y) là hàm mật độ chung của (X, Y ). Các đại lợng ngẫu nhiên U và V đợc xác định
X = a
11
U + a
12
V
Y = a
21
U + a
22
V
Khi đó mật độ chung của (U, V ) bằng
g(u, v) = h (a
11
u + a
12
v, a
21
u + a
22
v) |det(A)|
trong đó A =
a
11
a
12
a
21
a
22
là ma trận không suy biến.
Ví dụ X và Y là hai đại lợng ngẫu nhiên độc lập thuộc N(0, 1). Khi đó = X + Y và = X Y cũng
độc lập và có cùng phân bố chuẩn ( N(0, (
2)
2
)). Thật vậy
X =
1
2
( + )
Y =
1
2
( )
|det A| =
1
2
g(u, v) =
1
2
e
(u+v)
2
8
ã
1
2
e
(uv)
2
8
ã
1
2
Suy ra
g(u, v) =
1
2
2
e
u
2
2ã2
ã
1
2
2
e
u
2
2ã2
Nhận xét 2
1. Nếu X và Y là hai đại lợng ngẫu nhiên độc lập, khi đó hàm phân bố có điều kiện của X với điều kiện
Y = y trùng với hàm phân bố của X, (không phụ thuộc vào điều kiện Y = y)
F (x/Y = y) = P (X < x/Y = y) = P (X < x) = F (x).
2. Tổng quát hơn, giả sử (x, y) là một hàm hai biến bất kì, X và Y là hai đại lợng ngẫu nhiên độc lập.
Khi đó hàm phân bố có điều kiện của (X, Y ) với điều kiện Y = y trùng với hàm phân bố của (X, y)
P ((X, Y ) < x/Y = y) = P ((X, y) < x.
11
Chẳng hạn để tính hàm mật độ của tổng hai đại lợng ngẫu nhiên độc lập X và Y , có thể suy ra từ nhận xét
trên nh sau:
Xét Z = (X, Y ) = X + Y , hàm phân bố có điều kiện của Z với điều kiện Y = y (kí hiệu H(z/y)), theo
nhận xét trên bằng hàm phân bố của (X, y)(= X + y)
H(z/y) = P(X + y < z) = F (z y)
đạo hàm hai vế theo z để xác định hàm mật độ, ta đợc mật độ có điều kiện của Z với điều kiện Y = y (kí
hiệu h(z/y))
h(z/y) = f(z y).
áp dụng công thức xác suất đầy đủ mở rộng để tính hàm mật độ của Z (kí hiệu r(z)), ta đợc
r(z) =
h(z/y)g(y) dy =
f(z y)g(y) dy.
Đây chính là công thức xác định hàm mật độ của tổng hai đại lợng ngẫu nhiên độc lập.
Hoàn toàn tơng tự ta có thể thiết lập đợc các hàm mật độ của XY và X/Y , nếu X, Y độc lập nhau. Bạn
đọc tự chứng minh các kết quả sau:
a. Hàm mật độ của XY bằng
s(z) =
1
|y|
f(
z
y
)g(y) dy
b. Hàm mật độ của
X
Y
bằng
t(z) =
|y|f(zy))g(y) dy
Chẳng hạn ta phác qua cách dẫn dắt đến kết quả a. để tính hàm mật độ của XY . Trớc tiên ta tìm hàm
phân bố có điều kiện của XY với điều kiện Y = y (xét hai trờng hợp y > 0 và y < 0). Hàm phân bố có điều
kiện đó bằng hàm phân bố của y ãX (không điều kiện), suy ra, hàm mật độ của y ãX bằng
1
|y|
f(
z
y
), vậy hàm
mật độ của XY
s(z) =
1
|y|
f(
z
y
)g(y) dy.
Bài tập
1. Giả sử X và Y là hai đại lợng ngẫu nhiên độc lập có cùng phân bố đều trên (1, 1). Hy tính hàm mật
độ của X + Y .
2. Giả sử X và Y là hai đại lợng ngẫu nhiên độc lập có cùng phân bố đều trên (a, b) (để đơn giản ta giả thiết
a, b là các số dơng 0 < a < b). Hy tính hàm mật độ của đại lợng ngẫu nhiên tích XY .
3. Giả sử X và Y là hai đại lợng ngẫu nhiên độc lập có cùng phân bố mũ với tham số . Hy tính hàm mật
độ của |X Y |.
4. Gọi X và Y là hai đại lợng ngẫu nhiên độc lập, có cùng phân bố mũ với tham số . Kí hiệu g(y/x) là
hàm mật độ của X + Y với điều kiện X = x và f(x/y) là hàm mật độ của X với điều kiện X + Y = y. Hy
xác định các hàm mật có điều kiện g(y/x) và f(x/y).
4. Khác một chút với bài tập 4, giả sử X và Y là hai đại lợng ngẫu nhiên độc lập, X có phân bố mũ với
tham số , trong khi Y có phân bố mũ với tham số à, (à = ). Kí hiệu g(y/x) là hàm mật độ của X + Y với
điều kiện X = x và f(x/y) là hàm mật độ của X với điều kiện X + Y = y. Hy xác định các hàm mật có
điều kiện g(y/x) và f(x/y).
5. Giả sử X = (X
1
, X
2
) và Y = (Y
1
, Y
2
) là hai điểm chọn ngẫu nhiên (theo phân bố đều) độc lập nhau trên
đờng tròn đơn vị:
x
2
+ y
2
= 1
Hy tìm hàm mật độ của đại lợng ngẫu nhiên
Z =
X
1
X
2
Y
1
Y
2
12
3. Kì vọng có điều kiện
Giả sử A là biến cố có xác suất P(A) > 0 và X là đại lợng ngẫu nhiên tùy ý. Tơng tự nh định nghĩa
kì vọng của đại lợng ngẫu nhiên, ta có định nghĩa sau
Định nghĩa 4 Nếu X là đại lợng ngẫu nhiên rời rạc chỉ nhận các giá trị x
i
, i = 1, 2, , khi đó
E(X/A) =
i
x
i
P (X = x
i
/A)
đợc gọi là kì vọng có điều kiện của X với điều kiện biến cố A xảy ra.
Trờng hợp X là đại lợng ngẫu nhiên liên tục với f (x/A) là hàm mật độ có điều kiện, khi đó
E(X/A) =
xf(x/A) dx
đợc gọi là kì vọng có điều kiện của X với điều kiện biến cố A xảy ra.
Nếu X và Y là hai đại lợng ngẫu nhiên liên tục với f (x) và g(x) là các hàm mật độ của chúng. Gọi
f(x/y) là hàm mật độ có điều kiện của X với điều kiện Y = y Kì vọng của X với điều kiện Y = y, đợc kí
hiệu E(X/Y = y) là tích phân
E(X/Y = y) =
xf(x/y) dx,
nếu tích phân tồn tại và hội tụ tuyệt đối.
Định lí 4 Giả thiết rằng X và Y là hai đại lợng ngẫu nhiên liên tục, tồn tại kì vọng có điều kiện của X đối
với Y , khi đó
E(X) = E(E(X/Y )).
Chứng minh
Kí hiệu h(y) = E(X/Y = y) (ngời ta gọi h(y) là hàm hồi quy của X với điều kiện Y = y)
E(h(Y )) =
h(y)g(y) dy =
E(X/Y = y)g(y) dy =
=
xf(x/y) dx
g(y) dy =
x
f(x/y)g(y)dy
dx
Mặt khác f(x) =
f(x/y)g(y) dy nên
E(h(Y )) = E(E(X/Y )) =
xf(x) dx = E(X) đ.p.c.m.
4. Tơng quan và hệ số tơng quan
Định nghĩa 5 Nếu X và Y là hai đại lợng ngẫu nhiên tồn tại kì vọng E(X) và E(Y ), khi đó
cov(X, Y ) = E[(X E(X))(Y E(Y ))]
đợc gọi là covarian (hay còn gọi là mô men tơng quan) của X và Y .
Hiển nhiên nếu X và Y độc lập , khi đó
cov(X, Y ) = E[(X E(X))(Y E(Y ))] = E(X E(X)) ãE(Y E(Y )) = 0
13
Trờng hợp X = Y , khi đó covarian cov(X, X) = D(X).
Mô men tơng quan của hai đại lợng ngẫu nhiên có các tính chất sau
i) cov(X, Y ) = E[(X E(X))(Y E(Y ))] = E(XY ) E(X)E(Y )
ii) cov(X, Y ) = cov(X, Y ) = cov(X, Y )
iii) Kí hiệu
x
=
D(X) và
y
=
D(Y ) là các độ lệch tiêu chuẩn của X và Y . Khi đó
|cov(X, Y )|
x
y
.
Thật vậy xét
E[(Y tX)
2
] = E(Y
2
2tXY + t
2
Y
2
) = E(Y
2
) 2E(XY )t + E(Y
2
)t
2
0 với mọi t.
Đây là tam thức bậc hai không âm với mọi t, suy ra
[E(XY )]
2
E(X
2
)E(Y
2
)hay |E(XY )|
E(X
2
)
E(Y
2
)
áp dụng bất đẳng thức trên với X E(X) và Y E(Y ) thay cho X và Y
|cov(X, Y )| = |E[(X E(X))(Y E(Y ))]|
D(X)
D(X) =
x
y
.
Nhận xét rằng từ chứng minh trên suy ra
|cov(X, Y )| =
x
y
Y là một hàm bậc nhất của X : Y = aX + b.
Định nghĩa 6
(X, Y ) =
cov(X, Y )
x
y
=
E[(X E(X))(Y E(Y ))]
D(X)
D(X)
đợc gọi là hệ số tơng quan của X và Y .
Hiển nhiên hệ số tơng quan có các tính chất
i) 1 (X, Y ) 1. Dấu bằng xảy ra khi và chỉ khi Y = aX + b (hoặc X = aY + b)
ii) Nếu X và Y độc lập, khi đó hệ số tơng quan (X, Y ) = 0
Hệ số tơng quan đo mức độ phụ thuộc tuyến tính giữa Y và X. Nếu |(X, Y )| xấp xỉ 1 khi đó các điểm
ngẫu nhiên (X, Y ) gần nh tạo thành một đờng thẳng trên mặt phẳng toạ độ. Khi (X, Y ) = 0 ta nói X và
Y không tơng quan. Chú ý rằng nếu X và Y độc lập khi đó chúng không tơng quan, ngợc lại từ sự không
tơng quan của X và Y không suy ra chúng độc lập với nhau.
Định nghĩa 7 Kí hiệu c = cov(X, Y ) là mô men tơng quan của X và Y . Khi đó ma trận
C =
D(X) c
c D(Y )
đợc gọi là ma trận covarian (ma trận tơng quan) của X và Y .
Duy trì các kí hiệu
x
,
y
là các độ lệch tiêu chuẩn của X và Y , là hệ số tơng quan của X và Y . Từ
định nghĩa hệ số tơng quan suy ra c =
x
y
. Khi đó ma trận covarian có thể viết dới dạng
C =
2
x
x
y
x
y
2
y
Do || 1 nên
det(C) =
2
x
x
y
x
y
2
y
= (1
2
)
2
x
2
x
0
Phơng sai của đại lợng ngẫu nhiên cho ta biết độ lệch đại lợng ngẫu nhiên và giá trị trung bình của đại
lợng ngẫu nhiên đó. Ma trận các hệ số tơng quan cũng đóng vai trò tơng tự nh phơng sai khi xét độ dao
động của véc tơ ngẫu nhiên.
Giả sử d là đờng thẳng đi qua (EX, EY ) (giá trị trung bình của véc tơ ngẫu nhiên (X, Y )) và
n (, ) là
véc tơ đơn vị chỉ phơng của d. Gọi
Z = (X EX) + (Y EY )
14
là hình chiếu vuông góc của (X EX, Y EY ) lên đờng thẳng d. Phơng sai của Z sẽ đợc tính thông qua
ma trận covarian C nh sau
D(Z) =
2
E(X EX)
2
+
2
(Y EY )
2
+ 2E(X EX)E(Y EY ) =
=
2
2
x
+
2
2
y
+ 2
x
y
Nhận xét rằng phơng sai của Z là dạng toàn phơng với ma trận covarian C là ma trận của dạng toàn phơng
đó. Do det(C) 0, nói chung C là ma trận bán xác định dơng. Nếu X và Y độc lập tuyến tính (|| < 1),
khi đó C là ma trận xác định dơng thực sự.
Nhận xét 3 Sử dụng các phép toán đối với ma trận, ta có thể mở rộng khái niệm ma trận covarian cho nhiều
đại lợng ngẫu nhiên
X
i
, E(X
i
) = m
i
, cov(X
i
, X
j
) =
ij
, i, j = 1, 2, , n
Khi đó ma trận covarian của (X
1
, X
2
, , X
n
) là
C(X) =
11
12
ããã
1n
21
22
ããã
2n
ããã ããã
n1
n2
ããã
nn
Giả sử a
i
, i = 1, 2, n là các số thực bất kì. Khi đó
D(
n
i=1
a
i
X
i
) = E
n
i=1
a
i
(X
i
m
i
)
2
=
=
i
j
a
i
a
j
ij
Tơng tự
cov(
n
i=1
a
i
X
i
,
n
i=1
b
i
X
i
) =
i
j
a
i
b
j
ij
Kí hiệu A,B,X,M là các véc tơ cột với các thành phần a
i
, b
i
, X
i
, m
i
tơng ứng. C(X) là ma trận covarian của
X. Từ các đẳng thức trên suy ra
E(A
T
X) = A
T
E(X) = A
T
M
D(A
T
X) = A
T
C(X)A
cov(A
T
X, B
T
X) = A
T
C(X)B = B
T
C(X)A.
4 Hàm đặc trng
1. Đại lợng ngẫu nhiên phức
Trong lí thuyết xác suất ngời ta sử dụng hàm đặc trng nh là một công cụ quan trọng để chứng minh các
định lí giới hạn, để nghiên cứu các đặc trng số của đại lợng ngẫu nhiên nh: kì vọng, phơng sai Trớc
khi dẫn vào khái niệm hàm đặc trng, ta cần tìm hiểu một chút về đại lợng ngẫu nhiên phức.
Gọi và là hai đại lợng ngẫu nhiên, khi đó = + i đợc gọi là đại lợng ngẫu nhiên phức. Nó thực
chất là một hàm với giá trị phức đợc xác định trên không gian các biến cố ngẫu nhiên cơ bản . Kì vọng và
phơng sai của đợc xác đụnh nh sau
E() = E() + iE()
D() = E(| E()|
2
)
Hai đại lợng ngẫu nhiên phức
1
=
1
+ i
2
và
2
=
2
+ i
2
độc lập nhau nếu các véctơ ngẫu nhiên (
1
,
1
)
và (
2
,
2
) độc lập nhau. Sự độc lập của nhiều đại lợng ngẫu nhiên phức cũng là sự độc lập của các đại lợng
ngẫu nhiên 2 chiều. Dễ dàng chứng minh đợc khi đó
E(
1
2
) = E(
1
) + E(
2
)
D(
1
+
2
) = D(
1
) + D(
2
)
15
Kết quả này cũng mở rộng cho trờng hợp nhiều hơn hai đại lợng ngẫu nhiên độc lập.
2. Hàm đặc trng và các tính chất của hàm đặc trng
Hàm đặc trng của đại lợng ngẫu nhiên đợc xác định trên R
(t) = E(e
it
) = E(cos t) + iE(sin t)
Trờng hợp là đại lợng ngẫu nhiên rời rạc
x
1
x
2
x
n
P p
1
p
2
p
n
khi đó
(t) =
+
n=1
p
n
cos tx
n
+ i
+
n=1
p
n
sin tx
n
=
+
n=1
p
n
e
itx
n
.
Nếu là đại lợng ngẫu nhiên liên tục với f(x) là hàm mật độ, hàm đặc trng của
(t) =
+
f(x) cos tx dx + i
+
f(x) sin tx dx =
+
f(x)e
itx
dx.
Hàm đặc trng luôn luôn tồn tại và chúng có các tính chất sau
1. Giá trị hàm đặc trng tại t = 0 luôn bằng 1, (0) = 1 và |(t)| 1 với mọi t R.
Thật vậy, (0) = 1 là hiển nhiên. áp dụng bất đẳng thức E
2
(X) E(X
2
) với bất kì X
|(t)|
2
= E
2
(cos t) + E
2
(sin t) E(cos
2
t) + E(sin
2
t) = 1.
2. Với mọi t R
(t) = E(e
it
) = E(cos(t)) + iE(sin(t)) = (t).
Nếu có phân bố xác suất đối xứng qua 0 (hay hàm phân bố của và trùng nhau), khi đó hàm đặc
trng của nhận các giá trị thực và (t) là hàm chẵn.
3. Với các số thực bất kì a và b, hàm đặc trng của đại lợng ngẫu nhiên X = a + b bằng
E(itX) = e
ibt
(at).
4. Hàm đặc trng (t) liên tục đều trên toàn bộ R.
Chọn > 0 tùy ý. Kí hiệu A
là biến cố || > sao cho P(A
) = P(|| > ) <
3
. Khi đó
(t) = E(e
it
/A
)P (A
) + E(e
it
/A
)P (A
). Suy ra
|(t) E(e
it
/A
)P (A
)| = |E(e
it
/A
)P (A
)| 1 ã|P (A
)|
3
Từ đây ta suy ra
|(t
1
) (t
2
)| E(|e
it
1
e
it
2
|/A
)P (A
) +
2
3
E(|(t
1
t
2
)|/A
) +
2
3
Do E(|(t
1
t
2
)|/A
) |t
1
t
2
| nên |(t
1
) (t
2
)| nếu |t
1
t
2
| < =
3
.
5. Hàm đặc trng có tính chất đặc biệt quan trọng sau đây: Giả sử
1
,
2
, ,
n
là các đại lợng ngẫu nhiên
hoàn toàn độc lập, khi đó hàm đặc trng của tổng X =
1
+
2
+ ããã
n
bằng
X
(t) =
n
i=1
i
(t)
Do nhận xét sự độc lập của nhiều đại lợng ngẫu nhiên phức cũng là sự độc lập của các đại lợng ngẫu
nhiên nhiều chiều, nên kết quả trên đợc suy ra từ định lí kì vọng của tích các đại lợng ngẫu nhiên độc
lập bằng tích các kì vọng.
16
6. Nếu tồn tại các môment cấp k, (k = 1, 2, , n) của , khi đó hàm đặc trng
(t) khả vi cầp n và
(k)
(0) = i
k
E(
k
) (k = 1, 2, , n).
Theo giả thiết
+
f(x)|x|dx tồn tại và hữu hạn nên
+
xe
itx
f(x) dx hội tụ đều theo t, suy ra
(t) =
+
ixe
itx
f(x) dx
(0) = i
+
xf(x) dx = iE()
Lập luận tơng tự với k = 2, , n.
7. Ta công nhận kết quả rất mạnh sau đây của hàm đặc trng: Các hàm phân bố đợc xác định duy nhất
bởi hàm đặc trng của nó. Ngoài ra nếu giả thiết tích phân
+
|(t)|dt < + khi đó hàm mật độ
f(x) liên tục, và
f(x) =
1
2
+
(t)e
itx
dt
8. Cho một dy các hàm phân bố F(x), F
1
(x), F
1
(x), cùng với các hàm đặc trng tơng ứng (t),
1
(t),
2
(t),
Điều kiện cần và đủ để
lim
n
F
n
(x) = F(x) tại mọi điểm liên tục của F (x)
là, với mọi số thực t R
lim
n
n
(t) = (t).
Bài tập 6
1. Hàm đặc trng của
k
(k = 1, 2, , n) phân bố theo luật 0, 1
E(e
it
k
) = e
it
(1 p) + e
it
p = 1 + p(e
it
1)
Suy ra hàm đặc trng của phân bố nhị thức =
n
i=1
i
(do là tổng của các đại lợng ngẫu nhiên
độc lập
i
)
(t) = E(e
it
) = (1 + p(e
it
1))
n
2. Hàm đặc trng của phân bố Poisson
(t) =
k=0
e
itk
e
k
k!
= e
k=0
(e
it
)
k
k!
= e
(e
it
1)
3. Hàm đặc trng của phân bố mũ
(t) =
+
0
e
x(it)
dx =
1
1
it
4. Hàm đặc trng của phân bố đều trên (1, 1)
(t) =
1
2
1
1
e
itx
dx =
sin t
t
Chú ý rằng tơng tự nh hàm đặc trng của đại lợng ngẫu nhiên với f (x) là hàm mật độ, ngời ta còn
đa vào một hàm khác đợc định nghĩa nh sau
G(t) = E(e
t
) =
+
e
tx
f(x) dx
Khác với hàm hàm đặc trng, hàm G(t) không phải luôn luôn tồn tại. Đối với phân bố chuẩn N (0, 1)
G(t) =
1
2
+
e
tx
e
x
2
2
dx =
1
2
+
e
(xt)
2
2
+
t
2
2
dx =
1
2
+
e
(xt)
2
2
e
t
2
2
dx = e
t
2
2
Sử dụng nó ta có thể tính hàm đặc trng của phân bố chuẩn
17
5. Hàm đặc trng của phân bố chuẩn N(0, 1)
(t) = G(it) = e
(it)
2
2
= e
t
2
2
6. Sử dụng tính chất 3. hàm đặc trng của phân bố chuẩn N (m,
2
)
(t) = e
imt
2
t
2
2
7. Hàm đặc trng của phân bố
2
n
=
2
1
+
2
2
+ ããã +
2
n
. Đây là tổng của n đại lợng ngẫu nhiên độc lập
có cùng phân bố
2
với một bậc tự do. Ta đ biết rằng hàm mật độ của mỗi số hạng bằng
h(x) =
1
2x
e
x
2
nếu x > 0,
0 nếu x < 0
Hàm đặc trng của
2
1
bằng
2
k
(t) =
0
e
itx
1
2x
e
x
2
dx =
0
1
2x
e
x
2
(12it)
dx =
=
0
2
e
u
2
2
(12it)
du =
1
1 2it
Vậy hàm đặc trng của phân bố
2
n
với n bậc tự do
(t) = (1 2it)
n
2
Chú ý rằng từ tính chất 6. có thể tính kì vọng, phơng sai và môment các cấp của các đại lợng ngẫu nhiên
dựa vào hàm đặc trung của các đại lợng ngẫu nhiên đó. Chẳng hạn phơng sai của đại lợng ngẫu nhiên phân
bố
2
n
với n bậc tự do bằng:
(0) n
2
= 2n.
Bài tập 1. Các hàm nào là hàm đặc trng trong số các hàm sau
a) (t) =
1
1+t
2
Xét hàm mật độ f(x) =
e
|x|
2
. Hàm đặc trng của phân bố đó bằng (t) =
1
1+t
2
. Nếu áp dụng tích phân
trong tính chất 7.
e
|x|
2
=
1
2
+
1
1 + t
2
e
itx
dt e
|u|
=
+
1
(1 + x
2
)
e
iux
dx
Vậy (t) = e
|t|
là hàm đặc trng của phân bố Cauchy.
b) (t) = e
t
4
không là hàm đặc trng.
Do
(0) = 0 suy ra D() = 0, vô lí.
c) (t) = sin t không là hàm đặc trng.
d) (t) = cos t là hàm đặc trng của với phân bố của : P( = 1) = P( = 1) =
1
2
.
e) (t) =
1
2
(1 + cos t) là hàm đặc trng của với phân bố của : P ( = 1) = P ( = 1) =
1
4
,
P ( = 0) =
1
2
.
f) Tìm hàm đặc trng của đại lợng ngẫu nhiên có hàm mật độ f(x) = 1 |x|, với |x| 1
(t) =
1
1
e
itx
(1 |x|)dx =
2
t
sin
t
2
2
Ta cũng có thể đạt đợc kết quả trên bằng cách chứng minh f(x) = 1 |x| là hàm mật độ của tổng hai
đại lợng ngẫu nhiên độc lập phân bố đều trên đoạn [
1
2
,
1
2
].
18
Bài tập 2. Chứng tỏ rằng nếu (t) là hàm đặc trng, khi đó
1
2(t)
cũng là hàm đặc trng.
Giả sử
1
,
2
, là dy các đại lợng ngẫu nhiên độc lập cùng có (t) là hàm đặc trng. Gọi là đại lợng
ngẫu nhiên độc lập với dy trên và
P ( = n) =
1
2
n+1
(n = 0, 1, ).
Xét
=
1
+
2
+ ããã+
nếu > 0,
0 nếu = 0
áp dụng định lí kì vọng đầy đủ
(t) = E(e
it
) =
n=0
E(e
it
/{ = n})P( = n) =
n=0
((t))
n
2
n+1
=
1
2 (t)
Bài tập 3. Chứng minh rằng tổng của hai đại lợng ngẫu nhiên độc lập có phân bố chuẩn (với các tham số tùy
ý) cũng là đại lợng ngẫu nhiên có phân bố chuẩn.
Thật vậy hàm đặc trng của tổng hai đại lợng ngẫu nhiên độc lập có dạng hàm đặc trng của phân bố
chuẩn
1
(t)
2
(t) = e
im
1
t
2
1
t
2
2
e
im
2
t
2
2
t
2
2
= e
i(m
1
+m
2
)t(
2
1
+
2
1
)
t
2
2
.
5 Luật số lớn và định lí giới hạn trung tâm
1. Các dạng hội tụ và khái niệm về luật số lớn
Sự ổn định dần của tần suất tới xác suất của biến cố A chính là dạng đơn giản nhất của luật số lớn. Ngời ta
gọi chung các quy luật khẳng định sự hội tụ tới hằng số C của trung bình cộng của dy n đại lợng ngẫu nhiên
Y
1
+ Y
2
+ ããã+ Y
n
n
C khi n
là luật số lớn.
Định nghĩa 8 Cho dy Y
n
, n = 1, 2, các đại lợng ngẫu nhiên. Ta nói Y
n
hội tụ theo xác suất tới đại
lợng ngẫu nhiên Y , kí hiệu Y
n
P
Y , nếu với bất kì > 0
lim
n
P (|Y
n
Y | > ) = 0.
Ta nói dy các đại lợng ngẫu nhiên X
n
, n = 1, 2, hội tụ hầu chắc chắn tới X, kí hiệu X
n
h.c.c
X, nếu
P ( lim
n
X
n
= X) = 1.
Ta có thể chứng minh hội tụ hầu chắc chắn kéo theo hội tụ theo xác suất. Điều ngợc lại nói chung không
đúng. Thật vậy
{ : X
n
X} =
k=1
n=1
m=n
|X
m
X| <
1
k
Giả sử X
n
h.c.c
X, suy ra với mọi > 0
P
n=1
m=n
{|X
m
X| < }
= lim
n
P
m=n
{|X
m
X| < }
= 1.
Do vậy
lim
n
P (|X
m
X| < ) = 1 hay X
n
P
X.
Nhận xét rằng X
n
h.c.c
X tơng đơng với
lim
n
P
m=n
{|X
m
X| < }
= 1 với mọi > 0 sup
mn
|X
m
X|
P
0.
19
Định lí 5 (Trêbsép) Giả sử X là đại lợng ngẫu nhiên tồn tại kì vọng m = E(X) và phơng sai
2
= D(X).
Khi đó với mọi > 0 ta có:
P (|X m| )
2
2
Chứng minh Với đại lợng ngẫu nhiên không âm Y , ta biết rằng P(Y )
E(Y )
. Do đó
P (|X m| ) = P (|X m|
2
2
)
E(|X m|
2
)
2
=
2
2
.
2. Luật số lớn và định lí giới hạn trung tâm
Bây giờ ta phát biểu và chứng minh định lí sau về luật số lớn
Định lí 6 (Luật yếu số lớn) Giả sử X
1
, X
2
, là các đại lợng ngẫu nhiên độc lập có cùng kì vọng và phơng
sai
E(X
i
) = m, D(X
i
) =
2
, i = 1, 2,
Khi đó
X
1
+X
2
+ +X
n
n
hội tụ theo xác suất tới m
X
1
+ X
2
+ + X
n
n
P
m
Chứng minh Ta có
E
X
1
+ X
2
+ + X
n
n
= m, D
X
1
+ X
2
+ + X
n
n
=
2
n
áp dụng định lí Trêbsép ta đợc đ.p.c.m.
P
X
1
+ X
2
+ + X
n
n
m
>
2
n
2
.
Nhận xét rằng định lí trên vẫn đúng nếu ta thay giả thiết sự độc lập bằng sự không tơng quan của các đại
lợng ngẫu nhiên X
1
, X
2
,
Cuối cùng ta phát biểu, không chứng minh định lí sau của Kolgomorov
Định lí 7 (Luật mạnh số lớn) Giả sử X
1
, X
2
, là các đại lợng ngẫu nhiên độc lập có cùng hàm phân bố.
Khi đó điều kiện cần và đủ để
X
1
+X
2
+ +X
n
n
hội tụ hầu chắc chắn tới à
X
1
+ X
2
+ + X
n
n
h.c.c
à
là tồn tại kì vọng E(X
i
) và E(X
i
) = à.
Sử dụng các kết quả về hàm đặc trng ta có thể chứng minh định lí giới hạn sau
Định lí 8 Cho một dy các đại lợng ngẫu nhiên độc lập cùng phân bố X
1
, X
2
, X
3
, , X
n
, với E(X
k
) =
m, D(X
k
) =
2
với mọi k = 1, 2, Khi đó
lim
n
P
X
1
+ X
2
+ ããã+ X
n
nm
n
< x
=
1
2
x
e
u
2
2
du
Chứng minh Kí hiệu (t) là hàm đặc trng của X
k
m, khi đó hàm đặc trng của
X
k
m
n
bằng
t
n
. ứng
dụng tính chất 6 của hàm đặc trng và khai triển Taylo đến cấp 2
t
n
= 1
t
2
2n
+ o
1
n
Do tính độc lập của X
1
, X
2
, , X
n
hàm đặc trng của
X
1
+X
2
+ããã+X
n
nm
n
bằng
t
n
n
. Suy ra
lim
n
ã
t
n
n
= lim
n
ã
1
t
2
2n
+ o
1
n
n
= e
t
2
2
.
20
Đây chính là hàm đặc trng của phân bố chuẩn thuộc lớp N(0, 1), từ tính chất cuối cùng của hàm đặc trng,
suy ra điều phải chứng minh.
Đặc biệt khi X có phân bố nhị thức
P (X = k) = C
k
n
p
k
q
nk
, 0 < p < 1, q = 1 p, 0 k n,
ngời ta chứng minh đợc rằng
P (A X B)
B np +
1
2
npq
A np
1
2
npq
.
((.) là hàm phân bố chuẩn thuộc lớp N(0, 1))
Công thức này còn đợc gọi là định lí Moivre-Laplace.
Ví dụ Tỉ lệ học sinh giỏi trong một trờng phổ thông bằng 25%.
1. Tìm xác suất để khi chọn ngẫu nhiên 100 em, số học sinh giỏi dao động từ 10 đến 20.
2. Hy tìm xác suất để khi chọn ngẫu nhiên 500 em, số học sinh giỏi không ít hơn 120 em.
Giải:
1. Gọi X là số học sinh giỏi trong số 100 em chọn ra, X có phân bố nhị thức với p =0,25 n = 100.
P (X = k) = C
k
n
p
k
q
nk
= C
k
100
(0, 25)
k
(0, 75)
100k
trong đó 0 k 100. Suy ra xác suất cần tìm
P (10 X 20) =
20
k=10
C
k
100
(0, 25)
k
(0, 75)
100k
.
Để tính gần đúng xác suất trên, áp dụng công thức Moivre-Laplace
P (10 X 20) (b) (a).
trong đó
a =
10 100 ã0, 25
1
2
100 ã0, 25 ã0, 75
= 3, 58 và (a) = (3, 58) = 0, 000172
b =
20 100 ã0, 25 +
1
2
100 ã0, 25 ã0, 75
= 1, 04 và (b) = (1, 04) = 0, 14917
Vậy
P (10 X 20) 0, 14917 0, 000172 = 0, 148998.
2. Tơng tự nh phần 1, xác suất cần tìm xấp xỉ
1 (
120 500 ã0, 25 +
1
2
500 ã0, 25 ã0, 75
) = 1 (0, 465) = 1 0, 32 = 0, 68.
Chú ý rằng nếu X có phân bố nhị thức mà n khá lớn và p đủ nhỏ, cùng với giả thiết lim
n
np = > 0, khi
đó các số hạng của phân bố nhị thức tiến dần tới các số hạng tơng ứng của phân bố Poisson
lim
n
C
k
n
p
k
(1 p)
nk
= e
k
k!
.
Nói cách khác trong trờng hợp này
C
k
n
p
k
(1 p)
nk
=
e
np
(np)
k
k!
.
21
Ví dụ Tỉ lệ phế phẩm ở một công ty may mặc bằng 1,2%. Hy tìm xác suất để trong một lô hàng 500 chiếc
áo sơ mi, số áo bị lỗi không vợt quá 11 chiếc.
p = 0.012 khá nhỏ, áp dụng công thức gần đúng nêu trên
P (X 11)
11
k=0
e
np
(np)
k
k!
= 0, 98.
Ta có thể minh họa sự xấp xỉ của phân bố nhị thức với phân bố Poisson tơng ứng trong trờng hợp
p =
1
32
, n = 64.
bằng bảng so sánh dới đây
Phân bố nhị thức Phân bố Poisson
k C
k
n
p
k
(1 p)
nk
e
np
(np)
k
k!
0 0,131 0,135
1 0,271 0,271
2 0,275 0,271
3 0,183 0,180
4 0,090 0,090
5 0,035 0,036
6 0,011 0,012
7 0,003 0,003
8 0,001 0,001
9 0,000 0,000
(Các kết quả trên đợc tính bằng Mathematica 4.0)
22
Thống kê toán
1 Mẫu ngẫu nhiên và phân bố mẫu
Xét một mẫu ngẫu nhiên
(X
1
, X
2
, , X
n
)
tơng ứng với đại lợng ngẫu nhiên X
E(X) = m, D(X) =
2
.
Gọi là đại lợng ngẫu nhiên:
P ( = x
i
) =
1
n
với mọi i = 1, 2, , n.
Khi đó E(), D() đợc gọi là các đặc trng mẫu. Ngời ta kí hiệu X = E() là kì vọng mẫu và S
2
= D()
là phơng sai mẫu. Hiển nhiên
X =
X
1
+ X
2
+ + X
n
n
=
1
n
n
i=1
X
i
và
S
2
=
1
n
n
i=1
(X
i
X)
2
=
1
n
n
i=1
X
2
i
X
2
.
E(X) =
1
n
n
i=1
E(X
i
) = m, D(X) =
1
n
2
n
i=1
D(X
i
) =
2
n
.
Để tính kì vọng của phơng sai mẫu, ta sử dụng
1
n
n
i=1
(X
i
X)
2
=
1
n
n
i=1
X
2
i
X
2
.
Suy ra
E(S
2
) =
1
n
E
n
i=1
(X
i
X)
2
=
1
n
n
i=1
E(X
2
i
) E(X
2
) =
=
1
n
n
i=1
(m
2
+
2
)
m
2
+
2
n
=
n 1
n
2
.
Kí hiệu
S
2
=
n
n 1
S
2
=
1
n 1
n
i=1
(X
i
X)
2
.
Khi đó
E(S
2
) =
n
n 1
ã
n 1
n
2
=
2
.
S
2
đợc gọi là là phơng sai mẫu điều chỉnh.
E(X) = m = E(X), E(S
2
) =
2
= D(X),
Nhận xét 4
1. X không những hội tụ theo xác suất mà hội tụ hầu chắc chắn tới m = E(X).
2. S
2
, S
2
hội tụ hầu chắc chắn (suy ra cũng hội tụ theo xác suất) tới
2
khi n .
23
2 Các hàm phân bố thờng gặp trong thống kê
Hàm Gamma, Beta và tính chất hàm Gamma, Beta
A. Tích phân sau hội tụ với mọi x > 0, y > 0
(x) =
+
0
e
t
t
x1
dt, B(x, y) =
1
0
t
x1
(1 t)
y1
dt.
Tách (x) thành hai tích phân
(x) =
+
0
e
t
t
x1
dt =
1
0
e
t
t
x1
dt +
+
1
e
t
t
x1
dt = I
1
+ I
2
.
Tích phân I
1
hội tụ vì với 0 < x < 1, 0 < t 1, ta có e
t
t
x1
<
1
t
1x
.
Tích phân I
2
hội tụ vì lim
t+
e
t
t
x+1
= 0, suy ra với t đủ lớn e
t
t
x1
<
1
t
2
.
B. Tích phân sau hội tụ với mọi x > 0, y > 0.
B(x, y) =
1
0
t
x1
(1 t)
y1
dt.
Tách (x) thành hai tích phân
B(x, y) =
1
0
t
x1
(1 t)
y1
dt =
c
0
t
x1
(1 t)
y1
dt +
1
c
t
x1
(1 t)
y1
dt.
1. (1) = 1.
2. (x + 1) = x(x). Thật vậy với x > 0, xét
(x + 1) =
+
0
e
t
t
x
dt =
+
0
t
x
de
t
= t
x
e
t
|
+
0
+
+
0
xt
x1
e
t
dt = x(x)
3. lim
x0+
(x) = lim
x0+
(x+1)
x
= +.
4. Với x k > 0, k là số tự nhiên bất kì
(x) = (x 1)(x 2) ããã(x k)(x k) suy ra (n) = (n 1)!
5. Chú ý rằng (
1
2
) =
, suy ra
(n +
1
2
) =
1 ã3 ããã(2n 1)
2
n
=
(2n 1)!!
2
n
6. Ta công nhận kết quả sau đúng với mọi số thực x > 0, y > 0
B(x, y) =
(x)(y)
(x + y)
.
Phân bố Gamma, Beta
1. Nếu X
i
N(m
i
,
2
i
), i = 1, 2, , n độc lập, khi đó trung bình mẫu
X =
X
1
+ X
2
+ ããã+ X
n
n
N(m,
2
)
trong đó
m =
m
1
+ m
2
+ ããã+ m
n
n
,
2
i
=
2
1
+
2
2
+ ããã+
2
n
n
.
24
2. Phân bố của Y = X
2
với X N (m,
2
). Hàm mật độ của Y
g(y) = (2
2y)
1
e
(y+m
2
)
2
2
e
m
y
2
+ e
m
y
2
.
Nếu m = 0
g(y) =
1
2
2
e
y
2
2
y
1
2
.
Phân bố của Y = X
2
là trờng hợp đặc biệt của phân bố Gamma: G(y, , p) = const ãe
y
y
p1
.
3. Phân bố Gamma là phân bố có hàm mật độ
G(x, , p) =
p
(p)
ãe
x
x
p1
, > 0, p > 0, x > 0.
Mô men cấp k của phân bố Gamma
m
k
=
+
0
x
k
p
(p)
ãe
x
x
p1
dx =
+
0
p
(p)
ãe
x
x
k+p1
dx =
(p + k)
k
(p)
.
Vì vậy kì vọng và phơng sai của phân bố Gamma lần lợt bằng
m =
p
,
2
= m
2
m
2
1
=
(p + 2)
2
(p)
p
2
2
=
p
2
. (1)
Bài tập Giả sử X phân bố đều trên đoạn [0, 1]. Chứng minh rằng Y = ln X có phân bố Gamma với
các tham số = 1, p = 1.
4. Phân bố Beta là phân bố có hàm mật độ
B(x, , ) = [B(, )]
1
ãx
1
(1 x)
1
=
( + )
()()
ã x
1
(1 x)
1
, 0 < x < 1.
Đặc biệt B(x, 1, 1) = x là hàm mật độ của phân bố đều trên đoạn [0, 1].
Bài tập 1. Hy tính các mô men cấp k của phân bố Beta. (
B(+k,)
B(,)
).
Từ đó suy ra kì vọng và phơng sai của nó. (m =
+
,
2
=
(+)
2
(++1)
).
Bài tập 2. Giả sử X và Y độc lập có phân bố Beta với các tham số (
1
,
1
) và (
2
,
2
) tơng ứng. Chứng
minh rằng XY cũng có có phân bố Beta với các tham số (
2
,
1
+
2
), nếu
1
=
2
+
2
.
Hớng dẫn: Xét phép biến đổi u = xy, v = x. Khi đó Jacôbiên bằng
1
v
. Tích phân hàm mật độ chung của
(U, V ) theo v từ u đến 1 ta đợc mật độ của XY .
Bài tập 3. Giả sử X G(
1
, 1) và Y G(
2
, 1) độc lập có phân bố Gamma. Khi đó u =
X
X+Y
có phân bố
Beta với các tham số (
1
,
2
).
Hớng dẫn: Xét phép biến đổi u =
x
x+y
, v = y. Tích phân hàm mật độ chung theo v từ 0 đến .
Định lí 9 Nếu X G(, p
1
), Y G(, p
2
) độc lập, khi đó r = X + Y và f =
X
Y
cũng độc lập. Ngoài ra
r G(, p
1
+ p
2
) và hàm mật độ của f bằng
(p
1
+ p
2
)
(p
1
)(p
2
)
ã
f
p
1
1
(1 + f)
p
1
+p
2
.
Chứng minh. Hàm mật độ của (X, Y ) bằng
c ãe
xy
x
p
1
1
y
p
2
1
.
Đổi biến x = r sin
2
, y = r cos
2
, 0 < r < +, 0 < <
2
, khi đó Jacobien của (x, y) bằng J(r, ) =
r sin 2. Mật độ của (r, ) bằng
c
ãe
r
r
p
1
+p
2
1
(sin )
2p
1
1
(cos )
2p
2
1
, (2)
điều đó chứng tỏ r và độc lập. Suy ra r = X + Y và f =
X
Y
= tg
2
cũng độc lập. Từ biểu thức (2) hiển
nhiên r G(, p
1
+ p
2
).
Để xác định hàm mật độ của f, ta sử dụng phép đổi biến = arctg
f, ta thu đợc kết quả
(p
1
+ p
2
)
(p
1
)(p
2
)
ã
f
p
1
1
(1 + f)
p
1
+p
2
.
Chú ý rằng với phép biến đổi u =
1
1+f
, khi đó
1
0
u
p
2
1
(1 u)
p
1
1
du =
0
f
p
1
1
(1+f)
p
1
+p
2
df.
25