BÀI GIẢNG NHẬP MÔN
XÁC SUẤT & THỐNG KÊ
(dành cho sinh viên các ngành kỹ thuật)
TS. Ngô Hoàng Long
Trường Đại học Sư phạm Hà Nội
2015
Mục lục
1 Biến cố ngẫu nhiên và xác suất
1.1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.1.1
Phân loại biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.1.2
Phép toán trên các biến cố . . . . . . . . . . . . . . . . . . . . . . . .
7
1.1.3
Quan hệ giữa các biến cố . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.1.4
Biến cố đồng khả năng . . . . . . . . . . . . . . . . . . . . . . . . . .
8
Định nghĩa xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
1.2.1
Định nghĩa cổ điển . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
1.2.2
Hạn chế của xác suất cổ điển . . . . . . . . . . . . . . . . . . . . . .
8
1.2.3
Mở rộng định nghĩa xác suất cổ điển . . . . . . . . . . . . . . . . . .
9
1.3
Xác suất điều kiện . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.4
Sự độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
1.2
Phép thử và biến cố
6
2 Biến ngẫu nhiên rời rạc
13
2.1
Định nghĩa biến ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . .
13
2.2
Các số đặc trưng của biến ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . .
14
2.2.1
Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
2.2.2
Tính chất của kỳ vọng . . . . . . . . . . . . . . . . . . . . . . . . . .
15
Một số phân phối rời rạc thường gặp . . . . . . . . . . . . . . . . . . . . . .
16
2.3.1
Phân phối nhị thức B(n, p) . . . . . . . . . . . . . . . . . . . . . . .
16
2.3.2
Phân phối hình học Geo(p) . . . . . . . . . . . . . . . . . . . . . . .
17
2.3.3
Phân phối Poisson P oi(λ) . . . . . . . . . . . . . . . . . . . . . . . .
17
2.3
3 Biến ngẫu nhiên liên tục
18
3.1
Hàm phân phối xác suất của biến ngẫu nhiên . . . . . . . . . . . . . . . . .
18
3.2
Hàm mật độ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
3.3
Các số đặc trưng của biến ngẫu nhiên có phân phối liên tục tuyệt đối . . . .
19
1
3.4
Một số phân phối liên tục thường gặp . . . . . . . . . . . . . . . . . . . . . .
20
3.4.1
Phân phối đều U [a, b] . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
3.4.2
Phân phối mũ Exp(λ) . . . . . . . . . . . . . . . . . . . . . . . . . .
20
3.4.3
2
Phân phối chuẩn N (a, σ ) . . . . . . . . . . . . . . . . . . . . . . . .
4 Vectơ ngẫu nhiên
21
23
4.1
Hàm phân phối của vectơ ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . .
23
4.2
Vectơ ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
4.2.1
Bảng phân phối đồng thời . . . . . . . . . . . . . . . . . . . . . . . .
24
4.2.2
Hệ số tương quan . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
Vectơ ngẫu nhiên liên tục tuyệt đối . . . . . . . . . . . . . . . . . . . . . . .
25
4.3.1
Hàm mật độ đồng thời . . . . . . . . . . . . . . . . . . . . . . . . . .
25
Một số phân phối thường gặp (tiếp) . . . . . . . . . . . . . . . . . . . . . . .
26
4.4.1
Phân phối khi bình phương . . . . . . . . . . . . . . . . . . . . . . .
26
4.4.2
Phân phối Student . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
4.4.3
Phân phối F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
4.3
4.4
5 Các định lý giới hạn
29
5.1
Luật số lớn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
5.2
Định lý giới hạn trung tâm . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
5.3
Xấp xỉ phân phối nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
6 Mẫu ngẫu nhiên và các số đặc trưng mẫu
31
6.1
Mẫu ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
6.2
Các số đặc trưng mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
7 Ước lượng tham số
7.1
7.2
33
Ước lượng điểm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
7.1.1
Các khái niệm về ước lượng . . . . . . . . . . . . . . . . . . . . . . .
33
7.1.2
Phương pháp hợp lý cực đại . . . . . . . . . . . . . . . . . . . . . . .
33
Ước lượng khoảng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
7.2.1
Khoảng ước lượng của kì vọng a trong mẫu có phân phối chuẩn N (a, σ 2 ) 34
7.2.2
Khoảng ước lượng của phương sai σ 2 trong mẫu có phân phối chuẩn
N (a, σ 2 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
Khoảng ước lượng của xác suất trong phân phối nhị thức . . . . . . .
35
7.2.3
2
8 Kiểm định giả thuyết thống kê
36
8.1
Bài toán kiểm định giả thuyết thống kê . . . . . . . . . . . . . . . . . . . . .
36
8.2
Kiểm định tham số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
8.2.1
Kiểm định về trung bình trong mẫu có phân phối chuẩn . . . . . . .
37
8.2.2
Kiểm định về xác suất p trong phân phối nhị thức . . . . . . . . . . .
39
8.2.3
So sánh hai xác suất trong phân phối nhị thức . . . . . . . . . . . . .
40
Kiểm định về quy luật phân phối xác suất . . . . . . . . . . . . . . . . . . .
41
8.3
9 Hồi quy và tương quan
42
3
Một số quy tắc đếm
Quy tắc nhân
Giả sử ta phải thực hiện một nhiệm vụ thông qua n bước.
• Bước 1 có k1 cách thực hiện;
• Ứng với mỗi cách thực hiện bước 1 đều có k2 cách thực hiện bước 2;
• Ứng với mỗi cách thực hiện bước 2 đều có k3 cách thực hiện bước 3;
···
• Ứng với mỗi cách thực hiện bước n − 1 có kn cách thực hiện bước n.
Khi đó tổng số cách thực hiện nhiệm vụ là k1 × k2 × · · · × kn .
Quy tắc cộng
Giả sử có n phương án để thực hiện một nhiệm vụ.
• Phương án một có k1 cách thực hiện;
• Phương án hai có k2 cách thực hiện;
···
• Phương án n có kn cách thực hiện.
Khi đó tổng số cách thực hiện nhiệm vụ là k1 + k2 + · · · + kn .
Công thức tổ hợp
Giả sử tập Ω có n phần tử phân biệt. Số cách lấy ra đồng thời (không tính đến thứ tự)
n!
k phần tử phân biệt từ Ω là Cnk =
(k = 0, 1, 2, . . . , n).
k!(n − 1)!
4
Ví dụ 0.0.1. Bạn Lan có 5 áo dài, 4 quần dài. Hỏi có bao nhiêu cách cho bạn Lan mặc một
bộ áo dài.
Ví dụ 0.0.2. Trong hộp có 5 bi xanh, 4 bi đỏ, 2 bi trắng. Hỏi có bao nhiêu cách lấy ra 2 bi
từ trong hộp sao cho:
1. Hai viên bi cùng màu.
2. Hai viên bi khác màu.
3. Không có viên bi nào màu đỏ.
4. Có ít nhất một bi xanh.
5
Chương 1
Biến cố ngẫu nhiên và xác suất
1.1
Phép thử và biến cố
Định nghĩa 1.1.1. Phép thử : việc thực hiện một tổ hợp các điều kiện nào đó được gọi là
thực hiện một phép thử. Kí hiệu là G.
Ví dụ 1.1.1.
• Gieo một đồng xu.
• Gieo một con xúc xắc (hình lập phương).
• Bắn một viên đạn vào bia.
Định nghĩa 1.1.2. Biến cố: Kết quả của phép thử được gọi là biến cố.
Ví dụ 1.1.2. Gieo đồng tiền một lần. Biến cố "mặt sấp xuất hiện", "mặt ngửa xuất hiện".
1.1.1
Phân loại biến cố
1. Biến cố chắc chắn: nhất định xảy ra khi ta thực hiện một phép thử nào đó. Kí hiệu là
Ω.
2. Biến cố rỗng (trống): là một biến cố không thể xảy ra khi ta thực hiện một phép thử
nào đó. Kí hiệu là ∅.
3. Biến cố ngẫu nhiên: là biến cố có thể hoặc không thể xảy ra khi ta thực hiện một phép
thử nào đó. Kí hiệu A, B, C gọi tắt là biến cố.
Ví dụ 1.1.3. Gieo một con xúc xắc. Khi đó
"Mặt xuất hiện có số chấm nhỏ hơn hoặc bằng 6": Ω.
"Mặt xuất hiện có số chấm nhỏ hơn 1": ∅.
"Mặt xuất hiện có số chấm chia hết cho 2": A (ngẫu nhiên).
"Mặt xuất hiện có số chấm là số lẻ": B (ngẫu nhiên).
6
Chú ý 1.1.1. Đồng nhất mỗi biến cố A như một tập con của Ω theo lý thuyết tập hợp:
A ⊂ Ω.
1.1.2
Phép toán trên các biến cố
1. Phép hợp: Hợp của hai biến cố A và B là một biến cố mà nó xảy ra khi A xảy ra hoặc
B xảy ra.
2. Phép giao: A ∩ B là một biến cố mà nó xảy ra khi A và B đồng thời xảy ra.
Chú ý 1.1.2. Giao của hai biến cố A và B còn được kí hiệu là AB.
3. Phép hiệu: hiệu của hai biến cố A và B (kí hiệu A \ B hoặc CBA ) là một biến cố mà nó
xảy ra khi A xảy ra và B không xảy ra.
4. Phép cố đối: biến cố đối của biến cố A ( kí hiệu là A hoặc Ac là một biến cố hiệu của
Ω và A: A = Ω \ A, A ⊂ Ω.
1.1.3
Quan hệ giữa các biến cố
1. Quan hệ kéo theo: biến cố A kéo theo biến cố B (A ⊂ B) nếu A xảy ra thì B xảy ra.
2. Quan hệ tương đương: A và B tương đương (A = B) nếu A kéo theo B và B kéo theo
A.
3. Quan hệ xung khắc: gọi A và B là hai biến cố xung khắc nếu A xảy ra thì B không
xảy ra và ngượi lại.
Chú ý 1.1.3. Nếu A và B xung khắc thì ta viết
(a) A ∪ B thành A + B.
(b) A.B = ∅.
(c) A ∪ A = A, A ∩ A = A.
A ∪ ∅ = A, A ∩ ∅ = ∅.
(d) (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C).
Ví dụ 1.1.4. Gieo một con xúc xắc. Gọi A là biến cố "mặt chẵn xuất hiện",
B là biến cố "mặt lẻ xuất hiện", Ck là biến cố "mặt k chấm xuất hiện".
Hãy tính A ∪ B, A ∩ B, từ đó suy ra A, B; A ∪ C2 , A ∩ C2 , C2 + C4 + C6 , C1 + C3 + C5 , A \
C2 , C4 + C6 , C2 \ A.
7
1.1.4
Biến cố đồng khả năng
1. Biến cố đồng khả năng: là các biến cố mà khả năng xuất hiện như nhau khi ta thực
hiện phép thử nào đó.
2. Biến cố sơ cấp: là một biến cố không thể phân tích được thành hợp của hai biến cố
khác nhau và khác rỗng. Cụ thể nếu A là biến cố sơ cấp thì A không thể phân tích
được dưới dạng A = B ∪ C trong đó B = C hoặc B = ∅, C = ∅.
Ví dụ 1.1.5.
• Gieo đồng tiền cân đối và đồng chất. Hai biến cố S(mặt sấp) và N (mặt
ngửa) xuất hiện là hai biến cố đồng khả năng và sơ cấp.
• Gieo con xúc xắc cân đối và đồng chất. Gọi Ck là biến cố "mặt k chấm xuất hiện".
Khi đó C1 , . . . , C6 là 6 biến cố sơ cấp đồng khả năng.
1.2
1.2.1
Định nghĩa xác suất
Định nghĩa cổ điển
Giả sử thực hiện phép thử G. Kết quả của phép thử là n biến cố sơ cấp đồng khả năng
(kí hiệu w1 , . . . , wn ). Không gian biến cố sơ cấp kí hiệu là Ω, Ω = {w1 , . . . , wn }. Giả sử A là
m
là
một biến cố chứa m biến cố sơ cấp nào đó, nghĩa là A = wi1 + · · · + wim . Khi đó tỷ số
n
xác suất của biến cố A, kí hiệu là P(A).
Chú ý 1.2.1.
• Số lượng n biến cố sơ cấp của không gian biến cố sơ cấp gọi là n khả
năng có thể của phép thử.
• Số lượng m biến cố sơ cấp thuộc A gọi là m khả năng thuận lợi cho A. Suy ra
P(A) =
m
Số khả năng thuận lợi cho A
.
=
n
Số khả năng có thể của phép thử
Ví dụ 1.2.1. Gieo đồng tiền (cân đối và đồng chất). Tính xác suất để mặt sấp xuất hiện
khi:
1. Gieo một lần.
2. Gieo ba lần.
1.2.2
Hạn chế của xác suất cổ điển
• Số lượng phần tử của khôn gian biến cố sơ cấp là hữu hạn.
• Các biến cố sơ cấp phải đồng khả năng.
8
1.2.3
Mở rộng định nghĩa xác suất cổ điển
Giả sử không gian mẫu gồm các biến cố sơ cấp w1 , w2 , . . . Với mỗi biến cố sơ cấp wi ta
đặt tương ứng với khả năng xuất hiện là pi , 0 ≤ pi ≤ 1 sao cho
pi = 1. Khi đó xác suất
i∈I
của mỗi biến cố A là
P(A) =
pi .
wi ∈A
Ví dụ 1.2.2. Xét một con xúc xắc không cân đối mà khả năng xuất hiện từng mặt cho bởi
bảng
Số chấm
Khả năng
1
10%
2
20%
3
10%
4
20%
5
30%
6
10%
Tính xác suất để gieo được mặt có chẵn chấm.
1.3
Xác suất điều kiện
Ví dụ 1.3.1. Gieo hai con xúc xắc cân đối và đồng chất. Gọi A là biến cố "Hai mặt cùng
chấm xuất hiện", B là biến cố "tổng số chấm bằng 8". Hãy tính
1. P(A), P(B).
2. Giả sử rằng biến cố A đã xảy ra, tính xác suất để B xảy ra.
3. Giả sử rằng biến cố B đã xảy ra, tính xác suất để A xảy ra.
Định nghĩa 1.3.1. Cho A và B là hai biến cố, P(B) > 0. Xác suất để A xảy ra biết rằng
biến cố B đã xảy ra là
P(AB)
P(A ∩ B)
=
.
P(A|B) =
P(B)
P(B)
Đọc là xác suất của biến cố A với điều kiện B.
Từ định nghĩa trên ta có các công thức sau.
Mệnh đề 1.3.1 (Công thức nhân xác suất). Giả sử A và B là hai biến cố và P(B) > 0.
Khi đó
P(AB) = P(A|B)P(B).
Do P(AB) = P(BA) = P(B|A)P(A) nên ta có công thức sau.
Mệnh đề 1.3.2 (Công thức Bayes 1). Giả sử A và B là hai biến cố thỏa mãn P(A) >
0, P(B) > 0. Khi đó
P(B|A)P(A)
P(A|B) =
.
P(B)
9
Ví dụ 1.3.2. Một hộp có 30 lá thăm trong đó có một lá trúng thưởng. Một người bốc một
cách ngẫu nhiên từng lá thăm ra khỏi hộp (không hoàn lại) cho tới khi gặp thăm trúng
thưởng thì dừng lại.
1. Tính xác suất của biến cố
(a) lần bốc thứ nhất được thăm trúng thưởng;
(b) lần bốc thứ hai được thăm trúng thưởng;
(c) lần bốc thứ ba được thăm trúng thưởng.
2. Tính lại xác suất của các biến cố trên khi trong hộp có đúng 2 thăm trúng thưởng.
Nhận xét 1.3.1. Khi chỉ có 1 thăm trúng thưởng thì xác suất bốc được thăm này không
phụ thuộc vào thứ tự lần bốc. Tuy nhiên, khi có từ 2 thăm trúng thưởng trở lên, xác suất
bốc được thăm trúng thưởng sẽ giảm dần theo từng lần bốc.
Định nghĩa 1.3.2. Hệ n biến cố {A1 , . . . , An } được gọi là một hệ đầy đủ nếu:
• Ai ∩ Aj = ∅ với mọi i = j,
n
•
Ai = Ω.
i=1
Mệnh đề 1.3.3 (Công thức xác suất toàn phần). Giả sử {A1 , . . . , An } là một hệ đầy đủ,
B là một biến cố bất kỳ. Ta có
P(B) = P(B|A1 )P(A1 ) + P(B|A2 )P(A2 ) + · · · + P(B|An )P(An )
Chứng minh. Đặt Bi = B ∩ Ai với mỗi i = 1, . . . , n. Do {A1 , . . . , An } là hệ đầy đủ nên các
biến cố Bi đôi một xung khắc và ∪ni=1 Bi = B. Vậy nên
P(B) = P(B1 ) + . . . + P(Bn ).
Áp dụng công thức nhân xác suất P(Bi ) = P(B|Ai )P(Ai ), ta được
P(B) = P(B|A1 )P(A1 ) + P(B|A2 )P(A2 ) + · · · + P(B|An )P(An ).
Kết hợp công thức xác suất toàn phần và công thức Bayes 1, ta được.
Mệnh đề 1.3.4 (Công thức Bayes 2). Giả sử {A1 , . . . , An } là một hệ đầy đủ, B là một biến
cố bất kỳ. Ta có
P(B|Ak )P(Ak )
P(Ak |B) =
.
P(B|A1 )P(A1 ) + · · · + P(B|An )P(An )
.
10
Ví dụ 1.3.3. Một xét nghiệm kiểm tra bệnh UTN cho kết quả dương tính với 90% các ca
thực sự mắc bệnh và cho quả âm tính với 95% các ca thực sự không mắc bệnh. Giả sử tỷ
lệ mắc bệnh UTN là x%. Một người làm xét nghiệm trên và có kết quả là dương tính. Tính
xác suất để người đó thực sự mắc bệnh UTN khi
1. x = 50.
2. x = 5.
3. x = 0.5.
Nhận xét 1.3.2. Khi tỉ lệ mắc bệnh UTN trong cộng đồng là x càng nhỏ thì xác suất thực
mắc UTN khi xét nghiệm cho kết quả dương tính càng nhỏ. Điều này cho thấy sự khó khăn
khi xác định bệnh nhân có mắc phải một bệnh hiếm gặp hay không trong y tế.
Ví dụ 1.3.4. Trong một hộp có 5 bi xanh, 2 bi trắng và 1 bi đỏ. Bạn Tuân lấy ra lần lượt
từng viên bi trong hộp không trả lại cho tới khi nào lấy được bi xanh thì dừng. Gọi Y là số
bi đã bốc. Hãy tính
1. Xác suất Y = 1, 2, 3, 4.
2. Xác suất để lần thứ nhất Tuân bốc được bi trắng, biết rằng lần thứ 3 Tuân mới bốc
được bi xanh.
1.4
Sự độc lập
Định nghĩa 1.4.1. Hai biến cố A và B được gọi là độc lập nếu
P(A ∩ B) = P(A)P(B).
Thông thường người ta nói hai biến cố A và B độc lập nếu việc biến cố B xảy ra hay
không xảy ra không làm ảnh hưởng đến xác suất để biến cố A xảy ra.
Mệnh đề 1.4.1. Nếu A và B là hai biến cố độc lập thì
1. P(A|B) = P(A).
2. P(A|B c ) = P(A).
Chứng minh. Tự chứng minh, coi như bài tập.
Mệnh đề 1.4.2. Nếu A và B là độc lập thì
1. Ac , B độc lập.
2. A, B c độc lập.
11
3. Ac , B c độc lập.
Định nghĩa 1.4.2. A1 , . . . , An là n biến cố độc lập nếu với mọi 1 ≤ k ≤ n, với mọi
1 ≤ i1 < i2 < · · · < ik ≤ n thì
P(Ai1 .Ai2 . . . Aik ) = P(Ai1 )P(Ai2 ) . . . P(Aik ).
Bài tập 1.4.1. Giả sử A, B, C là ba biến cố độc lập. Chứng minh rằng
1. Ac , B, C là ba biến cố độc lập.
2. Ac , B c , C c là ba biến cố độc lập.
Định nghĩa 1.4.3. Một dãy phép thử được gọi là độc lập nếu mọi dãy kết quả của từng
phép thử là độc lập.
Ví dụ 1.4.1. Một xạ thủ bắn lần lượt từng viên đạn vào một bia. Giả sử kết quả các lần
bắn là độc lập với nhau và xác suất trúng đích của mỗi lần bắn đều bằng nhau và bằng 0.8
1. Tính xác suất để 3 viên đạn bắn đầu tiên trúng đích.
2. Tính xác suất để trong 3 viên đạn bắn đầu tiên có 2 viên trúng.
3. Tính xác suất phải bắn đến lần thứ 4 mới trúng đích.
12
Chương 2
Biến ngẫu nhiên rời rạc
2.1
Định nghĩa biến ngẫu nhiên rời rạc
Định nghĩa 2.1.1. Biến ngẫu nhiên X là một quan sát nhận giá trị bằng số kết quả của
phép thử ngẫu nhiên.
Nếu tập giá trị của X là hữu hạn hay đếm được thì X được gọi là biến ngẫu nhiên rời rạc.
Nếu tập giá trị của X là một khoảng con của R hoặc toàn bộ R thì X được gọi là biến ngẫu
nhiên liên tục.
Ví dụ 2.1.1. Biến ngẫu nhiên rời rạc:
1. Quan sát số răng, năm sinh, số con một người được chọn ngẫu nhiên.
2. Giao 2 con xúc xắc: tổng số chấm, tích số chấm,...
3. Số cuộc gọi đến một tổng đài điện thoại trong một ngày.
Ví dụ 2.1.2. Biến ngẫu nhiên liên tục:
1. Cự ly của một cú nhảy xa.
2. Thời gian chờ của một khách hàng ở quầy thanh toán.
3. Trọng lượng một chi tiết máy.
Ví dụ 2.1.3. Gieo hai đồng xu cân đối và đồng chất. Gọi X là số mặt sắp xuất hiện. Hãy
tính xác suất để
1. X = 0, 1, 2.
2. Lập bảng phân phối xác suất của X
Ví dụ 2.1.4. Trong hộp có 5 hạt giống loại A, 2 hạt giống loại B. Lấy ra ngẫu nhiên 3 hạt
giống từ hộp. Gọi X là số hạt loại A trong 3 hạt lấy ra. Hãy lập bảng phân phối xác suất
của X.
13
Ví dụ 2.1.5. Cho biến ngẫu nhiên X có bảng phân phối sau.
x 0
P[X = x] 0.2
1
2
0.3 0.3
3
0.2
1. Hãy tính P[X ≥ 1].
2. Hãy tính P[|X − 1| ≤ 1].
3. Đặt Y = 3 − X. Hãy lập bảng phân phối xác suất của Y.
Nhận xét 2.1.1. Bảng phân phối xác suất của X và Y giống nhau. Ta nói X và Y có cùng
phân phối.
2.2
2.2.1
Các số đặc trưng của biến ngẫu nhiên rời rạc
Định nghĩa
Cho bnn rời rạc X có phân phối cho bởi bảng
x x1
P[X = x] p1
x2
p2
...
...
xn
pn
...
...
Định nghĩa 2.2.1. Kỳ vọng của X là
xi p i = x1 p 1 + x2 p 2 + · · · + xn p n + · · ·
E[X] =
i≥1
nếu tổng trên hội tụ.
Kỳ vọng của biến ngẫu nhiên đặc trưng cho giá trị trung bình mà biến ngẫu nhiên đó có thể
nhận.
Mệnh đề 2.2.1. Cho ϕ : R → R. Khi đó
∞
E[ϕ(X)] =
ϕ(xi )pi ,
i=1
nếu tổng trên hội tụ.
Định nghĩa 2.2.2. Phương sai của X là
DX = E[(X − E[X])2 ].
Sử dụng Mệnh đề 2.2.1 ta có
2
x2i pi −
DX =
i≥1
xi p i
i≥1
14
= E[X 2 ] − (E[X])2 .
Ví dụ 2.2.1. Giả sử X là biến ngẫu nhiên có phân phối cho bởi bảng
x 1
P[X = x] 16
2
3
4
5
6
1
6
1
6
1
6
1
6
1
6
1. Tính kỳ vọng và phương sai của X.
2. Đặt Y = |X − 3|. Tính kì vọng và phương sai của Y .
3. Đặt Z = min{X, 3}. Tính kì vọng và phương sai của Z.
Ví dụ 2.2.2. Giả sử A là một biến cố nào đó. Xét bnn
1 nếu w ∈ A,
IA (w) =
0 nếu w ∈ A.
Tính kì vọng và phương sai của IA .
2.2.2
Tính chất của kỳ vọng
1. Nếu X = a với a là hằng số thì E[X] = a.
2. Nếu X ≥ 0 thì E[X] ≥ 0. Hơn nữa, nếu X ≥ Y thì E[X] ≥ E[Y ].
3. (Tính chất tuyến tính của kỳ vọng) với mọi a, b ∈ R,
E[aX + bY ] = aE[X] + bE[Y ].
Ví dụ 2.2.3. Gieo 4 con xúc xắc cân đối và đồng chất. Gọi X là tổng số chấm xuất hiện.
Tính E[X].
Ví dụ 2.2.4. ∗ Một đồ thị ngẫu nhiên gồm n đỉnh. Xác suất để hai đỉnh bất kì được nối
với nhau bởi 1 cạnh là p ∈ (0, 1). Goi X là tổng số cạnh của đồ thị. Tính E[X].
Ví dụ 2.2.5. Giả sử X là một bnn không âm, a là số thực dương. Khi đó
P[X ≥ a] ≤
E[X]
.
a
Bất đẳng thức trên gọi là bất đẳng thức Markov.
15
2.3
Một số phân phối rời rạc thường gặp
2.3.1
Phân phối nhị thức B(n, p)
Thực hiện một dãy gồm n phép thử độc lập. Giả sử xác suất thành công của mỗi phép
thử đều bằng nhau và bằng p. Gọi X là số phép thử thành công trong n phép thử. Khi đó
X ∈ {0, 1, 2, . . . , n}.
Để xác định phân phối của X ta gọi Hk là biến cố phép thử k thành công. Ta có (Hk ) là
dãy biến cố độc lập và P(Hk ) = p với mọi k. Vậy nên
P[X = 0] = P(H1c H2c . . . Hnc ) = P(H1c )P(H2c ) . . . P(Hnc ) = (1 − p)n ,
P[X = n] = P(H1 H2 . . . Hn ) = P(H1 )P(H2 ) . . . P(Hn ) = pn ,
P[X = 1] = P(H1 H2c . . . Hnc ) + P(H1c H2 . . . Hnc ) + P(H1c .H2c . . . Hn ) = np(1 − p)n−1 .
Tương tự ta có thể tính được
P[X = 2] = Cn2 p2 (1 − p)n−2 .
Tổng quát, ta có
P[X = k] = Cnk pk (1 − p)n−k , k = 0, . . . , n.
(2.1)
Biến ngẫu nhiên X có phân phối cho bởi công thức (2.1) được gọi là có phân phối nhị thức
và kí hiệu là X ∼ B(n, p).
Sau đây ta xác định kỳ vọng của X.
n
n
kP[X = k] =
E[X] =
k=0
n−1
=
l=0
k=1
n!
pk (1 − p)n−k .
(k − 1)!(n − k)!
n!
pl+1 (1 − p)n−l−1
l!(n − 1 − l)!
n−1
= np
l=0
(đặt l = k − 1)
(n − 1)!
pl (1 − p)n−1−l .
l!(n − 1 − l)!
Áp dụng công thức khai triển nhị thức Newton ta được
E[X] = np.
Tính toán tương tự ta được phương sai của X là
DX = np(1 − p).
Ví dụ 2.3.1. Xác suất nảy mầm của một giống thóc A là 0.9. Gieo 5 hạt thóc giống A độc
lập với nhau
1. Tính xác suất để có ít nhất hai hạt nảy mầm.
2. Tính kỳ vọng và phương sai của tổng số hạt nảy mầm.
16
2.3.2
Phân phối hình học Geo(p)
Thực hiện dãy phéo thử độc lập cho tới khi nào thành công lần đầu tiên thì dừng lại.
Gọi X là số phép thử đã thực hiện. Giả sử xác suất thành công của mỗi phép thử đều bằng
nhau và bằng p. Khi đó ta có
P[X = k] = (1 − p)k−1 p,
k = 1, 2, . . .
(2.2)
Biến ngẫu nhiên X có phân phối cho bởi công thức (2.2) được gọi là có phân phối hình học
và kí hiệu là X ∼ Geo(p).
Ta có thể tính được kì vọng và phương sai của X như sau
1
E[X] = ,
p
DX =
1−p
.
p2
Ví dụ 2.3.2. Xác suất để gửi thành công một tín hiệu lên vệ tinh là 0.9. Giả sử khả năng
thành công của mỗi lần gửi là độc lập với nhau.
1. Hỏi trung bình sau bao nhiêu lần gửi đi thì tín hiệu được gửi thành công lần đầu tiên.
2. Tính xác suất để trong 4 lần gửi đầu có ít nhất 1 lần thành công.
2.3.3
Phân phối Poisson P oi(λ)
Biến ngẫu nhiên X được gọi là có phân phối Poisson với tham số λ > 0, kí hiệu là
X ∼ P oi(λ) nếu X ∈ {0, 1, 2, . . . } và
e−λ .λk
.
P[X = k] =
k!
Ta có
E[X] = DX = λ.
Ví dụ 2.3.3. Số khách đến cửa hàng mỗi ngày trong khoảng thời gian từ 8h đến 9h là một
đại lượng ngẫu nhiên có phân phối Poisson với tham số λ = 4.
1. Tính xác suất để một ngày xác định nào đó, số khách đến cửa hàng trong khoảng thời
gian trên lớn hơn hoặc bằng 3.
2. Giả sử cửa hàng có thể phục vụ tối đa là 5 người. Tính xác suất để cửa hàng có thể
phục vụ tất cả các khách đến.
3. Hỏi để xác suất của biến cố có thể phục vụ được tất cả các khách đến cửa hàng ít nhất
là 99% thì khả năng phục vụ tối đa của cửa hàng phải ít nhất là bao nhiêu.
17
Chương 3
Biến ngẫu nhiên liên tục
3.1
Hàm phân phối xác suất của biến ngẫu nhiên
Định nghĩa 3.1.1. Giả sử X là biến ngẫu nhiên. Khi đó
FX (x) := P[X ≤ x]
được gọi là hàm phân phối của X.
Mệnh đề 3.1.1. (Tính chất của hàm phân phối)
1. 0 ≤ FX (x) ≤ 1.
2. a < b, P[a < X ≤ b] = FX (b) − FX (a).
3. Nếu a < b thì FX (b) ≥ FX (a).
4. lim FX (x) = 1,
x→+∞
3.2
lim FX (x) = 0.
x→−∞
Hàm mật độ
Định nghĩa 3.2.1. Nếu tồn tại hàm fX : R → R thỏa mãn
x
fX (t)dt, ∀x ∈ R
FX (x) =
−∞
thì fX được gọi là hàm mật độ của biến ngẫu nhiên X.
Tính chất của hàm mật độ
1. FX (x) = fX (x).
2. fX (x) ≥ 0, ∀x.
18
3. ∀a < b, P[a ≤ X ≤ b] =
4.
+∞
−∞
b
a
fX (t)dt
fX (t)dt = 1.
Ví dụ 3.2.1. Gọi X là thời gian đến lớp của sinh viên so với mốc thời gian là 7h00. Giả sử
X có phân phối liên tục tuyệt đối với hàm mật độ (đơn vị tính là giờ)
C(1 − x2 ) khi − 1 ≤ x ≤ 1
0
khi x ∈
/ [−1, 1]
fX (x) =
1. Tìm C.
2. Chứng minh rằng −1 ≤ X ≤ 1.
3. Một bạn được gọi là đi học rất muộn nếu đến lớp sau 7h30. Tính xác suất của biến cố
bạn đến lớp rất muộn.
Ví dụ 3.2.2. Cho biến ngẫu nhiên X có hàm mật độ
Cx khi 0 ≤ x ≤ 1
0
trong trường hợp khác
fX (x) =
1. Tìm C.
2. Tính P[|X − 12 | ≥ 13 ].
3. Đặt Y = 1 − X. Tính hàm mật độ của Y
3.3
Các số đặc trưng của biến ngẫu nhiên có phân phối
liên tục tuyệt đối
Định nghĩa 3.3.1. Giả sử biến ngẫu nhiên X có hàm mật độ fX . Khi đó X được gọi là
khả tích nếu
+∞
|x|fX (x)dx < +∞.
−∞
Kỳ vọng của X là
+∞
E[X] =
xfX (x)dx.
−∞
Mệnh đề 3.3.1. Nếu ϕ : R → R thì
+∞
E[ϕ(x)] =
ϕ(x)fX (x)dx.
−∞
Đặc biệt, nếu ϕ(x) = x2 thì
+∞
E[X 2 ] =
x2 fX (x)dx.
−∞
19
Định nghĩa 3.3.2. Phương sai của X là
DX = E[X 2 ] − (EX)2 =
2
x2 fX (x)dx −
xfX (x)dx .
Kỳ vọng của biến ngẫu nhiên bất kỳ có các tính chất như kỳ vọng của biến ngẫu nhiên
có phân phối rời rạc.
Ví dụ 3.3.1. Cho biến ngẫu nhiên X có hàm mật độ
fX (x) =
Cxα khi x ∈ [0, 1]
0
khi x ∈
/ [0, 1]
với C, α > 0.
1. Hãy xác định C theo α.
2. Tính kỳ vọng và phương sai của X.
3. Đặt Y = min{X, 12 }. Tính kì vọng của Y .
3.4
3.4.1
Một số phân phối liên tục thường gặp
Phân phối đều U [a, b]
Bnn X được gọi là có phân phối đều trên đoạn [a, b], kí hiệu là X ∼ U [a, b], nếu hàm
mật độ của X là
1
khi x ∈ [a, b]
b−a
fX (x) =
0
khi x ∈
/ [a, b]
Kỳ vọng và phương sai của X là
EX =
Mệnh đề 3.4.1.
a+b
2
và DX =
1. Giả sử X ∼ U [a, b]. Đặt Z =
(a − b)2
.
12
X−a
.
b−a
Khi đó Z ∼ U [0, 1].
2. Giả sử Z ∼ U [0, 1]. Đặt X = (b − a)Z + a. Khi đó X ∼ U [0, 1].
3.4.2
Phân phối mũ Exp(λ)
Bnn được gọi là có phân phối mũ với tham số λ > 0, kí hiệu là X ∼ Exp(λ), nếu X có
hàm mật độ
1 −x
e λ khi x > 0
λ
fX (x) =
0
trong trường hợp khác
20
Phân phối mũ thường được dùng để mô phỏng khoảng thời gian giữa hai lần liên tiếp một
sự kiện nào đó xảy ra (ví dụ như khoảng thời gian giữa hai cuộc điện thoại liên tiếp) hay
thời gian hoạt động của một thiết bị nào đó cho tới khi bị hỏng.
Kỳ vọng và phương sai của X là
E[X] = λ,
DX = λ2 .
và
Sau đây là mối quan hệ giữa phân phối mũ và phân phối đều.
Mệnh đề 3.4.2.
1. Nếu X ∼ Exp(1) thì λX ∼ Exp(λ) với mọi λ > 0.
2. Nếu X ∼ U [0, 1] thì Z = − ln X ∼ U [0, 1].
3.4.3
Phân phối chuẩn N (a, σ 2 )
Định nghĩa 3.4.1. Biến ngẫu nhiên X được gọi là có phân phối chuẩn N (a, σ 2 ) nếu hàm
mật độ của X là
(x−a)2
1
e− 2σ2 , ∀x ∈ R.
fX (x) = √
2πσ 2
Phân phối chuẩn thường được dùng để mô phỏng các đại lượng như chiều dài, trọng
lượng, Khi a = 0, σ 2 = 1, N (0, 1) được gọi là phân phối chuẩn tắc. Hàm mật độ của phân
phối chuẩn tắc là
x2
1
fX (x) = √ e− 2 .
2π
Hàm phân phối của phân phối chuẩn tắc là
x
1
Φ(x) = √
2π
e−
(t)2
2
dt.
−∞
Việc tính toán với phân phối chuẩn thường được đưa về tính toán với phân phối chuẩn tắc
nhờ mệnh đề sau.
Mệnh đề 3.4.3. Nếu X ∼ N (a, σ 2 ) thì Z =
X−a
σ
∼ N (0, 1).
Ví dụ 3.4.1. Năng suất của một giống đậu tương (tạ/ha) tuân theo phân phối chuẩn
N (20, 4).
1. Tính xác suất để một thửa ruộng trồng giống đậu tương trên đạt năng suất trên 20
tạ/ha.
2. Một thửa ruộng được gọi là có năng suất cao nếu nó đạt trên 24 tạ/ha. Tính xác suất
để một thửa ruộng đạt năng suất cao.
3. Tính P[X < 15].
21
4. Tính P[14 ≤ X ≤ 26].
5. Một thửa ruộng gọi là có năng suất thấp nếu nó nằm trong 1% các thửa ruộng có năng
suất thấp nhất. Tìm x0 sao cho thửa ruộng có năng suất thấp nhất khi và chỉ khi năng
suất của nó nhỏ hơn x0 .
Mệnh đề 3.4.4.
1. Giả sử Z ∼ N (0, 1) khi đó EZ = 0, DZ = 1.
2. Giả sử X ∼ N (a, σ 2 ) khi đó EX = a, DX = σ 2 .
Ví dụ 3.4.2. Biết cân nặng của trẻ sơ sinh tuân theo phân phối chuẩn N (a, σ 2 ). Biết rằng
có 5% trẻ có cân nặng nhỏ hơn hoặc bằng 2.7kg và có 2% trẻ có cân nặng lớn hơn hoặc bằng
4.2kg. Hãy xác định cân nặng trung bình và độ lệnh chuẩn của cân nặng.
22
Chương 4
Vectơ ngẫu nhiên
4.1
Hàm phân phối của vectơ ngẫu nhiên
Định nghĩa 4.1.1. Giả sử X1 , . . . , Xn là n biến ngẫu nhiên. Khi đó ξ = (X1 , . . . , Xn ) được
gọi là một vectơ ngẫu nhiên n chiều. Hàm Fξ : Rn → [0, 1] xác định bởi
Fξ (x1 , . . . , xn ) = P[X1 ≤ x1 , . . . , Xn ≤ xn ]
được gọi là hàm phân phối của vectơ ngẫu nhiên ξ.
Sau đây để đơn giản ta chỉ xét vectơ ngẫu nhiên hai chiều của hai biến ngẫu nhiên X và
Y và hàm
FX,Y (x, y) = P[X ≤ x, Y ≤ y]
được gọi là hàm phân phối đồng thời của X và Y .
Mệnh đề 4.1.1. (Tính chất của hàm phân phối)
1. 0 ≤ FX,Y (x, y) ≤ 1.
2. Với a < b, c < d, ta có
P[a < X ≤ b, c < Y ≤ d] = FX,Y (b, d) − FX,Y (a, d) − FX,Y (b, c) − FX,Y (a, c).
3. FX (x) = lim FX,Y (x, y),
y→+∞
FY (y) = lim FX,Y (x, y).
x→+∞
4. lim FX,Y (x, y) = lim FX,Y (x, y) = 0.
y→−∞
5. lim
x→−∞
lim FX,Y (x, y) = lim
x→+∞ y→+∞
lim FX,Y (x, y) = 1.
y→+∞ x→+∞
Định nghĩa 4.1.2. Dãy biến ngẫu nhiên X1 , . . . , Xn được gọi là độc lập nếu
P[X1 ≤ x1 , . . . , Xn ≤ xn ] = P[X1 ≤ x1 ] . . . P[Xn ≤ xn ],
với mọi (x1 , . . . , xn ) ∈ Rn .
23
4.2
4.2.1
Vectơ ngẫu nhiên rời rạc
Bảng phân phối đồng thời
Cho X và Y là hai biến ngẫu nhiên rời rạc, trong đó
X ∈ {x1 , x2 , . . . , xn , . . . } và Y ∈ {y1 , y2 , . . . , ym , . . . }.
Đặt
pij = P[X = xi , Y = yj ].
Bảng phân phối đồng thời của X và Y là
X = x1
X = x2
Y = y1
p11
p21
Y = y2
p12
p22
X = xn
pn1
pn2
···
···
···
···
···
Y = ym
p1m
p2m
pnm
Từ bảng phân phối trên ta có thể xác định phân phối của X và phân phối của Y bởi
P[X = xk ] = pk1 + pk2 + · · · (tổng các xác suất ở hàng ứng với xk ),
P[Y = yj ] = p1j + p2j + · · · (tổng các xác suất ở cột ứng với yj ).
Ví dụ 4.2.1. Trong hộp có 5 viên bi xanh, 2 viên bi trắng và 1 viên bi đỏ. Lấy ra ngẫu
nhiên 2 viên bi. Gọi X là số viên bi xanh, T là số viên bi trắng trong 2 viên bi vừa lấy.
1. Lập bảng phân phối xác suất đồng thời của X và T .
2. Lập bảng phân phối xác suất của Z = XT .
3. Tính kì vọng và phương sai của Z.
Mệnh đề 4.2.1. Hai bnn rời rạc X và Y độc lập khi và chỉ khi
P[X = xk , Y = yj ] = P[X = xk ]P[Y = yj ],
với mọi xk và yj lần lượt thuộc tập giá trị của X và Y .
Ví dụ 4.2.2. Giả sử X và Y là hai bnn độc lập X ∼ P oi(λ) và Y ∼ P oi(µ). Khi đó
X + Y ∼ P oi(λ + µ).
Mệnh đề 4.2.2. Nếu X và Y là hai biến ngẫu nhiên rời rạc độc lập, khi đó
E[f (X)g(Y )] = E[f (X)]E[g(Y )]
với mọi hàm f, g : R → R thỏa mãn các kì vọng trên tồn tại và hữu hạn.
24