Tải bản đầy đủ (.pdf) (34 trang)

Bài giảng Lý thuyết xác suất thống kê toán - Chương 3: Các phân phối xác suất thông dụng cung cấp cho người học các kiến thức về các phân phối của đại lượng ngẫu nhiên rời rạc,

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (170.17 KB, 34 trang )

CHƯƠNG 3
Các phân phối xác suất thông dụng
1. Các phân phối của ĐLNN rời rạc
1.1 Phân phối Nhò thức
1.1.1 Đònh nghóa và các số đặc trưng
Trong một phép thử, biến cố A xảy ra với xác
suất p. Thực hiện phép thử n lần độc lập. Gọi X là số
lần biến cố A xảy ra thì X là ĐLNN. Theo công thức
Nhò thức:
P(X=
=k) = Ckn pk q n − k


ĐLNN X có phân phối xác suất như trên được
được gọi là ĐLNN có phân phối Nhò thức, ký hiệu X
~ B(n, p). Giá trò của X là 0, 1, ..., n.
Đặt q = 1–p. Ta tính được:
E(X) = np
Var(X) = npq
(n+1)p – 1 ≤ Mod(X) ≤ (n+1)p
Excel
Pk = P(X=k) =BINOMDIST(k, n, p, 0)
P(X ≤ k) =BINOMDIST(k, n, p, 1)


Ví dụ
(1) Lấy ngẫu nhiên có hoàn lại 10 sản phẩm từ lô
hàng có 80% chính phẩm. Tính xác suất có 8 chính
phẩm.
Biến cố "lấy được chính phẩm" có xác suất p = 80%.
Số lần lặp lại phép thử là n = 10. Gọi X là số chính


phẩm đếm được thì X ~ B(10; 80%). Xác suất cần
tính là P(X=8). Theo công thức:
8
(0,8)8(0,2)2 ≈ 30%
P(X=8) = C10
=BINOMDIST(8, 10, 80%, 0)


(2) Cho X~B(79; 75%), Y~B(30; 25%). Tính Mod(X),
Mod(Y).
Lưu ý Mod(X), Mod(Y) đều là số nguyên, ta có:
59 ≤ Mod(X) ≤ 60 ⇒ Mod(X) = 59 hay Mod(X) = 60
6,75 ≤ Mod(Y) ≤ 7,75 ⇒ Mod(Y) = 7
(3) Một xạ thủ bắn trúng bia với xác suất 20%. Tính
xác suất xạ thủ này bắn vào bia 5 phát thì có không
quá 2 phát trúng bia.


1.1.2 Xấp xỉ Nhò thức bởi phân phối Chuẩn
Xét B(n, p). Nếu n đủ lớn và p không quá gần 0
hay 1 thì phân phối Nhò thức được xấp xỉ bởi phân
phối Chuẩn có cùng kỳ vọng và phương sai:

B(n, p) ≈ N(np, npq)
Ta cũng có công thức tính gần đúng:
1
k − np
P(X = k) ≈
)
ϕ(

npq
npq
=NORMDIST(k, n*p, (n*p*q)^.5, 0)

P(a ≤ X ≤ b) ≈ Φ(

b − np
npq

) − Φ(

Trong đó ϕ là hàm Gauss ϕ(z) =

a − np
npq

1


2

e− z

)

/2

.



Ghi chú
"n đủ lớn và p không quá gần 0 hay 1" nghóa là
p ≥ 10%, q ≥ 10%, np > 5 và nq > 5.


Ví dụ
Xác suất chữa khỏi bệnh của một loại thuốc là
80%. Có 1.000 người dùng thuốc này. Tính xác suất
có ít ra 790 người khỏi bệnh.
Biến cố "một người khỏi bệnh sau khi dùng thuốc" có
xác suất p = 85%. Số người dùng thuốc là n = 1.000.
Gọi X là số người khỏi bệnh sau khi dùng thuốc thì
X~B(1.000; 80%). Xác suất cần tính là P(X ≥ 790).
Do n đủ lớn và p không quá gần 0 hay 1 nên
B(1.000; 80%) ≈ N(800, 160).
790 − 800
) = 0,5 + Φ(0,79) ≈ 79%
P(X ≥ 790) ≈ 0,5 – Φ (
160
=1–NORMDIST(790, 800, 160^.5, 1)


1.2 Phân phối Poisson

1.2.1 Đònh nghóa và các số đặc trưng
ĐLNN rời rạc X nhận các giá trò 0, 1, ... với
P(X=k) đònh bởi công thức sau gọi là ĐLNN có phân
phối Poisson với tham số λ (λ > 0), ký hiệu X ~ P(λ):
λ k −λ
P(X=k) =

e
k!
Ta tính được:
E(X) = λ Var(X) = λ λ – 1 ≤ Mod(X) ≤ λ
Excel
P(X=k) =POISSON(k, λ, 0)
P(X ≤ k) =POISSON(k, λ, 1)
Ghi chú
Khi λ > 10 thì P(λ) ≈ N(λ, λ).


1.2.2 Xấp xỉ Nhò thức bởi phân phối Poisson
Xét ĐLNN B(n, p). Nếu n đủ lớn và p đủ nhỏ
thì phân phối Nhò thức được xấp xỉ bởi phân phối
Poisson có cùng kỳ vọng:

B(n, p) ≈ P(np)
Ghi chú
"n đủ lớn và p đủ nhỏ" nghóa là n ≥ 20 và p ≤ 5%.
Điều kiện khác là n ≥ 30, p ≤ 10% và np < 10.
Xấp xỉ sẽ tốt hơn nếu n ≥ 100 và np < 10.


Ví dụ
(1) Xác suất bò đứt trong 1 giờ hoạt động của một
ống sợi là 0,2%. Một máy dệt có 1.000 ống sợi. Tính
xác suất trong 1 giờ hoạt động của máy dệt có nhiều
hơn 2 ống sợi bò đứt.
Biến cố "ống sợi bò đứt" có xác suất p = 0,2%.
Gọi X là số ống sợi bò đứt trong số n = 1.000 ống sợi

thì X~B(1.000, 0,2%). Xác suất cần tính là P(X > 2).
Do n đủ lớn và p đủ nhỏ nên ta xấp xỉ X bởi P(λ)
với λ = 1.000×0,2% = 2. Ta có:
P(X > 2) = 1 – P(X=0) – P(X=1) – P(X=2)
20 −2 21 −2 22 −2
=1–
e –
e –
e = 1 – e–2(1+2+2) ≈ 32%
0!
1!
2!
=1−POISSON(2, 2, 1)


(2) Một cộng đồng có khoảng 2% người sống đến 90
tuổi. Cộng đồng hiện có 1.000 người.
a) Tính trung bình cộng đồng có bao nhiêu người
sống đến 90 tuổi?
b) Tính xác suất cộng đồng có đúng 20 người sống
đến 90 tuổi.
c) Tính xác suất cộng đồng có hơn 20 người sống
đến 90 tuổi.
(3) Trung bình một ngày bãi giữ xe nhận 600 xe.
Tính xác suất ngày mai có 700 xe được gởi tại bãi
giữ xe này.


1.3 Phân phối Siêu bội


1.3.1 Đònh nghóa và các số đặc trưng
Xét tập hợp gồm N phần tử trong đó có M phần
tử có tính chất tốt. Gọi X là số phần tử có tính chất
tốt có được khi lấy ngẫu nhiên n phần tử. Xét k là
một số nguyên từ max(0, n+M–N) đến min(M, n).
Theo công thức Siêu bội ta có:

P(X=
=k) =

CkM .CnN−−kM
CnN

=HYPGEOMDIST(k, n, M, N)

X được gọi là ĐLNN có phân phối Siêu bội, ký
hiệu X ~ H(N, M, n).
Đặt p = M/N và q = 1 – p. Ta tính được:


N−n
N−1
 (n + 1)(M + 1) 
Mod(X) = 

N+2



E(X) = np


Var(X) = npq


Ví dụ
(1) Một công ty có 10 chiếc xe trong đó có 3 chiếc
Lexus. Điều ngẫu nhiên 4 chiếc xe để đi công tác.
Tính xác suất trong các xe đó có 1 chiếc Lexus.
Mô hình Siêu bội.
N = 10

M=3

n=4

Gọi X là số xe Lexus có trong các xe được điều thì
X~H(10, 3, 4). Cần tính là P(X=1).
C13 .C73
= 50% =HYPGEOMDIST(1, 4, 3, 10)
P(X=1) =
4
C10


(2) Một lớp 70 sinh viên trong đó có 40 sinh viên
giỏi Toán. Chọn ngẫu nhiên 10 sinh viên. Tính xác
suất có ít ra là 3 sinh viên giỏi Toán.


1.3.2 Xấp xỉ Siêu bội bởi phân phối Nhò thức

Nếu n đủ nhỏ so với N, M và p = M/N không quá
gần 0 hay 1 thì ta có xấp xỉ:
M
H(N, M, n) ≈ B(n,
)
N
Ghi chú
"n đủ nhỏ so với N, M và p = M/N không quá gần 0
hay 1" nghóa là 20n < N, 20n < M và 10% ≤ p ≤ 90%.
* Khi n đủ nhỏ so với N thì việc lấy ngẫu nhiên có
hoàn lại hoặc không hoàn lại là gần như nhau.


Ví dụ
(1) Lô hàng gồm 10.000 sản phẩm trong số có 9.000
chính phẩm. Lấy ra 10 sản phẩm. Tính xác suất
trong các sản phẩm này có 9 chính phẩm.
Mô hình Siêu bội.
Gọi X là số chính phẩm có trong 10 sản phẩm lấy ra
thì X ~ H(1.000, 900, 10). Cần tính P(X=9).
Vì n đủ nhỏ so với N, M và p = M/N không quá gần 0
hay 1 nên:

H(1.000, 900, 10) ≈ B(10, 900/1.000) = B(10, 90%)
Vậy:
9
P(X=9) = C10
.(90%)9.(10%)1 ≈ 39%

=BINOMDIST(9, 10, 90%, 0)



(2) Tỷ lệ phế phẩm của nhà máy là 90%. Khách
hàng lấy 100 sản phẩm để kiểm tra và nếu thấy có
ít ra là 93 chính phẩm thì đồng ý mua sản phẩm của
nhà máy. Tính xác suất khách hàng đồng ý mua.
Gọi N, M là tổng số sản phẩm, chính phẩm của nhà
máy, X là số chính phẩm có trong 100 sản phẩm lấy
ra kiểm tra thì X ~ H(N, M, 100). Cần tính P(X ≥ 93).
Do số sản phẩm lấy ra kiểm tra đủ nhỏ so với số sản
phẩm cũng như số chính phẩm của nhà máy và tỷ
chính phẩm M/N = 90% không quá gần 0 hay 1 nên:

H(N, M, 100) ≈ B(100, 90%)
Lại do n = 100 đủ lớn và p = 90% không quá gần 0
hay 1 nên B(100, 90%) ≈ N(90, 9). Vậy:


P(X ≥ 93) = 0,5 – Φ (

93 − 90

) = 0,5 – Φ(1) ≈ 15,87%

9
=1–NORMDIST(93, 90, 9^.5, 1)

Xác suất khách hàng đồng ý mua sản phẩm của nhà
máy là 15,87%.



2. Các phân phối của ĐLNN liên tục
2.1 Phân phối Chuẩn
Theo Liapunov, một ĐLNN X là tổng của một số
lớn các ĐLNN độc lập và mỗi giá trò của ĐLNN
thành phần có vai trò rất nhỏ trong tổng thì X sẽ là
một ĐLNN có quy luật phân phối Chuẩn.
Xét Z ~ N(0; 1), ta có P(–zα/2 < Z < zα/2) = 1–α.
Lấy α = 5% thì P(–1,96 < Z < 1,96) = 95%.
Điều này chứng tỏ một ĐLNN có phân phối
Chuẩn Chính tắc thì 95% giá trò của nó đều nằm
trong khoảng (–1,96; 1,96). Nói theo nguyên lý Xác
suất Lớn thì hầu hết giá trò của phân phối Chuẩn
Chính tắc đều nằm trong khoảng (–1,96; 1,96).


Lấy α = 5% thì P(Z < 1,6449) = 95%.
Điều này chứng to một ĐLNN có phân phối
Chuẩn Chính tắc thì 95% giá trò của nó đều nhỏ hơn
1,6449. Nói theo nguyên lý Xác suất Lớn thì hầu hết
giá trò của phân phối Chuẩn Chính tắc đều nhỏ hơn
1,6449.
X−µ
là phân phối Chuẩn
Nếu X ~ N(µ; σ2) thì
σ
X−µ
gọi là điểm−Z. ĐLNN X có
Chính tắc. Giá trò
σ

phân phối Chuẩn thì hầu hết giá trò điểm−Z của X
đều nằm trong khoảng (–1,96; 1,96) và hầu hết đều
nhỏ hơn 1,6449.


Ví dụ
Trọng lượng ghi trên bao bì của một bao cám là
5Kg với độ lệch chuẩn là 0,1Kg. Biết trọng lượng của
một bao cám lấy ngẫu nhiên là một ĐLNN có phân
phối Chuẩn.
a) Một bao cám được coi là đạt tiêu chuẩn nếu
trọng lượng sai lệch không quá 200g trọng lượng ghi
trên bao bì. Tính tỷ lệ bao cám đạt tiêu chuẩn.
b) Tính xác suất mua được một bao cám có trọng
lượng từ 4,9Kg đến 5,2Kg.
c) Trọng lượng tối đa của một bao cám trong số
95% bao cám nhẹ nhất là bao nhiêu?


Gọi X là trọng lượng một bao cám (đơn vò: Kg). Theo
giả thiết thì X ~ N(µ, σ2) với µ = 5, σ = 0,1.
a)

Cần tính P(X − 5 < 0,2). Ta có:
P(X−5< 0,2) = 2Φ(0,2/0,1) = 2Φ(2) ≈ 95%
=2*NORMSDIST(.2/.1)−1

b)

Cần tính P(4,9 < X < 5,2). Ta có:

5, 2 − 5
4, 9 − 5
P(4,9 < X < 5,2) = Φ(
) − Φ(
)
0,1
0,1
= Φ(2) – Φ(–1) = Φ(2)+Φ(1) ≈ 82%
=NORMDIST(5.2, 5, .1, 1) − NORMDIST(4.9, 5, .1, 1)


c) Gọi x là trọng lượng cần tìm. Trọng lượng của
một bao cám trong số 95% bao cám nhẹ nhất có
điểm−Z không quá 1,6449. Vậy:
x−5
= 1,6449 ⇒ x = 5,1645
0,1
Trọng lượng tối đa của một bao cám trong số 95%
bao cám nhẹ nhất là 5,1645Kg.


2.2 Phân phối Chi Bình phương

Xét X1, X2, …, Xk là các ĐLNN độc lập và có
phân phối Chuẩn Chính tắc. Đặt:

χ2 = X 12 + X 22 + ... + X k2

χ2 là ĐLNN liên tục gọi là có phân phối Chi
2

2
Bình phương bậc tự do k, ký hiệu χ ~χ (k). Ta có:
2
2
E(χ (k)) = k
Var(χ (k)) = 2k
Khi k ≥ 30 thì phân phối Chi Bình phương được
xấp xỉ bởi phân phối Chuẩn Chính tắc.
Trong ứng dụng, ta cần tìm phân vò mức α của
2
2
2
phân phối Chi Bình phương χ ~χ (k), tức là tìm χ α
2
2
2
sao cho P(χ > χ α) = α. Giá trò χ α được tìm bằng cách
tra bảng kê số hoặc dùng hàm Excel =CHIINV(α, k).


×