Tải bản đầy đủ (.pdf) (27 trang)

Tiểu luận các công thức tính xấp xỉ xác suất và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.03 MB, 27 trang )

Tiểu luận“Các công thức tính
xấp xỉ xác suất và ứng dụng”
NHÓM 3

Thành phố Hồ Chí Minh, ngày 6 tháng 4 năm 2014


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”

DANH SÁCH THÀNH VIÊN VÀ NHẬN XÉT CHI TIẾT HOẠT ĐỘNG NHÓM
1. Lê Thị Anh Thư: tìm lý thuyết + bài tập phần “Xấp xỉ phân phối siêu bội bằng phân
phối nhị thức”.
NX: Tích cực tham gia xây dựng bài tiểu luận, gửi bài rất sớm so với thời hạn dự kiến,
tìm được nhiều bài tập.
2. Lê Vĩnh Hiển: tìm lý thuyết + bài tập phần “Xấp xỉ phân phối nhị thức bằng phân phối
Poisson”
NX: Chưa tích cực tham gia làm bài tiểu luận, không gửi tài liệu phần được giao tìm
kiếm ở trên.
3. Võ Thị Thanh Thảo: tìm lý thuyết + bài tập phần “Xấp xỉ phân phối nhị thức bằng
phân phối chuẩn”
NX: Tích cực tham gia các hoạt động nhóm, gửi bài đúng hạn, tìm và dịch được nhiều tài
liệu tiếng Anh hay, có nhiều hình ảnh minh họa.
4. Phan Thị Ngọc Khuê: tìm lý thuyết + bài tập phần “Xấp xỉ phân phối Poisson bằng
phân phối chuẩn”
NX: Nhiệt tình tham gia trao đổi về bài tiểu luận, tuy chịu trách nhiệm tìm phần khó nhất
trong 4 mục xấp xỉ nhưng vẫn gửi bài đúng hạn, nội dung ổn.
5. Hồ Thị Quỳnh Trâm: tổng hợp 4 phần, sửa chữa, bổ sung thêm lý thuyết và bài tập.
(lượng bổ sung thêm khoảng 30%).
NX: Tích cực tham gia xây dựng và hoàn thành bài tiểu luận, hoàn thành đúng thời hạn
đề ra, tìm được nhiều bài tập bằng tiếng Anh lẫn tiếng Việt.


Nhóm 3

Page 2


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
1. XẤP XỈ PHÂN PHỐI SIÊU BỘI BỞI PHÂN PHỐI NHỊ THỨC
1.1. Cơ sở lý thuyết
Lấy ngẫu nhiên n phần tử từ tập hợp có N phần tử (trong đó có M phần tử có tính chất A).
Gọi X là số phần tử có tính chất A trong n phần tử lấy ra.
1. Nếu lấy ra theo nguyên tắc có hoàn lại (phép chọn lặp) thì ta có n phép thử độc
lập và X~B(n, p) với p 

M
N

2. Nếu lấy không hoàn lại (phép chọn không lặp) khi đó X~H(N, M, n)
Trường hợp n rất nhỏ so với N, sự khác biệt giữa cách lấy có hoàn lại và không hoàn lại
là không đáng kể và ta có thể dùng phân phối nhị thức để xấp xỉ phân phối siêu bội:
(X~H(N,M,N))  (X~B(N,p)) khi n<< N, ở đó p 
Khi đó: P(X=k)=

k

nk

M

N M


C .C
C
n

 Cn p
k

N

k

q

M
N

nk

(q=1-p)

*Chú ý: trong thực hành, khi n =< 0.01N thì có thể xấp xỉ tốt.
2.2. Bài tập ứng dụng
Bài 1: Một lô hàng chứa 10.000 sản phẩm, trong đó có 8.000 sản phẩm tốt và 2.000 sản
phẩm xấu. Chọn ngẫu nhiên từ lô hàng ra 10 sản phẩm. Tính xác suất chọn được 7 sản
phẩm tốt.
Bài giải
Gọi X là số sản phẩm tốt có trong 10 sản phẩm chọn ra. Khi đó X có phân phối siêu bội
X ~ H(N, M, n) với N = 10.000; M = 8.000; n = 10. Vì n = 10 rất nhỏ so với N = 10.000
nên ta có thể xem như X có phân phối nhị thức X ~ B(n,p)
Với n = 10; p 


M
= 8.000/10.000 = 0,8. Do đó xác suất chọn được 7 sản phẩm tốt là:
N

7
P(X  7)  C10
.(0,8)7 .0,23  0,2013

Bài 2: Một trường gồm có 10000 sinh viên, trong đó có 1000 học kém. Một Đoàn
thanh tra đến trường, chọn ngẫu nhiên 100 sinh viên để kiểm tra. Tính xác suất để có 20
sinh viên học kém.
Nhóm 3

Page 3


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
Bài giải
Gọi X là số sinh viên học kém trong 100 sinh viên được chọn ra.
Ta có: X ∈ H(10000; 1000; 100)
20

Suy ra P(X=20)= C C
C

80

1000
9000

100
10000

Vì N = 10000 rất lớn, n = 100 << N= 10000 nên X xấp xỉ phân phối nhị thức: X ~
B(100; 0,1) với p =M/N=1000/10000=0.1
Mặt khác, do n = 100 rất lớn và 0 << p = 0,1 << 1 nên ta có thể áp dụng công thức
Gauss để xấp xỉ
P(X  20)  C100(0.1) 20 .(0.9)80 

1

20

100.(0.1).(0.9)

f(

20  100(0.1)
100.(0.1).(0.9)

)

1 10
1
1
 f ( )  f (3.33)  .0.0017  0.00057
3 3
3
3


Bài 3: Một cây lan có 60000 cây sắp nở hoa, trong đó có 7000 cây hoa màu đỏ. Chọn
ngẫu nhiên 20 cây lan trong vườn này. Tính xác suất để chọn được 7 cây lan có hoa màu
đỏ.
Bài giải
Gọi X là ĐLNN chỉ số cây hoa lan có màu đỏ trong số 60000 cây sắp nở hoa thì X ~
H(60000, 7000, 20).
Bởi vì n=700 rất nhỏ so với N=60000 nên có thể xem X có phân phối nhị thức X~ B(20,
7000/60000)
Xác suất để chọn được 7 cây lan có hoa màu đỏ.
P(X  7)  C720 .(

7 7 53 13
) .( )  0,00455
60 60

Bài 4: Một công ty nhập 5000 thùng hóa chất, trong đó có 1000 thùng kém chất lượng.
Công ty này phân phối ngẫu nhiên 10 thùng (không hoàn lại) cho 1 cửa hàng. Tính xác
suất để cửa hàng này nhận 3 thùng kém chất lượng.
Bài giải
Gọi X là ĐLNN chỉ số thùng kém chất lượng trong số 10 thùng được chọn.
Nhóm 3

Page 4


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
Ta có, X là phân phối siêu bội, X~H(5000, 1000, 10)
Bởi vì n=10 rất nhỏ so với N=5000 nên có thể xem X là một phân phối nhị thức với n=10
và p = 1000/5000=0,2.
Suy ra: X~B(10; 0,2)

Xác suất để cửa hàng này nhận 3 thùng kém chất lượng là
3
P(X  3)  C10
.0,23.0,87  0,2013

Bài 5: Một của hàng có 10000 con cá da trơn, trong đó có 1000 con cá tra. Tính các suất
để khi chọn ngẫu nhiên 50 con cá thì được 10 con cá tra.
Bài giải
Gọi X là ĐLNN chỉ số con cá tra có trong 50 con lấy ra
Ta có: X ~ H(10000, 1000, 50).
Vì n=50 rất nhỏ so với N=10000 nên có thể xem X là một phân phối nhị thức với
p=1000/10000=0,1.
Suy ra: X ~ B(50;0,1).
Xác suất chọn được 10 con cá tra là
10
40
P(X  10)  C10
 0,015
50 .0,1 .0,9

Nhóm 3

Page 5


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
2. XẤP XỈ PHÂN PHỐI NHỊ THỨC BẰNG PHÂN PHỐI POISSON
2.1. Cơ sở lý thuyết
Khi X B(n, p) mà n khá lớn và p rất nhỏ (p<0,1) ta có thể xem như X~ P(np). Tức là có
xấp xỉ

P( X  k )  Cnk p k q n k 

(np)k  np
e ; q  1  p; k  0,1, 2,..., n.
k!

Chú ý: Xấp xỉ trên sẽ có hiệu quả khi np<5 hay nq<5.
2.2. Bài tập ứng dụng
Bài 1: Trong một quy trình sản xuất kính, khi sản xuất ra những sản phẩm lỗi hoặc bị sủi
bọt, người ta vẫn đưa ra những sản phẩm không mong muốn này cho bộ phận tiếp thị.
Biết rằng, trung bình trong 1000 sản phẩm có 1 sản phẩm bị sủi bọt. Xác suất để một mẫu
ngẫu nhiên gồm 8000 sản phẩm có chứa ít hơn 7 sản phẩm bị sủi bọt.
Bài giải
Đây chính là phép thử nhị thức với n = 8000 và p = 0,001. Do p rất gần số 0 và n khá lớn,
ta có thể xấp xỉ phân phối nhị thức bằng cách sử dụng phân phối Poisson P(a) trong đó a
= np = 8.
Do vậy, nếu gọi X là số sản phẩm bị sủi bọt, ta có:
6

P(X  7)   C
k 0

k
8000

.k

0,001

.(8000  k)


0,999

8k
 e .  0,3134
k 0 k!
8

6

Bài 2: Một ống dệt có 1000 ống sợi. Xác suất để trong một giờ máy hoạt động có 1 ống
sợi bị đứt là 0,2%. Tìm xác suất để trong 1 giờ có không quá 2 ống sợi bị đứt.
Bài giải
Ta xem việc quan sát một ống sợi trong khoảng thời gian một giờ máy hoạt động là một
phép thử. Khi đó, do máy dệt có 1000 ống sợi, ta có 1000 phép thử độc lập. Gọi A là biến
cố ống sợi bị đứt. Trong mỗi phép thử, biến cố A xảy ra với xác suất p = 0,2% = 0,002 và

Nhóm 3

Page 6


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
không xảy ra với xác suất q = 1 – p = 0,998. Do đó, gọi X là tổng số ống sợi bị đứt trong
một giờ hoạt động của máy thì X có phân phối nhị thức X ~ B(n, p) với n=1000; p=0,002.
Vì n = 1000 khá lớn và p = 0,002 < 0,1 nên ta có thể xem X có phân phối Poisson:
X~P(a) với a=np=2
Xác suất để có không quá 2 ống sợi bị đứt trong một giờ hoạt động của máy là

20 21 22

P(0  X  2)  P(X  0)  P(X  1)  P(X  2)  e .(   )  5.e 2  0,6767
0! 1! 2!
2

Bài 3: Một lô hàng thịt đông lạnh đóng gói nhập khẩu chứa 0,6% bị nhiễm khuẩn. Tính
xác suất để chọn ngẫu nhiễn 1000 gói thịt từ lô hàng này có.
a. Không quá 2 gói bị nhiễm khuẩn.
b. Đúng 40 gói bị nhiễm khuẩn.
Bài giải
Gọi X là số gói thịt bị nhiễm khuẩn trong 1000 gói thịt được chọn ngẫu nhiên.
Ta có X~B(1000, 0,006). Bởi vì n =1000 khá lớn và p=0,006<0,1 nên ta có thể xem như
X~P(np), trong đó np=6 để tính gần đúng P(X  2)
a) Xác suất để có không quá 2 gói bị nhiễm khuẩn là:
0
6k 6
61 62
6 6
P(X  2)   .e  e .(   )  0,0619
0! 1! 2!
k 0 k!
2

b) Xác suất để có đúng 40 gói bị nhiễm khuẩn
40
P(X  40)  C1000
.0,00640.(1000  40)10,006 

640 6
.e  4,06.1020
40!


Bài 4: Một bao thóc có tỷ lệ hạt lép là 0,01%. Chọn ngẫu nhiên liên tiếp 5000 hạt. Tính
xác suất để:
a) Có đúng 2 hạt thóc lép.
b) Có ít nhất 2 hạt thóc lép.
Bài giải
Nhóm 3

Page 7


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
Gọi X là số hạt lép trong 5000 hạt.
Ta có: X ~ B(5000; 0,0001)
Do n = 5000 khá lớn và p = 0,0001 khá bé ta dùng xấp xỉ:
X  P(  ) với  = 5000. 0,0001 = 0,5  X ~ P(0,5)
Với P(X=K) =

e0,5 .0,5 K
K!

a) Gọi A là biến cố có đúng 2 hạt thóc lép khi chọn ngẫu nhiên liên tiếp 5000 hạt thóc.
 P(A)=P(X=2)=

e0,5 .0,5 2
 0, 0758
2!

b) Gọi B là biến cố có ít nhất 2 hạt thóc lép khi chọn ngẫu nhiên liên tiếp 5000 hạt thóc.
 P(B) = P(X≥2)= 1- [P(X=0)+P(X=1)] = 1 – (


e0,5 .0,5 0 e0,5 .0,51
+
) = 0,0902
0!
1!

Bài 5: Nước giải khát được chở từ Sài Gòn đi Vũng Tàu, mỗi xe chở 1000 chai bia Sài
Gòn, 2000 chai Coca và 800 chai nước trái cây. Xác suất để một chai mỗi loại bị bể trên
đường đi tương ứng là 0,2%; 0,11% và 0,3%. Nếu không quá một chai bị bể thì lái xe
được thưởng.
a. Tính xác suất có ít nhất một chai bia Sài Gòn bị bể.
b. Tính xác suất để lái xe được thưởng.
c. Lái xe phải chở ít nhất mấy chuyến để có ít nhất một chuyến được thưởng không nhỏ
hơn 0,9.
Bài giải
Gọi X1 là ĐLNN chỉ số chai bia Sài Gòn bị bể trong một chuyến. Khi đó, X1 có phân
phối nhị thức X1~(1000; 0,002). Vì n1 = 1000 khá lớn và p1 = 0,002 <0,1 nên ta có thể
xem X1 có phân phối Poisson
X1 ~ P(a1) với a1 = n1p1 = 1000.0,002 = 2, nghĩa là X1 ~ P(2)
Hoàn toàn tương tự, gọi X2; X3 lần lượt là các ĐLNN chỉ số chai Coca, chai nước trái cây
bị bể trong 1 chuyến. Khi đó X2; X3 có phân phối Poisson:
X2 ~ P(2000.0,0011) = P(2,2)
Nhóm 3

Page 8


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
X3 ~ P(800.0,03) = P(2,4)

a) Xác suất có ít nhất một chai bia Sài Gòn bị bể là

P(X1  1)  1  P(X1  0)  1 

20 2
.e  0,865
0!

b) Xác suất để lái xe được thưởng
Theo đề bài, lái xe được thưởng khi có không quá 1 chai bị bể; nghĩa là
X1 + X 2 + X 3  1
Vì X1 ~ P(2); X2 ~ P(2,2); X3 ~ P(2,4) nên X1 + X2 + X3 ~ P(2+2,2+2,4) = P(6,6)
Suy ra xác suất lái xe được thưởng là
P(X1 + X2 + X3  1 )= P(X1 + X2 + X3 = 0) + P(X1 + X2 + X3 = 1)

 e6,6 .(

6,60 6,61

) =0,0103.
0!
1!

c. Gọi n là số chuyến cần thực hiện và A là biến cố có ít nhất một chuyến được thưởng.
Yêu cầu bài toán là xác định n nhỏ nhất sao cho P(A)  0,9 . Biến cố đối lập của A là A :
không có chuyến nào được thưởng
Theo câu b; xác suất để lái xe được thưởng trong 1 chuyến là p=0,0103. Do đó theo công
thức Bernoulli ta có:
P(A) = 1 – P( A ) = 1 – qn = 1 – (1 – 0,0103)n = 1 – (0,9897)n
Suy ra:

P(A)  0,9  1 –

 0,9897 

n

 0,9

  0,9897   0,1
n

 n  223

Vậy lái xe phải chở ít nhất là 223 chuyến.

Bài 6: Một máy tính gồm 1000 linh kiện, 800 linh kiện B và 2000 linh kiện C. Xác suất
hỏng của 3 linh kiện đó lần lượt là 0,02%; 0,0125% và 0,005%. Máy tính ngưng hoạt
động khi số linh kiện hỏng nhiều hơn 1. Các linh kiện hỏng độc lập với nhau.
a. Tính xác suất để có ít nhất 1 linh kiện B bị hỏng.
Nhóm 3

Page 9


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
b. Tính xác suất để máy tính ngưng hoạt động.
c. Giả sử trong máy đã có 1 linh kiện hỏng. Tính xác suất để máy tính ngưng hoạt động.
Bài giải
Gọi X1 là ĐLNN chỉ số linh kiện A bị hỏng trong một máy tính. Khi đó, X1 có phân phối
nhị thức X1~(1000; 0,002). Vì n1 = 1000 khá lớn và p1 = 0,002 <0,1 nên ta có thể xem X1

có phân phối Poisson
X1 ~ P(a1) với a1 = n1p1 = 1000.0,002 = 2, nghĩa là X1 ~ P(2)
Hoàn toàn tương tự, gọi X2; X3 lần lượt là các ĐLNN chỉ số linh kiện B, linh kiện C bị
hỏng trong một máy tính. Khi đó X2; X3 có phân phối Poisson:
X2 ~ P(800.0,000125) = P(0,1)
X3 ~ P(2000.0,00005) = P(0,1)
a) Xác suất có ít nhất một linh kiện B bị hỏng là

P(X 2  1)  1  P(X 2  0)  1 

0,10 0,1
.e  0,0952
0!

b) Xác suất để máy ngưng hoạt động
Theo đề bài, máy tính ngưng hoạt động khi số linh kiện hỏng nhiều hơn 1; nghĩa là
X1 + X 2 + X 3  1
Vì X1 ~ P(0,2); X2 ~ P(0,1); X3 ~ P(0,1) nên X1 + X2 + X3 ~ P(0,2+0,1+0,1) = P(0,4)
Suy ra xác suất để máy ngưng hoạt động là
P(X1 + X2 + X3  1 )=1 - P(X1 + X2 + X3  1 ) = 1 – (P(X1 + X2 + X3 = 0) + P(X1 + X2 +
X3 = 1)

 1  e0,4 .(

0, 40 0, 41

)  0,0615
0!
1!


c. Giả sử trong máy đã có 1 linh kiện hỏng. Khi đó máy tính ngưng hoạt động khi có
thêm ít nhất một linh kiện hỏng nữa, nghĩa là khi
X1 + X 2 + X 3  1
Suy ra xác suất để máy tính ngưng hoạt động trong trường hợp này là:

Nhóm 3

Page 10


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
P(X1 + X2 + X3  1 )

 1  e0,4

= 1 – P(X1 + X2 + X3  1 ) = 1– (P(X1 + X2 + X3 = 0)

0, 40
 0,3297
0!

Bài 7: Một trường cấp 3 có 900 học sinh. Giả sử trong 1 năm trung bình mỗi học sinh
phải nằm ở trạm y tế của trường 1 ngày và khả năng bị bệnh của học sinh phân phối đều
cho các ngày của năm. Số giường của trạm ý tế tối thiểu là bao nhiêu để tỷ lệ không đủ
giường cho người bệnh ít hơn 0,01?
Bài giải
Gọi X là số học sinh phải nằm trạm y tế trong 1 ngày thì X ~ B(900, 1/365).
Vì n = 1500 khá lớn và p 

1

 0,00275 <0,1 cho nên X ~ P(a) với a = np = 4,125.
365

Gọi m là số giường tối thiểu cần có để tỷ lệ đủ giường bệnh ít hơn 0,01 hay nói cách khác
tỷ lệ đủ giường cho người bệnh ít nhất là 0,99.

a k a
P(X  m)   .e  0,99
k 0 k!
m

 m=7 (thử lần lượt từng giá trị đến khi m=7).
 Vậy cần phải có tối thiểu 7 giường để tỷ lệ không đủ giường cho người bệnh ít
hơn 0,01.

Nhóm 3

Page 11


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”

TÓM TẮT CÁC LOẠI XẤP XỈ RỜI RẠC

p

M
N

X ~ B(n, p)


X ~ H(N, M, n)

a  n.

M
N

a  n.p

Sai số rất lớn

X ~ P(a)

Nhóm 3

Page 12


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
3. XẤP XỈ NHỊ THỨC BẰNG PHÂN PHỐI CHUẨN
3.1. Cơ sở lý thuyết
Khi sử dụng phân phối nhị thức, nếu n khá lớn thì việc tính toán theo công thức Bernoulli
sẽ gặp khó khăn vì khi đó cỡ mẫu gia tăng chúng ta sẽ mất nhiều công sức hơn để tính số
lúy thừa cao của p và q (tức là của (1-p)) và số hạng cần phải tính để cộng lại với nhau
cũng nhiều hơn.
Lúc đó nếu p nhỏ đến mức np  npq thì có thể dùng phân phối Poisson thay thế cho nhị
thức. Nhưng nếu p không nhỏ (p>0,1) thì không thể dùng phân phối Poisson để thay thế
được. Khi đó ta dùng phân phối chuẩn để thay thế cho phân phối nhị thức.
Đôi khi rất khó để tính toán xác suất trực tiếp cho một nhị thức (n, p) biến ngẫu nhiên, X.

Chúng ta cần một bảng khác nhau cho mỗi giá trị của n, p. Nếu chúng ta không có một
bảng,việc tính toán trực tiếp có thể nhận được kết quả nhanh chóng như rất rườm rà.
Ví dụ: Tính P (X ≤ 100) với n = 150, p = 0,35.
Đối với các biến ngẫu nhiên bình thường thì việc tính xác là rất dễ dàng, chỉ cần tra bảng.
Tuy nhiên, chúng ta có thể xấp xỉ phân phối nhị thức bởi một phân phối chuẩn, với cách
chọn μ và σ thích hợp.
Để có thể hiểu được tại sao điều này có thể xảy ra, chúng ta hãy nghiên cứu quincunx.
Quincunx là một thiết bị được phát minh bởi Sir Francis Galton trong những năm 1800.
trong đó cho thấy khi quan sát nhiều lần các biến nhị thức ngẫu nhiên cho ra một biểu đồ
trông giống hình chuông, miễn là số các phép thử không phải là quá nhỏ.
(Xem trang web quincunx tại: />Nói chung sự phân phối của một biến nhị thức ngẫu nhiên có thể xấp xỉ chính xác bằng
một biến ngẫu nhiên chuẩn miễn là np ≥ 5, nq ≥ 5, và giả định rằng sự liên tục được thực
hiện để giải thích cho thực tế là chúng ta đang sử dụng một phân phối liên tục (phân phối
chuẩn) để xấp xỉ một nhị thức rời rạc
Để xấp xỉ phân phối của X, chúng ta sẽ sử dụng phân phối chuẩn có nghĩa là μ = np,
phương sai σ2 = npq, trong đó q = 1 - p
Nhóm 3

Page 13


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
Từ đó chúng ta rút ra được một biểu đồ dạng thanh của phân phối nhị thức với n,p cho
trước xếp chồng lên các phân phối chuẩn để tạo xấp xỉ. Lưu ý cách tăng lên khi p dịch
chuyển ra khỏi 0,5
 Nếu p(x) là phân phối Nhị thức và f(x) là mật độ chuẩn thì xấp xỉ là
a

p (a ) 


1
2



f ( x)dx

1
a
2

b

b

1
2

 p( x)  
x a

f ( x)dx

1
a
2

 Như vậy xác suất nhị thức p(a) xấp xỉ bằng xác suất mà 1 RV chuẩn nghĩa là np và
1
1

và x = a+ . Ngoài ra, P (a ≤ X ≤ b) xấp xỉ
2
2
1
1
bằng diện tích dưới đường cong chuẩn giữa x = a - và x = b +
2
2
1
1
Sự liên tục chính là việc sử dụng a - và b + trong xấp xỉ chuẩn. Điều này đảm
2
2

phương sai npq nằm giữa x = a-



bảo rằng xác suất luôn luôn xấp xỉ bằng vùng dưới đường cong chuẩn. Nó có thể
cải thiện đáng kể chất lượng của các xấp xỉ, thậm chí khi n lớn, vì vậy nó nên
được sử dụng bất cứ khi nào có thể.

Trong sơ đồ trên, các thanh đại diện cho phân phối nhị thức

Nhóm 3

Page 14


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”

với n = 10, p = 0,5. Đường cong chồng lên trên là mật độ chuẩn f (x). Gía trị chuẩn là μ =
np = 5, và các tiêu chuẩn lệch là
  10.(0,5).(0,5)  1,58

Giả sử chúng ta muốn tìm p(4), xác suất mà các nhị thức bằng 4.
Từ Bảng 2 Phụ lục B, chúng ta có:
p (4) = 0,3770-0,1719 = 0,2051
Đây là xác suất chính xác, nhưng chúng ta sẽ không luôn tìm được xác suất từ một bảng
nhị thức cho trước n và p.
Vì vậy, sử dụng xấp xỉ bằng phân phối chuẩn là cần thiết.
Theo sơ đồ, diện tích mật độ chuẩn giữa 3,5 và 4,5 cho biết một xấp xỉ hợp lí cho chiều
cao của thanh p(4). Điều này sẽ lý giải rõ ràng tại sao sự điều chỉnh liên tục là hữu ích
* CÔNG THỨC
Đối với ĐLNN X có phân phối nhị thức kiểu B(n,p), khi p không quá gần 0 hoặc 1 và n
khá lớn, ta có thể xem X~N(np, npq), q=1-p; tức là có xấp xỉ
P( X  k )  Cnk p k q n k 

P ( a  X  b)   (

1
k  np
f(
), k  0,1,..., n ; f(x) là hàm mật độ Gauss;
npq
npq

b  np
a  np
) (
) ;  ( x) là hàm Laplace.

npq
npq

Chú ý:
i) Việc xấp xỉ sẽ tốt nếu n, p thỏa mãn một trong các điều kiện sau:
0,1  p  0,5;np  5 hoặc là 0,5  p  0,9;n(1  p)  5

ii) Ta phải tìm xác suất p trong phân phối nhị thức X ~ B(n, p). Sau đó, tùy ý theo p nhỏ
hay lớn, mà ta xấp xỉ X bằng phân phối Poisson hay phân phối chuẩn.
3.2. Bài tập ứng dụng
Bài 1: Các hãng hàng không và khách sạn thường chấp thuận việc đặt phòng trước vượt
quá năng lực phòng nhằm giảm thiểu những tổn thất do đã đặt phòng nhưng không sử
dụng. Giả định rằng ghi nhận của một khách sạn dọc đường cho thấy, tính trung bình thì
có 10% khách sắp đến của họ sẽ không yêu cầu đặt chỗ trước. Nếu khách sạn chấp nhận

Nhóm 3

Page 15


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
215 chỗ đặt trước và chỉ có 200 phòng trong khách sạn đó, thì xác suất mà tất cả khách
đến yêu cầu một phòng sẽ nhận được phòng là bao nhiêu?
Bài giải
Theo đề, 10% khách sắp đến của họ sẽ không yêu cầu đặt chỗ trước, suy ra 90% khách
đến của họ yêu cầu đặt chỗ trước. Tức là giả sử nếu có 100 khách đặt chỗ trước thì chỉ có
90 khách đến nhận phòng.
Gọi X là ĐLNN chỉ số khách đến yêu cầu một phòng, thì X ~ B(215; 0,9).
Vì n =215 khá lớn và p = 0,9 không quá gần 0 cũng không quá gần 1 nên có thể xấp xỉ X
bằng công thức Laplace. Trong đó np=215.0,9=193,5 và


npq  4, 4

Xác suất để tất cả các khách đến yêu cầu một phòng sẽ nhận được phòng là

P(X  200)  P(0  X  200)  (

200  193,5
0  193,5
)  (
)
4, 4
4, 4

 (1, 47)  (43,9)
 0, 4922  0,5
 0.9922
Bài 2: Một khách sạn nhận đặt chỗ của 425 khách hàng cho 400 phòng vào ngày 30
tháng 4 vì theo kinh nghiệm của những năm trước cho thấy tỷ lệ khách đặt chỗ nhưng
không đến là 10%. Tính xác suất:
a. Có 400 khách đến vào ngày 30 tháng 4 để nhận phòng.
b. Tất cả khách đến vào ngày 30 tháng 4 đều nhận được phòng
Bài giải
Gọi X là số khách đặt phòng vào ngày 30 tháng 4, khi đó X~B(425;0,9) với
np=425.0,9=382,5 và

npq  425.0,9.0,1  6,185 .

a. Ta có:
P  X  400


1
400  np
f(
)
npq
npq

1
400  382,5
f(
)
6,185
6,185

f (2,83)
 0, 0012
6,185

b. Xác suất tất cả các khách đến vào ngày 30 tháng 4 đều có phòng:

Nhóm 3

Page 16


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”

401  382,5
0  382,5

)  (
)
6,185
6,185
 (2,991)  (61,84)  (2,7485)  ((61,924)
 0, 49861  0,5  0,99861
P(X  400)  P(0  X  401)  (

Bài 3: Sáng mai chuyến bay từ Ilberia đến Mandrid có thể chứa 370 hành khách. Theo
kinh nghiệm trước đây, Ilberis biết rằng xác suất 1 hành khách giữ vé xuất hiện trong
chuyến bay là 0,90. Họ đã bán 400 vé, cố tình đặt trước nhiều chuyến bay. Làm thế nào
Ilberia có thể tự tin rằng sẽ có hành khách không lên chuyến bay ( hoặc trì hoãn lại
chuyến bay) ?
Bài giải
Gọi X là số hành khách sẽ xuất hiện trong chuyến bay có phân phối nhị thức X~B(400;
0,9)
Với   400.(0,9)  360 và độ lệch chuẩn   400.(0,9).(0,1)  6
Chúng ta muốn P [X ≤ 370]. Vì n=400 khá lớn và p = 0,9 không quá gần 0 và không quá
gần 1 nên có thể áp dụng công thức Laplace để tính. Chúng ta xấp xỉ điều này như sau:

P(X  370)  P(0  X  370)  (

370  360
0  360
)  (
)
6
6

 (1,67)  (60)

 (1,67)  (60)
 0, 45254  0,5
 0,95254
Bài 4: Một nhà máy có 3 phân xưởng cùng sản xuất ra một loại sản phẩm. Tỷ lệ sản
phẩm loại II của các phân xưởng tương ứng là: 10%, 20%, 30%. Từ một lô hàng 10000
sản phẩm (trong đó có 3000 sản phẩm của phân xưởng 1; 4000 sản phẩm của phân xưởng
2 và 3000 sản phẩm của phân xưởng 3); người ta chọn ngẫu nhiên ra 100 sản phẩm để
kiểm tra. Nếu thấy có không quá 24 sản phẩm loại II trong số 100 sản phẩm kiểm tra thì
mua lô hàng đó. Tìm xác suất để lô hàng được mua.
Bài giải
Gọi X là số sản phẩm loại II có trong 100 sản phẩm lấy ra từ lô hàng để kiểm tra thì X có
phân phối siêu bội
Nhóm 3

Page 17


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
Nhưng vì lấy ra 100 sản phẩm từ tập hợp có số lượng lớn là 10000, nghĩa là lấy ít từ một
tập hợp có số lượng phần từ lớn nên ta có thể xem X là một phân phối nhị thức với n=100
và p 

M 3000.0,1  4000.0, 2  3000.0,3

 0, 2 .
N
10000

Suy ra: X ~ B(100; 0,2).
Gọi A là biến cố “lô hàng được mua”.

Ta có: P(A)  P(X  24)
Sử dụng công thức tích phân Laplace:

P(X  24)  P(0  X  24)  (

24  20
100.0, 2.0,8

)  (

0  20
100.0, 2.0,8

)

 (1)  (5)  0,34134  0,5  0,84134
Bài 5: Độ tin cậy của cầu chì điện là xác suất để cho cầu chì đó, được chọn ngẫu nhiên từ
số sản phẩm sản xuất ra, sẽ hoạt động được trong những điều kiện mà qua đó nó được
thiết kế. Một mẫu ngẫu nhiên gồm 1000 cầu chì được kiểm tra và x=27 cầu chì lỗi được
quan sát. Tính xác suất của việc quan sát thấy 27 hoặc nhiều hơn số cầu chì bị lỗi, bằng
cách giả định rằng độ tin cậy của cầu chì là 0,98.
Bài giải
Xác suất của việc quan sát một sản phẩm bị lỗi khi một cầu chì duy nhất được kiểm tra là
p = 0,02; khi đã biết độ tin cậy của cầu chì là 0,98.
Gọi X là số cầu chì bị lỗi quan sát được trong 1000 cầu chì lấy ra thì X ~ B(1000; 0,02).
Vì n = 1000 lớn và n = 0,02 không quá gần 0 cũng không quá gần 1 nên ta có thể dùng
công thức Laplace.
Ta có: np = 1000.0,02=20 và

npq  1000.0,02.0,98  4,43


P(X  27)  P(27  X  1000)  (

1000  20
27  20
)  (
)
4, 43
4, 43

 (221, 2)  (1,58)
 0,5  0, 44295  0,05705

Nhóm 3

Page 18


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
Bài 6: Trong một đợt thi tay nghề, mỗi công nhân dự thi sẽ chọn ngẫu nhiên một trong
hai máy và với máy đã chọn sản xuất 100 sản phẩm. Nếu trong 100 sản phẩm sản xuất ra
có từ 80 sản phẩm loại I trở lên thì được nâng bậc thợ. Giả sử đối với công nhân A, xác
suất để sản xuất được sản phẩm loại I đối với 2 máy tương ứng là 0,7 và 0,9. Tính xác
suất để công nhân A được nâng bậc thợ.
Bài giải
Gọi A1, A2 tương ứng là các biến cố công nhân A chọn được máy thứ nhất; thứ hai; B là
biến cố công nhân A được nâng bậc thợ. Áp dụng công thức xác suất đầy đủ, ta có:
P(B) = P(A1). P(B/A1) + P(A2). P(B/A2)
Gọi X1, X2 tương ứng là các biến cố công nhân A chọn được máy thứ nhất, thứ hai.
X1 ~ B(100; 0,7)


X2 ~ B(100; 0,9)

P(B/A1)=P(X1  0,8) = P(80  X1  100)
Vì n = 100 khá lớn và p=0,7 không quá gần 0 và không quá gần 1, nên áp dụng công thức
tích phân Laplace, ta có:

P(80  X1  100)  (

100  70
100.0,7.0,3

)  (

80  70
100.0,7.0,3

)

 (6,546)  (2,18)  0,5  0,48537  0,01463
Tương tự, ta có: P(B/A2)=P(X2  0,8) = P(80  X2  100)

P(80  X 2  100)  (

100  90
100.0,9.0,1

)  (

80  90

100.0,9.0,1

)

 (3,33)  (3,33)  2(3,33)  2.0,49957  0,99914
1
Vậy P(B)  (0,01463 0,99914) 0,507 .
2

Bài 7: Một phân xưởng có 3 máy cùng sản xuất một loại sản phẩm. Tỷ lệ sản phẩm loại
A của máy thứ nhất, thứ hai và thứ ba tương ứng là: 70%, 80%; 90%. Các sản phẩm do
phân xưởng sản xuất được đóng thành từng hộp, mỗi hộp có 10 sản phẩm (trong đó có 3
sản phẩm do nhà máy thứ nhất sản xuất; 4 sản phẩm do nhà máy thứ hai sản xuất và 3 sản
phẩm do nhà máy thứ ba sản xuất. Tiến hành kiểm tra lô hàng do phân xưởng sản xuất
theo cách sau: Từ lô hàng chọn ngẫu nhiên không hoàn lại 100 hộp, rồi từ các hộp đã
Nhóm 3

Page 19


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
chọn lấy ra ngẫu nhiên 1 sản phẩm để kiểm tra. Nếu thấy có 80 sản phẩm loại A trở lên
thì nhận lô hàng. Tính xác suất nhận lô hàng
Bài giải
Gọi B là biến cố nhận lô hàng.
Gọi X là ĐLNN chỉ số sản phẩm loại A có trong 100 sản phẩm lấy ra kiểm tra.
Theo đề, nếu có 80 sản phẩm loại A trở lên thì nhận lô hàng. Suy ra, B  (X  80) .
Gọi p là xác suất lấy được sản phẩm loại A khi lấy ngẫu nhiên một hộp ra để kiểm tra.
Áp dụng công thức xác suất đầy đủ, ta tính được:
p


3
4
3
.0,7  .0,8  .0,9  0,8
10
10
10

Vậy X ~ B(100; 0,8)
Vì n = 100 khá lớn và p = 0,8 không quá gần 0 cũng không quá gần 1 nên ta có thể áp
dụng công thức tích phân Laplace.
Trong đó: np = 100.0,8=80 và

npq  100.0,8.0,2  4

P(X  80)  P(80  X  100)  (

100  80
80  80
)  (
)
4
4

 (5)  (0)  0,5

Bài 8: Sản phẩm của một nhà máy sau khi sản xuất xong được đóng thành từng hộp. Mỗi
hộp có 10 sản phẩm. Gọi X là số sản phẩm loại I có trong mỗi hộp. Cho biết X có phân
phối xác suất như sau:

X
7
8
P
0,2
0,3
Tiến hành kiểm tra 300 hộp theo cách sau:

9
0,3

10
0,2

Mỗi hộp chọn ngẫu nhiên ra 3 sản phẩm để kiểm tra. Nếu thấy cả 3 sản phẩm lấy ra kiểm
tra đều là loại I thì nhận hộp đó.
a. Tính xác suất để số hộp nhận được thuộc khoảng (170; 190).
b. Tìm số hộp được nhận có khả năng lớn nhất.
Bài giải

Nhóm 3

Page 20


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
a. Gọi p là xác xuất bốc được 3 sản phẩm loại I hoặc còn có thể nói à xác suất để một hộp
được nhận.
Áp dụng công thức xác suất đầy đủ, ta có:
3

C37
C83
C39
C10
73
p  0, 2. 3  0,3. 3  0,3. 3  0, 2. 3 
C10
C10
C10
C10 120

Gọi Y là ĐLNN chỉ số hộp nhận được.
Y ~ (300,

73
73
). Tuy nhiên, do n = 300 khá lớn và p =
không quá gần 0 cũng không
120
120

quá gần 1 nên có thể áp dụng công thức Laplace (với np=182,5 và

npq  300.

73 47
.
 8, 45 )
120 120


Xác số số hộp nhận được thuộc khoảng (170; 190)

190  182,5
170  182,5
P(170  X  190)  (
)  (
)
8, 45
8, 45
 (0,8875)  (1, 479)
 (0,8875)  (1, 479)
 0,31259  0, 43043
 0,74302
b. Xác suất số hộp nhận được khả năng lớn nhất
np  q  Mod(X)  np  p

Suy ra: Mod(X)=183
Bài 9: Phân phối theo độ tuổi của những chủ hộ là một công cụ quan trọng cho nhà tiếp
thị quan tâm đến việc quảng cáo phù hợp với độ tuổi cho một sản phẩm cụ thể mà học
mong muốn tung ra thị trường. Một nghiên cứu do Joint Center for Housing Studies
(Trung tâm chung nghiên cứu Nhà ở) thực hiện đã ước tính rằng vào năm 1995 thì 31%
tất cả các chủ hộ sẽ nằm trong độ tuổi từ 45 đến 64 (Darney, 1994). Giả định một mẫu
gồm 500 chủ hộ được lấy trong năm 1995. Xác suất để cho có ít hơn 135 chủ hộ nằm
trong độ tuổi từ 45 đến 64 là bao nhiêu?
Bài giải

Nhóm 3

Page 21



Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
Gọi X là ĐLNN chỉ số chủ hộ trong độ tuổi từ 45 đến 64 thì X ~ B(500; 0,31).
Do n = 500 khá lớn và p = 0,31 không quá gần 0 cũng không quá gần 1 nên có thể áp
dụng công thức Laplace để tính xấp xỉ xác suất của X. Với np=500.0,31=155 và

npq  500.0,31.0,69  10,34
P(X  134)  P(0  X  134)  (

134  155
0  155
)  (
)
10,34
10,34

 (2,03)  (14,99)
 (2,03)  (14,99)
 0, 47882  0,5
 0,02118
Bài 10: Một kí túc xá có 1000 sinh viên, nhà ăn phục vụ bữa trưa làm 2 đợt liên tiếp. Số
chỗ ngồi của nhà ăn tối thiểu là bao nhiêu để tỷ lệ sinh viên không có chỗ ngồi ít hơn
0,01?
Bài giải
Gọi X là số sinh viên chọn đến nhà ăn trong đợt 1 và đợt 2 là 1000 – X.
Khi đó X ~ B(1000; 0,5). Vì n =1000 khá lớn và p = 0,5 không quá gần 0 cũng không quá
gần 1 nên ta có thể áp dụng công thức Laplace. Trong đó; np=500 và

npq  1000.0,5.0,5  5 10
Xác suất để tỷ lệ sinh viên không có chỗ ngồi ít hơn 0,01 là


P(X  k;1000  X  k)  0,99  P(1000  k  X  k)  0,99
k  500
500  k
 (
)  (
)  0,99
5 10
5 10
k  500
 2(
)  0,99
5 10
k  500
 (
)  0, 495
5 10
k  500

 0,18795
5 10
 k  502,9
Vậy số chỗ tối thiểu là 503 chỗ.

Nhóm 3

Page 22


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”


TÓM TẮT XẤP XỈ CHUẨN CHO NHỊ THỨC

X ~ B(n, p)
EX = np
VarX=npq

µ = np
 = npq
2

X ~ N(µ,  2 )
EX = µ
VarX =  2

Suy ra:
P( X  k )  Cnk p k q n k 
P ( a  X  b)   (

Nhóm 3

1
k  np
f(
), k  0,1,..., n ; f(x) là hàm mật độ Gauss;
npq
npq

b  np
a  np

) (
) ;  ( x) là hàm Laplace.
npq
npq

Page 23


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
4. XẤP XỈ PHÂN PHỐI POISSON BẰNG PHÂN PHỐI CHUẨN
4.1. Cơ sở lý thuyết
Những hình ảnh dưới đây minh họa sự phân phối của phân phối Poisson P(X) với những
giá trị trung bình khác nhau

Nhóm 3

Page 24


Tiểu luận“Các công thức tính xấp xỉ xác suất và ứng dụng”
Từ những hình ảnh phía trên, chúng ta có thể thấy khi tăng dần giá trị α lên thì đồ thị biến
đổi về dạng tương tự như đồ thị hình chuông của phân phối chuẩn. Đồng thời giá trị
có khả năng xảy ra nhất rất gần với giá trị α.
Phân phối bình thường cũng có thể được sử dụng để xấp xỉ phân phối Poisson với điều kiện
trị trung bình của λ (số lần thành công được kỳ vọng lớn hơn hoặc bằng 5).
Vì trung bình và phương sai của phân phối Poisson là tương đương :
   2   , nên độ lệch chuẩn    , và biến cố X được chuẩn hóa thành biến cố Z

lúc này được tính như sau:


Z 

X 





x



4.2. Bài tập ứng dụng
Bài 1:Tại một nhà máy, số lần ngừng việc trung bình mỗi ngày vì những vấn đề liên quan
đến máy móc trong quá trình sản xuất là 12. Xác định xác suất để có không quá 15 lần
ngừng việc vì hỏng máy trong một ngày làm việc bất kỳ.
Bài giải
Lúc này các đặc trưng của phân phối bình thường dùng để xấp xỉ phân phối Poisson được
xác định như sau:
   2    12

Biến ngẫu nhiên liên tục Z, được chuẩn hóa từ biến ngẫu nhiên rời rạc X đại diện cho số
lần gặp kết cục thành công đã được điều chỉnh tính liên tục là 15,5 được tính như sau:
Z

X 






15,5  12
 1, 01
12

Như vậy xác suất gần đúng để có không quá 15 lần ngừng việc là 0.8438, còn giá trị xác
suất chính xác tính theo công thức của phân phối Poisson là 0.8444.
Bài 2:Số tai nạn lao động trung bình trong một năm của một nhà máy là 6.5 vụ. Tính xác
suất trong một năm nào đó có tối đa 7 vụ tai nạn lao động.
Bài giải

Nhóm 3

Page 25


×