Tải bản đầy đủ (.pdf) (7 trang)

Bài giảng Thống kê y học - Bài 3: Xác suất có điều kiện - Định luật nhân xác suất

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (366.4 KB, 7 trang )

XÁC SUẤT CÓ ĐIỀU KIỆN - ĐỊNH LUẬT NHÂN XÁC SUẤT
Mục tiêu
Sau khi nghiên cứu chủ đề, học viên có khả năng:
­ Trình bày định nghĩa của xác suất có điều kiện
­ Trình bày công thức cộng xác suất và công thức nhân xác suất
1. Xác suất có điều kiện
Nếu các kết cục có thể  không bao gồm toàn thể  các kết cục (khi một số  kết cục bị 
hạn chế)  thì xác suất có thể được gọi là xác suất có điều kiện.
Xác suất có điều kiện được kí hiệu P(đặc tính quan tâm|Điều kiện)
Bảng 2. Giới tính của bệnh nhân của khoa Phổi và khoa Thận bệnh viện X

Tổng số

Khoa 
Phổi

Khoa 
Thận

Nam

11

4

15

Nữ

27


8

35

Tổng số

38

12

50

Thí dụ: Ở khoa Phổi và khoa Thận của bệnh viện X có 50 bệnh nhân và phân  
bố  của các đặc điểm của bệnh nhân này được trình bày trong bảng. Chọn một người  
bất kì, xác suất người là nam  và nằm ở khoa Phổi ­ P(Nam và Khoa Phổi)­ có phải là 
xác suất có điều kiện hay không? Hãy tính xác suất này.
Chọn một người bất kì, Xác suất người là nam  và nằm ở khoa Phổi ­ P(Nam và Khoa 
Phổi) – không phải là xác suất có điều kiện bởi vì các kết cục không có hạn chế   (ai  
cũng có thể được chọn).  
N: Số kết cuộc có thể là 50; m: số các kết cuộc thuận lợi cho 11; 
P (Nam và Khoa Phổi) = 
Thí dụ: Chọn một người nam, xác suất người này nằm ở khoa Phổi có phải là 
xác suất có điều kiện hay không? Hãy tính xác suất này.
Chọn một người nam, xác suất người này nằm  ở  khoa Phổi là xác suất có điều kiện  
bởi vì số kết cục bị hạn chế (chỉ có bệnh nhân nam được chọn và như vậy kết cục chỉ 
có thể là 1 trong số 15 bệnh nhân nam)
Nc: Số kết cuộc có thể là 15; m: số các kết cuộc thuận lợi cho 11; 
Xác suất người này nằm ở khoa Phổi  với điều kiện người này là nam giới = P 
(Khoa Phổi|Nam) = 
Lưu ý: Xác suất có điều kiện được kí hiệu P(đặc tính quan tâm|Điều kiện) và điều 

kiện này phải đúng cho cả kết cục thuận lợi (m) và kết cục có thể  (Nc). Trong thí dụ 
trên 11 kết cục thuận lợi vừa đòi hỏi điều kiện là nam giới và đặc tính là nằm ở khoa  
phổi và 15 kết cục có thể đòi hỏi điều kiện là nam giới. Thể hiện nhận xét bằng công 
thức:


P ( B | A)

m
Nc

n( A B )
n( A)

n( A B ) / N
n( A) / N

P( A B)
P( A)

(5)

n(A∩B ) là số  kết cục thoả điều kiện A và đặc tính B và n(A) số  kết cục thoả  điều  
kiện A
Thí dụ: Chọn một bệnh nhân ở khoa Thận, tính xác suất bệnh nhân này là nữ.
Đây là xác suất có điều kiện. P(nữ|khoa Thận) = =  =  = 0,75
Thí dụ: Theo bản báo cáo “Số ca nghi nhiễm SARS tích luỹ” của Tổ Chức Y tế Thế 
Giới   (   Số   ca   bệnh   SARS   (Hội 
chứng Hô hấp cấp tính trầm trọng) từ ngày 1/10/2002 đến ngày 17/5/2003 là 7761 với  
623 trường hợp tử vong. Xác suất tử vong của những người mắc SARS là xác suất có  

điều kiện: ( cả 623 ca tử vong và 7761 ca bệnh đều mắc SARS).
P(tử vong|SARS)=
Xác suất có điều kiện này (Xác suất tử vong ở những người mắc một bệnh cụ 
thể nào đó) được gọi là tỉ suất chết/mắc của bệnh đó (case­fatality rate).
Thí dụ: Trong một dân số, tỉ lệ những người có dấu hiệu lách to là 20%, những người  
vừa sốt rét vừa lách to là 18%, những người bị sốt rét là 23%. Một người ngẫu nhiên 
từ dân số đó, người này không có dấu hiệu lách to. Tính khả năng người này bị sốt rét? 
Bài giải: 
P(sốt rét|lách không to) = P(sốt rét và lách không to) / P(lách không to) 
= [P(sốt rét) ­ P(sốt rét và lách to)]/ P(lách không to) 
= (0.23­0.18)/0.8  =  0.05/0.8 =0.0625
2. Ðịnh luật nhân xác suất
Từ phương trình (5) ta có thể xây dựng công thức:
P(A∩B) = P(A) ×   P(B|A)

(6)

P(A∩B) = P(B∩A) =P(B) ×   P(A|B) 
Công thức này được gọi là định lí nhân xác suất.
Thí dụ: Nếu xác suất mắc bệnh lao, P(Lao) = 0,001 và xác suất chết/mắc của bệnh 
Lao, P(chết|Lao) = 0,1. Xác suất chết vì bệnh lao:
P(Lao và Chết) =  P(Lao) ×   P(Chết | Lao) = 0,001 ×  0,1 = 0,0001
Tính độc lập
Một   trong   những   khái   niệm   quan   trọng   trong   lí   thuyết   xác   suất   là   tính   độc   lập 
(independence). Hai biến cố A và B được gọi là độc lập nếu P(B|A) = P(B), hoặc suy 
ra từ (6) nếu 
P(A∩B) = P(A) ×   P(B)
(7)
Ý nghĩa của định nghĩa theo xác suất có điều kiện là xác suất của B không thay đổi dù 
có hay không có điều kiện A. Từ  phương trình (7) chúng ta có thể  suy ra là tính độc 

lập có tính chất đối xứng (nếu A độc lập với B thì B độc lập với A và ngược lại).
Thí dụ: 


Giả sử
Xác suất bị  chấn thương giao thông trên dân  số  chung = P(chấn thương giao thông)  
=0,01
Xác suất bị chấn thương giao thông ở người hút thuốc lá = P(chấn thương giao thông | 
hút thuốc lá) = 0,01
Khi đó chấn thương giao thông và hút thuốc lá là hai biến cố độc lập.
Giả sử
Xác suất bị  chấn thương giao thông trên dân  số  chung = P(chấn thương giao thông)  
=0,01
Xác suất bị chấn thương giao thông ở người nghiện rượu = P(chấn thương giao thông  
| nghiện rượu) = 0,03
Khi đó chấn thương giao thông và nghiện rượu là hai biến cố không độc lập
Khi biến cố A không độc lập với biến cố B thì:
­ A => B hoặc
­ B => A hoặc
­ Có một yếu tố   ảnh hưởng đến cả  A và B (yếu tố  này được gọi là yếu tố 
gây nhiễu).
Do đó nếu chúng ta có thể  chứng minh P(B) ≠ P(B|A)  ≠ P(B|Ac) (A và B không độc 
lập) và chúng ta loại trừ được các mệnh đề
­ B => A (bằng cách biện luận về thời gian)
­ Yếu tố gây nhiễu ảnh hưởng đến cả A và B 
Nghĩa là chúng ta có chứng cớ (evidence) của mệnh đề A=>B.
Đây là cách lập luận thường được sử dụng trong nghiên cứu xác định nguyên nhân hay 
yếu tố nguy cơ.
Tính loại trừ của 2 biến cố
Nếu hai biến cố A và B không bao giờ xảy ra đồng thời người ta gọi biến cố A  

và B loại trừ lẫn nhau. 
Thí dụ bệnh nhân không bao giờ bị nhiễm sán dải và sán dải heo cùng lúc nên 
việc nhiễm sán dải bò và sán dải heo là 2 biến cố  loại trừ  lẫn nhau. Trong thửu  
nghiệm tung xúc xắc, biến cố  ra mặt chẵn  và biến cố ra mặt 3 là biến cố loại trừ lẫn  
nhau.
Cần lưu ý hai biến cố  loại trừ  lẫn nhau không phải là 2 biến cố  độc lập mà 
thực chất là 2 biến cố  phụ  thuộc lẫn nhau. Biến cố  A xảy ra phụ  thuộc vào việc  
không xảy ra biến cố B và ngược lại.
3. Công thức cộng xác suất tổng quát
Thí dụ: Ở khoa Phổi và khoa Thận của bệnh viện X có 50 bệnh nhân và phân  
bố  của các đặc điểm của bệnh nhân này được trình bày trong bảng  ở  đầu chương. 
Chọn một người bất kì, hãy tính xác suất người là nam  hay nằm ở khoa Phổi ­ P(Nam  
hay Khoa Phổi):


P(Nam hay Khoa Phổi)=
P(Nam hay Khoa Phổi)= =  P(Phổi)+P(Nam)­P(Phổi và Nam)
Một cách tổng quát, nếu A∪B ≠ Ø thì chúng ta có 
P(A∪B) = P(A) + P(B) – P(A∩B)

(8)

Nếu hai biến cố A và B loại trừ lẫn nhau thì chúng ta có thể tính được xác suất xảy ra  
A hay B dựa trên nguyên lí cộng tính:
P(A∪B) = P(A) + P(B)
Đây là công thức cộng xác suất tổng quát. Sau đây là tổng kết công thức nhân và cộng 
xác suất tuỳ theo mối quan hệ giữa 2 biến số A và B
Quan   hệ   giữa   biến 
cố A và B


Định luật Nhân xác suất

Định luật Cộng xác suất

P(A∩B)

P(A∪B)

Không   đặc   biệt 
(không   độc   lập   và 
không loại trừ)

=P(A)× P(B|A)

= P(A) + P(B) – P(A∩B)

Độc lập

= P(A)× P(B)

= P(A) + P(B) – P(A)× P(B)

Loại trừ

= 0

= P(A) + P(B)

4. Công thức xác suất toàn phần và định lí Bayes
Nếu biến cố B phụ thuộc vào biến cố A – P(B) ≠ P(B|A) – thì xác suất của biến cố B  

phụ thuộc vào xác suất của biến cố A. Khi đó xác suất xảy ra B (A c là biến cố đối lập 
của biến cố A và được đọc là không A)
P ( B)

P( A

B)

P( A C

B)

P ( A) P ( B | A)

P( A C ) P ( B | A C )

(9)
Công thức này được gọi là công thức xác suất toàn phần (law of total probability). Áp  
dụng công thức này trong trường hợp ung thư phụ thuộc vào hút thuốc lá chúng ta có:  
Xác suất ung thư  = Xác suất hút thuốc lá ×  xác suất ung thư  khi hút thuốc lá + Xác 
suất không hút thuốc lá ×  xác suất ung thư khi không hút thuốc lá.
Tính xác suất A trên điều kiện B  ­ P(A|B) và thay mẫu số  với công thức xác 
suất toàn phần ta được
P( A B)
P ( A) P ( B | A)
P( A | B)
P( B)
P ( A) P ( B | A) P ( A c ) P ( B | A c )
(9)
Công thức này được gọi là định lí Bayes. Lí giải công thức này trong trường 

hợp hút thuốc lá tăng nguy cơ ung thư phổi như sau. Xác suất một người hút thuốc lá 
khi biết người này bị  ung thư phổi bằng với tỉ lệ với xác suất vừa hút thuốc vừa ung  
thư phổi trong xác suất bị ung thư phổi.


5. Biến số ngẫu nhiên
Khi chúng ta tiến hành phép thử, chúng ta thường không quan tâm đến chi tiết của biến  
cố  mà chỉ  quan tâm giá trị  của một đại lượng nào đó được xác định bởi kết cục của  
phép thử. Thí dụ, khi chúng ta gieo 3 con xúc xắc, có thể chúng ta không quan tâm đến  
con xúc xắc nào ra mặt mấy mà chỉ  quan tâm đến tổng số  điểm  của 3 con xúc xắc. 
Hay khi chúng ta mua vé số, chúng ta chỉ quan tâm đến số tiền mà chúng ta trúng được 
(hay số tiền bị mất) sau khi đã có kết quả xổ số.
Đại lượng mà giá trị  của nó được xác định bởi   kết cục của phép thử    ngẫu nhiên 
được gọi là biến số ngẫu nhiên. Biến số ngẫu nhiên thường được kí hiệu bằng chữ in 
hoa (như  X, Y,..). Biến số ngẫu nhiên X của biến cố e được kí hiệu là  X(e). Các thí 
dụ khác về biến số ngẫu nhiên gồm:
­ Thí dụ: Một người đặt một con số gồm 2 chữ số. Sau đó người ta tiến hành 
quay số để có kết quả là một số 2 chữ số. Như vậy phép thử sẽ có 100 kết  
cuộc là con số 00,01,02,03,...,99. Nếu kết cuộc trùng với con số được đặt, 
người đặt sẽ  được 70 đồng. Nếu kết cuộc không trùng với con số  được  
đặt, người đặt sẽ bị mất 1 đồng. Như vậy có 99 kết cục tương ứng với giá 
trị  ­1 và 1 kết cục tương  ứng với giá trị  70. ­1 và 70 là các giá trị  của biến  
số ngẫu nhiên X “số tiền thu được”. Ta có thể  tính được P(X=­1)=0,99 và 
P(X=70)=0,01
­ Theo dõi 100 người nghiện chích ma tuý chưa bị  nhiễm HIV, số  người bị 
nhiễm HIV sau 1 năm là biến số ngẫu nhiên
­ Điều trị  cho 15 ca bệnh SARS, số  ca tử  vong trong số 15 ca b ệnh này là  
biến số ngẫu nhiên
­ Một gia đình  có 1 đứa con, số  con trai trong gia đình này là biến số  ngẫu 
nhiên.

­ Đo chiều cao của một người, chiều cao người này là biến số ngẫu nhiên
6. Vọng trị
Nếu chúng ta không quan tâm đến chi tiết, chúng ta sẽ gán cho mỗi kết cục một giá trị 
của biến số ngẫu nhiên và khi đó chúng ta sẽ gán cho phép thử một giá trị gọi là vọng  
trị. Hãy trở lại với ví dụ về phép thử quay số (gồm 2 chữ số) được đưa ra trong phần  
biến số ngẫu nhiên. Phép thử này có nhiều kết cục và các kết cục tương ứng với ­1 và 
70 là giá trị  của biến số  ngẫu nhiên “số  tiền thu được”. Giả  sử  một người chơi trò 
chơi này rất nhiều lần (N lần) thì người số tiền người đó thu được sau N lần chơi:
70 ×  N ×  0,01 – 1 ×  N ×  0,99 = N ×  (0,70 – 0,99) = ­0,29 ×  N
Như vậy trung bình mỗi lần chơi người đó bị thu được 
(­0,29 ×  N)/N=0,29 đồng
Con số này được gọi là vọng trị của trò chơi. Một cách tổng quát vọng trị của phép thử 
là trung bình của biến số ngẫu nhiên nếu phép thử được lập lại nhiều lần và vọng trị 
của biến số ngẫu nhiên X được kí hiệu là E(X)
E(X)=X(e1)P(e1) + X(e2)P(e2) +...


Bài tập
Ðịnh luật nhân và cộng xác suất
1. Trong một nhóm gồm 502 người có phân phối nhóm máu và giới tính như sau:
Giới tính
Nhóm máu

Nam

Nữ

Tổng số

O


113

113

226

A

103

103

206

B

25

25

50

AB

10

10

20


Tổng số

251

251

502

1a. Nếu một người được chọn ngẫu nhiên từ  nhóm người này. Tính xác suất người  
này có nhóm máu O? xác suất người này có nhóm máu A? Xác suất người này có nhóm  
máu B? Xác suất người này có nhóm máu AB?
1b. Giới tính và nhóm máu có độc lập với nhau không? Chứng minh.
2. Xác suất một bệnh nhân được chọn từ một bệnh viện là nam là 0,6. Xác suất một  
bệnh nhân nam và ở khoa ngoại là 0,2. Một bệnh nhân được chọn ngẫu nhiên từ bệnh  
viện và người ta biết rằng đó là bệnh nhân nam. Tính xác suất bệnh nhân đó ở  khoa 
ngoại.
3. Trong dân số của một bệnh viện, xác suất một bệnh nhân được chọn ngẫu nhiên là  
có bệnh tim là 0,35. Xác suất bệnh nhân bệnh tim là hút thuốc lá là 0,86. Tính xác suất 
một bệnh nhân được chọn ngẫu nhiên là người hút thuốc lá và mắc bệnh tim?
4. Một nhà nghiên cứu muốn ước tính tỉ lệ tiêm chủng ở trẻ em dưới 2 tuổi trong tỉnh  
X bằng phương pháp lấy mẫu PPS (probability proportionate to size) gồm 2 bước.  
Bước 1:  lên danh sách tất cả các xã trong tỉnh rồi chọn trong danh sách đó 30 xã.  
Bước 2: chọn ngẫu nhiên 7 đứa trẻ dưới 2 tuổi trong mỗi xã được chọn để điều tra về 
tình hình tiêm chủng của đứa trẻ đó.
Giả sử trong tỉnh có xã A có 100 trẻ dưới 2 tuổi và xã B có 40 trẻ dưới 2 tuổi.
a. Nếu trong bước 1 đã chọn xã A, tính xác suất một đứa trẻ  dưới 2 tuổi của xã A 
được chọn đưa vào nghiên cứu
b. Nếu chúng ta không biết xã A có được chọn đưa vào nghiên cứu hay không, tính xác  
suất một đứa trẻ dưới 2 tuổi của xă A được chọn đưa vào nghiên cứu

c. Giả sử xác suất xã B được chọn đưa vào nghiên cứu  là 0,1, tính xác suất một đứa  
trẻ dưới 2 tuổi của xã B được chọn đưa vào nghiên cứu
Bài giải
1a. 

Theo công thức
m
P( E )
N


Với N là số các biến cố có thể và m số các biến cố thuận lợi.
Khi chọn ngẫu nhiên một người ta có thể có 502 kết cuộc khác nhau (Số  biến 
cố  có thể  N=502). Trong việc tính xác suất người có nhóm máu O, biến cố 
thuận lợi là biến cố  chọn được người có nhóm máu O. Như  vậy có 226 biến 
cố thuận lợi trong trường hợp này.
Xác suất người này có nhóm máu O là = 226/502=0,45
Tương tự
Xác suất người này có nhóm máu A là = 206/502=0,41
Xác suất người này có nhóm máu B là = 50/502=0,10
Xác suất người này có nhóm máu O là = 20/502=0,04
1b. 
Biến cố  A độc lập với biến cố B khi (A|B)=P(A) hay chứng minh P(B|
A)=P(B). Như vậy Nhóm máu và giới tính là độc lập với nhau bởi vì:
P(máu O | Nam)=113/251= 0,45 = P(máu O)
P(máu A | Nam)=103/251= 0,41 = P(máu A)
P(máu B | Nam)=25/251= 0,10 = P(máu B)
P(máu AB | Nam)=10/251= 0,04 = P(máu AB)
2.
Áp dụng công thức P(A|B)=P(A(B)/P(B); với A là biến cố  bệnh nhân ở 

khoa Ngoại và B là biến cố bệnh nhân là bệnh nhân nam ta có:
P(ngoại|nam)=P(ngoại(nam)/P(nam)= 0,2/0,6 = 0,33
3.
Áp dụng công thức P(A(B) = P(A).P(B|A) = P(B).P(B|A) ta có
P(hút thuốc(bệnh tim)=P(bệnh tim) x P(hút thuốc|bệnh tim)
= 0,35 x 0,86 = 0,301
4. Ta kí hiệu đứa trẻ quan tâm là m
a. Nếu trong bước 1 đã chọn xã A, xác suất một đứa trẻ  m dưới 2 tuổi của xã  
A được chọn đưa vào nghiên cứu = P(chọn m| chọn A) = 7/100 = 0,07
b. Nếu chúng ta không biết xã A có được chọn đưa vào nghiên cứu hay không,  
xác suất một đứa trẻ m dưới 2 tuổi của xã A được chọn đưa vào nghiên cứu =  
P(chọn m và chọn A) =  P(chọn A) ×  P (chọn m| chọn A) = 0,07  ×  P(chọn A)
c. Xác suất một đứa trẻ m dưới 2 tuổi của xã B được chọn đưa vào nghiên cứu  
= P(chọn m và chọn B) =  P(chọn B) ×  P (chọn m| chọn B) = 0,1 ×    7 / 40 = 
0,0175



×