Tải bản đầy đủ (.pdf) (62 trang)

ước lượng và kiểm định tham số thống kê bằng phương pháp bayes

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.52 MB, 62 trang )

TRƢỜNG ĐẠI HỌC CẦN THƠ
KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN
------------

LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC

ƢỚC LƢỢNG VÀ KIỂM ĐỊNH
THAM SỐ THỐNG KÊ
BẰNG PHƢƠNG PHÁP BAYES

Giáo viên hƣớng dẫn

Sinh viên thực hiện

ThS. Dƣơng Thị Bé Ba

Danh Đảnh
MSSV: 1100164
Ngành: Toán Ứng Dụng

CẦN THƠ – 5/2014


LỜI CẢM ƠN
---------Trong suốt quá trình học tập và thực hiện luận văn tôi đã nhận đƣợc sự giúp
đỡ, động viên và sự hƣớng dẫn tận tình của quý Thầy, quý Cô, Cha, Mẹ, bạn bè
cũng nhƣ sự nổ lực, cố gắng của bản thân để hoàn thành luận văn này.
Tôi xin chân thành gửi lời cảm ơn đến:
Cô Dƣơng Thị Bé Ba ngƣời đã tận tình hƣớng dẫn và dành nhiều thời gian
quý báu của mình để truyền đạt kiến thức, giúp đỡ tôi hoàn thành luận văn này.


Toàn thể quý thầy cô bộ môn Toán – Khoa Khoa học Tự nhiên của trƣờng
Đại học Cần thơ đã trang bị cho tôi những kiến thức cơ bản, những kỹ năng cần
thiết trong suốt quá trình học tập tại trƣờng, đó là hành trang quý báu không chỉ
giúp tôi hoàn thành tốt luận văn mà còn giúp tôi tự tin hơn trên con đƣờng sự
nghiệp phía trƣớc.
Quý Thầy, quý Cô trong Hội đồng bảo vệ luận văn đã dành nhiều thời gian
để xem xét và đóng góp những ý kiến quý báu để bài luận văn đƣợc hoàn thiện hơn.
Toàn thể các bạn sinh viên chuyên ngành Toán Ứng Dụng khóa 36, những
ngƣời bạn luôn sát cánh và tận tình giúp đỡ tôi trong suốt quá trình vừa qua.
Cuối cùng, tôi xin bày tỏ lòng kính trọng và sự biết ơn sâu sắc nhất đến Cha,
Mẹ và các anh, chị em trong gia đình đã luôn ủng hộ tôi về mọi phƣơng diện, đây là
nguồn sức mạnh tinh thần lớn nhất giúp tôi vƣơn lên trong cuộc sống.
Tôi xin chân thành cám ơn!
Cần Thơ, tháng 5 năm 2014

Danh Đảnh

i


PHẦN MỞ ĐẦU
Lý do chọn đề tài

I.

Thống kê là khoa học về thu thập, trình bày, phân tích các dữ liệu để từ đó
tìm ra bản chất và tính quy luật của các hiện tƣợng ngẫu nhiên trong kinh tế, xã hội
và tự nhiên. Nó dựa vào lý thuyết xác suất thống kê để tìm ra thông tin thống kê
trung thực, khách quan, chính xác, đầy đủ và kịp thời trong việc đánh giá, dự báo
tình hình, hoạch định chiến lƣợc, chính sách, xây dựng kế hoạch phát triển kinh tế

xã hội và đáp ứng nhu cầu thông tin thống kê của các tổ chức, cá nhân,… Do đó,
thống kê có tính ứng dụng rất cao trong thực tế trong đó có hai bài toán cơ bản là
ƣớc lƣợng và kiểm định giả thiết thống kê.
Trong khoa học có hai trƣờng phái thống kê: Trƣờng phái thống kê cổ điển
và trƣờng phái thống kê Bayes. Hai trƣờng phái thống kê này khác nhau về triết lý
khoa học và nhất là cách hiểu về khái niệm xác suất. Thống kê cổ điển dựa vào
những kết quả quan sát mẫu của hiện tại mà không quan tâm đến những thông tin
liên quan về số liệu đã biết trƣớc. Các kết luận trong thống kê cổ điển đều dựa trên
dữ liệu mẫu. Trong khi đó, thống kê Bayes dựa trên những thông tin dữ liệu đã biết
trƣớc về vấn đề đã quan sát để suy luận cho thống kê hiện tại. Trong thống kê
Bayes, thông tin tiền nghiệm cấu thành nên cơ sở lý thuyết, các kết luận dựa trên cơ
sở đã biết kết hợp với dữ liệu quan sát. Do đó, các kết luận trong thống kê Bayes có
độ chính xác cao hơn. Đặc biệt, trƣớc sự phát triển mạnh mẽ của công nghệ thông
tin cũng những phần mềm toán học, việc lƣu trữ thông tin rất thuận lợi. Do đó,
thống kê Bayes ngày càng có điều kiện phát triển hơn.
Với các lý do nêu trên em chọn đề tài “Ước lượng và kiểm định tham số
thống kê bằng phương pháp Bayes” để làm luận văn tốt nghiệp cuối khóa.
II.

Mục đích nghiên cứu
Luận văn đƣợc nghiên cứu với mục đích
 Tổng kết một cách có hệ thống các vấn đề có liên quan đến thống kê Bayes.
ii


 Nghiên cứu một số ứng dụng của thống kê Bayes trong kinh tế và xã hội.
III.

Phƣơng pháp nghiên cứu
 Sƣu tầm, tham khảo các tài liệu có liên quan đến đề tài.

 Tổng hợp, hệ thống hóa kiến thức đƣợc trình bày trong tài liệu để từ đó trình
bài lại các vấn đề có liên quan một cách logic, có hệ thống.

IV.

Đối tƣợng và phạm vi nghiên cứu
 Đối tƣợng nghiên cứu: Các vấn đề lý thuyết có liên quan đến thống kê
Bayes.
 Phạm vi nghiên cứu: Vì thời gian và kiến thức có hạn nên đề tài của em chỉ
nghiên cứu hai bài toán cơ bản là ƣớc lƣợng và kiểm định tham số thống kê
bằng phƣơng pháp Bayes.

V.

Bố cục luận văn
Cấu trúc luận văn bao gồm phần mở đầu, phần nội dung và phần kết luận.
Trong đó, phần nội dung gồm 4 chƣơng:
 Chƣơng 1: Kiến thức chuẩn bị
Trong chƣơng này trình bày một số vấn đề cơ bản về thống kê Bayes nhƣ:
thông tin tiền nghiệm, thông tin hậu nghiệm và một số hàm mật độ xác suất thông
dụng. Đây là cơ sở lý thuyết cho việc xây dựng bài toán ƣớc lƣợng và kiểm định
đƣợc trình bày trong chƣơng 2 và chƣơng 3.
 Chƣơng 2: Ƣớc lƣợng tham số bằng phƣơng pháp Bayes
Trong chƣơng này trình bày bài toán ƣớc lƣợng tham số thống kê bằng
phƣơng pháp Bayes.
 Chƣơng 3: Kiểm định tham số bằng phƣơng pháp Bayes
Trong chương này trình bày bài toán kiểm định tham số thống kê bằng
phương pháp Bayes.
 Chƣơng 4: Bài tập áp dụng
Trình bày hệ thống bài tập ứng dụng một số vấn đề đã thực hiện trong lý

thuyết.

iii


MỤC LỤC
LỜI CẢM ƠN ..............................................................................................................................i
PHẦN MỞ ĐẦU ........................................................................................................................ ii
I.

Lý do chọn đề tài .......................................................................................................... ii

II. Mục đích nghiên cứu .................................................................................................... ii
III. Phƣơng pháp nghiên cứu............................................................................................. iii
IV. Đối tƣợng và phạm vi nghiên cứu .............................................................................. iii
V. Bố cục luận văn ........................................................................................................... iii
MỤC LỤC ................................................................................................................................. iv
CHƢƠNG 1: KIẾN THỨC CHUẨN BỊ ...................................................................................1
1.1. ĐỊNH LÝ BAYES.........................................................................................................1
1.1.1.

Định lý Bayes cho đại lƣợng ngẫu nhiên rời rạc ............................................... 1

1.1.2.

Định lý Bayes cho đại lƣợng ngẫu nhiên liên tục ............................................. 4

1.2. PHÂN PHỐI TIỀN NGHIỆM VÀ PHÂN PHỐI HẬU NGHIỆM ............................5
1.2.1


Phân phối tiền nghiệm......................................................................................... 5

1.2.2

Phân phối hậu nghiệm ......................................................................................... 5

1.2.3

Hàm mật độ xác suất hậu nghiệm cho tham số ............................................... 10

CHƢƠNG 2: ƢỚC LƢỢNG THAM SỐ THỐNG KÊ BẰNG PHƢƠNG PHÁP BAYES
....................................................................................................................................................16
2.1. ƢỚC LƢỢNG ĐIỂM THAM SỐ THỐNG KÊ ........................................................16
2.2. ƢỚC LƢỢNG KHOẢNG THAM SỐ THỐNG KÊ ................................................16
2.2.1.

Một số bài toán ƣớc lƣợng liên quan đến trung bình ...................................... 17

2.2.2.

Một số bài toán ƣớc lƣợng liên quan đến tỷ lệ ................................................ 21

CHƢƠNG 3: KIỂM ĐỊNH THAM SỐ THỐNG KÊ BẰNG PHƢƠNG PHÁP BAYES...24
3.1. TỔNG QUAN VỀ BÀI TOÁN KIỂM ĐỊNH THỐNG KÊ .....................................24
3.2. MỘT SỐ BÀI TOÁN KIỂM ĐỊNH LIÊN QUAN ĐẾN TRUNG BÌNH ...............25
3.2.1.

Kiểm định trung bình ........................................................................................ 25

3.2.2.


So sánh hai trung bình ....................................................................................... 26

3.3. MỘT SỐ BÀI TOÁN KIỂM ĐỊNH LIÊN QUAN ĐẾN TỶ LỆ .............................31
3.3.1.

Kiểm định một tỷ lệ ........................................................................................... 31

3.3.2.

So sánh hai tỷ lệ ................................................................................................. 33

CHƢƠNG 4: BÀI TẬP ÁP DỤNG .........................................................................................36
PHẦN KẾT LUẬN ...................................................................................................................52
TÀI LIỆU THAM KHẢO ........................................................................................................53
PHỤ LỤC ..................................................................................................................................54
iv


Phụ lục 1. Bảng phân vị chuẩn tắc z  ..............................................................................54
Phụ lục 2. Bảng phân vị Student .......................................................................................55
Phụ lục 3. Bảng giá trị tích phân Laplace ........................................................................56

v


CHƢƠNG 1: KIẾN THỨC CHUẨN BỊ

Nhƣ ta đã biết, xác suất và thống kê có mối liên hệ rất mật thiết với nhau.
Xác suất nhƣ là công cụ để các nhà thống kê sử dụng thông tin trên một mẫu để đƣa

ra những suy luận hay mô tả tổng thể từ mẫu đƣợc lấy ra. Định lý Bayes là định lý
có vai trò rất quan trọng trong xác suất và thống kê bởi ý tƣởng của định lý Bayes
trong xác suất là việc tính xác suất hậu nghiệm của một biến cố dựa trên việc biết
đƣợc xác suất của biến cố tiền nghiệm, hầu nhƣ trong thực tế đa số các biến cố luôn
chịu tác động của nhiều biến cố khác nhau. Chính vì vậy nên định lý Bayes có tính
ứng dụng rất cao. Nền tảng của thống kê Bayes là việc mở rộng định lý Bayes đối
với đại lƣợng ngẫu nhiên rời rạc cho đại lƣợng ngẫu nhiên liên tục. Trong xác suất,
sử dụng định lý Bayes để thiết lập hàm mật độ xác suất hậu nghiệm cho một giai
đoạn và mở rộng cho nhiều giai đoạn nhằm để xem xét cho các tham số cụ thể của
phân phối nhị thức và phân phối chuẩn. Trong thống kê, định lý Bayes đƣợc sử
dụng để giải quyết các bài toán ƣớc lƣợng, kiểm định tham số. Trong chƣơng này sẽ
trình bày kiến thức nền tảng của thống kê Bayes.
1.1.

ĐỊNH LÝ BAYES

1.1.1. Định lý Bayes cho đại lƣợng ngẫu nhiên rời rạc
a. Định nghĩa hệ biến cố đầy đủ
Gọi 𝛺 là không gian mẫu của một phép thử. Một hệ các biến cố
𝐴1 , 𝐴2 , … , 𝐴𝑛 được gọi là một hệ biến cố đầy đủ hay là một hình thức chia của Ω
nếu thỏa mãn hai tính chất sau
𝐴1 + 𝐴2 +, … , +𝐴𝑛 = Ω
𝐴𝑖 𝐴𝑗 = ∅ ∀ 𝑖 ≠ 𝑗

A1

An

A2


𝐴



Hình vẽ minh họa hình thức chia của 𝐴𝑖 𝐴𝑗 trong không gian mẫu Ω.

1


Nhận xét: Gọi B là một biến cố bất kỳ của 𝛺. Nếu 𝐴1 , 𝐴2 , … , 𝐴𝑛 là hình thức chia
của 𝛺 thì 𝐴1 𝐵, 𝐴2 𝐵, … , 𝐴𝑛 𝐵 sẽ là một hình thức chia của B.
b. Công thức xác suất toàn phần
Cho 𝐴𝑖 , 𝑖 = 1, 𝑛 là một hệ biến cố đầy đủ. Khi đó với A là một biến cố bất
kỳ, ta có
𝑛

𝑃 𝐴 =

𝑃 𝐴𝑖 . 𝑃(𝐴|𝐴𝑖 )
𝑖=1

Chứng minh
Ta có
𝐴1 + 𝐴2 +, … , +𝐴𝑛 = Ω
⟺ 𝐴1 + 𝐴2 +, … , +𝐴𝑛 . A = Ω. A
⟺ 𝐴1 𝐴 + 𝐴2 𝐴+, … , +𝐴𝑛 A = A
⟺ 𝑃 𝐴 = 𝑃(𝐴1 𝐴 + 𝐴2 𝐴+, … , +𝐴𝑛 A)
Vì 𝐴𝑖 , 𝑖 = 1, 𝑛 là hệ các biến cố xung khắc từng đôi nên hệ 𝐴𝑖 𝐴 , 𝑖 = 1, 𝑛 cũng là
hệ các biến cố xung khắc từng đôi.
Do đó

𝑃 𝐴 = 𝑃 𝐴1 𝐴 + 𝐴2 𝐴+, … , +𝐴𝑛 A = 𝑃 𝐴1 𝐴 + 𝑃 𝐴2 𝐴 + ⋯ + 𝑃 𝐴𝑛 𝐴
= 𝑃 𝐴1 . 𝑃 𝐴|𝐴1 + 𝑃 𝐴2 . 𝑃 𝐴|𝐴2 + ⋯ + 𝑃 𝐴𝑖 . 𝑃 𝐴|𝐴𝑛
𝑛

=

𝑃 𝐴𝑖 . 𝑃(𝐴|𝐴𝑖 ) (đ𝑝𝑐𝑚)
𝑖=1

c. Định lý Bayes ( công thức xác suất Bayes)
Giả sử 𝐴1 , 𝐴2 , … , 𝐴𝑛 là một hệ các biến cố đầy đủ, B là một biến cố đã xảy ra.
Khi đó
𝑃(

𝐴𝑖

𝐵) =

𝑃 𝐴𝑖 𝑃(𝐵|𝐴𝑖 )
𝐴𝑖 𝑃(𝐵|𝐴𝑖 )

𝑛
𝑖=1 𝑃

Chứng minh
Theo công thức nhân xác suất, ta có
𝑃 𝐵. 𝐴𝑖 = 𝑃 𝐵 . 𝑃 𝐴𝑖 |𝐵 = 𝑃 𝐴𝑖 . 𝑃 𝐵|𝐴𝑖
⟺ 𝑃 𝐴𝑖 |𝐵 =

𝑃 𝐴𝑖 . 𝑃 𝐵|𝐴𝑖

𝑃 𝐵

Theo công thức xác suất toàn phần, ta có

2


𝑛

𝑃 𝐵 =

𝑃 𝐴𝑖 . 𝑃 𝐵|𝐴𝑖
𝑖=1

Do đó
𝑃

𝐴𝑖

𝐵 =

𝑃 𝐴𝑖 . 𝑃 𝐵|𝐴𝑖
𝐴𝑖 . 𝑃 𝐵|𝐴𝑖

đ𝑝𝑐𝑚 .

𝑛
𝑖=1 𝑃

Ví dụ 1.1: Có 2 lô sản phẩm. Lô 1 có 20 sản phẩm trong đó có 15 sản phẩm

tốt. Lô 2 có 20 sản phẩm trong đó có 10 sản phẩm tốt. Lấy ngẫu nhiên một lô và
trong lô đó lấy ra ngẫu nhiên một sản phẩm. Giả sử sản phẩm lấy ra là sản phẩm tốt,
tính xác suất sản phẩm đó thuộc lô thứ nhất?
Giải
Gọi A là biến cố lấy ra 1 sản phẩm tốt và 𝐿1 , 𝐿2 lần lƣợt là biến cố chọn đƣợc sản
phẩm thuộc lô 1 và lô 2
⇒ 𝐿1 , 𝐿2 là hệ biến cố đầy đủ
Xác suất đƣợc chọn của hai lô là: 𝑃 𝐿1 = 1 2 = 𝑃(𝐿2 )
Theo công thức xác suất toàn phần, xác suất lấy đƣợc sản phẩm tốt là
1 15 1 10 5
.
+ .
=
2 20 2 20 8
Nếu sản phẩm lấy ra là sản phẩm tốt, theo công thức Bayes ta có xác suất sản phẩm
thuộc L1 là
𝑃 𝐴 = 𝑃 𝐿1 𝑃 𝐴|𝐿1 + 𝑃 𝐿2 𝑃 𝐴|𝐿2 =

1 15
𝑃 𝐿1 𝑃(𝐴|𝐿1 ) 2 . 20 3
𝑃 𝐿1 |𝐴 =
=
=
5
𝑃(𝐴)
5
8
Ví dụ 1.2: Một hộp đựng 2 đồng xu, trong đó có 1 đồng xu cân đối, đồng
chất và 1 đồng xu luôn xuất hiện mặt sấp khi tung. Chọn ngẫu nhiên một đồng xu từ
hộp và khi tung đồng xu này lên 2 lần điều thấy nó xuất hiện mặt sấp. Tính xác xuất

đồng xu đã chọn là đồng xu cân đối, đồng chất.
Giải
Gọi A là biến cố khi tung 2 lần đồng xu điều xuất hiện mặt sấp.
B là đồng xu đƣợc chọn là đồng xu cân đối, đồng chất.
Theo công thức xác suất toàn phần, xác suất tung 2 lần đồng xu đều xuất hiện mặt
sấp là
𝑃 𝐴 = 𝑃 𝐵 .𝑃 𝐴 𝐵 + 𝑃 𝐵 .𝑃 𝐴 𝐵 =

3

1 1 1 1
5
. . + . 1.1 =
2 2 2 2
8


Nếu trong 2 lần đều xuất hiện mặt sấp. Khi đó, theo công thức Bayes ta đƣợc xác
suất đồng xu đã chọn là đồng xu cân đối và đồng chất là
𝑃 𝐵𝐴 =

𝑃 𝐵 .𝑃 𝐴 𝐵
1 8 1
=
=
𝑃(𝐴)
5 8 5

Ví dụ 1.3: Cho hai hộp đựng bi, hộp một có 6 bi vàng và 4 bi đỏ, hộp hai có
7 bi vàng và 3 bi đỏ. Lấy ngẫu nhiên từ hộp một 1 viên bi và bỏ vào hộp hai, sau đó

lấy từ hộp hai ra 2 viên bi. Tính xác suất 2 viên bi lấy ra có màu đỏ?
Giải
Gọi 𝐴1 là biến cố lấy đƣợc bi vàng từ hộp thứ nhất, 𝐴2 là biến cố lấy đƣợc bi đỏ từ
hộp thứ nhất và B là biến cố lấy đƣợc hai bi đỏ từ hộp thứ hai.
Ta có 𝐴1 , 𝐴2 là hệ biến cố đầy đủ nên:
𝑃 𝐵 = 𝑃 𝐴1 𝑃 𝐵|𝐴1 + 𝑃 𝐴2 𝑃 𝐵|𝐴2

6 𝐶32
4 𝐶24
=
. 2 +
. 2 = 0,076
10 𝐶11
10 𝐶11

1.1.2. Định lý Bayes cho đại lƣợng ngẫu nhiên liên tục
Cho 𝑋 là đại lƣợng ngẫu nhiên liên tục. Khi đó, hàm phân phối xác suất có điều
kiện 𝑋 khi biến cố 𝐴𝑖 đã xảy ra đƣợc xác định nhƣ sau
𝐹 𝑥 𝐴𝑖 =

𝑃( 𝑋 ≤ 𝑥 , 𝐴𝑖 )
𝑃(𝐴𝑖 )

Trong đó 𝐹 +∞|𝐴𝑖 = 1 và 𝐹 −∞ 𝐴𝑖 = 0.
Hàm mật độ xác suất có điều kiện của X khi biến cố 𝐴𝑖 xảy ra đƣợc xác định
nhƣ sau
𝑓 𝑥 𝐴𝑖 =

𝑑𝐹
𝑃(𝑥 ≤ 𝑋 ≤ 𝑥 + ∆𝑥|𝐴𝑖 )

= lim
𝑑𝑥 ∆𝑥→0
∆𝑥

Giả sử quan sát biến ngẫu nhiên 𝑋 trên k tổng thể 𝑤1 , 𝑤2 , … , 𝑤𝑛 có hàm mật độ
xác suất 𝑓𝑖 (𝑥) và xác suất tiên nghiệm 𝑞𝑖 , 𝑖 = 1,2, … , 𝑛. Khi đó kết quả đƣợc mở
rộng cho trƣờng hợp liên tục nhƣ sau
𝑘

𝑘

𝑓 𝑥 =

𝑃 𝑤𝑖 𝑓 𝑥 𝑤𝑖 =
𝑖=1

𝑃 𝑤𝑖 𝑥 =

𝑞𝑖 𝑓𝑖 (𝑥)
𝑖=1

𝑃 𝑤𝑖 𝑓(𝑥|𝑤𝑖 )
=
𝑓(𝑥)

𝑞𝑖 𝑓𝑖 (𝑥)
𝑘
𝑖=1 𝑞𝑖 𝑓𝑖 (𝑥)

Trong đó 𝑓(𝑥) đƣợc gọi là hàm mật độ xác suất kết hợp của tổng thể.

Khi 𝑋 và 𝑌 là 2 đại lƣợng ngẫu nhiên liên tục, định lý Bayes cho trƣờng hợp này
là hàm mật độ xác suất có điều kiện 𝑓(𝑥|𝑦) đƣợc xác định nhƣ sau
𝑓 𝑥𝑦 =

𝑓 𝑥 𝑓(𝑦|𝑥)
𝑓 𝑥 𝑓 𝑦 𝑥 𝑑𝑥
4


1.2.

PHÂN PHỐI TIỀN NGHIỆM VÀ PHÂN PHỐI HẬU NGHIỆM

1.2.1 Phân phối tiền nghiệm
Phân phối tiền nghiệm theo định lý Bayes còn đƣợc gọi là xác suất tiền nghiệm
là xác suất xảy ra của biến cố 𝐴 mà không quan tâm đến những biến cố khác. Thông
tin tiền nghiệm của các tham số là nhân tố quan trọng trong quá trình suy luận
Bayes. Phân phối tiền nghiệm chứa đựng đầy đủ thông tin và nếu lƣợng dữ liệu
quan sát đƣợc càng nhiều sẽ ảnh hƣởng càng lớn lên phân phối hậu nghiệm. Ngƣợc
lại, khi lƣợng dữ liệu quá ít thì thông tin trong phân phối tiền nghiệm sẽ đóng vai trò
quan trọng trong phân phối hậu nghiệm.
a. Tiền nghiệm mang thông tin và không mang thông tin
Tiền nghiệm mang thông tin là tiền nghiệm làm thay đổi về cơ bản những
thông tin chứa trong dữ liệu. Phƣơng pháp phổ biến để thể hiện thông tin tiền
nghiệm là đƣa ra phân phối cho tham số chƣa biết mà tham số đó phản ánh đƣợc
thông tin tiền nghiệm.
Trong nhiều trƣờng hợp niềm tin tiền nghiệm của ta rất mơ hồ và vì thế rất
khó để chuyển thành tiền nghiệm mang thông tin. Đây là trƣờng hợp mà ta gọi là
tiền nghiệm không mang thông tin hay tiền nghiệm mơ hồ và phân phối đƣợc lựa
chọn để thể hiện phân phối này là phân phối đều xác định trên các giá trị mà tham

số có thể có.
Chẳng hạn, tham số chỉ trung bình 𝜇 nhận giá trị (−∞; +∞) có phân phối
tiền nghiệm không mang thông tin. Tham số độ lệch chuẩn 𝜎 nhận giá trị trên
(0; +∞) có phân phối tiền nghiệm không mang thông tin.
b. Phân phối tiền nghiệm liên hợp
Trong nhiều trƣờng hợp, ta mong muốn chọn đƣợc phân phối tiền nghiệm sao
cho việc phân tích và tìm ra phân phối hậu nghiệm đƣợc thuận lợi nhất. Giả sử dữ
liệu đƣợc sinh ra từ một phân phối xác định nào đó, khi đó ta gọi phân phối tiền
nghiệm liên hợp để chỉ phân phối hậu nghiệm và phân phối tiền nghiệm cùng thuộc
một lớp phân phối. Mặc dù có cùng dạng phân phối nhƣng chúng có tham số khác
nhau, tham số của phân phối hậu nghiệm phản ánh sự kết hợp giữa thông tin tiền
nghiệm và dữ liệu quan sát.
1.2.2 Phân phối hậu nghiệm
Phân phối hậu nghiệm hay còn gọi là xác suất có điều kiện là xác suất xảy ra
biến cố 𝐴 khi biết biến cố 𝐵 đã xảy ra.
a. Bảng phân phối xác suất hậu nghiệm
 Bảng phân phối xác suất hậu nghiệm qua một giai đoạn
Tƣơng tự nhƣ bảng phân phối xác suất, bảng phân phối xác suất hậu nghiệm
dùng để thiết lập phân phối xác suất hậu nghiệm cho biến ngẫu nhiên rời rạc mà nó
cung cấp xác suất 𝑝 với mỗi các giá trị của x. Yêu cầu của một bảng phân phối xác
suất hậu nghiệm là 0 ≤ 𝑝 ≤ 1 và 𝑛𝑖=1 𝑝𝑖 = 1. Đồng thời ta có thể dựa vào bảng để
tính xác suất hậu nghiệm một cách trực quan, hay nhìn vào bảng ta có thể tính xác
suất hậu nghiệm đơn giản hơn.
5


Không gian Bayes
Cho hai đại lƣợng ngẫu nhiên rời rạc 𝑋 và 𝑌. Gọi 𝑥𝑖 , 𝑖 = 1,2, … , 𝑛 là các giá
trị có thể có của 𝑋 và 𝑦𝑗 , 𝑗 = 1,2, … , 𝑚 là các giá trị có thể có của 𝑌. Tập hợp các bộ
giá trị trong ma trận hình chữ nhật cỡ 𝑛 × 𝑚 với phần tử thứ 𝑖 cột 𝑗 trong ma trận

𝑥𝑖 , 𝑦𝑗 đƣợc gọi là không gian Bayes của hai biến 𝑋 và 𝑌.
Bảng 1: Không gian Bayes
𝑦1
𝑥1
𝑥2

𝑦2



(𝑥1 , 𝑦1 ) (𝑥1 , 𝑦2 )

𝑦𝑗



𝑦𝑚

(𝑥1 , 𝑦𝑗 )

(𝑥1 , 𝑦𝑚 )

𝑥2 , 𝑦1

𝑥2 , 𝑦2

𝑥2 , 𝑦𝑗

𝑥2 , 𝑦𝑚


𝑥𝑖 , 𝑦1

𝑥𝑖 , 𝑦2

𝑥𝑖 , 𝑦𝑗

𝑥𝑖 , 𝑦𝑚

𝑥𝑛 , 𝑦1

𝑥𝑛 , 𝑦2

𝑥𝑛 , 𝑦𝑗

𝑥𝑛 , 𝑦𝑚


𝑥𝑖

𝑥𝑛

Bài toán: Giả sử đại lƣợng ngẫu nhiên 𝑋 có thể có các giá trị 𝑥1 , 𝑥2 , … , 𝑥𝑛
với xác suất chƣa biết, đại lƣợng ngẫu nhiên 𝑌 nhận giá trị cụ thể 𝑌 = 𝑦0 đã biết.
Dựa vào giá trị đã biết của 𝑌 ta lập bảng phân phối xác suất cho đại lƣợng ngẫu
nhiên 𝑋.
Phƣơng pháp: Gọi 𝑃 𝑥𝑖 , 𝑦0 là xác suất đồng thời để đại lƣợng ngẫu nhiên
𝑋 nhận giá trị 𝑥𝑖 và đại lƣợng ngẫu nhiên 𝑌 nhận giá trị 𝑦0 , ta có
𝑃 𝑥𝑖 , 𝑦0 = 𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦0 |𝑋 = 𝑥𝑖 )
Trong đó 𝑃 𝑋 = 𝑥𝑖 là xác suất tiền nghiệm của 𝑋 = 𝑥𝑖
Theo công thức Bayes thì xác suất hậu nghiệm của 𝑋 = 𝑥𝑖 và 𝑌 = 𝑦0 đƣợc xác

định nhƣ sau
(1)

𝑝𝑖

= 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦0 =

𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦0 |𝑋 = 𝑥𝑖 )
𝑛
𝑖=1 𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦0 |𝑋 = 𝑥𝑖 )

Khi đó ta lập đƣợc bảng phân phối xác suất hậu nghiệm của 𝑋 khi 𝑌 = 𝑦0 là
Bảng 2: Bảng phân phối xác suất hậu nghiệm của X qua một giai đoạn
𝑋
𝑃

𝑥1
(1)

𝑝1

𝑥2
(1)

𝑝2



𝑥𝑛




𝑝3

(1)

Ví dụ 1.4: Trong một hộp có 5 viên bi, trong đó có 2 loại bi là bi đỏ và bi đen
(số lƣợng bi đỏ và bi đen không đƣợc xác định). Chọn ngẫu nhiên 1 viên bi từ hộp,
6


nếu ta chọn đƣợc bi đỏ kí hiệu là 𝑌 = 1 và nếu ta chọn đƣợc bi đen thì kí hiệu là
𝑌 = 0. Gọi X là số lƣợng bi đỏ trong hộp.
a. Tìm không gian Bayes của (𝑋, 𝑌).
b. Tìm bảng phân phối xác suất hậu nghiệm của 𝑋 khi 𝑌 = 1.
Giải
a. Không gian Bayes của (𝑋, 𝑌) đƣợc xác định nhƣ bảng sau
X\Y

0

1

2

3

4

5


0

0,0

0,1

0,2

0,3

0,4

0,5

1

1,0

1,1

1,2

1,3

1,4

1,5

b. Số lƣợng bi đỏ không đƣợc xác định nên ta xem xác suất tiên nghiệm của

𝑋 = 𝑥𝑖 , (𝑖 = 0,5) bằng nhau
𝑃 𝑋=0 =𝑃 𝑋=1 =𝑃 𝑋=2 =𝑃 𝑋=3 =𝑃 𝑋=4
1
=𝑃 𝑋=5 =
6
Ta có: 𝑃 𝑌 = 1 𝑋 = 𝑥𝑖 = 𝑖 5
Lập bảng tính nhƣ sau
𝑥𝑖

𝑃(𝑋 = 𝑥𝑖 )

𝑃 𝑌 = 1 𝑋 = 𝑥𝑖

𝑃(𝑋 = 𝑥𝑖 |𝑌 = 1)

(1)

(2)

(1).(2)

0

1 6

0

0

0


1

1 6

1 5

1 30

1/15

2

1 6

2 5

2 30

2/15

3

1 6

3 5

3 30

3/15


4

1 6

4 5

4/30

4/15

5

1 6

1

5 30

5/15



1 2
Bảng phân phối xác suất hậu nghiệm của 𝑋 với 𝑌 = 1 là
𝑋

0

1


2

3

4

5

𝑃

0

1/15

2/15

3/15

4/15

5/15

 Bảng phân phối xác suất qua nhiều giai đoạn
7


Bài toán: Giả sử đại lƣợng ngẫu nhiên X có thể nhận giá trị 𝑥1 , 𝑥2 , … , 𝑥𝑛 với
xác suất chƣa biết. Tiến hành m lần phép thử, lần thứ nhất ta nhận đƣợc kết quả
𝑌 = 𝑦1 , lần thứ hai ta nhận đƣợc kết quả 𝑌 = 𝑦2 ,…, và lần thứ m ta nhận đƣợc kết

quả 𝑌 = 𝑦𝑚 . Vấn đề đặt ra là ta cần lập bảng phân phối xác suất hậu nghiệm cho X.
Phƣơng pháp: Mở rộng cho trƣờng hợp một giai đoạn, bảng phân phối xác
suất hậu nghiệm của X qua m giai đoạn nhƣ sau:
Bảng 3: Bảng phân phối xác suất hậu nghiệm của X qua nhiều giai đoạn
𝑋

𝑥1
(𝑚 )

𝑃
(𝑚 )

Trong đó 𝑝𝑖

𝑝1

𝑥2



(𝑚 )



𝑝2

𝑥𝑛
(𝑚 )

𝑝3


đƣợc xác định nhƣ sau
(𝑚 )

𝑝𝑖

=

𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦1 , 𝑦2 , … , 𝑦𝑚 𝑥𝑖 )
𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦1 , 𝑦2 , … , 𝑦𝑚 𝑥𝑖 )

𝑚
𝑖=1 𝑃

Với
𝑃 𝑌 = 𝑦1 , 𝑦2 , … , 𝑦𝑚 𝑥𝑖

= 𝑃 𝑌 = 𝑦1 𝑋 = 𝑥𝑖 . 𝑃 𝑌 = 𝑦2 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦1 …

… 𝑃(𝑌 = 𝑦𝑚 |𝑋 = 𝑥𝑖 , 𝑌 = 𝑦1 , 𝑌 = 𝑦2 , … , 𝑌 = 𝑦𝑚 −1 )
Ví dụ 1.5: Trở lại ví dụ 1.4, giả sử ta chọn lần lƣợt 2 viên bi từ hộp, lần đầu
ta chọn đƣợc 1 viên bi đỏ, lần 2 ta chọn tiếp 1 viên bi thì thấy kết quả là viên bi đen.
Gọi X là viên bi đỏ trong hộp. Lập bảng phân phối xác suất hậu nghiệm của 𝑋.
Giải
Ta có
𝑃 𝑌 = 0 𝑋 = 𝑥𝑖 , 𝑌 = 1 =

4−𝑖
4


Lập bảng tính sau:
𝑥𝑖

𝑃(𝑋
= 𝑥𝑖 )

𝑃(𝑌 = 1|𝑋
= 𝑥𝑖 )

𝑃(𝑌 = 0|𝑋
= 𝑥𝑖 , 𝑌 = 1)

(1)(2)(3)

𝑃(𝑋 = 𝑥𝑖 |𝑌
= 1, 𝑌 = 0)

(1)

(2)

(3)

0

1/6

0

0


0

0

1

1/6

1/5

¼

1/120

0,034

2

1/6

2/5

2/4

4/120

0,133

3


1/6

3/5

¾

9/120

0,300

4

1/6

4/5

1

4/30

0,533

5

1/6

5/5

0


0

0

8




1/4

1

Từ bảng tính trên ta nhận đƣợc bảng phân phối xác suất hậu nghiệm của X là
X

0

1

2

3

4

5

P


0

0,034

0,133

0,3

0,533

0

b. Bảng phân phối xác suất hậu nghiệm tham số của một số phân phối đặc biệt
 Tham số tỷ lệ trong phân phối nhị thức
Bài toán: Giả sử đại lƣợng ngẫu nhiên có phân phối nhị thức với xác suất
thành công là 𝑝 với 𝑝 là đại lƣợng ngẫu nhiên có thể nhận các giá trị: 𝑝1 , 𝑝2 , … , 𝑝𝑚
với xác suất tiên nghiệm tƣơng ứng 𝑞1 , 𝑞2 , … , 𝑞𝑚 . Chọn một mẫu gồm n phần tử và
gọi Y là số lần thành công. Ta cần tìm bảng phân phối xác suất hậu nghiệm của p
khi Y nhận giá trị cụ thể 𝑌 = 𝑘.
Bảng phân phối xác suất hậu nghiệm
Theo công thức Bayes, bảng phân phối xác suất hậu nghiệm của tham số p nhƣ sau
Bảng 4: Bảng phân phối xác suất hậu nghiệm trong phân phối nhị thức
𝑝
𝑃

𝑝1
(𝐵)

𝑝1


𝑝2
(𝐵)

𝑝2



𝑝𝑚



𝑝𝑚

(𝐵)

Trong đó
(𝐵)

𝑝𝑖

= 𝑃 𝑝 = 𝑝𝑖 𝑌 = 𝑘 =

𝑃 𝑝 = 𝑝𝑖 𝑃(𝑌 = 𝑘|𝑝 = 𝑝𝑖 )
𝑚
𝑖=1 𝑃 𝑝 = 𝑝𝑖 𝑃(𝑌 = 𝑘|𝑝 = 𝑝𝑖 )


𝑃 𝑝 = 𝑝𝑖 = 𝑞𝑖 , 𝑃 𝑌 = 𝑘 𝑝 = 𝑝𝑖 = 𝐶𝑛𝑘 𝑝𝑖𝑘 1 − 𝑝𝑖


𝑛−𝑘

 Tham số trung bình của phân phối chuẩn
 Mẫu quan sát qua một giai đoạn
Cho đại lƣợng ngẫu nhiên X có phân phối chuẩn 𝑁(𝜇, 𝜎 2 ) với 𝜎 2 đã biết và
𝜇 chƣa biết. Giả sử 𝜇 nhận đƣợc các giá trị 𝜇1 , 𝜇2 , … , 𝜇𝑛 với xác suất tiên nghiệm
𝑃 𝜇 = 𝜇𝑖 = 𝑝𝑖 . Chọn một mẫu ngẫu nhiên đƣợc một giá trị cụ thể của 𝑋 là 𝑥0 . Cần
tìm xác suất hậu nghiệm cho các giá trị của 𝜇𝑖 , 𝑖 = 1,2, … , 𝑛.
Bảng phân phối xác suất hậu nghiệm của 𝝁
Áp dụng công thức Bayes ta đƣợc bảng phân phối xác suất hậu nghiệm của 𝜇
nhƣ sau

9


Bảng 5: Bảng phân phối xác suất hậu nghiệm của 𝝁 qua một gia đoạn
𝜇
𝑃

𝜇1

𝜇2

(𝑁)



(𝑁)

𝑝1




𝑝2

𝜇𝑛
(𝑁)

𝑝𝑛

Trong đó
(𝑁)

𝑝𝑖

= 𝑃 𝜇 = 𝜇𝑖 𝑋 = 𝑥0 ) =

𝑃 𝜇 = 𝜇𝑖 𝑓(𝑥0 |𝜇𝑖 )
𝑛
𝑖=1 𝑃 𝜇 = 𝜇𝑖 𝑓(𝑥0 |𝜇𝑖 )

Với
𝑓 𝑥0 𝜇𝑖 =

1
𝜎 2𝜋

𝑒𝑥𝑝 −

(𝑥0 − 𝜇𝑖 )2

2𝜎 2

 Mẫu quan sát qua nhiều giai đoạn
Cho đại lƣợng ngẫu nhiên X có phân phối chuẩn 𝑁(𝜇, 𝜎 2 ) với 𝜎 2 đã biết
nhƣng 𝜇 thì chƣa biết. Giả sử 𝜇 có thể nhận các giá trị 𝜇1 , 𝜇2 , … , 𝜇𝑛 với xác suất tiên
nghiệm 𝑃 𝜇 = 𝜇𝑖 = 𝑝𝑖 . Thực hiện phép thử 𝑚 lần ta đƣợc các giá trị của 𝑋 lần
lƣợt là 𝑥1 , 𝑥2 , … , 𝑥𝑚 . Ta lập bảng phân phối xác suất hậu nghiệm cho 𝜇.
Bảng phân phối xác suất hậu nghiệm của 𝝁 qua nhiều giai đoạn
Khi có nhiều giai đoạn ta lần lƣợt tìm xác suất hậu nghiệm của 𝜇 qua từng
giai đoạn một và xác suất hậu nghiệm của giai đoạn trƣớc chính là xác suất tiên
nghiệm cho giai đoạn sau. Bảng phân phối xác suất hậu nghiệm của 𝜇 là dựa vào
xác suất hậu nghiệm của giai đoạn cuối cùng.
1.2.3 Hàm mật độ xác suất hậu nghiệm cho tham số
a. Hàm mật độ xác suất hậu nghiệm khi có một quan sát
Xét đại lƣợng ngẫu nhiên 𝑋 với hàm mật độ xác suất 𝑓(𝑥) có tham số 𝜃 chƣa
biết. Giả sử 𝜃 có hàm mật độ xác suất tiên nghiệm 𝑔(𝜃). Thực hiện một quan sát, ta
đƣợc giá trị cụ thể của 𝑋 là 𝑥0 . Khi đó hàm mật độ xác suất hậu nghiệm của 𝜃 đƣợc
xác định nhƣ sau
𝑔 𝜃 𝑥0 =

𝑔 𝜃 𝑓(𝑥0 |𝜃)
𝑔 𝜃 𝑓 𝑥0 𝜃 𝑑𝑥

b. Hàm mật độ xác suất khi có nhiều quan sát
Trong trƣờng hợp X nhận nhiều giá trị quan sát 𝑥1 , 𝑥2 , … , 𝑥𝑛 thì hàm mật độ xác
suất hậu nghiệm của 𝜃 trở thành nhƣ sau
𝑔 𝜃 𝑥1 , 𝑥2 , … , 𝑥𝑛 =

𝑔 𝜃 𝑓(𝑥 |𝜃)
𝑔 𝜃 𝑓 𝑥 𝜃 𝑑𝑥


Trong đó
1
𝑥=
𝑛

𝑛

𝑥𝑖
𝑖=1

10


c. Hàm mật độ xác suất hậu nghiệm cho tham số của phân phối đặc biệt
 Hàm mật độ xác suất phân phối nhị thức
Đại lƣợng ngẫu nhiên rời rạc X đƣợc gọi là có phân phối nhị thức với hai
tham số 𝑛 và 𝑝. Kí hiệu: 𝑋~𝐵(𝑛, 𝑝). Hàm mật độ của nó đƣợc xác định nhƣ sau
𝑓 𝑥 𝑛, 𝑝 =

Các tham số đặc trưng

𝐶𝑛𝑥 𝑝𝑥 𝑞1−𝑥 𝑘𝑕𝑖 𝑥 = 0, 𝑛
0
𝑘𝑕𝑖 𝑥 ≠ 0, 𝑛

𝑇𝑟𝑢𝑛𝑔 𝑏ì𝑛𝑕: 𝐸 𝑋 = 𝑛𝑝
𝑃𝑕ươ𝑛𝑔 𝑠𝑎𝑖: 𝑉𝑎𝑟 𝑋 = 𝑛𝑝𝑞

 Hàm mật độ xác suất hậu nghiệm của phân phối nhị thức

Bài toán: Giả sử đại lƣợng ngẫu nhiên có phân phối nhị thức trong đó xác
suất thành công 𝑝 là đại lƣợng ngẫu nhiên có hàm mật độ xác suất chƣa biết. Thực
hiện 𝑛 lần các phép thử, gọi 𝑌 là số lần thành công. Ta xác định hàm mật độ xác
suất cho tham số 𝑝 theo công thức sau
Giả sử 𝑌 = 𝑚, ta có
𝑔 𝑝𝑌=𝑚 =

𝑔 𝑝 𝑓(𝑌 = 𝑚|𝑝)
1
𝑔
0

𝑝 𝑓(𝑌 = 𝑚|𝑝)

Trong đó 𝑔 𝑝 là hàm mật độ xác suất tiền nghiệm của 𝑝
𝑓 𝑌 = 𝑚 𝑝 = 𝐶𝑛𝑚 𝑝𝑚 1 − 𝑝

𝑛 −𝑚

Các trƣờng hợp đặc biệt
 Khi p có hàm mật độ xác suất tiên nghiệm đều
Nếu 𝑝 có hàm mật độ xác suất tiên nghiệm đều trên [0, 1] thì hàm mật độ xác
suất hậu nghiệm của nó là 𝛽(𝑎, 𝑏), trong đó
𝑎 =𝑚+1
𝑏 =𝑛−𝑚+1
Với n là số lần thực hiện phép thử và m là số lần thành công
Chứng minh
Vì p có hàm mật độ xác suất tiên nghiệm đều trên [0, 1] nên ta có
𝑝~𝑅 0, 1 ⟹ 𝑔 𝑝 =
Khi đó

11

1 𝑘𝑕𝑖 𝑝 ∈ [0, 1]
0 𝑘𝑕𝑖 𝑝 ∉ [0, 1]


𝑔 𝑝𝑌=𝑚 =

𝑓(𝑌 = 𝑚|𝑝)
1
𝑓
0

𝑌 = 𝑚 𝑝 𝑑𝑝

=

𝐶𝑛𝑚 𝑝𝑚 1 − 𝑝
1 𝑚 𝑚
𝐶 𝑝
0 𝑛

𝑛−𝑚

1−𝑝

𝑛−𝑚

Mặt khác
𝐶𝑛𝑚 𝑝𝑚 1 − 𝑝


𝑛−𝑚

=

𝑛!
𝑝𝑚 1 − 𝑝
𝑚! 𝑛 − 𝑚 !

Đặt 𝑚 = 𝑎 − 1, 𝑛 − 𝑚 = 𝑏 − 1 khi đó:
𝑛!
𝐶𝑛𝑚 𝑝𝑚 1 − 𝑝 𝑛 −𝑚 =
𝑝𝑎 −1 1 − 𝑝
𝑎−1 ! 𝑏−1 !

𝑛−𝑚

𝑏 −1

= 𝑀. 𝛽(𝑎, 𝑏)

Do đó
𝑔 𝑝𝑌=𝑚 =

𝑀. 𝛽(𝑎, 𝑏)
1
𝑀. 𝛽(𝑎, 𝑏)
0

= 𝛽(𝑎, 𝑏)


 Khi p có hàm mật độ xác suất tiên nghiệm 𝑩𝒆𝒕𝒂
Hàm mật độ xác suất hậu nghiệm cho tham số p của phân phối nhị thức, khi
thực hiện n lần phép thử độc lập và có m lần thành công với hàm mật độ xác suất
tiên nghiệm của tham số p có phân phối 𝛽(𝑎, 𝑏) là phân phối 𝛽(𝑎, 𝑏 ), trong đó
𝑎 =𝑎+𝑚
𝑏 =𝑛+𝑏−𝑚
Chứng minh
Ta có
Γ(𝑎 + 𝑏) 𝑎 −1
𝑝
1−𝑝
𝑛~𝛽 𝑎, 𝑏 ⇔ 𝑔 𝑝 = Γ 𝑎 Γ(𝑏)
0

𝑏 −1

𝑘𝑕𝑖 𝑝 ∈ [0,1]
𝑘𝑕𝑖 𝑝 ∉ [0,1]


𝑓 𝑌 = 𝑚 𝑝 = 𝐶𝑛𝑚 𝑝𝑚 1 − 𝑝

𝑛 −𝑚

Nên
𝑔 𝑝𝑌=𝑚 =

𝑔 𝑝 . 𝑓(𝑌 = 𝑚|𝑝)
1

𝑔
0

𝑝 . 𝑓 𝑌 = 𝑚 𝑝 𝑑𝑝


𝑔 𝑝 .𝑓 𝑌 = 𝑚 𝑝 =

Γ(𝑎 + 𝑏) 𝑚 𝑎 +𝑚 −1
.𝐶 𝑝
1−𝑝
Γ 𝑎 Γ(𝑏) 𝑛

𝑛+𝑏−𝑚 −1

Đặt 𝑎 + 𝑚 = 𝑎, 𝑛 + 𝑏 = 𝑏 khi đó
𝑔 𝑝 .𝑓 𝑌 = 𝑚 𝑝 =

Γ(𝑎 + 𝑏) 𝑚 𝑎 −1
.𝐶 𝑝
1−𝑝
Γ 𝑎 Γ(𝑏) 𝑛

Do đó
12

𝑏 −𝑚 −1

= 𝑀. 𝛽(𝑎, 𝑏)



𝑔 𝑝𝑌=𝑚 =

𝑔 𝑝 . 𝑓(𝑌 = 𝑚|𝑝)
1
𝑔
0

𝑝 . 𝑓 𝑌 = 𝑚 𝑝 𝑑𝑝

=

𝑀. 𝛽(𝑎, 𝑏 )
1
𝑀. 𝛽(𝑎, 𝑏 )
0

= 𝛽(𝑎, 𝑏)

Nhận xét: Khi tham số p có phân phối tiên nghiệm đều trên [0, 1] thì kết quả hàm
phân phối xác suất hậu nghiệm của p là trường hợp đặc biệt khi tham số p có phân
phối 𝛽(𝑎, 𝑏), với 𝑎 = 1, 𝑏 = 1.
 Hàm mật độ xác suất của phân phối chuẩn
Đại lƣợng ngẫu nhiên liên tục X đƣợc gọi là có phân phối chuẩn với hai tham
số 𝜇 và 𝜎 2 . Kí hiệu: 𝑋~𝑁(𝜇, 𝜎 2 ) và hàm mật độ xác suất của nó đƣợc xác định nhƣ
sau
𝑓 𝑥|𝜇, 𝜎
Các tham số đặc trưng

2


2

1

𝑥−𝜇
=
𝑒𝑥𝑝 −
2𝜎
𝜎 2𝜋

𝑇𝑟𝑢𝑛𝑔 𝑏ì𝑛𝑕: 𝐸 𝑋 = 𝜇
𝑃𝑕ươ𝑛𝑔 𝑠𝑎𝑖: 𝑉𝑎𝑟 𝑋 = 𝜎 2

 Hàm mật độ xác suất hậu nghiệm của phân phối chuẩn
Bài toán: Giả sử đại lƣợng ngẫu nhiên X có phân phối chuẩn với tham số
trung bình là 𝜇 chƣa biết, phƣơng sai 𝜎 2 đã biết. Giả sử 𝜇 có hàm mật độ xác suất là
𝑔(𝜇). Thực hiện một quan sát ta đƣợc một giá trị cụ thể của X là 𝑥0 . Ta tìm mật độ
xác suất hậu nghiệm của 𝜇.
Hàm mật độ xác suất hậu nghiệm đƣợc xác định bởi công thức
𝑔 𝜇 𝑥0 =

𝑔 𝜇 . 𝑓(𝑥0 |𝜇)
+∞
−∞

𝑔 𝜇 . 𝑓 𝑥0 𝜇 𝑑𝜇

Trong đó
𝑓 𝑥0 𝜇 =


1
𝜎 2𝜋

𝑒𝑥𝑝 −

2

𝑥0 − 𝜇
2𝜎 2

 Trường hợp 𝝁 có phân phối tiên nghiệm chuẩn 𝝁~𝑵(𝒎, 𝒔𝟐 )
Ta có
1

𝜇−𝑚
𝑔 𝜇 =
𝑒𝑥𝑝 −
2𝑠 2
𝑠 2𝜋
1
1
𝑔 𝜇 . 𝑓 𝑥0 𝜇 =
𝑒𝑥𝑝 −
2𝜋𝑠𝜎
2
13

𝑥0 − 𝜇
𝜎2


2

2

𝜇−𝑚
+
𝑠2

2


Xét
1
𝑃=−
2

=−

𝑥0 − 𝜇
𝜎2

2

𝜇−𝑚
+
𝑠2

2


1
𝑠 2 + 𝑚2 𝜇 2 − 2 𝑥0 𝑠 2 + 𝑚𝜎 2 𝜇 + 𝑠 2 𝑥02 + 𝑚2 𝜎 2
2𝜎 2 𝑠 2

=−

𝑠2 + 𝜎2 2
𝑥0 𝑠 2 + 𝑚𝜎 2
𝑠 2 𝑥02 + 𝑚2 𝜎 2
𝜇

2
𝜇
+
2𝜎 2 𝑠 2
𝑠2 + 𝜎2
𝑠2 + 𝜎2

𝑠2 + 𝜎2
=−
2𝜎 2 𝑠 2

𝑥0 𝑠 2 + 𝑚𝜎 2
𝜇−
𝑠2 + 𝜎2

2

+𝑃


Với P là hằng số đƣợc điều chỉnh thích hợp.
Do đó
𝑔 𝜇 . 𝑓 𝑥0 𝜇 =

1
2𝜋𝑠𝜎

𝑒𝑥𝑝 −

1
2𝜎 2 𝑠 2

𝜇−

𝑥 0 𝑠 2 +𝑚 𝜎 2
𝑠 2 +𝜎 2

2

+𝑃

1
𝑠2 + 𝜎2
𝑥0 𝑠 2 + 𝑚𝜎 2
=
𝑒𝑥𝑝 −
𝜇−
2𝜋𝑠𝜎
2𝜎 2 𝑠 2
𝑠2 + 𝜎2

𝑔 𝜇 𝑥0 =

2

. 𝑒𝑃

𝑔 𝜇 . 𝑓 𝑥0 𝜇
+∞
−∞

=−

𝑔 𝜇 . 𝑓 𝑥0 𝜇 𝑑𝜇
1
𝑠𝜎
+ 𝜎2

𝑠2

1
𝑥0 𝑠 2 + 𝑚𝜎 2
𝑒𝑥𝑝 −
𝜇−
𝑠2𝜎2
𝑠2 + 𝜎2
2𝜋
2 2
2
𝑠 +𝜎


2

Đặt:
𝑥0 𝑠 2 + 𝑚𝜎 2 1
𝑠2 + 𝜎2
𝜇=
, 2= 2 2
𝑠2 + 𝜎2
𝑎
𝑠 𝜎
1
1
𝑔 𝜇 =
𝑒𝑥𝑝 − 2 𝜇 − 𝜇 2
2𝑎
𝑎 2𝜋
Khi đó phân phối hậu nghiệm của 𝜇 là phân phối chuẩn 𝑁(𝑚, 𝑠 2 ) với
𝑥0 𝑠 2 + 𝑚𝜎 2 2
𝑠2𝜎2
𝑚=
,𝑠 = 2
𝑠2 + 𝜎2
𝑠 + 𝜎2
 Trường hợp khi có nhiều quan sát cho trung bình

14


Khi thực hiện n lần quan sát cho X ta nhận đƣợc các giá trị cụ thể
𝑥1 , 𝑥2 , … , 𝑥𝑛 , khi đó hàm mật độ xác suất cho 𝜇 đƣợc xác định nhƣ sau

𝑔 𝜇 𝑥1 , 𝑥2 , … , 𝑥𝑛 =

𝑔 𝜇 . 𝑓 𝑥| 𝜇
+∞
−∞

𝑔 𝜇 . 𝑓 𝑥| 𝜇 𝑑𝜇

Xét trong trƣờng hợp đặc biệt 𝑋𝑖 có phân phối chuẩn 𝑋𝑖 ~𝑁(𝑚, 𝑠 2 ) và có
hàm mật độ
1

𝜇−𝑚
𝑓 𝑥𝑖 |𝜇 =
𝑒𝑥𝑝 −
2𝑠 2
𝑠 2𝜋

2

Thì phân phối hậu nghiệm của 𝜇 cũng là phân phối chuẩn 𝑁(𝑚, 𝑠 2 ) với
𝑛𝑥𝑠 2 + 𝑚𝜎 2 2
𝑠2𝜎2
𝑚=
,𝑠 =
𝑛. 𝑠 2 + 𝜎 2
𝑛. 𝑠 2 + 𝜎 2

15



CHƢƠNG 2: ƢỚC LƢỢNG THAM SỐ THỐNG KÊ
BẰNG PHƢƠNG PHÁP BAYES
Một đại lƣợng ngẫu nhiên đƣợc đặc trƣng bởi các tham số mà trong thực tế
hầu nhƣ không thể biết đƣợc chúng một cách chính xác. Do đó, để xác định đƣợc
những tham số này ngƣời ta sẽ ƣớc lƣợng chúng từ mẫu đã chọn. Bài toán ƣớc
lƣợng tham số thống kê là bài toán ƣớc lƣợng giá trị tham số chƣa biết của đại
lƣợng ngẫu nhiên dựa vào quan sát trên mẫu đƣợc lấy ra. Thông thƣờng các tham số
cần ƣớc lƣợng là trung bình, phƣơng sai và tỷ lệ những phần tử nào đó đang đƣợc
quan tâm trong tổng thể. Căn cứ vào kết quả ƣớc lƣợng, ngƣời ta chia bài toán ƣớc
lƣợng tham số thống kê thành hai loại là ƣớc lƣợng điểm và ƣớc lƣợng khoảng tham
số thống kê.
2.1.

ƢỚC LƢỢNG ĐIỂM THAM SỐ THỐNG KÊ

Khi nghiên cứu đại lƣợng ngẫu nhiên X của tổng thể, chúng ta thƣờng không
biết phân phối xác suất của nó nhƣ thế nào, vì thế không thể biết chính xác các tham
số đặc trƣng. Ƣớc lƣợng điểm của các giá trị tham số chƣa biết của X (một tham số
hoặc nhiều tham số) là việc dựa trên một mẫu ( X1 , X 2 ,..., X n ) để tìm đƣợc một thống
kê ˆ( X , X ,..., X ) để thay thế tham số  chƣa biết.
1

2

n

Việc xác định điểm ƣớc lƣợng bằng phƣơng pháp Bayes của tham số chƣa
biết sẽ dựa vào phân phối xác suất hậu nghiệm của tham số đó.
Tuy nhiên, khi ƣớc lƣợng tham số  chƣa biết bằng phƣơng pháp ƣớc lƣợng

điểm thì ta không biết đƣợc mức độ chính xác của ƣớc lƣợng. Vì thế, không đánh
giá đƣợc mức độ sai lầm khi ta dùng ˆ thay cho  . Để khắc phục các hạn chế đó,
ta sử dụng ƣớc lƣợng khoảng tin cậy cho tham số  .
2.2.

ƢỚC LƢỢNG KHOẢNG THAM SỐ THỐNG KÊ

Giả sử  là một tham số của biến ngẫu nhiên X cần biết. Ƣớc lƣợng khoảng
tham số  là xác định khoảng ( 1 ;  2 ) sao cho xác suất để   ( 1 ;  2 ) bằng một độ
tin cậy cho trƣớc.
Trong bài toán ƣớc lƣợng khoảng, ta sử dụng một số kí hiệu sau
  : Mức ý nghĩa, là khả năng có thể mắc phải sai lầm khi ƣớc
lƣợng.
 1-  : Độ tin cậy của ƣớc lƣợng.
 ( 1;  2 ): Khoảng tin cậy của ƣớc lƣợng.
Thông thƣờng trong thực tế ta chỉ ƣớc lƣợng khoảng tham số với khoảng tin
cậy đối xứng. Trong phần này để ngắn gọn ta chỉ nói “ƣớc lƣợng” thay cho cách nói
đầy đủ “ƣớc lƣợng khoảng tin cậy đối xứng”. Khi đó, tham số  cần ƣớc lƣợng
thuộc khoảng (1; 2 )  (0   ; 0   ) , trong đó
16


  0 là ƣớc lƣợng điểm của tham số  ,
  là độ chính xác hay sai số của ƣớc lƣợng.
Sau đây là một số bài toán ƣớc lƣợng tham số cơ bản bằng phƣơng pháp
Bayes.
2.2.1. Một số bài toán ƣớc lƣợng liên quan đến trung bình
a. Ƣớc lƣợng trung bình
Giả sử đại lƣợng ngẫu nhiên X có tham số trung bình E(X) =  chƣa biết.
Cho trƣớc số  khá nhỏ, ƣớc lƣợng trung bình  với mức ý nghĩa  là việc chỉ ra

một khoảng ( 1 ,  2 ) sao cho P(1     2 ) = 1   .
 Trường hợp biết phương sai 𝝈𝟐
Giả sử đại lƣợng ngẫu nhiên X có tham số trung bình 𝜇 chƣa biết nhƣng
phƣơng sai 𝜎 2 đã biết. Tham số 𝜇 có phân phối tiên nghiệm chuẩn 𝑁 𝑚, 𝑠 2 . Chọn
một mẫu gồm n phần tử. Tham số trung bình mẫu là đại lƣợng ngẫu nhiên có phân
2
phối chuẩn 𝑁(𝜇, 𝜎 𝑛 ). Khi đó, 𝜇 có phân phối hậu nghiệm là phân phối chuẩn
𝑁(𝑚, 𝑠 2 ) với
𝜎 2 𝑚 + 𝑛𝑥𝑠 2
𝜎2𝑠2
2
𝑚=
,
𝑠 = 2
𝜎 2 + 𝑛𝑠 2
𝜎 + 𝑛𝑠 2
Do đó, với độ tin cậy 1 − 𝛼 cho trƣớc thì khoảng ƣớc lƣợng hậu nghiệm
(1 ,  2 ) của 𝜇 là
𝑚 − 𝑢1−𝛼 . 𝑠 , 𝑚 + 𝑢1−𝛼 . 𝑠
2

2

 Trường hợp chưa biết phương sai 𝝈𝟐
Khi 𝐧 ≥ 𝟑𝟎
Giả sử đại lƣợng ngẫu nhiên X có tham số trung bình 𝜇 chƣa biết và phƣơng
sai 𝜎 chƣa biết. Tham số 𝜇 có phân phối tiên nghiệm chuẩn 𝑁 𝑚, 𝑠 2 . Chọn một
mẫu gồm n phần tử. Trong trƣờng hợp này, phƣơng sai 𝜎 2 chƣa biết ta sẽ thay bằng
phƣơng sai mẫu điều chỉnh là
2


1
𝜎2 =
𝑛−1

𝑛

(𝑥𝑖 − 𝑥)2
𝑖=1

Khi đó, tham số trung bình mẫu là đại lƣợng ngẫu nhiên có phân phối chuẩn
2
2
𝜎
𝑁(𝜇,
𝑛 ) và 𝜇 có phân phối hậu nghiệm cũng là phân phối chuẩn 𝑁(𝑚, 𝑠 ) với

17


𝜎 2 𝑚 + 𝑛𝑦𝑠 2 2
𝜎2𝑠2
𝑚=
,𝑠 = 2
𝜎 2 + 𝑛𝑠 2
𝜎 + 𝑛𝑠 2
Do đó, với độ tin cậy 1 − 𝛼 cho trƣớc thì khoảng ƣớc lƣợng hậu nghiệm
(1 ,  2 ) của 𝜇 là
𝑚 − 𝑢1−𝛼 2 . 𝑠 , 𝑚 + 𝑢1−𝛼 2 . 𝑠
Khi 𝒏 < 30

Ta thực hiện tƣơng tự nhƣ trƣờng hợp trên và thay thế phân vị chuẩn 𝑢1−𝛼
bằng phân vị Student với bậc tự do 𝑛 − 1, mức xác suất 𝛼 2.

2

Do đó, với độ tin cậy 1 − 𝛼 cho trƣớc thì khoảng ƣớc lƣợng hậu nghiệm
(1 ,  2 ) của 𝜇 trong trƣờng hợp này là
(𝑚 − 𝑡𝛼

2

𝑛 − 1 . 𝑠 , 𝑚 + 𝑡𝛼

2

𝑛 − 1 . 𝑠)

Ví dụ 2.1: Hàm lƣợng vitamin trong một loại trái cây là một đại lƣợng ngẫu
nhiên có phân phối chuẩn với tham số trung bình chƣa biết và độ lệch chuẩn bằng 3.
Giả sử hàm lƣợng vitamin có phân phối tiên nghiệm chuẩn 𝑁(30; 102 ). Chọn một
mẫu gồm 10 trái cây đo đƣợc hàm lƣợng vitamin (đơn vị %) ta có số liệu sau
38.7 40.4 37.2 36.6 35.9 34.7 37.6 35.1 37.5 35.6
Hãy ƣớc lƣợng hàm lƣợng vitamin trung bình hậu nghiệm của trái cây với độ
tin cậy 95%.
Giải
Gọi 𝜇 là hàm lƣợng vitamin trung bình của trái cây
Đây là bài toán ƣớc lƣợng khoảng trung bình trong trƣờng hợp phƣơng sai đã biết.
Ta có
1 38,7 + 40,4 + 37,2 + 36,6 + 35,9 + 34,7 +
= 36,93

37,6 + 35,1 + 37,5 + 35,6
10
Vì 𝜇 có phân phối tiên nghiệm chuẩn 𝑁(30, 102 ) nên phân phối hậu nghiệm của 𝜇
là phân phối chuẩn 𝑁(𝑚, 𝑠 2 ) với
𝑦=

𝑚=

𝑚/𝑠 2 + 𝑛𝑦/𝜎 2 30/102 + 10.36,93/32
=
= 34,13
𝑛/𝜎 2 + 1/𝑠 2
10/32 + 1/102

𝜎2 𝑠2
32 . 102
𝑠 = 2
=
= 0,89
𝜎 + 𝑛𝑠 2 32 + 10. 102
Do đó với mức ý nghĩa 𝛼 = 0,05 ta đƣợc
2

𝑚 − 𝑢1−𝛼 2 . 𝑠 = 34,13 − 1,96. 0,89 = 32,28
𝑚 + 𝑢1−𝛼 2 . 𝑠 = 34,13 + 1,96. 0.89 = 35,98
Vậy hàm lƣợng vitamin trung bình của trái cây là (32,28 ; 35,98).
18


Ví dụ 2.2: Một ngƣời muốn ƣớc lƣợng chiều cao trung bình của loài cây

trồng, đƣợc trồng trên những vùng đất khác nhau. Chọn giá trị tiền nghiệm của
trung bình là phân phối chuẩn N (30, 42 ) . Giả sử chiều cao này có phân phối chuẩn
với độ lệch chuẩn chƣa biết. Chọn một mẫu ngẫu nhiên gồm 15 cây ta có đƣợc
trung bình mẫu là 32,5 cm, độ lệch chuẩn mẫu điều chỉnh là 2,2 cm. Hãy ƣớc lƣợng
chiều cao trung bình hậu nghiệm của cây với độ tin cậy 95%.
Giải
Gọi 𝜇 là chiều cao trung bình của cây
Đây là bài toán ƣớc lƣợng khoảng trung bình trong trƣờng hợp phƣơng sai chƣa
biết.
Ta có 𝑦 = 32,5, 𝜎 2 = 2,2 , 𝑛 = 15 < 30
Vì 𝜇 có phân phối tiên nghiệm chuẩn N (30,4 2) nên phân phối hậu nghiệm của 𝜇 là
phân phối chuẩn 𝑁(𝑚, 𝑠 2 ) với
2

𝑚=

2

𝑚/𝑠 + 𝑛𝑦/𝜎
=
𝑛/𝜎 2 + 1/𝑠 2

30. 1 42 + 15.32,5. 1 2,22
15

2,22

+ 1 42

= 32,45


𝜎2𝑠2
2,22 . 42
𝑠 = 2
=
= 0,3163
𝜎 + 𝑛𝑠 2 2,22 + 15. 42
2

Do đó
𝑚−. 𝑡𝛼

2

𝑚 − 𝑡𝛼

2

𝑛 − 1 𝑠 = 32,45 − 2,145. 0,3163 = 31,244
𝑛 − 1 . 𝑠 = 32,45 + 1,96 0,3163 = 33,656

Vậy chiều cao trunng bình của cây là khoảng (31,244; 33,656).
b. Ƣớc lƣợng sự khác nhau của hai trung bình
Bài toán: Giả sử X1 và X2 là hai đại lƣợng ngẫu nhiên có phân phối chuẩn
𝑋1 ~𝑁(𝜇1 , 𝜎12 ), 𝑋2 ~𝑁 𝜇2 , 𝜎22 , chúng ta muốn ƣớc lƣợng sự khác nhau giữa 𝜇1 và
𝜇2 dựa trên hai mẫu quan sát độc lập của X1 và X2 với độ tin cậy 1 − 𝛼 cho trƣớc.
Ở đây ta chỉ xét trƣờng hợp đã biết phƣơng sai và hai phƣơng sai này bằng
nhau.
Ta có hai mẫu 𝑦11 , … , 𝑦𝑛 1 1 , (𝑦12 , … , 𝑦𝑛 2 2 ) của hai đại lƣợng ngẫu nhiên X1
và X2 độc lập nên phân phối hậu nghiệm của chúng cũng độc lập. Giả sử ta có phân

phối tiên nghiệm: 𝜇1 ~𝑁(𝑚1 , 𝑠12 ) và 𝜇2 ~𝑁(𝑚2 , 𝑠12 ) . Khi đó

19


×