Tải bản đầy đủ (.pdf) (39 trang)

Xấp xỉ phân phối chuẩn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (8.14 MB, 39 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
KHOA TOÁN
−−−⋆−−−

NGUYỄN THỊ THỤC ĐOAN

XẤP XỈ PHÂN PHỐI CHUẨN
Chuyên ngành: Cử nhân Toán ứng dụng

KHÓA LUẬN TỐT NGHIỆP

Người hướng dẫn: T.S.LÊ VĂN DŨNG

Đà Nẵng - 05/ 2015



LỜI CẢM ƠN!

Trong suốt q trình học tập và hồn thành luận văn này, tôi đã nhận được
sự hướng dẫn, giúp đỡ tận tình của q Thầy Cơ, gia đình và bạn bè. Với lịng
kính trọng và biết ơn sâu sắc tôi xin được bày tỏ lời cảm ơn chân thành tới :
- Ban chủ nhiệm Khoa Toán, các thầy cơ và các cán bộ khoa Tốn, trường
Đại học Sư Phạm, Đại học Đà Nẵng đã nhiệt tình giảng dạy và giúp đỡ tơi trong
suốt q trình học tập tại trường.
- Đặc biệt, tơi xin bày tỏ lịng biết ơn sâu sắc đến thầy T.S. Lê Văn Dũng
là người đã hết lòng giúp đỡ, dạy bảo, động viên, và tạo mọi điều kiện thuận lợi
để tơi có thể hồn thành luận văn tốt nghiệp này.
- Nhân đây tôi cũng xin gởi lời cảm ơn đến gia đình, bạn bè đã giúp đỡ
động viên tôi cả về vật chất lẫn tinh thần trong suốt quá trình làm luận văn tốt


nghiệp.
Mặc dù luận văn đã được hoàn thành đúng thời gian qui định nhưng do
điều kiện thời gian và kiến thức còn hạn chế nên luận văn của tôi không tránh
khỏi những thiếu sót. Vì vậy, tơi rất mong nhận được sự đóng góp ý kiến của
các thầy cơ và các bạn để tạo điều kiện cho luận văn của tôi được hoàn thiện
hơn.
Đà Nẵng, tháng 05 năm 2015
Sinh viên

Nguyễn Thị Thục Đoan


MỤC LỤC

Lời cảm ơn!

2

Lời mở đầu

4

1 Kiến Thức Cơ Sở

6

1.1

Không gian xác suất . . . . . . . . . . . . . . . . . . . . . . . . . .


6

1.2

Biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

1.3

Các tham số đặc trưng của Biến ngẫu nhiên . . . . . . . . . . . . .

8

1.4

Một số phân phối xác suất quan trọng . . . . . . . . . . . . . . . .

9

2 Xấp xỉ phân phối chuẩn

13

2.1

Định lý giới hạn trung tâm . . . . . . . . . . . . . . . . . . . . . . . 13

2.2


Một số ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.3

Xấp xỉ phân phối chuẩn của phân phối nhị thức . . . . . . . . . . 15

2.4

Những ví dụ về khái quát định lý giới hạn trung tâm . . . . . . . 24

2.5

Xấp xỉ phân phối chuẩn của phân phối Poisson và Gamma . . . . 29

2.6

Các gợi ý thực tiễn về xấp xỉ phân phối chuẩn . . . . . . . . . . . 33

2.7

Tóm tắt nội dung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

Kết luận

36

Tài liệu tham khảo

37


3


LỜI MỞ ĐẦU

1. Lí do chọn đề tài
Lý thuyết xác suất thống kê là một bộ phận của toán học nghiên cứu các hiện
tượng ngẫu nhiên và ứng dụng chúng vào thực tế.
Ngày nay, lý thuyết xác suất thống kê đã được sử dụng để nghiên cứu tìm ra
các qui luật chi phối và đưa ra các phương pháp tính tốn xác suất của các
hiện tượng ngẫu nhiên. Nó là cơng cụ khơng thể thiếu được mỗi khi ta nói đến
dự báo, bảo hiểm, khi cần đánh giá các cơ may, nguy cơ rủi ro,...Nhà toán học
Pháp Laplace ở thế kỉ 19 đã tiên đốn rằng : "Mơn khoa học này hứa hẹn sẽ trở
thành một trong những đối tượng quan trọng nhất của tri thức nhân loại. Rất
nhiều vấn đề quan trọng nhất của đời sống thực tế thuộc về những bài toán của
lý thuyết xác suất". Và "xấp xỉ phân phối chuẩn" là một trong những bài toán
như thế.
2. Mục đích nghiên cứu
• Hệ thống lại kiến thức cơ sở về lý thuyết xác suất đã học.
• Tìm hiểu mở rộng thêm kiến thức về xấp xỉ phân phối chuẩn.

3. Phương pháp nghiên cứu
• Nghiên cứu lí luận: Trước tiên là đọc các tài liệu liên quan đến nội dung đề

tài.
• Hệ thống hóa các kiến thức cơ sở về không gian xác suất, các biến ngẫu

nhiên và một số phân phối xác suất quan trọng để áp dụng vào tìm hiểu về
xấp xỉ phân phối chuẩn.
• Hỏi,trao đổi và tham khảo ý kiến của giáo viên hướng dẫn,nghiên cứu về


xấp xỉ phân phối chuẩn.


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

• Đưa ra các khái niệm, định lý, ví dụ, và chứng minh rõ ràng về xấp xỉ phân

phối chuẩn.
4. Cấu trúc luận văn
Bố cục bao gồm 2 chương :
• Chương 1 Kiến thức cơ sở,hệ thống hóa các kiến thức liên quan để hổ trợ

cho việc tìm hiểu xấp xỉ phân phối chuẩn.
• Chương 2 Xấp xỉ phân phối chuẩn.

Do thời gian thực hiện khóa luận khơng nhiều, kiến thức cịn hạn chế nên khi
làm khóa luận khơng tránh khỏi những hạn chế và sai sót. Tơi mong nhận được
sự góp ý và những ý kiến phản biện của quý thầy cô và bạn đọc. Tôi xin chân
thành cảm ơn!
Đà Nẵng, tháng 05 năm 2015
Sinh viên

Nguyễn Thị Thục Đoan

5



CHƯƠNG 1
KIẾN THỨC CƠ SỞ

1.1

Khơng gian xác suất

1.1.1

Phép thử

Trong tốn học có những khái niệm khơng có định nghĩa mà chỉ có thể mơ
tả chúng bằng những hình ảnh hoặc tư duy trực quan. Chẳng hạn trong hình
học các khái niệm điểm, đường thẳng, mặt phẳng là những khái niệm khơng có
định nghĩa. Trong xác suất, khái niệm phép thử là khái niệm cơ bản khơng có
định nghĩa. Ta có thể hiểu phép thử là việc thực hiện một nhóm các điều kiện
cơ bản nào đó để quan sát một hiện tượng có xảy ra hay khơng. Phép thử được
gọi là ngẫu nhiên nếu ta không thể dự báo trước chính xác kết quả nào sẽ xảy
ra khi ta thực hiện phép thử đó.
1.1.2

Khơng gian mẫu

Tập hợp tất cả các kết quả có thể xảy ra của một phép thử ngẫu nhiên được
gọi là khơng gian mẫu. Ta thường kí hiệu là Ω.
Cho không gian mẫu Ω. Ta chỉ xét 1 lớp F các tập con của Ω thoã mãn 3
điều kiện:
+∅∈F
+ Nếu A ∈ F thì Ac ∈ F
+ Nếu A1 , A2 , ... , An , ... ∈ F thì


∪∞

n=1 An

∈F

Lớp F như vậy được gọi là σ -đại số các tập con của Ω
1.1.3

Độ đo xác suất

Một hàm tập hợp P : F → R được gọi là độ đo xác suất nếu thoã mãn 3 điều
kiện sau:
6


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

+ Với mọi A ∈ F , 0 ≤ P(A) ≤ 1
+ P(Ω) = 1
+ Nếu A1 ,A2 ,... ,An ,... đôi một không giao nhau(Ai ∩ Ai = ∅ với mọi i ̸=
j) thì
P(





An ) =

n=1




P (An ).

n=1

Khi đó mỗi phần tử của F được gọi là biến cố và P(A) được gọi là xác suất
xảy ra biến cố A. Bộ ba (Ω, F, P ) gọi là không gian xác suất.

1.2

Biến ngẫu nhiên

Định nghĩa 1.1. Cho không gian xác suất (Ω, F, P ). Ánh xạ X : Ω → R được
gọi là Biến ngẫu nhiên nếu X là hàm đo được, tức là với mọi a ∈ R, {ω ∈ Ω :
X(ω) < a} ∈ F .
1.2.1

Hàm phân phối xác suất

Định nghĩa 1.2. Cho biến ngẫu nhiên X , hàm số F (x) = P (X < x), x ∈ R được
gọi là hàm phân phối xác suất của X .
1.2.2

Biến ngẫu nhiên độc lập


Cho n Biến ngẫu nhiên X1 , ..., Xn xác định trên cùng một không gian mẫu
có các hàm phân phối xác suất lần lượt là F1 (x), ..., Fn (x). Ta nói các biến ngẫu
nhiênX1 , ..., Xn độc lập nếu với mọi x1 , ..., xn ∈ R ta có
P (X1 < x1 , ..., Xn < xn ) = F1 (x1 )...Fn (xn )
1.2.3

Biến ngẫu nhiên rời rạc và biến ngẫu nhiên liên tục

Ta gọi X là biến ngẫu nhiên rời rạc, nếu nó có miền giá trị hữu hạn hoặc vơ
hạn đếm được. Nếu biến ngẫu nhiên X có miền giá trị x1 , x2 , . . . , xn thì bảng số
X

P

x1
P (X = x1 )

x2
P (X = x2 )

...
xn
... P (X = xn )

được gọi là bảng phân phối xác suất biến ngẫu nhiên X.

7



Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu tồn tại một hàm
số f : R → R khả tích khơng âm sao cho với mọi y ∈ R,
∫ y
F (y) =

f (x)dx,
−∞

trong đó : F (y) là hàm phân phối của X .
Khi đó, f (x) được gọi là hàm mật độ của X .

1.3
1.3.1

Các tham số đặc trưng của Biến ngẫu nhiên
Kỳ vọng toán

Cho biến ngẫu nhiên X xác định trên không gian xác suất (Ω; F; P ), khả tích
Lebesgue. Kì vọng của X , kí hiệu là E(X), được xác định bởi

E(X) =

XdP.


+ Nếu Biến ngẫu nhiên rời rạc X có bảng phân phối xác suất


thì E(X) =



X
P

x1
p1

x2
p2

... xn ... ...
... pn ... ...

xk pk .

k

+ Nếu Biến ngẫu nhiên liên tục X có hàm mật độ f (x) thì:
∫+∞
E(X) =

xf (x)dx.
−∞

1.3.2


Phương sai

Cho Biến ngẫu nhiên X , số D(X) = E(X − E(X))2 được gọi là phương sai của
Biến ngẫu nhiên X.
+ Nếu Biến ngẫu nhiên rời rạc X có bảng phân phối xác suất
X
P

x1
p1

x2
p2

... xn ... ...
... pn ... ...
8


Xấp xỉ phân phối chuẩn

thì V ar(X) =

SVTH: Nguyễn Thị Thục Đoan



x2 k pk −

k


(


)2
xk pk

.

k

+ Nếu Biến ngẫu nhiên liên tục X có hàm mật độ f (x) thì :
 +∞
2

x2 f (x)dx − 
xf (x)dx .

∫+∞
V ar(X) =
−∞

1.3.3

−∞

Độ lệch tiêu chuẩn

Độ lệch tiêu chuẩn của biến ngẫu nhiên X , kí hiệu σ (X) được xác định bởi


cơng thức: σ (X) = V ar(X).
1.3.4

Trung vị

Số thực m được gọi là trung vị của biến ngẫu nhiên X nếu thỏa mãn P (X <
m) ≤ 0.5 và P (X > m) ≤ 0.5

Kí hiệu med(X) = m.

1.4
1.4.1

Một số phân phối xác suất quan trọng
Phân phối Bernoulli

Định nghĩa 1.3. Biến ngẫu nhiên rời rạc X được gọi là có phân phối Bernoulli
với tham số p(0 < p < 1) nếu X có hàm mật độ xác suất
{ x
p (1 − p)1−x nếu x ∈ {0, 1}
p(x; p) =
0
nếu x ∈
/ {0, 1}
Kí hiệu: X ∼ Ber(p)
Nếu X ∼ Ber(p) thì E(X) = p và V ar(X) = p(1 − p)
Ví dụ 1.4. Chọn ngẫu nhiên 1 sinh viên. Đặt:
{
1 nếu sinh viên đó hút thuốc lá
X=

0 nếu sinh viên đó khơng hút thuốc lá
Nếu có 20% sinh viên hút thuốc lá thì hàm mật độ xác suất của X là

0.8 nếu x = 0
p(x) = 0.2 nếu x = 1

0
nếu x ∈
/ {0; 1}
9


Xấp xỉ phân phối chuẩn

1.4.2

SVTH: Nguyễn Thị Thục Đoan

Phân phối nhị thức

Định nghĩa 1.5. Biến ngẫu nhiên rời rạc X được gọi là có phân phối nhị
thức với tham số n và p(n ∈ N \ {0} , 0 < p < 1) nếu X có hàm mật độ xác suất
{ x k
Cn p (1 − p)n−x nếu x ∈ {0, 1, 2, . . . , n}
p(x; n; p) =
0
nếu trái lại
Kí hiệu: X ∼ Bin(n, p).
Định lý 1.6.
(i) Nếu X1 , X2 , . . . , Xn là các biến ngẫu nhiên độc lập và có cùng phân phối

Ber(p), thì
S = X1 + X2 + . . . + Xn ∼ Bin(n, p).

(ii) Cho X ∼ Bin(n, p), khi đó E(X) = np và V ar(X) = np(1 − p).
Ví dụ 1.7. Tung 10 lần một con xúc xắc, gọi X là số lần xuất hiện mặt 1 chấm.
Khi đó X ∼ Bin(10; 1/6).
Ví dụ 1.8. Giả sử ở một siêu thị có đến 75% khách hàng thanh tốn bằng thẻ
tín dụng. Chọn ngẫu nhiên 10 khách hàng của siêu thị đó, gọi X là số khách
hàng thanh tốn bằng thẻ tín dụng, khi đó X ∼ Bin(10; 0.75). Do đó ta có
E(X) = np = 7.5, V ar(X) = np(1 − p) = 1.875
1.4.3

Phân phối Poisson

Định nghĩa 1.9. Biến ngẫu nhiên rời rạc X được gọi là có phân phối Poisson
với tham số λ (λ > 0) nếu X có hàm mật độ xác suất
p(x; λ) =

e−λ λx
x!

x∈N

Khi đó, E(X) = λ, V ar(X) = λ.
Kí hiệu: X ∼ P oi(λ)
Ví dụ 1.10. Gọi X là số cơn trùng bị dính bởi một cái bẫy trong một ngày. Giả
sử X có phân phối Poisson với tham số λ = 4.5 có nghĩa là trung bình một ngày
có 4.5 con cơn trùng bị dính bẫy. Xác suất có đúng 3 con cơn trùng bị dính bẫy
trong một ngày là


e−4.5 (4.5)5
= 0.1708
P (X = 3) =
5!
10


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

Định lý 1.11. Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên độc lập và có cùng
phân phối P oi(λ), khi đó S = X1 + X2 + . . . + Xn ∼ P oi(nλ).
1.4.4

Phân phối chuẩn

Định nghĩa 1.12. Biến ngẫu nhiên liên tục X được gọi là có phân phối chuẩn
với tham số µ và σ 2 (−∞ < µ < ∞ và σ > 0) nếu X có hàm mật độ xác suất
(x−µ)2
1
f (x; µ, σ) = √ e− 2σ2 , x ∈ R
σ 2π

Kí hiệu: X ∼ N (µ, σ 2 )
Biến ngẫu nhiên chuẩn có tham số µ = 0 và σ = 1 được gọi là phân phối chuẩn
tắc. Một biến ngẫu nhiên có phân phối chuẩn tắc được kí hiệu bởi Z . Hàm mật
độ xác suất của Z là
x2
1

f (x; 0, 1) = φ(x) = √ e− 2


Hàm phân phối xác suất của Z , kí hiệu Φ(x), là
∫ x

1
Φ(x) =
φ(t)dt = √

−∞

x

t2

e− 2 dt

−∞

Định lý 1.13. Cho X ∼ N (µ, σ 2 ). Khi đó
(i) E(X) = µ, V ar(X) = σ 2 .
(ii) Z =

X−µ
σ

∼ N (0; 1)

(iii) Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên độc lập và có cùng phân phối

chuẩn với tham số µ, σ 2 khi đó
S = X1 , X2 , . . . , Xn ∼ N (nµ; nσ 2 )


X=

S = X1 , X2 , . . . , Xn
∼ N (µ, σ 2 /2)
n

(iv) P (X < a) = P (X ≤ a) = Φ

( a−µ )
σ

.

(v) Với α < β

(

P (α < X < β) = P (α ≤ X ≤ β) = Φ

β−µ
σ

)
−Φ

(α − µ)

σ

Ví dụ 1.14. Chiều cao của nam thanh niên trưởng thành ở Việt Nam có phân
phối chuẩn N (µ, 0.12 ). Chọn ngẫu nhiên 100 nam thanh niên trưởng thành. Tính
11


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

xác suất sai số tuyệt đối giữa chiều cao trung bình của 100 nam thanh niên được
chọn µ khơng vượt q 0.03
Giải:
Đặt Xk là chiều cao của nam thanh niên thứ k th k = 1, 2, . . . , 100. Khi đó,
X=

X1 + X2 + · · · + X100
100

có phân phối chuẩn N (µ, 0.012 ). Do đó
P

(

)

X − µ < 0.03 = 2Φ(3) − 1 = 0.9974

12



CHƯƠNG 2
XẤP XỈ PHÂN PHỐI CHUẨN

2.1

Định lý giới hạn trung tâm

Định lý 2.1. Cho X1 , X2 , . . . , Xn (n ≥ 1) là n những biến độc lập bất kỳ có cùng
phân phối xác suất F , có một giá trị trung bình hữu hạn µ, và có phương sai
hữu hạn σ 2 . Cho Sn = X1 + X2 + · · · + Xn , X = X n =
(
)
−nµ
(a) ∀x ∈ R, P S√n nσ
→ Φ(x) khi n → ∞,
2
(√
)
n(X−µ)
(b) ∀x ∈ R, P
≤ x → Φ(x) khi n → ∞.
σ

X1 +X2 +···+Xn
,
n

thì


Nói cách khác, với n đủ lớn
Sn ≈ N (nµ, nσ 2 ),
X ≈ N (µ,

2.2

σ2
).
n

Một số ví dụ

Ví dụ 2.2. Xem biến ngẫu nhiên nhị thức X với tham số n và p; chúng tôi sẽ
cố định p = 0.1 và xem ảnh hưởng của việc tăng n trên pmf của X . Nhắc lại pmf
( )
nhị thức có cơng thức P (X = x) = nx px (1 − p)n−x , x = 0, 1, · · · , n. Sử dụng công
thức này, với n = 10, 20, 50 và 100, chúng tơi tính và phác thảo (như hình 1) pmf
của X trong dạng biểu đồ, biểu đồ này là một hệ thống các hình chữ nhật với
chiều cao tương ứng với một giá trị x bằng (hoặc tỉ lệ với) xác suất của giá trị
x.

13


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

Hình 1: Bin(n, 0.1) pmf với n = 10, 20, 50, 100

Chúng tôi thấy biểu đồ này, với n nhỏ nhất (n = 10), thì biểu đồ nghiêng hẳn về
một phía. Khi n tăng lên, biểu đồ ít bị nghiêng hơn, và với n lớn nhất n = 100,
biểu đồ có hình dạng cái chuông, tập trung ở 10 và 11, giống như đồ thị của
hàm mật độ xá suất của biến ngẫu nhiên chuẩn.
Giải thích như thế nào? Cơng thức cho hệ số độ nghiêng của một phân phối
nhị thức là √ 1−2p , với n → ∞ , p không đổi, sẽ bằng 0. Sự phân phối sẽ trở
np(1−p)

nên gần như cân bằng khi n càng lớn, dù lúc đầu nó bị nghiêng rất nhiều khi n
nhỏ. Hơn nữa, nói chung điều này đúng khi phân phối Bin(n, p) có thể được ước
tính bằng phân phối N (N p, np(1 − p)) với mọi p cố định khi n lớn. Nếu p gần 0.5,
một biểu đồ nhìn khá bình thường sẽ được tạo ra ngay cả khi n nhỏ (n = 20);
nếu p càng gần 0 hoặc 1, một n lớn hơn là cần thiết để tạo ra một biểu đồ nhìn
bình thường. Chúng ta sẽ thấy minh họa thực nghiệm này được xác minh bởi
một định lý dưới đây.

Ví dụ 2.3. Nhắc lại tổng n biến mũ độc lập có kỳ vọng λ, được phân phối bởi
cơng thức G(n, λ), phân phối G với tham số n và λ. Chúng ta sẽ cho λ = 1 và
n thay đổi, chọn n = 1, 3, 10, 50, lần lượt, và phác thảo công thức của G(n, λ).
14


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

Chúng ta cho một hiện tượng tương tự với ví dụ nhị thức trước. Khi n nhỏ,
mật độ phân phối bị nghiêng. Nhưng khi n tăng, mật độ phân phối dần dần trở
thành hình chng, giống như mật độ chuẩn (hình 2).
Điểm chung gì giữa ví dụ nhị thức và ví dụ Gamma? Trong ví dụ nhị thức,

một biến Bin(n, p) là tổng của n độc lập các biến Ber(p), trong khi trong ví dụ
Gamma một biến G(n, 1) là tổng của n độc lập các biến Exp(1)

Hình 2: Bin(n, 0.1) pmf với n = 10, 20, 50, 100
Trong cả hai trường hợp, chúng ta thấy là khi n lớn (khi chúng tôi gắn một
số lượng lớn các biến ngẫu nhiên độc lập với nhau), tổng đó có một mật độ nhìn
tương tự như mật độ chuẩn. Đây thực tế chính là những gì định lý giới hạn trung
tâm nói lên. Khơng quan trọng kiểu biến nào bạn thêm vào, nếu bạn thêm một
giá trị lớn của những biến độc lập, bạn sẽ có được một mật độ chuẩn.

2.3

Xấp xỉ phân phối chuẩn của phân phối nhị thức

Một trường hợp rất quan trọng trong đó định lý giới hạn trung tâm được
áp dụng là sự phân phối nhị thức. Định lý giới hạn trung tâm cho phép chúng
ta được lấy xấp xỉ những xác suất nhị thức quá dài, bao gồm những chuỗi giai
thừa lớn sử dụng những xấp xỉ phân phối chuẩn đơn giản và chính xác. Trước
15


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

hết chúng ta cho giá trị chính xác trên sự xấp xỉ phân phối chuẩn của phân phối
nhị thức.

Định lý 2.4. (Định lý giới hạn trung tâm Moivre-Laplace) Cho X ∼ Bin(n, p)
Sau đó cho mọi p cố định và x ∈ R,

(
P



)

X − np

np(1 − p))

≤x

→ Φ(x)

khi n → ∞
Chứng minh. Gọi X1 , X2 , . . . , Xn là các biến ngẫu nhiên độc lập và có cùng
phân phối xác suất Ber(p) ⇒ X = Sn = X1 + X2 + . . . + Xn
Định lý 2.5. (Định lý giới hạn địa phương Moivre-Laplace). Cho X ∼ Bin(n, p),
sau đó cho mọi p cố định và k = 0, 1, 2, · · · , n
(
X − np



P (X = k) = P

=√

np(1 − p)


(

1

ϕ
∼√
np(1 − p)



k − np

)

np(1 − p)

k − np

)

np (1 − p)

(k−np)2
1
=√
e− 2np(1−p)
2πnp(1 − p)

Chứng minh của định lý này sử dụng sự xấp xỉ Stirling cho những giai thừa

lớn và bao gồm chỉ những giá trị đại số. Nó sẽ được bỏ qua.
2.3.1

Hệ số hiệu chỉnh liên tục.

Định lý giới hạn trung tâm demoivre-laplace cho chúng ta biết rằng nếu
X ∼ Bin(n, p), thì chúng ta có thể lấy xấp xỉ loại ≤ xác suất P (X ≤ k) khi:

(

X − np



P (X ≤ k) = P

(
≈Φ



np(1 − p)
k − np

np(1 − p)

16

≤√


)

k − np
np(1 − p)

)


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

Chú ý, trong trường hợp áp dụng xấp xỉ chuẩn vào phân phối nhị thức, chúng
ta đang sử dụng một phân bố liên tục để lấy xấp xỉ một phân bố rời rạc, chỉ lấy
giá trị số nguyên. Chất lượng của sự lấy xấp xỉ tăng lên, thỉnh thoảng rất nhiều,
nếu chúng ta lấp đầy những khoảng cách giữa các số nguyên liên tiếp. Chúng ta
giả sử rằng một biến cố của X = x thật sự tương ứng với x −

1
2

≤ X ≤ x + 12 .

Trong trường hợp này, để lấy xấp xỉ P (X ≤ k) chúng ta sẽ mở rộng miền biến
cố tới k + 12 và lấy xấp xỉ P (X ≤ k) khi:
(
k+




P (X ≤ k) ≈ Φ

1
2

− np

)

np(1 − p)

Việc lấy xấp xỉ phân phối chuẩn đã được điều chỉnh này được gọi là lấy xấp xỉ
phân phối chuẩn với một hệ số hiệu chỉnh liên tục. Hệ số hiệu chỉnh liên tục nên
luôn luôn được hồn thành khi đang tính tốn một xấp xỉ phân phối chuẩn cho
xác suất nhị thức. Ở đây, những công thức xấp xỉ phân phối chuẩn với hệ số
hiệu chỉnh liên tục được liệt kê dưới đây để dễ tham khảo:
)
(
k+



P (X ≤ k) ≈ Φ

(
P (m ≤ X ≤ k) ≈ Φ

1
2


− np

np(1 − p)

k+



1
2

− np

np(1 − p)

,

)

(
−Φ

m−



1
2

− np


)

np(1 − p)

Chúng ta sẽ áp dụng hệ số hiệu chỉnh liên tục và định lý giới hạn địa phương
để tìm những xấp xỉ phân phối chuẩn cho những xác suất nhị thức trong một
vài ví dụ.

Ví dụ 2.6. (Tung đồng xu). Đây là ví dụ đơn giản nhất của một xấp xỉ phân
phối chuẩn của xác suất nhị thức. Chúng ta sẽ giải một số vấn đề bằng cách áp
dụng phương pháp xấp xỉ phân phối chuẩn.
Đầu tiên, giả sử một đồng xu đồng được tung 100 lần. Xác suất để có mặt ngửa
từ 45 đến 55 lần là bao nhiêu? Kí hiệu X là số mặt ngửa có được trong 100 lần
tung, X ∼ Bin(n, p), với n = 100, p = 0.5. Do đó, sử dụng phương pháp xấp xỉ

17


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

phân phối chuẩn với hệ số hiệu chỉnh liên tục:
(
(
)

)


55.5 − 50
44.5 − 50


P (45 ≤ X ≤ 55) ≈ Φ
−Φ
12.5
12.5
= Φ(1.56) − Φ(−1.56) = 0.9406 − 0.0594 = 0.8812

Nên, phần trăm xác suất mặt ngửa từ 45% và 55% là cao nhưng không quá cao
nếu chúng ta tung 100 lần. Câu hỏi tiếp theo là: Cần tung bao nhiêu lần để
99% chắc chắn phần trăm mặt ngửa sẽ từ 45% đến 55%? Phần trăm mặt ngửa

từ 45% đến 55% nếu và chỉ nếu số mặt ngửa từ 0.45n và 0.55n. Sử dụng xấp xỉ
phân phối chuẩn với hệ số hiệu chỉnh liên tục, một lần nữa, chúng ta muốn
(
)
(
)
0.99 = Φ

0.55n + 0.5 − 0.5n

0.25n

(

⇒ 0.99 = 2Φ


−Φ

0.45n − 0.5 − 0.5n

0.25n

0.55n + 0.5 − 0.5n

0.25n

)

−1

(bởi vì với mọi số thực x, Φ(x) − Φ(−x) = 2Φ(x) − 1)
(
)

0.55n + 0.5 − 0.5n

= 0.995
0.25n
(
)
0.05n + 0.5

⇒Φ
= 0.995
0.25n
⇒Φ


Bây giờ, từ một bảng tiêu chuẩn bình thường, chúng ta tìm thấy Φ(2.575) = 0.995
Vậy nên, chúng ta cân bằng
0.05n + 0.5

= 2.575
0.25n


⇒ 0.05n + 0.5 = 2.575 × 0.5 n = 1.2875 n

Viết


n = x, chúng ta có một phương trình bậc hai 0.05x2 − 1.2875x + 0.5 = 0

để giải. Khai căn chúng ta được là x = 25.71, và bình phương lên nó cho
n ≥ (25.71)2 = 661.04. Vậy nên, giá trị xấp xỉ của n trong n lần tung một

đồng xu, phần trăm mặt ngửa sẽ từ 45% đến 55% với 99% xác suất n = 662. Đa
số người tìm thấy giá trị n cần cao hơn giá trị họ đốn.

Ví dụ 2.7. (Bỏ phiếu: Dự đốn người thắng). Xấp xỉ phân phối chuẩn cho
những xác suất nhị thức thường được sử dụng để thiết kế bầu chọn cho một vấn
18


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan


đề, ví dụ bầu chọn để dự đoán một người thắng cuộc trong một kỳ bầu chọn.
Cho rằng trong cuộc bầu chọn có 2 ứng cử viên A và B, và trong số tất cả người
bỏ phiếu, 52% bầu cho A và 48% bầu cho B. Một cuộc bình chọn của 1400 người
bỏ phiếu đã hoàn tất, xác suất nào để cuộc bầu chọn dự đoán đúng người chiến
thắng?
Ký hiệu X cho số những người bầu cho A. Cuộc bỏ phiếu sẽ dự đoán đúng
người thắng cuộc nếu X > 700. Bằng cách sử dụng xấp xỉ phân phối chuẩn hiệu
chỉnh liên tục.

(

700.5 − 1400 × 0.52
P (X > 700) = 1 − P (X ≤ 700) ≈ 1 − Φ √
1400 × 0.52 × 0.48
= 1 − Φ(−1.5) = Φ(1.5) = 0.9332

)

Miễn là khoảng cách giữa sự ủng hộ của hai ứng cử viên đủ lớn, ví dụ 4% hoặc
hơn, một cuộc bầu chọn sử dụng 1500 lá phiếu sẽ dự đoán đúng người thắng
cuộc với một xác suất cao. Nhưng nó cần những cuộc bầu chọn lớn hơn để dự
đốn chính xác khoảng cách sự ủng hộ của hai ứng cử viên. Xem ví dụ tiếp theo.

Ví dụ 2.8. (Bỏ phiếu bầu chọn: Dự đoán tỉ lệ bầu chọn). Coi cuộc bầu chọn
chỉ có hai ứng cử viên A và B, và cho rằng tỉ lệ người bỏ phiếu bầu cho A là p.
Một cuộc bầu chọn có n người bỏ phiếu được thực hiện, và chúng ta muốn biết
với giá trị nào của n nếu với xác suất 95% chúng ta muốn dự đoán giá trị đúng
của p với sai số tối đa 2%.
Ký hiệu X là số lượt người bầu cho A trong tổng số n người tham gia bỏ

phiếu. Chúng ta sẽ ước tính giá trị đúng của p =
(
)
P

(
⇔P

(

X
− p ≤ 0.02
n

X
n.

Chúng ta muốn chắc chắn.

≥ 0.95

X
p − 0.02 ≤
≤ p + 0.02
n

)
≥ 0.95

⇔ P (np − 0.02n ≤ X ≤ np + 0.02n) ≥ 0.95


)

X − np
0.02n
≤√
≤√
≥ 0.95
np(1 − p)
np(1 − p)
np(1 − p)
(

√ )
−0.02 n
X − np
0.02 n
⇔P √
≤√
≤√
≥ 0.95
p(1 − p)
np(1 − p)
p(1 − p)

⇔P

−0.02n




19


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

Bây giờ, sử dụng xấp xỉ phân phối chuẩn cho phân phối nhị thức
(

√ )
X − np
0.02 n
≤√
≤√
p(1 − p)
np(1 − p)
p(1 − p)
(
(
√ )
√ )
0.02 n
0.02 n
≈Φ √
− Φ −√
p(1 − p)
p(1 − p)
)

(

0.02 n
−1
= 2Φ √
p(1 − p)

P

−0.02 n



Từ bảng tiêu chuẩn bình thường, Φ(z) − Φ(−z) ≥ 0.95 khi z = 1.96. Từ đó chúng
ta đặt


0.02 n



p(1 − p)

[
= 1.96 ⇒ n =

1.96




p(1 − p)
0.02

]2
= 9604p(1 − p)

Tuy nhiên, điểm chính của phép tính này là: tỉ lệ đúng của p là chưa biết, nên
công thức trên không thể dùng trong thực tế. Để giải quyết vấn đề này, chúng
ta dùng giá trị bảo toàn nhất của p, ấy là giá trị của p để cho giá trị lớn nhất
của n ở cơng thức trên. Giá trị đó là p = 0.5, cho ra n = 9604 × 0.25 = 2401. Điều
này khẳng định mệnh đề ở ví dụ trước rằng để dự đốn phần trăm bầu chọn
chính xác, chúng ta cần những cuộc bầu chọn với số lượng người tham gia nhiều
hơn rất nhiều so với chỉ để dự đốn chính xác người thắng cuộc.

Ví dụ 2.9. (Du dộng ngẫu nhiên). Lý thuyết du động ngẫu nhiên là một trong
số những lĩnh vực đẹp đẽ nhất của xác suất. Ở đây, chúng tơi sẽ đưa ra một ví
dụ giới thiệu mà sử dụng xấp xỉ chuẩn của phân phối nhị thức.
Giả sử một người say rượu đang đứng ở mốc thời gian 0 (ví dụ 11 giờ đêm)
và cứ mỗi giây anh ta hoặc là bước một bước sang trái hoặc một bước sang phải
từ chỗ anh ta đang đứng với xác suất như nhau. Sau hai phút, hỏi xác suất anh
ta sẽ ở vị trí mười bước hoặc nhiều hơn cách chỗ anh ta xuất phát? Lưu ý anh
ta sẽ bước 120 bước trong hai phút.
Cho cử động của anh ta ở bước thứ i được ký hiệu là Xi . Sau đó, P (Xi = ±1) =
0.5 Nên, chúng ta có thể nghĩ ra Xi với Xi = 2Yi − 1, tại Yi ∼ Ber(0.5), 1 ≤ i ≤
n = 120. Nếu chúng ta cho rằng các chuyển động liên tục của anh say rượu là
X1 , X2 , · · · là độc lập, thì Y1 , Y2 cũng độc lập, nên Sn = Y1 + Y2 + · · · + Yn ∼
20


Xấp xỉ phân phối chuẩn


SVTH: Nguyễn Thị Thục Đoan

Bin(n, 0.5) Hơn thế nữa,
|X1 + X2 + · · · + Xn | ≥ 10 ⇔ |2 (Y1 + Y2 + · · · + Yn ) − n| ≥ 10

Nên chúng ta sẽ tìm
P (|2 (Y1 + Y2 + · · · + Yn ) − n| ≥ 10)
(
)
(
)
n
n
= P Sn − ≥ 5 + P Sn − ≤ −5
2
2(
)
)
(
n
Sn − n2
Sn − 2
5
5
+P √
≥√
≤ −√
=P √
0.25n

0.25n
0.25n
0.25n

Hình 3: Du động ngẫu nhiên
Sử dụng xấp xỉ phân phối chuẩn, nó sẽ xấp xỉ bằng
)]
[
(
2 1−Φ
2.3.2

5

0.25n

= 2 [1 − Φ(0.91)] = 2(1 − 0.8186) = 0.3628

Quy tắc ngón tay cái

Một câu hỏi thực tế là, khi nào xấp xỉ chuẩn cho phân phối nhị thức được áp
dụng an tồn? Nó phụ thuộc vào độ chính xác của xấp xỉ bạn muốn trong một
vấn đề cụ thể. Tuy nhiên, một số quy tắc chung có thể dùng làm hướng dẫn rất
bổ ích. Chúng tơi cung cấp quy tắc ngón tay cái dưới đây. Đầu tiên, chúng tôi
21


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan


sẽ cho ra hai ví dụ.

Ví dụ 2.10. (Sử dụng Định lý giới hạn địa phương cho nhị thức). Giả sử
X ∼ Bin(50, 0.4). và chúng ta muốn tìm xác suất mà X bằng 16. Giá trị chính
16 0.416 0.650−16 = 0.0606; phép tính chính xác
xác của xác suất là P (X = 16) = C50

này cần những phép tính của các giai thừa lớn. Mặt khác, xác suất thường từ
(16−50×4)2

1
e− 2×50×0.4×0.6
2π50(0.4)(0.6)

định lý giới hạn địa phương là P (X = 16) ≈ √

= 0.0591.

Sai số trong xấp xỉ này nhỏ hơn 2.5%. Nếu chúng ta muốn xấp xỉ phân phối
chuẩn này tốt hơn nữa, thì một giá trị n lớn sẽ là cần thiết.

Ví dụ 2.11. Ước tính được xác suất một đứa bé được sinh ra đúng vào ngày
bác sĩ sản khoa dự đoán là 1/40. Hỏi xác suất để 15 đứa bé trong tổng 400 đứa
bé ra đời đúng vào ngày bác sĩ dự đoán?.
Đặt X là số trẻ trong tổng số 400 trẻ sinh ra đúng vào ngày được dự đốn.
Sau đó, cho rằng những ngày ra đời khác nhau là độc lập, X ∼ Bin(n, p), với
n = 400, p = 1/40, nên np = 10, np(1 − p) = 9.75.
15
Chúng ta có giá trị chính xác của P (X = 15) = C400


( 1 )15 ( 39 )385
40

40

= 0.0343.

Nếu chúng ta áp dụng xác suất Poisson, ta sẽ có giá trị
P (X = 15) ≈ e−10 1015 /15! = 0.0347

Nếu chúng ta áp dụng xấp xỉ phân phối chuẩn, thì với định lý giới hạn địa
phương Moivre-laplace, ta có:
P (X = 15) ≈ √

2
1
e−(15−10) /(2×9.75) = 0.0345
2π × 9.75

Vậy nên, dù cả hai xấp xỉ cho kết quả chính xác, nhưng xấp xỉ phân phối chuẩn
vẫn tốt hơn dù ở đây n lớn và p nhỏ. Lý do là, với những giá trị này của n và
p, độ nghiêng cũng như hệ số độ nhọn của phân phối nhị thức đều trở nên rất

nhỏ.
Ý tưởng này có thể được dùng để viết một quy tắc áp dụng khi sử dụng xấp xỉ
phân phối chuẩn cho phân phối nhị thức. Chúng tôi sử dụng xấp xỉ phân phối
chuẩn nếu n và p làm cho độ nghiêng và hệ số độ nhọn đủ nhỏ. Hệ số nghiêng
22



Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

và độ nhọn trong các trường hợp nhị thức, lần lượt là √ 1−2p

np(1−p)



1−6p(1−p)
.
np(1−p)

Quy

tắc ngón tay cái dưới đây sử dụng với xấp xỉ phân phối chuẩn cho phân phối
nhị thức.
Quy tắc ngón tay cái của xấp xỉ phân phối chuẩn cho phân phối nhị thức. Sử
dụng xấp xỉ phân phối chuẩn cho phân phối nhị thức khi:
(a) √|1−2p|

np(1−p)

≤ 0.15,


(b)


|1−6p(1−p)|
np(1−p)

≤ 0.075.

Sau một vài phép tính, chúng ta sẽ có
{
n ≥ max

45(1 − 2p)2 14|1 − 6p(1 − p)|
,
p(1 − p)
p(1 − p)

}

Không cần phải nói, những sự lựa chọn 0.15 và 0.75 đa phần là chủ quan.
Nhưng những sự lựa chọn này đều dẫn tới những đáp án có thể hiểu được cho
giá trị của n mà cần thiết để làm ra một xấp xỉ phân phối chuẩn chính xác.

Ví dụ 2.12. Chúng tôi cung cấp một bảng với giá trị thấp nhất của n tương
ứng với giá trị của p từ quy tắc ngón tay cái.
p
n cần thiết cho xấp xỉ phân phối chuẩn
0.1
320
0.2
100
0.3
35

0.4
30
0.5
30
Với p gần 0.5, sẽ là quan trọng khi cần kiểm soát độ nhọn của phân phối nhị
thức, trong khi nếu mà p gần với 0 (hoặc 1), thì cần phải kiểm sốt độ nghiêng.
Đây là điều mà quy tắc ngón tay cái nói lên. Một định lý nổi tiếng về xác suất
đặt giới hạn trên lên sai số của xấp xỉ phân phối chuẩn trong định lý giới hạn
trung tâm. Nếu chúng ta làm cho giới hạn này nhỏ, thì chúng ta có thể tin chắc
là xấp xỉ phân phối chuẩn sẽ chính xác. Giới hạn trên này được biết là giới hạn
Berry-Esseen. Đặc biệt trong trường hợp nhị thức, một bài chứng minh có thể
được xem ở Bhattacharya và Rao(1986) hoặc Feller(1968).

23


Xấp xỉ phân phối chuẩn

SVTH: Nguyễn Thị Thục Đoan

Định lý 2.13. ( Giới hạn Berry Esseen cho xấp xỉ phân phối chuẩn). Cho
X ∼ Bin(n, p) và cho Y ∼ N (np, np(1 − p)). Với mọi số thực x,
|P (X ≤ x) − P (Y ≤ x)| ≤

4 1 − 2p(1 − p)

5
np(1 − p)

Nên chú ý là giới hạn Berry-Esseen khá là bảo toàn. Vậy nên, những xấp xỉ

phân phối chuẩn chính xác được phát triển ngay cả khi giới hạn trên, khá là bảo
toàn, bằng 0.1. Chúng tơi khơng khuyến khích sử dụng giới hạn Berry-Esseen để
quyết định khi nào một xấp xỉ phân phối chuẩn cho phân phối nhị thức có thể
được dùng một cách chính xác. Giới hạn trên này đơn giản là quá bảo tồn.

2.4

Những ví dụ về khái qt định lý giới hạn trung tâm

Bây giờ chúng tơi cho một vài ví dụ áp dụng của định lý giới hạn trung tâm
chung để tính xấp xỉ các xác suất liên quan đến tổng các biến độc lập với phân
phối thông thường, không nhất thiết là tổng các biến Bernoulli.

Ví dụ 2.14. (Phân phối của tổng các giá trị khi tung xúc xắc). Giả thiết tung
một xúc xắc đồng chất n lần. Chúng tôi đã tìm được chính xác phân phối của
tổng n lần tung xúc xắc bằng cách sử dụng công thức Moivre. Nó khá là phức
tạp. Giờ chúng tơi sẽ sử dụng định lý giới hạn trung tâm để lấy xấp xỉ phân
phối một cách đơn giản hơn.
Cho Xi , 1 ≤ i ≤ n là những lần tung riêng lẻ. Sau đó, tổng n lần là Sn =
X1 + X2 + · · · + Xn Giá trị trung bình và phương sai của mỗi lần tung riêng lẻ là
µ = 3.5 và σ 2 = 2.92. Vậy nên, với định lý giới hạn trung tâm,
Sn ≈ N (3.5n, 2.92n)

Ví dụ, tung một con xúc xắc n = 100 lần. Giả sử chúng ta muốn tìm xác suất
để tổng là 300 hoặc lớn hơn. Tính tốn trực tiếp sử dụng cơng thức Moivre sẽ
phức tạp và thậm chí là khơng thể. Tuy nhiên sử dụng xấp xỉ phân phối chuẩn

24



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×