CHƯƠNG III:
MỘT SỐ QUY LUẬT PHÂN PHÓI XÁC SUẤT THÔNG DỤNG ( 5 +1 +1)
Giả sử trong bình có N quả cầu trong đó có M cầu trắng và N-M cầu đen. Mỗi
phép thử là lấy ra ngẫu nhiên 1 quả cầu từ bình. Theo những cách lấy khác nhau
sẽ có các quy luật phân phối xác suất khác nhau.
III.1.QUY LUẬT KHÔNG - MỘT A(p)
Giả sử lấy ngẫu nhiên 1 quả cầu từ bình. Có hai biến cố xảy ra hoặc lấy
được cầu trắng (biến cố A), hoặc không lấy được cầu trắng, tức là lấy được cầu
đen ( biến cố
A
).
Xác suất P(A) = M/N = p; P(
A
) = (N-M)/N = 1 – M/N = 1 – p = q
Tổng quát giả sử ta tiến hành một phép thử trong đó biến cố A có thể xảy
ra với xác suất bằng p . Gọi X là số lần xuất hiện biến cố A trong phép thử đó,
thì X là biến ngẫu nhiên rời rạc nhận hai giá trị có thể có là 0 ( không xảy ra biến
cố A) và 1 nếu biến cố A xảy ra. Do A và
A
lầ xung khắc nên xác suất để biến
ngẫu nhiên X nhận một trong hai giá trị trên là :
P
x
= p
x
.
q
1-x
với q = 1- p; x = 0; 1
1. Định nghĩa: Biến ngẫu nhiên rời rạc X nhận một trong hai giá trị có thể có X
= 0; 1 với xác suất tương ứng tính bằng công thức trên gọi là phân phối theo quy
luật không – một với tham số p. Ký hiêu là: A(p).
Bảng phân phối xác suất theo quy luật không – một luôn có dạng:
2. Các tham số đặc trưng của A(p):
E(x) = 0.q + 1.p = p E(X
2
) = 0
2
.q + 1
2
.p = p
Suy ra phương sai V(X) = p – p
2
= p(1- p) = p.q
Độ lệch chuẩn;
pq
=
σ
III.2. QUY LUẬT NHỊ THỨC – B(n,p)
Trong ví dụ đã nêu trên, bây giờ ta đổi cách lấy quả cầu: lấy n lần có hoàn
lại ( lấy ra 1 quả cầu, hoàn lại thùng và lấy lại…n lần như thế ) Vẫn có kết quả
chỉ với 2 biến cố A và
A
P(A) = M/N ; P(
A
) = (N-M)/N cho mỗi lần lấy, quá
X 0 1
P q p
trình này thỏa mãn lược đồ Bernoulli . Gọi X là “ số lần xuất hiện biến cố A
trong n phép thử trên thì X là biến ngẫu nhiên rời rạc với các giá trị có thể có X:
= 0, 1, 2,…, n. theo công thức Bernoulli ta có P
x
=
x
n
C
p
x
q
n-x
với x = 0, 1, 2..,n
1. Đinh nghĩa: Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có X
= 0, 1, 2,…, n với các xác suất được tính bằng công thức trên, gọi là phân phối
theo quy luật nhị thức với các tham số n, p. ký hiệu B(n, p)
Thí dụ 1: Trong một phân xưởng có 5 máy hoạt động độc lập. Xác suất để trong
một ngày mỗi máy hỏng đều bằng 0,1. tìm xác suất để:
a. Trong một ngày có 2 máy hỏng.
b. Trong một ngày có không quá 2 máy bị hỏng.
Giải: Gọi X là “ số máy hỏng trong một ngày” dễ thấy X có quy luật phân phối
nhị thức B(n, p) với n =5; p =0,1
a. Xác suất để trong một ngày có 2 máy hỏng chính là xác suất để X = 2
P
2
=
2
5
C
(0,1)
2
(0,9)
5-2
= 0,0729
b. Xác suất để trong một ngày có không quá 2 máy bị hỏng là xác suất để X
nhận giá trị trong đoạn [0 ; 2] Ta có;
P( 0 ≤ X ≤ 2) = P
0
+ P
1
+ P
2
= 0,99144
Với: P
0
=
0
5
C
(0,1)
0
(0,9)
5
= 0,59049; P
1
=
1
5
C
(0,1)
1
(0,9)
5-1
= 0,32805
2. Các tham số đặc trưng của quy luật phân phối nhị thức B(n , p):
Kỳ vọng toán E(X) = n.p
Phương sai V(X) = npq với q = 1 – p
Mốt m
0
được xác định: n.p – q ≤ m
0
≤ np + p
Thí dụ 2: Một nhân viên chào hàng mỗi ngày đi chào hàng ở 10 nơi với xác suất
bán được hàng mỗi nơi đều bằng 0,2. Vậy nếu 1 năm người đó đi chào hàng 300
ngày thì trung bình sẽ có bao nhiêu ngày người đó bán được hàng ?
Giải: Trước tiên ta tìm xác suất người đó bán được hàng trong một ngày. Gọi X
là số lần bán được hàng trong ngày, theo bài ra X là biến ngẫu nhiên thỏa mãn
lược đồ Bernoulli với n = 10 ; p = 0,2
P = P(X ≥ 1) = 1 – P(X=0) = 1 –
8926,0)8,0.()2,0(
1000
10
=
C
( bán được hàng và
không bán được hàng là hai biến cố xung khắc)
Gọi Y là số ngày người ấy bán được hàng trong năm thì Y tuân theo quy luật nhị
thức với n = 300 và p = 0,8926. Vậy số ngày trung bình trong năm người đó bán
được hàng chính là kỳ vọng toán:
E(X) = n.p =300.0,8926 = 267,78 ngày
III.3. QUY LUẬT POISSON – P(
λ
)
Giả sử biến ngẫu nhiên X tuân theo quy luật nhị thức B(n,p) song với n quá lớn
và xác suất p quá nhỏ và kỳ vọng toán E(X) = np =
λ
là số không đổi. khi ấy
việc tính toán theo công thức Bernoulli gặp khó khăn vì vậy người ta sử dụng
công thức xấp xỉ Poisson sau đây:
P
x
=
λ
λ
−
e
x
x
!
(*)
1. Định nghĩa: Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có X
= 0, 1, 2,… với xác suất tương ứng được tính bằng công thức (*) gọi là phân
phối theo quy luật Poisson với tham số
λ
. ký hiệu P(
λ
)
Thí dụ 1: một máy dệt có 5000 ống sợi, xác suất để trong một phút ống sợi bị
đứt bằng 0,0002. Tìm xác suất để trong một phút có không quá 2 ống sợi bị đứt.
Giải. gọi X là số ống sợi bị đứt trong 1 phút thì X thỏa mãn quy luật phân phối
nhị thức, nhưng do n = 5000; p =0,0002 ; np = 5000.0,0002 =1 =
λ
nên X thỏa
quy luật phân phối Poisson. Tìm xác suất để trong 1 phút có không quá 2 ống
sợi bị đứt là đi tìm xác suất sao cho X nhận các giá trị trong đoạn [0 ; 2] .Ta có:
P(0 ≤ X ≤ 2) = P
0
+ P
1
+ P
2
1
12
1
01
11
00
0
)71,2(
2
1
2
1
)71,2(
1
1
)71,2()71,2(
!0
1
!0
−
−
−−−
==
==
===
PP
PP
eP
λ
λ
Vậy: P(0 ≤ X ≤ 2) = 0,9225
2. Các tham số đặc trưng của quy luật P(
λ
)
Với X là biến ngẫu nhiên phân phối theo quy luật Poisson:
E(X) =
λ
V(X) =
λ
Mốt được xác định :
λ
- 1 ≤ m
0
≤
λ
chú ý m
0
là một số nguyên
III.4.QUY LUẬT SIÊU BỘI – M (N,n)
Ta trở lại ví dụ đã nêu ở đầu chương, bây gời ta lấy ngẫu nhiên lần lượt ra n quả
cầu theo phương thức không hoàn lại. Lúc này các phép thử sẽ không độc lập
với nhau nữa, do đó xác suất lấy được quả cầu trắng ở mỗi lần sẽ khác nhau.
Xác suất để trong n quả cầu lấy ra có x quả màu trắng như đã biết được tính theo
công thức xác suất cổ điển:
P
x
=
n
N
xn
MN
x
M
C
CC
−
−
.
1.Định nghĩa: Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có X =
0, 1, 2,…, n với các xác suất tương ứng được tính bằng công thức P
x
=
n
N
xn
MN
x
M
C
CC
−
−
.
gọi là phân phối theo quy luật siêu bội với tham số là N và n
Thí dụ: Một cửa hàng có bán 100 bóng đèn, trong đó có lẫn 5 bóng hỏng mà
không kiểm tra thì không thể xác định được. Một người khách chọn ngẫu nhiên
2 bóng. Tìm xác suất để người đó mua được cả 2 bóng đều tốt.
Giải: Gọi X là số bóng tốt mà người đó có thể mua được. X phân phối theo
quy luật siêu bội với N = 100, M = 95 và n = 2 ta có :
P
2
=
9,0
99.100
94.95
.
2
100
0
5
2
95
≈=
C
CC
2. Các tham số đực trưng của quy luật M(N,n)
X là biến ngẫu nhiên phân phối theo quy luật siêu bội thì:
E(X) =
pn
N
M
n ..
=
V(X) =
1
...
1
...
−
−
=
−
−−
N
nN
qpn
N
nN
N
MN
N
M
n
Note: Các quy luật phân phối A(p); B(n,p); P(
λ
); M(N,n) áp dụng cho các biến
ngẫu nhiên rời rạc
III.5. QUY LUẬT PHÂN PHỐI ĐỀU. U(a,b)
1.Định nghĩa: Biến ngẫu nhiên liên tục X gọi là phân phói theo quy luật đều
trong khoảng (a; b) nếu hàm mật độ xác suất của nó có dạng:
∉
∈
−
=
);(0
);(
1
)(
baxkhi
baxkhi
ab
xf
Đồ thị:
2. Các tham số đặc trưng:
Giả sử X là phân phối đều, theo định nghĩa của kỳ vọng toán của biến ngẫu
nhiên liên tục ta có:
E(X) =
22
11
.)(.
2
bax
ab
dx
ab
xdxxfx
b
a
b
a
+
=
−
=
−
=
∫∫
+∞
∞−
E(X
2
) =
33
11
.)(.
223
22
abbax
ab
dx
ab
xdxxfx
b
a
b
a
++
=
−
=
−
=
∫∫
+∞
∞−
Do đó phương sai: V(X) =
12
)(
))(()(
2
22
ab
XEXE
−
=−
Quy luật phân phối đều có ứng dụng rộng rãi trong thống kê, nhất là trong
các phương pháp phi tham số. Trong lý thuyết kết luận thống kê người ta quy
định: Nếu ta không biết gì về giá trị của tham số cần ước lượng, thì mỗi giá trị có
thể có của tham số đó là đồng khả năng. Điều đó dẫn đến việc quan niệm tham
số cần ước lượng như một biến ngẫu nhiên tuân theo quy luật phân phối đều.
Thí dụ: khi thâm nhập một thị trường mới, doanh nghiệp không thể khảng định
được một cách chắc chắn doanh số hàng tháng sẽ đạt được bao nhiêu mà chỉ dự
kiến được rằng doanh số tối thiểu sẽ là 20 triệu đồng / tháng, và tối đa là 40
triệu đồng / tháng. Tìm xác suất để doanh nghiệp đạt được doanh thu tối thiểu là
35 triệu đồng / tháng.
Giải: Gọi X là doanh số hàng tháng mà doanh nghiệp có thể đạt ở thị trường
đó. Do không có thông tin gì hơn, nên ta xem X là biến ngẫu nhiên liên tục
phân phối đều trên khoảng (20;40)
Vậy X có hàm mật độ xác suất như sau:
∉
∈=
−
=
)40;20(0
)40;20(4,0
2040
1
)(
xkhi
xkhi
xf
Xác suất cần tìm là: P(X ≥ 35) =
25,05,0)(
40
3535
==
∫∫
+∞
dxdxxf
III.6.QUY LUẬT PHÂN PHỐI CHUẢN – N(µ,
2
σ
)
1. Định nghĩa:
Biến ngẫu nhiên liên tục X nhận các giá trị trong khoảng ( -∞ ; +∞ ) gọi là
quy luật phân phối chuẩn với các tham số µ và
2
σ
, nếu hàm mật độ xác suất của
nó có dạng:
2
2
.2
)(
2
1
)(
σ
µ
πσ
−
−
=
x
exf
Đồ thị:
2. Các tham số đặc trưng của quy luật phân phối chuẩn: người ta chứng minh
được rằng nếu X là quy luật phân phối chuẩn thì:
Kỳ vọng toán E(X) = µ
Phương sai V(X) =
2
σ
3. Công thức tính xác suất để biến ngẫu nhiên X phân phối chuẩn nhận giá trị
trong khoảng (a;b)
P(a<X<b) =
=
∫
b
a
dxxf )(
)()(
2
1
00
.2
)(
2
2
σ
µ
σ
µ
πσ
σ
µ
−
Φ−
−
Φ=
−
−
∫
ab
dxe
x
b
a
Với:
dzeu
u
z
∫
=Φ
0
2
0
2
2
1
)(
π
người ta lập bảng sẵn cho giá trị của hàm này
4. Ứng dụng của quy luật phân phối chuẩn: Nếu biến ngẫu nhiên là tổng của một
số lớn các biến ngẫu nhiên độc lập và giá trị của mỗi biến độc lập chỉ chiếm vị
trí rất nhỏ trong tỏng đó thì X có phân phối xấp xỉ chuẩn.
Nhiều lĩnh vực trong thực tế là những biến ngẫu nhiên tuân theo quy luật
này thí dụ; năng suất của cùng một loại cây trồng trong các thửa ruộng khác
nhau tuân theo phân phối chuẩn, hay năng suất lao động của các công nhân có
cùng tay nghề và làm cùng một công việc như nhau cũng theo phân phối chuẩn,
…
III.7 QUY LUẬT KHI BÌNH PHƯƠNG
)(
2
n
χ
Biến ngẫu nhiên liên tục
2
χ
gọi là phân phối theo quy luật khi bình phương với
n bậc tự do nếu hàm mật độ của nó được xác định sau;
>
Γ
≤
=
−
0.
)
2
(.2
1
00
)(
1
22
2
xkhixe
n
xkhi
xf
nx
n
Trong đó:
dtetx
tx
∫
+∞
−−
=Γ
0
1
)(
là hàm Gamma (có bảng tính sẵn)
Kỳ vọng toán E(
n
=
)
2
χ
; Phương sai V(
n2)
2
=
χ
III.8.QUY LUẬT STUDENT – T(n)
Biến ngẫu nhiên liên tục T gọi là phân phối theo quy luật Student với n bậc tự
do nếu hàm mật độ xác suất của nó được xác định bằng biểu thức sau:
t
n
t
n
n
n
tf
n
∀
−
+
−
Γ−
Γ
=
−
2
2
1
1
)
2
1
()1(
)
2
(
)(
π
với
)(x
Γ
là hàm Gamma
Kỳ vọng toán E(T) = 0 Phương sai V(T) =
2
−
n
n
BÀI TẬP
CHƯƠNG IV:
ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
IV.1.KHÁI NIỆM VỀ TỔNG THỂ NGHIÊN CỨU ( 1)
Trong các chương trước ta đã nghiên cứu một số khái niệm về lý thuyết
xác suất, các dữ liệu mà chúng ta xét tới trong các bài toán xác suất đó, không
chỉ bằng các suy luận toán học, mà phải được quan sát, thu thập trong thực tế,
những dữ liệu này thu thập phải đảm bảo được tính khách quan, chính xác, vì
vậy cần được sử lý, kiểm định, do vậy thống kê toán học phải dựa trên các kết
quả của lý thuyết xác suất, còn muốn ứng dụng các kết quả của lý thuyết xác
suất vào thực tiễn thì phải thông qua Thống kê toán học.
Thí dụ: Ta muốn nghiên cứu chiều cao X của các em học sinh ở lứa tuổi
lên 10. Hỏi X có phân phối gì? Trả lời câu hỏi này là nhiệm vụ của thống kê
toán học.
Trong thực tế nhiều khi phải nghiên cứu một tập hợp các phần tử đồng
nhất theo một hay nhiều dấu hiệu định lượng, hoặc định tính đặc trưng cho các
phần tử đó. Người ta có thể nghiên cứu toàn bộ, tức là thống kê toàn bộ tập hợp
đó và phân tích từng phần tử theo dấu hiệu nghiên cứu. Thí dụ để nghiên cứu
dân số của một nước theo dấu hiệu như tuổi tác, trình độ học vấn, giới tính, địa
bàn dân cư, cơ cấu nghề nghiệp…người ta tiến hành tổng điều tra dân số nước
đó và phân tích từng người theo các dấu hiệu đó.
1. Định nghĩa: Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên
cứu định tính hoặc định lượng nào đó được gọi là tổng thể nghiên cứu hay tổng
thể.
Số lượng các phần tử của tổng thể gọi là kích thước của tổng thể, ký hiệu
là N.
Với mỗi tổng thể ta thường nghiên cứu các dấu hiệu đặc trưng cho tổng
thể đó, chúng được gọi là dấu hiệu nghiên cứu, ký hiệu là
χ
2. Các phương pháp mô tả tổng thể:
+ Giả sử tổng thể với dấu hiệu nghiên cứu định lượng
χ
nhận các giá trị
x
i
với các tần số tương ứng là N
i
( N
i
là số phần tử của tổng thể có cùng giá trị
x
i
) có bảng phân phối tần số sau:
Giá trị của
χ
.x
1
.x
2
…. .x
i
… x
n
Tần số N
1
N
2
….. N
i
…. N
n
Dễ thấy:
=
∀≤≤
∑
=
n
i
i
i
NN
iNN
1
0
+ Ký hiệu : p
i
=
ni
N
N
i
,...,2,1
=
; p
i
gọi là tần suất của x
i
. khi đó tổng thể
có bảng phân phối tần suất sau:
Giá trị của
χ
.x
1
.x
2
…. .x
i
… x
n
Tần suất p
1
p
2
….. p
i
…. p
n
Dễ thấy:
=
∀≤≤
∑
=
n
i
i
i
p
ip
1
1
10
+ Ký hiệu:
niNw
ij
xx
ji
,...,2,1
==
∑
<
và gọi là tần số tích lũy của x
i
( tức là
tổng số các phần tử của tổng thể có giá trị nhỏ hơn x
i
+ Ký hiệu: F(x
i
) =
∑
<
=
ij
xx
j
i
N
N
N
w
và gọi là tần suất tích lũy của x
i
Bảng phân phối tần số, tần suất, tần số tích lũy, tần số tích lũy của một tổng thể
là quá trình mô tả tổng thể theo dấu hiệu nghiên cữu
χ
, dẫu hiệu nghiên cữu
χ
hoàn toàn có thể mô hình hóa bằng một biến ngẫu nhiên rời rạc X. biến ngẫu
nhiên X dùng để mô hình hóa dấu hiệu nghiên cữu
χ
gọi là biến ngẫu nhiên
gốc, còn quy luật phân phối xác suất của nó gọi là quy luật phân phối gốc
3. Các tham số đặc trưng của tổng thể:
3.1. Trung bình tổng thể:
Ký hiệu: m =
∑
=
n
i
i
x
N
1
1
và gọi là trung bình tổng thể ( trung bình số học các giá
trị của dấu hiệu trong tổng thể )
Nếu trong tổng thể dấu hiệu
χ
chỉ nhận các giá trị x
1
, x
2
,…..,x
k
với các tần số
tương ứng N
1
, N
2
,….N
k
( k < n) thì:
.m =
i
k
i
i
Nx
N
∑
=
1
1
Giả sử tổng thể có kích thước N bao gồm các phần tử mang các giá trị khác nhau
của dấu hiệu nghiên cữu
χ
là x
1
, x
2
,…,x
N
. giả sử lấy ngẫu nhiên một x
i
nào đó
thì xác suất để lấy được x
i
là 1/N với mọi i =1,2,…,N. Ta xem giá trị của dấu
hiệu
χ
như là một biến ngẫu nhiên X nhận các giá trị có thể là: x
1
, x
2
,…,x
N