Cao Hào Thi 43
CHƯƠNG 5
BIẾN NGẪU NHIÊN VÀ PHÂN PHỐI XÁC SUẤT
(Random Variables and Probability Distributons)
5. ĐỊNH NGHĨA BIẾN NGẪU NHIÊN (Random Variable)
5.1.1. Định nghĩa
• Biến ngẫu nhiên là những biến mà giá trị của nó được xác định một cách ngẫu nhiên.
• Về mặt toán học, nếu mỗi biến cố sơ đẳng A thuộc tập hợp biến cố ω nào đấy có thể
đặt tương ứng với một đại lượng xác định X = X(A) thì X được gọi là một biến cố
ngẫu nhiên. Biến ngẫu nhiên X có thể xem như hàm của biến cố A với miền xác định
là ω.
• Các biến ngẫu nhiên được ký hiệu bằng các chữ lớn X, Y, Z,… còn các giá trị của
chúng được ký hiệu bằng các chữ nhỏ x, y, z...
5.1.2. Phân loại
Biến ngẫu nhiên được chia làm hai loại: biến ngẫu nhiên rời rạc, biến ngẫu nhiên liên tục.
a) Biến ngẫu nhiên rời rạc (Discrete Random Variable)
Nếu giá trị của biến ngẫu nhiên X có thể lập thành dãy rời rạc các số x
1
, x
2
, …, x
n
(dãy
hữu hạn hay vô hạn) thì X được gọi là biến ngẫu nhiên rời rạc.
b) 3.1.2.2. Biến ngẫu nhiên liên tục (Continuous Random Variable)
Nếu giá trị của biến ngẫu nhiên X có thể lấp đầy toàn bộ khoảng hữu hạn hay vô hạn (a,b)
của trục số 0x thì biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục.
Thí dụ
• Lượng khách hàng đến cửa hàng trong ngày là biến ngẫu nhiên rời rạc.
• Nhiệt độ trong ngày ở Sài Gòn là biến ngẫu nhiên liên tục.
5.2. PHÂN PHỐI XÁC SUẤT ĐỐI VỚI BIẾN NGẪU NHIÊN RỜI RẠC
(Probability Distribution for Discrete Variable)
5.2.1. Hàm xác suất (Probability Function)
Hàm xác suất P
x
(x) của biến ngẫu nhiên rời rạc X dùng diễn tả xác suất để cho biến ngẫu
nhiên X đạt giá trị x. P
X
(x) là hàm của giá trị x
P
X
(x) = P(X=x)
Cao Hào Thi 44
Thí dụ
Trong thí nghiệm thảy 1 con xúc sắc, ta có
P(X=1) = P(X=2) = … = P(X=6) = 1/6
→ Hàm xác suất là : P
X
(x) = P(X=x) = 1/6 với x =1, 2, 3, 4, 5, 6
5.2.2. Phân phối xác suất (Probability Distribution)
Phân phối xác suất của biến ngẫu nhiên X thể hiện sự tương quan giữa các giá trị x
i
của X
và các xác suất của x
i
, sự tương quan có thể trình bày bằng bảng đồ thị hoặc bằng biểu
thức.
Thí dụ
Trong thí nghiệm thảy 1 con xúc sắc, phân phối xác suất là:
Trình bày bằng bảng:
X 1 2 3 4 5 6
P
X
(x) 1/6 1/6 1/6 1/6 1/6 1/6
Trình bày bằng đồ thị :
5.2.3. Hàm xác suất tích lũy (Cumulative Probalility Function).
a) Định nghĩa
Hàm xác suất tích lũy F
X
(x
o
) của biến ngẫu nhiên rời rạc x thể hiện xác suất để X không
vượt quá giới hạn x
o
. F
X
(x
o
) là hàm của x
o
F
X
(x
o
) = P (X≤x
o
)
P
X
(x)
1/6
0 1 2 3 4 5 6 x
Cao Hào Thi 45
b) Tính chất
Ta có các tính chất sau:
a. F
X
(x
o
) =
∑
≤xox
X
)x(P
∑
≤xox
X
)x(P
: tổng của tất cả các giá trị có thể có của x với điều kiện x≤x
o
b. 0 ≤ F
X
(x
o
) ≤ 1 ∀x
o
c. Nếu x
1
< x
2
thì F
X
(x
1
) ≤ F
X
(x
2
)
Thí dụ
Trong thí nghiệm thảy 1 con xúc sắc, ta có hàm xác suất tích lũy như sau
F
X
(x
o
) =
⎪
⎪
⎩
⎪
⎪
⎨
⎧
≥
=+<≤
<
61
5211
6
10
0
0
0
x neáu
),...,,j(jx j neáu
j
x neáu
F
X
(x≤ 2.5) = P
X
(1) + P
X
(2) = 1/6 + 1/6 = 1/3
• Đối với biến ngẫu nhiên rời rạc hàm xác suất tích lũy luôn có dạng bậc thang bắt đầu
từ 0 và tận cùng bằng 1.
1
5/6
4/6
3/6
2/6
1/6
F
X
(x
o
)
0 1 2 3 4 5 6
x
Cao Hào Thi 46
5.2.4. Kỳ vọng của biến ngẫu nhiên rời rạc
(Expected Value of Discrete Random Variable)
a) Kỳ vọng của biến ngẫu nhiên
• Kỳ vọng, E(X), của biến ngẫu nhiên rời rạc X được định nghĩa như sau:
E(X) =
∑
x
x
)x(P.x
•
∑
x
:
Tổng tất cả các giá trị có thể có của x
• Kỳ vọng của biến ngẫu nhiên được gọi là số trung bình (mean) và được ký hiệu là µ
x
E(X) = µ
x
Thí dụ
Gọi X là số lỗi có trong 1 trang sách. Hàm xác suất của biến ngẫu nhiên X được cho bởi:
P
X
(0) = 0,81, P
X
(1) = 0,17, P
X
(2) = 0,02.
Tìm số lỗi trung bình có trong 1 trang sách ?
Giải
µ
x
= E(X) =
∑
x
X
)x(P*x
= 0 * 0,81 + 1 * 0,17 + 2 * 0,02
= 0,21 lỗi /1 trang
b) Kỳ vọng của hàm số của biến ngẫu nhiên
Gọi X là biến ngẫu nhiên rời rạc với hàm xác suất P
X
(x)
g(X) là một hàm số của biến ngẫu nhiên X
Kỳ vọng của hàm số g(X) được định nghĩa như sau :
E[g(x)] =
∑
x
X
)x(P)x(g
P
X
(x)
0,8
0,4
0 1 2 x
µ
x
= 0,21
Cao Hào Thi 47
5.2.5. Phương sai (Variance)
Gọi X là biến ngẫu nhiên rời rạc.
Gọi µ
X
là số trung bình của biến ngẫu nhiên
• Phương sai của biến ngẫu nhiên X chính là kỳ vọng của (X -
µ
x
)² và được ký hiệu
2
X
σ
.
2
X
σ
= E[(X -
µ
X
)²] =
( )
∑
µ−
x
XX
)x(P*x
2
•
Phuơng sai
2
X
σ
có thể tính theo công thức :
2
X
σ
= E(X²) -
2
X
µ
=
22
X
x
X
)x(Px µ−
∑
Chứng minh
2
X
σ
=
)x(P)x(
XX
x
2
µ−
∑
=
∑∑∑
+−
x
XX
x
XX
x
X
xPxPxxPx )()(.2)(
22
µµ
2
X
σ
=
22
X
x
X
)x(Px µ−
∑
5.2.6. Độ lệch chuẩn
σ
x
(Standard Deviation)
Độ lệch chuẩn được ký hiệu
σ
x
σ
X
=
2
X
σ
Thí dụ
Cho hàm xác suất của số lỗi X có trong 1 trang sách là
P
X
(0) = 0,81, P
X
(1) = 0,17, P
X
(2) = 0,02
Tìm độ lệch chuẩn của số lỗi có trong 1 trang sách ?
Giải
Trong thí dụ trước ta có
µ
X
= 0,21
•
Kỳ vọng của X²
E(X²) =
∑
x
X
)x(Px
2
= 0² * 0,81 + 1² * 0,17 + 2² * 0,02
E(X²) = 0,25
•
Phương sai
2
X
σ
= E(X²) -
2
X
µ
= 0,25 - (0,21)² = 0,2059
•
Độ lệch chuẩn
Cao Hào Thi 48
σ
x
=
4538,02059,0
2
==
X
σ
5.2.7. Momen
a) Momen gốc cấp k (Momen of Order k)
m
k
= E [X
k
] =
)x(Px
X
x
k
∑
•
k = 1: m
1
= E[X] =
XX
x
)x(Px
µ=
∑
•
k = 2: m
2
= E[X²]
b) Momen trung tâm cấp k (Central Momen of Order k)
M
k
= E[(X-µ
X
)
k
] =
)x(P.)x(
X
k
X
µ−
∑
•
k = 2:
2
X
σ
= E[(X -
µ
X
)²] = m
2
-
2
1
m
•
M
1
= E [(X -
µ
)] = 0
M
2
= E [(X -
µ
)² ] =
σ
² (Variance)
M
3
= E [(X -
µ
)³] =
γ
(Skewness : độ lệch)
M
4
= E [(X -
µ
)
4
] = KM
2
² = K
σ
4
K : hệ số Kurtorsis
5.2.8. Phân phối xác suất nhị thức (Binomial Probability Distubutions)
a) Hàm xác suất của phân phối nhị thức
(Probability Function of Binomial Distribution).
Tiến hành n phép thử độc lập.
Gọi p là
xác suất thành công
trong mỗi phép thử độc lập => q = (1-p) là
xác suất
thất bại
trong mỗi phép thử độc lập.
Xác suất để có số lần thử thành công là x trong những phép thử độc lập được cho
bởi hàm xác suất như sau :
Px(x) = [n!/ (x!(n - x)!)].[p
x
(1 - p)
n-x
]
với x = 0,1,2,…, n
hay
P
x
(x) =
x
n
C
p
x
q
n-x
với q = 1 - p
Ghi chú
•
Phân phối của số lần phép thử thành công là x được gọi là phân phối nhị thức..
Cao Hào Thi 49
•
Hàm xác suất P
X
(x) là hàm xác suất của phân phối nhị thức.
b) Số trung bình, phương sai và độ lệch chuẩn của phân phối nhị thức
Gọi X là số lần thành công trong n phép thử, mỗi phép thử có xác suất thành công là p. X
tuân theo phân phối nhị thức với số trung bình, phương sai và độ lệch chuẩn được tính
theo các công thức sau:
Số trung bình
µ
X
= E(X) = np
Phương sai
2
X
σ
= E[(X -
µ
x
)²] = np(1-p)
Hay
2
X
σ
= npq với q = 1-p
Độ lệch chuẩn
σ
x
=
npq
Thí dụ
Một người đi bán hàng đi tiếp xúc để chào hàng với 5 khách hàng. Xác suất để bán được
hàng trong mỗi lần chào hàng là 0,4.
a)
Tìm phân phối xác suất của số lần bán được hàng.
b)
Tìm số trung bình, phương sai và độ lệch chuẩn của số lần bán được hàng.
c)
Tìm xác suất của số lần bán được hàng trong khoảng 2 đến 4 lần.
Giải
a. Xác suất của số lần bán được hàng tuân theo phân phối nhị thức :
P
X
(x) =
x
n
C
P
x
q
n-x
=
x
C
5
* (0,4)
x
* (0,6)
5-x
P
X
(x) =
)!x(!x
!
−
5
5
* (0,4)
x
* (0,6)
5-x
x = 0 => P
X
(0) = 0,078
(không bán được)
x = 1 => P
X
(1) = 0,259
x = 2 => P
X
(2) = 0,346
x = 3 => P
X
(3) = 0,230
x = 4 => P
X
(4) = 0,077
x = 5 => P
X
(5) = 0,010
(trong 5 lần bán được cả 5)
P
X
(x)
0,4
0,2
0
0 1 2 3 4 5 X
số lần thành công
Cao Hào Thi 50
b. Số trung bình của số lần bán được hàng
µ
x
= np = 5 * 0,4 = 2
Phương sai
2
X
σ
= np(1-p) = 5 * 0,4 * 0,6 = 1,2
Độ lệch chuẩn
σ
x
=
12.
= 1,10
c. P(2 < X < 4) = P
X
(2) + P
X
(3) + P
X
(4) = 0,653
5.2.9. Phân phối xác suất Poisson
a) Phân phối Poisson
Biến ngẫu nhiên X được gọi tuân theo phân phối Poisson nếu hàm xác suất của X có dạng
P
X
(x) =
!x
e
x
λ
λ−
với
λ
> 0,
∀λ
x = 0,1,2,…
b) Số trung bình, phương sai và độ lệch chuẩn của phân phối Poisson
•
Số trung bình của phân phối Poisson
µ
x
= E(x) =
λ
•
Phương sai.
σ
²
x
= E[(x-
µ
x
)²] =
λ
•
Độ lệch chuẩn
σ
x
=
λ
Thí dụ
Một trạm điện thoại tự động nhận được trung bình 300 lần gọi trong 1 giờ. Hỏi xác suất
để trạm đó nhận được đúng 2 lần gọi trong 1 phút cho trước.
Giải
Số lần nhận được trung bình trong 1 phút
300/60 = 5 lần/1phút =>
λ
= 5
Xác suất để nhận được đúng 2 lần trong 1 phút.
P
X
(2) = (5² * e
-5
)/2! = 25/2e
5
≈
0,09
Cao Hào Thi 51
5.3. PHÂN PHỐI XÁC SUẤT ĐỐI VỚI BIẾN NGẪU NHIÊN LIÊN TỤC
(Probability Distributions For Continuous Random Variables)
Phân phối của biến ngẫu nhiên liên tục được xác định bởi hàm mật độ xác suất.
5.3.1. Hàm mật độ xác suất (Probability Density Function)
Gọi X là biến ngẫu nhiên liên tục, gọi x là giá trị bất kỳ nằm trong miền các giá trị có thể
có của X.
Hàm mật độ xác suất f
X
(x) của biến ngẫu nhiên liên tục là hàm có những tính chất sau :
•
f
X
(x)
≥
0 ,
∀
x
•
Xác suất P(a<X<b) để giá trị của biến ngẫu nhiên X rơi vào khoảng (a,b) được xác
định bởi đẳng thức.
P(a<X<b) =
∫
b
a
X
dx)x(f
Ghi chú
9
Đồ thị của hàm mật độ xác suất f
X
(x) được gọi là đường cong mật độ xác suất
(probability density curve) hay đường cong tần số (frequency curve) hay cũng còn
được gọi đường cong phân phối xác suất đối với biến ngẫu nhiên liên tục. Tung độ
của mỗi điểm trên đường cong gọi là mật độ xác suất.
9
Về mặt hình học xác suất để biến ngẫu nhiên rơi vào khỏang (a,b) bằng diện tích
hình thang cong giới hạn bởi đường cong phân phối xác suất, trục 0x, x = a, x = b.
x
Fx(x)
a
b
S
F
X
(x)
P(a<X<b) = S
∫
∞
∞−
= 1dx)x(f
x
==
> Toàn bộ diện tích của hình thang cong là 1
Nếu f
X
(x) là hàm mật độ phân phối thì f
X
(x) cần thỏa mãn 2 điều kiện
9
F
X
(x)
≥
0,
∀
x
9
∫
∞
= 1
dx)x(f
x