Tải bản đầy đủ (.pdf) (45 trang)

Bài giảng Lý thuyết xác suất thống kê toán - Chương 2: Đại lượng ngẫu nhiên, phân phối xác suất

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (202.89 KB, 45 trang )

CHƯƠNG 2
Đại lượng ngẫu nhiên – Phân phối XS
1. Đại lượng ngẫu nhiên rời rạc
1.1 Đònh nghóa
Nếu mỗi kết quả của một phép thử ngẫu nhiên
được biểu thò bằng một giá trò số, ta có một đại
lượng ngẫu nhiên (ĐLNN).
Chính xác hơn, ĐLNN X là một hàm số xác
đònh trên không gian mẫu Ω sao cho mọi tập hợp có
dạng (X < x) = {ω∈Ω / X(ω) = x} đều là biến cố.
Ghi chú
(X < x) là biến cố thì (X > x), (X = x) … đều là biến cố.


ĐLNN rời rạc là ĐLNN mà các giá trò nó có
thể nhận liệt kê được. Lúc này biến cố để X nhận
giá trò x ghi là (X = x). Xác suất của biến cố này được
ghi là P(X = x).
Ví dụ
(1) Tung con xúc sắc, gọi X là số chấm xuất hiện thì
X là một ĐLNN có thể nhận các giá trò 1, 2, 3, 4, 5,
6. Đây là một ĐLNN rời rạc. Ta có P(X=1) = 1/6.
(2) Mua một vé số 5.000đ của thành phố A, gọi X là
số tiền trúng số thì X là một ĐLNN rời rạc.
(3) Gọi X là số lần tung đồng xu cho đến khi được
mặt sấp thì X là ĐLNN rời rạc.


(4) Chiều cao X (cm) của một sinh viên trong lớp
được chọn ngẫu nhiên có thể nhận giá trò là một số
thực trong khoảng [140; 220]. Các giá trò này không


liệt kê được. X không phải là ĐLNN rời rạc.


1.2 Bảng phân phối xác suất của ĐLNN rời rạc
Quy luật phân phối xác suất của ĐLNN rời rạc
được biểu thò dưới dạng bảng phân phối xác suất
(bảng PPXS):
X x1 x2 ... xn
P p1 p2 ... pn
Bảng phân phối ký hiệu là (xi, pi), i= 1, n.
Ta phải có: pi > 0, i=1, n và p1 + p2 + ... + pn = 1.


Ví dụ
(1) Lô hàng gồm 6 chính phẩm và 4 phế phẩm. Lấy
ngẫu nhiên 2 sản phẩm. Gọi X là số chính phẩm.
Các giá trò có thể nhận của X là 0, 1, 2. Ta có:
2
C14 .C16
8
C24
p2 = P(X=1) =
=
p1 = P(X=0) = 2 =
2
15
C10 15
C10
5
p3 = P(X=2) = 1 – p1 – p2 =

X 0
1
2
15
P 2/15 8/15 5/15
Bảng phân phối của X:
(2) Xác suất trò khỏi bệnh của 1 viên thuốc là 90%.
Bệnh nhân uống từng viên, chưa hết bệnh thì uống
tiếp nhưng tối đa 3 viên. Gọi X là số viên thuốc bệnh
nhân uống. Lập bảng phân phối XS của X.


2. Các số đặc trưng của ĐLNN
2.1 Kỳ vọng
2.1.1 Đònh nghóa
Để đánh giá giá trò trung bình của một ĐLNN,
ta tính kỳ vọng. Kỳ vọng của ĐLNN X ký hiệu là
E(X). Kỳ vọng của ĐLNN X có bảng phân phối
(xi, pi), i=1, n được đònh nghóa:
n

E(X) = ∑ x i pi
i =1

Excel
Nếu các giá trò xi, pi được ghi trong miền M1, M2 thì
E(X) =SUMPRODUCT(M1; M2) .


Ví dụ

(1) Một lớp có 50 sinh viên. Sau một kỳ thi, kết quả
điểm được thống kê như sau:
Điểm 3 4 5
6 7 8 9
Số SV 3 7 15 10 5 6 4
Gọi X là điểm của một sinh viên gặp ngẫu nhiên.
Bảng phân phối của ĐLNN X:
X 3 4 5 6 7 8 9
3 7 15 10 5 6 4
P
50 50 50 50 50 50 50
Điểm trung bình: E(X) = 5,82 (điểm)
(2) Một lô hàng gồm 15 chính phẩm và 3 thứ phẩm.
Chính phẩm được bán với giá 200.000đ còn thứ


phẩm bán với giá 150.000đ. Tính trung bình thì thu
được bao nhiêu tiền khi bán một sản phẩm?
(3) Tung con xúc sắc. Nếu xuất hiện mặt 1 hoặc mặt
2 hoặc mặt 3 thì thua 1đ, mặt 4 thì hoà, mặt 5 thì
thắng 1đ, mặt 6 thì thắng 2đ. Gọi X là số tiền thu
được sau mỗi lần chơi. Tính kỳ vọng của ĐLNN X.
(4) Xét ĐLNN X có bảng phân phối (xi, pi), i = 1, m .
Thực hiện phép thử n lần. Gọi ki là số lần X nhận
giá trò xi. Giá trò trung bình của X trong n phép thử:
k x + k 2 x 2 + ... + k m x m
X = 1 1
n
k
k

k
= 1 x1 + 2 x2 + ... + m x m = f1 x1 + f2 x 2 + ... + f m x m
n
n
n

Trong đó fi là tần suất của biến cố (X=xi) ( i = 1, m ).


Cho n → ∞ thì fi → pi ( i = 1, m ) và do đó X → E(X).
Vậy khi n đủ lớn thì X ≈ E(X). Ta nói kỳ vọng của
một ĐLNN gần bằng với giá trò trung bình của một
quan sát của ĐLNN này.


2.1.2 Tính độc lập của ĐLNN rời rạc
Hai ĐLNN rời rạc X, Y gọi là độc lập nếu mỗi
biến cố (X = x) đều độc lập với mọi tổ hợp tích của
các biến cố có dạng (Y = yj).
Ví dụ
Gọi X là điểm thi môn Toán, Y là ngày sinh, U
là số ngày đi học môn toán của một sinh viên trong
lớp được chọn ngẫu nhiên thì X, Y là hai ĐLNN độc
lập. X, U là hai ĐLNN không độc lập.


2.1.3 Tính chất
(i) E(c) = c (c là ĐLNN hằng và bằng c)
(ii) E(cX) = cE(X)
(iii) E(X + Y) = E(X) + E(Y)

(iv) E(X.Y) = E(X).E(Y) nếu X, Y độc lập.


Ví dụ
(1) Một sinh viên sắp thi môn Toán và môn Kinh
tế. Khả năng đạt điểm như sau:
Điểm Toán

3 4 5 6 7 8 9

Điểm K.Tế

4 5 6 7 8 9

Khả năng (%)

5 10 15 20 25 15 10

Khả năng (%)

5 15 15 30 25 10

Dự kiến điểm trung bình hai môn của sinh viên
này là bao nhiêu?
Gọi X, Y là điểm thi môn Toán và môn Kinh tế. Cần
tính E( (X+Y)/2 ). Ta có:
E(X) = 6,35

E(Y) = 6,85


⇒ E( (X+Y)/2 ) = (E(X) + E(Y))/2 = 6,6 (điểm)


(2) Trong một tuần, một người có thể điểm tâm từ 5
cho đến 7 lần. Số tiền phải trả cho mỗi lần điểm
tâm thay đổi từ 20 ngàn đến 40 ngàn. Chi tiết cho
bởi bảng:
Số ngày
5 6 7
Số tiền 20 25 30 35 40
Khả năng (%) 25 60 15
Khả năng (%) 10 15 35 25 15
Được biết số ngày điểm tâm và chi phí cho mỗi
lần điểm tâm không phụ thuộc nhau. Trung bình mỗi
tuần người này chi bao nhiêu cho điểm tâm?


2.2 Phương sai

2.2.1 Phương sai của ĐLNN rời rạc
Độ lệnh của X so với E(X) là X – E(X). Tuy
nhiên, để tiện cho các phép tính vi tích, người ta xét
độ lệch bình phương [X – E(X)]2. Độ lệch bình phương
lớn thì độ lệch cũng lớn và ngược lại.
Để đánh giá mức độ phân tán các giá trò của
ĐLNN X quanh giá trò trung bình E(X), ta tính kỳ
vọng của độ lệch bình phương và gọi giá trò này là
phương sai:
var(X) = E([X − E(X)]2)
Trong thực tế, phương sai của ĐLNN X được

tính theo công thức:
var(X) = E(X2) − [E(X)]2


Để có cùng đơn vò đo với X, ta lấy căn của
phương sai và gọi giá trò này là độ lệch chuẩn:
σ(X) = Var(X)
Phương sai của ĐLNN X có bảng phân phối
(xi, pi), i=1, n được tính theo công thức:
 n

2
var(X) = ∑ xi pi −  ∑ x i pi 


i =1
 i =1

n

2


Ví dụ
Lấy ngẫu nhiên 100 gói mì ăn liền nhãn hiệu A
và 100 gói mì nhãn hiệu B rồi đem cân, ta có bảng:
Cân nặng (g) 82 83 84 85 86
Số gói mì A 10 20 10 30 20
Số gói mì B 18 6 16 31 16


87
10
13

Nên mua mì ăn liền nhãn hiệu nào?
Gọi X (Y) là trọng lượng một gói mì nhãn hiệu A (B)
được chọn ngẫu nhiên. Ta có bảng PPXS của ĐLNN
X và X2:
X2 6.724 6.889 7.056 7.225 7.396 7.569
X
82
83
84
85
86
87
P 10% 20% 10% 30% 20% 10%
E(X) = 84,6

E(X2) = 7159,4


var(X) = E(X2) − [E(X)]2 ≈ 2,24
Bảng phân phối của ĐLNN Y và Y2:
Y2 6.724 6.889 7.056 7.225 7.396 7.569
Y
82
83
84
85

86
87
p 18% 6%
16% 31% 16% 13%
E(Y) = 84,6

E(Y2) = 7159,7

⇒ var(Y) = E(Y2) − [E(Y)]2 ≈ 2,54

Trọng lượng trung bình của một gói mì của cả 2
nhãn hiệu đều là 84,6g. Tuy nhiên var(X) < var(Y)
nên gói mì nhãn hiệu A có trọng lượng ổn đònh hơn.
Nên mua mì ăn liền nhãn hiệu A.


2.2.2 Tớnh chaỏt
(i) var(c) = 0 (c laứ ẹLNN haống vaứ baống c)
(ii) var(cX) = c2.var(X)
(iii) var(X Y) = var(X) + var(Y) X, Y ủoọc laọp
(iv) var(X + c) = var(X)


Ví dụ
(1) Xét X, Y là hai ĐLNN độc lập. Biết var(X) = 4,
var(Y) = 1. Hãy tính σ(2X – 3Y + 1).
Theo tính chất của phương sai:
var(2X – 3Y + 1) = 4var(X) + 9var(Y) = 25
⇒ σ(2X – 3Y + 1) = 25 = 5



(2) Trò chơi A: Tung con xúc sắc. Nếu xuất hiện mặt
1 hoặc mặt 2 hoặc mặt 3 thì thua 1đ, mặt 4 thì hoà,
mặt 5 thì thắng 1đ, mặt 6 thì thắng 2đ.
Trò chơi B: Tung con xúc sắc. Nếu xuất hiện mặt
chẳn thì thì thắng 2đ, mặt lẻ thì thua 2đ.
Cách chơi I: Chơi 2 ván theo trò chơi A và 3 ván
theo trò chơi B.
Cách chơi II: Chơi 3 ván theo trò chơi A và 2
ván theo trò chơi B.
Tính kỳ vọng và phương sai của số tiền thắng
cuộc khi chơi theo cách I, cách II. Các cách chơi này
có công bằng? Cách chơi nào có tính đỏ đen hơn?


2.3 Giá trò tin chắc nhất của ĐLNN rời rạc

Xét X là ĐLNN rời rạc. Nếu phải dự đoán giá trò
của X thì ta sẽ chọn giá trò xo sao cho biến cố (X = xo)
có nhiều khả năng xảy ra nhất. xo gọi là giá trò tin
chắc nhất của ĐLNN X, ký hiệu Mod(X).
Do max P(X = x) có thể đạt tại nhiều giá trò x
x

nên Mod(X) không chắc duy nhất.


Ví dụ
(1) X là số nút khi tung xúc xắc thì Mod(X) là giá
trò 1 hay 2 ... hay 6.

(2) ĐLNN X có bảng phân phối sau có Mod(X) = 85:
X

82

83

84

85

86

87

p 10% 20% 10% 30% 20% 10%


2.4 Trung vò của ĐLNN rời rạc

Xét hai dãy số:
A: 1, 1, 5, 7, 8

B: 3, 3, 4, 6, 6, 9

Giá trò nằm giữa dãy số, gọi là trung vò, bằng
bao nhiêu?
Đối với dãy A, trung vò là 5. Đối với B, có hai
giá trò nằm giữa là 4 và 6. Ta lấy trung bình của hai
giá trò này là 5 làm trung vò.


Excel
Trung vò của dãy số ghi trong miền D là =MEDIAN(D).
Để tính trung vò của ĐLNN X có bảng phân phối
(xi, pi), i= 1, n, ta đưa các số pi về dạng các phân số


mi
. Thành lập dãy số bằng cách
n
lặp lại mi lần giá trò xi và sắp thứ tự. Trung vò của
dãy số này gọi là trung vò của ĐLNN X, ký hiệu
Med(X).
có chung mẫu số là

Med(X) thoả tính chất:
1
P(X ≤ Med(X)) ≥

2

P(X ≥ Med(X)) ≥

1
2


Ví dụ
Xét ĐLNN X:
Ta có:


X
2
3
4
P 0,25 0,25 0,1

5
2
0,1 =
20
20
Dãy số tương ứng:
0,25 =

01

02

03

04

05

06

07

08


09

0,4 =
10

11

12

5
0,4

8
20
13

14

15

16

17

18

19

20


2 2 2 2 2 3 3 3 3 3 4 4 5 5 5 5 5 5 5 5
⇒ Med(X) = 3,5


×