Tải bản đầy đủ (.pdf) (11 trang)

Bài giảng Xác suất thống kê: Chương 2 - Nguyễn Văn Tiến (2019)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.69 MB, 11 trang )

2/14/2019

CHƯƠNG 2

2.1 Khái niệm và phân loại

BIẾN NGẪU NHIÊN
MỘT CHIỀU

• Khái niệm. Biến số gọi là biến ngẫu nhiên (random
variable) nếu trong kết quả của phép thử nó sẽ
nhận một và chỉ một giá trị có thể có của nó tùy
thuộc vào sự tác động của các nhân tố ngẫu
nhiên.
• Ký hiệu: X, Y, Z … hay X1,X2,…
• Giá trị có thể có của bnn: chữ thường x, y, z, …
• {X≤x} {Y=y} là các biến cố ngẫu nhiên.

1

Ví dụ 1

2

Phân loại bnn

• X: Lượng khách vào một cửa hàng trong ngày
• Y: Tuổi thọ của một chiếc điện thoại
• Trả ngẫu nhiên 3 mũ bảo hiểm cho 3 người. Gọi Z:
số mũ bảo hiểm được trả đúng người
• T: Số sản phẩm hỏng trong 100 sản phẩm mới


nhập về
• U: Chiều cao của một sinh viên gọi ngẫu nhiên
trong lớp này

3

4

Phân loại

Ví dụ 2

Biến ngẫu nhiên

• Hộp có 6 viên bi gồm 4 trắng và 2 vàng. Lấy ngẫu
nhiên 2 viên bi từ hộp. Đặt Y là số viên bi vàng có
trong 2 viên lấy ra.
• Khi đó Y cũng là biến ngẫu nhiên.
• Ta có:
Y  0;1; 2

Rời rạc
- Hữu hạn giá trị
- Vô hạn đếm được giá
trị
- Xác suất tập trung tại
các điểm giá trị

Liên tục
- Giá trị lấp đầy một hay vài

khoảng hữu hạn hoặc vô hạn
- Xác suất tại từng khoảng giá
trị
- Xác suất không tập trung tại
các điểm
P(X=a)=0 với mọi a

• “Y=0”, “Y=1”, “Y<2” là các biến cố nào???

5

6

1


2/14/2019

Hai biến ngẫu nhiên độc lập

2.2 Quy luật phân phối xác suất

• Hai biến ngẫu nhiên X, Y độc lập nếu hai biến cố:

• Biểu diễn quan hệ giữa các giá trị của biến ngẫu
nhiên và xác suất tương ứng.

 X  x
Y  y 
• Độc lập nhau với mọi giá trị của x, y.

• Nói cách khác mọi biến cố liên quan đến hai biến
ngẫu nhiên X, Y luôn độc lập nhau.

7

Luật phân phối xác suất

Hàm phân phối xác suất

• Biểu diễn quan hệ giữa các giá trị của biến ngẫu
nhiên và xác suất tương ứng.
• Thường gặp 3 dạng:
Hàm phân bố xác
suất (CDF)

Rời rạc
+ Liên
tục
Hàm khối xác suất Rời rạc
(PMF)
Hàm mật độ xác
suất (PDF)

Xác suất bên trái
Tỷ lệ bên trái

F(x)

Xác suất tại điểm


p(x)
f(x)

Liên tục Mật độ xác suất

8

• Hàm phân phối xác suất (Cumulative Distribution
Function), viết tắt CDF của biến ngẫu nhiên X là
hàm xác định:

FX ( x)  P  X  x  ;    x  
• {X≤x} : biến cố “bnn X nhận giá trị nhỏ hơn hay
bằng x”
• Đơi khi ta còn gọi là hàm phân bố xác suất hay
hàm tích lũy xác suất.

f(x)

9

Tính chất

10

Hàm phân phối xác suất

i)

0  FX  x   1, x  R


ii)

FX  x  là hàm không giảm, liên tục bên phải. Nếu

X là biến ngẫu nhiên liên tục thì F  x  là hàm liên tục
trên R.
iii)

FX     lim FX  x   0
x

FX     lim FX  x   1
x

iv)

P  a  X  b   FX  b   FX  a  .
11

12

2


2/14/2019

Hàm khối xác suất

Bnn Rời rạc - Bảng ppxs


• Probability Mass Function (PMF)

• Bảng phân phối xác suất của X.

pX  x   P  X  x 
• Tính chất:
i) pX  x   0

x1

…. x2

…. xn

P

p1

…. p2

…. pn

• xi : giá trị có thể có của bnn X
• pi : xác suất tương ứng;

• Dạng bảng
• Dạng đồ thị

ii )  p X  x   1


X

i ) pi  p X ( xi )  P( X  xi )

x

iii ) P  A    p X  x 

n

ii )  pi  1

xA

i 1

13

14

PMF và CDF

PMF và CDF
• Hàm phân phối xác suất được xác định như sau:

FX kì vọng cao

32


Ví dụ 10

Ví dụ 11

• Một nhân viên bán hàng có 2 cuộc hẹn trong 1
ngày. Với cuộc hẹn thứ nhất, khả năng thành công
(ký được hợp đồng) là 0,7 và lợi nhuận dự kiến là
1000$. Với cuộc hẹn thứ 2, khả năng thành công
là 0,4 và lợi nhuận là 1500$. Giả sử kết quả các
cuộc hẹn độc lập nhau. Lợi nhuận kỳ vọng của
nhân viên bán hàng là bao nhiêu?

• X là tuổi thọ của một loại thiết bị điện tử

20.000
100  x 
x3
• Tìm tuổi thọ trung bình của loại thiết bị này.
f  x 

33

Ví dụ 12

Ví dụ 13

• Nhu cầu hàng ngày của một loại thực phẩm tươi sống ở
1 khu vực là bnn rời rạc có ppxs:
X
P


80
0,2

100
0,4

34

120
0,3

150
0,1

• Giả sử khu vực này chỉ có 1 cửa hàng và cửa hàng này
nhập mỗi ngày 100kg thực phẩm.
• Giá nhập là 40 ngàn/kg; bán ra là 60 ngàn/kg. Nếu thực
phẩm khơng bán được trong ngày thì phải bán với giá
20/kg ngàn mới hết hàng.
• Muốn có lãi trung bình cao hơn thì cửa hàng có nên
nhập thêm 20kg mỗi ngày hay khơng
35

• Cho bnn X có hàm mật độ:

f  x   e x

 x  0


• A) Kiểm tra lại tính hợp lý của PDF trên
• B) Tính E(X)
• Biến ngẫu nhiên X như trên gọi là có phân phối mũ
với tham số λ. Ký hiệu: X~E(λ)

36

6


2/14/2019

Ví dụ 14

Kỳ vọng của hàm của bnn
• Cho bnn X và hàm (x). Đặt Y=(X) là bnn
• Kỳ vọng tốn học của Y:

• Tính kỳ vọng của bnn X rời rạc có hàm mật độ:
P X  k 

C
 p k ,
k2

k  1, 2, 3,...

𝜑 𝑥𝑖 𝑝 𝑥𝑖 , nếu X rời rạ𝑐
𝐸 𝜑 𝑋


=

𝑖
+∞

𝜑 𝑥 𝑓 𝑥 𝑑𝑥 , nếu X liên tục
−∞

37

38

Ví dụ 15

Phương sai
• Định nghĩa. Phương sai (variance) của bnn X, ký
hiệu là V(X) được tính theo cơng thức:

• Xét hai bnn sau:
X
P
Y
P

3
0,3
1
0,4

4

0,4
2
0,1

5
0,3
6
0,3

• Rút gọn:

V  X   E  X  E  X 

2

V  X   E  X 2    E  X  

8
0,2

2

• So sánh E(X) và E(Y)
• Vẽ đồ thị và nhận xét về mức độ biến thiên của X,
Y
39

Ý nghĩa của phương sai

40


Tính chất của phương sai

• Phương sai đo độ dao động của các giá trị của X
xung quanh kỳ vọng tốn E(X)
• Phương sai có đơn vị là bình phương đơn vị của X
• Nếu X, Y cùng đơn vị, cùng ý nghĩa, V(X)>V(Y) thì:
– X biến động, dao động, phân tán hơn Y
– Y ổn định, đồng đều hơn X

• Trong kỹ thuật phương sai đặc trưng cho sai số
của thiết bị. Trong kinh tế, phương sai đo độ rủi ro
của các quyết định.
41

42

7


2/14/2019

Ví dụ 16

Ví dụ 17

• Tiền lãi khi đầu tư 1 tỷ đồng vào các ngành A, B là
các bnn độc lập X, Y:
X
P


0
0,3

15
0,5

30
0,2

Y
P

-2
0,2

15 35
0,45 0,35

• Muốn lãi trung bình cao hơn thì đầu tư vào ngành
nào?
• Muốn rủi ro thấp hơn thì đầu tư vào ngành nào?
• Muốn rủi ro thấp nhất thì chia vốn đầu tư theo tỷ
lệ nào?

X
P

0
0,3


15
0,5

30
0,2

Y
P

-2
0,2

15 35
0,45 0,35

• Đầu tư a tỷ vào ngành A và b tỷ vào ngành B trong 1
tháng. Tìm trung bình và phương sai của tổng tiền lãi
trong 1 tháng?
• Đầu tư 2 tỷ vào ngành A trong một tháng. Tìm trung
bình và phương sai của tiền lãi thu được.
• Mỗi tháng đầu tư vào ngành A 1 tỷ, độc lập nhau. Tìm
trung bình và phương sai của tổng tiền lãi trong 2
tháng. Tính xác suất tổng tiền lãi khơng dưới 50 triệu.
• Tìm xác suất đầu tư vào A được lãi cao hơn B?

43

Độ lệch chuẩn


44

Ví dụ 18

• Định nghĩa. Độ lệch chuẩn (standard deviation)
của bnn X, ký hiệu (X) hay X, là căn bậc hai của
phương sai.

 X   V X 
• Độ lệch chuẩn cũng đo mức độ phân tán, dao
động của bnn X và có ý nghĩa tương tự phương
sai.
• Độ lệch chuẩn có cùng đơn vị với bnn X.
45

Ví dụ 19

46

Chuẩn hóa biến ngẫu nhiên
• Cho X là bnn có kỳ vọng  và độ lệch chuẩn >0.
• Đặt:
X 
Z

• Ta có:

E Z   0

V Z  1


• Biến Z gọi là bnn chuẩn hóa của bnn X.

47

48

8


2/14/2019

Hệ số biến thiên

Ví dụ 20
Tuổi thọ của một loại côn trùng M là biến ngẫu nhiên
X (đơn vị: tháng) với PDF như sau:

f  x   kx 2  4  x  ,

• Định nghĩa. Hệ số biến thiên (coefficient of variation)
của X ký hiệu là CV(X) được tính theo cơng thức:
• Kí hiệu: CV(X).
CV  X  

 0  x  4

X

EX 


 E  X   0

.100%

• Hệ số biến thiên có đơn vị là %.
• Hệ số biến thiên đo độ phân tán tương đối.
• Có thể so sánh hệ số biến thiên của nhiều bnn khác
nhau, không cần cùng đơn vị, ý nghĩa, khơng có cùng
kỳ vọng.

• Tìm hằng số k?
• Xác định CDF?
• Tính tuổi thọ trung bình của loại cơn trùng trên.

49

50

Median (Trung vị)

Mode X

• Định nghĩa. Trung vị của bnn X, ký hiệu MedX, me
là giá trị nằm ở chính giữa phân phối xác suất
• Nếu X rời rạc:
 P  X  me   0,5

 P  X  me   0,5
• Nếu X liên tục:

me



• Định nghĩa. Mốt (mode) của bnn X, ký hiệu mo là
giá trị ứng với xác suất lớn nhất (X rời rạc) hoặc
hàm mật độ f(x) lớn nhất (X liên tục).
• BNN X có thể có 1 mod, nhiều mod hoặc khơng
có mod
• Nếu X rời rạc:

P  X  m0   max P  x  xi 
i

f  x  dx  0,5

• Nếu X liên tục:



f  m0   max f  x 
xR

51

Ví dụ 21

Ví dụ 22
• Cho bnn X có hàm mật độ xác suất


Cho bnn X

Ta có:

X

1

P

0,1

X

1

F(X) 0,1

Vậy

52

2

3

4

3
 x 2  x

f  x   4
0


5

0,2 0,15 0,3 0,25

2

3

4

0,3 0,45 0,75

,0  x  2
, x   0, 2

• Tìm MedX và ModX?

5
1

Med  X   4  Mod  X 
53

54

9



2/14/2019

Phân vị mức (1-𝛼)

Giá trị tới hạn

• Định nghĩa. Với bnn X liên tục, phân vị (percentile)
mức 1 − 𝛼 ký hiệu là 𝑥1−𝛼 là số thực thỏa mãn:

P  X  x1   1  

• Định nghĩa. Với bnn X liên tục, giá trị tới hạn
(critical value) mức 𝛼 (0 ≤ 𝛼 ≤ 1) ký hiệu là 𝑥𝛼 là
số thực thỏa mãn:

P  X  x   
𝛼

x
55

56

Ví dụ 23

Ví dụ 24

Tuổi thọ một loại cơn trùng là X (tháng) có hàm mật

độ
kx 2  4  x  , x   0;4
f  x  
, x   0;4
0

Cho bnn X có hàm mật độ

a) Tìm hằng số k
b) Tìm Mod(X)
c) Tìm xác suất cơn trùng chết trước khi nó được 1
tháng tuổi

và E(X)=0,6; V(X)=0,06
a) Tìm a,b,c?
b) Đặt Y=X3. Tính E(Y)

ax 2  bx  c
f  x  
0

, x   0;1
, x   0;1

57

58

Ví dụ 25


Ví dụ 25

• Giả sử một cửa hàng sách định nhập về một số
cuốn truyện trinh thám. Nhu cầu hàng năm về loại
sách này như sau:
Nhu cầu (cuốn)

30

31

32

33

P

0,3

0,15

0,3

0,25

• Cửa hàng mua sách với giá 7USD một cuốn, bán ra
với giá 10USD một cuốn nhưng đến cuối năm phải
hạ giá với giá 5USD một cuốn.
59


Nhu cầu (cuốn)

30

31

32

33

P

0,3

0,15

0,3

0,25

• Nếu nhập về 32 cuốn thì lợi nhuận bán được
trung bình là bao nhiêu?
• Xác định số lượng nhập sao cho lợi nhuận kì vọng
là lớn nhất.

60

10



2/14/2019

Anscombe's quartet

Bài tập chương 2






Anscombe's quartet

2.1; 2.2; 2.6; 2.7; 2.9;
2.10; 2.11; 2.14; 2.15; 2.17;
2.18; 2.10; 2.23; 2.24; 2.25
2.26; 2.27; 2.30; 2.31; 2.32
2.33; 2.34; 2.37

I

• Tất cả 23 bài.

II

III

IV

x


y

x

y

x

y

x

y

10.0

8.04

10.0

9.14

10.0

7.46

8.0

6.58


8.0

6.95

8.0

8.14

8.0

6.77

8.0

5.76

13.0

7.58

13.0

8.74

13.0

12.74

8.0


7.71

9.0

8.81

9.0

8.77

9.0

7.11

8.0

8.84

11.0

8.33

11.0

9.26

11.0

7.81


8.0

8.47

14.0

9.96

14.0

8.10

14.0

8.84

8.0

7.04

6.0

7.24

6.0

6.13

6.0


6.08

8.0

5.25

4.0

4.26

4.0

3.10

4.0

5.39

19.0

12.50

12.0

10.84

12.0

9.13


12.0

8.15

8.0

5.56

7.0

4.82

7.0

7.26

7.0

6.42

8.0

7.91

5.0

5.68

5.0


4.74

5.0

5.73

8.0

6.89

61

62

Anscombe's quartet

Anscombe's quartet
Value

Accuracy

Mean of x

Property

9

exact


Sample variance of x

11

exact

Mean of y

7.50

to 2 decimal places

Sample variance of y

4.125

±0.003

Correlation between x and y

0.816

to 3 decimal places

y = 3.00 + 0.500x

to 2 and 3 decimal places, respectively

0.67


to 2 decimal places

Linear regression line
Coefficient of
determination of the linear
regression

63

64

11



×