Tải bản đầy đủ (.pdf) (8 trang)

Bài giảng Xác suất thống kê: Chương 5 - Nguyễn Văn Tiến (2019)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.07 MB, 8 trang )

2/16/2019

Phương pháp mẫu

Chương 5

LÝ THUYẾT MẪU

Tổng thể (population)
Mẫu (Sample)
Tham số (parameter)
Thống kê (statistic)

2

1

Nội dung

Tóm tắt tổng thể và mẫu

• Trong lý thuyết mẫu hay thống kê suy diễn ta
thường dùng các đặc trưng của mẫu (statistic) để
ước tính các đặc trưng của tổng thể (parameter)
• Nếu ta lấy mẫu cỡ n từ tổng thể thì điều gì sẽ xảy
ra? Trung bình mẫu sẽ có quy luật phân phối gì? Tỷ
lệ mẫu có quy luật gì?
• Để ước tính trung bình tổng thể ta dùng đặc trưng
nào của mẫu? Tương tự cho các tham số khác như
tỷ lệ và phương sai?
•  Phải hiểu rõ quy luật phân phối của mẫu


(sampling distribution)

Kích
thước
Trung
bình
Phương
sai
Độ lệch
chuẩn
Tỷ lệ A

Tổng thể

Mẫu TQ

Mẫu cụ thể

N

n

n

  EX 

X

x


 2 V X 

S  ; S ;S  s ; s ;s 
2

2

* 2

2

2

  V X 

S; S; S *

s; s; s *

p  P  A

F

f

3

Các thuật ngữ

* 2


4

Phân phối của trung bình mẫu

• Tham số (Parameters) là các đại lượng số đặc trưng
của tổng thể. Đây là các giá trị cố định.
• Thống kê (Statistics) là các đại lượng đặc trưng của
mẫu. Chúng biến đổi từ mẫu này sang mẫu khác và
nhìn chung là các biến ngẫu nhiên. Ta cố gắng xác định
quy luật phân phối xác suất của các biến ngẫu nhiên
này. Từ đó tìm ra cách suy diễn cho tổng thể.
• Sai số chuẩn (Standard error) là độ lệch chuẩn của một
thống kê mẫu
• Độ lệch chuẩn (Standard deviation) liên quan đến một
mẫu
5

• Một bể cá lớn từ trại cá giống đang được chuyển đến hồ.
Ta muốn biết chiều dài trung bình của cá trong bể. Thay vì
đo chiều dài của toàn bộ cá trong bể ta chọn ngẫu nhiên
một mẫu và sử dụng trung bình mẫu để ước lượng cho
trung bình tổng thể.
• Đặt trung bình mẫu là 𝑋. Giá trị của 𝑋 là ngẫu nhiên do
phụ thuộc vào mẫu được chọn ra.
• Trung bình mẫu 𝑋 được gọi là một thống kê.
• Trung bình của tổng thể là cố định, ta ký hiệu là μ.
• Phân phối của trung bình mẫu cũng là phân phối của biến
ngẫu nhiên 𝑋.
• Thông thường, phân phối của trung bình mẫu rất phức tạp

ngoại trừ trường hợp cỡ mẫu rất nhỏ hoặc rất lớn.
• Phương pháp chọn mẫu là ngẫu nhiên, không hoàn lại.
6

1


2/16/2019

Ví dụ minh họa

Chọn mẫu cỡ n=2

• Tổng thể là trọng lượng của sáu quả bí ngô (kg) được
trưng bày trong một gian hàng trò chơi "đoán trọng
lượng" của hội chợ. Bạn được yêu cầu đoán trọng
lượng trung bình của sáu quả bí ngô bằng cách lấy một
mẫu ngẫu nhiên mà không hoàn lại từ tổng thể.
Quả bí
A B C D E F
Trọng lượng (kg) 19 14 15 9 10 17

Sample
A, B
A, C
A, D
A, E
A, F
B, C
B, D

B, E
B, F

Weight
19, 14
19, 15
19, 9
19, 10
19, 17
14, 15
14, 9
14, 10
14, 17

𝑋
16.5
17.0
14.0
14.5
18.0
14.5
11.5
12.0
15.5

Probability
1/15
1/15
1/15
1/15

1/15
1/15
1/15
1/15
1/15

Sample
C, D
C, E
C, F
D, E
D, F
E, F

Weight
15, 9
15, 10
15, 17
9, 10
9, 17
10, 17

𝑋
12.0
12.5
16.0
9.5
13.0
13.5


Probability
1/15
1/15
1/15
1/15
1/15
1/15

 

E X  14  

Bảng phân phối xác suất của trung bình mẫu:

Trung bình tổng thể: μ=14 (kg)

𝑋

9.5

11.5

12.0

12.5

13.0

13.5


14.0

14.5

15.5

16.0

16.5

17.0

18.0

P

1/15

1/15

2/15

1/15

1/15

1/15

1/15


2/15

1/15

1/15

1/15

1/15

1/15

7

8

Chọn mẫu cỡ n=5
Sample
A, B, C, D, E
A, B, C, D, F
A, B, C, E, F
A, B, D, E, F
A, C, D, E, F
B, C, D, E, F

𝑋
P

Weight
19, 14, 15, 9, 10

19, 14, 15, 9, 17
19, 14, 15, 10, 17
19, 14, 9, 10, 17
19, 15, 9, 10, 17
14, 15, 9, 10, 17

13.0
1/6

13.4
1/6

𝑋

13.4
14.8
15.0
13.8
14.0
13.0

13.8
1/6

14.0
1/6

Tổng hợp

Probability

1/6
1/6
1/6
1/6
1/6
1/6

14.8
1/6







15.0
1/6

 

E X  14  

Nếu cỡ mẫu lớn thì?
Cần chọn mẫu cỡ bao nhiêu?
Trung bình mẫu có quy luật phân phói như thế nào?
Xu hướng trung tâm của trung bình mẫu là?
Mức độ biến động của trung bình mẫu so với xu
hướng trung tâm?


9

10

Tổng thể và tham số tổng thể

Phân phối xác suất của thống kê mẫu
• Bị ảnh hưởng bởi:

• Kích thước N, gồm các phần tử có cùng một dấu
hiệu nghiên cứu X
• X: bnn gốc của tổng thể
• PPXS của X cũng là ppxs của tổng thể
• Các tham số tổng thể  tham số đặc trưng của
bnn X

 Cỡ mẫu
 Phân phối của tổng thể
 Cách thức chọn mẫu

  E  X ;

11

 2  V  X ;

p  P  X  

12


2


2/16/2019

Các đặc trưng mẫu (statistic)

Mẫu ngẫu nhiên – tổng quát
• Định nghĩa. Tập hợp n biến ngẫu nhiên độc lập X1, X2,
…, Xn thành lập từ biến ngẫu nhiên gốc X được gọi là
mẫu ngẫu nhiên cỡ n (kích thước n)
• Ký hiệu: W=(X1, X2, …, Xn) trong đó Xi là các bnn
• Xi có cùng quy luật phân phối với X
E  Xi   E  X   

• Trung bình mẫu:
𝑋=

• Phương sai mẫu:
𝑆

2

=

V  Xi   V  X    2

• Một phép thử với mẫu ngẫu nhiên là một mẫu cụ thể
gồm n quan sát. w=(x1,x2,…,xn)


𝑆
𝑆∗

2

2

1
𝑛−1
1
=
𝑛
=

1
𝑛

𝑛

𝑋1 + 𝑋2 +. . . +𝑋𝑁
𝑛

Tỷ lệ mẫu:

𝑛

𝑋𝑖 − 𝑋

F


2

𝑖=1

𝑋𝑖 − 𝑋

2

𝑋𝑖 − 𝜇

2

𝑖=1
𝑛

𝑖=1

13

Tính chất các thống kê mẫu

 

 

V X 

• Phương sai mẫu:

E S2    2


2
n

 

 X 

   n n1

E S

2

Điều tra thời gian sử dụng internet trong tuần của 90
sinh viên một trường ta được bảng số liệu sau:


n

Thời gian (giờ)
Số sv

E  S *2    2

2

V F  

3 4 5 6 7 8

7 8 17 24 20 14

Hãy tính các thống kê mẫu sau:
a) Trung bình mẫu, phương sai mẫu (đã hiệu chỉnh),
phương sai mẫu chưa hiệu chỉnh?
b) Tỷ lệ sinh viên trong mẫu có thời gian sử dụng trên 5
giờ một tuần?

• Tỷ lệ mẫu:

E F   p

14

Thực hành tính thống kê mẫu

• Trung bình mẫu:

E X 

p 1 p 
n
15

16

Cách 1_Lập bảng
xi
….
….

Tổng

ni
….
….

xini
….
….

n

i

n   ni


s

2



 x n   x
n
2
i i

xi
3

4
5
6
7
8
Tổng

x n x n
x

2

Cách 1_Lập bảng

(xi)2ni
….
….
2
i i

i i

Y
n

xn

i i

n

n
s2 
s
n 1



2

17

ni
7
8
17
24
20
14
90

xini
21
32
85
144
140
112
534

(xi)2ni

63
128
425
864
980
896
3356

18

3


2/16/2019

Cách 1_Lập bảng

Cách 2__dùng máy tính 570ES

n   ni  90

• Cỡ mẫu:
• Trung bình mẫu:

x

xn

i i


n



1.
2.
3.
4.

534
 5,9333
90

Shift + 9 + 3 + = + =: Reset máy
Shift + Mode +  + 4 + 1: bật tần số (frequency on)
Mode + 3 + 1: vào tính thống kê 1 biến (stat1-var)
Khi này ta có bảng sau:

• Phương sai mẫu chưa hiệu chỉnh:

xn
 s  n   x
2
i i

2

2

X


 ...  2,0844

• Phương sai mẫu đã hiệu chỉnh: Độ lệch mẫu đã hiệu

s2 



n
s
n 1

2

chỉnh:

 2,1078

FREQ

1
2
3

s  2,1078  1, 4518
19

Cách 2__dùng máy tính 570ES


Cách 2_dùng máy tính 570ES
6. Lấy số liệu thống kê: Shift + 1 + 5 (4) Chọn Var
Ta có bảng sau:

• Ta nhập vào như sau:
X
3
4
5
6
7
8

1
2
3
4
5
6

20

FREQ
7
8
17
24
20
14


1: n

2: x

3: x

4: sx

Tương ứng:
1: cỡ mẫu
2: trung bình mẫu
3. Độ lệch chuẩn mẫu.
4. Độ lệch chuẩn mẫu hiệu chỉnh.

• Nhấn AC để thoát.
21

Ví dụ 1

Số lần tương
ứng
3
5
10
8
4

22

Mô phỏng phân phối mẫu

• />t/index.html
• />• />4/node/132/
• />
Lượng xăng hao phí của một ô tô đi từ A đến B sau 30 lần
chạy kết quả cho trong bảng.
Lượng xăng
hao phí
9,6 – 9,8
9,8 – 10
10 – 10,2
10,2 – 10,4
10,4 – 10,6

Không
phải
phương
sai

a) Tính trung bình mẫu
b) Tính độ lệch chuẩn
mẫu
c) Tính độ lệch chuẩn
mẫu hiệu chỉnh

23

24

4



2/16/2019

Phân phối xác suất của thống kê mẫu





1. Tổng thể có phân phối chuẩn
• Cho tổng thể có phân phối chuẩn.
• Biến nn gốc X~N(µ; σ2)
• Ta có:

A. Biến ngẫu nhiên gốc có phân phối chuẩn
B. Biến ngẫu nhiên gốc có phân phối B(1,p)
C. Hai tổng thể có phân phối chuẩn
D. Hai tần suất của hai tổng thể



X 
 2 
X ~ N  ,  
n




X  


n

S
Z

n  S *



2

2



n

~ N  0;1

~ t  n  1
~  2 n

Z

 n  1 S 2 ~  2 n  1
 
2



25

2. Tổng thể có phân phối nhị thức





26

3. Hai tổng thể có phân phối chuẩn

Gọi p là tỷ lệ một tính chất A nào đó của tổng thể.
Khi này ppxs của bnn gốc X là: B(1;p) hay A(p)
Lấy mẫu nn cỡ n, gọi F là tỷ lệ mẫu.
Ta có:

• Cho hai tổng thể và 2 bnn gốc:
X ~ N   X ;  X2  ; Y ~ N  Y ;  Y2 

• Ta tiến hành lấy 2 mẫu độc lập:
W  n    X 1 , X 2 ,..., X n 

 p 1  p    F  p  n
F ~ N  p;
~ N  0;1

n
p 1  p 




W  m   Y1 , Y2 ,..., Ym 

• Các thống kê mẫu tương ứng:
X

X 1  X 2  ...  X n
n

Y

S X2

Y1  Y2  ...  Ym
m

SY2

27

3. Hai tổng thể có phân phối chuẩn
• Ta có:

28

3. Hai tổng thể có phân phối chuẩn
• Nếu chưa biết 2 phương sai nhưng mẫu lớn m>30,
n>30 thì:




2 
2 
X ~ N  X ; X ;
Y ~ N  Y ; Y 
n 
m



 X2  Y2 
 X  Y ~ N   X  Y ;


n
m


Z

 X Y   

X

 Y 

S X2 SY2

n

m

 N  0;1

• Do đó:

 X Y   
 X2
n



X

 Y 

 Y2

~ N  0;1

m
29

30

5


2/16/2019


3. Hai tổng thể có pp Chuẩn, mẫu nhỏ

3. Hai tổng thể có pp Chuẩn, mẫu nhỏ

• Hai tổng thể có phân phối chuẩn
• Trường hợp mẫu nhỏ (m hay n<30) và có thêm giả
thuyết 2 phương sai bằng nhau (chưa biết) ta có:

 X Y   

Z

X

 Y 

S2 S2

n m

• Hai tổng thể có phân phối chuẩn
• Trường hợp mẫu nhỏ (m hay n<30) và có thêm giả
thuyết 2 phương sai khác nhau (chưa biết) ta có:

~ t  n  m  2

Z

 X Y   


• Với S2 là phương sai chung được ước lượng như sau

  x  x    y  y
n

S2 

m

2

i

i 1

i

i 1

• Trong đó:

2

nm2



 n  1 S

k


  m  1 S
nm2
2
X

2
Y

X

 Y 

S X2 SY2

n
m

S

S

2
X

2
X

/ n  SY2 / m 


/ n

n 1

2



S

2
Y

 t k 

2

/ m

2

m 1

31

32

3. Hai tổng thể có phân phối chuẩn

3. Hai tổng thể có phân phối chuẩn


• Cho hai tổng thể và 2 bnn gốc:
X ~ N   X ;

2
X

• Cho hai tổng thể và 2 bnn gốc:
X ~ N   X ;  X2  ; Y ~ N  Y ;  Y2 

 ; Y ~ N   ; 
Y

2
Y

• Ta tiến hành lấy 2 mẫu cỡ n và cỡ m.
W  n    X 1 , X 2 ,..., X n 

• Ta có:

ZX 

 n  1 S X2

 n  1 S


~  2  n  1


 X2
 X2

2
X

/  n  1

 m  1 SY2 /
 Y2



 m  1

• Ta tiến hành lấy 2 mẫu cỡ n và cỡ m.
W  n    X 1 , X 2 ,..., X n 

W  m   Y1 , Y2 ,..., Ym 
ZY 

 m  1 SY2 ~  2 m  1


2

• Tương tự:

Y


W  m   Y1 , Y2 ,..., Ym 

S1*2 /  12
~ F  n; m 
S 2*2 /  2 2

S X2 /  X2
~ F  n  1; m  1
SY2 /  Y2
33

34

4. Hai tổng thể chưa biết ppxs, mẫu lớn

5. Hai tổng thể có phân phối B(n,p)

• Hai tổng thể có ppxs chưa biết
• Kích thước mẫu lớn m>30, n>30
• Đã biết hai phương sai
Z

 X Y   
 X2
n



X


 Y 

 Y2






 N  0;1

Z

m

• Chưa biết hai phương sai:
Z

 X Y   

X

 Y 

S X2 SY2

n
m

Cho hai tổng thể có tỷ lệ lần lượt là p1; p2.

Lấy mẫu cỡ n từ tổng thể 1, tần suất mẫu F1=k1/n
Lấy mẫu cỡ m từ tổng thể 2, tỷ lệ mẫu F2=k2/m
Với n, m đủ lớn ta có:

 F1  F2    p1  p2 
p1 1  p1  p2 1  p2 

n
m

~ N  0;1

 N  0;1

35

36

6


2/16/2019

Tóm tắt tổng thể và mẫu
Tổng thể
Kích
thước
Trung
bình
Phương

sai
Độ lệch
chuẩn

Mẫu cụ thể

N

n

n

  EX 

X

x

 2 V X 

Tỷ lệ A

Mẫu TQ

PPXS đối với hai mẫu độc lập

N, t

 S  ; S ;S  s ; s ;s 
2


2

* 2

2

Tổng thể

* 2

2

  V X 

S; S; S *

s; s; s *

p  P  A

F

f

Trung
bình
Phương
sai


Tỷ lệ

2

Mẫu TQ

 X ; Y

X ;Y

 X2 ;  Y2

S X2 ; SY2

s ; s ;s 

p1 ; p2

F1 ; F2

f1 ; f 2

Tổng hợp phân phối mẫu



~ ???

 F  p  n ~ ???
3.

p 1  p 

X  
2.

~ ???

S

2

~ ???

2

* 2

F
N

38

• Giả sử bạn lấy mẫu 100 giá trị từ tổng thể có trung
bình 500 và độ lệch chuẩn 80. Tính xác suất để
trung bình mẫu nằm trong khoảng (490, 510)

n

 n  1 S 2
4.


2

N, t

Ví dụ 1

• Một tổng thể
n

x; y

N
37

X  
1.

Mẫu cụ thể

5.

nS *2

2

~ ???

• Hai tổng thể
1.


X

1



 X 1   1  2 

~ ???
???
F1  F2    p1  p2 

3.
~ ???
???

2.

X

1



 X 1   1  2 
???

S 2 / 2
4. 12 1 2 ~ ???

S2 /  2

5.

~ ???
S1*2 /  12
~ ???
S2*2 /  2 2
39

40

Ví dụ 2

Ví dụ 3

Một mẫu kích thước n được rút ra từ tổng thể phân phối
chuẩn với trung bình là μ và độ lệch chuẩn 10. Hãy xác
định n sao cho:

Trọng lượng một loại sản phẩm là biến ngẫu nhiên phân
phối chuẩn với trung bình là 20,5 và độ lệch chuẩn 2.
Lấy ngẫu nhiên 4 sản phẩm để kiểm tra thì với xác suất
0,95 trọng lượng trung bình của chúng sai lệch so với
trọng lượng qui định tối đa là bao nhiêu?



b) P    2  X    2   0,9544


a) P   10  X    10  0,9544

41

42

7


2/16/2019

Ví dụ 4

Ví dụ 5

• Chiều dài của một loại sản phẩm là bnn pp chuẩn
với trung bình 20 m và độ lệch chuẩn 0,2 m. Lấy
một mẫu ngẫu nhiên 25 sp.
a) Cho biết ppxs của trung bình mẫu. Tính kỳ vọng
và phương sai của nó.
b) Xs để trung bình mẫu tối thiểu 30,06m
c) Tìm số k để tỷ số giữa phương sai mẫu hiệu
chỉnh và phương sai tổng thể ít nhất bằng k có
xác suất bằng 0,1.

• Giả sử X là năng suất lúa vùng A có pp chuẩn với
phương sai bằng 3 (tạ/ha)2. Lấy một mẫu ngẫu
nhiên kích thước 100. Tính xác suất để:

43


44

 100
P   Xi  X
 i 1





2


 270 


8



×