Tải bản đầy đủ (.ppt) (30 trang)

Chương 4: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (182.97 KB, 30 trang )


Chương 4
KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
§1: Các khái niệm
1.1 Giả thiết thống kê
Định nghĩa: Bất kỳ giả thiết nào nói về tham số,
dạng quy luật phân phối hoặc tính độc lập của đại
lượng ngẫu nhiên, đều gọi là giả thiết thống kê.
Những giả thiết đó có thể đúng hoặc cũng có thể
sai. Việc xác định tính đúng sai của một giả thiết
được gọi là kiểm định giả thiết thống kê.
Giả thiết H: . Đối thiết
0
θ θ
=
0
:H
θ θ


1.2 Mức ý nghĩa, miền bác bỏ
-Từ mẫu ngẫu nhiên ta chọn thống
kê sao cho nếu H đúng thì G có
phân phối hoàn toàn xác định.
( )
x 1 2
W , , ,
n
X X X
=
( )


1 2
, , ,
n
G f X X X=
G là tiêu chuẩn kiểm định giả thiết H
-Với bé tuỳ ý cho trước ta tìm được miền
sao cho:
α
( )
WP G
α
α
∈ =
α
W
α
Là miền bác bỏ
Là mức ý nghĩa của kiểm định
W
α
( )
0 1 2
, , ,
n
f x x x
θ
=
Là giá trị quan sát

-Nếu thì bác bỏ giả thiết H và thừa nhận

đối thiết
0
W
α
θ

H
-Nếu thì chấp nhận giả thiết H
0
W
α
θ

1.3 Sai lầm loại 1 và sai lầm loại 2
-Sai lầm loại 1: là sai lầm mắc phải khi ta bác bỏ
giả thiết H trong khi H lại đúng và
( )
WP G
α
α
∈ =
-Sai lầm loại 2: là sai lầm mắc phải khi ta chấp
nhận giả thiết H trong khi H sai và
( )
W 1P G
α
α
∉ = −
Chú ý: +) Nếu muốn giảm sai lầm loại 1 sẽ làm
tăng sai lầm loại 2 và ngược lại.

+) Ta thường ấn định trước xác suất sai lầm loại 1
và chọn miền bác bỏ nào có sai lầm loại 2 nhỏ nhất

§2: Kiểm định giả thiết về kỳ vọng
Giả sử ĐLNN X có kỳ vọng chưa
biết, có 3 bài toán kiểm định:
( )
E X
µ
=
( ) ( ) ( )
0 0 0
0 0 0
: : :
1 2 3
: : :
H H H
H H H
µ µ µ µ µ µ
µ µ µ µ µ µ
= = =
  
  
  
≠ > <
  
  
2.1 Trường hợp 1: đã biết
( )
2

D X
σ
=
Giả thiết : X có phân phối chuẩn hoặc cỡ mẫu n
đủ lớn
( )
30n

Chọn thống kê làm tiêu chuẩn
kiểm định
( )
0
X n
U
µ
σ

=
Nếu giả thiết H đúng thì
( )
0,1U N∈

a) Bài toán (1)
( )
0
:H
µ µ

- Với mức ý nghĩa cho trước, xác định phân
vị chuẩn ta tìm được miền bác bỏ:

α
1
2
u
α

( )
1- 1
2 2
W = - ;-u ; ; Wu P U
α α α α
α

   
∞ ∪ +∞ ∈ =
 ÷
 
   
- Lấy mẫu cụ thể và tính giá trị quan sát

0
0
x
u n
µ
σ

=
+) Nếu thì ta bác bỏ giả thiết
H và chấp nhận

( )
0 0
1
2
Wu u u
α α

≥ ∈
H
+) Nếu thì chấp nhận H

( )
0 0
1
2
Wu u u
α α

< ∉

b) Bài toán (2)
Với mức ý nghĩa cho trước, xác định phân vị
chuẩn ta tìm được miền bác bỏ:
α
1
u
α

[
)

1
W ;u
α α

= +∞
c) Bài toán (3)
( )
0
:H
µ µ
>
( )
0
:H
µ µ
<
Với mức ý nghĩa cho trước, xác định phân
vị chuẩn ta tìm được miền bác bỏ:
α
1
u
α

(
]
1
W ; u
α α

= −∞ −


Ví dụ: Một tín hiệu được gửi từ địa điểm A và
được nhận ở địa điểm B có phân phối chuẩn với
trung bình và độ lệch tiêu chuẩn .Tin rằng
giá trị của tín hiệu được gửi mỗi ngày. Người
ta tiến hành kiểm tra giả thiết này bằng cách gửi 5
tín hiệu một cách độc lập trong ngày thì thấy giá trị
trung bình nhận được tại địa điểm B là .Với
độ tin cậy 95%, hãy kiểm tra giả thiết đúng
hay không?
µ
2
σ
=
8
µ
=
9,5X
=
8
µ
=

0 0
: 8; : 8H H
µ µ
= ≠
Ta có n=5 < 30, độ tin cậy:
1 0,95, 1 0,975
2

α
α
− = − =
Phân vị chuẩn:
0,975
1,96u =
Miền bác bỏ là:
(
] [
)
W ; 1,96 1,96;
α
= −∞ − ∪ +∞
Giá trị quan sát:
0
0
9,5 8
5 1,68 W
2
x
u n
α
µ
σ


= = = ∉
Kết luận: giả thiết H chấp nhận được

2.2 Trường hợp 2: chưa biết

2
σ
Giả thiết X có phân phối chuẩn
Chọn thống kê

( )
0
'
X
T n
S
µ

=
Nếu H đúng thì
( )
1n
T T


a) Bài toán (1): Với mức ý nghĩa cho trước, ta
xác định phân vị Student (n-1) bậc tự do mức
α
1
2
α

0
0
'

1 1
2 2
W ; ; ;
x
t t t n
S
α α α
µ
− −

   
= −∞ − ∪ +∞ =
 ÷
 
   
+)Nếu thì bác bỏ giả thiết H
( )
0 0
1
2
Wt t t
α α

≥ ∈
+)Nếu thì chấp nhận H
( )
0 0
1
2
Wt t t

α α

< ∉

b) Bài toán (2): Với mức ý nghĩa cho trước, ta
xác định phân vị Student (n-1) bậc tự do mức
α
1
α

[
)
1
W ;t
α α

= +∞
Miền bác bỏ
c) Bài toán (3): Với mức ý nghĩa cho trước, ta
xác định phân vị Student (n-1) bậc tự do mức
α
1
α

Miền bác bỏ
(
]
1
W ; t
α α


= −∞ −

Ví dụ 1: Trọng lượng của các bao gạo là đại lượng
ngẫu nhiên có phân phối chuẩn với trọng lượng
trung bình là 50kg. Sau một khoảng thời gian hoạt
động người ta nghi ngờ trọng lượng của các bao
gạo có sự thay đổi. Cân thử 25 bao gạo thu được
kết quả sau:
X (khối lượng) Số bao
48 - 48,5 2
48,5 - 49 5
49 - 49,5 10
49,5 - 50 6
50 - 50,5 2
Với độ tin cậy 99%,
hãy kết luận về điều
nghi ngờ nói trên.

( ) ( )
( )
0
24
' '
50 25
: 50;
X n X
H T T
S S
µ

µ
− −
= = = ∈
Khoảng
48-48,5
48,5-49
49-49,5
49,5-50
50-50,5
48,25
48,75
49,25
49,75
50,25
2
5
10
6
2
96,5
243,75
492,5
298,5
100,5
4656,125
11882,812
24255,625
14850,375
5050,125
25 1231,75 60695,062

i
x
i
n
i i
n x
2
i i
n x
24
0,995
1 0,995 2,797
2
t
α
− = ⇒ =

(
] [
)
W ; 2,797 2,797;
α
= −∞ − ∪ +∞
Miền bác bỏ:
( )
2
2
'2 '
0
1231,75 60695,06

49,27; 49,27 0,27
25 25
25
0,27 0,2812 0,53
24
49,27 50 25
6,886 W
0,53
X S
S S
t
α
= = = − =
= = ⇒ =

= = ∈
Vậy giả thiết bị bác bỏ, điều nghi ngờ là đúng

Ví dụ 2: Để xác định trọng lượng trung bình
của các bao bột mỳ ta lấy ngẫu nhiên 17 bao
đem cân được kết quả: trọng lượng trung bình

39,8X kg=
'2
0,16S =
Hãy kiểm định giả thiết
: 40 : 40H kg H kg
µ µ
= ≠
Với mức ý nghĩa

0,05
α
=
Tiêu chuẩn kiểm định
( )
( )
0
16
0,05
1
'
; 2,12
n
X n
T T t
S
µ


= ∈ =
(
] [
)
W ; 2,12 2,12;
α
= −∞ − ∪ +∞
0
39,8 40 17
2,06 W
0,4

t
α

= = ∉
Kết luận: chấp nhận giả thiết H

2.3 Trường hợp 3:
Giả thiết và X không chuẩn
30n ≥
Chọn thống kê:
( )
0
'
X n
U
S
µ

=
Nếu H đúng thì
( )
0,1U N∈
a) Bài toán 1:
0
0
'
1 1
2 2
W ; ; ;
x n

u u u
S
α α α
µ
− −

   
= −∞ − ∪ +∞ =
 ÷
 
   
b) Bài toán 2:
[
)
1
W ;u
α α

= +∞

c) Bài toán 3:
(
]
1
W ; u
α α

= −∞ −
Ví dụ: Một nhóm nghiên cứu tuyên bố: trung bình
một người vào siêu thị X tiêu hết 140 ngàn đồng.

Chọn một mẫu ngẫu nhiên gồm 50 người mua
hàng, tính được số tiền họ tiêu là 154 ngàn đồng,
với độ lệch tiêu chuẩn điều chỉnh của mẫu là
. Với mức ý nghĩa 0,02 hãy kiểm định xem tuyên
bố của nhóm có đúng không?
'
62S
=
: 140; 140; 50 30; 1 0,99
2
H H n
α
µ
= ≠ = > − =
(
] [
)
0,99
2,33; W ; 2,33 2,33;u
α
= = −∞ − ∪ +∞
0
0
'
1,59 W
x n
u
S
α
µ


= = ∉

2.4 Kiểm định giả thiết về tỷ lệ (hay xác suất)
Xét phép thử C và biến cố A liên quan: P(A)=p
trong đó p là tham số chưa biết. Có 3 bài toán:
( ) ( ) ( )
0 0 0
0 0 0
: : :
1 2 3
: : :
H p p H p p H p p
H p p H p p H p p
= = =
  
  
  
≠ > <
  
  
Thực hiện n phép thử C trong đó biến cố A xuất
hiện m lần
Tính tỷ lệ là ước lượng điểm cho tham số p
m
f
n
=
Tiêu chuẩn kiểm định:
( )

( )
0
0 0
1
f p n
U
p p

=

Nếu H đúng thì
( )
0,1U N


a) Bài toán 1:
( )
0
: ;H p p≠
1- 1
2 2
W - ;-u ;u
α α α

   
= ∞ ∪ +∞
 ÷
 
   
b) Bài toán 2:

( )
0
: ;H p p>
[
)
1
W ;u
α α

= +∞
c) Bài toán 3:
( )
(
]
0 1
: ; W ;H p p u
α α

< = −∞ −
Ví dụ 1: Tỷ lệ phế phẩm ở một nhà máy là 10%.
Sau khi đã cải tiến kỹ thuật, điều tra 400 sản phẩm
thì thấy 32 phế phẩm. Với độ tin cậy 99% hãy xét
xem việc cải tiến kỹ thuật có làm giảm tỷ lệ phế
phẩm hay không?

Đây là bài toán kiểm định giả thiết về tỷ lệ, với cỡ
mẫu n=400 khá lớn. Gọi p là tỷ lệ phế phẩm của
nhà máy. Ta kiểm định:
: 0,1; : 0,1H p H p= <
Tỷ lệ phế phẩm:

32
0,08
400
f = =
(
]
1
0
1 0,99 2,326
0,08 0,1 400
W ; 2,326 ; 1,333 W
0,1.0,9
u
u
α
α α
α

− = ⇒ =

= −∞ − = = ∉
Kết luận: Chấp nhận H và việc cải tiến có hiệu quả

Ví dụ 2: Một nhà sản xuất thuốc chống dị ứng
thực phẩm tuyên bố rằng 90% người dùng thuốc có
tác dụng trong vòng 8 giờ. Kiểm tra 200 người bị
dị ứng thực phẩm thì thấy trong vòng 8 giờ thuốc
làm giảm bớt dị ứng đối với 160 người. Hãy kiểm
định xem lời tuyên bố trên của nhà sản xuất có
đúng hay không với mức ý nghĩa

0,01
α
=
: 0,9; : 0,9; 0,01H p H p
α
= ≠ =
0,995
1
2
160
2,576; 0,8
200
u u f
α

= = = =
(
] [
)
( )
0
W ; 2,576 2,576; ;
4,75 W
1
f p
u n
p p
α
α
= −∞ − ∪ +∞


= = ∈


2.5 Kiểm định giả thiết về sự bằng nhau giữa hai
trung bình
Giả sử ta có hai mẫu ngẫu nhiên được rút
ra từ ĐLNN X và ĐLNN Y
X Y
W ,W
Bài toán đặt ra là: ta muốn kiểm tra xem hai mẫu
trên có phải được rút ra từ một phân phối hay không?
Ta xét bài toán đơn giản là so sánh 2 giá trị trung
bình EX và EY
2 2
1 2 1 2
; ; ;EX EY DX DY
µ µ σ σ
= = = =
Đặt:
( ) ( )
1 2 1 2
1 2 1 2
: :
1 2
: :
H H
H H
µ µ µ µ
µ µ µ µ

= =
 
 
 
≠ >
 
 
Ta có:

a) Trường hợp 1: Biết
2 2
1 2
,
σ σ
( )
2 2
1 2
1 2
0,1
X Y
U N
n n
σ σ

= ∈
+
Với mức ý nghĩa cho trước, miền bác bỏ của
bài toán 1 là:
1 1
2 2

W ; ;u u
α α α
− −
   
= −∞ − ∪ +∞
 ÷
 
   
Với mức ý nghĩa cho trước, miền bác bỏ của
bài toán 2 là:
α
α
[
)
1
W ;u
α α

= +∞

b) Trường hợp 2: Chưa biết
Trong trường hợp này ta phải giả thiết
( )
2
1 1
,X N
µ σ
:
( )
2

2 2
,Y N
µ σ
:
trong đó

2 2
1 2
σ σ
=
Từ mẫu đã cho tính:
2 2
2 2
1 2 1 2
1 2 1 2
X
, , , ,
2
X Y
X Y
Y
X Y S S t
n S n S n n
n n n n

=
+ +
+ −
Với mức ý nghĩa cho trước, miền bác bỏ
của bài toán 1 là:

α
1 2 1 2
2 2
W ; ;
2 2
n n n n
t t
α
α α
+ − + −
   
   
= −∞ − ∪ +∞
 ÷  ÷
 ÷
 
   
   
2 2
1 2
;
σ σ

Với mức ý nghĩa cho trước, miền bác bỏ của
bài toán 2 là:
α
( )
)
1 2
2

W ;
n n
t
α
α
+ −

= +∞

Ví dụ 1: Trọng lượng sản phẩm do hai nhà máy
sản xuất ra đều là các đại lượng ngẫu nhiên tuân
theo quy luật phân phối chuẩn và cùng có độ lệch
tiêu chuẩn là . Với mức ý nghĩa có
thể xem trọng lượng trung bình của sản phẩm do
2 máy sản xuất ra là như nhau không? Nếu cân 25
sản phẩm của máy I thấy trọng lượng của chúng
là 1250kg, còn 20 sản phẩm của máy II có trọng
lượng1012kg
1kg
σ
=
0,05
α
=

Gọi trọng lượng sản xuất ra ở máy I,II là XvàY
Theo giả thiết D(X)=D(Y)=1
Đây là bài toán kiểm định giả thiết về 2 kỳ vọng
trong phân phối chuẩn, trường hợp đã biết phương
sai

( ) ( ) ( ) ( )
: :H E X E Y H E X E Y
= ≠
0
50 50,6
1250 1012
X 50; 50,6; 2
25 20
1 1
25 20
Y u

= = = = = =
+
(
] [
)
1
2
0,05 1,96; W ; 1,96 1,96;u
α α
α

= ⇒ = = −∞ − ∪ +∞
Kết luận: bác bỏ giả thiết H
( ) ( ) ( ) ( )
: :H E X E Y H E X E Y
= ≠
( ) ( ) ( ) ( )
: :H E X E Y H E X E Y

= ≠

×