Tải bản đầy đủ (.pdf) (87 trang)

bài giảng xác suất thống kê ( 7.kiểm định giả thuyết thống kê )

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.19 MB, 87 trang )

Bài 7

KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ

Thursday, February 09, 2017

1


Mục tiêu
Cung cấp kiến thức về lý thuyết kiểm định để
sinh viên có thể phân biệt và giải các dạng bài toán về kiểm
định như:








Kiểm định giá trị trung bình.
Kiểm định tỷ lệ.
Kiểm định phương sai
Kiểm định hiệu hai trung bình.
Kiểm định hiệu hai tỷ lệ
Kiểm định tính độc lập

Thursday, February 09, 2017

2




Giới thiệu bài toán kiểm định
Cần khảo sát tuổi trung bình của tổng thể rất nhiều người
(giả thiết đưa ra là 40 tuổi)
(Null Hypothesis:
H0: m = 40 )

Population
Với kết quả khảo sát được, ta có thể đánh giá giả
thiết đưa ra là đúng hay sai.
• Nên chấp nhận hay
bác bỏ ?
• Độ tin cậy của quyết
định trên ?

Lấy ra 1 mẫu
ngẫu nhiên để
khảo sát

Kết quả khảo sát:

=

Sample


Nội dung

1


• Các khái niệm

2

• Các phương pháp kiểm định

3

• Kiểm định tham số

4

• Kiểm định phi tham số

Thursday, February 09, 2017

4


Các khái niệm
• Giả thiết thống kê
• Đặt giả thiết thống kê
• Sai lầm và mức ý nghĩa

Thursday, February 09, 2017

5



Giả thiết thống kê và đặt giả thiết
1. Giả thiết thống kê là các phát biểu nói về tham số của
tổng thể, luật phân phối xác suất của tổng thể hay tính độc
lập của tổng thể.
Có hai loại giả thiết:
Giả thiết (giả thiết không): là giả thiết có dấu bằng (3
trường hợp: = , ≥ , ≤
)
Giả thiết đối : giả thiết ngược lại với

2. Đặt giả thiết: có 3 cách đặt giả thiết thống kê
Kiểm định 2 phía Kiểm định bên trái

: =

: =

: ≠

: <
2/9/2017

Kiểm định bên phải


:

=




:

>
6


Giả thiết thống kê và đặt giả thiết
Ví dụ: Nhà trường tuyên bố chiều cao trung bình của sinh
viên là =
=
cm.
• Chọn một mẫu ngẫu nhiên gồm n sinh viên, thấy chiều cao
trung bình của mẫu =
.
• Vì ̅ < , ta có 2 cách chọn giả thiết :



:
:

<


(kiểm định bên trái)
(kiểm định hai phía).

• Tùy vào yêu cầu cụ thể của bài toán mà ta chọn kiểm định
bên trái hoặc hai phía.

– “Chiều cao TB của sv thấp hơn 165cm?”→ bên trái.
– “Chiều cao TB của sv khác 165cm?” → hai phía.
2/9/2017

7


Ví dụ
Tại một siêu thị, Ban giám đốc siêu thị cho biết số tiền trung
bình một khách hàng sử dụng để mua hàng là 200 ngàn đồng.
Khảo sát 49 khách hàng thấy số tiền trung bình một khách
hàng sử dụng để mua hàng là 180 ngàn đồng, độ lệch chuẩn
của mẫu là 30 ngàn đồng.
Với mức ý nghĩa 3%, xét xem nguồn tin từ Ban giám đốc có
hợp lý không?


Ví dụ
Sức chịu lực của các sợi cáp do một công ty sản xuất có sức
chịu lực trung bình là 1.800 kg và độ lệch chuẩn 100 kg.
Một kỹ thuật mới được áp dụng vào quy trình sản xuất khẳng
định rằng sức chịu lực trung bình của các sợi cáp tăng lên.
Để kiểm định lời khẳng định này, người ta kiểm tra một mẫu
gồm 50 sợi cáp và thấy sức chịu lực trung bình là 1.850 kg.
Chúng ta có thể ủng hộ lời khẳng định này ở mức ý nghĩa 0,01
không?


Ví dụ
Trước đây tuổi thọ trung bình của các bóng đèn điện do một

công ty sản xuất là 1.120 giờ với độ lệch chuẩn 125 giờ.
Có ý kiến cho rằng “tuổi thọ trung bình của loại bóng đèn này
giảm so với trước đây.
Kiểm tra một mẫu ngẫu nhiên gồm 8 bóng mới sản xuất thì
thấy tuổi thọ trung bình là 1.070 giờ.
Hãy kiểm định ý kiến trên với mức ý nghĩa 0.05.


Sai lầm và mức ý nghĩa α
• Mục tiêu của kiểm định là thiết kế luật kiểm định sao cho
xác suất phạm phải sai lầm khi đưa ra một quyết định là
nhỏ nhất.
• Hai loại sai lầm:
– Sai lầm loại I: bác bỏ | đúng
– Sai lầm loại II: chấp nhận | sai
• Mức ý nghĩa = xác suất mắc phải sai lầm loại I
(the significance level of the test)
= P(reject
true

2/9/2017

11


Mức ý nghĩa

• Ví dụ: “kiểm định với mức ý nghĩa = 5%”, tức là, cho
phép đưa ra quyết định thống kê với xác suất phạm sai
lầm (loại I) là 5%

• Trong thực tế, người ta hay xét các mức ý nghĩa 10%, 5%,
2% và 1%.
2/9/2017

12


Các phương pháp kiểm định
1. Phương pháp giá trị tới hạn
– Đưa ra quyết định thống kê dựa vào mức ý nghĩa
cho trước.
– So sánh giá trị kiểm định (z hoặc t) với giá trị tới hạn
(zc hoặc tc)

2. Phương pháp giá trị P
– Đưa ra quyết định thống kê dựa vào việc tính toán
giá trị P.
– So sánh p_value vớ

2/9/2017

13


Cách tính giá trị tới hạn zc , tc
Với mức ý nghĩa 

,

giá trị tới hạn


Kiểm định 2 phía

/2

: =165
: ≠

/2
/

0

/

/

=

. .

(

/ )

/

= .

(


/ ,

)

Kiểm định bên trái

: =
: <



Kiểm định bên phải

: =
: >



=

. .

(

= .

(

,


0


Chú ý:

,

là giá trị không âm

)

)


Ví dụ:
Sử dụng Excel để tính toán giá trị zc cho kiểm định 2 phía và 1
phía với các mức ý nghĩa 1% , 2%, 5% và 10%
Với KĐ 2 phía : / =
. .
(
/ )
Với KĐ 1 phía :
=
. .
(
)
Mức ý nghĩa

1%


2%

5%

10%

Độ tin cậy

99%

98%

95%

90%

KĐ 2 phía zc

2.58

2.33

1.96

1.64

KĐ 1 phía zc

2.33


2.05

1.64

1.28

2/9/2017

15


Phương pháp giá trị tới hạn
1. Tính giá trị kiểm định
2. Tính giá trị tới hạn: tùy vào kiểm định 1 phía hay 2 phía
3. So sánh giá trị kiểm định với giá trị tới hạn để đưa ra kết luận.
Quy tắc bác bỏ H0:
• Kiểm định bên trái : z ≤ – (hoặc t ≤
)
• Kiểm định bên phải : z ≥ ( ặ t ≥ )
• Kiểm định 2 phía : nếu z (hoặc t) dương: z ≥
( ặ t≥ )
nếu z (hoặc t) âm: z≤
(hoặc t ≤
)




-zc


Bác bỏ H0 nếu z < -zc
2/9/2017

zc
Bác bỏ H0 nếu z > zc

/2
-zc

/2
zc

Bác bỏ H0 nếu z < -zc or z > zc
16


Phương pháp dùng giá trị p
• Tính p_value (xác suất tương ứng với giá trị kiểm định)
KĐ bên trái: p_value = P(Z≤-z), KĐ bên phải p_value= P(Z≥ z)
KĐ hai phía: p_value= P(Z≤-z) + P(Z≥z)= 2P(Z≤-z)= 2P(Z≥z)
• So sánh p_value với mức ý nghĩa

để đưa ra quyết định.

 TH chưa biết : Nếu ≤0.01: có cơ sở rất mạnh để bác bỏ H0
Nếu 0.01 ≤

 TH biết :


Nếu

≤0.05: có đủ cơ sở để bác bỏ H0

> 0.05, chưa đủ cơ sở bác bỏ H0

• Nếu ≤ , bác bỏ H0
• Nếu

> , chưa đủ cơ sở bác bỏ H0

Chú ý: p_value là mức
ý nghĩa nhỏ nhất mà
ta có thể bác bỏ


Các bước giải bài toán kiểm định
Bước 1: Xác định giá trị cần quan tâm
Bước 2: Đặt giả thiết H0 và đối thiết H1
Bước 3: Xác định mức ý nghĩa
Sử dụng PP giá trị tới hạn
Bước 4: Thu thập dữ liệu, tính giá trị kiểm định và giá trị tới hạn
Bước 5: So sánh giá trị kiểm định với giá trị tới hạn -> kết luận
Sử dụng p_value
Bước 4: Thu thập dữ liệu, tính giá trị kiểm định.
Dùng giá trị kiểm định tính p_value
Bước 5: Bác bỏ H0 nếu p_value ≤
2/9/2017

18



Kiểm định tham số

1

• Kiểm định trung bình µ

2

• Kiểm định tỷ lệ p

3

• Kiểm định phương sai

4

• Kiểm định hiệu 2 trung bình

5

• Kiểm định hiệu 2 tỷ lệ

Thursday, February 09, 2017

19


Kiểm định tham số

• Kiểm định trung bình:
Mẫu lớn

Biết

(n≥ 30)

Mẫu nhỏ
(n< 30)







Chưa biết

Kiểm định tỷ lệ
Kiểm định phương sai
Kiểm định hiệu hai trung bình mẫu lớn (n1, n2≥ 30)
Kiểm định hiệu hai trung bình mẫu nhỏ (n1, n2< 30)
Kiểm định hiệu hai tỷ lệ

2/9/2017

20


Kiểm định TB mẫu lớn

), biết

Mẫu lớn, chưa biết :
Thay bởi s. Làm
• Đặt giả thiết
Kiểm định 2 phía tương tự mẫu lớn biết
Kiểm định 1 phía
H0: μ = μ0
H0: μ = μ0
H1: µ ≠ m0
H1: µ > m0 hoặc µ < m0
Sử dụng PP giá trị tới hạn:
• Tiêu chuẩn kiểm định =
~ 0,1

Mẫu lớn (n≥

Giá trị kiểm định z =

̅

• Giá trị tới hạn: 1/2– = (

) ⇒z

• So sánh z với zc →Kết luận
Sử dụng PP p_value:
̅
• Giá trị kiểm định z =
• p_value=P(Z > z) hoặc p_value=P(Z < -z)

• So sánh p_value với →Kết luận
2/9/2017

( ) = (1–)/2⇒
P_value=P(Z<-z )+P(Z>z )
=2.P(Z>z )
21


Ví dụ 1: Kiểm định TB 2 phía mẫu lớn
Nhà trường tuyên bố chiều cao trung bình của sinh viên là
=
=
cm.
Chọn một mẫu ngẫu nhiên gồm 100 sinh viên, thấy chiều
cao trung bình của mẫu =
, với độ lệch chuẩn
mẫu à5 .
Với mức ý nghĩa 5%, lời tuyên bố của nhà trường có chính
xác không?

2/9/2017

22


Ví dụ 1: Kiểm định TB 2 phía mẫu lớn


Step 1 : Xác định giá trị cần quan tâm





Ở đây là chiều cao trung bình của toàn thể sinh viên

Step 2: Đặt giả thiết thống kê
: =
: ≠








Step 3: Xác định mức ý nghĩa của kiểm định



Yêu cầu mức ý nghĩa 5% để kiểm định
Nếu ko yêu cầu thì ta thường chọn 1%,2%,5%,10%

2/9/2017

23


Ví dụ 1: Kiểm định TB 2 phía mẫu lớn

• Step 4: Lấy mẫu và tính toán giá trị kiểm định và giá
trị tới hạn cho phù hợp với bài toán:
Ở đây ta lấy mẫu 100 sinh viên =

,

=

, =

Vì mẫu lớn nên ta sẽ sử dụng PP chuẩn
Tính giá trị kiểm định z
=

=

=


Tính giá trị tới hạn

:


=

= .




= .


Ví dụ 1: Kiểm định TB 2 phía mẫu lớn
• Step 5. So sánh z với zc và kết luận

/2 = .025

/2 = .025
0
z

Bác bỏ H0

Không bác bỏ H0

=

Do

=

<

Bác bỏ H0

=1.96
=

=


1.96

.

, ta có cơ sở bác bỏ giả thiết

2

Kết luận: Với mức ý nghĩa 5%, ta bác bỏ giả thiết chiều cao
trung bình của sinh viên là 165cm, nghĩa là lời tuyên bố của nhà
trường chưa chính xác.


×