Tải bản đầy đủ (.pptx) (84 trang)

Bài giảng xác suất thống kê kiểm định giả thuyết thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (393.75 KB, 84 trang )

CHƯƠNG 8

KIỂM ĐỊNH
GIẢ THUYẾT THỐNG KÊ

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Bài toán mở đầu
Bài
toán
mở
đầu
buôn muốn xem xét sự ổn

Một hãng
định về
lượng hàng bán được trung bình trên mỗi nhân
viên bán hàng so với những năm trước (lượng đó
bằng 7,4).
Mẫu ngẫu nhiên gồm 40 nhân viên bán hàng
được lựa chọn và thấy lượng hàng trung bình của
họ là 6,1 với độ lệch chuẩn đã hiệu chỉnh s=2,5.
Có thể nói rằng lượng hàng bán trung bình trên
mỗi đầu người có sự thay đổi không?
Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến



Bài toán mở đầu
• Gọi µ là lượng hàng bán trung bình trên mỗi n
hân viên năm nay.
• Ta đặt giả thuyết như sau:
H0: µ không đổi (so với năm ngoái)
H1: µ thay đổi (so với năm ngoái)
• Viết dưới dạng toán học:

 H 0 : µ = 7, 4

 H1 : µ ≠ 7, 4
Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Bài toán mở đầu
Giải
Bước 1. Theo định lý giới
hạn trung tâm
 σ2 
X ~ N  µ, ÷
 n 
Bước 2. Giả sử H0 đúng, nghĩa là µ=7,4
2

σ 
X ~ N  7, 4 ;
÷

n 

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Bài toán mở đầu
Bước 3. Chuẩn hóa:

Giải

X − 7, 4 )
(
Z=

n

σ

~ N ( 0 ;1)

Bước 4. Ta có xác suất sau:

(

)

P Z ≥ 1, 96 = 0, 05
Có nghĩa là nếu H0 đúng thì khả năng |Z|≥1,96

là 5%, rất nhỏ.
Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Bài toán mở đầu
Giải
Bước 5. Với mẫu đã chọn
ta có:
x = 6,1
Z qs

σ ≈ s = 2, 5

6,1 − 7, 4 )
(
=
2, 5

40

n = 40

= −3, 2887

Bước 6. Theo nguyên lý biến cố hiếm ta bác bỏ
giả thuyết H0 (chấp nhận giả thuyết H1) ở mức ý
nghĩa 5%.
Bài giảng Xác suất Thống kê 2014


Nguyễn Văn Tiến


Giải thích nhanh







Đây là bài toán kiểm định giả thuyết tham số.
Tham số cần kiểm định: trung bình tổng thể µ
H0: giả thuyết ; H1: đối thuyết
Z: tiêu chuẩn kiểm định
5%: mức ý nghĩa, ký hiệu: α là mức độ ít xảy ra của Z.
Miền |Z|≥1,96 gọi là miền bác bỏ giả thuyết. Thường ký
hiệu: Wα
• Zqs: giá trị quan sát trên mẫu còn gọi là giá trị kiểm định.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Giả thuyết – Đối thuyết
Giả thuyết:Giả
mộtthuyết-Đối
mệnh đề (một thuyết

câu khẳng định) về

một vấn đề chưa biết nào đó.
Ký hiệu: H0. Giả thuyết là một mệnh đề nên có thể
đúng hoặc không đúng.
Đối thuyết: một mệnh đề trái (xung khắc) với giả
thuyết. Ký hiệu: H1.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Kiểm định giả thuyết
Kiểm lý:
định giả thuyết
Dựa vào 2 nguyên
 Nguyên lý xác suất nhỏ
 Nguyên lý chứng minh phản chứng.
Để kiểm định H0 ta làm như sau:
1. Giả sử rằng H0 đúng
2. Xây dựng một biến cố A có xác suất bé khi H0
đúng (gọi là mức ý nghĩa của phép kiểm
định).
Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Kiểm định giả thuyết

3. Theo nguyên lý xác suất nhỏ thì trong một
lần thử biến cố A sẽ không xảy ra.
4. Vì vậy nếu với một mẫu cụ thể nào đó mà:
 A xảy ra thì giả thiết H0 đúng là vô lý và ta
bác bỏ giả thiết H0.
 A không xảy ra thì ta chưa có cơ sở để bác
bỏ H0.
Biến cố A được chọn theo H1 và được xây
dựng theo tiêu chuẩn kiểm định.
Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Tiêu chuẩn kiểm định (test thống kê)
 Là một biến ngẫu nhiên.
 Được xây dựng trên mẫu ngẫu nhiên và tham
số cần kiểm định. Còn gọi là thống kê mẫu.
 Ký hiệu: Z, T, χ ... (tùy bài toán)
 Tuy nhiên ta ký hiệu chung là Z cho tiện.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Tiêu chuẩn kiểm định
 Chọn mẫu ngẫu nhiên kích thước n:
(X1,X2,…,Xn)
 Xây dựng thống kê Z=Z (X1,X2,…,Xn,θ) , trong

đó θ là tham số liên quan đến giả thuyết cần
kiểm định.
 Nếu H0 đúng thì thống kê Z có qui luật phân
bố xác suất hoàn toàn xác định.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Miền bác bỏ giả thiết
Là miền giá trị của thống kê Z. Ký hiệu: Wα
Với điều kiện H0 đúng, Z nhận giá trị trong miền
Wα với xác suất bằng α.

{

}

P Z ∈ Wα H 0 = α
với α là mức ý nghĩa của kiểm định. Thông thường
là 0,05 hay 0,01.
Lưu ý: có vô số miền bác bỏ Wα thỏa mãn.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Sai lầm loại 1 và sai lầm loại 2

Sai lầm loại 1: bác bỏ H0 khi H0 đúng. Sai lầm
loại 1 sinh ra do kích thước mẫu quá nhỏ, do
cách lấy mẫu…

P ( Z ∈ Wα |H 0 ) = α

Sai lầm loại 2: chấp nhận H0 khi H0 sai. Vậy xác
suất sai lầm loại 2 xác định như sau:

P ( Z ∉ Wα |H1 ) = β
Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Sai lầm loại 1 và sai lầm loại 2
Bác bỏ H0
Chấp nhận H0

H0 đúng
Sai lầm loại 1
Xác suất =α

H0 sai

Sai lầm loại 2
Xác suất=β

Với cỡ mẫu cố định thì:
• Giảm sai lầm loại 1 thì sẽ làm tăng sai lầm loại 2.

• Giảm sai lầm loại 2 thì sẽ làm tăng sai lầm loại 1.
Nếu muốn cả 2 sai lầm này cùng giảm thì chỉ còn cách
tăng cỡ mẫu.
Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Sai lầm loại 1 và sai lầm loại 2
 Giả thiết H0 là quan trọng do đó sai lầm về nó
càng nhỏ càng tốt.
 Cố định xác suất sai lầm loại 1 ở mức ý nghĩa
α.
 Với mẫu kích thước n xác định, ta chọn miền
bác bỏ Wα sao cho xác suất sai lầm loại 2 nhỏ
nhất hoặc chấp nhận được.
 Việc chọn miền bác bỏ tùy thuộc vào từng bài
toán cụ thể.
Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Giá trị quan sát
• Ký hiệu: Zqs; Tqs; χqs.
• Là giá trị của Z tính trên mẫu cụ thể.
Zqs=Z(x1,x2,…,xn,θ)
• Với (x1,x2,…,xn) là giá trị cụ thể của mẫu ngẫu
nhiên (X1,X2,…,Xn) hay mẫu ngẫu nhiên cụ thể.


Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Qui tắc kiểm định giả thuyết
So sánh Zqs với Wα:
 Zqs ∈Wα thì bác bỏ H0; thừa nhận H1.
 Zqs ∉ Wα chưa có cơ sở để bác bỏ H0
(trên thực tế là thừa nhận H0)
Chú ý: không kết luận đúng – sai mà chỉ kết luận
bác bỏ – chấp nhận khi kiểm định giả thuyết.
Đồng thời phải nêu rõ bác bỏ – chấp nhận ở
mức ý nghĩa nào.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Tóm tắt các bước
1. Phát biểu H0 và H1.
2. Lập mẫu ngẫu nhiên kích thước n.
3. Xác định tiêu chuẩn kiểm định Z và phân phối xác
suất của Z với điều kiện H0 đúng.
4. Với mức ý nghĩa α, xác định miền bác bỏ tốt nhất
tùy theo đối thiết H1.
5. Tính giá trị quan sát của Z từ mẫu cụ thể.
6. So sánh giá trị quan sát với miền bác bỏ và kết luận.


Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


KIỂM ĐỊNH TRUNG BÌNH

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến


Ppxs của thống kê TB mẫu
Tổng thể

TB mẫu

Chuẩn,
đã biết σ

 σ2 
X ~ N  µ; ÷
n 


X − µ)
(
Z=

n


~ N ( 0;1)

n>30,
đã biết σ

 σ2 
X ≈ N  µ; ÷
n 


X − µ)
(
Z=

n

~ N ( 0;1)

n>30,
chưa biết σ

 σ2 
X ≈ N  µ; ÷
n 


X − µ)
(
Z=


n

~ t ( n − 1)

Chuẩn, n<30
chưa biết σ

 σ2 
X ~ N  µ; ÷
n 


X − µ)
(
Z=

n

~ t ( n − 1)

Bài giảng Xác suất Thống kê 2014

Chuẩn hóa
σ

σ

S


Nguyễn Văn Tiến

S


Tiêu chuẩn kiểm định
Kiểm định trung bình tổng thể:

X − µ)
(
Z=

n

X − µ)
(
Z=

n

σ

~ N ( 0; 1)

Hoặc:

S

Bài giảng Xác suất Thống kê 2014


~ t ( n − 1)
Nguyễn Văn Tiến


KIỂM ĐỊNH TRUNG BÌNH
 Giả thuyết thống kê.

H 0 : µ = µ0
 Lấy mẫu ngẫu nhiên cỡ n (X1,X2,…,Xn).
 Nếu H0 đúng thì ta có:

X −µ )
(
Z=

n

X −µ )
(
Z=

n

0

σ

0

S


Bài giảng Xác suất Thống kê 2014

: N ( 0;1)
: N ( 0;1)

Nguyễn Văn Tiến


Kiểm định hai phía_TH1,2,3
Bài toán kđ:
BT 1

Miền bác bỏ của Z~N(0;1)

 H 0 : µ = µ0

 H1 : µ ≠ µ0

Mức ý nghĩa: α

(α)
Bác bỏ

Bác bỏ

− t1−α
2




X − µ0 ) n

(


Wα =  Z =
Z > t1−α  vôiù φ  t1−α

σ

2 
 2

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

t1−α
2

 1−α
=
÷
÷
2



Kiểm định một phía_TH1,2,3

Bài toán kđ:
BT 1

 H 0 : µ = µ0

 H1 : µ > µ0

Miền bác bỏ của Z~N(0;1)

(α)
Bác bỏ

Mức ý nghĩa: α
0


X − µ0 ) n

(


Wα =  Z =
Z > t1− 2α  vôùi φ  t1− 2α

σ

2 
 2

Bài giảng Xác suất Thống kê 2014


t1− 2α
2

 1 − 2α
=
÷
÷
2


Nguyễn Văn Tiến


×