CHƯƠNG 8
KIỂM ĐỊNH GIẢ THUYẾT
VỀ THAM SỐ CỦA TỔNG THỂ
Ths. Nguyễn Tiến Dũng
Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội
Email:
MỤC TIÊU CỦA CHƯƠNG
● Sau khi học xong chương này, người học sẽ
● Hiểu được kiểm định là gì và biết cách lập cặp giả
thuyết KĐ phù hợp với các bài toán KĐ 2 bên, bên
trái và bên phải
● Nắm được quy trình KĐGT tổng quát
● Kể tên được các chỉ tiêu KĐ với bài toán KĐGT
trên một tổng thể (trung bình, tỷ lệ, phương sai)
● Biết cách xác định xác suất tới hạn để bác bỏ H0
p-value
● Phát biểu và nêu được chỉ tiêu KĐ với các bài toán
KĐGT trên hai tổng thể (trung bình, tỷ lệ, phương
sai)
© Nguyễn Tiến Dũng
Thống kê ứng dụng
2
CÁC NỘI DUNG CHÍNH
8.1 Các vấn đề chung về kiểm định
8.2 KĐ giả thuyết trên một tổng thể
8.3 KĐ giả thuyết trên hai tổng thể
© Nguyễn Tiến Dũng
Thống kê ứng dụng
3
8.1 CÁC VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH
● 8.1.1 Đặt giả thuyết về tham số tổng thể
● Cặp giả thuyết H0 (giả thuyết không) và H1(Ha) (giả
thuyết đối)
● TD1: Một nghiên cứu muốn tìm hiểu mối liên hệ
giữa thời gian tự học và KQ học tập (GPA)
● Giả thuyết NC (nghi vấn khoa học): Giữa thời gian tự học
và GPA có mối liên hệ
● H0: Giữa thời gian tự học và GPA KHÔNG có mối liên hệ
● H1: Giữa thời gian tự học và GPA có mối liên hệ
● Để chứng minh nghi vấn của người NC là đúng, thì
người NC sẽ phải: thu thập DL bác bỏ H0.
© Nguyễn Tiến Dũng
Thống kê ứng dụng
4
● 8.1.2 Một số nguyên tắc liên quan đến việc
đặt giả thuyết
● H0:
● trạng thái bình thường; trạng thái gốc, không có dữ liệu
chứng minh
● phải có dấu bằng, không có liên hệ;
● H1:
● trạng thái ngược lại H0, không có dấu bằng, có liên hệ,
thể hiện nghi vấn của người nghiên cứu
● đòi hỏi dữ liệu, bằng chứng để chứng minh
● Bác bỏ H0 tức chấp nhận H1 là đúng
● TD: Khối lượng gói ngũ cốc µ = 368g
© Nguyễn Tiến Dũng
Thống kê ứng dụng
5
8.1.3 Logic của bài toán kiểm định
● Nếu TB mẫu rất khác so với giá trị cần KĐ thì bằng
trực giác có thể bác bỏ H0 mà không cần KĐ
● Nếu TB mẫu gần với giá trị cần KĐ, cần một quy
tắc nhất quán để bác bỏ H0.
© Nguyễn Tiến Dũng
Thống kê ứng dụng
6
8.1.4 Sai lầm Kiểu I và Sai lầm Kiểu II
● Sai lầm Kiểu I
● Sai lầm alpha
● Alpha = P(Bác bỏ
H0/H0 đúng)
● <Bắt nhầm>
● Giảm alpha Giảm
Sai lầm Kiểu I
Tăng nguy cơ mắc
Sai lầm Kiểu II
● Bác bỏ được H0, chỉ
mắc Sai lầm Kiểu I
© Nguyễn Tiến Dũng
● Sai lầm Kiểu II
● Sai lầm beta
● Beta = P(Chấp nhận
H0/H0 sai)
● <Bỏ sót>
● Hiệu lực của KĐ
● Chấp nhận H0 ->
nguy mắc sai lầm
kiểu II
Thống kê ứng dụng
7
8.1.5 Mức ý nghĩa của KĐ
● 8.1.5 Mức ý nghĩa của KĐ (Significance level)
● Alpha: sai lầm phạm phải khi bác bỏ H0
● CL = (1 – α).100% là độ tin cậy của KĐ
● Giá trị thường dùng: CL = 95% hay α = 0,05
© Nguyễn Tiến Dũng
Thống kê ứng dụng
8
8.1.6 Xác suất tới hạn (p-value)
● Khi giảm α, khoảng ước lượng rộng ra khả
năng bác bỏ H0 giảm
● Xác suất tới hạn p-value = giá trị nhỏ nhất của
α mà tại đó không thể bác bỏ H0 được nữa
H 0 : 368
● TD: n=100; s=10
● α1 = 0,1 (90%) z α1/2= 1,645 H 1 : 368
● α2 = 0,05 (95%) z α2/2= 1,96 x 366, 3
© Nguyễn Tiến Dũng
Thống kê ứng dụng
9
8.1.7 KĐ một bên và KĐ hai bên
H 0 : 0
H1 : 0
Kiểm định bên trái
© Nguyễn Tiến Dũng
H 0 : 0
H1 : 0
Kiểm định hai bên
Thống kê ứng dụng
H 0 : 0
H1 : 0
Kiểm định bên phải
10
8.2 KIỂM ĐỊNH GIẢ THUYẾT TRÊN MỘT TỔNG THỂ
● 8.2.1 KĐGT về TB tổng thể
● 8.2.2 KĐGT về tỷ lệ tổng thể
● 8.2.3 KĐGT về phương sai tổng thể
© Nguyễn Tiến Dũng
Thống kê ứng dụng
11
8.2.1 KĐGT về TB tổng thể
● Quy trình KĐ
1. Lập cặp giả thuyết KĐ H0 và H1 và nhận diện bài toán KĐ
là hai bên, bên trái hay bên phải
2. Chọn mức ý nghĩa a
3. XĐ giá trị tính toán (giá trị thống kê) của chỉ tiêu KĐ: zStat,
tStat … (SGK: ztt, ttt …)
4. Có 2 cách tiếp cận:
●
●
5.
●
●
6.
Cách 1 (Cách tiếp cận giá trị tới hạn): XĐ giá trị tra bảng chỉ tiêu
KĐ: za, za/2, ta, ta/2 ...
Cách 2 (Cách tiếp cận xác suất tới hạn hay p-value): từ chỉ tiêu KĐ
tính -> tính ra p-value.
Áp dụng quy tắc bác bỏ H0 để ra quyết định về việc bác
bỏ hay chấp chận H0
Cách 1: So sánh giá trị tính toán với giá trị tra bảng của chỉ tiêu KĐ
Cách 2: So sánh p-value và a
Kết luận
© Nguyễn Tiến Dũng
Thống kê ứng dụng
12
8.2.1.1 Trường hợp biết phương sai tổng thể
z Stat
● Chỉ tiêu KĐ zStat
● Quy tắc bác bỏ H0 (theo giá trị tới
x 0
/ n
hạn)
H 0 : 0
H1 : 0
z Stat za
© Nguyễn Tiến Dũng
H 0 : 0
H1 : 0
z Stat za / 2
z Stat za / 2
Thống kê ứng dụng
H 0 : 0
H1 : 0
z Stat za
13
8.2.1.2 Trường hợp không biết phương sai tổng thể, cỡ
mẫu lớn (n≥30)
● Chỉ tiêu KĐ chính xác cần là tStat
● Do cỡ mẫu lớn, xấp xỉ t bằng z cho đơn
x 0
giản -> cChỉ tiêu KĐ zStat
● Thay PS tổng thể bằng PS mẫu
● Quy tắc bác bỏ H0
z Stat
H 0 : 0
H1 : 0
Baùc boû H 0 neáu
H 0 : 0
H1 : 0
Baùc boû H 0 neáu
H 0 : 0
H1 : 0
Baùc boû H 0 neáu
z Stat za
z Stat za / 2
z Stat za / 2
z Stat za
© Nguyễn Tiến Dũng
Thống kê ứng dụng
s/ n
14
8.2.1.3 Trường hợp không biết phương sai tổng thể, cỡ
mẫu nhỏ (n< 30)
● Chỉ tiêu KĐ tStat
t Stat
● Quy tắc bác bỏ H0
H 0 : 0
H1 : 0
t t n 1;a
© Nguyễn Tiến Dũng
H 0 : 0
H1 : 0
t tn 1;a / 2
t tn 1;a / 2
Thống kê ứng dụng
x 0
s/ n
H 0 : 0
H1 : 0
t tn 1;a
15
8.2.1.4 Cách tiếp cận p-value trong việc bác bỏ H0
● Tính chỉ tiêu KĐ zStat hoặc tStat (tính)
● Tìm xác suất P tương ứng với bài toán KĐ
(hai bên, bên trái, bên phải). Đó chính là pvalue
● KĐ hai bên: p-value = 2.P(z ≥ |zStat|)
● KĐ bên trái: p-value = P(z ≤ zStat)
● KĐ bên phải: p-value = P(z ≥ zStat)
● So sánh giá trị p-value với α
● Nếu p-value < α thì bác bỏ H0
● Nếu p-value ≥ α thì chấp nhận H0
© Nguyễn Tiến Dũng
Thống kê ứng dụng
16
8.2.2 KĐGT về tỷ lệ tổng thể
● Điều kiện cỡ mẫu đủ lớn:
● np ≥ 5
● n(1-p) ≥ 5
● Chỉ tiêu KĐ
● Quy tắc bác bỏ H0
H 0 : pˆ p0
H 1 : pˆ p0
z Stat za
© Nguyễn Tiến Dũng
z Stat
H 0 : pˆ p0
H 1 : pˆ p0
z Stat za / 2
z Stat za / 2
Thống kê ứng dụng
p p0
p 0 (1 p0 ) / n
H 0 : pˆ p0
H 1 : pˆ p0
z Stat za
17
8.2.3 KĐGT về phương sai tổng thể
● Chỉ tiêu KĐ
2
Stat
( n 1) s 2
● Quy tắc bác bỏ H0
KĐ bên trái
KĐ hai bên
2 02
2
2
0
2 02
2
2
0
2
2
Stat
n 1;1a / 2
2
Stat
© Nguyễn Tiến Dũng
2
n 1;1a
2
Stat
2
0
KĐ bên phải
2 02
2
2
0
2
n 1;a / 2
Thống kê ứng dụng
2
Stat
2
n 1;a
18
Phân phối Chi bình phương
© Nguyễn Tiến Dũng
Thống kê ứng dụng
19
KĐ Chi bình phương
KĐ bên trái
© Nguyễn Tiến Dũng
KĐ hai bên
Thống kê ứng dụng
KĐ bên phải
20
© Nguyễn Tiến Dũng
Thống kê ứng dụng
21
8.3 KĐGT TRÊN HAI TỔNG THỂ
● 8.3.1 KĐGT về chênh lệch của 2 TB tổng thể
● 8.3.2 KĐGT về chênh lệch của 2 tỷ lệ tổng thể
● 8.3.3 KĐGT về tính bằng nhau của 2 phương
sai tổng thể
© Nguyễn Tiến Dũng
Thống kê ứng dụng
22
8.3.1 KĐGT về chênh lệch của hai TB tổng thể
● 8.3.1.1 Trường hợp 2
mẫu độc lập, biết PS
● Giả thuyết KĐ
● Chỉ tiêu KĐ
● Quy tắc bác bỏ H0
H 0 : 1 2 d 0
H 1 : 1 2 d 0
z za
© Nguyễn Tiến Dũng
H 0 : 1 2 d 0
H 1 : 1 2 d 0
z za /2
z z
a /2
Thống kê ứng dụng
z
( x1 x2 ) d 0
12
n1
22
n2
H 0 : 1 2 d 0
H 1 : 1 2 d 0
z za
23
8.3.1.2 Trường hợp 2 mẫu độc lập, không biết PS, cỡ
mẫu lớn
● Thay PS tổng thể bằng PS mẫu
z
H 0 : 1 2 d 0
H 1 : 1 2 d 0
z za
© Nguyễn Tiến Dũng
( x1 x2 ) d 0
s12 s22
n1 n2
H 0 : 1 2 d 0
H 1 : 1 2 d 0
z za /2
z z
a /2
Thống kê ứng dụng
H 0 : 1 2 d 0
H 1 : 1 2 d 0
z za
24
8.3.1.3 Trường hợp 2 mẫu độc lập, không biết phương
sai, cỡ mẫu nhỏ
● Giả định 2 tổng thể có phân phối normal
● Trường hợp A: PS 2 tổng thể bằng nhau
thay 2 PS mẫu bằng 1 PS chung
( n1 1) s ( n2 1) s
s
n1 n2 2
2
1
2
p
tStat
( x1 x2 ) d 0
sp
© Nguyễn Tiến Dũng
2
2
1 1
n1 n2
Thống kê ứng dụng
25