Chương 8
KIỂM ĐỊNH GIẢ THIẾT
THỐNG KÊ
I. KHÁI NIỆM VỀ KIỂM ĐỊNH
GIẢ THIẾT THỐNG KÊ
Giả thiết thống kê là những giả thiết nói về
các tham số, phân phối xác suất hoặc tính độc
lập của các ĐLNN.
Giả thiết thống kê:
Kiểm định giả thiết thống kê:
Việc tìm ra kết luận bác bỏ hay chấp nhận 1
giả thiết đgl kiểm định giả thiết thống kê.
Giả thiết cần kiểm định đgl giả thiết không và
được ký hiệu là H0.
Mệnh đề đối lập với H0 đgl giả thiết đối (đối
thiết) và được ký hiệu là H1.
I. KHÁI NIỆM VỀ KIỂM ĐỊNH
GIẢ THIẾT THỐNG KÊ
Xuất phát từ yêu cầu của bài toán thực tế, ta
nêu ra giả thiết H0 và giả thiết đối của nó.
Chọn mẫu ngẫu nhiên (X1, X2,…, Xn).
Chọn hàm Z = ϕ(X1, X2,…, Xn, θ) sao cho: nếu
H0 đúng thì ta sẽ xác định được quy luật PPXS
của Z. ĐLNN Z đgl tiêu chuẩn kiểm định.
Khi đó với 1 số dương α bé tùy ý, ta tìm được 1
miền Wα sao cho: P(Z ∈ Wα) = α (tức là biến
cố (Z ∈ Wα) có xác suất rất nhỏ).
Phương pháp kiểm định giả thiết thống kê:
I. KHÁI NIỆM VỀ KIỂM ĐỊNH
GIẢ THIẾT THỐNG KÊ
Miền Wα đgl miền bác bỏ giả thiết H0. Phần
bù của Wα đgl miền chấp nhận giả thiết H0.
α đgl mức ý nghĩa của kiểm định.
Thực hiện 1 phép thử, ta thu được mẫu cụ
thể (x1, x2,…, xn). Từ mẫu này ta tính được
giá trị cụ thể của Z (ký hiệu z, gọi là giá trị
thực nghiệm): z = ϕ(x1,x2,…,xn,θ0).
Quy tắc quyết định:
Nếu z ∈ Wα thì ta bác bỏ giả thiết H0.
Nếu z ∉ Wα thì ta chấp nhận giả thiết H0.
Phương pháp kiểm định giả thiết thống kê:
Lưu ý:
•
Do ta chỉ dựa vào mẫu để ra quyết định nên
khi nói “chấp nhận H0” thì điều đó không có
nghĩa là giả thiết H0 đúng mà chỉ có nghĩa là
với số liệu của mẫu ta chưa có đủ cơ sở để
bác bỏ H0.
•
Xét cặp giả thiết: H0: θ = θ0
H1: θ ≠ θ0
⇒ Kiểm định đgl kiểm định hai phía (vì miền
bác bỏ nằm ở 2 phía của miền chấp nhận,
tương ứng với 2 trường hợp θ < θ0 và θ > θ0).
I. KHÁI NIỆM VỀ KIỂM ĐỊNH
GIẢ THIẾT THỐNG KÊ
Lưu ý:
•
Kiểm định phía trái: H0: θ = θ0
H1: θ < θ0
•
Kiểm định phía phải: H0: θ = θ0
H1: θ > θ0
Hai loại kiểm định này được gọi chung là
kiểm định một phía.
I. KHÁI NIỆM VỀ KIỂM ĐỊNH
GIẢ THIẾT THỐNG KÊ
H0
Đúng
Sai
Đúng
Sai
Đúng
Sai
Sai lầm
I. KHÁI NIỆM VỀ KIỂM ĐỊNH
GIẢ THIẾT THỐNG KÊ
Sai lầm loại I: là sai lầm mắc phải khi ta bác
bỏ một giả thiết trong khi thực tế giả thiết đó
đúng.
Xét xác suất mắc phải sai lầm loại I đối với
H0: đó là xác suất để Z thuộc miền bác bỏ Wα
khi H0 đúng (P(Z ∈ Wα)) ⇒ xác suất mắc phải
sai lầm loại I chính là mức ý nghĩa α.
Sai lầm loại I và sai lầm loại II:
Sai lầm loại II: là sai lầm mắc phải khi ta
chấp nhận một giả thiết trong khi thực tế giả
thiết đó sai.
I. KHÁI NIỆM VỀ KIỂM ĐỊNH
GIẢ THIẾT THỐNG KÊ
Xét xác suất mắc phải sai lầm loại II đối với
H0: đó là xác suất để Z không thuộc miền bác
bỏ Wα khi H0 sai ⇒ Đặt xác suất này là β.
Khi đó (1 - β) đgl lực của kiểm định.
Sai lầm loại I và sai lầm loại II:
Nhận xét: α↓ ⇒ β↑
α↑ ⇐ β↓
Người ta thường ấn định mức ý nghĩa α khá
nhỏ, khi đó chọn tiêu chuẩn kiểm định Z và
miền bác bỏ tương ứng sao cho β nhỏ đến
mức có thể được.
II. KIỂM ĐỊNH GIẢ THIẾT VỀ
TỶ LỆ TỔNG THỂ
Xét cặp giả thiết: H0: p = p0
H1: p ≠ p0
Kiểm định hai phía:
Tiêu chuẩn kiểm định được chọn là:
0 2 4 6 8 10 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
α/2
zα/
2
α/2
-
zα/
2
Nếu giả thiết H0
đúng thì:
F - p
Z = ~ N(0,1)
pq
n
0
0 0
F - p
Z = ~ N(0,1)
p q
n
II. KIỂM ĐỊNH GIẢ THIẾT VỀ
TỶ LỆ TỔNG THỂ
Kiểm định hai phía:
Với mức ý nghĩa α, vì Z ~ N(0,1) nên ta tìm
được 1 số zα/2 sao cho:
0 2 4 6 8 10 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
α/2
zα/
2
α/2
-
zα/
2
⇒ Ta chọn miền bác
bỏ là:
(- ∞; - zα/2)∪(zα/2; +
∞)
0
α/2 α/2
0 0
F - p
P(- z z ) = 1 - α
p q
n
≤ ≤
II. KIỂM ĐỊNH GIẢ THIẾT VỀ
TỶ LỆ TỔNG THỂ
Kiểm định hai phía:
Từ đó ta có quy tắc quyết định:
0 2 4 6 8 10 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
α/2
zα/
2
α/2
-
zα/
2
•
B3: Nếu z ∈ (- ∞; - zα/2)∪(zα/2; + ∞) ⇒ Bác
bỏ H0.
Ngược lại thì chấp nhận H0.
•
B1: Tính:
•
B2: Từ mức ý nghĩa
α ⇒ Tìm zα/2.
0
0 0
f - p
z =
p q
n
II. KIỂM ĐỊNH GIẢ THIẾT VỀ
TỶ LỆ TỔNG THỂ
Xét cặp giả thiết: H0: p = p0
H1: p > p0
Kiểm định phía phải:
Làm tương tự, ta có quy tắc quyết định:
0 2 4 6 8 10 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
α
zα
•
B3: Nếu z ∈ (zα; + ∞) ⇒ Bác bỏ H0.
Ngược lại thì chấp nhận H0.
•
B1: Tính:
•
B2: Từ mức ý nghĩa
α ⇒ Tìm zα.
⇒ quy tắc kiểm định phía trái?
0
0 0
f - p
z =
p q
n
III. KIỂM ĐỊNH GIẢ THIẾT VỀ
TRUNG BÌNH TỔNG THỂ
Xét cặp giả thiết: H0: θ = θ0
H1: θ ≠ θ0
Kiểm định hai phía:
Tiêu chuẩn kiểm định được chọn là:
0 2 4 6 8 10 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
α/2
zα/
2
α/2
-
zα/
2
Nếu giả thiết H0
đúng thì:
n ≥ 30, σ đã biết :
X - μ
Z = ~ N(0,1)
σ
n
0
X - μ
Z = ~ N(0,1)
σ
n
III. KIỂM ĐỊNH GIẢ THIẾT VỀ
TRUNG BÌNH TỔNG THỂ
Kiểm định hai phía:
Từ đó ta có quy tắc quyết định:
0 2 4 6 8 10 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
α/2
zα/
2
α/2
-
zα/
2
•
B3: Nếu z ∈ (- ∞; - zα/2)∪(zα/2; + ∞) ⇒ Bác
bỏ H0.
Ngược lại thì chấp nhận H0.
•
B1: Tính:
•
B2: Từ mức ý nghĩa
α ⇒ Tìm zα/2.
n ≥ 30, σ đã biết :
0
x - μ
z =
σ
n
III. KIỂM ĐỊNH GIẢ THIẾT VỀ
TRUNG BÌNH TỔNG THỂ
Kiểm định hai phía:
Tiêu chuẩn kiểm định được chọn là:
0 2 4 6 8 10 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
α/2
zα/
2
α/2
-
zα/
2
Nếu giả thiết H0
đúng thì:
n ≥ 30, σ chưa biết :
X - μ
Z = ~ T(n - 1) N(0,1)
S
n
≈
0
X - μ
Z = ~ N(0,1)
S
n
III. KIỂM ĐỊNH GIẢ THIẾT VỀ
TRUNG BÌNH TỔNG THỂ
Kiểm định hai phía:
Từ đó ta có quy tắc quyết định:
0 2 4 6 8 10 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
α/2
zα/
2
α/2
-
zα/
2
•
B3: Nếu z ∈ (- ∞; - zα/2)∪(zα/2; + ∞) ⇒ Bác
bỏ H0.
Ngược lại thì chấp nhận H0.
•
B1: Tính:
•
B2: Từ mức ý nghĩa
α ⇒ Tìm zα/2.
n ≥ 30, σ chưa biết :
0
x - μ
z =
s
n
III. KIỂM ĐỊNH GIẢ THIẾT VỀ
TRUNG BÌNH TỔNG THỂ
Kiểm định hai phía:
Làm tương tự, ta có quy tắc quyết định:
0 2 4 6 8 10 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
α/2
zα/
2
α/2
-
zα/
2
•
B3: Nếu z ∈ (- ∞; - zα/2)∪(zα/2; + ∞) ⇒ Bác
bỏ H0. Ngược lại thì chấp nhận H0.
•
B1: Tính:
•
B2: Từ mức ý nghĩa
α ⇒ Tìm zα/2.
n < 30, σ đã biết và ĐLNN gốc X có phân
phối chuẩn:
0
x - μ
z =
σ
n
III. KIỂM ĐỊNH GIẢ THIẾT VỀ
TRUNG BÌNH TỔNG THỂ
Kiểm định hai phía:
Tiêu chuẩn kiểm định được chọn là:
Nếu giả thiết H0
đúng thì:
n < 30, σ chưa biết và ĐLNN gốc X có phân
phối chuẩn:
0 2 4 6 8 10 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
α/2
tα/2
α/2
-
tα/2
X - μ
Z = ~ T(n - 1)
S
n
0
X - μ
Z = ~ T(n - 1)
S
n
III. KIỂM ĐỊNH GIẢ THIẾT VỀ
TRUNG BÌNH TỔNG THỂ
Kiểm định hai phía:
Ta có quy tắc quyết định:
•
B3: Nếu z ∈ (- ∞; - tα/2)∪(tα/2; + ∞) ⇒ Bác
bỏ H0. Ngược lại thì chấp nhận H0.
•
B1: Tính:
•
B2: Từ mức ý nghĩa
α ⇒ Tìm tα/2.
n < 30, σ chưa biết và ĐLNN gốc X có phân
phối chuẩn:
0 2 4 6 8 10 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
α/2
tα/2
α/2
-
tα/2
0
x - μ
z =
s
n
IV. KIỂM ĐỊNH GIẢ THIẾT VỀ QUY
LUẬT PHÂN PHỐI XÁC SUẤT CỦA
ĐẠI LƯỢNG NGẪU NHIÊN
Giả sử ĐLNN X có hàm phân phối xác suất
F(x) chưa biết.
Ta cần kiểm định giả thiết: H0: F(x) = F*(x)
với F*(x) là 1 hàm phân phối xác suất cụ thể
nào đó.
Thực hiện n phép thử độc lập. Khi đó:
Tần số lý thuyết của biến cố (X = xi) sẽ là
nPi (với Pi = P(xi ≤ X ≤ xi + 1) hoặc Pi =
P(X=xi) (i = 1, 2,…, k)).
Tần số thực tế của biến cố (X = xi) là ni.
IV. KIỂM ĐỊNH GIẢ THIẾT VỀ QUY
LUẬT PHÂN PHỐI XÁC SUẤT CỦA
ĐẠI LƯỢNG NGẪU NHIÊN
Với n khá lớn thì χ2 ~ χ2(k – r – 1), với r là số tham số
chưa biết tương ứng với PPXS của X nếu H0 đúng (các
tham số này phải được ước lượng bằng phương pháp
hợp lý cực đại).
Chọn tiêu chuẩn kiểm định:
Với mức ý nghĩa α, miền bác bỏ giả thiết H0
là: Wα = (χ2α ; + ∞).
2
k
2
i i
i = 1
i
(n - nP )
χ =
nP
∑
IV. KIỂM ĐỊNH GIẢ THIẾT VỀ QUY
LUẬT PHÂN PHỐI XÁC SUẤT CỦA
ĐẠI LƯỢNG NGẪU NHIÊN
Từ đó ta có quy tắc quyết định:
•
B3: Nếu χ2 ∈ (χ2α(k – r – 1); + ∞) ⇒ Bác bỏ
H0.
Ngược lại thì chấp nhận H0.
•
B1: Tính:
•
B2: Từ mức ý nghĩa α ⇒ Tìm χ2α(k – r – 1).
2
k
2
i i
i = 1
i
(n - nP )
χ =
nP
∑
V. KIỂM ĐỊNH GIẢ THIẾT VỀ
TÍNH ĐỘC LẬP
Giả sử quan sát đồng thời 2 dấu hiệu A và B
trên cùng 1 phần tử.
Dấu hiệu A có các dấu hiệu thành phần là
A1, A2,…, Ah.
Dấu hiệu B có các dấu hiệu thành phần là
B1, B2,…, Bk.
Ta cần kiểm định giả thiết:
H0: A và B độc lập;
H1: A và B không độc lập.
Lấy mẫu kích thước n và trình bày kết quả
quan sát dưới dạng bảng:
V. KIỂM ĐỊNH GIẢ THIẾT VỀ
TÍNH ĐỘC LẬP
Gọi Ci là biến cố chọn được phần tử mang dấu
hiệu Ai; Dj là biến cố chọn được phần tử mang
dấu hiệu Bj;
Nếu H0 đúng, tức là A và B độc lập thì các dấu
hiệu Ai, Bj cũng độc lập ⇔ Ci, Dj cũng độc lập.
B1 B2 … Bk Tổng
A1 n11 n12 … n1k n1
A2 n21 n22 … n2k n2
… … … … … …
Ah nh1 nh2 … nhk nh
Tổng m1 m2 … mk n
B
A
V. KIỂM ĐỊNH GIẢ THIẾT VỀ
TÍNH ĐỘC LẬP
B1 B2 … Bk Tổng
A1 n11 n12 … n1k n1
A2 n21 n22 … n2k n2
… … … … … …
Ah nh1 nh2 … nhk nh
Tổng m1 m2 … mk n
B
A
Ci, Dj độc lập
ij j
i
i j i j
n m
n
P(C D ) = ; P(C ) = ; P(D ) =
n n n
ij j
i
n m
n
.
n n n
⇔ =