Tải bản đầy đủ (.pdf) (50 trang)

Bổ đề Neyman Pearson và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (352.41 KB, 50 trang )

Mục lục
Mở đầu 4
Chương 1: Kiến thức chuẩn bị 7
1.1 Bài toán kiểm định giả thiết và các khái niệm mở đầu . . 7
1.2 Các loại sai lầm trong bài toán kiểm định giả thiết và cách
khắc phục . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Một số kiến thức bổ sung về lý thuyết xác suất . . . . . . 9
1.3.1 Tiêu chuẩn ngẫu nhiên . . . . . . . . . . . . . . . 9
1.3.2 Hàm lực lượng . . . . . . . . . . . . . . . . . . . . 10
1.3.3 Tiêu chuẩn mạnh nhất mức α . . . . . . . . . . . . 10
1.3.4 Định lý Fubini . . . . . . . . . . . . . . . . . . . . 10
1.3.5 Một số mệnh đề . . . . . . . . . . . . . . . . . . . 11
Chương 2: Bổ đề Neyman - Pearson 13
2.1 Bổ đề Neyman - Pearson . . . . . . . . . . . . . . . . . . 13
2.2 Hệ quả . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.1 Hệ quả 1 . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.2 Hệ quả 2 . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Bài toán kiểm định giả thiết hợp với đối thiết đơn . . . . 19
2.3.1 Bài toán . . . . . . . . . . . . . . . . . . . . . . . 19
2.3.2 Định nghĩa phân bố ít thuận lợi nhất mức α . . . 19
2.3.3 Định lý . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4 Một số ví dụ minh họa . . . . . . . . . . . . . . . . . . . 21
2.5 Bổ đề Neyman - Pearson mở rộng . . . . . . . . . . . . . 26
Chương 3: Ứng dụng của bổ đề Neyman - Pearson 31
3.1 Kiểm định giả thiết về số trung bình . . . . . . . . . . . . 31
1
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
3.1.1 Bài toán 1: Kiểm định giả thiết về số trung bình khi
phương sai đã biết . . . . . . . . . . . . . . . . . . 31
3.1.2 Bài toán 2: Kiểm định giả thiết về số trung bình khi
phương sai chưa biết . . . . . . . . . . . . . . . . . 34


3.1.3 Bài toán 3: Kiểm định giả thiết về sự bằng nhau
giữa hai giá trị trung bình khi phương sai đã biết . 36
3.1.4 Bài toán 4: Kiểm định giả thiết về sự bằng nhau
giữa hai giá trị trung bình khi phương sai chưa biết 38
3.2 Kiểm định giả thiết về tỉ lệ . . . . . . . . . . . . . . . . . 40
3.2.1 Bài toán 1: Kiểm định về giá trị một tỉ lệ . . . . . 40
3.2.2 Bài toán 2: Kiểm định giả thiết về sự bằng nhau của
hai tỉ lệ . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3 Kiểm định giả thiết về phương sai . . . . . . . . . . . . . 45
3.3.1 Bài toán 1: Kiểm định về giá trị một phương sai . 45
3.3.2 Bài toán 2: Kiểm định giả thiết về sự bằng nhau của
hai phương sai . . . . . . . . . . . . . . . . . . . . . 47
Kết luận 49
Tài liệu tham khảo 50
2
Lời cảm ơn
Để hoàn thành khóa luận tốt nghiệp ngoài sự cố gắng, nỗ lực của bản
thân tôi còn nhận được sự giúp đỡ nhiệt tình của các thầy cô giáo trong
Khoa Toán - Công nghệ - Trường Đại học Hùng Vương đã tận tình chỉ bảo
tôi trong quá trình thực hiện đề tài này.
Nhân dịp này tôi xin gửi lời cảm ơn chân thành nhất tới cô giáo Bùi Thị
Thu Dung - giảng viên Bộ môn Toán Khoa Toán - Công nghệ - Trường Đại
học Hùng Vương, cô đã giành nhiều thời gian quý báu để tận tình hướng
dẫn chỉ bảo tôi trong suốt quá trình làm đề tài, đồng thời cô đã giúp tôi
lĩnh hội những tri thức mới và rèn luyện tác phong nghiên cứu khoa học.
Qua đây, tôi cũng xin gửi lời cảm ơn tới các thầy cô giáo trong Khoa
Toán – Công Nghệ, tới gia đình, bạn bè là những người luôn ủng hộ, quan
tâm, nhiệt tình giúp đỡ, chia sẻ và động viên tôi trong suốt quá trình thực
hiện và hoàn thành đề tài.
Mặc dù đã cố gắng rất nhiều song khóa luận không tránh khỏi những

thiếu sót. Vì vậy tôi rất mong nhận được những ý kiến đóng góp của các
thầy giáo, cô giáo và các bạn sinh viên để khóa luận được hoàn thiện hơn.
Tôi xin chân thành cảm ơn!
Việt Trì, tháng 5 năm 2012
Sinh viên
Dương Văn Long
3
MỞ ĐẦU
1. Lí do chọn đề tài khóa luận
Kiểm định giả thiết thống kê là một lĩnh vực quan trọng và hấp dẫn
trong chuyên ngành lý thuyết xác suất và thống kê. Lời giải cho các lớp bài
toán kiểm định giả thiết thống kê về tham số được trình bày bằng ngôn
ngữ hàm tiêu chuẩn đối với từng lớp có một tiêu chuẩn kiểm định riêng.Ví
như, với lớp bài toán kiểm định giả thiết hợp một phía, ta sử dụng tiêu
chuẩn của tỷ số hợp lý đơn điệu; với lớp bài toán kiểm định giả thiết hợp
trong đoạn ta dùng tiêu chuẩn không chệch mạnh đều nhất; hay với lớp
bài toán kiểm định giả thiết hợp 2 phía ta dùng tiêu chuẩn của họ mũ,
Bổ đề Neyman - Pearson đã chỉ ra cho chúng ta tiêu chuẩn để kiểm
định các bài toán thuộc lớp bài toán kiểm định giả thiết đơn đối với đối
thiết đơn, dạng H
1
: θ = θ
0
/K
1
: θ = θ
1
.
Trong học phần Lý thuyết xác suất và thống kê, sinh viên ngành Toán
và các ngành khác đã được tìm hiểu một số dạng bài toán thuộc lớp bài

toán kiểm định giả thiết đơn đối với đối thiết đơn như: Bài toán kiểm định
về số trung bình, bài toán kiểm định về tỷ lệ, bài toán kiểm định về phương
sai. Tuy nhiên trong tất cả các giáo trình mới chỉ dừng lại ở việc đưa ra
các bước để giải quyết bài toán nêu trên mà chưa chỉ ra nguồn gốc tường
tận của lời giải đó. Do vậy đã gây ra không ít những khó khăn đối với sinh
viên chuyên ngành Toán nói riêng và một số sinh viên muốn đi sâu nghiên
cứu bài toán kiểm định giả thiết thống kê nói chung.
Từ những lí do trên, tôi đã mạnh dạn chọn đề tài: "Bổ đề Neyman
- Pearson và ứng dụng" làm đề tài khóa luận tốt nghiệp của mình với
mong muốn tìm hiểu thêm phương pháp giải cho lớp bài toán kiểm định
giả thiết nêu trên. Đồng thời, khóa luận giúp các bạn sinh viên có mong
muốn cầu thị tìm hiểu sâu về bài toán kiểm định giả thiết có thêm tài liệu
tham khảo trong trường Đại học.
2. Mục tiêu khóa luận
- Trình bày nội dung và chứng minh chi tiết Bổ đề Neyman - Pearson
và Bổ đề Neyman - Pearson mở rộng.
4
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
- Hệ thống hóa một số ứng dụng của Bổ đề Neyman - Pearson trong
việc giải quyết một số dạng bài toán kiểm định giả thiết thống kê.
3. Nhiệm vụ nghiên cứu
- Nghiên cứu Bổ đề Neyman - Pearson và Bổ đề Neyman - Pearson
mở rộng.
- Nghiên cứu ứng dụng của Bổ đề Neyman - Pearson trong việc giải
quyết một số dạng bài toán kiểm định giả thiết thống kê.
4. Phương pháp nghiên cứu
- Phương pháp nghiên cứu lí luận: Nghiên cứu các tài liệu, giáo trình
có liên quan tới Bổ đề Neyman - Pearson và những ứng dụng của Bổ đề.
- Phương pháp tổng kết kinh nghiệm: Tổng hợp và hệ thống hóa các
kiến thức về vấn đề nghiên cứu một cách đầy đủ, khoa học và chính xác.

5. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: Bổ đề Neyman - Pearson và ứng dụng của Bổ
đề.
- Phạm vi nghiên cứu: Ứng dụng của Bổ đề Neyman - Pearson vào
giải quyết một số dạng bài toán kiểm định giả thiết thống kê.
6. Bố cục của khóa luận
- Ngoài phần Mở đầu, Kết luận và Tài liệu tham khảo, nội dung của
khóa luận gồm 3 chương.
Chương 1. Kiến thức chuẩn bị
1.1. Bài toán kiểm định giả thiết và các khái niệm mở đầu
1.2. Các loại sai lầm trong bài toán kiểm định giả thiết và cách khắc
phục
1.3. Một số kiến thức bổ sung về lý thuyết xác suất
Chương 2. Bổ đề Neyman - Pearson
2.1. Bổ đề Neyman - Pearson
2.2. Hệ quả
2.3. Bài toán kiểm định giả thiết hợp với đối thiết đơn
2.4. Một số ví dụ minh họa
2.5. Bổ đề Neyman - Pearson mở rộng
Chương 3. Ứng dụng của Bổ đề Neyman - Pearson
3.1. Kiểm định giả thiết về số trung bình
3.2. Kiểm định giả thiết về tỉ lệ
5
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
3.3. Kiểm định giả thiết về phương sai
7. Ý nghĩa khoa học và thực tiễn
7.1 Ý nghĩa khoa học
- Đề tài khóa luận đã hệ thống hóa một số ứng dụng của Bổ đề Neyman
- Pearson vào giải quyết một số dạng bài toán kiểm định giả thiết thống
kê.

7.2 Ý nghĩa thực tiễn
- Đề tài là tài liệu tham khảo cho giảng viên, sinh viên muốn đi sâu
nghiên cứu về Bổ đề Neyman - Pearson nói riêng và chuyên ngành lý thuyết
xác suất thống kê nói chung.
6
Chương 1
KIẾN THỨC CHUẨN BỊ
1.1 Bài toán kiểm định giả thiết và các khái niệm mở
đầu
Giả sử ta có mẫu ngẫu nhiên (X
1
, X
2
, , X
n
) - các quan sát độc lập
về biến ngẫu nhiên ξ còn F là lớp các hàm phân bố nào đó. Ta chia lớp
F thành hai lớp con F
H
và F
K
= F\F
H
. Biết rằng hàm phân bố F của
biến ngẫu nhiên ξ đang xét thuộc vào lớp F nhưng chưa biết F ∈ F
H
hay
F ∈ F
K
. Ta gọi mệnh đề: “hàm phân bố F thuộc lớp F

H
” là giả thiết H,
còn mệnh đề “hàm phân bố F thuộc lớp F
K
” là đối thiết K. Bài toán đặt
ra là: hãy kiểm tra xem giả thiết H đúng hay đối thiết K đúng?
Nếu lớp F được tham số hóa, tức là F = {F (x, θ), θ ∈ Θ}, trong đó
dạng toán học của hàm F đã biết, θ là tham ẩn chưa biết. Khi đó, ta sẽ đồng
nhất lớp F với không gian tham Θ và giả thiết H : F ∈ F
H
sẽ là θ ∈ Θ
H
,
đối thiết K : F ∈ F
K
sẽ là θ ∈ Θ
K
, trong đó Θ
H
∩Θ
K
= ∅, Θ
H
∪Θ
K
= Θ.
- Nếu Θ
H
gồm chỉ một điểm thì giả thiết H được gọi là giả thiết đơn.
Nếu Θ

H
có nhiều hơn một điểm thì H được gọi là giả thiết hợp.
- Nếu Θ
K
gồm chỉ một điểm thì đối thiết K được gọi là đối thiết đơn.
Nếu Θ
K
có nhiều hơn một điểm thì K được gọi là đối thiết hợp.
Phương pháp chung để giải bài toán kiểm định giả thiết H với đối
thiết K (nói tắt là bài toán kiểm định giả thiết H/K) là:
Xét biến ngẫu nhiên X giả sử X = {(X
1
, X
2
, . . . , X
n
)} là không gian
giá trị của biến ngẫu nhiên X. Ta tìm cách chia X ra làm hai phần: S và
S = X\S. Sau đó ta chọn quyết định theo quy tắc sau:
- Nếu mẫu ngẫu nhiên (X
1
, X
2
, , X
n
) ∈ S thì ta bác bỏ giả thiết H
và chấp nhận đối thiết K.
- Nếu mẫu ngẫu nhiên (X
1
, X

2
, , X
n
) ∈ S ta chấp nhận H hay nói
7
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
chính xác hơn là ta chưa có cơ sở để bác bỏ H và do đó ta có khuynh
hướng chấp nhận H cho đến khi có thông tin mới, như vậy việc bác bỏ H
đáng tin cậy hơn việc chấp nhận H. Miền S tìm được ở trên được gọi là
miền tiêu chuẩn (hoặc miền giới hạn).
1.2 Các loại sai lầm trong bài toán kiểm định giả
thiết và cách khắc phục
Nội dung của bài toán kiểm định giả thiết là dựa vào mẫu quan sát
để lựa chọn một trong hai quyết định: chấp nhận giả thiết H hay phải bác
bỏ nó. Khi đưa ra quyết định chấp nhận hay bác bỏ giả thiết H có thể sẽ
mắc hai loại sai lầm:
Sai lầm loại I: Bác bỏ giả thiết H khi thực chất H đúng.
Sai lầm loại II: Chấp nhận giả thiết H khi thực chất H sai.
Ký hiệu P (S|H) và P(S|K) là xác suất phạm sai lầm loại I và loại
II tương ứng. Người làm thống kê muốn hạn chế cả hai loại sai lầm này,
nghĩa là mong muốn chọn được miền tiêu chuẩn S sao cho cực tiểu hóa
cả hai xác suất phạm sai lầm, tức là chọn S sao cho có thể loại trừ khả
năng phạm cả hai loại sai lầm càng nhiều càng tốt. Song không thể cực
tiểu đồng thời cả hai loại sai lầm khi cỡ mẫu cố định, bởi vì hai xác suất
trên liên hệ với nhau bởi hệ thức:
P (S|K) + P(S|K) = 1; P (S|H) + P (S|H) = 1
Do đó miền tiêu chuẩn S cực tiểu P (S|H) chưa chắc đã cực tiểu
P (S|K) và ngược lại. Hơn nữa miền tiêu chuẩn S = ∅ sẽ có xác suất
phạm sai lầm loại I bằng 0, tức là bé nhất nhưng miền tiêu chuẩn như vậy
ta không xét. Do vậy, có hai phương pháp chọn miền tiêu chuẩn S cũng là

hai cách khắc phục sai lầm trong bài toán kiểm định giả thiết thống kê.
Phương pháp I: Cố định hai mức xác suất phạm sai lầm, chọn miền
S sao cho cỡ mẫu n là cực tiểu.
Phương pháp II: Ta cố định một loại xác suất phạm sai lầm và tìm
miền S sao cho xác suất phạm sai lầm kia đạt giá trị nhỏ nhất. Thông
thường ta cố định xác suất phạm sai lầm loại I: P (S|H) ≤ α tức là cho
giới hạn trên của xác suất phạm sai lầm loại I, ta sẽ chọn miền tiêu chuẩn
S sao cho xác suất phạm sai lầm loại II P (S|K) đạt cực tiểu hay P(S|K)
đạt cực đại. Phương pháp II được sử dụng rộng rãi hơn.
8
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
Cho trước 0 ≤ α ≤ 1, ta chọn miền tiêu chuẩn S sao cho:

P (S|H) ≤ α
P (S|K) đạt cực đại
(1.2.1)
Nếu H = {θ ∈ Θ
H
}, K = {θ ∈ Θ
K
} thì (1.2.1) được viết lại là:



sup
θ∈Θ
H
P
θ
(S) ≤ α

P
θ
(S) với θ ∈ Θ
K
đạt cực đại
(1.2.2)
Khi đó α được gọi là mức ý nghĩa của tiêu chuẩn, α thường được chọn
bằng 0,1;0,05;0,01;0,001; Chọn α bằng bao nhiêu tùy thuộc vào từng bài
toán cụ thể.
1.3 Một số kiến thức bổ sung về lý thuyết xác suất
1.3.1 Tiêu chuẩn ngẫu nhiên
Tiêu chuẩn được đặc trưng bởi hàm ϕ(X) gọi là tiêu chuẩn ngẫu nhiên.
Hàm ϕ(X) gọi là hàm tiêu chuẩn, 0 ≤ ϕ(X) ≤ 1.
Nếu ϕ(X) = ϕ(X
1
, X
2
, , X
n
) chỉ nhận hai giá trị 0 và 1,
ϕ(X) =

1 nếu (X
1
, X
2
, , X
n
) ∈ S
0 nếu (X

1
, X
2
, , X
n
) ∈ S
(1.3.1)
khi đó ϕ(X) được gọi là tiêu chuẩn không ngẫu nhiên hay là hàm chỉ
tiêu của S trên không gian mẫu X với miền tiêu chuẩn S = {X : ϕ(X) = 1}.
Theo phương pháp II, để cực tiểu hóa tổng xác suất phạm sai lầm.
Trước hết ta cố định xác suất phạm sai lầm loại 1, tức là cố định P
θ
(S|H) =
P
θ
(S) = E
θ
ϕ(X) với θ ∈ Θ
H
. Sau đó tìm θ ∈ Θ
K
sao cho: P
θ
(S|K) đạt
cực tiểu.
Vì P
θ
(S|K) + P
θ
(S|K) = 1 ⇒ P

θ
(S|K) = 1 − P
θ
(S|K). Do đó để
P
θ
(S|K) đạt cực tiểu thì P
θ
(S|K) đạt cực đại hay E
θ
ϕ(X), θ ∈ Θ
K
đạt
cực đại vì P
θ
(S|K) = P
θ
(S) = E
θ
ϕ(X) với θ ∈ Θ
K
.
Do vậy bài toán kiểm định giả thiết H/K được phát biểu bằng ngôn
ngữ hàm tiêu chuẩn như sau: Cần chọn tiêu chuẩn ϕ sao cho:

E
θ
ϕ(X) ≤ α, θ ∈ Θ
H
E

θ
ϕ(X) với θ ∈ Θ
K
đạt cực đại
(1.3.2)
9
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
1.3.2 Hàm lực lượng
Đại lượng β
ϕ
(θ) = E
θ
ϕ(X) = P
θ
(S), θ ∈ Θ được gọi là hàm lực lượng
(hay hàm mạnh) của tiêu chuẩn S.
1.3.3 Tiêu chuẩn mạnh nhất mức α
Tiêu chuẩn ϕ mức α để kiểm định giả thiết H đối với đối thiết đơn
K
1
: {θ = θ
1
} cực đại hàm lực lượng β
ϕ

1
) (cực đại theo hàm ϕ(X)) được
gọi là tiêu chuẩn mạnh nhất mức α.
Nghĩa là, miền tiêu chuẩn S được gọi là mạnh nhất mức α nếu thỏa
mãn các điều kiện sau:




sup
θ∈Θ
H
P
θ
(S) ≤ α
P
θ
1
(S) ≥ P
θ
1
(S

), ∀S

là tiêu chuẩn mức α
(1.3.3)
trong đó miền tiêu chuẩn S là đặc trưng của tiêu chuẩn ϕ.
1.3.4 Định lý Fubini
Nếu µ
1
, µ
2
là các độ đo δ - hữu hạn thì với mỗi A ∈ χ
1
⊗ χ

2
các
hàm số x → µ
2
(A
x
), y → µ
1
(A
y
) đo được. Hơn nữa tập µ xác định bởi:
µ
1
⊗µ
2
(A) =


1
µ
2
(A
x
)dµ
1



2
µ

1
(A
y
)dµ
2
là một độ đo δ - hữu hạn thì với
mỗi A ∈ χ
1
⊗ χ
2
thỏa mãn điều kiện µ
1
⊗ µ
2
(A
1
A
2
) = µ
1
(A
1

2
(A
2
),
∀A
1
∈ χ

1
, A
2
∈ χ
2
.
- Định lý Fubini về đổi thứ tự tích phân:
Nếu µ
1
, µ
2
là các độ đo δ - hữu hạn và f là hàm đo được không âm hoặc
µ
1
⊗ µ
2
khả tích thì các hàm số x →

f(x, y)dµ
2
(y), y →

f(x, y)dµ
1
(x).
Hơn nữa:


1
×Ω

2
f(x, y)dµ
1
⊗ µ
2
(x, y) =


1

1
(x)


2
f(x, y)dµ
2
(y)
=


2

2
(y)


1
f(x, y)dµ
1

(x)
10
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
1.3.5 Một số mệnh đề
a. Mệnh đề 1: Nếu X là đặc tính chuẩn N(a, σ
2
), (X
1
, X
2
, , X
n
) là
mẫu ngẫu nhiên độc lập thì:
(i) X =
1
n
n

k=1
X
k
và S
2
độc lập với nhau.
(ii) X ∼ N(a,
σ
2
n
).

(iii)
(n −1)S
2
σ
2
∼ χ
2
(n −1).
Trong đó:
X là trung bình mẫu: X =
1
n
n

i=1
X
i
S
2
là phương sai mẫu hiệu chỉnh: S
2
=
1
n −1
n

i=1
(X
i
− X)

2
Chứng minh
(i) Ta công nhận kết quả này.
(ii) Ta có X ∼ N(a, σ
2
) suy ra ϕ
X
(t) = e
ita−
σ
2
t
2
2
Do mẫu độc lập và tính duy nhất của hàm đặc trưng nên ta có:
ϕ
X
(t) =E

e
itX

= E

e
it
1
n
n


k=1
X
k

= E

n

k=1
e
i
t
n
X
k

=
n

k=1
E

e
i
t
n
X
k

=

n

k=1
ϕ
X
k
(
t
n
)
=
n

k=1

e
i
t
n
a−
σ
2
t
2
2n
2

= e
ita−
σ

2
t
2
2n
Ta có X ∼ N(a, σ
2
), ϕ
X
(t) = e
ita−
σ
2
t
2
2
và ϕ
X
(t) = e
ita−
σ
2
t
2
2n
⇒ X ∼ N(a,
σ
2
n
).
(iii) Từ (ii) suy ra Z =

X − a
σ

n
=

n(X − a)
σ
∼ N(0, 1)
⇒ Z
2
=
n(X − a)
2
σ
2
∼ χ
2
(1).
11
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
Ta lại có:
n

i=1
(X
i
− a)
2
=

n

i=1

(X
i
− X) + (X −a)

2
=
n

i=1
(X
i
− X)
2
+ 2(X −a)
n

i=1
(X
i
− X) + n(X −a)
2
Suy ra:
n

i=1
(X

i
− a)
2
=
n

i=1
(X
i
− X)
2
+ n(X −a)
2
Vậy
n

i=1
(X
i
− a)
2
σ
2
=
n

i=1
(X
i
− X)

2
σ
2
+
n(X − a)
2
σ
2
=
n −1
σ
2
S
2
+ Z
2
Do (i), X và S
2
độc lập nên
n −1
σ
2
S
2
và Z
2
cũng độc lập.
Từ
X
i

− a
σ
∼ N(0, 1) ⇒
(X
i
− a)
2
σ
2
∼ χ
2
(1)
Suy ra
n

i=1
(X
i
− a)
2
σ
2
∼ χ
2
(n)
Vậy
n −1
σ
2
S

2
=
n

i=1
(X
i
− X)
2
σ
2
∼ χ
2
(n −1).
b. Mệnh đề 2:
Nếu (X
1
, X
2
, , X
n
) là mẫu độc lập của đặc tính chuẩn N(a, σ
2
) thì
T =
(X − a)

n
S
∼ T (n − 1).

c. Mệnh đề 3:
Cho (X
1
, X
2
, , X
n
) và (Y
1
, Y
2
, , Y
m
) là các mẫu ngẫu nhiên độc lập
nhau tương ứng của các đặc tính X ∼ N(a
1
, σ
2
), Y ∼ N(a
2
, σ
2
) trên Ω
khi đó F =
S
2
n
S
2
m

có phân phối F (n −1, m − 1).
12
Chương 2
BỔ ĐỀ NEYMAN - PEARSON
2.1 Bổ đề Neyman - Pearson
Giả sử P
0
và P
1
là các phân bố xác suất có mật độ tương ứng là p
0

p
1
đối với độ đo µ nào đó.
1. Để kiểm định giả thiết đơn H
1
: θ = θ
0
với đối thiết đơn K
1
: θ = θ
1

0
= θ
1
), ta tìm được tiêu chuẩn ϕ và hằng số k sao cho:
E
0

ϕ(X) = α, α ∈ [0; 1] (2.1.1)

ϕ(x) =

1 khi p
1
(x) > kp
0
(x)
0 khi p
1
(x) < kp
0
(x)
(2.1.2)
trong đó: E
0
ϕ(X) =

ϕ(x)dP
0
(x) =

ϕ(x)dF (x, θ
0
).
2. Nếu tiêu chuẩn ϕ thỏa mãn (2.1.1) và (2.1.2) với k nào đó thì ϕ là
tiêu chuẩn mạnh nhất mức α để kiểm định giả thiết H
1
/K

1
.
3. Nếu ϕ là tiêu chuẩn mạnh nhất mức α để kiểm định giả thiết H
1
/K
1
thì với k nào đó ϕ thỏa mãn (2.1.2) µ - hầu khắp nơi. ϕ cũng thỏa mãn
(2.1.1) trừ trường hợp tồn tại tiêu chuẩn mức nhỏ hơn α và lực lượng bằng
1.
Chứng minh.
Chứng minh khẳng định 1.
Ta xét ba trường hợp sau:
* Trường hợp 1: α = 0
- Nếu α = 0 thì trong (2.1.2) ta chọn k = +∞ và với quy ước ∞.0 = 0
13
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
ta chỉ rõ ϕ thỏa mãn (2.1.1).
Thực vậy:
E
0
ϕ(X) =1.P
0
{p
1
(X) > +∞p
0
(X)}+ 0.P
0
{p
1

(X) < +∞p
0
(X)}
=P
0
{p
1
(X) > +∞p
0
(X)}
- Nếu p
0
(x) > 0, +∞.p
0
(x) = +∞ thì ta có:
E
0
ϕ(X) = P
0
{p
1
(X) > +∞} = 0
- Nếu p
0
(x) = 0 thì với quy ước trên và để ý rằng:
P
0
{x : p
0
(x) = 0} =


{x:p
0
(x)=0}
p
0
(x)dµ(x) = 0
Ta có:
E
0
ϕ(X) =P
0
{(p
1
(X) > +∞.p
0
(X)) ∩(p
0
(X) = 0)} ≤ P
0
{p
0
(X) = 0}
=0
* Trường hợp 2: α = 1
- Nếu α = 1 ta chọn k = 0 và khi đó:
ϕ(x) =

1 khi p
1

(x) > 0.p
0
(x) = 0
0 khi p
1
(x) < 0
Cho nên E
0
ϕ(X) = P
0
{p
1
(X) > 0} = 1. Nếu E
0
ϕ(X) ≤ 1 thì bổ sung
cho ϕ trong miền p
1
(x) = 0 giá trị nào đó để E
0
ϕ(X) = 1.
* Trường hợp 3: 0 < α < 1
- Ta xác định hàm α(c) như sau:
α(c) = P
0
{p
1
(X) ≥ cp
0
(X)}
Khi tính xác suất theo P

0
ta chỉ xét những tập mà p
0
(x) > 0, vì vậy
α(c) = P
0

p
1
(X)
p
0
(X)
≥ c

hay 1 −α(c) = P
0

p
1
(X)
p
0
(X)
< c

Đây chính là hàm phân bố của biến ngẫu nhiên
p
1
(X)

p
0
(X)
, vì thế α(c) là
hàm không tăng và liên tục trái.
14
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
Ta có:
α(c)−α(c+0) = P
0

p
1
(X)
p
0
(X)
≥ c

−P
0

p
1
(X)
p
0
(X)
> c


= P
0

p
1
(X)
p
0
(X)
= c

α(−∞) = 1, α(+∞) = 0.
Với α cho trước (0 < α < 1) ta xác định c
0
từ hệ thức:
α(c
0
) ≥ α ≥ α(c
0
+ 0)
Và xây dựng tiêu chuẩn ϕ như sau:
ϕ(x) =










1 khi p
1
(x) > c
0
p
0
(x)
α −α(c
0
+ 0)
α(c
0
) −α(c
0
+ 0)
khi p
1
(x) = c
0
p
0
(x)
0 khi p
1
(x) < c
0
p
0
(x)

Số hạng thứ hai có nghĩa khi α(c
0
) = α(c
0
+ 0).
Nếu α(c
0
) = α(c
0
+ 0) thì khi đó P
0
{p
1
(x) = c
0
p
0
(x)} = 0. Do đó ϕ
xác định µ− hầu khắp nơi. Ta chọn hằng số k trong (2.1.2) chính là c
0
.
Bây giờ ta chứng minh ϕ được chọn như trên sẽ thỏa mãn (2.1.1). Thực
vậy:
E
0
ϕ(X) = P
0

p
1

(X)
p
0
(X)
> c
0

+
α −α(c
0
+ 0)
α(c
0
) −α(c
0
+ 0)
P
0

p
1
(X)
p
0
(X)
= c
0

= α(c
0

+ 0) +
α −α(c
0
+ 0)
α(c
0
) −α(c
0
+ 0)
(α(c
0
) −α(c
0
+ 0))
= α(c
0
+ 0) + α −α(c
0
+ 0) = α
Chứng minh khẳng định 2.
Giả sử ϕ là tiêu chuẩn thỏa mãn (2.1.1) và (2.1.2), còn ϕ

là tiêu chuẩn
khác nào đó với E
0
ϕ

(X) ≤ α.
Ký hiệu S
+

= {x : ϕ(x) −ϕ

(x) > 0}, S

= {x : ϕ(x) −ϕ

(x) < 0}.
+ Nếu x ∈ S
+
thì ϕ(x) > 0 suy ra ϕ(x) = 1 (do ϕ(x) = 0 hoặc
ϕ(x) = 1) và p
1
(x) > kp
0
(x).
+ Nếu x ∈ S

suy ra ϕ(x) = 0 và p
1
(x) < kp
0
(x).
Đặt S = S
+
∪ S

, từ những điều trên ta có ϕ − ϕ

và p
1

− kp
0
cùng
dấu hay (ϕ −ϕ

)(p
1
− kp
0
) > 0.
15
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
Ta có:

S
(ϕ −ϕ

)(p
1
− kp
0
)dµ =

S
+
∪S

(ϕ −ϕ

)(p

1
− kp
0
)dµ ≥ 0
Suy ra

(ϕ−ϕ

)p
1
dµ ≥

k(ϕ−ϕ

)p
0
dµ ≥ 0, tức

ϕp
1
dµ ≥

ϕ

p
1

hay E
1
ϕ(X) ≥ E

1
ϕ

(X)
Như vậy ϕ là tiêu chuẩn mạnh nhất.
Chứng minh khẳng định 3.
Để chứng minh khẳng định 3 ta giả sử ϕ là tiêu chuẩn xác định bởi
(2.1.1) và (2.1.2), còn ϕ

là tiêu chuẩn mạnh nhất mức α để kiểm định giả
thiết H
1
/K
1
.
Đặt S = {S
+
∪ S

} ∩ {x : p
1
(x) = kp
0
(x)}, tức là tập những điểm
thuộc miền xác định của ϕ mà trên đó ϕ = ϕ

. Ta phải chứng minh
µ(S) = 0. Giả sử µ(S) > 0, vì (ϕ −ϕ

)(p

1
− kp
0
) > 0 trên S nên

S
+
∪S

(ϕ −ϕ

)(p
1
− kp
0
)dµ =

S
(ϕ −ϕ

)(p
1
− kp
0
)dµ > 0
Từ đó ta có:

(ϕ −ϕ

)p

1
dµ > k

(ϕ −ϕ

)p
0
dµ > 0
Suy ra

ϕp
1
dµ >

ϕ

p
1
dµ hay E
1
ϕ(X) > E
1
ϕ

(X).
Như vậy ϕ mạnh hơn ϕ

. Điều này mâu thuẫn với giả thiết ϕ

mạnh

nhất. Do đó µ(S) = 0, tức là tiêu chuẩn mạnh nhất ϕ

phải thỏa mãn
(2.1.2) µ− hầu khắp nơi. Bây giờ chứng minh ϕ

cũng thỏa mãn (2.1.1)
trừ trường hợp E
0
ϕ

(X) < α và E
1
ϕ

(X) = 1. Thực vậy, nếu E
0
ϕ

(X) < α
và E
1
ϕ

(X) < 1 do ϕ

có dạng (2.1.2) µ− hầu khắp nơi, ta điều chỉnh giá trị
ϕ

trên tập {x : p
1

(x) = kp
0
(x)} và khi đó ta nhận được hoặc E
0
ϕ

(X) = α
hoặc E
1
ϕ

(X) = 1. Bổ đề cơ bản Neyman - Pearson được chứng minh xong.
2.2 Hệ quả
2.2.1 Hệ quả 1
Giả sử β là lực lượng của tiêu chuẩn mạnh nhất mức α để kiểm định
16
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
giả thiết đơn P = P
0
với đối thiết đơn P = P
1
. Khi đó α < β trừ trường
hợp P
0
= P
1
.
Chứng minh. Ta thấy tiêu chuẩn ϕ(x) ≡ α có mức ý nghĩa bằng α
và có lực lượng bằng α. Do đó α ≤ β (vì β là lực lượng của tiêu chuẩn
mạnh nhất). Giả sử α = β, vì α = β = 1 chỉ sảy ra đối với tiêu chuẩn luôn

luôn không chấp nhận giả thiết trong mọi trường hợp (tiêu chuẩn loại như
thế ta không xét) nên ta xét trường hợp α = β < 1. Nếu α = β thì tiêu
chuẩn ϕ(x) ≡ α là mạnh nhất. Theo khẳng định 3 của định lý 2.1, tiêu
chuẩn này phải thỏa mãn (2.1.2) với k nào đó µ− hầu khắp nơi. Mặt khác
ϕ(x) ≡ α. Vậy ϕ phải có dạng:
ϕ(x) =





1 khi p
1
(x) > kp
0
(x)
α khi p
1
(x) = kp
0
(x)
0 khi p
1
(x) < kp
0
(x)
và µ(p
1
(x) = kp
0

(x)) = 1 xảy ra chỉ với k = 1 (vì 1 =

p
1
dµ(x) =
k

p
0
dµ(x) = k) cho nên µ(p
0
(x) = p
1
(x)) = 1. Điều đó kết thúc chứng
minh hệ quả.
2.2.2 Hệ quả 2
Giả sử W = (X
1
, , X
n
) là mẫu ngẫu nhiên độc lập của đặc tính
X, X ∼ N(θ, σ
2
), σ đã biết.
Tiêu chuẩn W
α
=

X > c
α


là tiêu chuẩn để kiểm định giả thiết:
H : θ = θ
0
≤ θ

/K : θ = θ
1
> θ

, mức ý nghĩa α ∈ (0; 1).
Chứng minh:
Theo bổ đề Neyman - Pearson ta tìm c để xây dựng W
α
từ hệ thức:
p (x
1
, x
2
, , x
n
, θ
1
) ≥ cp(x
1
, x
2
, , x
n
, θ

0
)


1

2πσ

n
exp

n

i=1

(x
i
− θ
1
)
2

2

≥ c

1

2πσ


n
exp

n

i=1

(x
i
− θ
0
)
2

2

⇔ (2πσ
2
)

n
2
exp

n

i=1

(x
i

− θ
1
)
2

2

≥ c(2πσ
2
)

n
2
exp

n

i=1

(x
i
− θ
0
)
2

2

17
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long

⇒ exp


1

2

n

i=1
x
i
2
− 2nXθ
1
+ nθ
1
2


≥ cexp


1

2

n

i=1

x
i
2
− 2nXθ
0
+ nθ
0
2

⇒ exp

nX(θ
1
− θ
0
)
1
σ
2

≥ cexp

n(θ
1
2
− θ
0
2
)
1


2

= c

⇒ nX(θ
1
− θ
0
)
1
σ
2
≥ lnc

⇒ X ≥
σ
2
lnc

n(θ
1
− θ
0
)
= c
α
Miền tiêu chuẩn là: W
α
=


X ∈ Θ : X ≥ c
α

.
* Xác định c
α
:
Vì X
i
∼ N(θ, σ
2
) ⇒ X ∼ N(θ,
σ
2
n
)
Ta có:
P
0
(W
α
) = P
0
(X ≥ c
α
) = α
P
0
là độ đo xác suất trên miền giả thiết H.

Vì X ∼ N(θ
0
,
σ
2
n
) ⇒
X − θ
0
σ

n
∼ N(0, 1)
⇒ P
0

X < c
α

= 1 −α
⇒ P
0



X − θ
0
σ

n

<
c
α
− θ
0
σ

n



= 1 −α
⇒ Φ



c
α
− θ
0
σ

n



= 1 −α ⇒
c
α
− θ

0
σ

n
= Φ
−1
(1 −α)
⇒ c
α
= Φ
−1
(1 −α)
σ

n
+ θ
0
, đặt t
α
= Φ
−1
(1 −α)
⇒ c
α
= t
α
σ

n
+ θ

0
⇒ Miền tiêu chuẩn cần tìm là:
W
α
=

X :
X > t
α
σ

n
+ a
0

.
18
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
2.3 Bài toán kiểm định giả thiết hợp với đối thiết
đơn
2.3.1 Bài toán
Bài toán kiểm định giả thiết hợp đối với đối thiết đơn là bài toán có
dạng:
H
2
: f(x) ∈ {f
θ
(x), θ ∈ Θ}/K
2
: f(x) = g(x)

trong đó f(x), f
θ
(x), g(x) là các mật độ xác suất với độ đo µ nào đó,
lớp {f
θ
(x), θ ∈ Θ} và g(x) hoàn toàn đã biết.
Giả sử λ(θ) là phân bố xác suất trên Θ. Ta sẽ chuyển bài toán kiểm
định giả thiết hợp H
2
với đối thiết đơn K
2
về bài toán kiểm định giả thiết
đơn với đối thiết đơn bằng cách đưa vào “trung bình có trọng lượng” của
các mật độ xác suất f
θ
(x), θ ∈ Θ. Khi đó giả thiết hợp H
2
được thay bằng
giả thiết đơn H
λ
, mà theo giả thiết này mật độ của biến ngẫu nhiên đang
xét được xác định bởi công thức:
h
λ
(x) =

Θ
f
θ
(x)dλ(θ)

Vấn đề đặt ra là chọn phân bố xác suất λ(θ) trên Θ như thế nào? Bởi
vì giả thiết H
2
: f(x) ∈ {f
θ
(x), θ ∈ Θ} không cho lượng tin nào về giá trị
chính xác của θ, mặt khác H
λ
lại cần phải tương đương với H
2
(với quan
điểm đối thiết K
2
), cho nên lẽ tự nhiên ta đòi hỏi phân bố λ là ít thuận
lợi nhất.
2.3.2 Định nghĩa phân bố ít thuận lợi nhất mức α
Giả sử β
λ
là lực lượng cực đại có thể đạt được đối với đối thiết K
2
của
tiêu chuẩn mạnh nhất ϕ
λ
để kiểm định giả thiết H
λ
với đối thiết K
2
. Ta
gọi λ là phân bố ít thuận lợi nhất (với mức α) nếu với mọi phân bố λ


ta
có: β
λ
≤ β
λ

, trong đó: β
λ
= E
θ
ϕ
λ
(X), β
λ

= E
θ
ϕ
λ

(X).
β
λ
là xác suất bác bỏ giả thiết khi giả thiết sai. Vì thế để cho chắc
chắn và khách quan ta sẽ chọn phân bố λ mà β
λ
tương ứng là nhỏ nhất.
Chọn λ như vậy tiêu chuẩn ϕ
λ
được xây dựng sử dụng được thì các tiêu

chuẩn ϕ
λ



= λ) khác lại càng sử dụng tốt hơn. Để thấy rõ hiệu quả
của phương pháp nêu trên, định lý sau chỉ rõ mối quan hệ giữa tiêu chuẩn
mạnh nhất đối với bài toán rút gọn H
λ
/K
2
và tiêu chuẩn mạnh nhất đối
với bài toán ban đầu H
2
/K
2
.
19
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
2.3.3 Định lý
Giả sử trên không gian tham Θ cho σ - trường sao cho mật độ f
θ
(x)
đo được theo toàn bộ các biến θ và x. Giả sử trên σ - trường đó tồn tại
phân bố xác suất λ với tính chất sau: tiêu chuẩn mạnh nhất ϕ
λ
mức α để
kiểm định giả thiết H
λ
/K

2
có mức nhỏ hơn hoặc bằng α đối với giả thiết
ban đầu H
2
: E
θ
ϕ
λ
(X) ≤ α, ∀θ ∈ Θ. Khi đó:
1. Tiêu chuẩn ϕ
λ
là mạnh nhất để kiểm định giả thiết H
2
/K
2
.
2. Nếu ϕ
λ
là tiêu chuẩn mạnh nhất duy nhất mức α để kiểm định giả
thiết H
λ
/K
2
, thì ϕ
λ
cũng là tiêu chuẩn mạnh nhất duy nhất để kiểm định
giả thiết H
2
/K
2

.
3. Phân bố λ là ít thuận lợi nhất.
Chứng minh.
* Chứng minh khẳng định 1:
Áp dụng định lý Fubini ta thấy h
λ
(x) cũng là mật độ đối với độ đo µ:

X
h
λ
(x)dµ(x) =

Θ
dλ(θ)

X
f
θ
(x)dµ(x) = 1
Giả sử ϕ
λ
là tiêu chuẩn mức α đối với giả thiết H
2
, ϕ

là tiêu chuẩn mức
α bất kỳ khác để kiểm định giả thiết H
2
/K

2
, tức là E
θ
ϕ

(X) ≤ α, ∀θ ∈ Θ.
Khi đó:

X
ϕ

(x)h
λ
(x)dµ(x) =

X
ϕ

(x)

Θ
f
θ
(x)dλ(θ)dµ(x)
=

Θ
E
θ
ϕ


(X)dλ(θ) ≤ α
Điều đó có nghĩa rằng ϕ

là tiêu chuẩn mức α đối với giả thiết H
λ
.
Do đó β
ϕ

≤ β
λ
. Vậy ϕ
λ
là tiêu chuẩn mạnh nhất để kiểm định giả thiết
H
2
/K
2
.
* Chứng minh khẳng định 2:
Theo khẳng định 1 để chứng minh khẳng định 2 ta chỉ cần chứng
minh tiêu chuẩn mạnh nhất đối với H
2
/K
2
cũng là mạnh nhất đối với
H
λ
/K

2
. Điều này rõ ràng bởi vì giả sử ϕ là tiêu chuẩn mạnh nhất đối với
H
2
/K
2
, tức là E
θ
ϕ(X) ≤ α, ∀θ ∈ Θ và

X
ϕ(x)g(x)dµ(x) đạt cực đại, thì
theo chứng minh khẳng định 1 ta thấy ϕ cũng có mức α đối với H
λ
/K
2

20
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long

X
ϕ(x)g(x)dµ(x) đạt cực đại, nghĩa là ϕ tiêu chuẩn mạnh nhất mức α đối
với H
λ
/K
2
.
* Chứng minh khẳng định 3:
Để chứng minh λ là phân bố ít thuận lợi nhất ta xét λ


là phân
bố bất kỳ khác trên Θ, ϕ
λ
là tiêu chuẩn được xác định trong định lý,
khi đó ϕ
λ
cũng là tiêu chuẩn mức α để kiểm định H
λ

/K
2
(chứng minh

X
ϕ
λ
(x)h
λ

dµ(x) ≤ α được tiến hành như trong khẳng định 1).
Vì vậy β
λ
=

X
ϕ
λ
(x)g(x)dµ(x) không thể vượt quá β
λ


- lực lượng của
tiêu chuẩn mạnh nhất đối với H
λ

/K
2
, tức là β
λ
≤ β
λ

, ∀λ

.
2.4 Một số ví dụ minh họa
Ví dụ 1: Ta có một mẫu ngẫu nhiên (X
1
, X
2
, , X
n
) được rút ra từ
họ N(θ, 1), X
i
∼ N(θ, 1). Tham ẩn θ chỉ nhận một trong hai giá trị θ
0
hoặc θ
1

1

> θ
0
). Hãy kiểm tra xem θ nhận giá trị nào, tức là bài toán
kiểm định giả thiết H
1
: θ = θ
0
với đối thiết K
1
: θ = θ
1
, mức ý nghĩa α.
Tính các xác suất phạm sai lầm?
Giải:
Vì X
i
độc lập cùng phân bố nên mật độ đồng thời của mẫu là :
p
0
(x) = p(x
1
, x
2
, , x
n
, θ
0
) =
1
(2π)

n
2
exp


1
2
n

i=1
(x
i
− θ
0
)
2

p
1
(x) = p(x
1
, x
2
, , x
n
, θ
1
) =
1
(2π)

n
2
exp


1
2
n

i=1
(x
i
− θ
1
)
2

Theo bổ đề Neyman - Pearson, miền tiêu chuẩn sẽ là:
S = {x : ϕ(x) = 1} = {(x
1
, , x
n
) : p
1
(x) > kp
0
(x)}
=

(x

1
, , x
n
) : exp


1
2
n

i=1
(x
i
− θ
0
)
2

> kexp


1
2
n

i=1
(x
i
− θ
1

)
2

=

(x
1
, , x
n
) : e
nx(θ
1
−θ
0
)
> ke

n
2

2
1
−θ
2
0
)

=

(x

1
, , x
n
) : x >

n
2

2
1
− θ
2
0
) + lnk
n(θ
1
− θ
0
)

= {(x
1
, , x
n
) : x > c}
21
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
Trong đó:
c =


n
2

2
1
− θ
2
0
) + lnk
n(θ
1
− θ
0
)
Với mức α cho trước ta xác định hằng số c, rồi sau đó hằng số k từ
phương trình (2.1.1):
E
0
ϕ(X) = P
0

X > c

= α.
Với giả thiết H
1
thì X
i
∼ N(θ
0

, 1), do vậy X ∼ N(θ
0
,
1
n
). Và từ đó ta
có:
P
0

X > c

= P
0

X − θ
0
1/

n
>
c −θ
0
1/

n

= α
hay
1 −Φ(

c −θ
0
1/

n
) = 1 −Φ((c −θ
0
)

n) = α
trong đó Φ(.) là hàm của phân bố N(0, 1).
Vậy c = θ
0
+ (1/

n)Φ
−1
(1 −α). Giá trị Φ
−1
(1 −α) dễ dàng tìm được
từ bảng phân bố chuẩn.
Như vậy dựa trên mẫu đã cho ta tính được X, với α cho trước từ bảng
phân bố chuẩn ta tìm được c, so sánh X và c. Nếu X > c ta bác bỏ giả
thiết θ = θ
0
và chấp nhận giả thiết nếu X < c. Kết luận như vậy đúng với
xác suất lớn hơn hoặc bằng 1 − α trong trường hợp θ = θ
0
(và sai với xác
suất nhỏ hơn hoặc bằng α).

Để tính các xác suất phạm sai lầm, ta giả sử θ
1
> θ
0
.
Nếu giả thiết H
1
đúng thì X ∼ N(θ
0
,
1
n
). Do đó xác suất phạm sai
lầm loại I là α = P
0
(X > c) còn khả năng đúng khi ta chấp nhận H
1

P
0
(X < c) = 1 − α.
Nếu đối thiết K
1
đúng thì X ∼ N(θ
0
,
1
n
). Khi đó xác suất phạm sai
lầm loại II là: P

1
(X < c) = β còn khả năng đúng khi ta chấp nhận K
1

P
1
(X > c) = 1 − β.
Rõ ràng α càng nhỏ thì β càng lớn và β càng nhỏ thì α lại càng lớn,
nghĩa là sự biến thiên của xác suất phạm sai lầm loại I và xác suất phạm
sai lầm loại II là ngược chiều nhau. Với xác suất phạm sai lầm loại I cố
22
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
định, để giảm xác suất phạm sai lầm loại II ta chọn đối thiết θ
1
cách xa
θ
0
, nghĩa là xác suất sai lầm loại II sẽ giảm khi θ
1
tiến xa θ
0
(vì giả thiết
θ
1
> θ
0
).
Chú ý: Vì DX = DX/n cho nên một cách để làm giảm cả hai xác
suất sai lầm là tăng số quan sát n lên (khi miền tiêu chuẩn X > c không
thay đổi).

Bây giờ ta xét ví dụ cụ thể hơn:
Ví dụ 2. Giả sử ta có mẫu ngẫu nhiên gồm 100 quan sát từ đại lượng
X ∼ N(µ, 25
2
).
1. Hãy chỉ ra miền tiêu chuẩn mạnh nhất để kiểm định giả thiết
H
1
: µ = 36 với đối thiết K
1
: µ = 42, mức ý nghĩa α = 0, 05.
2. Tính xác suất phạm sai lầm loại II.
3. Chỉ rõ xác suất để có các quyết định đúng.
4. Tìm hàm lực lượng.
5. Tính các xác suất sai lầm loại II khi đối thiết K
1
là µ = 39; 40; 45; 50.
6. Tính xác suất sai lầm loại I và loại II đối với H
1
: µ = 36, K
1
: µ = 42
nếu miền tiêu chuẩn S =

X > 38, 5

,

X > 40


,

X > 41

7. Với H
1
: µ = 36, K
1
: µ = 42; S =

X > 40

. Hãy tính xác suất sai
lầm loại I và loại II khi số quan sát tăng từ 100 lên 200.
Giải:
1. Theo phần giải ở ví dụ 1 thì miền tiêu chuẩn mạnh nhất cần tìm
với mức ý nghĩa α = 0, 05 là:
S =

X > c = 36 +
25

100
Φ
−1
(0, 95) = 36 +
1, 65.25
10
= 40, 125


=

X > 40, 125

2. Xác suất phạm sai lầm loại II là:
β = P

X < 40, 125/µ = 42

= P

X − µ
25/

n
<
c −µ
25/

n

= P

X − 42
25/

100
<
c −42
1/


25

= Φ(
40, 125 −42
25/

100
) = Φ(−0, 75)
= 1 −Φ(0, 75)
= 1 −0, 7734 = 0, 2266
3. P

chấp nhậnH
1
|H
1
đúng

= 1 −α = 0, 95
23
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
(hoặc = P

X < 40, 125|µ = 36

= Φ(1, 65) = 0, 95)
P

bác bỏ H

1
|K
1
đúng

= 1 −β = 1 −0, 2266 = 0, 7734
(hoặc = P

X > 40, 125|µ = 42

= 1 −Φ(−0, 75) = 0, 7734)
4. Hàm lực lượng
β(µ) =

α = 0, 05 nếu µ = 36
1 −β = 0, 7734 nếu µ = 42
5. Ta có:
β = P

X < 40, 125|µ = 39

= Φ(
40, 125 −39
25/

100
) = Φ(0, 45) = 0, 6736
β = P

X < 40, 125|µ = 40


= Φ(0, 05) = 0, 5199
β = P

X < 40, 125|µ = 45

= Φ(−1, 95) = 0, 0256
β = P

X < 40, 125|µ = 50

= Φ(−3, 95) = 0, 0001
6. Ta có:
α = P (bác bỏ µ = 36|H
1
đúng ) = P

X > 38, 5|µ = 36

= 1 −Φ(1) = 0, 1587
β = P

X < 38, 5|µ = 42

= Φ(−1, 4) = 0, 0808
α = P

X > 40|µ = 36

= 1 −Φ(1, 6) = 0, 548

β = P

X < 40|µ = 42

= Φ(−0, 8) = 0, 2119
α = P

X > 41|µ = 36

= 1 −Φ(2) = 0, 0228
β = P

X < 41|µ = 42

= Φ(−0, 4) = 0, 3446
7. Ta có:
H
1
: µ = 36/K
1
: µ = 42 và S =

X > 40

, nhưng quan sát n = 200,
khi đó DX = 25
2
/200 ⇒

DX = 25/10


2 = 1, 768.
Do đó (40 −36)/1, 768 = 2, 26 ⇒ Φ(2, 26) = 0, 9881
Vậy xác suất sai lầm loại I là: α = 1 −0, 9881 = 0, 0119
Ta có: (40 −42)/1, 768 = −1, 13 ⇒ Φ(−1, 13) = 0, 1292
Vậy xác suất sai lầm loại II là: β = 0, 1292.
Ta thấy rằng tăng cỡ mẫu từ 100 lên 200, xác suất sai lầm từ loại I
giảm từ 0, 0548 xuống 0, 0119, xác suất sai lầm từ loại II giảm từ 0, 2119
xuống 0, 1292.
Ví dụ 3: Để kiểm tra chất lượng của bóng điện do nhà máy nào đó
sản xuất ra ta lấy một mẫu ngẫu nhiên cỡ n và quan sát về một đặc trưng
24
Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long
nào đó của bóng điện, chẳng hạn thời gian thắp sáng của bóng điện hoặc
độ sáng của bóng điện. Gọi X là thời gian thắp sáng của bóng điện. Bóng
điện được coi là tốt nếu X vượt quá đại lượng u nào đó. Ta muốn kiểm
tra giả thiết H : p ≥ p
0
, trong đó p = P {X ≤ u} là xác suất để bóng điện
bị coi là phế phẩm.
Giải:
Giả sử (X
1
, X
2
, , X
n
) là mẫu ngẫu nhiên cỡ n về đặc trưng X, tức
là các X
i

độc lập cùng phân bố như X. Nhưng phân bố của X ta lại chưa
biết được gì cả. Phân bố của biến ngẫu nhiên X có thể đặc trưng bởi xác
suất p cùng với P

và P
+
là phân bố có điều kiện của đại lượng X với các
điều kiện X ≤ u và X > u tương ứng. Nếu các phân bố P

và P
+
có mật
độ p

và p
+
đối với độ đo µ nào đó (chẳng hạn µ = P

+ P
+
) thì mật độ
đồng thời của mẫu ngẫu nhiên đã cho là:
p
m
(1 −p)
n−m
p

(x
i1

) p

(x
im
)p
+
(x
j1
) p
+
(x
j,n−m
)
trong đó x
i1
, x
i2
, , x
im
≤ u < x
j1
, x
j2
, , x
j,n−m
nghĩa là trong mẫu
đã cho có m sản phẩm hỏng và n − m sản phẩm tốt. Ta có:
P {X < x} =P {(X < x)(X ≤ u)} + P {(X < x)(X > u)}
=P


(x)p + P
+
(x)(1 −p)
=

P

(x)p nếu x ≤ u
P
+
(x)(1 −p) nếu x > u
Từ đó ta có mật độ:
p(x) =

p

(x)p nếu x ≤ u
p
+
(x)(1 −p) nếu x > u
và ta nhận được mật độ đồng thời trên.
Bây giờ ta chọn đối thiết cố định, chẳng hạn p = p
1
với p
1
< p
0
. Khi đó
phân bố ít thuận lợi nhất sẽ là phân bố mà nó tập trung vào (p
0

, P

, P
+
)
với xác suất 1. Do vậy h
λ
sẽ là : (p
0
, P

, P
+
). Vì (p
0
, P

, P
+
) sẽ là phần tử
trong H mà gần đối thiết (p
1
, P

, P
+
) nhất, bởi vì khi phân biệt giữa hai
giả thiết đơn, nếu chúng càng gần nhau thì càng khó phân biệt, còn nếu
chúng càng xa nhau thì càng dễ phân biệt.
Theo định lý 2.3.3 tiêu chuẩn mạnh nhất mức α để kiểm định

H
λ
(p
0
, P

, P
+
) với đối thiết (p
1
, P

, P
+
) sẽ là:
25

×