Tải bản đầy đủ (.pdf) (21 trang)

Bài giảng xác suất thống kê ( Nguyễn Văn Thìn ) - Chương 7 doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (373.5 KB, 21 trang )

Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Bài Giảng Môn học
Xác Suất và Thống Kê
Nguyễn Văn Thìn
Khoa Toán - Tin Học
Đại Học Khoa Học Khoa Học Tự Nhiên Tp.HCM
Ngày 4 tháng 9 năm 2011
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Nội dung
Tập hợp - Giải tích tổ hợp
Biến cố và xác suất
Biến ngẫu nhiên và quy luật phân phối xác suất
Một số biến ngẫu nhiên thông dụng
Lý thuyết mẫu
Ước lượng tham số thống kê
Kiểm định giả thiết thống kê
Kiểm định giả thiết về trung bình của tổng thể.
Kiểm định giả thiết về tỷ lệ của tổng thể.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Bài toán kiểm định giả thiết thống kê.
Định nghĩa (Giả thiết thống kê, kiểm định giả thiết thống kê)
Giả thiết thống kê là những giả thiết nói về các tham số, dạng quy
luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên.
Việc tìm ra kết luận bác bỏ hay chấp nhận một giả thiết gọi là
kiểm định giả thiết thống kê
Ví dụ
Trong một báo cáo nói rằng: thu nhập bình quân của những người
làm trong ngành thư viện ở Việt Nam là 7 triệu đồng một tháng
thì ta có thể coi đó là một giả thiết thống kê, giả thiết này nói về
một tham số (kỳ vọng) của biến ngẫu nhiên X biểu thị mức lương
của những người làm trong ngành thư viện. Dựa vào số liệu của


một mẫu điều tra về thu nhập và quy tắc kiểm định để đưa một
kết luận là bác bỏ hay chấp nhận giả thiết nói trên.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Cách đặt giả thiết.
1 Giả thiết được đặt ra với ý đồ bác bỏ nó, nghĩa là giả thiết đặt
ra ngược lại với điều ta muốn chứng minh,muốn thuyết phục.
2 Giả thiết được đặt ra sao cho khi chấp nhận hay bác bỏ nó sẽ
có tác dụng trả lời mà bài toán thực tế đặt ra.
3 Giả thiết được đặt ra nếu nó đúng thì ta sẽ xác định được qui
luật phân phối xác suất của đại lượng ngẫu nhiên được chọn
làm tiêu chuẩn kiểm định.
4 Khi đặt giả thiết ta thường so sánh cái chưa biết với cái đã
biết. Cái chưa biết là điều mà ta cần kiểm định, kiểm tra, làm
rõ. "Cái đã biết" mà ta nói ở đây thường là những thông tin
quá khứ, các định mức kinh tế, kỹ thuật.
5 Giả thiết đặt ra thường mang ý nghĩa: "không khác nhau",
hoặc "khác mà không có ý nghĩa" hoặc "bằng nhau".
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Giả thiết không và đối thiết
Giả thiết cần kiểm định được gọi là Giả thiết không ký hiệu H
0
.
Một mệnh đề đối lập với H
0
được gọi là Giả thiết đối (Đối thiết)
và được ký hiệu là H
1
.
Ví dụ
H

0
: θ = θ
0
; H
1
: θ = θ
0
Nếu ta kiểm định giả thiết với đối thiết dạng như trên thì kiểm
định được gọi là kiểm định giả thiết hai phía. Nếu kiểm định giả
thiết với đối thiết có dạng H
1
: θ > θ
0
hoặc H
1
: θ < θ
0
thì kiểm
định được gọi là kiểm định giả thiết một phía.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Tiêu chuẩn kiểm định.
Xuất phát từ yêu cầu của bài toán thực tế , ta nêu ra giả thiết H
0
và đối thiết của nó.
Giả sử rằng H
0
đúng, từ đó tìm một biến cố có xác suất đủ bé để
có thể tin rằng biến cố đó hầu như không thể xảy ra trong một
phép thử. Muốn vậy từ mẫu ngẫu nhiên (X
1

, X
2
, , X
n
) ta chọn
Z = f (X
1
, , X
n
, θ
0
) sao cho:
Nếu H
0
đúng thì ta sẽ xác định được quy luật phân phối xác suất
của Z và với mẫu cụ thể ta có thể tính được giá trị của Z. Đại
lượng ngẫu nhiên Z được gọi là Tiêu chuẩn kiểm định giả thiết H
0
.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Miền bác bỏ, mức ý nghĩa.
Do quy luật phân phối xác suất của Z đã biết nên với α bé tùy ý
ta có thể tìm được miền W
α
sao cho P(Z ∈ W
α
) = α. Miền W
α
được gọi là miền bác bỏ giả thiết H
0

và α được gọi là mức ý nghĩa
của kiểm định.
Thực hiện một phép thử đối với mẫu ngẫu nhiên (X
1
, , X
n
) ta
thu được mẫu cụ thể (x
1
, , x
n
). Từ mẫu cụ thể này ta tính được
giá trị của Z (ký hiệu là z) và gọi là giá trị thực nghiệm
z = f (x
1
, , x
n
, θ
0
).
• Nếu z ∈ W
α
thì ta bác bỏ giả thiết H
0
, thừa nhận H
1
.
• Nếu z /∈ W
α
thì ta chấp nhận H

0
.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Sai lầm loại 1 và sai lầm loại 2.
Khi kiểm định giả thiết thống kê, chúng ta có thể mắc phải một
trong hai loại sai lầm sau đây:
a Sai lầm loại 1: Là sai lầm mắc phải khi ta bác bỏ giả thiết H
0
trong khi thực tế thì giả thiết H
0
đúng.
b Sai lầm loại 2: Là sai lầm mắc phải khi ta chấp nhận giả thiết
H
0
trong khi thực tế thì giả thiết H
0
sai.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Quy trình kiểm định.
Quá trình kiểm định giả thiết thống kê được tiến hành theo các
bước sau đây
1 Phát biểu giả thiết không H
0
và đối thiết H
1
. Quyết định dữ
liệu nào cần được thu thập và thu thập dưới các điều kiện
nào. Chọn lựa một kiểm định thống kê (cùng với mô hình
thống kê liên kết với nó) để kiểm định H
0

.
2 Từ một số kiểm định có thể được dùng cho mô hình nghiên
cứu, chọn ra kiểm định thích hợp nhất dựa trên cơ sở là các
điều kiện của nghiên cứu và các giả định cơ sở của kiểm định.
3 Chọn mức ý nghĩa α và kích thước mẫu n.
4 Tìm phân phối mẫu của kiểm định thống kê dưới điều kiện H
0
đúng.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
5 Trên cơ sở (2), (3) và (4) đã trình bày ở trên, xác định miền
bác bỏ của kiểm định thống kê tương ứng.
6 Thu thập dữ liệu. Sử dụng dữ liệu thu được từ mẫu, tính giá
trị của kiểm định. Nếu giá trị của thống kê nằm trong miền
bác bỏ, ta bác giả thiết H
0
, nếu giá trị thu được nằm ngoài
miền bác bỏ, kết luận không thể bác bỏ giả thiết H
0
ở mức ý
nghĩa đã chọn.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Quy trình kiểm định trong bài làm
1 Từ mẫu cụ thể đã cho tính giá trị của các thống kê tương ứng
với tiêu chuẩn kiểm định trong trường hợp tương ứng.
2 Với mức ý nghĩa α cho trước, xác định miền bác bỏ.
3 Kiểm tra giá trị của tiêu chuẩn kiểm định có nằm trong miền
bác bỏ hay không và kết luận.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Kiểm định giả thiết về trung bình của tổng thể.
Bài toán

Cho tổng thể với trung bình µ chưa biết với phương sai có thể đã
biết hoặc chưa biết. Từ mẫu ngẫu nhiên (X
1
, X
2
, , X
n
) hãy kiểm
định
H
0
: µ = m
0
, H
1
: µ = m
0
(µ < m
0
, µ > m
0
)
với mức ý nghĩa α.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Kiểm định giả thiết về trung bình của tổng thể.
Trường hợp kích thước mẫu n ≥ 30 (hoặc n < 30 nhưng X có
phân phối chuẩn), σ
2
đã biết
Chọn thống kê

Z =
¯
X − m
0
σ

n
=

n(
¯
X − m
0
)
σ
làm tiêu chuẩn kiểm định. Nếu giả thiết H
0
đúng thì Z ∼ N(0, 1).
Từ đây ta suy ra miền bác bỏ tương ứng với từng loại đối thiết.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Kiểm định giả thiết về trung bình của tổng thể.
Ta có bảng tóm tắt các loại giả thiết và miền bác bỏ tương ứng.
Giả thiết Miền bác bỏ
H
0
: µ = m
0
W
α
=


z =
¯x−m
0
σ/

n
: z < z
α

H
1
: µ < m
0
H
0
: µ = m
0
W
α
=

z =
¯x−m
0
σ/

n
: z > z
1−α


H
1
: µ > m
0
H
0
: µ = m
0
W
α
=

z =
¯x−m
0
σ/

n
: |z| > z
1−α/2

H
1
: µ = m
0
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Kiểm định giả thiết về trung bình của tổng thể.
Trường hợp kích thước mẫu n ≥ 30, σ
2

chưa biết
Ta có thể dùng ước lượng của Var(X) là S
2
để thay thế cho σ
2
.
Chọn thống kê
Z =
¯
X − m
0
S

n
=

n(
¯
X − m
0
)
S
làm tiêu chuẩn kiểm định. Nếu giả thiết H
0
đúng thì Z ∼ N(0, 1).
Từ đây ta suy ra miền bác bỏ tương ứng với từng loại đối thiết.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Kiểm định giả thiết về trung bình của tổng thể.
Ta có bảng tóm tắt các loại giả thiết và miền bác bỏ tương ứng.
Giả thiết Miền bác bỏ

H
0
: µ = m
0
W
α
=

z =
¯x−m
0
s/

n
: z < z
α

H
1
: µ < m
0
H
0
: µ = m
0
W
α
=

z =

¯x−m
0
s/

n
: z > z
1−α

H
1
: µ > m
0
H
0
: µ = m
0
W
α
=

z =
¯x−m
0
s/

n
: |z| > z
1−α/2

H

1
: µ = m
0
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Kiểm định giả thiết về trung bình của tổng thể.
Trường hợp kích thước mẫu n < 30, σ
2
chưa biết, X tuân theo
quy luật phân phối chuẩn.
Chọn thống kê
T =
¯
X − m
0
S

n
=

n(
¯
X − m
0
)
S
làm tiêu chuẩn kiểm định. Nếu giả thiết H
0
đúng thì
T ∼ T(n − 1) (Phân phối Student với n −1 bậc tự do). Từ đây ta
suy ra miền bác bỏ tương ứng với từng loại đối thiết.

Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Kiểm định giả thiết về trung bình của tổng thể.
Ta có bảng tóm tắt các loại giả thiết và miền bác bỏ tương ứng.
Giả thiết Miền bác bỏ
H
0
: µ = m
0
W
α
=

t =
¯x−m
0
s/

n
: t < t
n−1
α

H
1
: µ < m
0
H
0
: µ = m
0

W
α
=

t =
¯x−m
0
s/

n
: t > t
n−1
1−α

H
1
: µ > m
0
H
0
: µ = m
0
W
α
=

t =
¯x−m
0
s/


n
: |t| > t
n−1
1−α/2

H
1
: µ = m
0
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Kiểm định giả thiết về tỷ lệ của tổng thể.
Bài toán
Cho tổng thể X, trong đó tỷ lệ cá thể mang đặc tính A nào đó là
trong tổng thể là p (p chưa biết). Từ mẫu ngẫu nhiên
(X
1
, X
2
, , X
n
) hãy kiểm định
H
0
: p = p
0
, H
1
: p = p
0

(p < p
0
, p > p
0
)
với mức ý nghĩa α.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Kiểm định giả thiết về tỷ lệ của tổng thể.
Trường hợp kích thước mẫu n ≥ 30 (hoặc n < 30 nhưng X có
phân phối chuẩn, σ
2
đã biết:
Quan sát sự xuất hiện của biến cố "Cá thể mang đặc tính A"
trong n phép thử độc lập. Nếu có m lần xuất hiện biến cố trên thì
tần suất f =
m
n
là một ước lượng điểm của xác suất P(A) = p.
Gọi F là tần số xuất hiện A trong n phép thử thì F ∼ B(1, p).
Gọi (F
1
, , F
n
) là một mẫu ngẫu nhiên của F, khi đó
¯
F =
1
n
n


i=1
F
i
= f
Chọn thống kê
Z =
¯
F − p
0

p
0
q
0
n
=

n(
¯
F − p
0
)

p
0
q
0
làm tiêu chuẩn kiểm định. Nếu giả thiết H
0
đúng thì Z ∼ N(0, 1).

Từ đây ta suy ra miền bác bỏ tương ứng với từng loại đối thiết.
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê
Kiểm định giả thiết về tỷ lệ của tổng thể.
Ta có bảng tóm tắt các loại giả thiết và miền bác bỏ tương ứng.
Giả thiết Miền bác bỏ
H
0
: p = p
0
W
α
=

z =
(f −p
0
)

n

p
0
(1−p
0
)
: z < −z
α

H
1

: p < p
0
H
0
: p = p
0
W
α
=

z =
(f −p
0
)

n

p
0
(1−p
0
)
: z > z
1−α

H
1
: p > p
0
H

0
: p = p
0
W
α
=

z =
(f −p
0
)

n

p
0
(1−p
0
)
: |z| > z
1−α/2

H
1
: p = p
0

×