Tải bản đầy đủ (.pdf) (95 trang)

các phương pháp kiểm định tham số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (934.3 KB, 95 trang )



i


TRƯỜNG ĐẠI HỌC CẦN THƠ
KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN
XW




LUẬN VĂN TỐT NGHIỆP



CÁC PHƯƠNG PHÁP
KIỂM ĐỊNH THAM SỐ





















GIÁO VIÊN HƯỚNG DẪN
ThS. DƯƠNG TH
Ị TUYỀN
B
Ộ MÔN TOÁN –
KHOA KHTN
SINH VIÊN THỰC HIỆN
PHAN TH
Ị CHINH
MSSV: 1107511

NGÀNH: TOÁN ỨNG DỤNG
C

N THƠ 11/2013


ii

LỜI CẢM ƠN
Lời đầu tiên, em xin gởi lời cảm ơn chân thành đến Th.S Dương Thị Tuyền. Cảm
ơn sự hướng dẫn nhiệt tình và tận tâm của Cô trong suốt thời gian thực hiện luận văn.

Em cũng xin gửi lời cám ơn đến những người Thầy, Cô, đặc biệt là các thầy, cô
trong Bộ môn Toán - Khoa Khoa Học Tự Nhiên đã truyền đạt cho em những kiến thức
nền tảng vô cùng quý báu, đã luôn tạo mọi điều kiện thuận lợi để em hoàn thành tốt
khóa học.
Cuối cùng là lời cám ơn sâu sắc đến gia đình, bạn bè và người thân đã hết lòng
quan tâm, động viên và giúp đỡ em hoàn thành chương trình học tập.
Em xin kính chúc quý Thầy, Cô luôn dồi giàu sức khỏe, luôn thành công trong
công việc và trong cuộc sống.
Trân trọng!
Cần Thơ, ngày 30 tháng 11 năm 2013
Sinh viên

Phan Thị Chinh














iii

MỤC LỤC

Trang
PHẦN MỞ ĐẦU iv
CHƯƠNG 1: KIỂM ĐỊNH THAM SỐ THỐNG KÊ 1
1.1 Sơ lược về bài toán kiểm định giả thiết thống kê 1
1.1.1 Đặt vấn đề 1
1.1.2 Phương pháp kiểm định 1
1.1.3 Sai lầm loại một và sai lầm loại hai 2
1.2 Kiểm định trị trung bình tổng thể 2
1.2.1 Kiểm định giả thiết về trị trung bình của biến ngẫu nhiên có phân phối
chuẩn 2
1.2.1.1 Bài toán 2
1.2.1.2 Các bước thực hành 3
1.2.1.3 Ví dụ 4
1.2.2 Kiểm định so sánh hai trung bình 6
1.2.2.1 Bài toán 6
1.2.2.2 Các bước thực hành 6
1.2.2.3 Các ví dụ 8
1.2.2.4 Kiểm định sự bằng nhau của hai trung bình bằng phương pháp so sánh
cặp đôi (mẫu phối hợp từng cặp) 11
1.3 Kiểm định tỷ lệ 15
1.3.1 Kiểm định giả thiết về tỷ lệ tổng thể 15
1.3.1.1 Bài toán 15
1.3.1.2 Các bước thực hành 15
1.3.1.3 Ví dụ 16
1.3.2 Kiểm định so sánh hai tỷ lệ 17
1.3.2.1 Bài toán 17
1.3.2.2 Các bước thực hành 17
1.3.2.3 Ví dụ 18
1.3.3 Kiểm định giả thiết về nhiều tỷ lệ 19
1.3.3.1 Bài toán 19

1.3.3.2 Các bước tiến hành 19
1.3.3.3 Ví dụ 20
1.4 Kiểm định phương sai 21
1.4.1 Kiểm định giả thiết về phương sai của biến ngẫu nhiên có phân phối chuẩn 21
1.4.1.1 Bài toán 21
1.4.1.2 Các bước thực hành 22
1.4.1.3 Ví dụ 22
1.4.2 Kiểm định so sánh hai phương sai 23


iv

1.4.2.1 Bài toán 23
1.4.2.2 Các bước thực hiện 23
1.4.2.3 Ví dụ 25
1.4.3 Kiểm định K phương sai của K biến ngẫu nhiên có phân phối chuẩn 25
1.4.3.1 Bài toán 25
1.4.3.2 Các bước thực hành 26
1.4.3.3 Ví dụ 27
CHƯƠNG 2: PHÂN TÍCH PHƯƠNG SAI 29
2.1 Phân tích phương sai một nhân tố 29
2.1.1 Bài toán 29
2.1.2 Các bước thực hiện 29
2.1.3 Ví dụ 31
2.2 Phân tích phương sai hai nhân tố 32
2.2.1 Trường hợp hai nhân tố tác động riêng lẽ 33
2.2.2 Trường hợp hai nhân tố tác động tổng hợp 38
CHƯƠNG 3: THỰC HIỆN KIỂM ĐỊNH TRÊN SPSS 46
3.1 Kiểm định trung bình tổng thể 46
3.1.1 Kiểm định giả thiết về trung bình của một tổng thể 46

3.1.2 Kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể 47
3.1.2.1 Kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể - trường
hợp mẫu độc lập 47
3.1.2.2 Kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể - trường
hợp mẫu phụ thuộc hay phối hợp từng cặp 50
3.2 Kiểm định tỷ lệ 53
3.2.1 Kiểm định tỷ lệ của một tổng thể 53
3.2.2 Kiểm định về sự bằng nhau của hai tỷ lệ tổng thể 55
3.2.3 Kiểm định nhiều tỷ lệ tổng thể 57
3.3 Phân tích phương sai 60
3.3.1 Phân tích phương sai một yếu tố (One-Way Anova) 60
3.3.2 Phân tích phương sai hai yếu tố (Two-Way Anova) 67
KẾT LUẬN 79
TÀI LIỆU THAM KHẢO 80
PHỤ LỤC 81






v

PHẦN MỞ ĐẦU
Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các
số liệu thống kê nhằm rút ra các kết luận khoa học và thực tiễn. Chính vì thế mà thống
kê đóng một vai trò cực kỳ quan trọng và không thể thiếu trong các nghiên cứu khoa
học và trong cuộc sống ngày nay.
Kiểm định giả thiết thống kê được coi là một bài toán có ý nghĩa lớn và quan
trọng của thống kê toán học với đa dạng các bài toán liên quan tới dấu hiệu nghiên cứu

trong tổng thể. Trong đó, kiểm định tham số thống kê giải quyết nhanh nhiều bài toán
liên quan đến tham số tổng thể hay dạng phân phối xác suất của tổng thể.
Bên cạnh đó, phân tích phương sai cũng là một kỹ thuật phân tích thống kê khá
nhạy bén. Phân tích phương sai được sử dụng để kiểm định giả thiết về giá trị bình khi
có từ 3 nhóm trở lên. Kỹ thuật này dựa trên mức độ biến thiên trong nội bộ các nhóm
và biến thiên giữa các trung bình nhóm.
Hiện nay, với sự phát triển mạnh mẽ của khoa học máy tính, có rất nhiều phần
mềm phục vụ cho việc phân tích và xử lí số liệu thống kê. Trong đó nổi bật là phần
mềm SPSS với ưu điểm là phần mềm chuyên nghiệp, xử lí nhanh và dễ sử dụng. Vì
thế, SPSS đã lôi cuốn nhiều người sử dụng.
Bắt đầu từ việc muốn hiểu rõ hơn về các phương pháp kiểm định tham số thống
kê, về thủ tục phân tích phương sai, về ứng dụng của SPSS, em chọn đề tài: “Một số
phương pháp kiểm định tham số”.
Luận văn được viết theo quan điểm thực hành, chú trọng việc áp dụng các
phương pháp kiểm định tham số thống kê, phân tích phương sai trong nghiên cứu,
trong thực tiễn hơn là trình bày dưới dạng thuần túy toán học. Mỗi phương pháp kiểm
định đều được minh họa bằng nhiều ví dụ cụ thể ở các lĩnh vực thức tế khác nhau.
 Nội dung của luận văn gồm có 3 chương:
Chương 1: Kiểm định tham số thống kê
Giới thiệu về bài toán kiểm định giả thiết thống kê, các loại kiểm định tham số
thống kê: kiểm định trung bình, kiểm định tỷ lệ và kiểm định phương sai của biến
ngẫu nhiên và cho ví dụ cụ thể trong từng trường hợp.
Chương 2: Phân tích phương sai
Giới thiệu và tóm tắt quá trình phân tích phương sai một yếu tố, phân tích
phương sai hai yếu tố, cho ví dụ minh họa.






vi

Chương 3: Thực hiện trên phần mềm SPSS
Đưa ra các ví dụ về bài toán kiểm định tham số thống kê và phân tích phương sai,
trình bày cách thực hiện trên phần mềm SPSS, phân tích kết quả, so sánh với phương
pháp truyền thống và đưa ra kết luận.
Phần kết luận: Trình bày những nhận xét khái quát về đề tài.
Vì thời gian có hạn và kiến thức bản thân còn nhiều hạn chế nên luận văn còn có
nhiều sai sót. Em rất mong nhận được sự đóng góp, chỉ dẫn của quý thầy cô và các bạn
để luận văn được hoàn thiện hơn.



















1


CHƯƠNG 1: KIỂM ĐỊNH THAM SỐ THỐNG KÊ
1.1 Sơ lược về bài toán kiểm định giả thiết thống kê
1.1.1 Đặt vấn đề
Gọi
T
là một tham số đặc trưng (giá trị trung bình, tỷ lệ hoặc phương sai) chưa
biết của tổng thể. Giả sử ta hình thành một giả thiết về
T
,
0 0
:H
T T

(
0
T
là các giá trị
cụ thể nào đó) và chọn các mệnh đề đối lập với H
0
, gọi là đối thiết H
1
. Khi đó H
1

thể là:
Hoặc:
0
T T
!

Hoặc:
0
T T

Hoặc:
0
T T
z
.
Giả thiết thống kê đưa ra ở trên có thể đúng hoặc sai và làm như thế nào để biết
chính xác điều này. Vì vậy cần kiểm định để xác định giả thiết đúng hay sai. Kiểm
định này được gọi là kiểm định giả thiết tham số thống kê và thực hiện dựa trên thông
tin thực nghiệm của mẫu để kết luận.
1.1.2 Phương pháp kiểm định
Giả sử tổng thể có tham số
T
chưa biết, ta đưa ra bài toán kiểm định với giả thiết
và đối thiết thích hợp.
Từ biến ngẫu nhiên gốc X trong tổng thể lập mẫu ngẫu nhiên kích thước n
W = (X
1
, X
2
, …, X
n
)
và chọn lập thống kê
G = f(X
1
, X

2
, …, X
n
,
0
T
)
Nếu H
0
đúng thì quy luật phân phối xác suất của G hoàn toàn xác định. Thống kê
G được gọi là tiêu chuẩn kiểm định.
Thực hiện một phép thử đối với mẫu ngẫu nhiên W = (X
1
, X
2
, …, X
n
) thu được
một mẫu cụ thể w = (x
1
, x
2
, …, x
n
) và qua đó tính được một giá trị cụ thể của tiêu
chuẩn kiểm định G:
G
qs
= f(x
1

, x
2
, …, x
n
,
0
T
)
Giá trị này được gọi là giá trị quan sát của kiểm định.
Với một xác suất khá bé bằng
D
cho trước, ta có thể tìm được một miền
W
D

tương ứng sao cho
0
( W / )P G H
D
D

. Giá trị
D
được gọi là mức ý nghĩa của kiểm
định và miền
W
D
được gọi là miền bác bỏ của giả thiết H
0
với mức ý nghĩa

D
.
Quy tắt kiểm định giả thiết thống kê:
- Nếu
W
qs
G
D

thì bác bỏ giả thiết H
0
và chấp nhận đối thiết H
1
, tức là giả thiết
sai và đối thiết đúng.

2

- Nếu
W
qs
G
D

thì chấp giả thiết H
0
và bác bỏ đối thiết H
1
, tức là giả thiết đúng
và đối thiết sai.

1.1.3 Sai lầm loại một và sai lầm loại hai
Với quy tắt kiểm định như trên, ta có thể mắc hai loại sai lầm:
 Sai lầm loại 1: Bác bỏ giả thiết H
0
trong khi H
0
đúng.
 Sai lầm loại 2: Chấp nhận giả thiết H
0
trong khi H
0
sai.
Quan hệ giữa việc kiểm định giả thiết và các loại sai lầm có thể mô tả trong bảng
sau:
Kết luận
Thực tế
Bác bỏ H
0

Chấp nhận H
0

H
0
đúng

Sai lầm loại 1
xác suất
D


Kết luận đúng
xác suất
1
E


H
0
sai
Kết luận đúng
xác suất
1
D


Sai lầm loại 2
xác suất
E

Ta thấy sai lầm loại 1 và sai lầm loại 2 là mâu thuẫn với nhau, tức là với một mẫu
kích thước n xác định thì không thể cùng một lúc giảm xác suất mắc hai loại sai lầm
trên được. Khi ta giảm
D
đi thì đồng thời sẽ làm tăng
E
và ngược lại.
Thông thường, người ta đặt ra trước mức xác suất mắc sai lầm loại 1 là
D
và xây
dựng một quy tắt kiểm định sao cho xác suất mắc sai lầm loại 2 (

E
) là nhỏ nhất. Với
D
là mức ý nghĩa của kiểm định.
1.2 Kiểm định trị trung bình tổng thể
1.2.1 Kiểm định giả thiết về trị trung bình của biến ngẫu nhiên có phân phối
chuẩn
1.2.1.1 Bài toán
Tổng thể được đặc trưng bởi đại lượng ngẫu nhiên X có trung bình
( )E X
P


chưa biết. Giả sử ta có mẫu gồm n giá trị quan sát độc lập (X
1
, X
2
, …, X
n
) được chọn
ngẫu nhiên từ tổng thể. Gọi
2
, ,X
P V
và S
2
lần lượt là trung bình và phương sai của
tổng thể và của mẫu, và
2
,x s

tương ứng là các giá trị trung bình và phương sai cụ thể
của mẫu.
Với mức ý nghĩa
D
cho trước, cần kiểm định các cặp giả thiết và đối thiết sau:

0 0
1 0
:
:
H
H
P P
P P


®
!
¯

0 0
1 0
:
:
H
H
P P
P P



®

¯

0 0
1 0
:
:
H
H
P P
P P


®
z
¯

(
0
P
là số cho trước).

3

1.2.1.2 Các bước thực hành
 Trường hợp 1: Khi đã biết phương sai
2
( )Var X
V



Bước 1:
Chọn thống kê U:
0
(0,1)
X
U n N
P
V


(
0,1
)
N

Nếu H
0
đúng thì
0
( )
( )
X n
X n
U
P
P
V V




sẽ xấp xỉ phân phối N(0, 1).
Bước 2: Tính giá trị quan sát:
0
x
u n
P
V



Bước 3: Tìm miền bác bỏ
- Nếu H
1
:
0
P P
!

thì
 
1
;W u
D D

f

- Nếu H
1

:
0
P P


thì
 
1
;W u
D D

f 
.
- Nếu H
1
:
0
P P
z

thì
1 1
2 2
; ;W u u
D D D
 
§ · § ·
f  f
¨ ¸ ¨ ¸
© ¹ © ¹



(Các giá trị
1
u
D

,
1
2
u
D

tra trong bảng phân vị chuẩn).
Bước 4: Kết luận
+ Nếu
u W
D

: Bác bỏ giả thiết, chấp nhận đối thiết.
+ Nếu
u W
D

: Chấp nhận giả thiết, bác bỏ đối thiết.
 Trường hợp 2: Khi chưa biết phương sai
2
( )Var X
V




30n t

Bước 1: Chọn thống kê T:
0
( 1)
P


( 1)
(
(
X
T n T n
S

Nếu H
0
đúng thì
0
P
P



X
X
T n n
S S

sẽ phân phối T (n – 1).
Bước 2: Tính giá trị quan sát
0
x
u n
s
P



Bước 3: Tìm miền bác bỏ
Tương tự như trường hợp 1.



4

Bước 4: Kết luận
+ Nếu
u W
D

: Bác bỏ giả thiết, chấp nhận đối thiết.
+ Nếu
u W
D

: Chấp nhận giả thiết, bác bỏ đối thiết.
 Trường hợp 3: Khi chưa biết phương sai
2

( )Var X
V



30n 
, X có phân phối
chuẩn.
Ở trường hợp này, các bước thực hiện giống như trương hợp 2, chỉ khác ở bước
tìm miền bác bỏ. Cụ thể miền bác bỏ được tìm như sau:
- Nếu H
1:
0
P P
!

thì
 
1
( 1);
D D

 fW t n

- Nếu H
1
:
0
P P



thì
 
1
( 1);
D D

  fW nt

- Nếu H
1
:
0
P P
z

thì
1 1
2 2
( 1) ( 1 ;);
D D D
 
§ · § ·
f  f
¨ ¸ ¨ ¸
© ¹ ©
 
¹

W ntnt


(Các giá trị
1
( 1)t n
D


,
1
2
( 1)t n
D


tra trong bảng phân vị Student với bậc tự do
là n – 1).
1.2.1.3 Ví dụ
Ví dụ 1.1: Thông qua một mẫu gồm 100 gia đình người ta thu được kết quả là chi tiêu
trung bình hàng tháng của các gia đình đó là 2,455 triệu đồng với độ lệch chuẩn mẫu là
0,3 triệu đồng. Với mức ý nghĩa 0,05 có thể cho rằng chi tiêu trung bình hàng tháng
của các gia đình ít hơn 2,25 triệu đồng hay không? Giả thiết mức chi tiêu hàng tháng
có phân phối chuẩn.
Giải
Gọi
P
là chi tiêu trung bình hàng tháng của các gia đình.
Ta có:
0
100, 2.455, 0.3, 2.25 n x s
P



0.05
D

.
- Chúng ta đặt giả thiết và đối thiết cho bài toán:
0
1
: 2.25
: 2.25
H
H
P
P


®

¯

- Giá trị quan sát:
0
2.455 2.25
100 6.833
0.3
x
u n
s
P





- Miền bác bỏ:
   
1
; ; 1.645W u
D D

f  f 

- Kết luận:
u W
D

nên ta chấp nhận giả thiết. Vậy chưa có cơ sở để cho rằng chỉ
tiêu trung bình hàng tháng của các gia đình ít hơn 2,25 triệu đồng.

5

Ví dụ 1.2: Bột mỳ được đóng gói bằng máy tự động có trọng lượng đóng bao theo quy
định là 16 kg và độ lệch chuẩn là 1,2 kg. Lấy ngẫu nhiên 25 bao bột mì để kiểm tra tìm
được trọng lượng đóng gói trung bình của chúng là 15,6 kg. Với mức ý nghĩa 5% cần
dừng máy để điều chỉnh bao không?
Giải
Gọi
P
là trọng lượng đóng gói trung bình theo quy định của mỗi bao bột mì.
Ta có:

25, 15.6, 1.2n x
V


0.05
D


x Đặt giả thiết cho bài toán:
0
1
: 16
: 16
H
H
P
P


®
z
¯

x Giá trị quan sát:
0
15.6 16
5 1.67
1.2
x
u n

P
V




x Miền bác bỏ:
1 1
2 2
; ; ( ; 1.96) (1.96; )W u u
D D D
 
§ · § ·
f   f f   f
¨ ¸ ¨ ¸
© ¹ © ¹

x Ta thấy
u W
D

nên ta chấp nhận giả thiết. Vì vậy, ta cần phải dừng máy để điều
chỉnh bao lại.
Ví dụ 1.3:
Mức hao phí xăng (X) cho một loại xe ôtô chạy trên đoạn đường AB là biến
ngẫu nhiên phân phối chuẩn có trung bình là 50 lít. Do đường được tu sửa lại, người ta
cho rằng mức hao phí xăng trung bình đã giảm xuống. Quan sát 26 chuyến xe chạy
trên đường AB ta thu được số liệu sau:
Mức hao phí xăng (lít)
Số chuyến xe

48.5 – 49.0
49.0 – 49.5
49.5 – 50.0
50.0 – 50.5
50.5 – 51.5
5
7
9
3
2
Với mức ý nghĩa 5% hãy kiểm định về ý kiến trên.
Giải
Gọi
P
là mức hao phí xăng trung bình của xe ôtô.
Từ mẫu trên ta tính được:
49.558x
,
0.584s




6

x Đặt giả thiết cho bài toán:
0
1
: 50
: 50

H
H
P
P



x Giá trị quan sát:

x Miền bác bỏ
 
0.95,25
; ( ; 1.708)W t
D
f  f 

x Vì
u W
D

nên ta bác bỏ giả thiết. Vậy ta có cơ sở để chấp nhận ý kiến trên là
đúng, tức là mức hao phí xăng trung bình của loại xe ôtô đó đã được giảm xuống khi
đường được tu sửa lại.


1.2.2 Kiểm định so sánh hai trung bình
1.2.2.1 Bài toán
Có 2 tổng thể được đặc trưng bởi 2 đại lượng ngẫu nhiên
2
1 1

~ ( , )X N
P V

2
2 2
~ ( , )Y N
P V
. Căn cứ vào hai mẫu cụ thể (X
1
, X
2
, …, X
n1
) và (Y
1
, Y
2
, …, Y
n2
) ta cần
kiểm định các giả thiết, đối thiết sau với mức ý nghĩa
D
cho trước:

0 1 2
1 1 2
:
:
H
H

P P
P P


®
!
¯

0 1 2
1 1 2
:
:
H
H
P P
P P


®

¯

0 1 2
1 1 2
:
:
H
H
P P
P P



®
z
¯

1.2.2.2 Các bước thực hành
a. Trường hợp 1: Phương sai
2
2
2
1
,
VV
đã biết
Bước 1: Chọn thống kê U:
1 2
2 2
1 2
1 2
( ) ( )
(0,1)
X Y
U N
n n
P P
V V
  



(0
,1
)
U N

Trong đó:

,X Y
lần lượt là trung bình của mẫu 1 và mẫu 2.

1
n
,
2
n
lần lượt là số phần tử của mẫu 1 và mẫu 2.
Nếu H
0
đúng thì
2 2
1 2
1 2
( )X Y
U
n n
V V



cũng có phân phối N(0, 1).



49,558 50
26
0.
3.859
584
u 


7

Bước 2: Tính giá trị quan sát
2 2
1 2
1 2
x y
u
n n
V V




Bước 3: Tìm miền bác bỏ
- Nếu
1 1 2
:H
P P
!

thì
 
1
;W u
D D

f

- Nếu
1 1 2
:H
P P


thì
 
1
;W u
D D

f 

- Nếu
1 1 2
:H
P P
z

thì
1 1

2 2
; ;W u u
D D D
 
§ · § ·
f  f
¨ ¸ ¨ ¸
© ¹ © ¹


(Các giá trị
1
u
D

,
1
2
u
D

tra trong bảng phân vị chuẩn).
Bước 4: Kết luận
+ Nếu
u W
D

: Bác bỏ giả thiết, chấp nhận đối thiết.
+ Nếu
u W

D

: Chấp nhận giả thiết, bác bỏ đối thiết.
b. Trường hợp 2:
2
2
2
1
,
VV
chưa biết và
30,30
21
tt nn
(mẫu lớn)
Trường hợp này ta thực hiện các bước giống như trường hợp 1, trong đó hai
phương sai chưa biết sẽ được thay thế bằng hai phương sai mẫu điều chỉnh
2
1
S

2
1
S

trong công thức tính giá trị quan sát. Cụ thể giá trị quan sát được xác định như sau:
2 2
1 2
1 2
x y

u
s s
n n




c. Trường hợp 3:
2
2
2
1
,
VV
chưa biết nhưng biết
2 2
1 2
V V
|
, n < 30
Bước 1: Chọn thống kê T:
1 2
1 2
1 2
( ) ( )
( 2)
1 1
X Y
T T n n
S

n n
P P
  
 

1 2
(
1 2
T
(
(
1 2
1 2
(
T
(
1 2
T
(
1 2
1 2
1 2

với
 
2 2
1 1 2 2
2
1 2
1 ( 1)

2
  

 
n S n S
n n
S
.
Nếu H
0
đúng thì
1 2
( )
1 1
X Y
T
S
n n



có phân phối
1 2
( 2)T n n 
.

8

Bước 2: Tính giá trị quan sát
1 2

1 1
x y
u
s
n n




Bước 3: Tìm miền bác bỏ
- Nếu
1 1 2
:H
P P
!
thì
 
1 1 2
);( 2
D D

  fW t n n

- Nếu
1 1 2
:H
P P


thì

 
1 1 2
(; 2)
D D

f   W t n n

- Nếu
1 1 2
:H
P P
z

thì
1 2 1 2
1 1
2 2
; 2)( ( 2);
D D D
 
§ · § ·
f      f
¨ ¸ ¨ ¸
© ¹ © ¹

W t n n t n n

(Các giá trị
1 1 2
( 2)t n n

D

 
,
1 2
1
2
( 2)t n n
D

 
tra trong bảng phân vị Student với
bậc tự do là
1 2
2n n 
).
Bước 3: Kết luận
+ Nếu
u W
D

: Bác bỏ giả thiết, chấp nhận đối thiết.
+ Nếu
u W
D

: Chấp nhận giả thiết, bác bỏ đối thiết.
1.2.2.3 Các ví dụ
Ví dụ 1.4 : Trồng cùng một loại giống trên hai thửa ruộng như nhau và bón hai loại
phân khác nhau. Đến ngày thu hoạch ta có kết quả như sau:

Thửa thứ nhất lấy mẫu 1000 bông lúa thấy số hạt trung bình là
70
1
x

hạt và độ
lệch chuẩn mẫu
10
1
s
. Thửa thứ hai lấy mẫu 500 bông lúa thấy số hạt trung bình của
mỗi bông là
72
2
x

20
2
s
.
Hỏi sự khác nhau giữa
1
x

2
x
là ngẫu nhiên hay bản chất. Hãy kết luận với
mức ý nghĩa
05.0
D

.
Giải
Ta có:
1
1 1
1000, 70, 10n x s

2
2 2
500, 72, 20n x s

x Chúng ta đặt giả thiết cho bài toán:
1 2
0
1 2
1
:
:
H x x
H x x


°
®
z
°
¯


9


x Giá trị quan sát:
1 2
2 2 2 2
1 2
1 2
70 72
2.108
10 20
1000 500
x x
u
s s
n n
 




x Miền bác bỏ với
05.0
D
:
1 1
2 2
; ; ( ; 1.96) (1.96; )W u u
D D D
 
§ · § ·
f  f f   f

¨ ¸ ¨ ¸
© ¹ © ¹


x Kết luận:
u W
D

nên ta bác bỏ giả thiết. Vậy sự khác biệt giữa
1
x

2
x
là có ý
nghĩa.
Ví dụ 1.5: Thành tích chạy 100m (giây) của 2 nhóm nữ sinh viên thi đậu vào chuyên
ngành đại học Sư phạm TDTT khóa 30 và khóa 31 được cho như sau:
Bảng 1.1: Thành tích chạy 100m của 2 nhóm nữ sinh viên
Khóa 30
Khóa 31
16.3
16.5
18.4
16.9
16.4
16.8
17.4
15.5
17.0

18.0
18.0
17.8
16.8
17.0
14.9

17.0
16.0
17.9
17.2
17.0
18.0
1
6.2
17.4
18.3
17.8
17.1
16.3
17.8
19.0
16.8
17.3
18.0

n = 15
n = 17
Với mức ý nghĩa 1%, có thể cho rằng thành tích trung bình của nhóm nữ sinh
viên khóa 31 cao hơn khóa 30 hay không?

Giả thiết thành tích chạy 100m (giây) của các nữ sinh viên có phân phối chuẩn.
Giải
Gọi x và y lần lượt là thành tích chạy 100m của nữ sinh viên khóa 30 và khóa 31
của trường Đại học Cần Thơ.
Ta có:
1 2
15, 17n n



1 2
1 2
16.98, 17.29, 1.09, 0.952x x s s
.
 Giả thiết và đối thiết cho bài toán
P P
P P


0
1
:
:
X Y
X Y
H
H


10


 Giá trị quan sát
Vì mẫu nhỏ và tỷ số
| 
2
2
1
2 2
2
1.09
1.31 1.5
0.952
s
s
nên
V V
|
2 2
1 2
, ta có:
 
2 2
1 1 2 2
2
1 2
1 ( 1)
1.038
2
n s n s
s

n n
  

 

1 2
16.98 17.29
0.859
1 1 1 1
1.031
15 17
x y
u
s
n n
 

 

 Miền bác bỏ
 
1 2
1 , 2 0.99,30
; ( ; ) ( ; 2.457)
n n
W t t
D D
  
f  f  f 


 Ta thấy
u W
D

nên ta không thể bác bỏ giả thiết H
0
với mức ý nghĩa 0,01. Vậy
có thể nói thành tích chạy 100m (giây) trung bình của hai nhóm nữ sinh khóa 30 và 31
bằng nhau hay ý kiến trên là không đúng.
Ví dụ 1.6: Có số liệu về 60 tờ séc ở thành phố Alphaville và 100 tờ séc ở thành phố
Betaville như sau:
Bảng 1.2: Bảng số liệu về số tờ séc ở hai thành phố Alphaville và Betaville
Thành phố
Số tiền
Thành phố
Số tiền
Thành phố
Số tiền
Thành phố
Số tiền
Thành phố
Số tiền
Alphaville
5777.09
Alphaville
3389.32
Betaville
5277.02
Betaville
867.84

Betaville
8474.79
Alphaville
7084.28
Alphaville
3790.81
Betaville
8466.76
Betaville
7681.87
Betaville
3085.16
Alphaville
8835.02
Alphaville
1947.26
Betaville
6139.15
Betaville
3497.02
Betaville
5367.51
Alphaville
7991.03
Alphaville
8717.98
Betaville
6148.06
Betaville
2787.2

Betaville
4436.18
Alphaville
5973.38
Alphaville
6709.22
Betaville
5091.6
Betaville
2564.88
Betaville
3199.03
Alphaville
4610.17
Alphaville
6363.45
Betaville
6413.81
Betaville
5755.03
Betaville
2259.1
Alphaville
3412.3
Alphaville
6877.04
Betaville
4347.14
Betaville
6072.04

Betaville
4260.72
Alphaville
3432.09
Alphaville
5324.94
Betaville
4382.56
Betaville
6333.22
Betaville
2666.77
Alphaville
5742.21
Alphaville
8725.03
Betaville
1662.87
Betaville
2845.85
Betaville
2956.85
Alphaville
3738.43
Alphaville
8260.05
Betaville
3934.55
Betaville
2989.74

Betaville
5390.57
Alphaville
6962.54
Alphaville
9236.12
Betaville
3193.24
Betaville
5508.15
Betaville
2250.45
Alphaville
3786.4
Alphaville
8120.87
Betaville
7325.73
Betaville
10610.63
Betaville
9031.56
Alphaville
9224.84
Alphaville
5599.97
Betaville
9197.8
Betaville
7147.34

Betaville
6223.58
Alphaville
6204.26
Alphaville
8455.03
Betaville
6453.58
Betaville
5681.7
Betaville
7368.8
Alphaville
4234.49
Alphaville
4556.03
Betaville
6436.26
Betaville
5146.53
Betaville
5549.03
Alphaville
4679.02
Alphaville
5217.34
Betaville
7610.27
Betaville
7317.2

Betaville
4677.99
Alphaville
5450.01
Alphaville
6594.01
Betaville
1766.05
Betaville
1170.19
Betaville
7243.39
Alphaville
3523.68
Alphaville
4882.65
Betaville
5328.59
Betaville
7719.83
Betaville
2526.81
Alphaville
7965.06
Alphaville
6674.81
Betaville
4510.68
Betaville
613.97

Betaville
4864.92
Alphaville
3831.61
Alphaville
7293.22
Betaville
8057.88
Betaville
3721.19
Betaville
7688.37
Alphaville
6941.38
Alphaville
5028.87
Betaville
5962.47
Betaville
5549.84
Betaville
6036.61

11

Alphaville
5098.01
Alphaville
4270.85
Betaville

4256.96
Betaville
1504.88
Betaville
6328.62
Alphaville
5500.95
Alphaville
5099.8
Betaville
5796.46
Betaville
4562.56
Betaville
5332.64
Alphaville
7442.07
Betaville
3863.02
Betaville
4762.7
Betaville
3737.22
Betaville
1466.56
Alphaville
6322.64
Betaville
10649.82
Betaville

5222.84
Betaville
3795.45
Betaville
6678.37
Alphaville
6419.44
Betaville
6699.12
Betaville
2470.49
Betaville
4473.34
Betaville
1987.66
Alphaville
5959.78
Betaville
3958.07
Betaville
2009.22
Betaville
2536
Betaville
5495.28
Alphaville
2272.12
Alphaville
10744.41
Betaville

6355.62
Betaville
1319.92
Betaville
8177.78
Alphaville
3516.99
Betaville
4708.66
Betaville
2085.26
Betaville
4740.31
Betaville
5838.95
Alphaville
8370.71
Betaville
3086.25
Betaville
2066.4
Betaville
9626.76
Betaville
6714.95
Alphaville
2836.04
Betaville
975.23
Betaville

5706.3
Betaville
1446.65
Betaville
4021.06
Alphaville
6757.57
Betaville
6687.69
Betaville
4898.64
Betaville
4607.03
Betaville
5174.74
Với mức ý nghĩa 1%, hãy kiểm định xem ý kiến sau đúng hay sai: “Giá trị trung
bình của các tờ séc ở hai thành phố Alphaville và Betaville là như nhau”.
Giải
Gọi
1 2
,
P P
lần lượt là giá trị trung bình của các tờ séc ở hai thành phố Alphaville
và Betaville.
Ta có:

1 2
60, 100n n



1 2
1 2
5949.079, 4855.010, 2040.959, 2199.192x x s s

 Giả thiết, đối thiết:
P P
P P

z
0 1 2
1 1 2
:
:
H
H

 Giá trị quan sát:
2 2 2 2
1 2
1 2
5949.079 4855.010
3.189
2040.959 2199.192
60 100
x y
u
s s
n n
 





 Miền bác bỏ
0.995 0.995
( ; ) ( ; ) ( ; 2.576) (2.576; )W u u
D
f   f f   f

 Ta thấy
u W
D

nên ta bác bỏ giả thiết. Vậy giá trị trung bình các tờ séc của hai
thành phố có sự khác biệt rõ rệt. Ta thấy giá trị trung bình của các tờ séc ở thành phố
Alphaville cao hơn ở thành phố Betaville.
1.2.2.4 Kiểm định sự bằng nhau của hai trung bình bằng phương pháp so sánh
cặp đôi (mẫu phối hợp từng cặp)
Ở phần này ta xét việc kiểm định hai trung bình khi hai mẫu điều tra có cùng
kích thước n, trong đó các giá trị của mẫu phụ thuộc tương ứng với nhau theo từng
cặp.

12

a. Bài toán
Giả sử ta có hai tổng thể nghiên cứu trong đó các biến ngẫu nhiên X
1
và X
2
cùng

phân phối chuẩn với các phương sai chưa biết. Với mức ý nghĩa
D
phải kiểm định giả
thiết thống kê:
0 1 2
H :μ μ
hay
0 1 2
H :μ μ 0

Từ hai tổng thể rút ra hai mẫu ngẫu nhiên cùng kích thước n:
X
1
= (X
11
, X
12
, …, X
1n
)
X
2
= (X
21
, X
22
, …, X
2n
)
Do các giá trị của 2 mẫu tương ứng với nhau theo từng cặp nên ta sẽ thiết lập

biến ngẫu nhiên D với các giá trị có thể có D
1
, D
2
, …, D
n
là hiệu số các cặp giá trị
tương ứng của 2 mẫu:
i 1i 2i
D X X (i 1,n) 

Lúc đó trung bình của D sẽ là:
     
D 1 2 1 2 1 2
μ E X X E X E X μ μ   

và việc kiểm định giả thiết
0 1 2
H :μ μ 0
có thể viết dưới dạng
0 D
H :μ 0
. Bài toán
đưa về dạng kiểm định giá trị trung bình xét ở trên.
Từ các giá trị D
i
tìm được ta xác định trung bình mẫu và phương sai mẫu:
1
1
n

i
i
D D
n


¦

2 2
1
1
( )
1



¦
n
D i
i
S D D
n

b. Các bước thực hành
Bước 1: Chọn thống kê T:
( )
( 1)
D
D
D n

T T n
S
P


( 1
)
T
(
(
T
((

Nếu H
0
đúng thì
D
D n
T
S

có phân phối
( 1)T n 
.
Bước 2: Tính giá trị quan sát:
D
D n
u
s



Bước 3: Tìm miền bác bỏ
Vì chưa biết phương sai của các biến ngẫu nhiên nên ta có miền bác bỏ dạng T
như sau:

13

- Nếu
1
: 0
D
H
P
!
thì
 
1
( 1);
D D

 fnW t

- Nếu
1
: 0
D
H
P

thì

 
1
; ( 1)
D D

f  W t n

- Nếu
1
: 0
D
H
P
z
thì
1 1
2 2
( 1) ( 1 ;);
D D D
 
§ · § ·
f  f
¨ ¸ ¨ ¸
© ¹ ©
 
¹

W ntnt

Bước 4: Kết luận

+ Nếu
u W
D

: Bác bỏ giả thiết, chấp nhận đối thiết.
+ Nếu
u W
D

: Chấp nhận giả thiết, bác bỏ đối thiết.
c. Ví dụ
Ví dụ 1.7: Thành tích chạy 100m của mẫu gồm 46 nam sinh viên chuyên ngành sư
phạm TDTT trường Đại Học Cần Thơ khi thi vào trường và thành tích sau một năm
tập luyện được cho trong bảng sau:
Bảng 1.3: Thành tích chạy 100m của mẫu gồm 46 sinh viên
STT
Thi ĐH
Sau 1 năm
STT
Thi ĐH
Sau 1 năm
1
12.2
11.8
24
13.8
13.2
2
12.0
11.7

25
13.1
12.4
3
13.3
12.2
26
13.0
12.6
4
12.0
11.2
27
13.2
12.6
5
12.5
12.0
28
12.5
12.2
6
13.1
12.2
29
12.6
11.8
7
12.3
12.5

30
12.7
12.5
8
12.8
12.2
31
13.6
12.4
9
12.6
12.5
32
12.8
12.0
10
12.7
12.2
33
12.0
11.4
11
14.2
13.0
34
13.2
12.8
12
12.5
12.0

35
13.8
13.5
13
13.3
12.7
36
13.5
12.9
14
14.4
13.1
37
13.4
12.9
15
13.4
12.8
38
13.6
13.0
16
12.6
12.5
39
13.7
13.0
17
12.6
12.4

40
13.0
12.5
18
14.8
13.5
41
14.0
13.2
19
14.0
12.8
42
12.6
12.5
20
12.0
11.2
43
12.3
11.2
21
13.5
13.2
44
14.0
13.2
22
13.2
12.7

45
14.7
13.1
23
13.2
12.8
46
13.6
13.0

14

Với mức ý nghĩa 5%, hãy so sánh thành tích trung bình của các nam sinh viên
khi thi và sau một năm tập luyện tại trường Đại Học Cần Thơ?
Giải
Gọi
A
x

B
x
là thành tích chạy 100m của nam sinh viên khi thi vào trường và
sau một năm tập luyện tại trường.

i A B
D x x 
là hiệu số giữa thành tích chạy trung bình của các nam sinh viên
khi thi vào trường và sau một năm tập luyện.
Ta có:
Bảng 1.4: Bảng tính giá trị chênh lệch của thành tích chạy 100m

STT
A
x

B
x

i A B
D x x 

STT
A
x

B
x

i A B
D x x 

1
12.2
11.8
0.4
24
13.8
13.2
0.6
2
12.0

11.7
0.3
25
13.1
12.4
0.7
3
13.3
12.2
1.1
26
13.0
12.6
0.4
4
12.0
11.2
0.8
27
13.2
12.6
0.6
5
12.5
12.0
0.5
28
12.5
12.2
0.3

6
13.1
12.2
0.9
29
12.6
11.8
0.8
7
12.3
12.5
-0.2
30
12.7
12.5
0.2
8
12.8
12.2
0.6
31
13.6
12.4
1.2
9
12.6
12.5
0.1
32
12.8

12.0
0.8
10
12.7
12.2
0.5
33
12.0
11.4
0.6
11
14.2
13.0
1.2
34
13.2
12.8
0.4
12
12.5
12.0
0.5
35
13.8
13.5
0.3
13
13.3
12.7
0.6

36
13.5
12.9
0.6
14
14.4
13.1
1.3
37
13.4
12.9
0.5
15
13.4
12.8
0.6
38
13.6
13.0
0.6
16
12.6
12.5
0.1
39
13.7
13.0
0.7
17
12.6

12.4
0.2
40
13.0
12.5
0.5
18
14.8
13.5
1.3
41
14.0
13.2
0.8
19
14.0
12.8
1.2
42
12.6
12.5
0.1
20
12.0
11.2
0.8
43
12.3
11.2
1.1

21
13.5
13.2
0.3
44
14.0
13.2
0.8
22
13.2
12.7
0.5
45
14.7
13.1
1.6
23
13.2
12.8
0.4
46
13.6
13.0
0.6
x Đặt giả thiết và đối thiết:
0
1
: 0
: 0
D

D
H
H
P
P


®
z
¯



15

x Tớnh giỏ tr quan sỏt
1
1
0.626
n
i
i
D D
n


Ư

2 2
1

1
( ) 0.137
1
n
D i
i
s D D
n



Ư

11.471
D
D n
u
s


x Min bỏc b
1 , 1 1 , 1
2 2
; ; ( ; 2.131) (2.131; )
n n
W t t
D D D

Đ ã Đ ã
f f f f

ă á ă á
â ạ â ạ


x Kt lun:
u W
D

nờn ta bỏc b gi thit H
0
. Vy thnh tớch trung bỡnh ca cỏc
nam sinh viờn khi thi vo trng v sau mt nm tp luyn l cú s khỏc bit. Ta thy
thnh tớch ca sinh viờn mụn chy 100m sau mt nm tp luyn ó tng lờn rừ rt.
1.3 Kim nh t l
1.3.1 Kim nh gi thit v t l tng th
1.3.1.1 Bi toỏn
Gi s tng th c c trng bi i lng ngu nhiờn X v chia lm hai loi
phn t: nhng phn t cú tớnh cht A v nhng phn t khụng cú tớnh cht A. T l
nhng phn t cú tớnh cht A m ta quan tõm l
( )p p A
cha bit. Xột mu gm n
quan sỏt c lp (X
1
, X
2
, , X
n
) v
D
l mc ý ngha cho trc, hóy kim nh cỏc

cp gi thit, i thit (
0
p
l mt s cho trc):

0 0
1 0
:
:
H p p
H p p


đ
!


0 0
1 0
:
:
H p p
H p p


đ



0 0

1 0
:
:
H p p
H p p


đ
z


1.3.1.2 Cỏc bc thc hnh
Bc 1: Chn thng kờ:
0
0 0
( )
(0,1)
( 1)
f p n
U N
p p



(0,1)
U N

Nu H
0
ỳng thỡ

( )
( 1)
f p n
U
p p



cng phõn phi N(0, 1).
# Chỳ ý: n v p phi tha iu kin:
5
1
1
0.3
n
p p
p p
n
!





đ








16

Bước 2: Tính giá trị quan sát
0
0 0
f p
u n
p q



Với
m
f
n

(m là số lần xuất hiện những phần tử có tính chất A trong n lần thực hiện
phép thử độc lập) và
0 0
1q p 
.
Bước 3: Tìm miền bác bỏ
- Nếu
1 0
:H p p!
thì
 
1

;W u
D D

f

- Nếu
1 0
:H p p!
thì
 
1
;W u
D D

f 

- Nếu
1 0
:H p p!
thì
1 1
2 2
; ;W u u
D D D
 
§ · § ·
f  f
¨ ¸ ¨ ¸
© ¹ © ¹



(Các giá trị
1
u
D

,
1
2
u
D

tra trong bảng phân vị chuẩn).
Bước 4: Kết luận
+ Nếu
u W
D

: Bác bỏ giả thiết, chấp nhận đối thiết.
+ Nếu
u W
D

: Chấp nhận giả thiết, bác bỏ đối thiết.
1.3.1.3 Ví dụ
Ví dụ 1.8: Tỷ lệ phế phẩm do một máy tự động sản xuất là 5%. Kiểm tra ngẫu nhiên
300 sản phẩm thấy có 24 sản phẩm lầ phế phẩm. Từ đó có ý kiến cho rằng tỷ lệ phế
phẩm do máy đó sản xuất có chiều hướng tăng lên. Hãy kết luận ý kiến nêu trên với
mức ý nghĩa
05.0

D
.
Giải
Gọi p là tỷ lệ phế phẩm của máy tự động sản xuất ra.
Ta có:
0
0.05, 300, 24 p n m

0.08
m
f
n

.
x Đặt giả thiết và đối thiết cho bài toán:
0
1
: 0.05

: 0.05
H p
H p


®
!
¯

x Tính giá trị quan sát:
0

0 0
0.08 0.05
300 2.384
0.05 0.95
f p
u n
p q



u


17

x Miền quan sát với mức ý nghĩa
05.0
D

   
1
; 1.645;W u
D D

f f

x Kết luận:
u W
D


nên ta bác bỏ giả thiết. Vậy ta có cơ sở để cho rằng tỷ lệ phế
phẩm do máy tự động sản xuất đã tăng lên.
1.3.2 Kiểm định so sánh hai tỷ lệ
1.3.2.1 Bài toán
Có hai tổng thể được đặc trưng bởi hai đại lượng ngẫu nhiên X
1
, X
2
cùng phân
phối không - một và được xét theo định tính với tỷ lệ những phần tử có tính chất A mà
ta quan tâm là p
1
và p
2
chưa biết. Với mức ý nghĩa
D
cho trước, ta cần kiểm định các
giả thiết và đối thiết tương ứng sau:
Dạng 1:
211
210
:
:
ppH
ppH
!

Dạng 2:
211
210

:
:
ppH
ppH


Dạng 3 :
211
210
:
:
ppH
ppH
z


Xét hai mẫu có kích thước n
1
, n
2
từ tổng thể thứ nhất, thứ hai. Gọi f
1
, f
2
là tỷ lệ
phần tử có tính chất A trong hai mẫu tương ứng. Khi đó, tỷ lệ phần tử có tính chất A
của chung hai mẫu là
1 1 2 2
1 2
n f n f

f
n n



.
1.3.2.2 Các bước thực hành
Bước 1: Chọn thống kê:
1 2 1 2
1 1 2 2
1 2
( ) ( )
(0,1)
(1 ) (1 )
f f p p
U N
p p p p
n n
  

 

(0,1)
U N
nếu n
1
, n
2
> 30.
Nếu H

0
đúng thì
1 2
1 2
( )
1 1
(1 )
f f
U
p p
n n


§ ·
 
¨ ¸
© ¹
cũng sẽ phân phối xấp xỉ N(0, 1). Vì p
thường chưa biết nên ta sẽ thay p bởi:

1 1 2 2
1 2
n f n f
f
n n



.
Vậy ta có thống kê của kiểm định là:

1 2
1 2
1 1
(1 )
f f
U
f f
n n


§ ·
 
¨ ¸
© ¹

Bước 2: Tính giá trị quan sát
1 2
1 2
1 1
(1 )
f f
u
f f
n n


§ ·
 
¨ ¸
© ¹



18

Bước 3: Tìm miền bác bỏ
- Nếu là dạng 1:
 
1
;W u
D D

f

- Nếu là dạng 2:
 
1
;W u
D D

f 

- Nếu là dang 3:
1 1
2 2
; ;W u u
D D D
 
§ · § ·
f  f
¨ ¸ ¨ ¸

© ¹ © ¹


(Các giá trị
1
u
D

,
1
2
u
D

tra trong bảng phân vị chuẩn).
Bước 4: Kết luận
+ Nếu
u W
D

: Bác bỏ giả thiết, chấp nhận đối thiết.
+ Nếu
u W
D

: Chấp nhận giả thiết, bác bỏ đối thiết.
1.3.2.3 Ví dụ
Ví dụ 1.9: Hiện trạng học sinh bỏ học hiện là vấn đề đang được đặc biệt quan tâm
trong ngành giáo dục nước ta, nhất là ở nông thôn. Tại hai trường trung học ở hai vùng
nông thôn A và B trong năm học 2009-2010 có các số liệu thống kê sau:

Trường
Số học sinh
Số học sinh bỏ học
A
B
1900
2600
175
325
Với mức ý nghĩa 0,05 có thể cho rằng tình trạng bỏ học ở trường B là nghiệm
trọng hơn ở trường A hay không?
Giải
Gọi p
1
, p
2
lần lượt là tỷ lệ học sinh bỏ học của trường A và trường B.
Ta có:
1 1 2 2
1 2
1 2
175 325 1
,
1900 2600 9
n f n f
f f và f
n n





x Đặt giả thiết và đối thiết cho bài toán:
211
210
:
:
ppH
ppH



x Tính giá trị quan sát:
1 2
1 2
3.468
1 1
(1 )
f f
u
f f
n n


§ ·
 
¨ ¸
© ¹


19


x Miền quan sát với mức ý nghĩa
05.0
D

   
1
; ; 1.645W u
D D

f  f 

x Kết luận:
u W
D

nên ta bác bỏ giả thiết. Vậy ta có cơ sở để cho rằng tình trạng
bỏ học ở trường B là nghiệm trọng hơn ở trường A.
1.3.3 Kiểm định giả thiết về nhiều tỷ lệ
1.3.3.1 Bài toán
Giả sử có k tổng thể nghiên cứu đặc trưng bởi các biến ngẫu nhiên X
1
, X
2
, …, X
k
.
Gọi p = p(A) là tỷ lệ phần tử A và p
1
, p

2
, …, p
k
là k giá trị tương ứng của p ở các tổng
thể. Với mức ý nghĩa
D
cho trước hãy kiểm định giả thiết và đối thiết sau:
0 1 2
:
k
H p p p

1
: : ; , 1,
i j
H i j p p i j k z z
(Có ít nhất hai giá trị khác nhau)
Dựa trên k mẫu ngẫu nhiên độc lập kích thước tương ứng là n
1
, n
2
, …, n
k
và số
lần xuất hiện phần tử A trên k tổng thể lần lượt là m
1
, m
2
, …, m
k

, hãy kiểm định xem
giả thiết đúng hay đối thiết đúng.
1.3.3.2 Các bước tiến hành
Bước 1: Chọn thống kê:
2
2
1
( )
(1 )
k
i i i
i
i i i
m n p
n p p
F




¦

Do p thường chưa biết nên ta sẽ thay bằng ước lượng của nó là:
1 2
1 2


k
k
m m m

f
n n n
  

  

Khi đó tiêu chuẩn kiểm định sẽ là:
2
2
1
( )
(1 )
k
i i
i
i
m n f
n f f
F




¦

Nếu H
0
đúng thì
2
F

sẽ phân phối khi bình phương với (k – 1) bậc tự do.
Bước 2: Tính giá trị quan sát
2
2
1
( )
(1 )
k
i i
i
i
m n f
n f f
F




¦

Bước 3: Tìm miền bác bỏ
2
2 2
1
2 2
( )
; ( 1) ( 1 )
)
( );
(1

k
i i
i
i
W
m n f
k k
n f f
D D D
F F FF


!  
 ½

® ¾
¯ ¿
f

¦

×