Tải bản đầy đủ (.pdf) (17 trang)

ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT - BÀI TOÁN ƯỚC LƯỢNG doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.74 MB, 17 trang )

1
Chương 5. ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT
5.1. Bài toán ước lượng
Trong phần này sẽ đề cập đến việc suy luận các đặc trưng của tổng thể dựa trên các đặc trưng
của mẫu. Các đặc trưng của tổng thể có thể là giá trị trung bình, phương sai hoặc tỷ lệ các đơn vị
của tổng thể có một tính chất nào đó.
Vấn đề đặt ra là ước lượng các đặc trưng của tổng thể (chưa biết) từ các đặc trưng của mẫu dữ
liệu thu thập được.
1. Các vấn đề liên quan đến bài toán ước lượng
Có hai loại ước lượng là ước lượng điểm và ước lượng khoảng.
 Ước lượng điểm là phương pháp dùng một tham số thống kê mẫu đơn lẻ để ước lượng
về giá trị thật của tham số tổng thể.
Các tham số đặc trưng
Mẫu
Tổng thể
Trung bình
̅
Tỷ lệ
̂
Phương sai
Do các tham số đặc trưng của tổng thể được ước lượng thông qua một mẫu được chọn
nên khi thay đổi từ mẫu này sang mẫu khác sẽ dẫn đến các tham số đặc trưng của tổng
thể cũng thay đổi.
Vì vậy, trong trường hợp trung bình của tổng thể nếu dùng một giá trị trung bình mẫu của
một mẫu cụ thể để ước lượng điểm về trung bình tổng thể sẽ kém tin cậy hơn so với khi
vận dụng quy luật phân phối của trung bình mẫu vào quá trình ước lượng trung bình tổng
thể qua phương pháp ước lượng khoảng.
 Ước lượng khoảng là phương pháp dựa vào dữ liệu của mẫu, với một độ tin cậy cho
trước, xác định khoảng giá trị mà đặc trưng của tổng thể có thể rơi vào.
Một cách tổng quát, gọi là đặc trưng của tổng thể cần ước lượng. Giả sử, dựa vào mẫu
quan sát tìm được hai biến ngẫu nhiên và sao cho


(
< <
)
= 1− .
Gọi , lần lượt là các giá trị cụ thể của và . Khoảng ( , )được gọi là khoảng ước
lượng với độ tin cậy
(
1−
)
∗100%của , hay nói một cách ngắn gọn là khoảng tin cậy
(
1−
)
∗100%của .
2. Ước lượng trung bình tổng thể
A. Ước lượng trung bình một tổng thể
a. Biết phương sai của tổng thể
Giả sử có mẫu quan sát được chọn ngẫu nhiên từ tổng thể phân phối chuẩn có phương sai
đã biết.
Gọi là trung bình mẫu, khoảng tin cậy
(
1−
)
∗100%của trung bình tổng thể được xác
định bởi
2

/



< < +
/


Với có phân phối chuẩn.
Ví dụ: Một công ty muốn ước lượng số tài liệu (trang) được chuyển bằng fax trong một ngày.
Kết quả thu thập từ 15 ngày cho thấy trung bình một ngày có 267 trang tài liệu được chuyển
bằng fax. Theo kinh nghiệm từ các văn phòng tương tự thì độ lệch chuẩn là 32 trang. Giả sử số
trang tài liệu chuyển bằng fax trong một ngày có phân phối chuẩn với độ tin cậy 95%, ta ước
lượng

/


< < +
/


Với = 267, = 32, = 15,
/
=
.
= 1. 96 ta có 250.8055 < < 283.1945.
Như vậy với độ tin cậy 95%, số lượng tài liệu chuyển trung bình một ngày được ước lượng từ
251 đến 284 trang.
Nhận xét:
 Với một độ tin cậy và kích thước mẫu không đổi, nếu độ lệch chuẩn càng lớn thì
khoảng ước lượng càng rộng, tức là độ chính xác của ước lượng càng thấp.
 Với một độ tin cậy và độ lệch chuẩn không đổi, nếu kích thước mẫu càng lớn thì
khoảng ước lượng càng hẹp, tức là độ chính xác của ước lượng càng cao.

 Với độ lệch chuẩn và kích thước mẫu không đổi, nếu độ tin cậy càng cao thì khoảng
ước lượng càng rộng, tức là độ chính xác của ước lượng càng thấp.
b. Chưa biết phương sai của tổng thể
Trong thực tế, ta thường không biết phương sai của tổng thể.
Trong trường hợp này ta vẫn giả định tổng thể có phân phối chuẩn, khoảng tin cậy
(
1−
)
100% trung bình tổng thể được xác định như sau:

, /


< < +
, /


Với có phân phối Student với bậc tự do
(
−1
)
.
Ví dụ: Công ty điện thoại ở một thành phố muốn ước lượng thời giant rung bình của các cuộc
điện đàm đường dài vào những ngày cuối tuần. Mẫu ngẫu nhiên 20 cuộc gọi đường dài vào
những ngày cuối tuần cho thấy thời gian điện đàm trung bình là 14.8 phút, độ lệch chuẩn là 5.6
phút. Như vậy với độ tin cậy 95%, thời gian trung bình của cuộc điện đàm đường dài được xác
định như sau:

, /



< < +
, /


3
Với = 14. 8; = 5.6; = 20,
, /
=
, .
= 2. 093 ta có
12.1792 < < 17 .4208
Nghĩa là với độ tin cậy 95%, thời gian trung bình của một cuộc điện đàm đường dài vào cuối
tuần được ước lượng khoảng từ 12.1792 đến 17.4208 phút.
Lưu ý: Trong trường hợp mẫu lớn ( ≥30), ta có thể dùng phân phối chuẩn thay cho phân phối
Student, kể cả trong trường hợp tổng thể có phân phối chuẩn.
Ví dụ: Một trường đại học thực hiện nghiên cứu về số giờ tự học của sinh viên trong một tuần.
Chọn ngẫu nhiên 200 sinh viên cho thấy số giờ tự học trong tuần tính trung bình là 18.36 giờ, độ
lệch chuẩn là 3.92 giờ. Như vậy với độ tin cậy 95%, số giờ tự học trung bình của sinh viên ở
trường này được ước lượng là:

/


< < +
/


Với = 18. 36; =3.92; = 200;
/

=
.
= 1. 96 ta có
17.8168 < < 18 .9032
Nghĩa là với độ tin cậy 95%, số giờ tự học trung bình trong tuần của sinh viên được ước lượng từ
17.8168 đến 18.9032 giờ.
B. Ước lượng sự khác biệt giữa hai trung bình tổng thể
Trong nhiều trường hợp, ta có thể quan tâm đến khác biệt giữa trung bình hai tổng thể, chẳng hạn
như khác biệt về doanh số trung bình trong tuần từ hai phương pháp trưng bày hàng hóa, chào
hàng hóa khác nhau, hoặc sự khác biệt giữa năng suất cây trồng do sử dụng hai loại phân bón
khác nhau… Phương pháp so sánh trung bình hai tổng thể phụ thuộc vào cách thức lấy mẫu: mẫu
phối hợp từng cặp (mẫu phụ thuộc) hoặc mẫu độc lập.
a. Mẫu phối hợp từng cặp
Ở phương pháp này, các đơn vị mẫu được chọn từng cặp, từ hai tổng thể. Thông thường mẫu
phối hợp từng cặp thường bao gồm các trường hợp sau đây:
- So sánh trước và sau, chẳng hạn mẫu thứ nhất là doanh số bán trước khi thực hiện
khuyến mãi, mẫu thứ hai là doanh số sau khi thực hiện khuyến mãi. Ở đây mẫu phối hợp
từng cặp theo nghĩa là doanh số trước và sau khi khuyến mãi được thu thập từ cùng một
cửa hàng.
- So sánh các đơn vị ở cùng một đặc điểm nào đó, chẳng hạn mẫu thứ nhất là tiền lương
của nhân viên nam ở công ty Y, mẫu thứ hai là tiền lương của nhân viên nữ ở công ty Y,
hai nhân viên nam và nữ được xem là giống nhau về năng lực và kinh nghiệm. Ở đây,
mẫu phối hợp từng cặp theo nghĩa là cả hai nhân viên nam và nữ được xem là có nang lực
và kinh nghiệm như nhau.
4
- So sánh giữa các đơn vị phối hợp từng cặp theo không gian, chẳng hạn mẫu thứ nhất là
doanh số của loại nước giải khát nhãn hiệu A ở cửa hàng; ở mẫu thứ hai là doanh số
bán hàng của loại nước giải khát nhãn hiệu B ở cửa hàng đó. Ở đây, mẫu phối hợp từng
cặp theo nghĩa là cả hai doanh số của hai nhãn hiệu A và B đều được thu thập từ cùng
một cửa hàng.

- So sánh giữa các đơn vị phối hợp từng cặp theo thời gian, chẳng hạn mẫu thứ nhất là
doanh số của nhà hàng X ở một tuần lễ nào đó, mẫu thứ hai là doanh số của nhà hàng Y
trong cùng một tuần lễ đó. Ở đây mẫu phối hợp từng cặp theo nghĩa từng cặp doanh số
được thu thập trong cùng một tuần lễ.
Giả sử có các cặp quan sát ( , )lấy ngẫu nhiên từ hai tổng thể và .
Gọi , lần lượt là trung bình của tổng thể , ;
̅
là trung bình của khác biệt;
là độ lệch tiêu chuẩn của khác biệt.
Với khoảng tin cậy
(
1−
)
100% của − được xác định như sau:
̅

, /


< − <
̅
+
, /


Với có phân phối Student với bậc tự do
(
−1
)
.

Ví dụ: Công ty điện lực thực hiện các biện pháp khuyến khích tiết kiệm điện. Lượng điện tiêu
thụ ghi nhận ở 12 hộ gia đình trước và sau khi có các biện pháp khuyến khích tiết kiệm ddieemnj
như sau:
Hộ gia đình
Lượng điện tiêu thụ trước và sau khi
khuyến khích tiết kiệm điện (KWh)
Độ lệch
= −
Bình phương độ lệch

̅
Trước
Sau
1
73
69
4
0.340278
2
50
54
-4
55.00694
3
83
82
1
5.840278
4
78

67
11
57.50694
5
56
60
-4
55.00694
6
74
73
1
5.840278
7
74
75
-1
19.50694
8
87
78
9
31.17361
9
69
64
5
2.506944
10
72

72
0
11.67361
11
77
70
7
12.84028
12
75
63
12
73.67361
Tổng
41
330.9167
Vậy ta có
̅
= = 3.4167; =
.
=30.08333↔ = 5.4848.
5
Giả sử rằng các khác biệt giữa lượng điện trước và sau khi khuyến khích tiết kiệm điện có phân phối
chuẩn, khoảng itn cậy 95% của − là
̅

, /


< − <

̅
+
, /


Với = 12;
̅
= 3. 4167; = 5.4848;
, /
=
, .
= 2. 201 ta có
−0.0682 < − < 6 .9016
Như vậy, khoảng tin cậy 95% của khác biệt giữa lượng điện tiêu thụ trung bình trước và sau khi
khuyến khích tiết kiệm được ước lượng từ -0.0682 KWh đến 6.9016 KWh. Khoảng ước lượng
này bao gồm trị số 0, do vậy có thể tin rằng lượng điện tiêu thụ trung bình trước và sau khi thực
hiện các biện pháp khuyến khích tiết kiệm là bằng nhau.
b. Mẫu độc lập
Gọi , là các mẫu được chọn ngẫu nhiên độc lập từ hai tổng thể phân phối chuẩn và ;
, là trung bình của hai tổng thể và ;
, là phương sai của hai tổng thể và ;
, là trung bình của hai mẫu.
Khoảng tin cậy
(
1−
)
100% của − được xác định như sau:
(

)


/
∗ + < − <
(

)
+
/
∗ +
Với có phân phối chuẩn.
Ví dụ: Một công ty đang xem xét kế hoạch tiết giảm chi phí sản xuất thông qua việc xây dựng
một dây chuyền sản xuất mới nhằm rút ngắn thời gian sản xuất sản phẩm. Ở dây chuyền sản
xuất mới 40 sản phẩm được sản xuất với thời gian trung bình 46.5 phút/sản phẩm, độ lệch tiêu
chuẩn là 8 phút. Với dây chuyền sản xuất, 38 sản phẩm được sản xuất với thời gian trung bình
51.2 phút/sản phẩm, độ lệch chuẩn 9.5 phút. Hãy ước lượng khoảng tin cậy 95% cho khác biệt về
thời gian sản xuất giữa dây chuyền sản xuất mới và cũ.
Ta có
= 46. 5
= 8
= 40
/
=
.
= 1. 96
= 51.2
= 9. 5
= 38
Ta có khoảng tin cậy 95% sự khác biệt về thời gian sản xuất trung bình giữa dây chuyền sản xuất
mới và cũ là
6

(
46.5−51.2
)
−1.96∗
8
40
+
9.5
38
< − <
(
46.5−51.2
)
+1.96∗
8
40
+
9.5
38
−8.6077 < − < −0.7923
Khoảng tin cậy 95% tính được chỉ là các giá trị âm, không bao gồm giá trị 0. Do vậy có thể nói
rằng dây chuyền sản xuất mới có thời gian sản xuất ngắn hơn. Với độ tin cậy 95%, ta ước lượng
dây chuyền sản xuất mới rút ngắn thời giant rung bình sản xuất một sản phẩm trong khoảng từ
0.7923 phút đến 8.6077 phút.
3. Ước lượng tỷ lệ tổng thể
Trong nghiên cứu, ta quan tâm đến tỷ lệ các đơn vị có một tính chất nào đó trong tổng thể, như tỷ
lệ khách hàng sử dụng một loại sản phẩm nào đó, tỷ lệ phế phẩm trong sản xuất…
Khi đó ta thực hiện ước lượng cho kiểm định của tổng thể.
A. Ước lượng tỷ lệ
Giả sử mẫu ngẫu nhiên có quan sát;

̂ là tỷ lệ các quan sát có tính chất nào đó.
Với mẫu lớn ≥ 40, khoảng tin cậy
(
1−
)
∗100% của tỷ lệ các quan sát có tính chất
trong tổng thể được xác định bởi:
̂ −
/
̂(1− ̂)
< < ̂ +
/
̂(1− ̂)
Với là phân phối chuẩn.
Nhận xét: Khi càng lớn thì khoảng ước lượng càng hẹp, tức độ chính xác của ước lượng càng
cao.
Ví dụ: Một nghiên cứu được thực hiện nhằm ước lượng thị phần của sản phẩm nội địa (do các
công ty trong nước sản xuất) đối với mặt hàng bánh kẹo. Kết quả điều tra ngẫu nhiên 100 khách
hàng cho thấy có 34 người dùng sản phẩm nội địa. Như vậy với độ tin cậy 95%, tỷ lệ khách hàng
sử dụng sản phẩm bánh kẹo nội địa được ước lượng là:
̂ −
/
̂(1− ̂)
< < ̂ +
/
̂(1− ̂)
Với ̂ = 0.34; = 100;
/
=
.

=1.96 ta có:
0.2472 < < 0.4328
7
Nghĩa là với độ tin cậy 95%, thị phần bánh kẹo nội địa được ước lượng từ 24.72% đến 43.28%.
B. Ước lượng sự khác biệt giữa tỷ lệ hai tổng thể.
Giả sử ta có hai mẫu , được chọn ngẫu nhiên độc lập từ hai tổng thể và ;
, lần lượt là tỷ lệ các đơn vị có tính chất trong tổng thể;
̂ , ̂ lần lượt là tỷ lệ các đơn vị có tính chất trong mẫu.
Với mẫu lớn , ≥ 40, khoảng tin cậy
(
1−
)
∗100%của − được xác định như sau:
̂ − ̂ −
/
̂ (1− ̂ )
+
̂ (1− ̂ )
< −
< ̂ − ̂ +
/
̂ (1− ̂ )
+
̂ (1− ̂ )
Ví dụ: Kết quả điều tra từ mẫu ngẫu nhiên 1000 người ở mỗi thành phố cho thấy năm 2008. Tỷ
lệ thất nghiệp ở thành phố H là 7.5%, ở thành phố K là 7.2%. Hãy ước lượng khoảng tin cậy
99% cho sự khác biệt về tỷ lệ thất nghiệp giữa hai thành phố.
Ta có ̂ = 0.075; ̂ = 0.072; = = 1000;
/
=

.
= 2. 575thay vào công thức
̂ − ̂ −
/
̂ (1− ̂ )
+
̂ (1− ̂ )
< −
< ̂ − ̂ +
/
̂ (1− ̂ )
+
̂ (1− ̂ )
→ −0.027 < − < 0.033
Với độ tin cậy 99%, có thể nói rằng tỷ lệ thất nghiệp ở thành phố H ở trong khoảng thấp hơn
2.7% đến cao hơn 3.3% so với thành phố K. Với khoảng tin cậy này ta có thể tin rằng tỷ lệ thất
nghiệp ở hai thành phố là bằng nhau (khoảng tin cậy chứa trị số 0 cho thấy dấu hiệu về sự bằng
nhau giữa hai tỷ lệ tổng thể).
Lưu ý: Đôi khi ta quan tâm đến việc ước lượng khoảng tin cậy chỉ một bên, chẳng hạn muốn
ước lượng giới hạn trên mà với độ tin cậy 95% thì trung bình tổng thể không lớn hơn giới hạn
đó; nghĩa là ta muốn ước lượng khoảng tin cậy bên phải, giới hạn dưới của khoảng tin cậy trong
trường hợp này xem như −∞.
Tương tự, có thể t among muốn ước lượng giới hạn dưới với độ tin cậy 99% thì trung bình tổng
thể không thể nhỏ hơn giới hạn đó; nghĩa là, ta mong muốn ước lượng khoảng tin cậy bên trái và
giới hạn trên của khoảng tin cậy xem như +∞.
8
Vì đây là ước lượng một bên nên thay những giá trị
/
,
, /

lần lượt bằng các giá trị
,
,
.
Ví dụ: Với độ tin cậy 95% một công ty muốn ước lượng giới hạn trên cho lượng sản phẩm sản
xuất trung bình hàng ngày. Mẫu ngẫu nhiên 48 ngày cho thấy = 1260 sản phẩm, độ lệch
chuẩn = 325 sản phẩm.
Khoảng tin cậy bên phải của ước lượng sản phẩm sản xuất trung bình hàng ngày được ước lượng
như sau:
−∞ < < + ∗

→ −∞ < < 1260+1.645∗
325

48
→ −∞ < < 1337.17
Như vậy, với độ tin cậy 95% ta ước lượng mức sản xuất trung bình hàng ngày không vượt quá
1338 sản phẩm.
4. Xác định cỡ mẫu cho bài toán ước lượng
a. Đối với trung bình tổng thể
Giả sử ta có mẫu quan sát được chọn ngẫu nhiên tư tổng thể phân phối chuẩn có phương sai .
Khoảng tin cậy
(
1−
)
∗100%của trung bình tổng thể được xác định bởi

/



< < +
/


Gọi là sai số ước lượng được xác định bằng nửa chiều rộng của khoảng tin cậy nên
=
/


→ =
/

Ví dụ: Sử dụng các số liệu của ví dụ ước lượng trung bình tổng thể trong trường hợp đã biết
phương sai ở trên. Ước lượng số lượng tài liệu chuyển bằng fax trong một ngày với độ tin cậy
99%, = 10trang. Kích thước mẫu phải là bao nhiêu để thỏa mãn điều kiện này?
Ta có
/
=
.
= 2. 575; = 10; =32 thì =
/

= 67. 89
Như vậy cần phải thu thập số liệu ít nhất trong 68 ngày.
b. Đối với tỷ lệ tổng thể
Tương tự, ta xác định kích thước mẫu tối thiểu như sau:
=
/
∗ ̂ ∗(1− ̂)
Do ̂ ∗(1− ̂) ≤ nên ta có thể sử dụng công thức

9
=
/
4
Ví dụ: Sử dụng các số liệu của ví dụ ước lượng tỷ lệ của tổng thể. Ước lượng thị phần của sản
phẩm bánh kẹo nội địa với độ tin cậy 99% với sai số ước lượng là 3%. Kích thước mẫu phải là
bao nhiêu để thỏa mãn điều kiện này?
Ta có
/
=
.
= 2. 575; = 0.03nên
=
/
4
= 1841.84
Như vậy cần phải điều tra 1842 người.
5.2. Bài toán kiểm định
Bên cạnh việc ước lượng, các đặc trưng của tổng thể còn có thể được suy diễn từ dữ liệu mẫu
thông qua phương pháp kiểm định giả thuyết. Kiểm định giả thuyết là dựa vào mẫu dữ liệu thu
thập được để đưa ra các kết luận “bác bỏ” hay “chưa có cơ sở để bác bỏ” về các giả thuyết của
tổng thể.
Ví dụ: Những chi tiết về sản phẩm (trọng lượng, đường kính…) đã biết trước hoặc được quy định theo
tiêu chuẩn kỹ thuật. Lấy mẫu sản phẩm để kết luận xem, những chi tiết hoặc tiêu chuẩn kỹ thuật này được
thực hiện trong toàn bộ sản phẩm sản xuất hay không.
Hay sau một thời gian thực hiện các biện pháp marketing (quảng cáo, khuyến mãi…) công ty muốn đánh
giá xem thị phần, doanh số có gì thay đổi so với trước hay có đạt được mục tiêu đã đặt ra hay không.
1. Các vấn đề liên quan đến bài toán kiểm định
a. Đặt giả thuyết
Giả sử dấu hiệu nghiên cứu trong tổng thể có thể xem như biến ngẫu nhiên . Nếu chưa biết

dạng phân phối xác suất của nó, song cơ sở để giả thuyết rằng phân phối theo một quy luật
nào đó, người ta đưa ra giả thuyết: “biến ngẫu nhiên phân phối theo quy luật ”.
Cũng có trường hợp dạng phân phối xác suất của đã biết song tham số đặc trưng của nó lại
chưa biết, nếu có cơ sở để giả thuyết rằng giá trị của tham số bằng ( là hằng số đã biết),
người ta đưa ra giả thuyết = .
Khi nghiên cứu hai hay nhiều biến ngẫu nhiên độc lập thuộc các tổng thể khác nhau hay thuộc
cùng một tổng thể, thường phải xét xem chúng độc lập hay phụ thuộc nhau, các tham số đặc
trưng của chúng có bằng nhau hay không… Nếu chưa biết một cách chắc chắn song có cơ sở để
nhận định về các vấn đề đó cũng có thể đưa ra các giả thuyết tương ứng.
Từ đó có thể đưa ra định nghĩa sau:
Định nghĩa: Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của biến ngẫu nhiên,
về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập của các biến ngẫu nhiên.
10
Giả thuyết thống kê đưa ra được ký hiệu là và được gọi là giả thuyết gốc.
Khi đưa ra một giả thuyết thống kê, người ta còn nghiên cứu kèm theo nó mệnh đề mâu thuẫn
với nó, gọi là giả thuyết đối và ký hiệu là . Để khi giả thuyết bị bác bỏ thì thừa nhận giả
thuyết đối . Khi đó và tạo nên cặp giả thuyết thống kê.
Chẳng hạn, ta nghiên cứu nhu cầu thị trường về một loại hàng hóa nào đó. Ta có thể đưa ra các
cặp giả thuyết thống kê sau:
 : Nhu cầu của thị trường phân phối theo quy luật chuẩn;
: Nhu cầu của thị trường không phân phối theo quy luật chuẩn.
 : Nhu cầu trung bình về loại hàng hóa này là = 1000đơn vị/ tháng;
Lúc đó các giả thuyết đối tương ứng của nó có thể là: : > 1000; : < 1000;
: ≠ 1000.
 : Nhu cầu của thị trường và thu nhập của khách hàng độc lập với nhau;
: Nhu cầu của thị trường và thu nhập của khách hàng phụ thuộc nhau…
Trong thực tế, người ta còn phân biệt các giả thuyết chứa đựng một mệnh đề hoặc nhiều mệnh
đề.
Giả thuyết đơn là giả thuyết chỉ chứa đựng một mệnh đề. Chẳng hạn, nếu là tham số của quy
luật chuẩn và ta đưa ra giả thuyết : = 5 thì đó là giả thuyết đơn.

Giả thuyết kép là giả thuyết chứa đựng một số hữu hạn hoặc vô hạn các giả thuyết đơn. Chẳng
hạn giả thuyết : > 5 bao gồm một số vô hạn các giả thuyết đơn dạng : = , trong đó
là mọi số lớn hơn 5.
Việc kiểm định giả thuyết kép thường khá phức tạp, do đó ở đây ta chỉ hạn chế ở việc nghiên cứu
trường hợp giả thuyết gốc là giả thuyết đơn.
Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm định, tức là tìm ra kết luận về tính
thừa nhận được hay không thừa nhận được của giả thuyết đó. Việc kiểm định này gọi là kiểm
định thống kê, vì nó dựa vào thông tin thực nghiệm của mẫu để kết luận.
Phương pháp chung để kiểm định một giả thuyết thống kê như sau:
Trước hết giả sử đúng, từ đó dựa vào thông tin của mẫu rút ra từ tổng thể tìm được một biến
cố nào đó, sao cho xác suất xảy ra biến cố bằng bé đến mức có thể, tức là có thể coi
không xảy ra trong một phép thử về biến cố này. Lúc đó trên một mẫu cụ thể thực hiện một phép
thử đối với biến cố , nếu xảy ra, điều đó chứng tỏ sai và bác bỏ nó; còn nếu không xảy
ra thì ta chưa có cơ sở để bác bỏ .
Khi một mẫu được chọn ra từ một tổng thể, các thông tin của mẫu có thể nói lên đặc điểm của
tổng thể đó hoặc cũng có thể dùng để đánh giá sự phỏng đoán hoặc một giả thuyết đã được giả
định.
Ví dụ:
- Một nhà sản xuất kẹo cho rằng trung bình mỗi hộp (0,5kg) có khoảng 82 viên kẹo. Ðể
kiểm tra điều này, ngẫu nhiên những hộp kẹo được chọn ra để kiểm tra, đếm và tính
toán.
11
- Một nhà sản xuất nước giải khát muốn kiểm tra giả định về tỉ lệ lượng tạp chất có trong
thành phẩm nhiều nhất là 0,5%. Ngẫu nhiên những chai và lon nước giải khát được chọn
ra để kiểm tra một cách cẩn thận về tỉ lệ tạp chất này.
- Một quản trị Marketing muốn kiểm tra giả định doanh thu của công ty tăng trung bình ít
nhất 5% sau đợt quảng cáo. Ông ta kiểm tra giả định bằng cách liệt kê doanh thu trước và
sau chiến dịch quảng cáo để tính toán.
- Một đài phát thanh truyền hình muốn biết những chương trình Tivi có thỏa mãn cho cả
quí ông và quí bà hay không. Ðể kiểm tra điều này, ông ta lấy ý kiến của nam và nữ một

cách ngẫu nhiên trong khu vực phát hình của mình, xử lý thông tin và cho kết luận.
Tùy theo mục đích nghiên cứu có nhiều loại kiểm định khác nhau như:
 Những kiểm định đơn giản về trung bình tổng thể (µ) phương sai tổng thể (
2
), hoặc tỉ lệ
tổng thể (p).
 Kiểm định sự khác sai về trung bình () phương sai (
2
), hoặc tỉ lệ (p) của hai tổng thể
hay nhiều tổng thể.
 Kiểm định của một tổ hợp của những biến độc lập và những biến phụ thuộc của các nhân
tố ảnh hưởng đến các vấn đề nghiên cứu.
Từ đó dặt các giả thuyết H
0
và H
1
dưới dạng một phía hay hai phía cho thích hợp.
 Giả thuyết H
0
: ký hiệu cho các tham số của tổng thể như trung bình , phương sai ,
tỷ lệ .
Vậy giả thuyết H
0
là tham số  của tổng thể thì bằng với giá trị 
0
cụ thể nào đó trong trường hợp
giả thuyết có giá trị đơn, nghĩa làì H
0
:  = 
0

(kiểm định hai phía), hoặc giả thuyết là một dãy của
giá trị, lúc đó H
0
:   
0
hay H
0
:   
0
(kiểm định một phía).
Đối thuyết H
1
: Giả thuyết H
1
là kết quả ngược lại của giả thuyết H
0
. Nếu giả thuyết H
0
đúng thì
giả thuyết H
1
sai và ngược lại.
Vậy cặp giả thuyết H
0
và H
1
được thể hiện trong các trường hợp kiểm định như sau:
- Trong trường hợp kiểm định dạng hai phía (Two-tail test):
: =
: ≠

- Trong trường hợp kiểm định dạng một phía (One- tail test):
: ≥
: <
hoặc
: ≤
: >
b. Mức ý nghĩa và các loại sai lầm
 Sai lầm loại I.
Là sai lầm của việc bác bỏ giả thuyết H
0
khi giả thuyết này đúng ở mức ý nghĩa nào đó của kiểm
định, nghĩa là nếu quyết định xác suất bác bỏ giả thuyết H
0
khi giả thuyết này đúng là thì xác
suất để chấp nhận nó là (1- ).
 Sai lầm loại II.
Ngược lại sai lầm loại I là sai lầm loại II là loại sai lầm của việc chấp nhận giả thuyết H
0
khi giả
thuyết này sai. Nếu xác suất của việc quyết định chấp nhận một giả thuyết H
0
sai được ký hiệu là
 thì xác suất để bác bỏ giả thuyết này là (1-.
Những quyết định dựa trên giả thuyết H
0
được tóm tắt như sau:
11
- Một nhà sản xuất nước giải khát muốn kiểm tra giả định về tỉ lệ lượng tạp chất có trong
thành phẩm nhiều nhất là 0,5%. Ngẫu nhiên những chai và lon nước giải khát được chọn
ra để kiểm tra một cách cẩn thận về tỉ lệ tạp chất này.

- Một quản trị Marketing muốn kiểm tra giả định doanh thu của công ty tăng trung bình ít
nhất 5% sau đợt quảng cáo. Ông ta kiểm tra giả định bằng cách liệt kê doanh thu trước và
sau chiến dịch quảng cáo để tính toán.
- Một đài phát thanh truyền hình muốn biết những chương trình Tivi có thỏa mãn cho cả
quí ông và quí bà hay không. Ðể kiểm tra điều này, ông ta lấy ý kiến của nam và nữ một
cách ngẫu nhiên trong khu vực phát hình của mình, xử lý thông tin và cho kết luận.
Tùy theo mục đích nghiên cứu có nhiều loại kiểm định khác nhau như:
 Những kiểm định đơn giản về trung bình tổng thể (µ) phương sai tổng thể (
2
), hoặc tỉ lệ
tổng thể (p).
 Kiểm định sự khác sai về trung bình () phương sai (
2
), hoặc tỉ lệ (p) của hai tổng thể
hay nhiều tổng thể.
 Kiểm định của một tổ hợp của những biến độc lập và những biến phụ thuộc của các nhân
tố ảnh hưởng đến các vấn đề nghiên cứu.
Từ đó dặt các giả thuyết H
0
và H
1
dưới dạng một phía hay hai phía cho thích hợp.
 Giả thuyết H
0
: ký hiệu cho các tham số của tổng thể như trung bình , phương sai ,
tỷ lệ .
Vậy giả thuyết H
0
là tham số  của tổng thể thì bằng với giá trị 
0

cụ thể nào đó trong trường hợp
giả thuyết có giá trị đơn, nghĩa làì H
0
:  = 
0
(kiểm định hai phía), hoặc giả thuyết là một dãy của
giá trị, lúc đó H
0
:   
0
hay H
0
:   
0
(kiểm định một phía).
Đối thuyết H
1
: Giả thuyết H
1
là kết quả ngược lại của giả thuyết H
0
. Nếu giả thuyết H
0
đúng thì
giả thuyết H
1
sai và ngược lại.
Vậy cặp giả thuyết H
0
và H

1
được thể hiện trong các trường hợp kiểm định như sau:
- Trong trường hợp kiểm định dạng hai phía (Two-tail test):
: =
: ≠
- Trong trường hợp kiểm định dạng một phía (One- tail test):
: ≥
: <
hoặc
: ≤
: >
b. Mức ý nghĩa và các loại sai lầm
 Sai lầm loại I.
Là sai lầm của việc bác bỏ giả thuyết H
0
khi giả thuyết này đúng ở mức ý nghĩa nào đó của kiểm
định, nghĩa là nếu quyết định xác suất bác bỏ giả thuyết H
0
khi giả thuyết này đúng là thì xác
suất để chấp nhận nó là (1- ).
 Sai lầm loại II.
Ngược lại sai lầm loại I là sai lầm loại II là loại sai lầm của việc chấp nhận giả thuyết H
0
khi giả
thuyết này sai. Nếu xác suất của việc quyết định chấp nhận một giả thuyết H
0
sai được ký hiệu là
 thì xác suất để bác bỏ giả thuyết này là (1-.
Những quyết định dựa trên giả thuyết H
0

được tóm tắt như sau:
11
- Một nhà sản xuất nước giải khát muốn kiểm tra giả định về tỉ lệ lượng tạp chất có trong
thành phẩm nhiều nhất là 0,5%. Ngẫu nhiên những chai và lon nước giải khát được chọn
ra để kiểm tra một cách cẩn thận về tỉ lệ tạp chất này.
- Một quản trị Marketing muốn kiểm tra giả định doanh thu của công ty tăng trung bình ít
nhất 5% sau đợt quảng cáo. Ông ta kiểm tra giả định bằng cách liệt kê doanh thu trước và
sau chiến dịch quảng cáo để tính toán.
- Một đài phát thanh truyền hình muốn biết những chương trình Tivi có thỏa mãn cho cả
quí ông và quí bà hay không. Ðể kiểm tra điều này, ông ta lấy ý kiến của nam và nữ một
cách ngẫu nhiên trong khu vực phát hình của mình, xử lý thông tin và cho kết luận.
Tùy theo mục đích nghiên cứu có nhiều loại kiểm định khác nhau như:
 Những kiểm định đơn giản về trung bình tổng thể (µ) phương sai tổng thể (
2
), hoặc tỉ lệ
tổng thể (p).
 Kiểm định sự khác sai về trung bình () phương sai (
2
), hoặc tỉ lệ (p) của hai tổng thể
hay nhiều tổng thể.
 Kiểm định của một tổ hợp của những biến độc lập và những biến phụ thuộc của các nhân
tố ảnh hưởng đến các vấn đề nghiên cứu.
Từ đó dặt các giả thuyết H
0
và H
1
dưới dạng một phía hay hai phía cho thích hợp.
 Giả thuyết H
0
: ký hiệu cho các tham số của tổng thể như trung bình , phương sai ,

tỷ lệ .
Vậy giả thuyết H
0
là tham số  của tổng thể thì bằng với giá trị 
0
cụ thể nào đó trong trường hợp
giả thuyết có giá trị đơn, nghĩa làì H
0
:  = 
0
(kiểm định hai phía), hoặc giả thuyết là một dãy của
giá trị, lúc đó H
0
:   
0
hay H
0
:   
0
(kiểm định một phía).
Đối thuyết H
1
: Giả thuyết H
1
là kết quả ngược lại của giả thuyết H
0
. Nếu giả thuyết H
0
đúng thì
giả thuyết H

1
sai và ngược lại.
Vậy cặp giả thuyết H
0
và H
1
được thể hiện trong các trường hợp kiểm định như sau:
- Trong trường hợp kiểm định dạng hai phía (Two-tail test):
: =
: ≠
- Trong trường hợp kiểm định dạng một phía (One- tail test):
: ≥
: <
hoặc
: ≤
: >
b. Mức ý nghĩa và các loại sai lầm
 Sai lầm loại I.
Là sai lầm của việc bác bỏ giả thuyết H
0
khi giả thuyết này đúng ở mức ý nghĩa nào đó của kiểm
định, nghĩa là nếu quyết định xác suất bác bỏ giả thuyết H
0
khi giả thuyết này đúng là thì xác
suất để chấp nhận nó là (1- ).
 Sai lầm loại II.
Ngược lại sai lầm loại I là sai lầm loại II là loại sai lầm của việc chấp nhận giả thuyết H
0
khi giả
thuyết này sai. Nếu xác suất của việc quyết định chấp nhận một giả thuyết H

0
sai được ký hiệu là
 thì xác suất để bác bỏ giả thuyết này là (1-.
Những quyết định dựa trên giả thuyết H
0
được tóm tắt như sau:
12
Ví dụ: Lượng tạp chất có trong thành phẩm ta xét
 Sai lầm lọai I:
- Giả thuyết H
0
: Lượng tạp chất nhiều nhất là 0,5%.
- Thực chất lượng tạp chất nhiều nhất là 0,5%, có nghĩa là giả thuyết H
0
đúng.
Nhưng qua kiểm định ta lại bác bỏ giả thuyết này, vậy ta đã mắc phải sai lầm lọai I:
bác bỏ một giả thuyết đúng. Ðiều này cho ta một kết luận rằng tỉ lệ tạp chất có trong
nước giải khát ít nhất là 0,5%, quá tỉ lệ tạp chất cho phép, điều này sẽ gây ảnh hưởng
không tốt đến người tiêu dùng.
 Sai lầm lọai II:
- Giả thuyết H
0
: Lượng tạp chất nhiều nhất là 0,5%.
- Thực chất lượng tạp chất có trong nước giải khát ít nhất là 0,5%, có nghĩa là giả
thuyết H
0
sai. Nhưng qua kiểm định ta lại chấp nhận giả thuyết này, vậy ta đã mắc
phải sai lầm lọai II: chấp nhận một giả thuyết sai. Ðiều này cho ta kết luận rằng tỉ lệ
tạp chất có trong nước giải khát nhiều nhất là 0,5%.
c. Giá trị −

Giá trị − là mức ý nghĩa nhỏ nhất mà ở đó giả thuyết H
0
bị bác bỏ.
Đối với giá trị kiểm định đã được tính trong bài toán kiểm định, ta tra bảng phân phối chuẩn tính
được giá trị tương ứng. Đó chính là giá trị của kiểm định. Do vậy giả thuyết bị bác bỏ ở
bất kỳ mức ý nghĩa nào lớn hơn (hay bằng) p-value.
d. Độ giá trị của kiểm định
Khi cố định khả năng mắc sai lầm loại I là (mức ý nghĩa), suy ra khả năng mắc sai lầm loại II
là (xác suất không bác bỏ một giả thuyết sai) và (1− )là xác suất bác bỏ giả thuyết
sai, được gọi là độ giá trị của kiểm định.
2. Kiểm định giả thuyết về trung bình tổng thể
12
Ví dụ: Lượng tạp chất có trong thành phẩm ta xét
 Sai lầm lọai I:
- Giả thuyết H
0
: Lượng tạp chất nhiều nhất là 0,5%.
- Thực chất lượng tạp chất nhiều nhất là 0,5%, có nghĩa là giả thuyết H
0
đúng.
Nhưng qua kiểm định ta lại bác bỏ giả thuyết này, vậy ta đã mắc phải sai lầm lọai I:
bác bỏ một giả thuyết đúng. Ðiều này cho ta một kết luận rằng tỉ lệ tạp chất có trong
nước giải khát ít nhất là 0,5%, quá tỉ lệ tạp chất cho phép, điều này sẽ gây ảnh hưởng
không tốt đến người tiêu dùng.
 Sai lầm lọai II:
- Giả thuyết H
0
: Lượng tạp chất nhiều nhất là 0,5%.
- Thực chất lượng tạp chất có trong nước giải khát ít nhất là 0,5%, có nghĩa là giả
thuyết H

0
sai. Nhưng qua kiểm định ta lại chấp nhận giả thuyết này, vậy ta đã mắc
phải sai lầm lọai II: chấp nhận một giả thuyết sai. Ðiều này cho ta kết luận rằng tỉ lệ
tạp chất có trong nước giải khát nhiều nhất là 0,5%.
c. Giá trị −
Giá trị − là mức ý nghĩa nhỏ nhất mà ở đó giả thuyết H
0
bị bác bỏ.
Đối với giá trị kiểm định đã được tính trong bài toán kiểm định, ta tra bảng phân phối chuẩn tính
được giá trị tương ứng. Đó chính là giá trị của kiểm định. Do vậy giả thuyết bị bác bỏ ở
bất kỳ mức ý nghĩa nào lớn hơn (hay bằng) p-value.
d. Độ giá trị của kiểm định
Khi cố định khả năng mắc sai lầm loại I là (mức ý nghĩa), suy ra khả năng mắc sai lầm loại II
là (xác suất không bác bỏ một giả thuyết sai) và (1− )là xác suất bác bỏ giả thuyết
sai, được gọi là độ giá trị của kiểm định.
2. Kiểm định giả thuyết về trung bình tổng thể
12
Ví dụ: Lượng tạp chất có trong thành phẩm ta xét
 Sai lầm lọai I:
- Giả thuyết H
0
: Lượng tạp chất nhiều nhất là 0,5%.
- Thực chất lượng tạp chất nhiều nhất là 0,5%, có nghĩa là giả thuyết H
0
đúng.
Nhưng qua kiểm định ta lại bác bỏ giả thuyết này, vậy ta đã mắc phải sai lầm lọai I:
bác bỏ một giả thuyết đúng. Ðiều này cho ta một kết luận rằng tỉ lệ tạp chất có trong
nước giải khát ít nhất là 0,5%, quá tỉ lệ tạp chất cho phép, điều này sẽ gây ảnh hưởng
không tốt đến người tiêu dùng.
 Sai lầm lọai II:

- Giả thuyết H
0
: Lượng tạp chất nhiều nhất là 0,5%.
- Thực chất lượng tạp chất có trong nước giải khát ít nhất là 0,5%, có nghĩa là giả
thuyết H
0
sai. Nhưng qua kiểm định ta lại chấp nhận giả thuyết này, vậy ta đã mắc
phải sai lầm lọai II: chấp nhận một giả thuyết sai. Ðiều này cho ta kết luận rằng tỉ lệ
tạp chất có trong nước giải khát nhiều nhất là 0,5%.
c. Giá trị −
Giá trị − là mức ý nghĩa nhỏ nhất mà ở đó giả thuyết H
0
bị bác bỏ.
Đối với giá trị kiểm định đã được tính trong bài toán kiểm định, ta tra bảng phân phối chuẩn tính
được giá trị tương ứng. Đó chính là giá trị của kiểm định. Do vậy giả thuyết bị bác bỏ ở
bất kỳ mức ý nghĩa nào lớn hơn (hay bằng) p-value.
d. Độ giá trị của kiểm định
Khi cố định khả năng mắc sai lầm loại I là (mức ý nghĩa), suy ra khả năng mắc sai lầm loại II
là (xác suất không bác bỏ một giả thuyết sai) và (1− )là xác suất bác bỏ giả thuyết
sai, được gọi là độ giá trị của kiểm định.
2. Kiểm định giả thuyết về trung bình tổng thể
13
Kiểm định trung bình về tổng thể trong các trường hợp mẫu lớn và mẫu nhỏ, với điều kiện đã
biết hoặc chưa biết phương sai tổng thể .
Giả sử ta có mẫu gồm giá trị quan sát được chọn ngẫu nhiên từ một tổng thể nào đó.
Gọi , , ̅, lần lượt là trung bình và phương sai của tổng thể và mẫu.
Kiểm định giả thuyết về trung bình của tổng thể được thực hiện như sau:
2.1. Trường hợp mẫu lớn ≥ , đã biết hoặc chưa biết phương sai
 Kiểm định hai phía
: =

: ≠
ứ ý
với là giá trị cho trước.
Giá trị kiểm định =
|
̅
|
/

(nếu trong trường hợp chưa biết thì thay bởi ).
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu >
/
.
Nhận xét: Ta nhận thấy sự liên hệ giữa ước lượng và kiểm định giả thuyết: Giả thuyết
: = ( : ≠ )bị bác bỏ ở mức ý nghĩa khi và chỉ khi khoảng tin cậy
(
1−
)
100%
của không chứa trị số .
 Kiểm định một phía
: ≥
: <
ứ ý
hoặc
: ≤
: >
ứ ý
với là giá trị cho trước.
Giá trị kiểm định =

|
̅
|
/

(nếu trong trường hợp chưa biết thì thay bởi ).
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu > .
2.2. Trường hợp mẫu nhỏ < 30.
Với mẫu nhỏ, ta giả định tổng thể phân phối chuẩn.
2.2.1. Đã biết phương sai tổng thể
Trường hợp này vẫn áp dụng phương pháp kiểm định như trong trường hợp mẫu lớn.
2.2.2. Chưa biết phương sai tổng thể
 Kiểm định hai phía
: =
: ≠
ứ ý
với là giá trị cho trước.
Giá trị kiểm định =
|
̅
|
/

.
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu >
( )
, /
trong đó
( )
, /


phân phối Student với bậc tự do ( −1), mức ý nghĩa /2.
 Kiểm định một phía
: ≥
: <
ứ ý
hoặc
: ≤
: >
ứ ý
với là giá trị cho trước.
Giá trị kiểm định =
|
̅
|
/

.
14
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu >
( )
,
trong đó
( )
,

phân phối Student với bậc tự do ( −1), mức ý nghĩa .
Nhận xét: trong trường hợp chưa biết phương sai của tổng thể thì kiểm định có phân phối
Student.
3. Kiểm định giả thuyết về tỷ lệ tổng thể

Giả sử ta có mẫu ngẫu nhiên các quan sát.
Gọi , ̂ lần lượt là tỷ lệ các đơn vị có một tính chất nào đó mà ta quan tâm trong tổng thể và
trong mẫu.
Với mẫu lớn ≥ 40, phân phối của tỷ lệ mẫu ̂ được xem như chuẩn và kiểm định giả thuyết về
được thực hiện như sau:
 Kiểm định hai phía
: =
: ≠
ứ ý
với là giá trị cho trước.
Giá trị kiểm định =
| |
( )/
.
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu >
/
.
 Kiểm định một phía
: ≥
: <
ứ ý
hoặc
: ≤
: >
ứ ý
với là giá trị cho trước.
Giá trị kiểm định =
| |
( )/
.

Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu > .
4. Kiểm định giả thuyết về sự khác biệt hai trung bình tổng thể
4.1. Kiểm định dựa trên sự phối hợp từng cặp
Giả sử ta có các cặp quan sát ( , ) lấy ngẫu nhiên từ hai tổng thể và :
(
,
)
,
(
,
)
,…,
(
,
)
.
Gọi , lần lượt là trung bình của và ;
̅
, là trung bình và độ lệch tiêu chuẩn của khác biệt
(

)
.
Giả sử rằng phân phối của các khác biệt giữa và trong tổng thể là chuẩn.
Kiểm định giả thuyết về sự khác biệt giữa , như sau:
 Kiểm định hai phía
: − =
: − ≠
ứ ý
với là giá trị cho trước (khi muốn kiểm định

giả thuyết = thì ta đặt = 0.
Giá trị kiểm định =
| |
/

.
15
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu >
( )
, /
trong đó
( )
, /

phân phối Student với bậc tự do ( −1), mức ý nghĩa /2.
 Kiểm định một phía
: − ≥
: − <
ứ ý
hoặc
: − ≤
: − >
ứ ý
với là giá trị cho
trước.
Giá trị kiểm định =
| |
/

.

Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu >
( )
,
trong đó
( )
,

phân phối Student với bậc tự do ( −1), mức ý nghĩa .
4.2. Kiểm định dựa trên mẫu ngẫu nhiên độc lập
4.2.1. Đã biết phương sai của tổng thể
Giả sử có hai tổng thể và có phân phối chuẩn. Hai mẫu được chọn ngẫu nhiên độc lập từ hai
tổng thể.
Tổng thể thứ nhất có trung bình và phương sai ,mẫu được chọn ngẫu nhiên có cỡ mẫu ,
trung bình mẫu .
Tổng thể thứ hai có trung bình và phương sai ,mẫu được chọn ngẫu nhiên có cỡ mẫu ,
trung bình mẫu . (Giá trị và có thể khác nhau về kích thước).
 Kiểm định hai phía
: − =
: − ≠
ứ ý
với là giá trị cho trước (khi muốn kiểm định
giả thuyết = thì ta đặt = 0.
Giá trị kiểm định =
| |
.
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu >
/
.
 Kiểm định một phía
: − ≥

: − <
ứ ý
hoặc
: − ≤
: − >
ứ ý
với là giá trị cho
trước.
Giá trị kiểm định =
| |
.
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu >
/
.
4.2.2. Chưa biết phương sai của tổng thể
 Trong trường hợp kích thước mẫu lớn ≥ 30 và ≥ 30.
Ta vẫn dùng công thức và quy tắc kiểm định như khi đã biết phương sai tổng thể, với
phương sai mẫu và thay cho và , kể cả khi tổng thể không có phân phối
chuẩn.
16
 Trong trường hợp mẫu nhỏ (hoặc và hoặc cả hai giá trị này đều nhỏ hơn 30), với
giả định hai tổng thể và có phân phối chuẩn.
Ta vẫn dùng và thay cho và .
Giá trị kiểm định =
| |
.
So sánh với giá trị tra bảng phân phối Student với số bậc tự do được xác định bởi công
thức
ố ậ ự =
+

−1
+
−1
Và với mức ý nghĩa /2 trong trường hợp kiểm định hai phía; mức ý nghĩa trong
trường hợp kiểm định một phía.
4.3. Giả định phương sai tổng thể bằng nhau
Giả định hai tổng thể có = . Kiểm định giả thuyết áp dụng thuận tiện trong trường hợp
mẫu nhỏ.
Gọi là giá trị ước lượng cho phương sai chung của cả hai tổng thể
=
(
−1
)
+
(
−1
)
+ −2
 Kiểm định hai phía
: − =
: − ≠
ứ ý
với là giá trị cho trước.
Giá trị kiểm định =
| |
.
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu >
, /
.
 Kiểm định một phía

: − ≥
: − <
ứ ý
hoặc
: − ≤
: − >
ứ ý
với là giá trị cho
trước.
Giá trị kiểm định =
| |
.
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu >
,
.
5. Kiểm định giả thuyết về sự bằng nhau giữa hai tỷ lệ tổng thể
Giả sử ta có hai mẫu , được chọn ngẫu nhiên độc lập từ hai tổng thể và .
17
Gọi , và ̂ , ̂ lần lượt tỷ lệ cấc đơn vị có tính chất nào đó mà ta quan tâm trong tổng thể
và trong mẫu.
Với mẫu lớn , ≥ 40 kiểm định giả thuyết về sự bằng nhau giữa hai tỷ lệ tổng thể =
thực hiện như sau:
 Kiểm định hai phía
: − = 0
: − ≠ 0
ứ ý
Giá trị kiểm định =
| |
( )
trong đó ̂ là giá trị ước lượng cho tỷ lệ chung

, trong đó ̂ = .
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu >
/
.
 Kiểm định một phía
: − ≤ 0
: − > 0
ứ ý
hoặc
: − ≥ 0
: − < 0
ứ ý
Giá trị kiểm định =
| |
( )
trong đó ̂ là giá trị ước lượng cho tỷ lệ chung
, trong đó ̂ = .
Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu > .

×