Tải bản đầy đủ (.docx) (40 trang)

Giao an hoc ki 1,toán cao cấp - tin học ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.25 MB, 40 trang )

1. Tóm tắt Z-TEST và T-TEST (khi n ≥ 30 có thể xem t-test và z-test gần như nhau)

1.1. Một số công thức

Điều kiện

Giả thuyết

tα/2(k) = T.INV.2T(α,k); tα(k) = T.INV(1-α,k)

Một trung bình của X chuẩn
Biết σ

H: μ = μ0

Z-test

Z=

| X − µ0 | n
σ

P(z

α/2

) = 1 –α/2

P(zα) = 1 - α
Chưa biết σ


Z-test

Z=

| X − µ0 | n
S

P(z

α/2

) = 1 –α/2

n ≥ 30
P(zα) = 1 - α
T - test
Chưa biết σ

T-test

T=

| X − µ0 | n
S

tα/2(n – 1); tα(n – 1)

T=

| X − µ0 | n

S

tα/2(n – 1); tα(n – 1)

n < 30
Hai trung bình của X, Y độc lập, chuẩn; σ 1, σ 2 gần nhau
Biết σ1, σ2

Chưa biết σ1; σ2
n1, n2 ≥ 30
1

H: μ1 = μ2

H: μ1 = μ2

Z-test

Z-test

Z=

Z=

| X1 − X 2 |

σ 12 σ 22
+
n1 n2
| X1 − X 2 |

S12 S 22
+
n1 n2

P(z

P(z

α/2

) = 1 –α/2

α/2

) = 1 –α/2


P(zα) = 1 - α

T-test

Chưa có σ1; σ2

H: μ1 = μ2

T-test

T=

T=


n1 hoặc n2 < 30

S2 =

H: μ1 = μ2

T-test

| X1 − X 2 |

tα/2(n1 + n2 – 2)

S12 S22
+
n1 n2

tα(n1 + n2 – 2)

| X1 − X 2 |

tα/2(n1 + n2 – 2)

S2 S2
+
n1 n2

tα(n1 + n2 – 2)

(n1 − 1) S12 + (n2 − 1) S 22

n1 + n2 − 2
| X1 − X 2 |

T=

S + S − 2rS1S 2
2
1

2
2

n

tα/2(n1 + n2 – 2)
tα(n1 + n2 – 2)

H: μ1 = μ2

T-test

T=

k≈

Biết p0

H: p = p0

| X1 − X 2 |

S12 S22
+
n1 n2

(n1 − 1)( n2 − 1)
(n1 − 1)C 2 + (n2 − 1)C 2

Z=

| f − p0 |
n
p0 (1 − p0 )

C=

S12 S12 S22
:( + )
n1 n1 n2

tα/2(k); tα(k)

P(z

α/2

) = 1 –α/2

P(zα) = 1 - α

Biết p


H: p1 = p2

Z-test

Z=

Hoặc
T-test

2

T=

| f1 − f 2 |
p(1 − p) p (1 − p )
+
n1
n2
| f1 − f 2 |
p(1 − p) p (1 − p)
+
n1
n2

P(z

α/2

) = 1 – α/2


tα/2(n1 + n2 – 2)


Chưa biết p

H: p1 = p2

Z-test

Z=

| f1 − f 2 |
f (1 − f ) f (1 − f )
+
n1
n2

P(z

α/2

) = 1 –α/2

P(zα) = 1 - α

f =

T-test


T=

n1 f1 + n2 f 2
n1 + n2
| f1 − f 2 |
f (1 − f ) f (1 − f )
+
n1
n2

tα/2(n1 + n2 – 2)
tα(n1 + n2 – 2)

1.2. Ví dụ – Bài tập
1.2.1. Z-test cho một giá trị trung bình
a) X chuẩn, biết σ
Ví dụ: Một dung dịch cần có độ PH 8,2. Một phương pháp xác định PH có phân phối
chuẩn với độ lệch chuẩn là 0,02 cho kết quả: X = 8,18; 8,17; 8,16; 8,15; 8,17; 8,21; 8,22;
8,16; 8,19; 8,18. Với mức 5% hãy kiểm định H: μ = 8,20; K: μ ≠ 8,20.
Cách 1. Z - TEST trực tiếp.

Bước 1. Công thức

α
| X − µ0 |
n
σ
H: μ = 8,20; K: μ ≠ 8,20. Z =
. P(zα/2) = Φ(zα/2) = 1- 2


Bước 2. Tóm tắt đề bài: µ = 8,20; σ = 0,02; n = 10; X = 8,179
Bước 3. Tra bảng – Tính toán: zα/2 = 1,96. Z = 3,32.
Bước 4. Kết luận: Bác bỏ H0.
Gi chú p-value = 1 – 2Q(Z) = 2 – 2P(Z) = 2 – 2.0,9996 = 0,0008 (hai phía).
3


Cách 2. Z – TEST trong Excel, p-value = 1 – 0,9996 = 0,0004 (một phía)

Cách 3. Z – TEST trong Z – TEST Statistics (Android), p-value = 0,0004 (một phía)

Cách 4. Có thể kiểm định H thông qua ước lượng khoảng đối với µ như sau:
zα / 2σ
n = 0,0124; 8,179 - 0,0124 < µ < 8,179 + 0,0124 = 8,1914 < 8,2. Bác bỏ H.
ε=

Ghi chú: Trong R, SPSS,… không có One-Sample Z Test, có thể xây dựng thêm.
Bài tập.
1. Điểm của sinh viên có phân phối chuẩn, phương sai 18. Điều tra 10 sinh viên X: 65, 78,
88, 55, 48, 95, 66, 57, 79, 81. Với mức 5%, kiểm định H: µ = 75; K: µ ≠ 75.

4


2. Một tín hiệu được gửi từ địa điểm A và được nhận ở địa điểm B có phân phối chuẩn với
trung bình 8, độ lệch chuẩn 2. Khi khảo sát 5 lần có X = 9,5. Với độ tin cậy 95%, hãy
kiểm định H: µ = 8. K: µ ≠ 8.
3. Một hãng buôn muốn biết xem phải chăng có sự không ổn định trung bình về lượng
hàng bán được trên một nhân viên bán hàng so với các năm trước (lượng đó bằng 7,4).
Một mẫu gồm 40 nhân viên bán hàng được lựa chọn và tìm thấy lượng hàng trung bình

của họ là 6,1 với độ lệch chuẩn là 2,5. Với mức 1% có thể nói rằng lượng hàng bán được
trung bình trên mỗi đầu người có sự thay đổi không?
4. Khối lượng gói mì chính có phân phối chuẩn, với độ lệch chuẩn là 36g. Theo quy định
mỗi gói là 453g. Kiểm tra 81 gói thấy khối lượng trung bình là 448g. Với mức 0,05 có thể
cho rằng khối lượng các gói mì chính không đạt tiêu chuẩn hay không.
5. Năng suất một giống lúa có phân phối chuẩn với phương sai là 10 (tạ/ha); năng suất
trung bình là 32,5. Điều tra 15 thửa ruộng có X: 33,7; 35,4; 32,7; 36,3; 37,3; 32,4; 30,0;
32,4; 31,7; 34,5; 42,0; 33,9; 38,1; 35,0; 33,8. Với mức 1%, kiểm định H: µ = 32,5; K: µ >
32,5.
b) X chuẩn, chưa biết σ, n ≥ 30 (Z-test hoặc T-test)
Ví dụ: Một nhóm nghiên cứu tuyên bố rằng trung bình mỗi người vào siêu thị X tiêu
140.000đ. Chọn mẫu 50 người thấy X = 154000đ, với độ lệch mẫu hiệu chỉnh S =
62.000đ. Với mức 0,02 kiểm định H: µ = 140000; K: µ ≠ 140000.
Giải:

B1. Công thức: H:

µ = 140000. K: µ ≠ 140000.

Z=

α
| X − µ0 | n
S
. P(zα/2) = 1 – 2

B2. Tóm tắt đề bài: X = 154000; µ0 = 140.000; n = 50; S = 62.000; α = 0,02
B3. Tra bảng – Tính toán
Tra bảng: P(tz/2) = 0,99 ⇒ zα/2 = 2,327. Tính Z = 1,5967
B4. Kết luận: Chấp nhận H.

Ghi chú:
1) p-value = 2 – 2P(Z) = 2 – 2P(1,5967) = 0,1103 > 0,05. Chấp nhận H.
2) Nếu sử dụng T-test thì t0,01(49) = T.INV(0,02;49) = 2,4049 > Z. Chấp nhận H.
Bài tập.
5


1. Một công ti có hệ thống máy tính có thể xử lí 1200 hóa đơn một giờ. Nhập một hệ thống
máy tính mới. Hệ thống này khi chạy kiểm tra trong 40 giờ cho thấy số hóa đơn được xử lí
trung bình trong 1 giờ là 1260, độ lệch chuẩn 215. Với mức 5% hãy nhận định xem hệ
thống mới có tốt hơn hệ thống cũ hay không?
2. Khối lượng quả (X gam) có phân phối chuẩn. Cân một số quả, số liệu ghi trong bảng.
a) Tiêu chuẩn là 30g. Với mức 5%, có thể nói loại quả trên đạt tiêu chuẩn hay không?
b) Vụ trước khối lượng trung bình là 29g. Với mức 5% có thể nói khối lượng trung bình đã
tăng lên hay không?
X
ni

[25 – 27)
7

[27 – 29)
10

[29 – 31)
17

[31 – 33)
14


[33 – 35)
8

[35 – 37]
7

3. Khối lượng mỗi sản phẩm do máy tự động sản xuất được quy định 6kg. Kiểm tra 121
sản phẩm có trung bình mẫu là 5,975kg, phương sai mẫu hiệu chỉnh 5,7596 (kg) 2. Với mức
5%, hãy kết luận về tình hình sản xuất.
c) X chuẩn, chưa biết σ, n < 30 (T- Test)
Ví dụ: Khối lượng (X gam)một loại quả có phân phối chuẩn. Cân thử một số quả có số
liệu cho trong bảng. Với mức 5%, kiểm định H: “µ = 30”.
X
ci
ni
Giải:

[25 – 27)
26
3

[27 – 29)
28
5

[29 - 31)
30
7

[31 - 33)

32
5

[33 - 35)
34
3

[35 – 37]
36
2

B1. Công thức
| X − µ0 |
n
S
H: “µ = 30”. K: “µ ≠ 30”. T =
. tα/2(n – 1) = T.INV.2T(α,k)

B2. Tóm tắt đề bài: n = 25; α = 0,05; X = (26.3 + ..+ 36.2):25 = 30,48. S = 2,9029.
(30,48 − 30).5
= 0,8267
2,9029
B3. t0,05/2(24) = T.INV.2T(0,05;24) = 2,0639. T =
.

p-value = T.DIST.2T(T;k) = T.DIST.2T(0,8267;24) = 0,4166. B4. Chấp nhận H.

Bài tập

6



1. Thu nhập của công nhân là biến ngẫu nhiên có phân phối chuẩn. Các năm trước thu
nhập trung bình của công nhân là 15 (triệu/năm). Năm nay điều tra 25 công nhân ta có số
liệu sau. Với mức 5% hãy kiểm định H: µ = 15; K: µ ≠ 15.
X
[10 – 12)
[12 – 14)
[14 – 16)
[16 – 18)
[18 – 20]
ci
ni
2
4
10
6
3
Với mức ý nghĩa 5% hãy kiểm định xem thu nhập trung bình của công nhân năm nay
có khác so với năm trước hay không, biết rằng
2. Mức xăng hao phí có phân phối chuẩn. Các năm trước hao phí cho một loại xe ôtô trên
đoạn đường AB là 50 lít. Năm nay, người ta nghi mức hao phí tăng. Điều tra 30 xe chạy
trên đoạn AB ta có số liệu sau. Với mức 1% hãy kết luận về nghi ngờ trên.
X
[49-49,5)
[49,5-50)
[50-50,5)
[50,5-51)
[51-51,5]
ci

ni
5
7
10
6
2
3. Khối lượng bao gạo là biến ngẫu nhiên có phân phối chuẩn tiêu chuẩn là 50 kg. Cân thử
25 bao và thu được kết quả như bảng. Với mức 5% hãy kiểm định K: “µ < 50”.
X
[48 - 48,5)
[48,5 – 49)
[49 – 49,5)
[49,5 – 50)
[50-50,5]
ci
ni
3
5
10
5
2
4. Một công ty sản xuất giống tuyên bố loại giống mới có năng suất trung bình 21,5 tạ/ha.
Gieo thử tại 16 vườn thí nghiệm thu được kết quả: 19,2; 18,7; 22,4; 20,3; 16,8; 25,1; 17,0;
15,8; 21,0; 18,6; 23,7; 24,1; 23,4; 19,8; 21,7; 18,9. Với mức 5%, xác nhận xem quảng cáo
của công ty có đúng không. Biết rằng năng suất giống cây trồng có phân phối chuẩn.
5. Một qui trình sản xuất dầu gội đầu có khối lượng trung bình là 20 kg. Một mẫu 9 kiện
có khối lượng như sau(kg): 21,4

19,7


19,7

20,6

20,8

20,1

19,7

20,3

20,9

Giả sử rằng phân phối của tổng thể là phân phối chuẩn, hãy kiểm định giả thuyết ở mức ý
nghĩa 5% dựa vào dạng kiểm định 2 đuôi với giả thuyết H cho rằng quá trình sản xuất thì
hoạt động một cách chính xác?
1.2.2. Z-test cho hai giá trị trung bình
a) Z-test cho hai giá trị trung bình; X, Y độc lập, chuẩn, biết σ1, σ2 gần nhau
Ví dụ: Hai phương án gia công cùng một loại chi tiết, chi phí như sau. Với mức 5%, kiểm
định H: µX = µY; K: µX ≠ µY. Biết X, Y có phân phối chuẩn với σ12 = σ22 = 0,16.
7


X
Y
Giải:

2,5
2,0


3,2
2,7

3,5
2,5

Z=

B1. Công thức H:

µX = µY. K: µX ≠ µY.

3,8
2,9

3,5
2,3

x
2,6

| X1 − X 2 |

σ 12 σ 22
+
n1 n2

α
; P(zα/2) = Φ( zα/2) = 1- 2


B2. Tóm tắt đề bài: n1 = 5; n2 = 6; σ12 = σ22 = 0,16; X = 3,3; Y = 2,5; α = 0,05.
B3. Tra bảng – Tính toán: zα/2 = 1,96. Z = 3,33. Bác bỏ H.
Ghi chú: p-value = 2 – 2P(Z) = 2 – 2P(3,33) = 0,0009.
Bài tập.
1. Hai máy X và Y sản xuất tự động một loại chi tiết máy có độ dài chuẩn với σX = 2,1; σY
= 2,2. Lấy mỗi loại 100 sản phẩm để kiểm tra thấy X = 151,2; Y = 151,9. Với mức

0,05; kiểm định H: µX = µY; K: µX < µY.
2. Điểm của học sinh học trường tư (X) và trường công (Y) có phân phối chuẩn. Từ các số
liệu sau: nX = 60; X = 104; σX = 14. nY = 60; Y = 110; σY = 14,2. Với mức 5%, kiểm

định H: µX = µY; K: µX ≠ µY.
b) Z-test hai trung bình; X, Y độc lập, chuẩn, chưa biết σ1, σ2 gần nhau; n1, n2 ≥ 30
Ví dụ: Giá cổ phiếu có phân phối chuẩn. Theo dõi giá cổ phiếu 31 ngày của công ti A và B
có: A = 37,58; SA = 1,5. B = 38,24; SB = 2,20.
Với mức 4%. Kiểm định H: µA = µB. K: µA < µB.
T=

B1. Công thức

| X1 − X 2 |
S12 S 22
+
n1 n2

; P(zα) = 1 – α hoặc tα(n1 + n2 – 2)

B2. Tóm tắt đề bài (như trên)
B3. Tra bảng–Tính toán: T = 1,3801. zα = 1,755. t0,04(60) = T.IVN(0,96;60) = 1,7808

B4. Trả lời: Chấp nhận H.
Bài tập
1. Tuổi thọ bóng đèn có phân phối chuẩn. Theo dõi hai loại bóng đêèn A và B ta có:

8


nA = 36; A = 1250; SA = 20. nB = 35; B = 1260; SB = 30. Với mức 6%, kiểm định H: µA =
µB. K: H: µA ≠ µB.
2. Trồng thử hai giống lúa A và B, các số liệu như sau: n A = 30; A = 45; SA = 2,5. nB = 30;
B = 46,5. SB = 4,0. Với mức 5%, kiểmđịnh H: µA = µB. K: µA < µB.

3. Giá cổ phiếu có phân phối chuẩn. Theo dõi giá cổ phiếu của hai công ti A và B trong 31
ngày có: A = 37,58; SA = 1,5. B = 38,24; SB = 2,2. Với mức 5%, kiểmđịnh H: µA = µB. K:
µ A ≠ µ B.
c) T-test hai trung bình; X, Y độc lập, chuẩn, chưa biết σ1, σ2 gần nhau; n1 , n2 < 30
Ví dụ: Thu nhập trong hai nhà máy có phân phối chuẩn? Điều tra thu nhập trong một
tháng của công nhân ở hai nhà máy sản xuất thiết bị điện tử A và B ta thu được:
Nhà máy A: 91,5; 94,18; 92,18; 95,39; 91,79; 89,07; 94,72; 89,21.
Nhà máy B: 89,19; 90,95; 90,46; 93,21; 97,19; 97,04; 91,07; 92,75.
Với mức 5%, kiểm định H: µA = µB; K: µA ≠ µB.
Giải:
B1. Công thức

S2 =

(nA − 1)S + (nB − 1) S
n A + nB − 2
;T=
2

A

2
B

| A− B |
1 1
S
+
nA nB

; tα/2(nA + nB –2) = T.INV.2T(α,nA + nB – 2)

B2. Tóm tắt đề bài
nA = nB = 8; α = 0,05. A = 92, 255; SA2 = 4,998; B = 92,733; SA2 = 7,77
B3. Tra bảng – Tính toán
t 0,0025(14) = T.INV.2T(0,05;14) = 2,1448
7
S = 14 (4,998 + 7,77) = 6,3844 ⇒ T = 0,3784.
2

p-value = T.DIST.2T(0,3784;14) = 0,7108
B4. Chấp nhận H.
Bài tập
1. Với mức 0,05 hãy xem thu nhập hàng năm (tính bằng triệu đồng) của dân cư hai thành
phố A, B đó có thực sự khác nhau hay không. Các số liệu như sau (giả sử thu nhập của dân
cư hai thành phố có phân bố chuẩn, phương sai như nhau.
9



nA = 20; A = 18,27 ; SA2 = 8,74. nB = 19; B = 16,78; SB2 = 6,53.
2. Năng suất (tạ/ha) giống lúa có phân phối chuẩn. Khảo sát giống A và giống B trên các
thửa ruộng như bảng. Với mức 5% kiểm định H: µA = µB; K: µA ≠ µB.
A
B

40
41

38
44

40
38

42
42

44
40

41
45

36
39

39
37


x
43

x
41

3. Khối lượng trẻ sơ sinh có phân phối chuẩn. Nhóm A (mẹ không nghiện thuốc lá) có: n A
= 15; A = 3,5533; SA0,3707. Nhóm B (mẹ nghiện): nB = 14; B = 3,2029 ; SB = 0,4927. Với
mức 5%, kiểm định H: µA = µB; K: µA > µB.
4. Tiền lương trung bình hàng tuần có phân phối chuẩn. Khảo sát 29 công nhân ở xí
nghiệp A là 1.800.000đ; độ lệch chuẩn hiệu chỉnh là 140.000đ. Ở xí nghiệp B tương ứng là
1.700.000đ; 100.000đ. Với mức 5%, kiểm định H: µA = µB; K: µA ≠ µB.
5. Khối lượng trẻ sơ sinh trai (T) và gái (G) có phân phối chuẩn cùng phương sai. Khảo
sát, ta có: nT = 20; T = 3200; ST = 400. nG = 17; G = 3000; SG = 3800.
d) T-test hai trung bình; X, Y chuẩn độc lập; chưa biết σ1, σ2 không chắc gần nhau
Ví dụ: Để kiểm nghiệm hiệu quả của một sáng kiến nhằm tăng năng suất, người ta chọn
ngẫu nhiên 7 ngày làm việc của từng nhóm: Nhóm I có áp dụng phương pháp mới và
Nhóm II không áp dụng phương pháp mới. Kết quả có được về năng suất của từng nhóm
như sau: Nhóm I: 40, 54, 26, 63, 21, 37, 39. Nhóm II: 18, 43, 28, 50, 16, 32, 13. Với mức
0,05; hãy kết luận xem phương pháp mới có thực sự hiệu quả hay không. Giả thiết rằng
năng suất của mỗi loại đều có phân bố chuẩn.
Giải: (một phía)
T=

B1. Công thức:

| X1 − X 2 |
S12 S 22
+
n1 n2


;

C=

S12 S12 S 22
(n − 1)( n2 − 1)
: ( + ) k ≈ 21
n1 n1 n2 ;
C (n1 + n2 − 2) ; t (k) hoặc t (k).
α/2
α

B2. Tóm tắt đề bài:
n1 = 7; X = 40,00; S12 = 215,33. n2 = 7; Y = 28,57; S22 = 198,62; α = 0,05
C=

6.6
215,33 215,33 + 198, 62
= 11,1
:
= 0,5202 ⇒ k ≈
2
0,5202 (6 + 6 − 2)
7
7
⇒ k = 11.

B3. Tra bảng – Tính toán: t0,05(11) = T.INV(0,95;11) = 1,7959. T = 1,4864
p-value = T.DIST.2T(1,4864;11) = 0,1653

10


B4. Trả lời: Chấp nhận H.
Bài tập.
1. Số lượng của một nguyên tố vi lượng trong máu nam (X), nữ (Y) có phân phối chuẩn.
Từ các số liệu: nX = 75; X = 28 ppm; SX = 14,1 ppm. nY = 50; Y = 33ppm; SX = 9,5ppm.
Với mức 0,05; kiểm định µX = µY; K: µX < µY.
2. Chiều dài chi tiết máy có phân phối chuẩn. Kiểm tra ở phân xưởng X và Y có số liệu: n X
= 40; X = 2,3 inches; SX = 0,2 inches. nY = 30; Y = 2,25 inches; SY = 0,28. Với mức 0,05;
kiểm định µX = µY; K: µX ≠ µY.
e) T-test cho hai trung bình không độc lập (có thể bắt cặp, chẳng hạn ví dụ sau)
Ví dụ: Điểm 2 bài kiểm tra lần 1 (X) và lần 2 (Y) của 31 sinh viên như sau. Với mức 5%
hãy kiểm định H: X = Y ; K: X > Y (một phía).

X
Y

3
3

X
Y

5
6

3
3
5

6

3
3
6
6

3
4

4
4

6
6

6
7

4
4
6
7

4
5
6
7

4

5
7
7

5
5
7
7

5
5
7
7

5
5
7
8

5
5
8
8

8
8

5
5


5
6

5
6

9
8

9
9

9
10

B1. Công thức
| X −Y |

T=

S + S − 2rS X SY
2
X

2
Y

n

|D|

n
S
D
=
; với D = X - Y

tα/2(2n – 2) = T.INV.2T(α;2n – 2) – Hai phía
tα(2n – 2) = T.INV(1-α,2n-2) – Một phía
B2. Tóm tắt đề bài
nX = 31; X = 5,6129; MSX =1,7538; SX = 1,7828; α = 0,05
nY = 31; Y = 5,9677; MSY =1,7318; SY = 1,7604; r = 0,9518
B3. Tra bảng – Tính toán
t0,05(60) = T.IVN(0,95;60) = 1,6706. T = 3,5893. Nếu Z-test thì z0,05 = 1,645.
B4. Trả lời: Bác bỏ H.
Ghi chú: p-value = T.DIST.2T(3,5893;60) = 0,00067.
Bài tập (Mời xem thêm phần 2).
1.2.3. Z-test cho một tỷ lệ
11


Ví dụ: Theo một nguyên lí sinh học, một loài hoa có 25% màu đỏ. Khảo sát 400 hoa thấy
88 hoa màu đỏ. Với mức 5%, kiểm định H: p = 0,25. K: p < 0,25.
Hướng dẫn
Cách 1. Z - TEST trực tiếp.
Bước 1.
| f − p0 |

Công thức H:

p = 0,25. K: p < 0,25. T =


p0 q0

n

. P(tα) = Φ( tα) = 1 - α

Bước 2. Tóm tắt đề bài: p0 = 0,25; f = 88:400 = 0,22; n = 400; α = 0,05.
Bước 3. Tra bảng: t0,05 = 1,645. T = 1,3856.
Bước 4. Chấp nhận H.
Ghi chú: p-value = 1 – P(T) = 1 – 0,9171 = 0,0829 (một phía).
Cách 2. T- TEST trực tiếp:
t0,05(399) = T.INV(0,95;399) = 1,6487 > T = 1,3856. Chấp nhận H.
Ghi chú: p-value = T.DIST.2T(T;k):2 = T.DIST.2T(1,3856;399):2 = 0,1666 :2 = 0,0833.
Cách 3. Kiểm định thông qua ước lượng p:

ε=

n

Chấp nhận H.

Bài tập.
12

1, 6487

t α (n − 1) f (1 − f )

=


88.312
400.400
20
= 0,0341 ⇒ 0,1859 < p = 0,25 < 0,2541


1. Trước cải tiến kĩ thuật, tỉ lệ phế phẩm là 5%. Sau cải tiến, khảo sát 500 sản phẩm thấy
15 phế phẩm. Với mức 5%, kiểm định H: p = 0,05. K: f < 0,05.
2. Tỷ lệ khách du lịch trở lại là được quy định 60%. Khảo sát 300 khách thấy 162 người
trở lại. Với mức 0,025%, kiểm định H: p = 60%; K: p < 60%.
3. Một mẫu ngẫu nhiên gồm 160 nhà doanh nghiệp, trong đó 62 người đồng ý với câu nói:
Một sự nổi tiếng trong cách cư xử và lối sống có đạo đức thì ít quan trọng trong cơ hội
được thăng chức của các quản đốc và trưởng phó phòng hơn là sự nổi tiếng về việc kiếm
ra tiền cho công ty. Hãy kiểm định giả thuyết H cho rằng phân nửaa trong tất cả nhà doanh
nghiệp đồng ý với câu nói trên dựa vào kiểm định dạng 2 đuôi.
4. Một cục xúc sắc 4 mặt được tung ngẫu nhiên 1000 lần và ta quan sát thấy có 290 lần
mặt số 4 xuất hiện. Liệu ta có đủ chứng cứ để kết luận rằng cục xúc sắc là bất thường?
1.2.4. Z-test cho hai tỷ lệ
a) Z-test cho hai tỷ lệ, biết p
Ví dụ. Tỉ lệ khách du lịch trở lại trong 2 năm sau ở các khách sạn trong Thành phố Hải
Long là 30%. Khách sạn A có 1200 khách thì có 355 người trở lại. Khách sạn B có 1300
thì có 400 người trở lại. Với mức 5%, kiểm định H: pA = pB; K: pA < pB.
Giải:
| f A − fB |

B1. Công thức T =

p(1 − p ) p (1 − p)
+

nA
nB

; tα(n - 1) = T.INV(1 - α;n – 1)

B2. Tóm tắt đề bài: nA = 1200; fA = 0,2958; nB = 1300; fB = 0,3077; p = 0,3; α = 0,05
B3. Tra bảng t0,05(2499) = 1,6455 ≈ 1,645 = z0,05.

Tính T =

| fA − fB |
p (1 − p) p (1 − p )
+
nA
nB

= 0,6847

B4. Trả lời: Chấp nhận H.
Ghi chú: p-value = T.DIST.2T(T;k):2 = 0,4936. Chấp nhận H.
b) Z-test hai tỷ lệ, chưa biết p
Ví dụ 4. Khảo sát 500 người ở thành phố A, có 34%. Khảo sát 750 ở thành phố B, có 40%
ủng hộ đảng Dân chủ. Với mức 5%, kiểm định H: pA = pB; K: pA < pB.
13


Hướng dẫn
Cách 1. Z - TEST trực tiếp.
Bước 1.


Công thức H:

pA = pB; K: pA < pB. P(tα) = Φ( tα) = 1 - α

| f A − fB |
f (1 − f ) f (1 − f )
+
nA
nB

T=

n A f A + nB f B
; f = n A + nB

Bước 2. Tóm tắt đề bài: fA = 0,34; fB = 0,4; nA = 500; nB = 750
Bước 3. Tra bảng: t0,05 = 1,645. Tính f = 0,376; T = 2,1455.
Bước 4. Bác bỏ H.
Ghi chú:
1) p-value = 1 – P(T) = 1 – 0,98404 = 0,0196 (một phía).
2) Nếu sử dụng T-Test thì t0,05(1249) = T.INV(0,95;1249) = 1,6461 < T.
Bài tập.
1. Kiểm tra ngẫu nhiên các sản phẩm cùng loại do hai nhà máy sản xuất thu được các số
liệu sau: X: n = 1100, có 22 phế phẩm; Y: n =900, có 31 phế phẩm.
Với mức 0,05 có thể coi tỷ lệ phế phẩm của hai nhà máy là như nhau hay không.
2. Ðể đánh giá hiệu quả của việc khích lệ sự trả lời bằng thư của khách hàng trong một
nghiên cứu tìm hiểu thị hiếu tiêu dùng sản phẩm. Công ty dùng cả hai hình thức, gởi bảng
câu hỏi kèm quà khích lệ và không kèm quà.
Trường hợp 1: Gởi 432 bảng câu hỏi kèm quà thì tỷ lệ thất thoát là 9,1% (tỷ lệ mà công
14



ty không nhận lại bảng câu hỏi từ khách hàng).
Trường hợp 2: Gởi 431 bảng câu hỏi không kèm quà thì tỷ lệ thất thoát là 10,4%.
Với mức 5%, hãy kiểm định H: Tỷ lệ của hai tổng thể bằng nhau. K: Tỷ lệ lớn hơn trong
trường hợp không có quà kèm theo bảng câu hỏi.
3. Điều tra hiện tượng học sinh bỏ học ở hai vùng nông thôn A và B ta thu được số liệu
sau: Vùng A: Điều tra 1900 em có 175 em bỏ học. Vùng B: Điều tra 2600 em có 325 em
bỏ học. Có ý kiến cho rằng tình trạng học sinh bỏ học ở vùng nông thôn A là ít nghiêm
trọng hơn vùng nông thôn B. Với mức ý nghĩa 1% hãy kiểm định ý kiến đó.
2. Nói thêm về T – TEST
2.1. Kiểm định T-TEST có 3 trường hợp chính
1) T-test một mẫu (One-Sample T Test)
H: “ X = µ ”. T =

| X −µ |

σ

n

. Nếu chưa có σ, có thể lấy S thay thế.

tα/2(n – 1) = T.INV.2T(α,n-1); tα(n – 1) = T.INV(1-α,n-1)
2) T-test 2 mẫu từng cặp Pair sample T test. (1 phía hoặc 2 phía; phương sai như nhau hoặc
gần nhau; thường là 1 phía với phương sai như nhau). H: “µX = µY”.
Kiểm định T-test cặp đôi cần có các điều kiện:
a) Hai mẫu ngẫu nhiên.
b) Biến đo lường là biến liên tục (biến nhị phân thì sử dụng kiểm định McNemar).
c) Biến sai phân giữa 2 nhóm có phân phối chuẩn hoặc xấp xỉ chuẩn.

d) Các quan sát của 2 nhóm có quan hệ với nhau, nghĩa là một đối tượng chỉ ứng với chỉ
một cặp quan sát.
e) Không có điểm dị biệt trong tập dữ liệu.
Một số cách kiểm định:
TT
01

Paired Two Sample T test
Tính trực tiếp

T=

|d |
| X −Y |
n=
2
Sd
S X + SY2 − 2rS X SY

Ghi chú
d = X - Y = x1-y1,

n

x2 – y2, …, xn – yn
tα/2(nX + nY – 2)

15



C2. Sd = S X + SY − 2rS X SY
T.TEST(array1,array2,1,1)
t.test(x, y, paired = TRUE,
2

02
03

Trong Excel
Trong R

2

alternative = "two.sided")
04
Trong Stata
05
Trong SPSS
06
Trong Mple 18


3) T-test 2 mẫu độc lập - Independent Samples T Test (1 phía hoặc 2 phía; phương sai gần
nhau). H0: “ X = Y ”
Kiểm định Independent Samples T Test cần có điều kiện:
a) Hai mẫu độc lập, ngẫu nhiên.
b) Biến phụ thuộc phải là biến liên tục: cân nặng, chiều cao,…
c) Biến phụ thuộc có phân phối chuẩn hoặc xấp xỉ chuẩn.
d) Biến phụ thuộc có phương sai đồng nhất (tỉ lệ từ 0,85 đến 1,15)
e) Biến độc lập là biến phân loại 2 mức: Thành thị - Nông thôn; Trường A -Trường B;…

f) Không có điểm dị biệt trong tập dữ liệu.
Một số cách kiểm định:
TT

Independent Samples T Test

01

Tính trực tiếp

02

Trong Excel

Ghi chú
| X −Y |

nX, nY ≥ 30

σ X2 σ Y2
+
nX
nY

Nếu chưa có σX, σY

T=
T.TEST(array1,array2,1,2)
T.TEST(array1,array2,1,3) tTEST:


Two

-

Sample

Assuming Equal Variances
T.TEST(array1,array2,2,2)
T.TEST(array1,array2,2,3)
t-TEST:

Two

-

Sample

thì dùng SX, SY
nX hoặc nY < 30 thì
(n X − 1) S X2 + (nY − 1) SY2
n X + nY − 2
S2 =

T=

| X −Y |
1
1
S2(
+

)
nX
nY

Assuming Unequal Variances tα/2(nX + nY – 2)

03
04
16

Trong R
Trong Stata


05 Trong SPSS
06 Trong Mple 18
Ghi chú: T-TEST trong Excel
Cú pháp T.TEST(array1,array2,tails,type)
Array1: Tập dữ liệu thứ nhất.
Array2: Tập dữ liệu thứ hai.
Tails: Xác định số đuôi (1 hoặc 2).
Type: (1: Từng cặp. 2: Hai mẫu cùng phương sai. 3: Hai mẫu khác phương sai)
Các đối số kiểu và đuôi sẽ được cắt bớt để trở thành số nguyên. Kiểu 1 yêu cầu n 1 = n2.
Nếu đuôi hoặc kiểu không phải là số, T.TEST sẽ trả về giá trị lỗi #VALUE! .
Nếu đuôi là giá trị khác 1 hoặc 2, T.TEST sẽ trả về giá trị lỗi #NUM! .
Nếu đuôi =1, T.TEST trả về xác suất có giá trị cao hơn trong thống kê T dựa vào giả thuyết
là mảng 1 và mảng 2 là các mẫu có từ các tập hợp có cùng giá trị trung bình. Giá trị được
T.TEST trả về khi đuôi = 2 là gấp đôi giá trị được trả về khi đuôi = 1.
2.2. Ví dụ - Bài tập
2.2.1. T-test một mẫu (One-sample t-test)

Ví dụ: Một loại mì ăn liền có khối lượng Xg/gói tuân theo phân phối chuẩn, với khối
lượng quy định là 225g. Điều tra một mẫu ta có bảng sau. Với mức α = 0,05 hãy kiểm
định H0 : X = 225 ; H1 : X ≠ 225 .
X
200
210
ni
5
15
Cách 1. Thực hiện kiểm định trực tiếp
t = 1,96; T =

|X −µ|
S

n =

225 − 214,75
8,4694

220
16
40

230
4

= 7,6542; bác bỏ H0.

Ghi chú: p-value = 1 – 2Q(T) = 0; bác bỏ H0.

Cách 2. Thực hiện t-test trong Stata, cú pháp: ttest varname = μ0, level(1- α)

17


p-value = 0,0000; bác bỏ H0.
Cách 3. Thực hiện t-test trong SPSS
Analyze → Compre Means → T. One-Sample T TEST

Chuyển biến Mitom vào khung Test Variable (s) → Options (gõ Độ tin cậy, mặc
định 95%) → Gõ µ0 vào ô Test Value → OK

p-value = 0,000 < 0,05; bác bỏ H0.
Cách 4. Thực hiện t-test trong R
18


p-value = 2,756.10-9 = 0,000000002756 ≈ 0 < 0,05; bác bỏ H0.
Cách 5. Thực hiện t-test trong Maple 18

p-value = 2,75566.10-9 = 0,00000000275566 ≈ 0 < 0,05; bác bỏ H0.
Cách 6. Thực hiện t-test trong Excel

19


Bài tập
2.2.2. T-test hai mẫu độc lập (Independent Sample T test)
Ví dụ:
Điểm 2 bài kiểm tra X, Y độc lập của 31 sinh viên như sau. Với mức 5% hãy kiểm định

H0: X = Y ; H1: X ≠ Y (hai phía) hoặc H1: X > Y (một phía).
Điểm
n1
n2

3
4
3

Lời giải
Xét các điều kiện.
20

4
4
3

5
9
7

6
5
6

7
4
6

8

2
4

9
3
1

10
0
1

Cộng
n = 31
n = 31


Điều kiện
Biến độc lập phân làm 2 loại
Biến phụ thuộc là biến liên tục
Biến phụ thuộc có phân phối xấp xỉ chuẩn.
Hai mẫu độc lập
Không có điểm dị biệt trong từng mẫu
Phương sai khá gần nhau

Vận dụng
Điểm lần 1, lần 2
Coi: 3 ≤ X, Y ≤ 10
Kiểm định (1)
Quá lớn hoặc quá nhỏ
3,1785:3,0989 = 1,22


Kết luận
Phù hợp
Phù hợp
Phù hợp
Phù hợp
Phù hợp
Khá phù hợp

(1) Kiểm định dữ liệu xấp xỉ chuẩn. p-value = 0,3354 > 0,05.

Cách 1. Kiểm định trực tiếp
(5, 9677 − 5, 6129) 31
3,1785 + 3, 0989 = 0,78845; t = 1,96; t = 1,645.
T=
α/2
α

⇒ p-value (2 phía) = 2 – 2P(T) = 0,4304; p-value (1 phía) = 0,2152. Chấp nhận H0.
Cách 2. Kiểm định trong Excel. Xem X, Y độc lập cùng phương sai (khá gần nhau).
Ghi chú: F-TEST (trước). H0: V(X) = V(Y), p-value = 0,9451; chấp nhận H0.

21


Cách 3. Kiểm định trong Excel. Xem X, Y độc lập khác phương sai (có khác chút).

22



Cách 4. Kiểm định trong Maple 18.
DX
Kiểm định phương sai như nhau: DY = 1.

23


T-test. p-value = 0,4335.

Cách 5. Kiểm định trong R (Mặc định hai biến độc lập). p-value = 0,4335.

24


Cách 6. Kiểm định trong R (Khai báo hai biến độc lập). p-value = 0,4335.

Cách 7. Kiểm định trong SPSS.

25


×