Tải bản đầy đủ (.pdf) (24 trang)

Đáp ánbài tập ôn xác suất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (511.25 KB, 24 trang )

Dạng 1: Ước lượng trung bình của tổng thể
Bài tập giáo trình: Từ bài 4.14 – 4.54
Bài tập thêm:
1. The yield of a chemical process is being studied. From previous experience, yield is known
to be normally distributed and 𝜎 = 3. The past five days of plant operation have resulted in the
following percent yields: 91.6, 88.75, 90.8, 89.95, and 91.3. Find a 95% two-sided confidence
interval on the true mean yield.
(Sản lượng của một q trình hóa học đang được nghiên cứu. Theo kinh nghiệm trước đây,
năng suất có phân phối chuẩn với σ = 3. Sau 5 ngày vận hành, sản lượng thu được có phần
trăm như sau: 91,6, 88,75, 90,8, 89,95 và 91,3. Tìm khoảng tin cậy 95% cho năng suất trung
bình của q trình hóa học trên.)
Bài làm
Gọi X là năng suất của q trình hóa học trên.
Theo đề bài, ta có:
𝑋 ∼ 𝑁(𝜇, 𝜎 2 )
𝜎=3
Dựa trên dữ kiện đề bài, ta tính được:
𝑛 = 5 (𝑛 < 30)
𝑥̅ = 90.48
Gọi 𝜇 là năng suất trung bình của q trình hóa học.
Thống kê: 𝑍 =

𝑋̅ −𝜇
𝜎
√𝑛

∼ 𝑁(0,1)

Với độ tin cậy 95%, ta có: 𝛼 = 0.05
⇒ 𝑧1−𝛼 = 𝑧
2



1−

0.05
2

= 𝑧0.975 = 1.96

Sai số ước lượng: 𝜖 = 𝑧1−𝛼 ×
2

𝜎
√𝑛

= 1.96 ×

3
√5

= 2.63

Khoảng tin cậy 95% cho trung bình 𝜇 là:
𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖
⇔ 90.48 − 2.63 < 𝜇 < 90.48 + 2.63
⇔ 87.85 < 𝜇 < 93.11


Vậy: Khoảng tin cậy 95% cho năng suất trung bình của q trình hóa học là (87.85; 93.11)%

2. The life in hours of a 75-watt light bulb is known to be normally distributed with 𝜎 = 25

hours. A random sample of 20 bulbs has a mean life of 𝑥̅ = 1014 hours.
(a) Construct a 95% two-sided confidence interval on the mean life.
(b) Suppose that you wanted the total width of the two-sided confidence interval on mean life
to be six hours at 95% confidence. What sample size should be used?
(Tuổi thọ của một bóng đèn 75W được biết là có phân phối chuẩn với 𝜎 = 25 giờ. Một mẫu
gồm 20 bóng đèn có tuổi thọ trung bình 𝑥̅ = 1014 giờ.
a) Hãy tìm khoảng tin cậy 95% cho trung bình tuổi thọ của các bóng đèn 75W
b) Giả sử rằng sai số ước lượng là 6 giờ thì phải số bóng đèn cần phải sử dụng là bao nhiêu?)
Bài làm
a) Gọi X là tuổi thọ của các bóng đèn.
Theo đề bài, ta có:
𝑋 ∼ 𝑁(𝜇, 𝜎 2 )
𝜎 = 25
Dựa trên dữ kiện đề bài, ta tính được:
𝑛 = 20 (𝑛 < 30)
𝑥̅ = 1014
Gọi 𝜇 là tuổi thọ trung bình của các bóng đèn 75W.
Thống kê: 𝑍 =

𝑋̅ −𝜇
𝜎
√𝑛

∼ 𝑁(0,1)

Với độ tin cậy 95%, ta có: 𝛼 = 0.05
⇒ 𝑧1−𝛼 = 𝑧
2

1−


0.05
2

= 𝑧0.975 = 1.96

Sai số ước lượng: 𝜖 = 𝑧1−𝛼 ×
2

𝜎
√𝑛

= 1.96 ×

25
√20

= 10.96

Khoảng tin cậy 95% cho trung bình 𝜇 là:
𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖
⇔ 1014 − 10.96 < 𝜇 < 1014 + 10.96
⇔ 1003.04 < 𝜇 < 1024.96
Vậy: Khoảng tin cậy 95% cho tuổi thọ trung bình của các bóng đèn 75W là
(1003.04; 1024.96) giờ.


b) Sai số ước lượng bằng 6 giờ với độ tin cậy 95% nghĩa là:
𝜖=6
⇔ 𝑧0.975 ×

⇔ 1.96 ×

𝜎
√𝑛
25
√𝑛

=6
=6

⇔ 𝑛 = 66.69
Vậy cần sử dụng 67 bóng đèn 75W để sai số ước lượng bằng 6 giờ.

3. A civil engineer is analyzing the compressive strength of concrete. Compressive strength is
normally distributed with 𝜎 2 = 1000 (𝑝𝑠𝑖)2. A random sample of 12 specimens has a mean
compressive strength of 𝑥̅ = 3250 psi.
(a) Construct a 95% two-sided confidence interval on mean compressive strength
(b) Suppose that it is desired to estimate the compressive strength with an error that is less than
15 psi at 99% confidence. What sample size is required?
(Một kỹ sư cơng trình đang phân tích cường độ nén của bê tơng. Cường độ có phân phối chuẩn
với 𝜎 2 = 1000 (𝑝𝑠𝑖)2. Một mẫu ngẫu nhiên gồm 12 mẫu thử có cường độ nén trung bình là
𝑥̅ = 3250 psi.
(a) Xây dựng khoảng tin cậy hai phía 95% về cường độ nén trung bình
(b) Giả sử trong, người ta muốn ước tính cường độ nén với sai số nhỏ hơn 15 psi với độ tin cậy
99% thì cần phân tích bao nhiêu mẫu?)
Bài làm
a) Gọi X là cường độ nén của bê tơng.
Theo đề bài, ta có:
𝑋 ∼ 𝑁(𝜇, 𝜎 2 )
𝜎 2 = 1000 ⇒ 𝜎 = 10√10

𝑛 = 12 < 30
𝑥̅ = 3250
Gọi 𝜇 là cường độ nén trung bình của bê tơng
Thống kê: 𝑍 =

𝑋̅ −𝜇
𝜎
√𝑛

∼ 𝑁(0,1)

Với độ tin cậy 99%, ta có: 𝛼 = 0.01
⇒ 𝑧1−𝛼 = 𝑧1−0.01 = 𝑧0.995 = 2.575
2

2


Sai số ước lượng: 𝜖 = 𝑧1−𝛼 ×
2

𝜎
√𝑛

= 2.575 ×

10√10
√12

= 23.51


Khoảng tin cậy 99% cho trung bình 𝜇 là:
𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖
⇔ 3250 − 23.51 < 𝜇 < 3250 + 23.51
⇔ 3226.49 < 𝜇 < 3273.51
Vậy: Khoảng tin cậy 99% cho cường độ nén bê tơng trung bình là (3226.49; 3273.51) psi
b) Sai số nhỏ hơn 15 với khoảng tin cậy 99% nghĩa là:
𝜖 < 15
⇔ 𝑧0.995 ×
⇔ 2.575 ×

𝜎
√𝑛

< 15

10√10
√𝑛

< 15

⇔ 𝑛 > 29.47
Vậy: Muốn tính sai số ước lượng nhỏ hơn 15 psi thì cần khảo sát ít nhất 30 mẫu.

4. A healthcare provider monitors the number of CAT scans performed each month in each of
its clinics. The most recent year of data for a particular clinic follows (the reported variable is
the number of CAT scans each month expressed as the number of CAT scans per thousand
members of the health plan):
2.31, 2.09, 2.36, 1.95, 1.98, 2.25, 2.16, 2.07, 1.88, 1.94, 1.97, 2.02.
(a) Find a 95% two-sided CI on the mean number of CAT scans performed each month at this

clinic.
(b) Historically, the mean number of scans performed by all clinics in the system has been 1.95.
If there any evidence that this clinic performs more CAT scans on average than the overall
system average?
(Một nhà cung cấp dịch vụ chăm sóc sức khỏe giám sát số lần quét CAT được thực hiện mỗi
tháng tại mỗi phòng khám của họ. Dữ liệu năm gần đây nhất cho một phòng khám cụ thể theo
sau (biến được báo cáo là số lần quét CAT mỗi tháng được biểu thị bằng số lần quét CAT trên
một nghìn thành viên của kế hoạch sức khỏe):2,31, 2,09, 2,36, 1,95, 1,98, 2,25, 2,16, 2,07,
1,88, 1,94, 1,97, 2,02.
(a) Tìm khoảng tin cậy 95% trên số lần quét CAT trung bình được thực hiện mỗi tháng tại
phòng khám này.
(b) Trước đây, số lần quét trung bình được thực hiện bởi tất cả các phịng khám trong hệ thống
là 1,95. Có bất kỳ bằng chứng nào cho thấy phòng khám cụ thể này thực hiện nhiều lần qt
CAT hơn mức trung bình của tồn hệ thống?)


Bài làm
Gọi X là số lần quét CAT mỗi tháng.
Theo dữ kiện đề bài, ta tính được:
𝑛 = 12 (𝑛 < 30)
𝑥̅ = 2.082
𝑠 = 0.156
a) Gọi 𝜇 là số lần quét CAT trung bình của mỗi tháng.
Thống kê: 𝑇 =

𝑋̅ −𝜇
𝑆
√𝑛

∼ 𝑇𝑛−1 (với 𝑛 = 12)


Với độ tin cậy 95%, ta có: 𝛼 = 0.05
𝑛−1
12−1
11
⇒ 𝑡1−
𝛼 = 𝑡 0.05 = 𝑡0.975 = 2.201
2

1−

2

𝑛−1
Sai số ước lượng: 𝜖 = 𝑡1−
𝛼 ×
2

𝑠
√𝑛

= 2.201 ×

0.156
√12

= 0.099

Khoảng tin cậy 95% cho trung bình 𝜇 là:
𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖

⇔ 2.082 − 0.099 < 𝜇 < 2.082 + 0.099
⇔ 1.983 < 𝜇 < 2.181
Vậy: Khoảng tin cậy 95% cho số lần qt CAT trung bình của dịch vụ chăm sóc sức khỏe là
(1.983; 2.181) lần.
b) Vì 1.95 < (1.983; 2.181)
Vậy: Với độ tin cậy 95%, có thể khẳng định phịng khám thực hiện qt CAT nhiều hơn trung
bình của tồn hệ thống.

5. The wall thickness of 25 glass 2-liter bottles was measured by a quality-control engineer.
The sample mean was 𝑥̅ = 4.05 millimeters, and the sample standard deviation was s = 0.08
millimeter. Find a 95% lower confidence bound for mean wall thickness.
(Độ dày thành của 25 chai thủy tinh 2 lít được đo bởi một kỹ sư quản lý chất lượng. Giá trị
trung bình của mẫu là 𝑥̅ = 4.05 mm và độ lệch chuẩn của mẫu là s = 0.08 mm. Tìm khoảng
tin cậy 95% cho độ dày trung bình của thành chai.)
Bài làm
Gọi X là độ dày của thành chai
Theo đề bài, ta có:
𝑛 = 25 (𝑛 < 30)


𝑥̅ = 4.05
s = 0.08
Gọi 𝜇 là cường độ dòng điện trung bình chạy qua ống hình tivi.
Thống kê: 𝑇 =

𝑋̅ −𝜇
𝑆
√𝑛

∼ 𝑇𝑛−1 (với 𝑛 = 25)


Với độ tin cậy 95%, ta có: 𝛼 = 0.05
𝑛−1
25−1
24
⇒ 𝑡1−
𝛼 = 𝑡 0.05 = 𝑡0.975 = 2.0639
2

1−

2

𝑛−1
Sai số ước lượng: 𝜖 = 𝑡1−
𝛼 ×
2

𝑠
√𝑛

= 2.0639 ×

0.08
√25

= 0.033

Khoảng tin cậy 95% cho trung bình 𝜇 là:
𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖

⇔ 4.05 − 0.033 < 𝜇 < 4.05 + 0.033
⇔ 4.017 < 𝜇 < 4.083
Vậy: Khoảng tin cậy 99% cho độ dày trung bình của chai là (4.017; 4.083) 𝑚𝑚

6. An article in Medicine and Science in Sports and Exercise [“Maximal Leg-Strength Training
Improves Cycling conomy in Previously Untrained Men” (2005, Vol. 37, pp. 131–136)]
studied cycling performance before and after eight weeks of egstrength training. Seven
previously untrained males performed leg-strength training three days per week for eight weeks
(with four sets of five replications at 85% of one repetition maximum). Peak power during
incremental cycling increased to a mean of 315 watts with a standard deviation of 16 watts.
Construct a 95% confidence interval for the mean peak power after training.
(Một bài báo trên Tạp chí Y học và Khoa học trong Thể dục thể thao đã nghiên cứu thành tích
đạp xe trước và sau 8 tuần tập luyện sức bền. Bảy nam giới chưa được đào tạo trước đây đã
thực hiện bài tập sức mạnh chân ba ngày mỗi tuần trong tám tuần (với bốn hiệp năm lần lặp
lại với tỷ lệ 85% của một lần lặp lại tối đa). Công suất trong quá trình đạp xe tăng dần lên
mức trung bình là 315 W với độ lệch tiêu chuẩn là 16 W. Xây
Bài làm
Gọi X là cơng suất trong q trình đạp xe.
Theo đề bài, ta có:
𝑛 = 7 (𝑛 < 30)
𝑥̅ = 315
s = 16
Gọi 𝜇 là cơng suất trung bình trong quá trình đạp xe.


Thống kê: 𝑇 =

𝑋̅ −𝜇
𝑆
√𝑛


∼ 𝑇𝑛−1 (với 𝑛 = 7)

Với độ tin cậy 95%, ta có: 𝛼 = 0.05
𝑛−1
7−1
6
⇒ 𝑡1−
𝛼 = 𝑡 0.05 = 𝑡0.975 = 2.4469
2

1−

2

𝑛−1
Sai số ước lượng: 𝜖 = 𝑡1−
𝛼 ×
2

𝑠
√𝑛

= 2.4469 ×

16
√7

= 14.797


Khoảng tin cậy 95% cho trung bình 𝜇 là:
𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖
⇔ 315 − 14.797 < 𝜇 < 315 + 14.797
⇔ 300.203 < 𝜇 < 329.797
Vậy: Khoảng tin cậy 95% cho cơng suất trung bình trong q trình đạp xe là
(300.203; 329.797) 𝑊

Dạng 2: Ước lượng tỉ lệ:
Bài tập giáo trình: Từ bài 4.55 – 4.65
Bài tập thêm:
1. An article in the Journal of the American Statistical Association (1990, Vol. 85, pp. 972–
985) measured the weight of 30 rats under experiment controls. Suppose that 12 were
underweight rats.
(a) Calculate a 95% two-sided confidence interval on the true proportion of rats that would
show underweight from the experiment.
(b) Using the point estimate of p obtained from the preliminary sample, what sample size is
needed to be 95% confident that the error in estimating the true value of p is less than 0.02?
(c) How large must the sample be if you wish to be at least 95% confident that the error in
estimating p is less than 0.02, regardless of the true value of p?
(Một bài báo trên Tạp chí của Hiệp hội Thống kê Hoa Kỳ (1990, Tập 85, trang 972–985) đã
đo trọng lượng của 30 con chuột được kiểm sốt bằng thí nghiệm. Giả sử rằng 12 con chuột
bị nhẹ cân.
(a) Tính khoảng tin cậy hai phía 95% về tỷ lệ thực sự của những con chuột có biểu hiện nhẹ
cân từ thí nghiệm.
(b) Sử dụng ước lượng điểm p thu được từ mẫu ban đầu, cỡ mẫu nào là cần thiết để có độ tin
cậy 95% rằng sai số khi ước lượng giá trị thực của p nhỏ hơn 0,02?
(c) Mẫu phải lớn bao nhiêu nếu muốn chắc chắn ít nhất 95% rằng sai số khi ước lượng p nhỏ
hơn 0,02, bất kể giá trị thực của p là bao nhiêu?)
Bài làm



a) Gọi Y là những con chuột bị nhẹ cân. (Đơn vị: con)
𝑝 là tỉ lệ những con chuột bị nhẹ cân.
𝑝̂ là tỉ lệ những con chuột bị nhẹ cân trong thí nghiệm trên.
Theo đề bài, ta có:

𝑦
12
𝑦 = 12
} ⇒ 𝑝̂ = = = 0.4
𝑛
30
𝑛 = 30

𝑛𝑝̂ = 30 × 0.4 = 12 > 5
Kiểm tra điều kiện: {
𝑛(1 − 𝑝̂ ) = 30 × (1 − 0.4) = 18 > 5
Thống kê: 𝑍 =

𝑃̂ −𝑃
̂

̂

√𝑃(1−𝑃)

∼ 𝑁(0,1)

𝑛


Với độ tin cậy 95%, ta có: 𝛼 = 0.05
⇒ 𝑧1−𝛼 = 𝑧
2

1−

0.05
2

= 𝑧0.975 = 1.96
𝑝̂(1−𝑝̂)

Sai số ước lượng: 𝜖 = 𝑧1−𝛼 × √

𝑛

2

0.4×(1−0.4)

= 1.96 × √

30

= 0.1753

Khoảng tin cậy 95% cho tỉ lệ 𝑝 là:
𝑝̂ − 𝜖 < 𝑝 < 𝑝̂ + 𝜖
⇔ 0.4 − 0.1753 < 𝑝 < 0.4 + 0.1753
⇔ 0.2247 < 𝑝 < 0.5753

Vậy: Với khoảng tin cậy 95%, tỉ lệ những con chuột có biểu hiện nhẹ cân thuộc khoảng
(0.2247; 0.5753)
b) Với độ tin cậy 95% và 𝑝̂ = 0.4, sai số ước lượng nhỏ hơn 0.02 nghĩa là:
𝜖 < 0.02
⇔ 𝑧0.975 × √

⇔ 1.96 × √

𝑝̂ (1 − 𝑝̂ )
< 0.02
𝑛

0.4 × (1 − 0.4)
< 0.02
𝑛

⇔ 𝑛 > 2304.96
Vậy: Để sai số ước lượng nhỏ hơn 0.02 với độ tin cậy 95%, 𝑝̂ = 0.4 thì cần khảo sát ít nhất
2305 con chuột.
c) Vì 𝑝̂ chưa biết, do đó 𝑝̂ (1 − 𝑝̂ ) đạt giá trị cực đại khi 𝑝̂ = 1 − 𝑝̂
⇒ 𝑝̂ = 0.5
⇔ 𝑝̂ (1 − 𝑝̂ ) = 0.25


Sai số ước lượng nhỏ hơn 0.02 với độ tin cậy 95% với bất kể 𝑝̂ nào nghĩa là:
1.96 × √

0.25
< 0.02
𝑛


⇔ 𝑛 > 2401
Vậy: Để sai số ước lượng nhỏ hơn 0.02 với độ tin cậy 95% với bất kể giá trị thực của p thì
phải khảo sát ít nhất 2402 con chuột.

2. The Arizona Department of Transportation wishes to survey state residents to determine
what proportion of the population would like to increase statewide highway speed limits from
65 mph to 75 mph. How many residents does the department need to survey if it wants to be at
least 99% confident that the sample proportion is within 0.05 of the true proportion?
(Bộ Giao thông vận tải Arizona muốn khảo sát cư dân tiểu bang để xác định tỷ lệ dân số muốn
tăng giới hạn tốc độ đường cao tốc trên toàn tiểu bang từ 65 dặm một giờ lên 75 dặm một giờ.
Bộ cần khảo sát bao nhiêu cư dân nếu muốn chắc chắn ít nhất 99% rằng tỷ lệ dân số muốn
tăng giới hạn tốc độ là 0.05?)
Bài làm
Gọi Y là số dân bang Arizona muốn tăng giới hạn tốc độ đường cao tốc trên toàn tiểu bang từ
65 dặm một giờ lên 75 dặm một giờ.
Với độ tin cậy 99%, ta có: 𝛼 = 0.01
⇒ 𝑧1−𝛼 = 𝑧1−0.01 = 𝑧0.995 = 2.575
2

2

Vì 𝑝̂ chưa biết, do đó 𝑝̂ (1 − 𝑝̂ ) đạt giá trị cực đại khi 𝑝̂ = 1 − 𝑝̂
⇒ 𝑝̂ = 0.5
⇔ 𝑝̂ (1 − 𝑝̂ ) = 0.25
Nếu muốn chắc chắn ít nhất 99% rằng tỉ lệ dân số muốn tăng giới hạn tốc độ là 0.05 nghĩa là:
𝜖 = 0.05
⇔ 𝑧0.995 × √

𝑝̂ (1 − 𝑝̂ )

= 0.05
𝑛

⇔ 2.575 × √

0.25
= 0.05
𝑛

⇔ 𝑛 = 663.0625
Vậy: Cần khảo sát 664 người nếu muốn chắc chắn ít nhất 99% rằng tỉ lệ tỉ lệ dân số muốn
tăng giới hạn tốc độ là 0.05


3. A study is to be conducted of the percentage of homeowners who own at least two television
sets. How large a sample is required if we wish to be 99% confident that the error in estimating
this quantity is less than 0.017?
(Một nghiên cứu về tỷ lệ phần trăm chủ nhà sở hữu ít nhất hai ti vi. Cỡ mẫu là bao nhiêu nếu
muốn chắc chắn 99% rằng lỗi trong ước tính đại lượng này nhỏ hơn 0,017?)
Gọi Y là số lượng nhà có ti vi.
Với độ tin cậy 99%, ta có: 𝛼 = 0.01
⇒ 𝑧1−𝛼 = 𝑧1−0.01 = 𝑧0.995 = 2.575
2

2

Vì Vì 𝑝̂ chưa biết, do đó 𝑝̂ (1 − 𝑝̂ ) đạt giá trị cực đại khi 𝑝̂ = 1 − 𝑝̂
⇒ 𝑝̂ = 0.5
⇔ 𝑝̂ (1 − 𝑝̂ ) = 0.25
Nếu muốn chắc chắn tỉ 99% rằng tỉ lệ lỗi là nhỏ hơn 0.01 nghĩa là:

𝜖 = 0.01
⇔ 𝑧0.995 × √

𝑝̂ (1 − 𝑝̂ )
= 0.01
𝑛

⇔ 2.575 × √

0.25
= 0.01
𝑛

⇔ 𝑛 = 128.75
Vậy: Cỡ mẫu cần là 129 nếu muốn chắc chắn 99% rằng lỗi trong ước tính đại lượng nhỏ hơn
0.01

Dạng 3: Kiểm định một mẫu: So sánh trung bình với một số
Bài tập giáo trình: Từ bài 5.19 – 5.62
Bài tập thêm:
1. Medical researchers have developed a new artificial heart constructed primarily of titanium
and plastic. The heart will last and operate almost indefinitely once it is implanted in the
patient’s body, but the battery pack needs to be recharged about every four hours. A random
sample of 50 battery packs is selected and subjected to a life test. The average life of these
batteries is 4.05 hours. Assume that battery life is normally distributed with standard deviation
𝜎 = 0.2 hour.
(a) Is there evidence to support the claim that mean battery life exceeds 4 hours?


Use 𝛼 = 0.05.

(b) What is the P-value for the test in part (a)?
(Các nhà nghiên cứu y học đã phát triển một trái tim nhân tạo mới được cấu tạo chủ yếu bằng
titan và nhựa. Trái tim sẽ tồn tại và hoạt động gần như vô thời hạn sau khi nó được cấy vào cơ
thể bệnh nhân, nhưng bộ pin cần được sạc lại khoảng bốn giờ một lần. Một mẫu ngẫu nhiên
gồm 50 bộ pin được chọn và trải qua bài kiểm tra tuổi thọ. Tuổi thọ trung bình của những viên
pin này là 4,05 giờ. Giả sử rằng thời lượng pin có phân phối chuẩn với độ lệch chuẩn σ = 0,2
giờ.
(a) Có bằng chứng nào chứng minh cho tuyên bố rằng thời lượng pin có nghĩa là vượt quá 4
giờ không? Sử dụng α = 0,05.
(b) Giá trị 𝑃𝑔𝑖á 𝑡𝑟ị cho phép thử trong phần (a) là bao nhiêu?)
Bài làm
a) Gọi X là thời lượng pin của trái tim nhân tạo.
Theo đề bài, ta có:
𝑋 ∼ 𝑁(𝜇, 𝜎 2 )
𝑛 = 50 (𝑛 > 30)
𝑥̅ = 4.05
𝜎 = 0.2
Gọi 𝜇 là thời lượng pin trung bình của trái tim nhân tạo.
Giả thuyết: {

𝐻0 : 𝜇 = 𝜇0 = 4
𝐻1 : 𝜇 > 𝜇0

Khi 𝐻0 đúng thì ta có thống kê 𝑍 =

𝑋̅ −𝜇
𝜎
√𝑛

∼ 𝑁(0,1)


Với mẫu thực nghiệm, ta tính được giá trị thống kê: 𝑧 =

𝑥̅ −𝜇
𝜎
√𝑛

=

4.05−4
0.2
√50

=

5√2
4

= 1.77

Với mức ý nghĩa 𝛼 = 5%, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.05 = 𝑧0.95 = 1.645
Ta thấy: 𝑧 = 1.77 > 𝑧1−𝛼 = 1.645
Do đó ta có đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 5%.
Vậy: Thời lượng pin trung bình là khơng vượt q 4 giờ.
b) 𝑝𝑔𝑖á 𝑡𝑟ị = 1 − 𝜙(𝑧) = 1 − 𝜙(1.77) = 1 − 0.9616 = 0.0384

2. Humans are known to have a mean gestation period of 280 days (from last menstruation)
with a standard deviation of about 9 days. A hospital wondered whether there was any evidence



that their patients were at risk for giving birth prematurely. In a random sample of 70 women,
the average gestation time was 274.3 days.
(a) Is the alternative hypothesis one- or two-sided?
(b) Test the null hypothesis at 𝛼 = 0.05.
(c) What is the P-value of the test statistic?
(Phụ nữ được biết là có thời gian mang thai trung bình là 280 ngày (kể từ lần hành kinh cuối
cùng) với độ lệch chuẩn khoảng 9 ngày. Một bệnh viện tự hỏi liệu có bằng chứng nào cho thấy
bệnh nhân của họ có nguy cơ sinh non hay không. Trong một mẫu ngẫu nhiên gồm 70 phụ nữ,
thời gian mang thai trung bình là 274,3 ngày.
(a) Giả thuyết thay thế là một hay hai phía?
(b) Kiểm định giả thuyết rỗng tại α = 0,05.
(c) Giá trị 𝑃𝑔𝑖á 𝑡𝑟ị của thống kê thử nghiệm là bao nhiêu?)
Bài làm
Gọi X là thời gian phụ nữ mang thai.
Theo đề bài, ta có:
𝑛 = 70 (𝑛 > 30)
𝑥̅ = 274.3
𝜎=9
Gọi 𝜇 là thời gian trung bình phụ nữ mang thai.
a) Đây là kiểm định hai phía.
b) Giả thuyết: {

𝐻0 : 𝜇 = 𝜇0 = 280
𝐻1 : 𝜇 ≠ 𝜇0

Khi 𝐻0 đúng thì ta có thống kê 𝑍 =

𝑋̅ −𝜇
𝜎
√𝑛


∼ 𝑁(0,1)

Với mẫu thực nghiệm, ta có giá trị thống kê 𝑧 =

𝑥̅ −𝜇
𝜎
√𝑛

=

274.3−280
9
√70

=−

19√70
30

≈ −5.30

Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.05 = 𝑧0.975 = 1.96
2

2

Ta thấy: |𝑧| = 5.3 > 𝑧1−𝛼 = 1.96
2


Do đó: Ta có đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05
Vậy: Thời gian mang thai trung bình của phụ nữ khác 280 ngày.
c) 𝑝𝑔𝑖á 𝑡𝑟ị = 1 − 2𝜙(|𝑧|) = 1 − 2𝜙(|−5.30|) = 1 − 2 × 1 = −1


3. The bacterial strain Acinetobacter has been tested for its adhesion properties. A sample of
five measurements gave readings of 2.69, 5.76, 2.67, 1.62 and 4.12 dyne-cm2. Assume that the
standard deviation is known to be 0.66 dyne-cm2 and that the scientists are interested in high
adhesion (at least 2.5 dyne-cm2).
(a) Should the alternative hypothesis be one-sided or two-sided?
(b) Test the hypothesis that the mean adhesion is 2.5 dyne-cm2.
(c) What is the P-value of the test statistic?
(Chủng vi khuẩn Acinetobacter đã được thử nghiệm về đặc tính bám dính của nó. Một mẫu
gồm năm phép đo cho kết quả là 2,69, 5,76, 2,67, 1,62 và 4,12 dyn/cm2. Giả sử rằng độ lệch
chuẩn được biết là 0,66 dyn/cm2 và các nhà khoa học quan tâm đến độ kết dính cao (ít nhất là
2,5 dyn/cm2).
(a) Giả thuyết thay thế là một phía hay hai phía?
(b) Kiểm tra giả thuyết rằng độ kết dính trung bình là 2,5 dyne-cm2.
(c) Giá trị 𝑃𝑔𝑖á 𝑡𝑟ị của thống kê thử nghiệm là bao nhiêu?)
Bài làm
Gọi X là độ kết dính của chủng vi khuẩn Acinetobacter.
Giả sử 𝑋 ∼ 𝑁(𝜇, 𝜎 2 )
Dựa vào số liệu đề bài, ta tính được
𝑛 = 5 (𝑛 < 30)
𝜎 = 0.66
𝑥̅ = 3.372
Gọi 𝜇 là độ kết dính trung bình của chủng vi khuẩn Acinetobacter.
a) Kiểm định này là kiểm định một phía bên trái.
b) Giả thuyết: {


𝐻0 : 𝜇 = 𝜇0 = 2.5
𝐻1 : 𝜇 < 𝜇0

Khi 𝐻0 đúng thì ta có thống kê 𝑍 =

𝑋̅ −𝜇
𝜎
√𝑛

∼ 𝑁(0,1)

Với mẫu thực nghiệm, ta có giá trị thống kê 𝑧 =

𝑥̅ −𝜇
𝜎
√𝑛

=

3.372−2.5
0.66
√5

≈ 2.95

Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.05 = 𝑧0.95 = 1.645
Ta thấy: −𝑧1−𝛼 = −1.645 < 𝑧 = 2.95
Do đó ta khơng có đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05
Vậy: Độ kết dính trung bình của chủng vi khuẩn Acinetobacter có giá trị ít nhất là 2.5
𝑑𝑦𝑛/𝑐𝑚2



c) 𝑝𝑔𝑖á 𝑡𝑟ị = 𝜙(𝑧) = 𝜙(2.95) = 0.9984

4. Cloud seeding has been studied for many decades as a weather modification procedure (for
an interesting study of this subject, see the article in Technometrics, “A Bayesian Analysis of
a Multiplicative Treatment Effect in Weather Modification,” Vol. 17, pp. 161–166). The
rainfall in acre-feet from 20 clouds that were selected at random and seeded with silver
nitrate follows: 18.0, 30.7, 19.8, 27.1, 22.3, 18.8, 31.8, 23.4, 21.2, 27.9, 31.9, 27.1, 25.0, 24.7,
26.9, 21.8, 29.2, 34.8, 26.7, and 31.6. Can you support a claim that mean rainfall from seeded
clouds exceeds 25 acre-feet? Use 𝛼 = 0.01. Find the P-value.
(Việc gieo hạt vào đám mây đã được nghiên cứu trong nhiều thập kỷ như một quy trình điều
chỉnh thời tiết (để có một nghiên cứu thú vị về chủ đề này, hãy xem bài báo trong tạp chí
Technometrics, “A Bayesian Analysis of a Multiplicative Treatment Effect in Weather
Modification,”, Tập 17, trang 161– 166). Lượng mưa tính bằng mẫu Anh từ 20 đám mây
được chọn ngẫu nhiên và được gieo bằng bạc nitrat như sau: 18,0, 30,7, 19,8, 27,1, 22,3,
18,8, 31,8, 23,4, 21,2, 27,9, 31,9, 27,1, 25,0, 24,7, 26,9, 21,8, 29,2, 34,8, 26,7 và 31,6. Có thể
ủng hộ một tuyên bố rằng lượng mưa từ những đám mây có hạt vượt q 25 mẫu Anh khơng?
Sử dụng α = 0,01. Tìm giá trị P.
Bài làm
Gọi X là lượng mưa từ những đám mây.
Dựa vào dữ kiện đề bài, ta có:
𝑛 = 20 (𝑛 < 30)
𝑥̅ = 26.035
𝑠 = 4.78
𝜎 chưa biết
Gọi 𝜇 là lượng mưa trung bình từ những đám mây.
Giả thuyết: {

𝐻0 : 𝜇 = 𝜇0 = 25

𝐻1 : 𝜇 > 𝜇0

Khi 𝐻0 đúng thì ta có kê 𝑇 =

𝑋̅ −𝜇
𝑆
√𝑛

∼ 𝑇𝑛−1 với 𝑛 = 20

Với mẫu thực nghiệm, ta tính được giá trị thống kê 𝑡 =

𝑥̅ −𝜇
𝑠
√𝑛

=

26.035−25
4.78
√20

≈ 0.968

𝑛−1 20−1
19
Với mức ý nghĩa 𝛼 = 0.01, tra bảng phân phối Student: 𝑡1−𝛼
=1−0.01 = 𝑡0.99
= 2.5395
𝑛−1

Ta thấy: 𝑡 = 0.968 < 𝑡1−𝛼
= 2.5395

Do đó: khơng đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.01
Vậy: Lượng mưa trung bình từ những đám mây không vượt quá 25 mẫu Anh.


5. An article in the ASCE Journal of Energy Engineering (1999, Vol. 125, pp. 59–75) describes
a study of the thermal inertia properties of autoclaved aerated concrete used as a building
material. Five samples of the material were tested in a structure, and the average interior
temperatures (°C) reported were as follows: 23.01, 22.22, 22.04, 22.62, and 22.59. Test the
hypotheses 𝐻0 : 𝜇 = 22.5 versus 𝐻1 : 𝜇 ≠ 22.5, using 𝛼 = 0.05. Find the P-value
(Một bài báo trên Tạp chí ASCE Journal of Energy Engineering (1999, Tập 125, trang 59–
75) mơ tả một nghiên cứu về các đặc tính qn tính nhiệt của bê tơng khí chưng áp được sử
dụng làm vật liệu xây dựng. Năm mẫu vật liệu đã được thử nghiệm trong cấu trúc và nhiệt độ
bên trong trung bình (° C) được báo cáo như sau: 23,01, 22,22, 22,04, 22,62 và 22,59. Kiểm
định giả thuyết 𝐻0 : 𝜇 = 22,5 so với 𝐻1 : 𝜇 ≠ 22,5, sử dụng α = 0,05. Tìm giá trị 𝑃𝑔𝑖á 𝑡𝑟ị?)
Bài làm
Gọi X là nhiệt độ của bê tơng trong khí chưng áp được sử dụng làm vật liệu xây dựng.
Theo đề bài, ta có:
𝑛 = 5 (𝑛 < 30)
𝑥̅ = 22.496
𝑠 = 0.378
𝜎 chưa biết
Gọi 𝜇 là nhiệt độ trung bình của bê tơng trong khi chưng áp được sử dụng làm vật liệu xây
dựng
Giả thuyết: {

𝐻0 : 𝜇 = 𝜇0 = 22.5
𝐻1 : 𝜇 ≠ 𝜇0


Khi 𝐻0 đúng thì ta có thống kê 𝑇 =

𝑋̅ −𝜇
𝑆
√𝑛

∼ 𝑇𝑛−1 với 𝑛 = 5

Với mẫu thực nghiệm, ta tính được giá trị thống kê 𝑡 =

𝑥̅ −𝜇
𝑠
√𝑛

=

22.496−22.5
0.378
√5

≈ −0.024

𝑛−1 5−1
4
Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Student: 𝑡1−
𝛼 =
0.05 = 𝑡0.975 = 2.7764
1−
2


2

𝑛−1
Ta thấy: |𝑡| = 0.024 < 𝑡1−
𝛼 = 2.7764
2

Do đó: khơng đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05
Vậy: Giả thuyết 𝐻0 đúng
𝑝𝑔𝑖á 𝑡𝑟ị = 2𝑃(𝑡𝑛−1 > |𝑡|) = 2𝑃(𝑡4 > 0.024) ≈ 2 × (1 − 0.6) ≈ 0.8

Dạng 4: Kiểm định một mẫu: So sánh trung bình với một tỉ lệ:
Bài tập giáo trình: Từ bài 5.69 – 5.88


Bài tập thêm:
1. The advertised claim for batteries for cell phones is set at 48 operating hours with proper
charging procedures. A study of 5000 batteries is carried out and 15 stop operating prior to 48
hours. Do these experimental results support the claim that less than 0.2 percent of the
company’s batteries will fail during the advertised time period, with proper charging
procedures? Use a hypothesis-testing procedure with 𝛼 = 0.01.
(Có quảng cáo cho rằng pin dành cho điện thoại di động sẽ có 48 giờ hoạt động với quy trình
sạc thích hợp. Một nghiên cứu về 5000 pin được thực hiện và 15 lần ngừng hoạt động trước
48 giờ. Các kết quả thử nghiệm này có ủng hộ tun bố rằng ít hơn 0,2% pin của công ty sẽ
hỏng trong khoảng thời gian được quảng cáo có thích hợp khơng? Sử dụng quy trình kiểm định
giả thuyết với 𝛼 = 0.01.)
Bài làm
Gọi Y là số điện thoại ngừng hoạt động trước 48 giờ.
𝑝 là tỉ lệ số điện thoại ngừng hoạt động trước 48 giờ.

Theo đề bài, ta có:

𝑦
15
𝑦 = 15
} ⇒ 𝑝̂ = =
= 0.003
𝑛
5000
𝑛 = 5000

𝑛𝑝̂ = 15 > 5
Kiểm tra điều kiện: {
𝑛(1 − 𝑝̂ ) = 4985 > 5
Giả thuyết: {

𝐻0 : 𝑝 = 𝑝0 = 0.002
𝐻1 : 𝑝 < 𝑝0

Khi 𝐻0 đúng thì ta có thống kê 𝑍 =

𝑝̂−𝑝0
𝑝 (1−𝑝0 )
√ 0

∼ 𝑁(0,1)

𝑛

Với mẫu thực nghiệm, ta có giá trị thống kê: 𝑧 =


0.003−0.002
0.002(1−0.002)
5000

= 1.58



Với mức ý nghĩa 𝛼 = 0.01, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.01 = 𝑧0.99 = 2.33
Ta thấy: 𝑧 = 1.58 > −𝑧1−𝛼 = −2.33
Do đó: Khơng có đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.01
Vậy: Có ít nhất 0.2% pin của công ti sẽ hỏng trong khoảng thời gian 48 giờ với mức ý nghĩa
𝛼 = 0.01

2. A computer manufacturer ships laptop computers with the batteries fully charged so that
customers can begin to use their purchases right out of the box. In its last model, 85% of
customers received fully charged batteries. To simulate arrivals, the company shipped 100 new
model laptops to various company sites around the country. Of the 100 laptops shipped, 95 of
them arrived reading 100% charged. Do the data provide evidence that this model’s rate is at
least as high as the previous model? Test the hypothesis at 𝛼 = 0.05


(Một nhà sản xuất máy tính vận chuyển các máy tính xách tay đã được sạc đầy pin để khách
hàng có thể bắt đầu sử dụng ngay khi mua hàng của họ. Trong mơ hình cuối cùng của nó, 85%
khách hàng nhận được pin đã sạc đầy. Để mô phỏng lượng khách đến, cơng ty đã vận chuyển
100 máy tính xách tay mẫu mới đến các địa điểm công ty khác nhau trên khắp đất nước. Trong
số 100 máy tính xách tay được xuất xưởng, 95 máy tính trong số đó được sạc đầy. Dữ liệu có
cung cấp bằng chứng rằng tỷ lệ của mơ hình này ít nhất là cao như mơ hình trước đó khơng?
Kiểm định giả thuyết tại α = 0,05)

Bài làm
Gọi Y là số máy tính đã được sạc đầy.
𝑝 là tỉ lệ số máy tính đã được sạc đầy.
Theo đề bài, ta có:

𝑦
95
𝑦 = 95
} ⇒ 𝑝̂ = =
= 0.95
𝑛
100
𝑛 = 100

𝑛𝑝̂ = 95 > 5
Kiểm tra điều kiện: {
𝑛(1 − 𝑝̂ ) = 5 = 5
Giả thuyết: {

𝐻0 : 𝑝 = 𝑝0 = 0.85
𝐻1 : 𝑝 < 𝑝0

Khi 𝐻0 đúng thì ta có thống kê 𝑍 =

𝑝̂−𝑝0
𝑝 (1−𝑝0 )
√ 0
𝑛

∼ 𝑁(0,1)


Với mẫu thực nghiệm, ta có giá trị thống kê: 𝑧 =

0.95−0.85
0.85(1−0.85)
100

= 2.8



Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.05 = 𝑧0.95 = 1.645
Ta thấy: 𝑧 = 2.8 > −𝑧1−𝛼 = −1.645
Do đó: Khơng có đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05
Vậy: Tỉ lệ mơ hình này ít nhất là cao như mơ hình trước đó với mức ý nghĩa 5%.

3. In a random sample of 500 handwritten zip code digits, 466 were read correctly by an optical
character recognition (OCR) system operated by the U.S. Postal Service (USPS). USPS would
like to know whether the rate is at least 90% correct. Do the data provide evidence that the rate
is at least 90% at 𝛼 = 0.05?
(Trong một mẫu ngẫu nhiên gồm 500 mã zip viết tay các chữ số, 466 đã được đọc chính xác
bằng hệ thống nhận dạng ký tự quang học (OCR) do Bưu điện Hoa Kỳ vận hành (USPS). USPS
muốn biết liệu tỷ giá có ở mức đúng ít nhất 90%. Dữ liệu có cung cấp bằng chứng rằng tỷ lệ
là ít nhất 90% tại α = 0,05?)
Bài làm
Gọi Y là số mã zip được đọc chính xác bằng hệ thống nhận dạng kí tự quang học.
𝑝 là tỉ lệ số mã zip được đọc chính xác bằng hệ thống nhận dạng kí tự quang học.


Theo đề bài, ta có:


𝑦
466
𝑦 = 466
} ⇒ 𝑝̂ = =
= 0.932
𝑛
500
𝑛 = 500

𝑛𝑝̂ = 466 > 5
Kiểm tra điều kiện: {
𝑛(1 − 𝑝̂ ) = 34 = 5
Giả thuyết: {

𝐻0 : 𝑝 = 𝑝0 = 0.9
𝐻1 : 𝑝 < 𝑝0

Khi 𝐻0 đúng thì ta có thống kê 𝑍 =

𝑝̂−𝑝0
𝑝 (1−𝑝0 )
√ 0

∼ 𝑁(0,1)

𝑛

Với mẫu thực nghiệm, ta có giá trị thống kê: 𝑧 =


0.932−0.9
0.9(1−0.9)
500

= 2.385



Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.05 = 𝑧0.95 = 1.645
Ta thấy: 𝑧 = 2.385 > −𝑧1−𝛼 = −1.645
Do đó: Khơng có đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05
Vậy: tỉ lệ số mã zip được đọc chính xác bằng hệ thống nhận dạng kí tự quang học là ít nhất
90% với mức ý nghĩa 𝛼 = 0.05

Dạng 5: Kiểm định hai mẫu: So sánh hai trung bình
Bài tập giáo trình: Từ bài 5.89 – 5.125
Bài tập thêm:
1. An article in Quality Engineering [2012, Vol. 24(1)] described an experiment on a grinding
wheel. The following are some of the grinding force data (in N) from this experiment at two
different vibration levels.
Low

242, 249, 235, 250, 254, 244, 258, 311, 237, 261, 314, 252

High

302, 421, 419, 399, 317, 311, 350, 363, 392, 367, 301, 302

Is there evidence to support the claim that the mean grinding force increases with the vibration
level?

(Một bài báo trong Kỹ thuật chất lượng [2012, Vol. 24 (1)] đã mơ tả một thí nghiệm trên bánh
mài. Sau là một số dữ liệu về lực mài (tính bằng N) từ thí nghiệm này ở hai mức độ rung khác
nhau.
Thấp

242, 249, 235, 250, 254, 244, 258, 311, 237, 261, 314, 252

Cao

302, 421, 419, 399, 317, 311, 350, 363, 392, 367, 301, 302

Có bằng chứng nào chứng minh cho tuyên bố rằng lực mài trung bình tăng theo mức độ rung
không?)
Bài làm
Gọi X và Y lần lượt là lực trung bình khi độ rung thấp và cao của bánh mài.


Theo đề bài, ta có:
𝑛𝑋 = 𝑛𝑌 = 12 (𝑛𝑋 = 𝑛𝑌 < 30)
𝑥𝑋 = 258.92
̅̅̅
𝑥𝑌 = 353.67
̅̅̅
𝑠𝑋 = 26.22
𝑠𝑌 = 46.5956
𝜎𝑋 và 𝜎𝑌 chưa biết
Giả sử 𝜎𝑋2 = 𝜎𝑌2 = 𝜎 2 và X, Y tuân theo phân phối chuẩn.
Gọi 𝜇𝑋 và 𝜇𝑌 lần lượt là độ lớn trung bình của lực mài thấp và lực mài cao.
𝜇𝑋 = 𝜇𝑌
Giả thuyết: {𝜇 < 𝜇

𝑋
𝑌
Khi 𝐻0 đúng thì ta có thống kê 𝑇 =

̅̅̅̅
̅̅̅̅
𝑋𝑋 −𝑋
𝑌
1
1
+ )
𝑛𝑋 𝑛𝑌

√𝑆 2 (

∼ 𝑇𝑛𝑋+𝑛𝑌−2

2
(𝑛𝑋 −1)𝑆𝑋
+(𝑛𝑌 −1)𝑆𝑌2

Với 𝑆 2 =

𝑛𝑋 +𝑛𝑌 −2

Với mẫu thực nghiệm, ta tính được:
(𝑛𝑋 − 1)𝑠𝑋2 + (𝑛𝑌 − 1)𝑠𝑌2 (12 − 1) × 26.222 + (12 − 1) × 46.59562
𝑠 =
=
= 1429.32

𝑛𝑋 + 𝑛𝑌 − 2
12 + 12 − 2
2

⇒ 𝑠 = √1429.32 = 37.8
𝑥𝑋 − ̅̅̅
̅̅̅
𝑥𝑌

𝑡=

1
1
𝑛𝑋 + 𝑛𝑌 )

√𝑠 2 (

=

258.92 − 353.67
√37.8 × ( 1 + 1 )
12 12

= −37.75

Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Student, ta có:
𝑛 +𝑛𝑌 −2

𝑋
𝑡1−𝛼


12+12−2
22
= 𝑡1−0.05
= 𝑡0.95
= 1.7171
𝑛 +𝑛𝑌 −2

𝑋
Ta thấy: 𝑡 = −37.75 < −𝑡1−𝛼

= −1.7171

Do đó: Có đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05
Vậy: Lực mài trung bình tăng theo mức độ rung với mức ý nghĩa 𝛼 = 0.05

2. A photoconductor film is manufactured at a nominal thickness of 25 mils. The product
engineer wishes to increase the mean speed of the film and believes that this can be achieved
by reducing the thickness of the film to 20 mils. Eight samples of each film thickness are
manufactured in a pilot production process, and the film speed (in microjoules per square inch)
is measured. For the 25-mil film, the sample data result is ̅̅̅
𝑥1 = 1.15 and 𝑠1 = 0.11, and for
the 20-mil film the data yield 𝑥
̅̅̅2 = 1.06 and 𝑠2 = 0.09. Note that an increase in film speed


would lower the value of the observation in microjoules per square inch. Do the data support
the claim that reducing the film thickness increases the mean speed of the film? Use 𝜎 = 0.10,
and assume that the two population variances are equal, and the underlying population of film
speed is normally distributed. What is the P-value for this test?

(Màng quang dẫn được sản xuất ở độ dày danh nghĩa là 25 mil. Kỹ sư sản phẩm mong muốn
tăng tốc độ trung bình của màng và tin rằng có thể đạt được điều này bằng cách giảm độ dày
của màng xuống 20 mil. Tám mẫu của mỗi độ dày màng được sản xuất trong quy trình sản
xuất thử nghiệm và tốc độ màng (tính bằng 𝜇𝐽/𝑖𝑛𝑐ℎ2 ) được đo. Đối với phim dày 25 mil, kết
quả dữ liệu mẫu là ̅̅̅
𝑥1 = 1.15 và 𝑠1 = 0,11, và đối với phim dày 20 mil, năng suất dữ liệu
𝑥2 = 1,06 và 𝑠2 = 0,09. Lưu ý rằng tốc độ phim tăng lên sẽ làm giảm giá trị của quan sát
̅̅̅
tính bằng 𝜇𝐽/𝑖𝑛𝑐ℎ2 . Dữ liệu có ủng hộ tuyên bố rằng việc giảm độ dày của màng làm tăng tốc
độ trung bình của màng không? Sử dụng σ = 0,10 và giả sử rằng hai phương sai tổng thể bằng
nhau và tập hợp cơ bản của tốc độ phim được phân phối bình thường. Giá trị 𝑃𝑔𝑖á 𝑡𝑟ị cho phép
thử này là bao nhiêu?)
Bài làm
Theo đề bài, ta có:
𝑛1 = 𝑛2 = 8
𝑥1 = 1.15
̅̅̅
𝑠1 = 0.11
𝑥2 = 1.06
̅̅̅
𝑠2 = 0.09
𝜎 = 0.1
Gọi 𝜇1 và 𝜇2 lần lượt là tốc độ trung bình của màng quang dẫn 25 mil và 20 mil.
𝜇1 = 𝜇2
Giả thuyết: {𝜇 < 𝜇
1
2
Khi 𝐻0 đúng thì ta có thống kê 𝑇 =

̅̅̅̅

̅̅̅̅
𝑋1 −𝑋
2
1

1

√𝑆 2 (𝑛 +𝑛 )
1
2

∼ 𝑇𝑛1 +𝑛2−2

(𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22

Với 𝑆 2 =

𝑛1 +𝑛2 −2

Với mẫu thực nghiệm ta có:
(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22 (8 − 1) × 0.112 + (8 − 1) × 0.092
𝑠 =
=
= 0.0101
𝑛1 + 𝑛2 − 2
8+8−2
2

⇒ 𝑠 = √0.0101 = 0.1
𝑡=


𝑥1 − 𝑥
̅̅̅
̅̅̅2
1
1
+
𝑛1 𝑛2 )

√𝑠 2 (

=

1.15 − 1.06
√0.0101 × (1 + 1)
8 8

= 1.79



×