1. Trình bày lại ví dụ 3.4 trang 161 và ví dụ 4.2 trang 171 Giáo Trình XSTK
2009.
Ví dụ 3.4 Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiện cứu theo hai
yếu tố: pH(A), nhiệt độ (B),và chất xúc tác (C) được trình bày trong bảng sau:
Yếu tố A
Yếu tố B
B1 B2 B3 B4
A1 C1 9 C2 14 C3 16 C4 12
A2 C2 12 C3 15 C4 12 C1 10
A3 C3 13 C4 14 C1 13 C2 14
A4 C4 10 C1 11 C2 11 C3 13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
Nhập dữ liệu vào bảng sau:
Thiết lập các biểu thức và tính giá trị thống kê
Tính các giá trị Ti T j T k T
Các giá trị Ti
Chọn ô B7 và nhập biểu thức = SUM(B2:E2)
Chọn ô C7 và nhập biểu thức = SUM(B3:E3)
Chọn ô D7 và nhập biểu thức = SUM(B4:E4)
Chọn ô E7 và nhập biểu thức = SUM(B5:E5)
Các giá trị T j
Chọn ô B8 và nhập biểu thức = SUM(B2:B5)
Dùng con trỏ kéo kí tự tự điền tu62 ô B8 đến ô E8
Các giá trị T k
Chọn ô B9 và nhập biểu thức =SUM(B2.C5.D4.E3)
Chọn ô C9 và nhập biểu thức =SUM(B3.C2.D5.E4)
Chọn ô D9 và nhập biểu thức =SUM(B4.C3.D2.E5)
Chọn ô E9 và nhập biểu thức =SUM(B5.C4.D3.E2)
Giá trị T
Chọn ô B10 và nhập biểu thức = SUM(B2:E5)
Tính các già trị và
Các già trị và
Chọn ô G7 và nhập biểu thức = SUMSQ(B7:B7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến G9
Giá trị
Chọn ô G10 và nhập biểu thức =POWER(B10.2)
Giá trị
Chọn ô G11 và nhập biểu thức = SUMQS(B1:E5)
Tính các giá trị SSR, SSC, SSF, SST và SSE
Các giá trị SSR, SSC, SSF
Chọn ô I7 và nhập biểu thức =G7/4 – 39601/POWER(4.2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến I9
Giá trị SSE
Chọn ô I10va2 nhập biểu thức =I1 – SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF và MSE
Các giá trị MSR, MSC, MSF
Chọn ô K7 cà nhập biểu thức I7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền tứ ô K7 đến ô K9
Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/(4-1)*(4-2)
Tính các giá trị và F
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến M9
Kết quả và biện luận
F
R
= 3.10 < F
0.05
(3.6) = 4.76 chấp nhận H
o
(pH)
F
c
= 11.95 > F
0.05
(3.6) = 4.76 bác bỏ H
o
(pH)
F = 30.05 > F
0.05
(3.6) = 4.76 bác bỏ H
o
(pH)
Vậy chỉ có nhiệt độ và chất xúc tác gây anh3 hưởng đến hiệu suất.
Ví dụ 4.2 Người ta dùng ba mức nhiệt độ gồm 105, 120 và 135
o
C kết hợp với ba khoảng
hởi gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản
ứng (%) được trình bày trong bảng sau:
Thời gian (phút)
X1
Nhiệt độ (
o
C)
X2
Hiệu suất (%)
Y
15 105 1.87
30 105 2.02
60 105 3.28
15 120 3.05
30 120 4.07
60 120 5.54
15 135 5.03
30 135 6.45
60 135 7.26
Hãy cho biết yếu tố nhiệt độ và thời gian hoặc yếu tố thời gian có liên quan tuyến tính với
hiệu suất của phản ứng tổng hợp? Nếu có thì điều kie54n nhiệt độ 115
o
C trong vòng 50
phút hì hiệu suất phản ứng sẽ là bao nhiêu?
Nhập dữ liệu vào bảng tính
Dữ liệu nhất thiết phải được nhập theo bảng sau:
Sử dụng “Regression”
Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis
Chọn chương trình Regression tonh hộp thoại Data Analysis rồi nhấn OK
Trong hộp thoại Regression, lần lượt ấn định các chi tiết:
Phạm vi của biến số Y (Input Y Range)
Phạm vi của biến số X (Input X Range)
Nhãn dữ liệu (Labels)
Mức tin cậy (Confident Level)
Tọa độ đầu ra ( Output Range)
Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals
Plots)
Hộp thoại Regression
Regression Statistics
Multiple R 0.988775634
R Square 0.977677254
Adjusted R Square 0.970236338
Standard Error 0.329668544
Observations 9
ANOVA
df SS MS F Significance F
Regression 2 28.55973 14.27987 131.3921 1.11235E-05
Residual 6 0.652088 0.108681
Total 8 29.21182
Coefficients
Standard
Error t Stat P-value Lower 95% Upper 95% Lower 95.0%
Intercept -12.7 1.101639 -11.5283 2.56E-05 -15.39561342 -10.0043866 -15.39561342
X1 0.044539683 0.005874 7.582718 0.000274 0.03016691 0.058912455 0.03016691
X2 0.128555556 0.008972 14.32782 7.23E-06 0.106600783 0.150510328 0.106600783
Phương trình hồi quy = f(X1,X2)
=-12 + 0.04X
1
+0.13X
2
(R
2
=0.97;S=0.33)
t
o
=11.528 > t
0.05
=2.365
(hay P
v
=2.260*10
-5
<α=0.05)
bác bỏ giả thiết Ho
t
1
=7.538 > t
0.05
=2.365
(hay P
v
=0.00027<α=0.05)
bác bỏ giả thiết Ho
t
2
=14.328 > t
0.05
=2.365
(hay P
v
=7.233*10
-6
<α=0.05)
bác bỏ giả thiết Ho
F=131.392 > F0.05 = 5.140(hay F
S
=1.112*10
-5
<α=0.05)
Vậy cả hai hệ số -12.70(Bo),0.04(B1) vá 0.13(B2) của phương trình hồi quy
=-12 + 0.04X
1
+0.13X
2
đều có ý nghĩa thống kê. Nói một cách khác, phương trình hồi
quy này thích hợp
Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là
thời gian và nhiệt độ
2. Số kilômét đi được nhờ 1 lít xăng của 4 loại xe ôtô A, B, C, D được ghi lại như sau trên các
xe chạy thí nghiệm:
Loại A: 25, 23, 20, 27, 20
Loại B: 28, 31, 27, 28, 26
Loại C: 32, 33, 30, 28, 32
Loại D: 24, 24, 23, 27, 22
Với mức ý nghóa α = 5%, hãy so sánh mức tiêu thụ xăng của 4 loại xe nói trên.
I.CƠ SỞ LÝ THUYẾT
Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung
binh1 của hai hay nhiều mẫu được lấy từ các phân số. Đây có thể được xem như một
phần mở rộng của trắc nghiệm so sánh hai giá trị trung bình.
Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu
tố ( nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát. Y. (i= 1,2,3…)
Bảng ANOVA
Nguồn sai số Bậc tự do
Tổng số bình
phương
Bình phương
trung bình
Gía trị thống kê
Yếu tố
Sai
số
k-1
N-k
SSF=
SSE=SST-SSF
MSF=
MSE=
F=
Tổng cộng N-1 SST=
Trắc nghiệm
Giả thiết:
H
o
:μ
1
=μ
2
=…μ
n
“các giá trị trung bình bằng nhau”
H1: μi≠μj :Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
F=
Biện luận
Nếu F<F
α
(k-1;N-k) chấp nhận giả thiết H
o
II. CÁCH THỰC HIỆN VÀ KẾT QUẢ CHẠY BẰNG EXCEL
Giả thiết Ho:mức tiêu thụ xăng của 4 loại xe là như nhau
Nhập dữ liệu vào bảng sau:
Áp dụng “Anova: Single Factor”
a)Nhấn lần lượt các đơn lệnh Tools và Data Analysis
b)Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấn nút ok
cTrong hộp thoại Anova: Single Factor lần lượt ấn định:
Phạm vi đầu vào(Input Range)
Cách sắp xếp theo hàng hay cột(Group By)
Nhấn dữ liệu (Labels in First Row/Column)
Hôp thoại “Anova: Single Factor”
Kết quả
Groups Count Sum Average Variance
Loại A 5 115 23 9.5
Loại B 5 140 28 3.5
Loại C 5 155 31 4
Loại D 5 120 24 3.5
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 205 3 68.33333 13.33333 0.000128
3.2388
72
Within Groups 82 16 5.125
Total 287 19
Biện luận
F=13.33>F
0.05
= 3.239 Bác bỏ giả thiết H
o
Vậy mức tiêu thụ xăng của 4 loại xe là khác nhau
3. Hãy tiến hành phân tích phương sai đối với các số liệu sau đây
Mẫu thứ nhất: 22 19 13 19 23 15 16 18 20 20
Mẫu thứ hai: 27 25 22 27 19 23 21 28 23 25 27
Mẫu thứ ba: 20 18 21 21 16 17 20 18 17 19 18
Mẫu thứ tư: 18 16 24 19 22 22 24
4. Người ta tiến hành đo mực nước sông tại một số đòa điểm thuộc tỉnh X trong cùng một ngày
(số lần đo không giống nhau) và thu được bảng số liệu sau đây:
Thời điểm đo Đòa điểm đo
F1 F2 F3 F4
1
2
3
4
5
6
7
5,5
5,6
5,8
5,9
6,0
6,7
7,2
4,9
5,1
6,5
5,4
6,1
4,6
4,8
5,8
5,1
6,2
7,1
4,5
6,2
4,8
4,8
6,5
6,8
Mực nước sông trung bình/ngày của các điểm nói trên có thực sự khác nhau không?
Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung
binh1 của hai hay nhiều mẫu được lấy từ các phân số. Đây có thể được xem như một
phần mở rộng của trắc nghiệm so sánh hai giá trị trung bình.
Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu
tố ( nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát. Y. (i= 1,2,3…)
Bảng ANOVA
Nguồn sai số Bậc tự do
Tổng số bình
phương
Bình phương
trung bình
Gía trị thống kê
Yếu tố
Sai số
k-1
N-k
SSF=
SSE=SST-SSF
MSF=
MSE=
F=
Tổng cộng N-1 SST=
Trắc nghiệm
Giả thiết:
H
o
:μ
1
=μ
2
=…μ
n
“các giá trị trung bình bằng nhau”
H1: μi≠μj :Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
F=
Biện luận
Nếu F<F
α
(k-1;N-k) chấp nhận giả thiết H
o
II. CÁCH THỰC HIỆN VÀ KẾT QUẢ CHẠY BẰNG EXCEL
Nhập dữ liệu vào bảng sau:
Áp dụng “Anova: Single Factor”
a)Nhấn lần lượt các đơn lệnh Tools và Data Analysis
b)Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấn nút ok
cTrong hộp thoại Anova: Single Factor lần lượt ấn định:
Phạm vi đầu vào(Input Range)
Cách sắp xếp theo hàng hay cột(Group By)
Nhấn dữ liệu (Labels in First Row/Column)
Hơp thoại “Anova: Single Factor”
Kết quả
Anova: Single
Factor
SUMMARY
Groups Count Sum Average Variance
Mẫu 1 10 185 18.5 9.611111
Mẫu 2 11 267 24.27273 8.418182
Mẫu 3 11 205 18.63636 2.854545
Mẫu 4 7 145 20.71429 9.571429
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 234.9339 3 78.3113 10.67926 3.94E-05
2.8741
87
Within Groups 256.6558 35 7.333024
Total 491.5897 38
4. Người ta tiến hành đo mực nước sông tại một số đòa điểm thuộc tỉnh X trong cùng một ngày
(số lần đo không giống nhau) và thu được bảng số liệu sau đây:
Thời điểm đo Đòa điểm đo
F1 F2 F3 F4
1
2
3
4
5
6
7
5,5
5,6
5,8
5,9
6,0
6,7
7,2
4,9
5,1
6,5
5,4
6,1
4,6
4,8
5,8
5,1
6,2
7,1
4,5
6,2
4,8
4,8
6,5
6,8
Mực nước sông trung bình/ngày của các điểm nói trên có thực sự khác nhau không?
I.CƠ SỞ LÝ THUYẾT
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát
Yij(i=1,2,3…:yếu tố A;j=1,2,3 :yếu tố B)
Nguồn sai
số
Bậc tự do Tổng số bình phương Bình phương trung bình Giá trị thống kê
Yếu tố A (r-1) SSB= MSB= F
R
=
Yếu tố B
(cột)
Sai số
(c-1)
(r-1)(c-1)
SSB=
SSE=SST-(SSF+SSB)
MSB=
MSB=
F
C
=
Tổng cộng
(c-1)
(r-1)(c-1)
SST=
Trắc nghiệm
Giả thiết:
H
o
:μ
1
=μ
2
=…μ
n
“các giá trị trung bình bằng nhau”
H1: μi≠μj :Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
F
R
= và F
C
=
Biện luận
Nếu F
R
<F
α
[b-1;(k-1)(b-1)] chấp nhận giả thiết H
o
(yếu
tố A)
Nếu FC<F
α
[bk-1;(k-1)(b-1)] chấp nhận giả thiết H
o
(yếu tố B)
II. CÁCH THỰC HIỆN VÀ KẾT QUẢ CHẠY BẰNG EXCEL
Nhập dữ liệu vào bảng sau:
Áp dụng “Anova: Two-Factor Without Replication”
a)Nhấn lần lượt các đơn lệnh Tools và Data Analysis
b)Chọn chương trình Anova: Two-Factor Without Replication trong hộp thoại Data
Analysis rồi nhấn nút ok
c)Trong hộp thoại Anova: Two-Factor Without Replication, lần lượt ấn định các chi tiết
Phạm vi đầu vào(Input Range)
Nhấn dữ liệu (Labels in First Row/Column)
Ngưỡng tin cậy(Alpha)
Phạm vi đầu ra(Output Range)
Hộp thoại Anova: Two-Factor Without Replication
Kết quả
Anova: Two-Factor
Without
Replication
SUMMARY Count Sum Average Variance
1 4 19.5 4.875 0.2025
2 4 21.7 5.425 0.375833
3 4 22.9 5.725 0.489167
4 4 21.2 5.3 0.22
5 4 24.8 6.2 0.046667
6 4 20.6 5.15 11.81667
7 4 7.2 1.8 12.96
F1 7 42.7 6.1 0.386667
F2 5 28 4 7.773333
F3 6 33.6 4.8 5.236667
F4 6 33.6 4.8 5.33
ANOVA
Source of Variation SS df MS F P-value F crit
Rows 49.9 6 8.316667 2.396734 0.070318
2.661
305
Columns 15.8725 3 5.290833 1.524736 0.242229
3.159
908
Error 62.46 18 3.47
Total 128.2325 27
Biện luận
F
R
=2.397 < F
0.05
=2.661 chấp nhận giả thiết Ho(thời điểm đo)
F
C
=1.525 < F
0.05
=3.16 chấp nhận giả thiết Ho(địa điểm đo)
Vậy mực nước sông trung bình/ngày của các điểm nói trên thực sự khác nhau
5.So sánh chi phí cho ba loại dòch vụ ở ba thành phố khác nhau bằng phương phương phân
tích phương sai trên cơ sở bảng số liệu sau đây:
Thành phố Loại dòch vụ
I II III
I
II
III
61
58
68
52
51
64
69
61
79
Các con số trong ô là chi phí trung bình cho 1 lần dòch vụ (đơn vò: 1000đ)
I.CƠ SỞ LÝ THUYẾT
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát
Yij(i=1,2,3…:yếu tố A;j=1,2,3 :yếu tố B)
Nguồn sai
số
Bậc tự do Tổng số bình phương Bình phương trung bình Giá trị thống kê
Yếu tố A (r-1) SSB= MSB= F
R
=
Yếu tố B
(cột)
Sai số
(c-1)
(r-1)(c-1)
SSB=
SSE=SST-(SSF+SSB)
MSB=
MSB=
F
C
=
Tổng cộng
(c-1)
(r-1)(c-1)
SST=
Trắc nghiệm
Giả thiết:
H
o
:μ
1
=μ
2
=…μ
n
“các giá trị trung bình bằng nhau”
H1: μi≠μj :Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
F
R
= và F
C
=
Biện luận
Nếu F
R
<F
α
[b-1;(k-1)(b-1)] chấp nhận giả thiết H
o
(yếu
tố A)
Nếu FC<F
α
[bk-1;(k-1)(b-1)] chấp nhận giả thiết H
o
(yếu tố B)
II. CÁCH THỰC HIỆN VÀ KẾT QUẢ CHẠY BẰNG EXCEL
Nhập dữ liệu vào bảng sau:
Áp dụng “Anova: Two-Factor Without Replication”
a)Nhấn lần lượt các đơn lệnh Tools và Data Analysis
b)Chọn chương trình Anova: Two-Factor Without Replication trong hộp thoại Data
Analysis rồi nhấn nút ok
c)Trong hộp thoại Anova: Two-Factor Without Replication, lần lượt ấn định các chi tiết
Phạm vi đầu vào(Input Range)
Nhấn dữ liệu (Labels in First Row/Column)
Ngưỡng tin cậy(Alpha)
Phạm vi đầu ra(Output Range)
Hộp thoại Anova: Two-Factor Without Replication
KẾT QUẢ
Anova: Two-Factor
Without Replication
SUMMARY Count Sum Average Variance
i 3 182 60.66667 72.33333
ii 3 170 56.66667 26.33333
iii 3 211 70.33333 60.33333
i 3 187 62.33333 26.33333
ii 3 167 55.66667 52.33333
iii 3 209 69.66667 81.33333
ANOVA
Source of Variation SS df MS F P-value F crit
Rows 296.2222 2 148.1111 24.91589 0.005521
6.944
272
Columns 294.2222 2 147.1111 24.74766 0.005591
6.944
272
Error 23.77778 4 5.944444
Total 614.2222 8
BIỆN LUẬN
F
R
=24.916 > F
0.05
=6.944 bác bỏ giả thiết Ho(thành phố)
F
C
=24.748 > F
0.05
=6.944 bác bỏ giả thiết Ho(loại dịch vụ)
Vậy yếu tố thành phố và loại dịch vụ ảnh hưởng đến chi phí