Tải bản đầy đủ (.doc) (37 trang)

bài báo cáo bài tập lớn xác suất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.49 MB, 37 trang )

Bài báo cáo Bài tập lớn
Xác suất thống kê
MỤC LỤC
Bài báo cáo Bài t p l nậ ớ 1
Xác su t th ng kêấ ố 1
M C L CỤ Ụ 2
I.D ng bài t p: phân tích ph ng sai 2 y u tạ ậ ươ ế ố 33
A. KHÁI NI M TH NG KÊ:Ệ Ố 33
BÀI BÁO CÁO XSTK
NHÓM 4
BÀI 1:
Phần A:(ví du 3.4 trang 161sgk)
Hiệu xuất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3
yếu tố:pH(A),nhiệt độ (B) và chất xúc tác (C)được trình bày trong bảng sau:
Yếu tố
A
Yếu tố B
B1 B2 B3 B4
A1 C1 9 C2 14 C3 16 C4 12
A2 C2 12 C3 15 C4 12 C1 10
A3 C3 13 C4 14 C1 11 C2 14
A4 C4 10 C1 11 C2 13 C3 13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu xuất phản ứng?
Bài làm:
I.Dạng toán: phân tích phương sai ba yếu tố
II.CƠ SỞ LÝ THUYẾT
Mục đích của sự phân tích phương sai ba yếu tố là đánh giá sự ảnh hưởng của ba
yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố trên các giá
trị quan sát G(i=1,2…r:yếu tố A;j=1,2…r:yếu tố B;k=1,2…r:yếu tố C)
• Mô hình vuông la tinh ba yếu tố được trình bày như sau:


Yếu
tố A
Yếu tố B
B1 B2 B3 B4 T
i
A1 C1 Y
111
C2 Y
122
C3 Y
133
C4 Y
144
T
1
A2 C2 Y
212
C3 Y
223
C4 Y
234
C1 Y
241
T
2
A3 C3 Y
313
C4 Y
324
C1 Y

334
C2 Y
342
T
3
A4 C4 Y
414
C1 Y
421
C2 Y
412
C3 Y
443
T
4
T
j
T
1
T
2
T
3
T
4
T
i
:Tổng theo hàng
T
j

:Tổng theo cột
T
k
:Giá trị này được tính như sau:
B C A D
C D A B
D A B C
A B C D
T
k
được tính theo bảng trên,ví dụ:
T
1
= Y
111
+ Y
421
+ Y
334
+ Y
241
Bảng ANOVA:
Nguồn sai
số
Bậc
tự do
Tổng số bình
phương
Bình phương trung
bình

Giá trị thống

Yếu tố A (r-1)
SSR=
MSR=
F
R
=MSR/MSE
Yếu tố B
(r-1)
SSC=
MSC=SSC/(R-1) F
C
=MSC/MSE
Yếu tố C (r-1)
SSF=
MSF=
F=MSF/MSE
Sai số
(r-1)
(r-2)
SSE=SST-
(SSF+SSR+SSC)
MSE=SSE/(r-1)(r-2)
Tổng
cộng
(r
2
-1)
SST=

Ta có giả thuyết sau :
H
0
:Các giá trị trung bình bằng nhau
H
1
:Có ít nhất hai giá trị trung bình bằng nhau
Nếu giá trị thống kê bé hơn F
α
III.Áp dụng MS-EXCEL:
H
0
: µ
1
= µ
2
= µ
3
=…= µ
n
ó Các giá trị trung bình bằng nhau
H1: µ
j
≠ µ
k
ó Có ít nhất hai giá trị trung bình khác nhau

Thiết lập các biểu thức và tính các giá trị thống kê
1. Tính các giá trị Ti…. T.j… T k và T
• Các giá trị Ti…

Chọn ô B7 và chọn biểu thức=SUM(B2:E2)
Chọn ô C7 và nhập biểu thức=SUM(B3:E3)
Chọn ô D7 và nhập biểu thức=SUM(B4:E4)
Chọn ô E7 và nhập biểu thức=SUM(B4:E4)
• Các giá trị T.j.
Chọn ô B8 và nhập biểu thức=SUM(B2:B5)
Dùng con trỏ kéo ký tự điền từ ô B8 đến ô E8
• Các giá trị T k
Chọn ô B9 và nhập biểu thức=SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức=SUM(B3,C2,D5,E4)
Chọn ô D9 và nhập biểu thức=SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức=SUM(B5,C4,D3,E2)
• Giá trị T…
Chọn ô B10 và nhập biểu thức=SUM(B2:B5)
2. tính các giá trị G
• Các giá trị G
Chọn ô G7 và nhập biểu thức=SUMSQ(B7:E7)
Dung con trỏ kéo ký hiệu tự điền từ G7 đến ô G9
Chọn ô G10 và nhập biểu thức=POWER(B10,2)
Chọn ô G11 và nhập biểu thức=SUMSQ(B2:E5)
3. tính các giá trị SSR.SSC.SSF.SST và SSE
• Các giá trị SSR.SSC.SSF
Chọn ô I7 và nhập biểu thức=G7/4-39601/POWER(4,2)
Dung con trỏ kéo ký tự điền từ ô I7 đến ô I9
• Giá trị SST
Chọn ô I11 và nhập biểu thức=G11-G10/POWER(4,2)
• Giá trị SSE
Chọn ô I10 và nhập biểu thức=I11-SUM(I7:I9)
4. tính các giá trị MSR.MSC.MSF và MSE
• Giá trị SST

Chọn ô K7 và nhập biểu thức=I7/(4-1)
Dung con trỏ kéo ký tự điền từ ô K7 đến ô K9
• Giá trị MSE
Chọn ô K10 và nhập biểu thức=I/((4-1)*(4-2))
5. tính các giá trị G và F:
Chọn ô M7 và nhập biểu thức=K7/0.3958
Dùng con trỏ kéo ký tự điền từ ô M7 đến M9.
IV.KẾT QUẢ VÀ BIỆN LUẬN:
F
R
=3.10<F
0.05
(3.6)=4.76=>chấp nhận H
0
(Ph)
F
C
=11.95> F
0.05
(3.6)=4.76=> bác bỏ H
0
(nhiệt độ)
F=30.05> F
0.05
(3.6)=4.76=>bác bỏ H
0
(chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng đến hiệu suất
Phần B:(ví du 4.2 trang 171)
Người ta dùng 3 mức nhiệt độ gồm 105,120 và 135

0
C kết hợp với 3 khoảng
thời gian là 15,30 và 60 phút để thực hiện một phản ứng tổng hợp.các hiệu xuất
của phản ứng(%) được trình bày trong bảng sau:
Thời gian (phút)
X1
Nhiệt độ (
0
C)
X2
Hiệu xuất (%)
Y
15 105 1.87
30 105 2.02
60 105 3.28
15 120 3.05
30 120 4.07
60 120 5.54
15 135 5.03
30 135 6.45
60 135 7.26
Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên quan
tuyến tính với hiệu xuất của phản ứng tổng hợp?nếu có thì điều kiện nhiệt độ
115
0
C trong vòng 50 phút thì hiệu xuất phản ứng sẻ là bao nhiêu?
Giải:
I.Dạng toán: hồi quy tuyến tính đa tham số
II.Cơ sở lý thuyết:
HỒI QUY TUYẾN TÍNH ĐA THAM SỐ

Trong phương trình hồi quy tuyến tính đa tham số ,biến số Y có liên quan đến k
biến số độc lập.
Phương trình tổng quát:
Y(x
0
,x
1
,…x
k
) =B
0
+B
1
X
1
+…+B
k
X
k
Bảng ANOVA
Nguồn sai số Bậc tự do Tổng số bình
phương
Bình phương
trung bình
Giá trị thống

Hồi quy k SSR MSR=SSR/k F=MSR/MSE
Sai số N-k-1 SSE MSE=SSE/(N-
k-1)
Tổng cộng N-1 SST=SSR+SSE

• Giá trị thống kê:
• Giá trị R-bình phương
• Giá trị R
2
-được hiệu chỉnh
• R
2
= =Kf/((N-k-1)+Kf) (R
2
>=0,81 là khá tốt)
• Giá trị R
2
được hiệu chỉnh
• R
ii
2
= = R
2
-
• Độ lệch chuẩn
• S= (S=<0,30 là khá tốt)
Trắc nghiệm thống kê
Đối với một phương trình hồi quy ý nghĩa thống kê của các hệ số B
i
được đánh
giá bằng trắc nghiệm t (phân phối student) trong khi tính chất thích hợp của
phương trình được đánh giá bằng trắc nghiệm F (phân phối Fisher)
-Trong trắc nghiệm t
H
0

:Các hệ số hồi quy không có ý nghĩa
H
1
:Có ít nhất vài hệ số hồi quy có ý nghĩa
Bậc tự do của giá trị t: =N-k-1
t=
-trong trắc nghiệm F:
H
2
:phương trình hồi quy không thích hợp
H
3
:phương trình hồi quy thích hợp với ít nhất vài β
i
Bậc tự do của giá trị F:v
1
=1;v
v
=N-k-1
III.Áp dụng MS-EXCEL:
-Trong trắc nghiệm t:
H
0
: Β
i
= 0 ó Các hệ số hồi quy không có ý nghĩa
H
1
: Β
i

≠ 0 ó Các hệ số hồi quy có ý nghĩa
-Trong trắc nghiệm F:
H
0
: Β
i
= 0 ó Phương trình hồi quy không thích hợp
H
1
: Β
i
≠ 0 ó Phương trình hồi quy thích hợp với ít nhất vài B
i
Bước 1:nhập dử liệu vào bản tính
Dử liệu nhất thiết phải được nhập theo cột.
Bước 2:áp dụng Regression
Nhấn lần lượt đơn lệnh tools và lệnh data Analysis
Chọn chương trình Regression trong hộp thoại data Analysis rồi nhấp OK
Trong hộp thoại Regression ,làn lượt ấn các chi tiết:
Phạm vi của biến số Y (input Y range)
Phạm vi của biến số X (input X range)
Nhãn dử liệu(Labels)
Mức tin cậy(Confidence level)
Tọa độ đầu ra(Output range)
Đường hồi quy(line Fit Plots),…
Các giá trị đầu ra cho bảng sau:
Phương trình hồi quy:
X1
=f(X
1

)
X1
=2.73+0.04X
1
(R
2
=0.21,S=1.81)
t
0
=2.19<t
0.05
=2.365(hay P
v
2
=0.071>α=0.05)
=>Chấp nhận giả thiết H
0
t
1
=1.38<t
0.05
=2.365(hay P
v
=0.209>α=0.05)
=>Chấp nhận giả thiết H
0
F=1.95<F
0.05
=5.590(hay F
s

=0.209>α=0.05)
=>Chấp nhận giả thiết H
0
Vậy cả hai hệ số 2.73(B
0
) và 0.04(B
1
) của phương trình hồi quy
X1
=2.73+0.04X
1
đều không có ý nghĩa thống kê.nói cách khác phương trình
hồi quy này không thich hợp.
Phương trình hồi quy:
X2
=f(X
2
)
Y
X2
=2.73+0.04X
2
(R
2
=0.76,S=0.99)
t
0
=3.418> t
0.05
=2.365(hay P

v
2
=0.011>α=0.05)
=>Bác bỏ giả thiết H
0
t
1
= 4.757>t
0.05
=2.365(hay P
v
=0.00206<α=0.05)
=>Bác bỏ giả thiết H
0
F=22.631>F=5.590(hay F
s
=0.00206<α=0.05)
=>Bác bỏ giả thiết H
0
Vậy cả hai hệ số -11.14(B
0
) và 0.13(B1) của phương trình hồi quy
X2
=2.73+0.04X2 đều có ý nghĩa thống kê.Nói cách khác phương trình hồi quy này
thích hợp.
IV.Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu xuất của phản ứng
tổng hợp.
Phương trình hồi quy:
X1,X2
=f(X1,X2)

X1,X2
=-12.70+0.04X
1
+0.13X
2
(R
2
=0.97; S=0.33)
X1.X2
=-12.7+0.04X
1
+0.13X
2
t
0
=11.528> t
0.05
=2.365(hay P
v
2
=2.260*10
-5
<α=0.05)
=>Bác bỏ giả thiết H
0
t
1
=7.583> t
0.05
=2.365(hay P

v
=0.00027<α=0.05)
=>Bác bỏ giả thiết H
0
F=131.392>5.14(hay F
s
=1.112*10
-5
<α=0.05)
=>Bác bỏ giả thiết H
0
Vậy cả hai hệ số -12.70(B
0
),0.04(B1)và 0.13(B1)của phương trình hồi quy
=-12.80+0.04X
1
+0.13X
2
đều có ý nghĩa thống kê. Nói cách khác,phương trinh hồi
quy này thích hợp
Kết luận: hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với cả hai
yếu tố là thời gian và nhiệt độ.
Sự tuyến tính của phương trình
X1,X2
=-12.70+0.04X
1
+0.13X
2
. có thể được
trình bày trong biểu đồ phân tán(scatterplots):

BIỂU ĐỒ:
Kết luận: hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với cả hai
yếu tố là thời gian và nhiệt độ.
Nếu muốn dự đoán hiệu xuất bằng phương trình hồi quy Y=-
12.70+0.04X
1
+0.13X
2
,chỉ cần chọn một ô,ví dụ như
E20,sau đó nhập hàm=E17+E18*50+E19*115 và được kết quả như sau:
Ghi chú: E17 tọa độ của B0 ,E18 tọa độ của B1,E19 tọa độ của B2,50 là giá trị của
X
1
(thời gian) và 115 là giá trị của X
2
(nhiệt độ)
BÀI 2:
Có 4 báo cáo viên A,B,C,D nói về cùng một chủ đề.sau đây là thời gian(tính
bằng phút)mà mỗi báo báo cáo viên đó sử dụng trong 5 buổi báo ở các địa điểm
khác nhau:
A: 25 29 30 42 35
B: 35 20 20 17 30
C: 30 27 18 19 26
D: 28 32 33 35 24
Hãy thiết lập bảng ANOVA cho các số liệu trên.Gỉa thiết H
0
là gì?giả thiết H
0

có bị bác bỏ mứ ý nghĩa 5% hay khơng.

Giải:
I.Dạng tốn: phân tích phương sai một yếu tố :
II.Cơ sở lí thuyết:
Giả sử
1
11 21 n 1
{x , x , x }
là một mẫu có kích thước n
1
rút ra từ tập hợp
chính các giá trò của X
1;
2
12 22 n 2
{x , x , x }
là một mẫu kích thước rút ra từ tập
hợp chính các giá trò của X
2
, ,
k
1k 2k n k
{x , x , x }
là một mẫu kích thước n
k
rút
ra từ tập hợp chính các giá trò của X
k
. Các số liệu thu được trình bày thành
bảng ở dạng sau đây:
Ta đưa

ra một số kí
hiệu sau
 Trung bình của mẫu thứ i (tức là mẫu ở cột thứ i trong bảng
trên):
=
= =

i
n
ji
j 1
i
i
i i
x
T
x
n n
 Trung bình chung
= =
= = =
∑∑
∑∑
j
n
k
ij
ij i 1 j 1
x
x

T
x
n n n
ở đó n = n
1
+ n
2
+ + n
k;
T = T
1
+ T
2
+ + T
k
.
 Tổng bình phương chung ký hiệu là SST (viết tắt là chữ Total
Sum of Squares) được tính theo công thức sau:
( ) ( ) ( )
( )
= = =
= =
= − + − + + −
= −
∑ ∑ ∑
∑∑
L
1 2 k
j
k

n n n
2 2 2
i1 i2 ik
i 1 i 1 i 1
n
n
2
ij
j 1 i 1
SST x x x x x x
x x
có thể chứng minh rằng

,
= = =
= + + + −
= −
∑ ∑ ∑

L
1 2 k
n n n
2
2 2 2
i1 i2 ik
i 1 i 1 i 1
2
2
ij
i j

T
SST x x x
n
T
x
n
 Tổng bình phương do nhân tố ký hiệu là SSF (viết tắt của chữ
Sum of Squares for Factor) được tính theo công thức sau:
Các mức nhân tố
1 2 K
=
=

1
1
k
i
n n
x
11
x
12
x
1k
x
21
x
22
x
2k


1
1n
x
2
2n
x

k
n k
x
Tổng
số
T
1
T
2
T
k
=
=

1
k
k
i
T T
Trung
bình
1

x
2
x

=
T
x
n
( )
=
= −
= + + + −

L
k
2
i i
i 1
2 2 2
2
1 2 k
1 2 k
SSF n x x
T T T
T
n n n n
 Tổng bình phương do sai số ký hiệu là SSE (viết tắt của chữ Sum
of Squares for the Error) được tính theo công thức:
( ) ( ) ( )
1 2 k

1 2 k
n n n
2 2 2
i1 i 2 2 ik k
i 1 i 1 i 1
n n n
2 2 2
2 2 2
1 2 k
i1 i 2 ik
1 2 k
i 1 i 1 i 1
2 2
2
1 k
ij
1 k
SSE x x x x x x
T T T
x x x
n n n
T T
x
n n
= = =
= = =
= − + − + + −
= − + − + + −
 
= − + +

 ÷
 ÷
 
∑ ∑ ∑
∑ ∑ ∑
∑∑
L
L
L
Từ công thức trên ta thấy:
SST = SSF + SSE
 Trung bình bình phương của nhân tố, ký hiệu là MSF (viết tắt
của chữ Mean Square for Factor) được tính bởi công thức:
SSF
MSF
k 1
=

k – 1 được gọi là bậc tự do của nhân tố.
 Trung bình bình phương của sai số, ký hiệu là MSE (viết tắt của
chữ Mean Square for Error) được tính bởi công thức:
SSE
MSE
n k
=

n – k được gọi là bậc tự do của sai số.
Tỷ số F được tính bởi công thức

MSF

F
MSE
=
Các kết quả nói trên được trình bày trong bảng sau đây gọi là ANOVA
(viết tắt của chũ Analysis of Variance: phân tích phương sai)
Bảng ANOVA
Nguồn Tổng
bình
Bậc tự
do
Trung
bình bình
Tỷ số F
phương phương
Nhân tố SSF k – 1 MSF MSF/MS
E
Sai số SSE n – k MSE
Tổng số SST n – 1
- Người ta chứng minh được rằng nếu giả thiết H
o
đúng thì tỷ số F
MSF
F
MSE
=
sẽ có phân bố Fisher với bậc tự do là (k – 1, n – k)
Thành thử giả thiết H
o
sẽ bò bác bỏ ở mức ý nghóa α của phân bố Fisher
với bậc tự do là (k – 1, n – k), k – 1 được gọi là bậc tự do ở mẫu số.

Giả thiết H
0
: H
0

1
= µ
2
= µ
3
= µ
4
ó”thời gian nói trung bình của 4 người là bằng
nhau”
H1 :a
I
≠ a
J
TÍNH CỤ THỂ:
Thời gian báo cáo của các báo cáo viên
Tổng số
A B C D
25 35 30 28
29 20 27 32
30 20 18 33
42 17 19 35
35 30 26 24
n
i
5 5 5 5 20

T
i
161 122 120 152 555
Bước 1: Tính SSF:
SSF = (161
2
+122
2
+120
2
+152
2
)/5 – 555
2
/20=260,55
Bước 2: Tính SST:
SST = (25
2
+29
2
+30
2
+42
2
+35
2
+… 24
2
)- 555
2

/20=855,75
Bước 3: Tính SSE:
SSE= 855,75-260,55=595,20
Bước 4: Tính MSF:
MSF = 260.55/3=86.85
Bước 5: Tính SSE:
MSE = 595.20/16=37.2
Bước 6: Tính F:
F = 86.85/37.20 = 2.33
Tra bảng ta có F(3,16)=3.24
F<F(3,16)
Suy ra: chấp nhận Ho, thời gian trung bình mà các báo cáo viên cần cho các bài
báo cáo của mình là bằng nhau
III.Thuật toán:
a. mở chương trình Ms-EXCEL
b. nhập dử liệu vào bảng tính
sử dụng hàm ANOVA:single-factor từ data Analysis.
c. biện luận:
từ bảng ANOVA thu được F
R
,F
C
nếu F
R
<F
α
=> chấp nhận H
0
( báo cáo viên)
IV.Quy trình giải thuật :

Khởi động Ms- EXCEL
Nhập dử liệu vào bảng:
Áp dụng “anova:single-factor”
Nhấn lần lượt lệnh tools và lệnh data analysis
Từ hộp thoại data analysis ta chọn” single-factor” rồi nhấp nút OK
Trong hộp thoại anova:single factor, lần lượt ấn định các chi tiết:
Phạm vi đầu vào(input range)
Nhãn dử liệu (labels in fisrt row/column)
Ngưởng tin cậy (alpha)
Phạm vi đầu ra(output range)
Sau khi nhấn OK ta thu được kết quả được thể hiện qua bảng anova sau:
V.Kết luận
F=2.33 < Fcrit= 3.23  Chấp nhận Ho
 Thời gian trung bình mà các báo cáo viên cần cho các bài báo cáo của mình là
bằng nhau
BÀI 3:
Một cửa hàng lớn có bán ba loại giầy A,B,C.theo dõi số khách hàng mua các
loại giầy này trong 5 ngày,người quả lý thu được bảng số liệu sau:
A B C
28
21
20
18
23
35
42
32
25
27
33

38
31
42
29
Với mức ý nghĩa α=1% hãy so sánh lượng tiêu thụ trung bình của ba loại giầy
nói trên.
Loại giầy
Giải:
I.Dạng: Bài toán phân tích phương sai một nhân tố
II.Cơ sở lí thuyết:
Giả sử
1
11 21 n 1
{x , x , x }
là một mẫu có kích thước n
1
rút ra từ tập hợp
chính các giá trò của X
1;
2
12 22 n 2
{x , x , x }
là một mẫu kích thước rút ra từ tập
hợp chính các giá trò của X
2
, ,
k
1k 2k n k
{x , x , x }
là một mẫu kích thước n

k
rút
ra từ tập hợp chính các giá trò của X
k
. Các số liệu thu được trình bày thành
bảng ở dạng sau đây:
Các mức nhân tố
1 2 k
=
=

1
1
k
i
n n
x
11
x
12
x
1k
x
21
x
22
x
2k

1

1n
x
2
2n
x

k
n k
x
Tổng
số
T
1
T
2
T
k
=
=

1
k
k
i
T T
Trung
bình
1
x
2

x

=
T
x
n
Ta đưa ra một số kí hiệu sau
 Trung bình của mẫu thứ i (tức là mẫu ở cột thứ i trong bảng
trên):
=
= =

i
n
ji
j 1
i
i
i i
x
T
x
n n
 Trung bình chung
= =
= = =
∑∑
∑∑
j
n

k
ij
ij i 1 j 1
x
x
T
x
n n n
ở đó n = n
1
+ n
2
+ + n
k;
T = T
1
+ T
2
+ + T
k
.
 Tổng bình phương chung ký hiệu là SST (viết tắt là chữ Total
Sum of Squares) được tính theo công thức sau:
( ) ( ) ( )
( )
= = =
= =
= − + − + + −
= −
∑ ∑ ∑

∑∑
L
1 2 k
j
k
n n n
2 2 2
i1 i2 ik
i 1 i 1 i 1
n
n
2
ij
j 1 i 1
SST x x x x x x
x x
có thể chứng minh rằng

,
= = =
= + + + −
= −
∑ ∑ ∑

L
1 2 k
n n n
2
2 2 2
i1 i2 ik

i 1 i 1 i 1
2
2
ij
i j
T
SST x x x
n
T
x
n
 Tổng bình phương do nhân tố ký hiệu là SSF (viết tắt của chữ
Sum of Squares for Factor) được tính theo công thức sau:
( )
=
= −
= + + + −

L
k
2
i i
i 1
2 2 2
2
1 2 k
1 2 k
SSF n x x
T T T
T

n n n n
 Tổng bình phương do sai số ký hiệu là SSE (viết tắt của chữ Sum
of Squares for the Error) được tính theo công thức:
( ) ( ) ( )
1 2 k
1 2 k
n n n
2 2 2
i1 i 2 2 ik k
i 1 i 1 i 1
n n n
2 2 2
2 2 2
1 2 k
i1 i 2 ik
1 2 k
i 1 i 1 i 1
2 2
2
1 k
ij
1 k
SSE x x x x x x
T T T
x x x
n n n
T T
x
n n
= = =

= = =
= − + − + + −
= − + − + + −
 
= − + +
 ÷
 ÷
 
∑ ∑ ∑
∑ ∑ ∑
∑∑
L
L
L
Từ công thức trên ta thấy
SST = SSF + SSE
 Trung bình bình phương của nhân tố, ký hiệu là MSF (viết tắt
của chữ Mean Square for Factor) được tính bởi công thức:
SSF
MSF
k 1
=

k – 1 được gọi là bậc tự do của nhân tố.
 Trung bình bình phương của sai số, ký hiệu là MSE (viết tắt của
chữ Mean Square for Error) được tính bởi công thức:
SSE
MSE
n k
=


n – k được gọi là bậc tự do của sai số.
Tỷ số F được tính bởi công thức

MSF
F
MSE
=
Các kết quả nói trên được trình bày trong bảng sau đây gọi là ANOVA
(viết tắt của chũ Analysis of Variance: phân tích phương sai)
Bảng ANOVA
Nguồn Tổng
bình
phương
Bậc tự
do
Trung
bình bình
phương
Tỷ số F
Nhân tố SSF k – 1 MSF MSF/MS
E
Sai số SSE n – k MSE
Tổng số SST n – 1
Người ta chứng minh được rằng nếu giả thiết H
o
đúng thì tỷ số F
MSF
F
MSE

=
sẽ có phân bố Fisher với bậc tự do là (k – 1, n – k)
Thành thử giả thiết H
o
sẽ bò bác bỏ ở mức ý nghóa α của phân bố Fisher
với bậc tự do là (k – 1, n – k), k – 1 được gọi là bậc tự do ở mẫu số.
Tính tốn cụ thể
Ta có được các kết quả sau:
2 2 2 2
110 161 173 444
447,6
5 5 5 15
SSF
= + + − =

2
2 2 2 2 2
444
28 21 20 42 29 801,6
15
SST
= + + + + + − =
801.6 447.6 354SSE SST SSF
= − = − =
447.6
223,8
1 2
SSF
MSF
k

= = =

354
29,5
15 3
SSE
MSE
n k
= = =
− −
223.8
7,5864
29.5
MSF
F
MSE
= = =
Ta trình bày các kết quả tính toán trên trong bảng ANOVA
Nguồn
Tổng bình
phương
Bậc tự
do
Trung bình
bình phương
Tỷ số F
Nhân tố 447,6 2 223,8 7,5864
Sai số 354 12 29,5
Tổng số
801,6 14

Với mức ý nghóa 1%, tra bảng phân bố Fisher với bậc tự do (2,12) ta
được:c = 6,93.
Ta có F > c do đó ta bác bỏ H
o
.
III.Thuật tốn:
a. mở chương trình Ms-EXCEL
b. nhập dử liệu vào bảng tính
sử dụng hàm ANOVA:single-factor từ data Analysis
c. biện luận:
thu được bảng Anova ta thu được F
nếu F<F
α
=>chấp nhận giả thiết H
0
ngược lại thì bác bỏ giả thiết H
0
IV.quy trình giải thuật:
Khởi động Ms- EXCEL
Nhập dử liệu vào bảng tính
Áp dụng “anova single factor”
Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis.
Chọn trương trình Anova:single factor trong hộp thoại Data Analysis rồi nhấn nút
OK

×