Tải bản đầy đủ (.docx) (39 trang)

Bài tập lớn xác suất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (810.91 KB, 39 trang )

Trường đại học Bách Khoa TPHCM
KHOA KHOA HỌC ỨNG DỤNG
-----oOo-----

BÀI TẬP LỚN XÁC XUẤT THỐNG KÊ
------ Nhóm 10 ------

GVHD: PGS-TS NGUYỄN ĐÌNH HUY

NHÓM :

10


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
Câu 1: Trình bày lại ví dụ 3.4 trang 161 và ví dụ 4.2 trang 171 Giáo Trình XSTK
2009
Ví dụ 3.4 Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo
ba yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:

Yếu tố B

Yếu tố
A

B1

B2

B3


B4

A1

C1

9

C2

14

C3

16

C4

12

A2

C2

12

C3

15


C4

12

C1

10

A3

C3

13

C4

14

C1

11

C2

14

A4

C4


10

C1

11

C2

13

C3

13

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng
Bài làm:
1. Dạng toán: PHÂN TÍCH PHƯƠNG SAI BA YẾU TỐ
2. Cơ sở lý thuyết:

Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các
giá trị quan sát G (i = 1, 2... r: yếu tố A; j = 1, 2...r: yếu tố B: k = 1, 2...r: yếu tố C).
Mô hình:
Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô
hình vuông la tinh n×n. Ví dụ như mô hình vuông la tinh 4×4:
B

C

D


A

C

D

A

B

D

A

B

C

A

B

C

D

2
2



BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
Mô hình vuông la tinh ba yếu tố được trình bày như sau:
Yếu tố C (T..k. Ví dụ: T..1 = Y111 + Y421 + Y331 + Y241)
Yếu tố B

Yếu tố A

B1

B2

B3

B4

A1

C1

Y111

C2

Y122

C3

Y133

C4


Y144

T1..

A2

C2

Y212

C3

Y223

C4

Y234

C1

Y241

T2..

A3

C3

Y313


C4

Y324

C1

Y331

C2

Y342

T3..

A4

C4

Y414

C1

Y421

C2

Y432

C3


Y443

T4..

T.i.

T.1.

T.2.

T.3.

T.4.

Bảng ANOVA:
Nguồn sai
số
Yếu tố A
(Hàng)
Yếu tố B
(Cột)

Bậc tự do

Bình phương
trung bình

Giá trị thống kê


SSR
MSR= (r − 1)

MSR
FR= MSE

T
− ...2
r
r

2

SSC
MSC= (r − 1)

MSC
FC= MSE

T..2k T...
− 2

r
r
k
=
1
SSF =

2


SSF
MSF= (r − 1)

MSF
F= MSE

SSE = SST –

SSE
MSE= (r − 1)( r − 2)

Tổng số bình phương
Ti ..2 T..2
∑ − 2
SSR = i =1 r r
r

(r-1)

r

(r-1)

SSC =



T. 2j.


j =1

r

Yếu tố C

(r-1)

Sai số

(r-1)(r-2)

Tổng cộng

(SSF + SSR + SSC)

2

(r -1)

SST =

∑∑∑ Yij2k −
i

j

r

T...2

r2

3
3


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
Trắc nghiệm


Giả thiết:
H0: μ1 = μ2 = ...= μk ⇔ “Các giá trị trung bình bằng nhau”
H1: μi ≠ μj ⇔ “Có ít nhất hai giá trị trung bình khác nhau”



Giá trị thống kê: G và G



Biện luận:

Nếu G (chấp nhận H0 (đối với yếu tố A))
Nếu G (chấp nhận H0 (đối với yếu tố B))
Nếu G (chấp nhận H0 (đối với yếu tố C)).
3. Phần mềm: Microsoft Excel 2010.
4. Chương trình:
5. Phương pháp giải bài toán trên Excel 2010:

Giả thiết H0: pH ảnh hưởng đến hiệu suất phản ứng.

Giả thiết H0: Nhiệt độ ảnh hưởng đến hiệu suất phản ứng.
Giả thiết H0: Chất xúc tác ảnh hưởng đến hiệu suất phản ứng.
 Bước 1: Nhập dữ liệu vào bảng tính:

 Bước 2: Thiết lập các biểu thức và tính giá trị thống kê:
∗ Tính các giá trị Ti…,Tj.. và T..k ,T…
- Các giá trị Ti..

-

-

Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
Các giá trị T.j.
Chọn ô B8 và nhập =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 tới ô E8.
Các giá trị T..k
Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)
4
4


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012










Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
Giá trị T..
Chọn ô B10 và nhập biểu thức =SUM(B2:E5)
Tính các giá trị G và G
-Các giá trị G và G
Chọn ô B10 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 tới G9
-giá trị G
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
-giá trị G
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR. SSC. SSF. SST và SSE
-Các giá trị SSR. SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 tới I9
-Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
-Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(J7:I9)
Tính các giá trị MSR. MSC. MSF và MSE
-Các giá trị MSR. MSC và MSF
Chọn ô K7 và nhập biểu thức =K7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 tới ô K9

-Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính giá trị G và F
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 tới ô M9

 Bước 3: Kết quả và biện luận

FR = 3.10 < F0.05(3,6) = 4.76 ⇒ chấp nhận Ho (pH)
5
5


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
FC = 11.95 > F0.05(3,6) = 4.76 ⇒ bác bỏ Ho (nhiệt độ)
F = 30.05 > F0.05 (3,6)=4.76 ⇒ bác bỏ Ho (chất xúc tác)
Vậy chỉ có nhiệt và chất xúc tác gây ảnh hưởng đến hiệu suất.
Ví dụ 4.2 Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 135 0C kết hợp với ba
khoảng thời gian là 15, 30, 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất
của phản ứng (%) được trình bày trong bảng sau đây:

6
6


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012

Thời gian (phút)
X1


Nhiệt độ (0C)
X2

Hiệu suất (%)
Y

15

105

1.87

30

105

2.02

60

105

3.28

15

120

3.05


30

120

4.07

60

120

5.54

15

135

5.03

30

135

6.45

60

135

7.26


Hãy cho biết yếu tố nhiệt độ và thời gian/ hoặc yếu tố thời gian có liên quan tuyến
tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115 0C trong
vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
Bài làm:
1. Dạng toán: HỒI QUY TUYẾN TÍNH ĐA THAM SỐ
2. Cơ sở lý thuyết:

Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên
quan đến k biến số độc lập Xi (I = 1,2,...,k) thay vì chỉ có một như trong hồi quy tuyến
tính đơn giản.
Phương trình tổng quát:
Ŷx0,x1,...,xk = B0 + B1X1 +B2X2 + ... + BkXk

7
7


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
Bảng ANOVA:

Nguồn sai số

Bậc tự do

Tổng số bình
phương

Bình phương
trung bình


Giá trị thống


Hồi quy

K

SSR

SSR
MSR= k

MSR
F= MSE

MSE =
SSE
( N − k − 1)

Sai số

N-k-1

SSE

Tổng cộng

N-1

SST = SSR + SSE


Giá trị thống kê:
Giá trị R-bình phương:
Giá trị R2 được hiệu chỉnh (Adjusted R Square)
R2 =

SSR
kF
=
SST ( N − k − 1) + kF ( R 2 ≥ 0,81 là khá tốt)

Giá trị R2 được hiệu chỉnh (Adjusted R Square)
Rii2 =

( N − 1) R 2 − k
k (1 − R 2 )
= R2 −
N − k −1
( N − k − 1)

2

( Rii sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ)
Độ lệch chuẩn:
S=

SSE
( N − k − 1) ( S ≤ 0,30 là khá tốt)

Trắc nghiệm thống kê:

-

Trong trắc nghiệm t:
H0: βi = 0 “Các hệ số hồi quy không có ý nghĩa”.
H1: βi ≠ 0 “Có ít nhất vài hệ số hồi quy có ý nghĩa”.
Bậc tự do của giá trị t: γ = N – k – 1
t=

-

Bi − β i
S n2

; Sn2 =

Trong trắc nghiệm F:
8
8

S2
∑ ( X i − X )2


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
H0: βi = 0 “Phương trình hồi quy không thích hợp”.
H1: βi ≠ 0 “Phương trình hồi quy thích hợp với ít nhất vài hệ số Bi”.
Bậc tự do của giá trị F: v1 = 1, v2 = N – k – 1.
3. Phần mềm: Micsrosoft Excel 2010.
4. Chương trình: Regression.
5. Phương pháp giải bài toán trên Excel 2010.

 Bước 1:Nhập dữ liệu vào bảng tính:

Dữ kiệu nhất thiết phải được nhập theo cột:

 Bước 2 : Nếu trong menu Tools chưa có mục Data Analysis , tiến hành cài

Analysis
ToolPak như sau :
Chọn File/Option/Add-Ins/Data Analysis Tool Pak /Go…/ Analysis Tool Pak
/OK… như
trong hình :

9
9


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012


a)
b)
c)
-

Bước 3: Sử dụng “Regression”
Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis
Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấn nút OK
Trong hộp Regression, lần lượt ấn định các chi tiết:
Phạm vi của biến số Y (Input Y Range)
Phạm vi của biến số X (Input X Range)

Nhãn dữ liệu (Labels)
Mức tin cậy (Confidence Level)
Tọa độ đầu ra (Output Range)
Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số
(residuals plots...)

10
10


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012

Phương trình hồi quy

Yµ X1 = f ( X 1 )

Yµ X1 = 2,73 + 0,04X
1

(R2 = 0,21; S = 1.81)

11
11


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012

2
t0 = 2,19 < t0,05 = 2,365 ( hay PV = 0,071 > α = 0,05)


⇒ Chấp nhận giả thiết H0.
t1 = 1,38 < t0,05 = 2,365 ( hay PV = 0,209 > α = 0,05)
⇒Chấp nhận giả thiết H0.
F = 1,905 <

3
F0,05

4
= 5,590 (hay FS = 0,209 > α = 0,05)

⇒Chấp nhận giả thiết H0.
µ

Vậy cả 2 hệ số 2,37 (B0) và 0,04(B1) của phương trình hồi quy Y X = 2,73 + 0.04X1
đều không có ý nghĩa thống kê. Nói một cách khác, phương trình hồi quy này không
thích hợp.

12
12

i


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
Kết Luận:
Yếu tố thời gian không liên quan tuyến tính tới hiệu suất của phản ứng tổng hợp.
µ
Phương trình hồi quy: Y X = f ( X 2 )
2


Yµ X 2 = 2,73 + 0.04X
2

(R2 = 0,76; S = 0,99)

13
13


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012

2
t0 = 3,418 > t0,05 = 2,365 ( hay PV = 0,011 < α = 0,05)

⇒ bác bỏ giả thiết H0.
t2 = 4,757 > t0,05 = 2,365 ( hay PV = 0,00206 < α = 0,05)
⇒ bác bỏ giả thiết H0.
4
4
F=22,631 > F0.05 = 5,590 (hay FS =0,00206 < α = 0,05)

⇒ bác bỏ giả thiết H0.
µ

Vậy cả 2 hệ số -11,14 (B0) và 0,13(B2) của phương trình hồi quy Y X = -11,14 + 0,13X2
đều có ý nghĩa thống kê. Nói một cách khác, phương trình hồi quy này thích hợp.
14
14


2


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
Kết Luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
µ
Phương trình hồi quy Y X , X = f ( X 1 , X 2 )
1

2

Yµ X1 , X 2 = -12,70 + 0,04X + 0.13X (R2 = 0,97; S = 0,33)
1
2

15
15


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012

−5

t0 = 11,528 > t0,05 = 2,365 (hay PV = 2,260 .10 < α = 0,05)
⇒ bác bỏ giả thiết H0.
t1 = 7,583 > t0,05 = 2,365 (hay PV = 0,00207 < α = 0,05)
⇒ bác bỏ giả thiết H0.
−6
t2 = 14,328 > t0,05 = 2,365 (hay PV =7,233 .10 < α = 0,05)
⇒ bác bỏ giả thiết H0.

F = 131,329 < F0,05 = 5,140 (hay FS = 1,112 .10
⇒ bác bỏ giả thiết H0.

16
16

−5

< α = 0,05)


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
Vậy cả 2 hệ số -12.70 (B 0); 0,04 (B1) và 0,13(B2) của phương trình hồi quy
Yµ X1 , X 2 = -12,70 + 0,04X + 0,13X đều có ý nghĩa thống kê. Nói một cách khác,
1
2

phương trình hồi quy này thích hợp.
Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai
yếu tố là thời gian và nhiệt độ.
µ

Sự tuyến tính của phương trình Y X , X = -12,70 + 0,04X1 + 0,13X2 có thể được
trình bày trên biểu đồ phân tán (scatterplots):
1

2

µ


Muốn dự đoán hiệu suất của phản ứng bằng phương trình hồi quy : Y X , X =
-12,70 + 0,04X1 + 0,13X2, bạn chỉ cần chọn một ô, ví dụ B21, sau đó nhập hàm và
được kết quả như sau:
1

2

Ghi chú: B17 tọa độ của B0, B18 tọa độ của B1, B19 tọa độ của B2, 50 là giá
trị của X1 (thời gian) và 115 là giá trị của X2 (nhiệt độ)

17
17


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
Câu 2 : Bảng sau đây cho ta một mẫu gồm 11 quan sát (x i, yi) từ tập hợp chính các
giá trị của cặp ĐLNN (X, Y):
X
Y

0,9
-0,3
X
Y

1,22
0,1

1,32
0,7


1,32
0,37

0,77
-0,28

0,95
-0,70

1,3
-0,25

1,45
0,55

1,2
0,02
1,3
0,35

1,2
0,32

a) Tìm đường hồi quy của Y đối với X.
b) Tính sai số tiêu chuẩn của đường hồi quy.
c) Tính tỷ số F để kiểm định sự đúng đắn của giả thiết: Có hồi quy tuyến tính của Y
theo X.
Bài làm:
1. Dạng toán: PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH

2. Cơ sở lý thuyết:

PHƯƠNG TRÌNH TỔNG QUÁT:
µ X = B + BX
Y
0
B0 = Y − BX
n

B=

1

n

∑XY − N ∑XY
i i

i =1

n

∑X
i =1

i =1

2
i


i i

− NX 2

Bảng ANOVA:
Nguồn
sai sô

Bậc tự do

Tổng số bình phương
n

Hồi quy

SSR =

∑ (Y ' − Y ')
i =1

n

Sai số

N–2

Tổng
cộng

N–1


SSE= =

∑ (Y − Y ')
i =1

i

18
18

2

i

2

Bình phương trung
bình

Giá trị thống


MSR = SSR

MSR
F = MSE

MSE = SSE/(N - 2)



BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
GIÁ TRỊ THỐNG KÊ:
Gía trị R-bình phương (R-square):
R=

SSR
SST (100R2: % của biến đổi trên Y đượcgiải thích bởi X)

Độ lệch chuẩn (Standard Error)
S=

1 n
∑ (Yi − Y 'i )2
N − 2 i =1

(Sự phân tán của dữ liện càng ít thì giá trị của S càng gần zero).
Trắc nghiệm thống kê:
µ

Đối với một phương trình hồi quy Y X = B0 + BX , ý nghĩa thống kê của các hệ số Bi
(B0 hay B) được đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính chất
µ
thích hợp của phương trình Y X = f ( X ) được đánh giá bằng trắc nghiệm F (phân bố
Fischer)

Trắc nghiệm t:
-

Giả thiết:

H0: βi = 0 “Hệ số hồi quy không có ý nghĩa”
H0: βi ≠ 0 “Hệ số hồi quy có ý nghĩa”

-

Giá trị thống kê:
t=

Bi − βi
S n2

; S n2 =

S2
n

∑(X
i =1

i

− X )2

Phân bố Student γ = N – 2
-

Biện luận:

Nếu t < tα (N - 2) ⇒ chấp nhận giả thiết H0.
Trắc nghiệm F:

-

Giả thiết:
H0: βi = 0 “Hệ số hồi quy không thích hợp”
H0: βi ≠ 0 “Hệ số hồi quy thích hợp”
19
19

=

B
S n2


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
-

Giá trị thống kê:
F=

MSR
MSE

Phân bố Fischer v1 = 1, v2 = N – 2
-

Biện luận:

Nếu F < Fα (N - 2) ⇒ chấp nhận giả thiết H0.
3. Phần mềm: Micsrosoft Excel 2010.

4. Chương trình: Regression.
5. Phương pháp giải bài toán trên Excel 2010.

Gỉa thiết H0 : Hệ số góc α của đường thẳng hồi quy của Y đối với X bằng 0
 Bước 1: Nhập dữ liệu vào bảng:

 Bước 2 : Nếu trong menu Tools chưa có mục Data Analysis , tiến hành cài

Analysis
ToolPak như sau :
Chọn File/Option/Add-Ins/Data Analysis Tool Pak /Go…/ Analysis Tool Pak
/OK… như
trong hình :

20
20


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012


a)
b)
c)
-

Bước 3: Sử dụng “Regression”
Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis
Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấn nút OK
Trong hộp Regression, lần lượt ấn định các chi tiết:

Phạm vi của biến số Y (Input Y Range)
Phạm vi của biến số X (Input X Range)
Nhãn dữ liệu (Labels)
Mức tin cậy (Confidence Level)
Tọa độ đầu ra (Output Range)
Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số
(residuals plots...)

21
21


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012

Ta được bảng kết quả sau:

Kết luận:

µ
a) Đường hồi quy của Y đối với X: Y X = −1.739476701 + 1.547892012 X
b) Sai số tiêu chuẩn 0.289645139
c) Tỷ số F = 12.6367483

Tra bảng phân phối Fisher với bậc tự do (3,4) ở mức 5% bằng cách nhập hàm
c = FINV(0.05,1,7) ta được giá trị c = 5.591447851
22
22


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012

Vì F > c nên ta bác bỏ H o.
Vậy ta khẳng định Hệ số góc α của đường thẳng hồi quy của Y đối với X khác 0

Câu 3: Bảng sau đây cho ta phân bố thu nhập của hai nhóm tuổi: Nhóm từ 40 – 50
tuổi và nhóm từ 50 – 60 tuổi trong số các công nhân lành nghề ở Thụy Điển năm
1930.
Nhóm tuổi
40 – 50
50 – 60

0–1

1–2

Thu nhập
2–3 3–4

71
54

430
324

1072
894

1609
1202

4–6

1178
903

≥6
158
112

Có sự khác nhau về phân bố thu nhập giữa hai nhóm tuổi này trong số các công nhân
lành nghề hay không? Mức ý nghĩa α = 2%.

Bài làm:
1. Dạng toán: PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ
2. Cơ sở lý thuyết:

Giả sử ta có k ĐLNN có phân bố chuẩn X 1, X2, ... X k, trong đó
Các giá trị trung bình µi và phương sai

σ

2
i

Xi : N ( µi , σ

2
i

)

.


đều chưa biết. Tuy nhiên chúng ta

giả thiết rằng các phương sai bằng nhau:
σ12 = σ22 = L = σ2k

Chúng ta muốn kiểm định xem liệu các giá trị trung bình µi này có như nhau
hay không:
µ1 = µ2 = L = µ k

Trong thống kê vấn đề trên thường được xem xét dưới góc độ sau đây.
Giả sử chúng ta quan tân đến một nhân tố X (factor) nào đó. Nhân tố X có
thể xem xét ở k mức khác nhau. Ký hiệu X i là hiệu quả của việc tác động nhân
tố X ở mức i đối với cá thể. Như vậy µi là hiệu quả trung bình của nhân tố X ở
mức i. chúng ta muốn biết khi cho nhân tố X thay đổi các mức khác nhau thì
điều đó có ảnh hưởng hay không tới hiệu quả trung bình.
Các mức nhân tố
23
23


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012

Tổng số
Trung bình

1

2


...

k

x11

x12

...

n1k

x21

x22

...

n2k

...

...

...

...

xn1 1


xn2 2

...

xnk k

T1

T2

...

x1

x2

...

Tk

n=

k

∑n

1

i =1


T=

k

∑T

k

i=1

x=

T
n

Ta đưa ra một số kí hiệu sau
*) Trung bình của mẫu thứ i (tức là mẫu ở cột thứ i trong bảng trên):
ni

∑ x ji

T
j=1
xi = i =
ni
ni

*) Trung bình chung
k nj


x=

ở đó

T
=
n

∑∑

x ij

n

∑∑ xij
=

i =1 j=1

n

n = n1 + n2 + ... + n k;
T = T1 + T2 + ... + T k.

*) Tổng bình phương chung ký hiệu là SST (viết tắt là chữ Total Sum of
Squares) được tính theo công thức sau:
STT =

n1


n2

∑ ( xi1 − x ) + ∑ ( xi2 − x )
2

i =1

=

2

+L+

i =1

nk n j

∑∑ ( xij − x )

2

có thể chứng minh rằng
n1


i=1

=

x2i1 +


∑ x2ij −
i, j

n2


i =1
2

x2i2 + L +

nk


i=1

x2ik −

T2
n

T
n

24
24

∑ ( xik − x )
i =1


j=1 i =1

STT =

nk

2


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012
+) Tổng bình phương do nhân tố ký hiệu là SSF (viết tắt của chữ Sum of
Squares for Factor) được tính theo công thức sau:
SSF =
=

k

∑ n i ( xi − x )
i =1
T12

n1

+

2

T22
T2 T

+L+ k − 2
n2
nk n

+) Tổng bình phương do sai số ký hiệu là SSE (viết tắt của chữ Sumof
Squares for the Error) được tính theo công thức:
SSE =
=

n1

i =1
n1


i =1

=

n2

nk

2
2
2
∑ ( x i1 − x ) + ∑ ( x i2 − x2 ) + L + ∑ ( x ik − x k )

x2i1 −


T12
n1

+



i =1
n2


i =1

x2i2 −

T12

i =1

T22
n2

Tk2

+L+

nk


i =1


x2ik −

Tk2
nk



∑∑ x2ij −  n1 + L + nk ÷÷




Từ công thức trên ta thấy
SST = SSF + SSE
+ Trung bình bình phương của nhân tố, ký hiệu là MSF (viết tắt của chữ
Mean Square for Factor) được tính bởi công thức:
MSF =

SSF
k −1

+ k – 1 được gọi là bậc tự do của nhân tố.
Trung bình bình phương của sai số, ký hiệu là MSE (viết tắt của chữ Mean
Square for Error) được tính bởi công thức:
MSE =

SSE
n−k


n – k được gọi là bậc tự do của sai số.
+ Tỷ số F được tính bởi công thức
F=

MSF
MSE

Các kết quả nói trên được trình bày trong bảng sau đây gọi là ANOVA (viết
tắt của chữ Analysis of Variance: phân tích phương sai)
Bảng ANOVA
Nguồn

Tổng bình
phương

Bậc tự do
25

25

Trung
bình bình
phương

Tỷ số F


×