Tải bản đầy đủ (.pdf) (31 trang)

BÁO CÁO XSTK THẦY HUY NHÓM 5

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.61 MB, 31 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA KHOA HỌC ỨNG DỤNG
֎֎֎

BÁO CÁO BÀI TẬP LỚN MÔN
XÁC SUẤT VÀ THỐNG KÊ
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

HỌ VÀ TÊN: LÊ ĐỨC DUY
MSSV: 1510455
NHÓM – LỚP: DT02

THÀNH PHỐ HỒ CHÍ MINH THÁNG 07-2016


MỤC LỤC
1. ĐỀ BÀI TẬP – ĐỀ SỐ 5 ............................................................................... 3
2. PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL ........................ 6
2.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK
2015 (N.Đ.HUY). .............................................................................................. 6
2.1.1 Ví dụ 10 trang 172 ................................................................................. 6
2.1.2 Ví dụ 12 trang 181 ................................................................................. 9
2.2 Bài tập 2 ..................................................................................................... 15
2.3 Bài tập 3 ..................................................................................................... 19
2.4 Bài tập 4 ..................................................................................................... 25
2.5 Bài tập 5 ..................................................................................................... 28

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 2




1. ĐỀ BÀI TẬP – ĐỀ SỐ 5
1.1.

Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK
2015 (N.Đ.HUY).

1.1.1. Ví dụ 10/172: Hiệu suất phần trăm (%) của một phản ứng hóa học
được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác
(C) được trình bày trong bảng sau:
Yếu tố
Yếu tố
B
A
B1
B2
B3
B4
A1
C1
9
C2
14
C3
16
C4
12
A2
C2

12
C3
15
C4
12
C1
10
A3
C3
13
C4
14
C1
11
C2
14
A4
C4
10
C1
11
C2
13
C3
13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
1.1.2. Ví dụ 12/181: Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và
135C kết hợp với ba khoảng thời gian là 12, 30 và 60 phút, để thực
hiện mộ phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được
trình bày trong bảng sau đây:

Thời gian (phút) X1 Thời gian (C) X2 Hiệu suất (%) Y
15
105
1.87
20
105
2.02
60
105
3.28
15
120
3.05
30
120
4.07
60
120
5.54
15
135
5.03
30
135
6.45
60
135
7.26
Hãy cho yếu tố nhiệt độ và thời gian/ hoặc yếu tố thời gian có liên quan tuyến
tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115C trong

vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 3


1.2. Một nông trường nuôi bò nuôi ba giống bò sữa A, B, C. Lượng sữa của các
con bò này được thống kê trong bảng sau đây:
Loại bò
A
B
C

Lượng sữa
Ít

Trung bình

Nhiều

92
53
75

37
15
19

46

19
12

Với mức ý nghóa  = 0,05, hãy nhận đònh xem có phải ba giống bò này thuần
như nhau về phương diện sản lượng sữa hay không?

1.3. Hãy phân tích tình hình kinh doanh của một số ngành nghề ở quận 4 quận
nội thành trên cơ sở số liệu về doanh thu của một số cửa hàng như sau:
Ngành nghề kinh
doanh
Điện lạnh
Vật liệu xây dựng
Dòch vụ tin học

Khu vực kinh doanh
Q1

Q2

Q3

Q4

2.5:2.7:2.0:3.0 3.1:3.5:2.7 2.0:2.4
5.0:5.4
0.6:10.4
15.0
9.5:9.3:9.1 19.5:17.5
1.2:1.0:9.8:1.8 2.0:2.2:1.8 1.2:1.3:1.2 5.0:4.8:5.2


1.4. Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu
nhập hàng năm và tuổi của họ. Kết quả thu được như sau:
Thu nhập
Tuổi

Dưới
100 000 $

Từ 100 000
$ - 399 599
$

Trên
400 000
$

Dưới 40

6

9

5

Từ 40 đến
54

18

19


8

Trên 54

11

12

17

Với mức ý nghóa 1%, kiểm đònh giả thiết cho rằng tuổi và mức thu nhập
có quan hệ với nhau hay không ?

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 4


1.5. Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội
thành:
Ngày khảo sát
Thứ hai
Thứ ba
Thứ tư
Thứ năm
Thứ sáu
Thứ bảy

Quận nội thành

Q1

Q2

Q3

Q4

Q5

22
21
25
24
28
30

18
18
25
24
19
22

22
22
25
18
15
28


18
18
19
20
22
25

18
19
20
22
25
25

Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn  = 1%.
Lượng báo bán ra có chòu tác động của các yếu tố ngày trong tuần không?

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 5


2. PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL
2.1. Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015
(N.Đ.HUY).
2.1.1. Ví dụ 10/172: Hiệu suất phần trăm (%) của một phản ứng hóa học
được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình
bày trong bảng sau:
Yếu tố

Yếu tố
B
A
B1
B2
B3
B4
A1
C1
9
C2
14
C3
16
C4
12
A2
C2
12
C3
15
C4
12
C1
10
A3
C3
13
C4
14

C1
11
C2
14
A4
C4
10
C1
11
C2
13
C3
13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
BÀI LÀM
PHƯƠNG PHÁP: Phân tích phương sai để đánh giá 3 yếu tố.
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị
quan sát.
G(i= 1,2…r: yếu tố A; j=1,2…r: yếu tố B; k= 1,2…r: yếu tố C).
MÔ HÌNH: Khi nghiên cứu ảnh hưởng của các yếu tố, mỗi yếu tố có n mức, thì người
ta dung mô hình vuông la tinh nxn. Ví dụ như mô hình vuông la tinh 4x4:

Mô hình vuông la tinh ba yếu tố được trình bày như sau:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 6


BẢNG ANOVA:


Trắc nghiệm:
 Giả thiệt:
o Ho: µ1=µ2=…=µk ↔ Các giá trị trung bình bằng nhau
o H1: µi ≠ µj ↔ Có ít nhất hai giá trị trung bình bằng nhau
 Giá trị thông kê: FR, FR, F
 Biện luận
o Nếu FRo Nếu FRo Nếu FRÁp dụng MS-EXCEL:
 Nhập dữ liệu vào máy tính

 Tình các giá trị Ti…Tj…T..k và T…
o Các giá trị Ti
 Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
 Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
 Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
 Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
o Các giá trị Tj
 Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 7











 Dùng con trỏ kéo kí tự điền từ ô B8 đến ô E5
o Các giá trị T..k
 Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
 Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)
 Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)
 Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
o Giá trị T…
 Chọn ô B10 và nhập biểu thức =SUM(B2:E5)
Tính các giá trị Ġ và Ġ
o Các giá trị Ġ và Ġ
 Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
 Dùng con trỏ kéo kí hiệu tự điềntừ ô G7 và ô G9
o Giá trị Ġ : Chọn ô G10 và nhập biểu thức =POWER(B10,2)
o Giá trị Ġ : Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tình các giá trị SSR, SSC, SSF, SST và SSE
o Các giá trị SSR, SSC và SSF biểu thức
 Chọn ô I7 và nhâp biểu thức =G7/4-39601/POWER(4,2)
 Dùng con trỏ kéo kí hiệu tự điền từ ô I7 và ô I9
o Các giá trị SST: Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
o Các giá trị SSE: Chọn ô I10 và nhập biểu thức =I11- SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF và MSE
o Các giá trị MSR, MSC và MSF
 Chọn ô K7 và nhâp biểu thức =I7/(4-1)
 Dùng con trỏ kéo kí hiệu điền từ ô K7 đến ô K9
o Giá trị MSE: Chọn ô K10 và nhâp biểu thức =I10/((4-1)*(4-2))
Tình các giá trị FR , FC và F:

o Chọn ô M7 và nhâp biểu thức =K7/0.3958
o Dùng con trỏ kéo kí hiệu điền từ ô M7 đến ô M9
Kết quả có được:

 Kết quả và biện luận
o FR=3.1 < F0.05(3.6)=4.76 → Chấp nhận Ho (pH)
o FC=11.95 > F0.05(3.6)=4.76→ Bác bỏ Ho (nhiệt độ)
o F=30.05 > F0.05(3.6)=4.76 → Bác bỏ Ho (chất xúc tác)
 Vậy chỉ có nhiệt độ và chất xuc tác gây ảnh hưởng đến hiệu suất
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 8


Câu 2.2. Ví dụ 12/181: Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 135C
kết hợp với ba khoảng thời gian là 12, 30 và 60 phút, để thực hiện mộ phản ứng
tổng hợp. Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:
Thời gian (phút) X1 Thời gian (C) X2 Hiệu suất (%) Y
15
105
1.87
20
105
2.02
60
105
3.28
15
120
3.05

30
120
4.07
60
120
5.54
15
135
5.03
30
135
6.45
60
135
7.26
Hãy cho yếu tố nhiệt độ và thời gian/ hoặc yếu tố thời gian có liên quan tuyến tính
với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115C trong
vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
BÀI LÀM
Phương pháp: Hồi quy tuyền tính đa tham số
Trong phương tình hồi quy tuyền tính đa tham số, biến số phụ thuộc Y có liên quan đến
k biến số độc lập Xi (i=1,2,…,k) thay vì chỉ có một như trong quy hồi quy tuyến tinh
đơn giản.
Phương trình tổng quát:
ŶX0,X1,…,Xk= B0 +B1X1+…+BkXk
Bảng ANOVA
Tổng số bình
Bình phương
Giá trị thống
Nguồn sai số

Bậc tự do
phương
trung bình

Hồi quy
K
SSR
MSR=SSR/k
F=MSR/MSE
MSE=SSS/(NSai số
N-K-1
SSE
K-1)
Tổng cộng
N-1
SST=SSR+SSE
Giá trị tống kê:
- Giá trị R-bình phương:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 9


-

Độ lệch chuẩn

-


Trắc nghiệm thông kê
o Giá trị thông kê: F
o Trắc nghiệm t:
 H0 βi = 0 ↔ Các hệ số hồi quy không có ý nghĩa.
 H1 βi ≠ ↔ Có ít nhất vài hệ số hồi quy có ý nghĩa.
o Trác nghiệm F:
 H0 βi = 0 ↔ Phuơng trình hồi quy không thích hợp.
 H1 βi ≠ ↔ Phương trình hồi quy thích hợp với ít nhất vài hệ số Bi
Bậc tự do của giá trị F : v1 =1, v2= N-k-1
ÁP DỤNG MS EXCEL:
 Nhập dữ liệu vào bảng:

 Sự dụng “Regresstion” :
o Vào Data nhấn Data Analysis, Regression rồi nhấn nut Ok

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 10


Trong hộp Regression, lần lượt ấn định các chi tiết :
o Phạm vị của biến X (Input X Range): $A$1:$A$10
o Phạm vị của biến Y (Input Y Range): $C$1:$C$10
o Nhãn dữ liệu (Labels)
o Mức tin cậy (Confidence Level)
o Đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals)
 Nhấn OK ta có bảng sau:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY


Page 11


 Phương trình hồi quy: ŶX1=f(X1)
ŶX1=2.73 + 0.04X1
(R2=0.21;S=1.81)
T0=2.129< t0.05=2.365
 Chấp nhận giả thiết Ho
T2=1.38< t0.05=2.365
 Chấp nhận giả thiết Ho
F=1.905< F30.05=5.59
 Chấp nhận giả thiết Ho
Vậy cả hai hệ số 2.37(Bo) và 0.04 (B1) của phương trình hồi quy ŶX1=2.73+0.04X1 đều
không có ý nghĩa thống kê. Hay phương trình hồi quy không thích hợp.

Kết luận : yếu tố thời gian không liên quan tuyến tính với hiệu suất của phản ứng
 Yếu tố nhiết độ:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 12


 Phương trình hồi quy: ŶX2=f(X2)
ŶX2=-11.14+0.13X2
(R2=0.21;S=0.99)
T0=3.418> t0.05=2.365
 Bác bỏ giả thiết Ho
T2=4.757> t0.05=2.365
 Bác bỏ giả thiết Ho

F=22.631> F0.05=5.59
 Chấp nhận giả thiết Ho
Vậy cả hai hệ số -11.14 (B0) và 0.13(B1) của phương trình hồi quy
ŶX2=-11.14+0.13X2 đều có ý nghĩa thống kê. Hay phương trình hồi quy
thích hợp.
Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng
tổng hợp.

 Cả 2 yếu tố nhiệt độ và thởi gian:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 13


 Phương trình hồi quy: ŶX1, X2=f(X1, X2)
ŶX1, X2= -12.7+ 0.04X1+ 0.13X2
T0 11.528 > t0.05=2.365
 Bác bỏ giả thiết Ho
T1=7.583> t0.05=2.365
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 14


 Bác bỏ giả thiết Ho
T2=14.328> t0.05=2.365
 Bác bỏ giả thiết Ho
F=131.395> F0.05=5.51
 Chấp nhận giả thiết Ho

Vậy cà hai hệ số -12.7 (Bo); 0.04(B1) và 0.13(B2) của phương trình hồi quy ŶX1, X2= 12.7+ 0.04X1+ 0.13X2 đều có ý nghĩa thống kê. Hay phương trình hồi quy thích hợp
 Kết luận: Hiêu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai
yếu tố là nhiệt độ và thơi gian

Dự đoán hiệu suất của phản ứng tại nhiệt độ 115oC và 50 phút:
Chọn ô B21 và nhập công thức: B1
7+B18*50+B19*115 được kết quả là:
4.310873
Bài 2: Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C. Lượng sữa của các
con bò được thống kê trong bảng sau đây:
Lượng sữa
Loại bò
Ít

Trung Bình

Nhiều

A

92

37

46

B

53


15

19

C

74

19

12

Với mức ý nghĩa 𝜶 = 𝟎, 𝟎𝟓, hãy nhận định xem có phải ba giống bò này có
phân bố tỉ lệ như nhau về phương diện sữa hay không?
BÀI LÀM
 Nhận xét: Đây là bài toán kiểm định giả thuyết vể tỷ lệ.
 Giải thuyết H0: Tỷ lệ sữa của ba giống bò này có phân phân bố tỉ lệ như nhau.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 15


GIẢI BÀI TOÁN BẰNG EXCEL
Nhập giá trị vào bảng tính:

Tính tổng các số:
 Tổng hàng: Chọn E3, nhập =SUM(B3:D3), rồi Enter, dùng con trỏ kéo nút
tự điều khiển từ điền từ E4 đến E5.
 Tổng cột: Chọn B6, nhập =SUM(B3:B5), rồi Enter, dùng con trỏ kéo nút

tự điều khiển từ B6 đến D6.
 Tổng cộng: chọn E8 và nhập =SUM(E3:E5).

Tính các tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng
 A: Chọn B11: nhập =E3*$B$6/$E$6, rùi Enter, dùng con trỏ kéo nút tự
điều khiển từ B11 đến B13.
 B: Chọn C11: nhập =E3*$C$6/$E$6, rồi Enter, dùng con trỏ kéo nút tự
điều khiển từ C11 đến C13.
 C: Chọn D11: nhập =E3*$D$6/$E$6, rồi Enter, dùng con trỏ kéo nút tự
điều khiển từ D11 đến D13.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 16


 Áp dụng hàm số CHITEST tính giá trị 𝑃(𝑋 > 𝜒 2 )
Chọn B15, nhập =CHITEST(B3:D5,B11:D13), rồi Enter.

 Biện luận:

𝑃(𝑋 > 𝜒 2 ) = 0,02251515 < 0.05
 Bác bỏ giả thuyết H0.

 Kết luận: Ba giống bò này có tỉ lệ khác nhau về phương diện sữa.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 17



Bài 3. Với mức ý nghĩa 1%, Hãy phân tích tình hình kinh doanh của 1 số ngành
nghề ở quận 4 quận nội thành trên cơ sở số liệu về doanh thu của 1 số cửa hàng
như sau:
Ngành nghề
kinh doanh

Khu vực kinh doanh
Q2
Q3

Q1

Điện lạnh
Vật liệu xây
dựng
Dịch vụ tin
học

Q4

2.5:2.7:2.0:3.0
0.6:10.4

3.1:3.5:1.7
15.0

2.0:2.4
9.5:9.3:9.1


5.0:5.4
19.5:17.5

1.2:1.0:9.8:1.8

2.0:2.2:1.8

1.2:1.3:1.2

5.0:4.8:5.2

BÀI LÀM
 Phương pháp: Phân tích phương sai 2 yếu tố ( có lặp)
 Cơ sở lý thuyết:Trên thực một biến lượng chịu tác động không chỉ một
nhân tố mà có thể hai (hay nhiều nhân tố). Chẳng hạn năng suất cây trồng
chịu ảnh hưởng của nhân tố giống và của nhân tố đất. Kết quả học tập của
một sinh viên chịu ảnh hưởng không những bởi nhân tố giảng viên mà còn
bởi nhân tố sĩ số của lớp học...
Trong mục này ta sẽ trình bày một cách vắn tắt kỹ thuật phân tích phương sai
hai nhân tố nhằm phát hiện ảnh hưởng của mỗi nhân tố cũng như tác động qua
lại của hai nhân tố đó đến biến lượng đang xét.
Giả sử chúng ta quan tâm tới nhân tố A và B. Nhân tố A được xem xét ở các mức
A1, A2, ...Ar, và nhân tố B được xem xét ở các nước B1, B2,...Bc.
Gọi Xjk là ĐLNN đo lường hiệu quả việc tác động của mức Aj và Bk lên cá thể.
Giả sử x1jk, x2jk, ..., xnjk là mẫu kích thước njk rút ra từ tập hợp chính các giá
trị của Xjk. Ta gọi đó là mẫu (j, k). Ta đưa ra một số ký hiệu sau:
x jk : trung bình của mẫu (j, k)

n jo 


c

 n jk

k 1

n ok 

r

 n jk
j 1

n

 n jo   n ok
j

x jo 

k

 n jk x jk  x ijk
k

n jo



i


k

n jo

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

 trung bình của mức Aj

Page 18


 n jk x jk  x i jk
x ok 

j



n ok

i

j

 trung bình của mức Bk

n ok

x = trung bình chung =


 x jk
n

x ok

Ta có bảng sau đây ghi các kết quả tính toán trên:
A
B
A1

B1

B2

...

Bk

...

Bc

Trung bình
dòng Aj

x11

x12


...

x1k

...

x1c

x10

A2

x21

x22

...

x2k

...

x2c

x20

...

...


...

...

...

...

...

...

Aj
...

x j1

xj2

xjk

xj0

...

...

...
...


xjc

...

...
...

...

...

Ar

x r1

x r2

...

x rk

...

x rc

x ro

Trung
bình cột
Bk


x o1

x o2

...

...

x oc

x

+ Tổng bình phương chung, ký hiệu là SST, được tính theo công thức sau:
SST 

r n jk

c

  x i jk  x 

2

k 1 j 1 i 1

+ Tổng bình phương cho nhân tố A, ký hiệu là SSFA được tính theo công thức sau:
SSFB 

c


 n ok  x ok  x 

2

k 1

+ Tổng bình phương do sai số, ký hiệu là SSE, được tính theo công thức
SSF 

r n jk

  x i jk  x jk2 
c

k 1 j 1 i 1

+ Tổng bình phương do tương tác (Sum of Squares for Interaction) ký hiệu là SSI,
được tính theo công thức.
SSI 

C

r

  x jk  x jo  x ko  x 

2

k 1 j 1


+ Trung bình bình phương của nhân tố A, ký hiệu là MSFA’ được tính bởi công
thức:
M SFA 

SSFA
r 1

r – 1 gọi là bậc tự do của A bằng số mức của A trừ 1.
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 19


+ Trung bình bình phương của nhân tố B, ký hiệu là MSFB’ được tính bởi công
thức.
M SFB 

SSFB
c 1

c – 1 gọi là bậc tự do của B bằng số mức của B trừ 1.
+ Trung bình bình phương của sai số, ký hiệu là MSE, được tính bởi
M SE 

SSE
n  cr

n – cr gọi là bậc tự do của sai số.
+ Trung bình bình phương của tương tác, ký hiệu là MSI, được tính bởi

M SI 

SSI
(c  1)(r  1)

(c – 1) (r – 1) gọi là bậc tự do của tương tác.
Chú ý rằng:
(r – 1) + (c – 1) + (c – 1) (r – 1) + n – rc = n – 1 = bậc tự do tổng cộng.
+ Tỷ số F cho nhân tố A, ký hiệu bởi FA được tính như sau.
FA 

M SFA
M SE

Tương tự tỷ số F cho nhân tố B, FB được tính bởi
FB 

M SFB
M SE

và tỷ số F cho tương tác giữa A và B, ký hiệu là FAB được tính bởi:
FAB 

M SI
M SE

Với mức ý nghĩa  đã cho ta ký hiệu f (u, v) là phân vị mức  của phân bố Fisher
với bậc tự do (u, v).
Ta có quy tắc quyết định như sau:
+ Nếu FA> f (r – 1, n – cr) thì ta bác bỏ giả thiết.

H oA :

“Các mức A1,... Ar có hiệu quả trung bình như nhau”

+ Nếu FB> f (c – 1, n – cr) thì ta bác bỏ giả thiết:
HB
o :

“Các mức B1, B2, ... Bc có hiệu quả trung bình như nhau”

Nếu FAB> f ((r – 1)(c – 1), n – rc)
Ta bác bỏ giả thiết:
H oAB :

“Có sự tương tác giữa A và B”.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 20


Trên thực hành tính toán chúng ta thực hiện như sau:
Giả sử Tjk là tổng các giá trị trong mẫu (j, k). Ký hiệu
c
r

T

T
,

T

T jk
 jo
jk
ok

k 1
j 1

c
r

n

n
,
n

n jk
jo
jk
ok

k 1
j 1



T 



n 
A









 Tjo   Tok   x i jk
 n jo   n ok

 x 2ijk

(3)

Ta có các đẳng thức sau:
SST  A 

SSFA 

T2
n

(4)


2
Tjo

r

 n jo



j 1

SSFB 

T2
n

(5)

c

2
Tok
T2

n
n
k 1 ok




SSE  A 

c

(6)

2
T jk

r

 n jk

(7)

k 1 j 1

SSI  SST  SSFA  SSFB  SSE

(8)

Đặc biệt nếu tất cả các mẫu bằng nhau njk = m với mọi j, k thì:
n jo  cm , n ok  r m
r

 Tjo2
do đó

SSFA 


j 1

cm



T2
n

(5’)



T2
n

(6’)

r

SSFB 

 Tok2

k 1

rm

 Tjk2
SSE  A 


k

j

m

(7’)

Trước hết ta cần tính các đại lượng Tjk. Tiếp theo tính các giá trị Tjo, njo, nok, Tok,
n, T và A theo các công thức (1), (2), (3).
Từ đó tính SST, SSFA, SSFB, SSE và SSI theo các công thức (4), (5), (6), (7)
(hoặc (5’), (6’), (7’) nếu njk = m)

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 21


Giả thuyết:
-HA (yếu tố ngành nghề): doanh thu không phụ thuộc vào ngành nghề.
-HB (yếu tố quận): doanh thu không phụ thuộc vào quận.
-HAB(sự tương tác giữa 2 yếu tố): doanh thu giữ các ngành nghề và các quận
không có liên quan tới nhau.
Nhập dữ liệu vào bảng tính:

Áp dụng: “Anova: Two-Factor With Replication”
Vào Data -> Data Analysis. Chọn mục Anova: Two-Factor With Replication.
Chọn OK.


Trong hộp thoại Anova: Two-Factor With Replication lần lượt ấn định các chi
tiết:
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 22







Phạm vi đầu vào (Input Range): $A$9:$E$21
Số hàng mỗi mẫu (Rows per sample): 4
Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%)
Phạm vi đầu ra (Output Range): $A$23

Nhấn OK. Ta được bảng sau:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 23


Kết quả và biện luận:

 Thực hiện bài toán trên MS-EXCEL:
FR = 2.8929 < F0.01 = 5.247894
 Chấp nhận giả thuyết Ho (ngành nghề kinh doanh)
 Fc= 0.8089 < F0.01 =4.3771

 Chấp nhận giả thuyết Ho (ngành nghề và địa điểm kinh doanh)
KẾT LUẬN: Vì vậy doanh thu cửa hàng trên phụ thuộc vào ngành nghề và địa
điểm kinh doanh, giữa ngành nghề kinh doanh và địa điểm kinh doanh có sự
tương tác lẫn nhau.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 24


Bài 4: Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu
nhập hằng năm và tuổi của họ.Kết quả thu được như sau:

Thu nhập
Dưới

Từ 100 000 $ -

Trên

Dưới 40

100 000 $
6

399 599 $
9

400 000 $
5


Từ 40 đến 54

18

19

8

Trên 54

11

12

17

Tuổi

Với mức ý nghĩa 1%, kiểm định giả thuyết cho rằng tuổi và mức thu nhậo không
có quan hệ với nhau.
BÀI LÀM
 Nhận xét: Đây là bài toán phân tích tính độc lập.
 Giả thiết: Mức thu nhập hàng năm và tuổi của các doanh nghiệp Mỹ không có
quan hệ với nhau.
 Thực hiện bài toán bằng MS-Excel.
 Nhập liệu vào bảng tính:

 Tính tổng hàng , tổng cột và tổng cộng:
o Tính tổng hàng: Chọn ô E3 nhập hàm =SUM(B3:D3) rồi kéo hàm

xuống các ô E4, E5.
o Tính tổng cột: Chọn ô B6 nhập hàm =SUM(B3:B5) rồi kéo hàm qua
các ô C5, D5.
o Tính tổng cộng: Chọn ô E6 nhập hàm =SUM(E3:E5).

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 25


×