ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA KHOA HỌC ỨNG DỤNG
֎֎֎
BÁO CÁO BÀI TẬP LỚN MÔN
XÁC SUẤT VÀ THỐNG KÊ
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
HỌ VÀ TÊN: LÊ ĐỨC DUY
MSSV: 1510455
NHÓM – LỚP: DT02
THÀNH PHỐ HỒ CHÍ MINH THÁNG 07-2016
MỤC LỤC
1. ĐỀ BÀI TẬP – ĐỀ SỐ 5 ............................................................................... 3
2. PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL ........................ 6
2.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK
2015 (N.Đ.HUY). .............................................................................................. 6
2.1.1 Ví dụ 10 trang 172 ................................................................................. 6
2.1.2 Ví dụ 12 trang 181 ................................................................................. 9
2.2 Bài tập 2 ..................................................................................................... 15
2.3 Bài tập 3 ..................................................................................................... 19
2.4 Bài tập 4 ..................................................................................................... 25
2.5 Bài tập 5 ..................................................................................................... 28
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 2
1. ĐỀ BÀI TẬP – ĐỀ SỐ 5
1.1.
Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK
2015 (N.Đ.HUY).
1.1.1. Ví dụ 10/172: Hiệu suất phần trăm (%) của một phản ứng hóa học
được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác
(C) được trình bày trong bảng sau:
Yếu tố
Yếu tố
B
A
B1
B2
B3
B4
A1
C1
9
C2
14
C3
16
C4
12
A2
C2
12
C3
15
C4
12
C1
10
A3
C3
13
C4
14
C1
11
C2
14
A4
C4
10
C1
11
C2
13
C3
13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
1.1.2. Ví dụ 12/181: Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và
135C kết hợp với ba khoảng thời gian là 12, 30 và 60 phút, để thực
hiện mộ phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được
trình bày trong bảng sau đây:
Thời gian (phút) X1 Thời gian (C) X2 Hiệu suất (%) Y
15
105
1.87
20
105
2.02
60
105
3.28
15
120
3.05
30
120
4.07
60
120
5.54
15
135
5.03
30
135
6.45
60
135
7.26
Hãy cho yếu tố nhiệt độ và thời gian/ hoặc yếu tố thời gian có liên quan tuyến
tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115C trong
vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 3
1.2. Một nông trường nuôi bò nuôi ba giống bò sữa A, B, C. Lượng sữa của các
con bò này được thống kê trong bảng sau đây:
Loại bò
A
B
C
Lượng sữa
Ít
Trung bình
Nhiều
92
53
75
37
15
19
46
19
12
Với mức ý nghóa = 0,05, hãy nhận đònh xem có phải ba giống bò này thuần
như nhau về phương diện sản lượng sữa hay không?
1.3. Hãy phân tích tình hình kinh doanh của một số ngành nghề ở quận 4 quận
nội thành trên cơ sở số liệu về doanh thu của một số cửa hàng như sau:
Ngành nghề kinh
doanh
Điện lạnh
Vật liệu xây dựng
Dòch vụ tin học
Khu vực kinh doanh
Q1
Q2
Q3
Q4
2.5:2.7:2.0:3.0 3.1:3.5:2.7 2.0:2.4
5.0:5.4
0.6:10.4
15.0
9.5:9.3:9.1 19.5:17.5
1.2:1.0:9.8:1.8 2.0:2.2:1.8 1.2:1.3:1.2 5.0:4.8:5.2
1.4. Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu
nhập hàng năm và tuổi của họ. Kết quả thu được như sau:
Thu nhập
Tuổi
Dưới
100 000 $
Từ 100 000
$ - 399 599
$
Trên
400 000
$
Dưới 40
6
9
5
Từ 40 đến
54
18
19
8
Trên 54
11
12
17
Với mức ý nghóa 1%, kiểm đònh giả thiết cho rằng tuổi và mức thu nhập
có quan hệ với nhau hay không ?
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 4
1.5. Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội
thành:
Ngày khảo sát
Thứ hai
Thứ ba
Thứ tư
Thứ năm
Thứ sáu
Thứ bảy
Quận nội thành
Q1
Q2
Q3
Q4
Q5
22
21
25
24
28
30
18
18
25
24
19
22
22
22
25
18
15
28
18
18
19
20
22
25
18
19
20
22
25
25
Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn = 1%.
Lượng báo bán ra có chòu tác động của các yếu tố ngày trong tuần không?
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 5
2. PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL
2.1. Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015
(N.Đ.HUY).
2.1.1. Ví dụ 10/172: Hiệu suất phần trăm (%) của một phản ứng hóa học
được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình
bày trong bảng sau:
Yếu tố
Yếu tố
B
A
B1
B2
B3
B4
A1
C1
9
C2
14
C3
16
C4
12
A2
C2
12
C3
15
C4
12
C1
10
A3
C3
13
C4
14
C1
11
C2
14
A4
C4
10
C1
11
C2
13
C3
13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
BÀI LÀM
PHƯƠNG PHÁP: Phân tích phương sai để đánh giá 3 yếu tố.
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị
quan sát.
G(i= 1,2…r: yếu tố A; j=1,2…r: yếu tố B; k= 1,2…r: yếu tố C).
MÔ HÌNH: Khi nghiên cứu ảnh hưởng của các yếu tố, mỗi yếu tố có n mức, thì người
ta dung mô hình vuông la tinh nxn. Ví dụ như mô hình vuông la tinh 4x4:
Mô hình vuông la tinh ba yếu tố được trình bày như sau:
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 6
BẢNG ANOVA:
Trắc nghiệm:
Giả thiệt:
o Ho: µ1=µ2=…=µk ↔ Các giá trị trung bình bằng nhau
o H1: µi ≠ µj ↔ Có ít nhất hai giá trị trung bình bằng nhau
Giá trị thông kê: FR, FR, F
Biện luận
o Nếu FR
o Nếu FR
o Nếu FR
Áp dụng MS-EXCEL:
Nhập dữ liệu vào máy tính
Tình các giá trị Ti…Tj…T..k và T…
o Các giá trị Ti
Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
o Các giá trị Tj
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 7
Dùng con trỏ kéo kí tự điền từ ô B8 đến ô E5
o Các giá trị T..k
Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)
Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
o Giá trị T…
Chọn ô B10 và nhập biểu thức =SUM(B2:E5)
Tính các giá trị Ġ và Ġ
o Các giá trị Ġ và Ġ
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điềntừ ô G7 và ô G9
o Giá trị Ġ : Chọn ô G10 và nhập biểu thức =POWER(B10,2)
o Giá trị Ġ : Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tình các giá trị SSR, SSC, SSF, SST và SSE
o Các giá trị SSR, SSC và SSF biểu thức
Chọn ô I7 và nhâp biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 và ô I9
o Các giá trị SST: Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
o Các giá trị SSE: Chọn ô I10 và nhập biểu thức =I11- SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF và MSE
o Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhâp biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu điền từ ô K7 đến ô K9
o Giá trị MSE: Chọn ô K10 và nhâp biểu thức =I10/((4-1)*(4-2))
Tình các giá trị FR , FC và F:
o Chọn ô M7 và nhâp biểu thức =K7/0.3958
o Dùng con trỏ kéo kí hiệu điền từ ô M7 đến ô M9
Kết quả có được:
Kết quả và biện luận
o FR=3.1 < F0.05(3.6)=4.76 → Chấp nhận Ho (pH)
o FC=11.95 > F0.05(3.6)=4.76→ Bác bỏ Ho (nhiệt độ)
o F=30.05 > F0.05(3.6)=4.76 → Bác bỏ Ho (chất xúc tác)
Vậy chỉ có nhiệt độ và chất xuc tác gây ảnh hưởng đến hiệu suất
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 8
Câu 2.2. Ví dụ 12/181: Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 135C
kết hợp với ba khoảng thời gian là 12, 30 và 60 phút, để thực hiện mộ phản ứng
tổng hợp. Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:
Thời gian (phút) X1 Thời gian (C) X2 Hiệu suất (%) Y
15
105
1.87
20
105
2.02
60
105
3.28
15
120
3.05
30
120
4.07
60
120
5.54
15
135
5.03
30
135
6.45
60
135
7.26
Hãy cho yếu tố nhiệt độ và thời gian/ hoặc yếu tố thời gian có liên quan tuyến tính
với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115C trong
vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
BÀI LÀM
Phương pháp: Hồi quy tuyền tính đa tham số
Trong phương tình hồi quy tuyền tính đa tham số, biến số phụ thuộc Y có liên quan đến
k biến số độc lập Xi (i=1,2,…,k) thay vì chỉ có một như trong quy hồi quy tuyến tinh
đơn giản.
Phương trình tổng quát:
ŶX0,X1,…,Xk= B0 +B1X1+…+BkXk
Bảng ANOVA
Tổng số bình
Bình phương
Giá trị thống
Nguồn sai số
Bậc tự do
phương
trung bình
kê
Hồi quy
K
SSR
MSR=SSR/k
F=MSR/MSE
MSE=SSS/(NSai số
N-K-1
SSE
K-1)
Tổng cộng
N-1
SST=SSR+SSE
Giá trị tống kê:
- Giá trị R-bình phương:
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 9
-
Độ lệch chuẩn
-
Trắc nghiệm thông kê
o Giá trị thông kê: F
o Trắc nghiệm t:
H0 βi = 0 ↔ Các hệ số hồi quy không có ý nghĩa.
H1 βi ≠ ↔ Có ít nhất vài hệ số hồi quy có ý nghĩa.
o Trác nghiệm F:
H0 βi = 0 ↔ Phuơng trình hồi quy không thích hợp.
H1 βi ≠ ↔ Phương trình hồi quy thích hợp với ít nhất vài hệ số Bi
Bậc tự do của giá trị F : v1 =1, v2= N-k-1
ÁP DỤNG MS EXCEL:
Nhập dữ liệu vào bảng:
Sự dụng “Regresstion” :
o Vào Data nhấn Data Analysis, Regression rồi nhấn nut Ok
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 10
Trong hộp Regression, lần lượt ấn định các chi tiết :
o Phạm vị của biến X (Input X Range): $A$1:$A$10
o Phạm vị của biến Y (Input Y Range): $C$1:$C$10
o Nhãn dữ liệu (Labels)
o Mức tin cậy (Confidence Level)
o Đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals)
Nhấn OK ta có bảng sau:
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 11
Phương trình hồi quy: ŶX1=f(X1)
ŶX1=2.73 + 0.04X1
(R2=0.21;S=1.81)
T0=2.129< t0.05=2.365
Chấp nhận giả thiết Ho
T2=1.38< t0.05=2.365
Chấp nhận giả thiết Ho
F=1.905< F30.05=5.59
Chấp nhận giả thiết Ho
Vậy cả hai hệ số 2.37(Bo) và 0.04 (B1) của phương trình hồi quy ŶX1=2.73+0.04X1 đều
không có ý nghĩa thống kê. Hay phương trình hồi quy không thích hợp.
Kết luận : yếu tố thời gian không liên quan tuyến tính với hiệu suất của phản ứng
Yếu tố nhiết độ:
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 12
Phương trình hồi quy: ŶX2=f(X2)
ŶX2=-11.14+0.13X2
(R2=0.21;S=0.99)
T0=3.418> t0.05=2.365
Bác bỏ giả thiết Ho
T2=4.757> t0.05=2.365
Bác bỏ giả thiết Ho
F=22.631> F0.05=5.59
Chấp nhận giả thiết Ho
Vậy cả hai hệ số -11.14 (B0) và 0.13(B1) của phương trình hồi quy
ŶX2=-11.14+0.13X2 đều có ý nghĩa thống kê. Hay phương trình hồi quy
thích hợp.
Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng
tổng hợp.
Cả 2 yếu tố nhiệt độ và thởi gian:
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 13
Phương trình hồi quy: ŶX1, X2=f(X1, X2)
ŶX1, X2= -12.7+ 0.04X1+ 0.13X2
T0 11.528 > t0.05=2.365
Bác bỏ giả thiết Ho
T1=7.583> t0.05=2.365
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 14
Bác bỏ giả thiết Ho
T2=14.328> t0.05=2.365
Bác bỏ giả thiết Ho
F=131.395> F0.05=5.51
Chấp nhận giả thiết Ho
Vậy cà hai hệ số -12.7 (Bo); 0.04(B1) và 0.13(B2) của phương trình hồi quy ŶX1, X2= 12.7+ 0.04X1+ 0.13X2 đều có ý nghĩa thống kê. Hay phương trình hồi quy thích hợp
Kết luận: Hiêu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai
yếu tố là nhiệt độ và thơi gian
Dự đoán hiệu suất của phản ứng tại nhiệt độ 115oC và 50 phút:
Chọn ô B21 và nhập công thức: B1
7+B18*50+B19*115 được kết quả là:
4.310873
Bài 2: Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C. Lượng sữa của các
con bò được thống kê trong bảng sau đây:
Lượng sữa
Loại bò
Ít
Trung Bình
Nhiều
A
92
37
46
B
53
15
19
C
74
19
12
Với mức ý nghĩa 𝜶 = 𝟎, 𝟎𝟓, hãy nhận định xem có phải ba giống bò này có
phân bố tỉ lệ như nhau về phương diện sữa hay không?
BÀI LÀM
Nhận xét: Đây là bài toán kiểm định giả thuyết vể tỷ lệ.
Giải thuyết H0: Tỷ lệ sữa của ba giống bò này có phân phân bố tỉ lệ như nhau.
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 15
GIẢI BÀI TOÁN BẰNG EXCEL
Nhập giá trị vào bảng tính:
Tính tổng các số:
Tổng hàng: Chọn E3, nhập =SUM(B3:D3), rồi Enter, dùng con trỏ kéo nút
tự điều khiển từ điền từ E4 đến E5.
Tổng cột: Chọn B6, nhập =SUM(B3:B5), rồi Enter, dùng con trỏ kéo nút
tự điều khiển từ B6 đến D6.
Tổng cộng: chọn E8 và nhập =SUM(E3:E5).
Tính các tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng
A: Chọn B11: nhập =E3*$B$6/$E$6, rùi Enter, dùng con trỏ kéo nút tự
điều khiển từ B11 đến B13.
B: Chọn C11: nhập =E3*$C$6/$E$6, rồi Enter, dùng con trỏ kéo nút tự
điều khiển từ C11 đến C13.
C: Chọn D11: nhập =E3*$D$6/$E$6, rồi Enter, dùng con trỏ kéo nút tự
điều khiển từ D11 đến D13.
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 16
Áp dụng hàm số CHITEST tính giá trị 𝑃(𝑋 > 𝜒 2 )
Chọn B15, nhập =CHITEST(B3:D5,B11:D13), rồi Enter.
Biện luận:
𝑃(𝑋 > 𝜒 2 ) = 0,02251515 < 0.05
Bác bỏ giả thuyết H0.
Kết luận: Ba giống bò này có tỉ lệ khác nhau về phương diện sữa.
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 17
Bài 3. Với mức ý nghĩa 1%, Hãy phân tích tình hình kinh doanh của 1 số ngành
nghề ở quận 4 quận nội thành trên cơ sở số liệu về doanh thu của 1 số cửa hàng
như sau:
Ngành nghề
kinh doanh
Khu vực kinh doanh
Q2
Q3
Q1
Điện lạnh
Vật liệu xây
dựng
Dịch vụ tin
học
Q4
2.5:2.7:2.0:3.0
0.6:10.4
3.1:3.5:1.7
15.0
2.0:2.4
9.5:9.3:9.1
5.0:5.4
19.5:17.5
1.2:1.0:9.8:1.8
2.0:2.2:1.8
1.2:1.3:1.2
5.0:4.8:5.2
BÀI LÀM
Phương pháp: Phân tích phương sai 2 yếu tố ( có lặp)
Cơ sở lý thuyết:Trên thực một biến lượng chịu tác động không chỉ một
nhân tố mà có thể hai (hay nhiều nhân tố). Chẳng hạn năng suất cây trồng
chịu ảnh hưởng của nhân tố giống và của nhân tố đất. Kết quả học tập của
một sinh viên chịu ảnh hưởng không những bởi nhân tố giảng viên mà còn
bởi nhân tố sĩ số của lớp học...
Trong mục này ta sẽ trình bày một cách vắn tắt kỹ thuật phân tích phương sai
hai nhân tố nhằm phát hiện ảnh hưởng của mỗi nhân tố cũng như tác động qua
lại của hai nhân tố đó đến biến lượng đang xét.
Giả sử chúng ta quan tâm tới nhân tố A và B. Nhân tố A được xem xét ở các mức
A1, A2, ...Ar, và nhân tố B được xem xét ở các nước B1, B2,...Bc.
Gọi Xjk là ĐLNN đo lường hiệu quả việc tác động của mức Aj và Bk lên cá thể.
Giả sử x1jk, x2jk, ..., xnjk là mẫu kích thước njk rút ra từ tập hợp chính các giá
trị của Xjk. Ta gọi đó là mẫu (j, k). Ta đưa ra một số ký hiệu sau:
x jk : trung bình của mẫu (j, k)
n jo
c
n jk
k 1
n ok
r
n jk
j 1
n
n jo n ok
j
x jo
k
n jk x jk x ijk
k
n jo
i
k
n jo
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
trung bình của mức Aj
Page 18
n jk x jk x i jk
x ok
j
n ok
i
j
trung bình của mức Bk
n ok
x = trung bình chung =
x jk
n
x ok
Ta có bảng sau đây ghi các kết quả tính toán trên:
A
B
A1
B1
B2
...
Bk
...
Bc
Trung bình
dòng Aj
x11
x12
...
x1k
...
x1c
x10
A2
x21
x22
...
x2k
...
x2c
x20
...
...
...
...
...
...
...
...
Aj
...
x j1
xj2
xjk
xj0
...
...
...
...
xjc
...
...
...
...
...
Ar
x r1
x r2
...
x rk
...
x rc
x ro
Trung
bình cột
Bk
x o1
x o2
...
...
x oc
x
+ Tổng bình phương chung, ký hiệu là SST, được tính theo công thức sau:
SST
r n jk
c
x i jk x
2
k 1 j 1 i 1
+ Tổng bình phương cho nhân tố A, ký hiệu là SSFA được tính theo công thức sau:
SSFB
c
n ok x ok x
2
k 1
+ Tổng bình phương do sai số, ký hiệu là SSE, được tính theo công thức
SSF
r n jk
x i jk x jk2
c
k 1 j 1 i 1
+ Tổng bình phương do tương tác (Sum of Squares for Interaction) ký hiệu là SSI,
được tính theo công thức.
SSI
C
r
x jk x jo x ko x
2
k 1 j 1
+ Trung bình bình phương của nhân tố A, ký hiệu là MSFA’ được tính bởi công
thức:
M SFA
SSFA
r 1
r – 1 gọi là bậc tự do của A bằng số mức của A trừ 1.
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 19
+ Trung bình bình phương của nhân tố B, ký hiệu là MSFB’ được tính bởi công
thức.
M SFB
SSFB
c 1
c – 1 gọi là bậc tự do của B bằng số mức của B trừ 1.
+ Trung bình bình phương của sai số, ký hiệu là MSE, được tính bởi
M SE
SSE
n cr
n – cr gọi là bậc tự do của sai số.
+ Trung bình bình phương của tương tác, ký hiệu là MSI, được tính bởi
M SI
SSI
(c 1)(r 1)
(c – 1) (r – 1) gọi là bậc tự do của tương tác.
Chú ý rằng:
(r – 1) + (c – 1) + (c – 1) (r – 1) + n – rc = n – 1 = bậc tự do tổng cộng.
+ Tỷ số F cho nhân tố A, ký hiệu bởi FA được tính như sau.
FA
M SFA
M SE
Tương tự tỷ số F cho nhân tố B, FB được tính bởi
FB
M SFB
M SE
và tỷ số F cho tương tác giữa A và B, ký hiệu là FAB được tính bởi:
FAB
M SI
M SE
Với mức ý nghĩa đã cho ta ký hiệu f (u, v) là phân vị mức của phân bố Fisher
với bậc tự do (u, v).
Ta có quy tắc quyết định như sau:
+ Nếu FA> f (r – 1, n – cr) thì ta bác bỏ giả thiết.
H oA :
“Các mức A1,... Ar có hiệu quả trung bình như nhau”
+ Nếu FB> f (c – 1, n – cr) thì ta bác bỏ giả thiết:
HB
o :
“Các mức B1, B2, ... Bc có hiệu quả trung bình như nhau”
Nếu FAB> f ((r – 1)(c – 1), n – rc)
Ta bác bỏ giả thiết:
H oAB :
“Có sự tương tác giữa A và B”.
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 20
Trên thực hành tính toán chúng ta thực hiện như sau:
Giả sử Tjk là tổng các giá trị trong mẫu (j, k). Ký hiệu
c
r
T
T
,
T
T jk
jo
jk
ok
k 1
j 1
c
r
n
n
,
n
n jk
jo
jk
ok
k 1
j 1
T
n
A
Tjo Tok x i jk
n jo n ok
x 2ijk
(3)
Ta có các đẳng thức sau:
SST A
SSFA
T2
n
(4)
2
Tjo
r
n jo
j 1
SSFB
T2
n
(5)
c
2
Tok
T2
n
n
k 1 ok
SSE A
c
(6)
2
T jk
r
n jk
(7)
k 1 j 1
SSI SST SSFA SSFB SSE
(8)
Đặc biệt nếu tất cả các mẫu bằng nhau njk = m với mọi j, k thì:
n jo cm , n ok r m
r
Tjo2
do đó
SSFA
j 1
cm
T2
n
(5’)
T2
n
(6’)
r
SSFB
Tok2
k 1
rm
Tjk2
SSE A
k
j
m
(7’)
Trước hết ta cần tính các đại lượng Tjk. Tiếp theo tính các giá trị Tjo, njo, nok, Tok,
n, T và A theo các công thức (1), (2), (3).
Từ đó tính SST, SSFA, SSFB, SSE và SSI theo các công thức (4), (5), (6), (7)
(hoặc (5’), (6’), (7’) nếu njk = m)
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 21
Giả thuyết:
-HA (yếu tố ngành nghề): doanh thu không phụ thuộc vào ngành nghề.
-HB (yếu tố quận): doanh thu không phụ thuộc vào quận.
-HAB(sự tương tác giữa 2 yếu tố): doanh thu giữ các ngành nghề và các quận
không có liên quan tới nhau.
Nhập dữ liệu vào bảng tính:
Áp dụng: “Anova: Two-Factor With Replication”
Vào Data -> Data Analysis. Chọn mục Anova: Two-Factor With Replication.
Chọn OK.
Trong hộp thoại Anova: Two-Factor With Replication lần lượt ấn định các chi
tiết:
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 22
Phạm vi đầu vào (Input Range): $A$9:$E$21
Số hàng mỗi mẫu (Rows per sample): 4
Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%)
Phạm vi đầu ra (Output Range): $A$23
Nhấn OK. Ta được bảng sau:
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 23
Kết quả và biện luận:
Thực hiện bài toán trên MS-EXCEL:
FR = 2.8929 < F0.01 = 5.247894
Chấp nhận giả thuyết Ho (ngành nghề kinh doanh)
Fc= 0.8089 < F0.01 =4.3771
Chấp nhận giả thuyết Ho (ngành nghề và địa điểm kinh doanh)
KẾT LUẬN: Vì vậy doanh thu cửa hàng trên phụ thuộc vào ngành nghề và địa
điểm kinh doanh, giữa ngành nghề kinh doanh và địa điểm kinh doanh có sự
tương tác lẫn nhau.
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 24
Bài 4: Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu
nhập hằng năm và tuổi của họ.Kết quả thu được như sau:
Thu nhập
Dưới
Từ 100 000 $ -
Trên
Dưới 40
100 000 $
6
399 599 $
9
400 000 $
5
Từ 40 đến 54
18
19
8
Trên 54
11
12
17
Tuổi
Với mức ý nghĩa 1%, kiểm định giả thuyết cho rằng tuổi và mức thu nhậo không
có quan hệ với nhau.
BÀI LÀM
Nhận xét: Đây là bài toán phân tích tính độc lập.
Giả thiết: Mức thu nhập hàng năm và tuổi của các doanh nghiệp Mỹ không có
quan hệ với nhau.
Thực hiện bài toán bằng MS-Excel.
Nhập liệu vào bảng tính:
Tính tổng hàng , tổng cột và tổng cộng:
o Tính tổng hàng: Chọn ô E3 nhập hàm =SUM(B3:D3) rồi kéo hàm
xuống các ô E4, E5.
o Tính tổng cột: Chọn ô B6 nhập hàm =SUM(B3:B5) rồi kéo hàm qua
các ô C5, D5.
o Tính tổng cộng: Chọn ô E6 nhập hàm =SUM(E3:E5).
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY
Page 25