Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
BÁO CÁO BÀI TẬP LỚN
MÔN XÁC SUẤT THỐNG KÊ
HỌC KỲ I 2012-2013
Mục lục:
Bài 1:
Ví dụ 3.4:............................................................ 02
Ví dụ 4.2:........................................................... 04
Bài 2:..................................................................... 12
Bài 3:..................................................................... 15
Bài 4:..................................................................... 17
Bài 5:..................................................................... 21
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 1
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Bài 1: Trình bài lại ví dụ 3.4 trang 207 và ví dụ 4.2 trang 216 sách bài
tập Xác suất thống kê 2012 (Nguyễn Đình Huy)
Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu
theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Yếu tố
Yếu tố
B
A
A1
A2
A3
A4
B1
C1
C2
C3
C4
B2
9
12
13
10
B3
C2
C3
C4
C1
14
15
14
11
C3
C4
C1
C2
B4
16
12
11
13
C4
C1
C2
C3
12
10
14
13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
Bài làm:
•
Ta giả thiết:
H0: Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) bằng
nhau.
H1: Có ít nhất hai giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C)
khác nhau.
Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để kết luận ảnh
hưởng của các yếu tố đến hiệu suất của phản ứng.
• Cơ sở lý thuyết:
Khi phân tích phương sai ba yếu tố ta thường dung mô hình vuông La tinh có dạng như sau:
Yếu tố
A
A1
A2
A3
A4
T.i.
Yếu tố
B
B1
C1
C2
C3
C4
B2
Y111
Y212
Y313
Y414
T.1.
C2
C3
C4
C1
B3
Y122
Y223
Y324
Y421
T.2.
C3
C4
C1
C2
B4
Y133
Y234
Y331
Y432
T.3.
C4
C1
C2
C3
Y144
Y241
Y342
Y443
T.4.
Ti..
T1..
T2..
T3..
T4..
Bảng ANOVA:
Nguồn
sai số
Bậc tự do
Yếu tố A
(hàng)
r-1
Tổng số bình phương
SSR =
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 2
Bình phương
trung bình
Giá trị thống kê
MSR = SSR / (r 1)
FR = MSR / SSE
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Yếu tố B
(cột)
r-1
SSC =
MSC = SSC / (r 1)
FC = MSC /SSE
Yếu tố C
r-1
SSF =
MSF = SSF / (r 1)
F = MSF / SSE
Sai số
(r-1)(r-2)
Tổng
cộng
r2 - 1
SSE = SST – (SSF + SSR +
SSC)
MSE =
SST =
Giải toán trên Excel:
Nhập dữ liệu vào bảng như sau:
•
Tính các giá trị Ti.. T.j. T..k và T...
Các giá trị Ti..
Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8
Các giá trị T..k
Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)
Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
Giá trị T…
Chọn ô B10 và nhập biểu thức =SUM(B2:E5)
•
Tính các giá trị và
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 3
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
-
Các giá trị
Nhóm 1A
và
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G10
•
•
•
Giá trị
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC, SSF, SST và SSE
- Các giá trị SSR, SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9
- Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
- Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF, và MSE
- Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhập biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9
- Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính giá trị G và F
Chọn ô M7 và nhập biểu thức =K7/K10
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
Kết quả và biện luận:
FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận giả thiết H0 (pH)
Fc = 11,95 > F0.05(3.6) =4,76 => Bác bỏ giả thiết H0 (Nhiệt độ)
F = 30,05 > F0.05(3.6) =4,76 => Bác bỏ giả thiết H0 (Chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất.
Ví dụ 4.2: Người ta dung ba mức nhiệt độ gồm 105, 120 và 135oC kết hợp với ba
khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu
suất của phản ứng (%) được trình bày trong bảng sau đây:
Thời gian (phút)
X1
15
30
60
15
30
60
15
GVHD: PGS. TS. Nguyễn Đình Huy
Nhiệt độ (oC)
X2
105
105
105
120
120
120
135
Trang 4
Hiệu suất (%)
Y
1.87
2.02
3.28
3.05
4.07
5.54
5.03
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
30
60
135
135
Nhóm 1A
6.45
7.26
Hãy cho biết yếu tố nhiệt độ hoặc yếu tố thời gian có liên quan tính tuyến với hiệu suất của
phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115oC trong vòng 50 phút thì hiệu suất
phản ứng sẽ là bao nhiêu?
Bài làm:
•
Ta giả thiết:
H0: Phương trình hồi quy không thích hợp.
H1: Phương trình hồi quy thích hợp.
Ta tìm phương trình hồi quy tính tuyến đa tham số để chỉ ra sự phụ thuộc hoặc không phụ
thuộc giữa yếu tố thời gian (X1) và nhiệt độ (X2) với hiếu suất phản ứng tổng hợp (Y).
•
Cơ sở lý thuyết:
Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số độc lập Xi
(i=1,2,...,k):
B0 + B1X1 + B2X2 + … + BkXk
Bảng ANOVA:
Nguồn
sai số
Bậc tự do
Tổng số bình phương
Bình phương trung
bình
Giá trị thống kê
Hồi quy
K
SSR
MSR = SSR / k
F = MSR / MSE
Sai số
N-k-1
SSE
MSE = SSE / (N - k 1)
Tổng
cộng
N–1
SST = SSR + SSE
Giá trị thống kê:
•
Giá trị R-bình phương:
Giá trị R2:
(R3 ≤ 0.81 là khá tốt)
Giá trị R2 được hiệu chỉnh (Adjusted R Square)
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 5
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ
•
Độ lệch chuẩn:
(S ≤ 0.30 là khá tốt)
Trắc nghiệm thống kê:
•
Trắc nghiệm t:
Bậc tự do của t:
=N-k-1
;
•
Trắc nghiệm F:
Bậc tự do của giá trị F: v1 = 1, v2 = N -k - 1
Giải toán trên Excel:
Nhập dữ liệu theo cột:
Sử dụng Regression: Data -> Data Analysis
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 6
Nhóm 1A
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Trong cửa sổ Data Analysis chọn Regression:
Hồi quy theo Thời gian (X1):
Các thông số:
-
Input Y Range: Phạm vi biến số Y
Input X Range: Phạm vi biến số X
Labels: Dữ liệu bao gồm nhãn
Confidence Level: Mức tin cậy (chọn 95%)
Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời gian)
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 7
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Kết quả:
Phương trình hồi quy:
YX1 = f(X1) = 2.7667 + 0.0445X1 với R2 = 0.2139 và S = 1.8112
t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay
0.05
Nên chấp nhận giả thiết H0.
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 8
= 0.0708 > α =
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05
Nên chấp nhận giả thiết H0.
F = 1.9049 <
= 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay
= 0.2100 > α =
0.05
Nên chấp nhận giả thiết H0.
Vậy phương trình hồi quy trên không có ý nghĩa thống kê.
Kết luận: Yếu tố thời gian không có liên quan tính tuyến với hiệu suất của phản ứng tổng
hợp.
Hồi quy theo Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là
$B$1:$B$10
Kết quả:
Phương trình hồi quy:
YX2 = f(X2) =11.1411 + 0.1286X2 với R2 = 0.7638 và S = 0.9929
t0 = 3.4179 > t0.05 = 2.365 hay
= 0.0112 < α = 0.05
Nên bác bỏ giả thiết H0.
t1 = 4.7572 > t0.05 = 2.365 hay PV = 0.0021 < α = 0.05
Nên bác bỏ giả thiết H0.
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 9
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
F = 22.6309 >
= 5.590 hay
Nhóm 1A
= 0.0021 < α = 0.05
Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê.
Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.
Hồi quy theo Thời gian (X1) và Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là
$A$1:$B$10
Kết quả:
Phương trình hồi quy:
YX1, X2 = f(X1,X2) = -12.7000 + 0.0445X1 + 0.1286X2 với R2 = 0.9777 và S = 0.3297
t0 = 11.5283 > t0.05 = 2.365 hay
= 2.5607E-05 < α = 0.05
Nên bác bỏ giả thiết H0.
t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05
Nên bác bỏ giả thiết H0.
t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05
Nên bác bỏ giả thiết H0.
F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS = 0.0021 < α =
0.05
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 10
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê.
Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là
thời gian và nhiệt độ.
Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X1 + 0.1286X2:
Vẽ biểu đồ: chọn ô C2, vào Insert -> Scatter -> Scatter with only Maker
Sự tính tuyến của phương trình hồi quy YX1, X2 = -12.7000 + 0.0445X1 + 0.1286X2 có thể
được trình bày trên biểu đồ phân tán:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 11
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Dự đoán hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian (X1) 50 phút,
nhiệt độ (X2) 115oC bằng phương trình:
H=-12.7+0.0445*50+0.1286*115=4.310873016
Vậy: Hiệu suất dự đoán của phản ứng tại thời gian (X1) 50 phút và nhiệt độ (X2) 1150C là
4.310873016
Bài 2: Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỷ lệ
những người đi làm bằng xe máy, xe đạp và buýt. Việc điều tra được tiến hành trên
hai nhóm. Kết quả như sau:
Nữ
Nam
Xe máy
25
75
Buyt
100
120
Xe đạp
125
205
Với mức ý nghĩa α = 5%, hãy nhận định xem có sự khác nhau về cơ cấu sử dụng
các phương tiện giao thông đi làm trong hai nhóm công nhân nam và công nhân nữ
hay không.
Bài làm:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 12
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
•
•
Nhóm 1A
Ta giả thiết:
Ho: Cơ cấu sử dụng phương tiện giao thông của công nhân nam và công nhân nữ không
khác nhau.
Cơ sở lý thuyết:
Giá trị thống kê:
Oi - các tần số thực nghiệm (observed frequency)
Ei - các tần số lý thuyết (expected frequency)
Biện luận:
Nếu
Giá trị
=> bác bỏ giả thiết H0
tính theo biểu thức:
Oi - các tần số thực nghiệm của ô thuộc hàng i cột j
Ei - các tần số lý thuyết của ô thuộc hàng i cột j, r là số hàng và c là số cột
Xác xuất
với bậc tự do DF = (r - 1)(c - 1); trong đó r là số hàng và c là số
cột trong bảng VI
Nếu
=> Chấp nhận giả thiết H0 và ngược lại.
Giải toán trên Excel:
Nhập giá trị vào bảng tính:
Tính các tổng:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 13
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
•
•
•
•
Nhóm 1A
Tổng hàng:
Chọn E2 và nhập biểu thức =SUM(B2:D2)
Dùng con trỏ kéo nút tự điền từ E2 tới E3
Tổng cột:
Chọn B4 và nhập biểu thức =SUM(B2:B3)
Dùng con trỏ kéo nút tự điền từ B4 tới D4
Tổng cộng:
Chọn E5 và nhập biểu thức =SUM(B2:D3)
Tính các tần số lí thuyết:
Tần số lí thuyết = (tổng hàng x tổng cột) / tổng cộng.
Chọn ô B6 nhập công thức =B$4*$E2/$E$4, dùng con trỏ kéo nút tự điền từ ô B6
đến ô D7
Áp dụng hàm CHITEST:
Chọn B9 và nhập biểu thức =CHITEST(B2:D3,B6:D7)
Ta sẽ có được kết quả của
Biện luận:
= 0.0022 < α = 0.05 => Bác bỏ giả thuyết Ho
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 14
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Kết luận:
Cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm công nhân
nam và nữ khác nhau.
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 15
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Bài 3: Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E
yêu cầu những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành
phối mà họ đang sống. Kết quả được cho như sau:
Thành phố
Mức độ thỏa mãn
Rất thỏa
mãn
Tương đối
Không
220
130
84
156
122
121
207
54
95
164
63
75
24
43
73
A
B
C
D
E
Với mức ý nghĩa α = 3%, kiểm định xem mức độ thỏa mãn cuộc sống có phân bố giống nhau trong 5
thành phố trên hay không?
Bài làm:
Giả thiết
H0 : Mức độ thỏa mãn cuộc sống có phân bố giống nhau trong 5 thành phố.
Dạng bài: kiểm tra tính độc lập.
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 16
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
•
•
•
•
Nhóm 1A
Tổng hàng
Chọn E3 và nhập biểu thức =SUM(B3:D3)
Dùng con trỏ kéo nút tự điền từ E3 đến E8
Tổng cột
Chọn B8 và nhập biểu thức =SUM(B3:B7)
Dùng con trỏ tự kéo nút tự điền từ B8 đến D8
Tính các tần số lí thuyết
Tần số lí thuyết=(tổng hàng*tổng cột/tổng cộng)
Chọn ô B10 và nhập biểu thức =E$3*$B8/$E$8
Dùng con trỏ tự kéo nút tự điền từ B10 đến D14
Áp dụng hàm CHITEST:
Chọn ô B16 và nhập biểu thức =CHITEST(B3:D7,B10:D14)
Ta sẽ có được kết quả của
Biện luận:
= 5.52299E-13 < α = 0.03 => Bác bỏ giả thuyết Ho
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 17
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 18
Nhóm 1A
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Kết luận:
Mức độ thỏa mãn cuộc sống phân bố khác nhau trong 5 thành phố trên.
Bài 4: Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội
thành:
Ngày khảo sát
Thứ hai
Thứ ba
Thứ tư
Thứ năm
Thứ sáu
Thứ bảy
Quận nội thành
Q1
Q2
Q3
Q4
Q5
22
21
25
24
28
30
18
18
25
24
19
22
22
22
25
18
15
28
18
18
19
20
22
25
18
19
20
22
25
25
Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn α = 2%.
Lượng báo bán ra có chịu tác động của các yếu tố ngày trong tuần không?
Bài làm:
Cơ sở lí thuyết:
Phân tích phương sai hai yếu tố không lặp:
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá
trị quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
Mô hình:
Yếu tố A
1
2
…
r
Tổng
cộng
Trung
bình
1
…
Yếu tố B
2
…
…
…
…
…
…
…
…
c
Tổng
cộng
Trung bình
…
…
…
…
Bảng ANOVA
Nguồn sai
Bậc tự
Tổng số bình
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 19
Bình phương
Giá trị thống
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
số
do
phương
Yếu tố A
(hàng)
(r–1)
( c -1 )
Yếu tố B
( cột )
Nhóm 1A
trung bình
SSB =
SSF =
Sai số
(r-1)(c1)
SSE = SST - (SSF +
SSB)
Tổng
cộng
( rc – 1)
SST =
MSB =
=
MSF =
=
MSB =
-
Giả thuyết:
“Các giá trị trung bình bằng nhau”
“Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
Biện luận:
Nếu
=> Chấp nhận H0 (yếu tố A)
Nếu
=> Chấp nhận H0 (yếu tố B).
Giải toán trên Excel:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 20
kê
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Áp dụng “Anova: Two-Factor Without Replication”
Vào Data -> Data Analysis. Chọn mục Anova: Two-Factor Without Replication. Chọn OK.
Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định các chi tiết:
•
•
•
Phạm vi đầu vào (Input Range): $A$2:$F$8
Nhãn dữ liệu (Labels in First Row/Column)
Ngưỡng tin cậy (Alpha): 0.02 (mức ý nghĩa = 2%)
Nhấn OK. Ta được bảng sau:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 21
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Kết quả và biện luận:
FR = 3,5672 > F0.02 = 3,4817 =>không chấp nhận giả thiết H0(thứ)
→ Vậy lượng báo bán ra có sự khác nhau theo thứ.
FC = 2,4748< F0.02 = 3,7313=> chấp nhận giả thiết H0 (quận)
→ Vậy lượng báo bán ra theo quận không có sự khác nhau.
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 22
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Bài 5: Theo dõi ngẫu nhiên giá thuê nhà tại 5 thành phố (với điều kiện thuê nhà
như nhau) thu được các số liệu sau:
Thành phố A
Thành phố B
Thành phố C
Thành phố D
Thành phố E
900
625
415
410
340
1200
640
400
310
425
850
775
420
320
275
1320
1000
560
280
210
1400
690
780
500
575
1150
550
620
385
360
975
840
800
440
750
390
Hãy tìm P-value để kiểm định xem có sự khác biệt về giá thuê nhà ở 5 thành phố nói trên hay
không.
Bài làm:
Nhận xét: Đây là bài toán phân tích phương sai một yếu tố.
Giả thiết H0: không có sự khác biệt về giá thuê nhà ở 5 thành phố.
Cơ sở lí thuyết:
- Phân tích phương sai một yếu tố.
- Sự phân tích này nhằm đánh giá sự ảnh hưởng của một yếu tố trên các giá trị quan
sát Yi (i=1,2,…,k)
Mô hình:
Yếu tố thí nghiệm
1
2
…
…
…
…
…
…
…
Tổng cộng
Trung bình
…
T
…
…
Bảng ANOVA
Nguồn sai
Bậc tự do
số
Yếu tố
k-1
Sai số
K
Tổng số bình phương
SSF =
MSF =
N-k
SSE = SST - SSF
GVHD: PGS. TS. Nguyễn Đình Huy
Bình phương trung
bình
Trang 23
Giá trị thống kê
=
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
MSB =
Tổng cộng
( rc – 1)
SST =
Giả thuyết:
“Các giá trị trung bình bằng nhau”
“Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
Biện luận:
Nếu
=> Chấp nhận giả thiết H0
Giải toán trên Excel:
Nhập bảng số liệu như hình dưới:
Vào Data /Data analysis, chọn Anova: Single Factor rồi bấm OK
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 24
Nhóm 1A
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Trên màng hình sẽ hiện lên hộp thoại của Anova: Single Factor
Ta nhập các thông số như hình dưới
• Phạm vi của biến số Y(Input Range): ta kéo chuột từ ô A1 tới ô I5
• Alpha: 0.05
• Group by: Rows
• Xuất kết quả (Output options): kích vào New Worksheet Ply
Ta được kết quả như sau:
Kết Quả Và Biện Luận
P-Value = 6.46E-10 < Alpha=0.05
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 25