Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
BÁO CÁO BÀI TẬP LỚN
MÔN XÁC SUẤT THỐNG KÊ
HỌC KỲ HÈ 2012
Mục lục:
Bài 1:
Ví dụ 3.4:............................................................................. 02
Ví dụ 4.2:............................................................................. 04
Bài 2:........................................................................................ 11
Bài 3:........................................................................................ 13
Bài 4:........................................................................................ 16
Bài 5:........................................................................................ 20
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 1
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Bài 1: Trình bài lại ví dụ 3.4 trang 207 và ví dụ 4.2 trang 216 sách bài tập Xác suất thống kê 2012
(Nguyễn Đình Huy)
Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH
(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Yếu tố
A
A1
A2
A3
A4
Yếu tố B
B1
C1
C2
C3
C4
B2
9
12
13
10
B3
C2
C3
C4
C1
14
15
14
11
C3
C4
C1
C2
B4
16
12
11
13
C4
C1
C2
C3
12
10
14
13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
Bài làm:
•
Ta giả thiết:
H0: Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) bằng nhau.
H1: Có ít nhất hai giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) khác
nhau.
Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để kết luận ảnh hưởng của
các yếu tố đến hiệu suất của phản ứng.
• Cơ sở lý thuyết:
Khi phân tích phương sai ba yếu tố ta thường dung mô hình vuông La tinh có dạng như sau:
Yếu tố
A
A1
A2
A3
A4
T.i.
Yếu tố
B
B1
C1
C2
C3
C4
B2
Y111
Y212
Y313
Y414
T.1.
C2
C3
C4
C1
B3
Y122
Y223
Y324
Y421
T.2.
C3
C4
C1
C2
B4
Y133
Y234
Y331
Y432
T.3.
C4
C1
C2
C3
Y144
Y241
Y342
Y443
T.4.
Ti..
T1..
T2..
T3..
T4..
Bảng ANOVA:
Nguồn sai
số
Bậc tự do
Yếu tố A
(hàng)
r-1
Yếu tố B
(cột)
r-1
Bình phương trung
bình
Giá trị thống kê
SSR =
MSR = SSR / (r - 1)
FR = MSR / SSE
SSC =
MSC = SSC / (r - 1)
FC = MSC /SSE
Tổng số bình phương
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 2
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Yếu tố C
r-1
Sai số
(r-1)(r-2)
Tổng
cộng
r2 - 1
MSF = SSF / (r - 1)
SSF =
SSE = SST – (SSF + SSR + SSC)
SST =
Giải toán trên Excel:
Nhập dữ liệu vào bảng như sau:
•
Tính các giá trị Ti… T.j. T..k và T
Các giá trị Ti..
Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8
Các giá trị T..k
Chọn ô B9 và nhập biểu thức =SUM(B2;C5;D4;E3)
Chọn ô C9 và nhập biểu thức =SUM(B3;C2;D5;E4)
Chọn ô D9 và nhập biểu thức =SUM(B4;C3;D2;E5)
Chọn ô E9 và nhập biểu thức =SUM(B5;C4;D3;E2)
Giá trị T…
Chọn ô B10 và nhập biểu thức =SUM(B5;C4;D3;E2)
•
Tính các giá trị và
-
Các giá trị
và
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9
-
Giá trị
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
GVHD: PGS. TS. Nguyễn Đình Huy
Nhóm 1A
Trang 3
MSE =
F = MSF / SSE
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
•
•
•
Nhóm 1A
Giá trị
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC, SSF, SST và SSE
- Các giá trị SSR, SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9
- Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
- Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF, và MSE
- Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhập biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9
- Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính giá trị G và F
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
Kết quả và biện luận:
FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận H0 (pH)
Fc = 11,95 < F0.05(3.6) =4,76 => Bác bỏ H0 (Nhiệt độ)
F = 30,05 < F0.05(3.6) =4,76 => Bác bỏ H0 (Chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất.
Ví dụ 4.2: Người ta dung ba mức nhiệt độ gồm 105, 120 và 135oC kết hợp với ba khoảng thời gian là
15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình
bày trong bảng sau đây:
Thời gian (phút)
X1
15
30
60
15
30
60
15
30
60
Nhiệt độ (oC)
X2
105
105
105
120
120
120
135
135
135
Hiệu suất (%)
Y
1.87
2.02
3.28
3.05
4.07
5.54
5.03
6.45
7.26
Hãy cho biết yếu tố nhiệt độ hoặc yếu tố thời gian có liên quan tính tuyến với hiệu suất của phản ứng
tổng hợp? Nếu có thì điều kiện nhiệt độ 115oC trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao
nhiêu?
Bài làm:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 4
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
•
Nhóm 1A
Ta giả thiết:
H0: Phương trình hồi quy không thích hợp.
H1: Phương trình hồi quy thích hợp.
Ta tìm phương trình hồi quy tính tuyến đa tham số để chỉ ra sự phụ thuộc hoặc không phụ thuộc giữa
yếu tố thời gian (X1) và nhiệt độ (X2) với hiếu suất phản ứng tổng hợp (Y).
•
Cơ sở lý thuyết:
Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số độc lập X i (i=1,2,...,k):
B0 + B1X1 + B2X2 + … + BkXk
Bảng ANOVA:
Nguồn sai
số
Bậc tự do
Tổng số bình phương
Bình phương trung bình
Giá trị thống kê
Hồi quy
k
SSR
MSR = SSR / k
F = MSR / MSE
Sai số
N-k-1
SSE
MSE = SSE / (N - k - 1)
Tổng
cộng
N-1
SST = SSR + SSE
Giá trị thống kê:
•
Giá trị R-bình phương:
Giá trị R2:
(R3 ≤ 0.81 là khá tốt)
Giá trị R2 được hiệu chỉnh (Adjusted R Square)
sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ
•
Độ lệch chuẩn:
(S ≤ 0.30 là khá tốt)
Trắc nghiệm thống kê:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 5
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
•
Trắc nghiệm t:
Bậc tự do của t:
=N-k-1
;
•
Trắc nghiệm F:
Bậc tự do của giá trị F: v1 = 1, v2 = N -k - 1
Giải toán trên Excel:
Nhập dữ liệu theo cột:
Sử dụng Regression: Data -> Data Analysis
Trong cửa sổ Data Analysis chọn Regression:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 6
Nhóm 1A
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Hồi quy theo Thời gian (X1):
Các thông số:
-
Input Y Range: Phạm vi biến số Y
Input X Range: Phạm vi biến số X
Labels: Dữ liệu bao gồm nhãn
Confidence Level: Mức tin cậy (chọn 95%)
Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời gian)
Kết quả:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 7
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Phương trình hồi quy:
YX1 = f(X1) = 2.7667 + 0.0445X1 với R2 = 0.2139 và S = 1.8112
t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay
= 0.0708 > α = 0.05
Nên chấp nhận giả thiết H0.
t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05
Nên chấp nhận giả thiết H0.
F = 1.9049 <
= 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay
= 0.2100 > α = 0.05
Nên chấp nhận giả thiết H0.
Vậy phương trình hồi quy trên không có ý nghĩa thống kê.
Kết luận: Yếu tố thời gian không có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.
Hồi quy theo Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là $B$1:$B$10
Kết quả:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 8
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Phương trình hồi quy:
YX2 = f(X2) =11.1411 + 0.1286X2 với R2 = 0.7638 và S = 0.9929
t0 = 3.4179 > t0.05 = 2.365 hay
= 0.0112 < α = 0.05
Nên bác bỏ giả thiết H0.
t1 = 4.7572 > t0.05 = 2.365 hay PV = 0.0021 < α = 0.05
Nên bác bỏ giả thiết H0.
F = 22.6309 >
= 5.590 hay
= 0.0021 < α = 0.05
Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê.
Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.
Hồi quy theo Thời gian (X1) và Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là $A$1:$B$10
Kết quả:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 9
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Phương trình hồi quy:
YX1, X2 = f(X1,X2) = -12.7000 + 0.0445X1 + 0.1286X2 với R2 = 0.9777 và S = 0.3297
t0 = 11.5283 > t0.05 = 2.365 hay
= 2.5607E-05 < α = 0.05
Nên bác bỏ giả thiết H0.
t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05
Nên bác bỏ giả thiết H0.
t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05
Nên bác bỏ giả thiết H0.
F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS = 0.0021 < α = 0.05
Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê.
Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là thời gian và nhiệt độ.
Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X1 + 0.1286X2:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 10
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Vẽ biểu đồ: chọn ô C2, vào Insert -> Scatter -> Scatter with only Maker
Hàm lượng dự đoán (Y’)
Sự tính tuyến của phương trình hồi quy YX1, X2 = -12.7000 + 0.0445X1 + 0.1286X2 có thể được trình
bày trên biểu đồ phân tán:
Hàm lượng thực nghiệm (Y)
Dự đoán hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian (X 1) 50 phút, nhiệt độ
(X2) 115oC:
Công thức ô E3:
=B1+B2*E1+B3*E2
Kết quả: 4.3109
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 11
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Bài 2: Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỷ lệ
những người đi làm bằng xe máy, xe đạp và buýt. Việc điều tra được tiến hành trên hai
nhóm. Kết quả như sau:
Nữ
Nam
Xe máy
25
75
Buyt
100
120
Xe đạp
125
205
Với mức ý nghĩa α = 5%, hãy nhận định xem có sự khác nhau về cơ cấu sử dụng các
phương tiện giao thông đi làm trong hai nhóm công nhân nam và công nhân nữ hay
không.
Bài làm:
•
•
Ta giả thiết:
Ho: Cơ cấu sử dụng phương tiện giao thông của công nhân nam và công nhân nữ không khác
nhau.
Cơ sở lý thuyết:
Giá trị thống kê:
Oi - các tần số thực nghiệm (observed frequency)
Ei - các tần số lý thuyết (expected frequency)
Biện luận:
Nếu
Giá trị
=> bác bỏ giả thiết H0
tính theo biểu thức:
Oi - các tần số thực nghiệm của ô thuộc hàng i cột j
Ei - các tần số lý thuyết của ô thuộc hàng i cột j, r là số hàng và c là số cột
Xác xuất
với bậc tự do DF = (r - 1)(c - 1); trong đó r là số hàng và c là số cột
trong bảng VI
Nếu
=> Chấp nhận giả thiết H0 và ngược lại.
Giải toán trên Excel:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 12
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Nhập giá trị vào bảng tính:
Tính các tổng:
•
•
•
•
Tổng hàng:
Chọn E2 và nhập biểu thức =SUM(B2:D2)
Dùng con trỏ kéo nút tự điền từ E2 tới E3
Tổng cột:
Chọn B4 và nhập biểu thức =SUM(B2:B3)
Dùng con trỏ kéo nút tự điền từ B4 tới D4
Tổng cộng:
Chọn E5 và nhập biểu thức =SUM(B2:D3)
Tính các tần số lí thuyết:
Tần số lí thuyết = (tổng hàng x tổng cột) / tổng cộng.
Chọn ô B6 nhập công thức =B$4*$E2/$E$4, dùng con trỏ kéo nút tự điền từ ô B6 đến ô
D7
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 13
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 14
Nhóm 1A
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Áp dụng hàm CHITEST:
Chọn B9 và nhập biểu thức =CHITEST(B2:D3,B8:D9)
Ta sẽ có được kết quả của
Biện luận:
= 0.0022 < α = 0.05 => Bác bỏ giả thuyết Ho
Kết luận:
Cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm công nhân nam và nữ khác nhau.
Bài 3: Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E yêu cầu những người
được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phối mà họ đang sống. Kết quả được cho như
sau:
Thành phố
Mức độ thỏa mãn
Rất thỏa mãn
Tương đối
Không
220
130
84
156
122
121
207
54
95
164
63
75
24
43
73
A
B
C
D
E
Với mức ý nghĩa α = 3%, kiểm định xem mức độ thỏa mãn cuộc sống có phân bố giống nhau trong 5 thành phố
trên hay không?
Bài làm:
Dạng bài: kiểm tra tính độc lập, sử dụng MS Excel để giải.
Sử dụng Excel
B1. Khởi động chương trình Excel
B2. Nhập bảng dữ liệu vào chương trình
B3. Thêm dòng tổng cột và dòng tổng hàng
B4. Tính tổng cột và tổng hàng
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 15
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 16
Nhóm 1A
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
B5. Tính tổng: nhập vào ô F9 =SUM(F4:F8)
Kết quả ta được:
B6. Tính bảng tần số lý thuyết: ɣij = mj*ni/n
Nhập vào ô C12 = C$9*$F4/$F$9)
Dùng con trỏ tự diền kéo từ ô C12 đến ô E16
Kết quả ta được:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 17
Nhóm 1A
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
B7. Nhấp chọn ô C17
Gọi hàm CHITEST để tính giá trị P
Nhập giá trị Actual_range: C4:E8
Nhập giá trị Expectd_range: C12:E16
Kết quả ta được:
Kết quả: P= 3.5299E-13
Biện luận:
= 3.5299E-13 < α = 0.03 bc bỏ giả thuyết H0
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 18
Nhóm 1A
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Kết luận:
Mức độ thỏa mãn cuộc sống phân bố khác nhau trong 5 thành phố trên.
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 19
Nhóm 1A
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Bài 4: Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội thành:
Quận nội thành
Ngày khảo sát
Thứ hai
Thứ ba
Thứ tư
Thứ năm
Thứ sáu
Thứ bảy
Q1
Q2
Q3
Q4
Q5
22
21
25
24
28
30
18
18
25
24
19
22
22
22
25
18
15
28
18
18
19
20
22
25
18
19
20
22
25
25
Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn α = 2%. Lượng báo bán ra có
chịu tác động của các yếu tố ngày trong tuần không?
Bài làm:
Cơ sở lí thuyết:
Phân tích phương sai hai yếu tố không lặp:
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Y ij
(i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
Mô hình:
Yếu tố A
1
2
…
r
Yếu tố B
1
…
2
…
Tổng cộng
Trung bình
…
…
…
…
…
c
…
…
…
Tổng cộng
Trung bình
…
…
…
Bảng ANOVA
Nguồn sai số
Bậc tự do
Yếu tố A
(hàng)
(r–1)
Tổng số bình phương
SSB =
GVHD: PGS. TS. Nguyễn Đình Huy
Bình phương trung
bình
MSB =
Trang 20
Giá trị thống kê
=
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Yếu tố B
( cột )
( c -1 )
Sai số
(r-1)(c-1)
Tổng cộng
( rc – 1)
MSF =
Nhóm 1A
=
SSF =
SSE = SST - (SSF + SSB)
SST =
MSB =
-
Giả thuyết:
“Các giá trị trung bình bằng nhau”
“Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
Biện luận:
Nếu
=> Chấp nhận H0 (yếu tố A)
Nếu
=> Chấp nhận H0 (yếu tố B).
Giải toán trên Excel:
Áp dụng “Anova: Two-Factor Without Replication”
Vào Data -> Data Analysis. Chọn mục Anova: Two-Factor Without Replication. Chọn OK.
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 21
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định các chi tiết:
•
•
•
Phạm vi đầu vào (Input Range): $A$2:$F$8
Nhãn dữ liệu (Labels in First Row/Column)
Ngưỡng tin cậy (Alpha): 0.02 (mức ý nghĩa = 2%)
Nhấn OK. Ta được bảng sau:
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 22
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Kết quả và biện luận:
FR = 3,5672 > F0.02 = 3,4817 =>không chấp nhận giả thiết H0(thứ)
→ Vậy lượng báo bán ra có sự khác nhau theo thứ.
FC = 2,4748< F0.02 = 3,7313=> chấp nhận giả thiết H0 (quận)
→ Vậy lượng báo bán ra theo quận không có sự khác nhau.
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 23
Nhóm 1A
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Nhóm 1A
Bài 5: Theo dõi ngẫu nhiên giá thuê nhà tại 5 thành phố (với điều kiện thuê nhà như nhau) thu được các
số liệu sau:
Thành phố A
Thành phố B
Thành phố C
Thành phố D
Thành phố E
900
625
415
410
340
1200
640
400
310
425
850
775
420
320
275
1320
1000
560
280
210
1400
690
780
500
575
1150
550
620
385
360
975
840
800
440
750
390
Hãy tìm P-value để kiểm định xem có sự khác biệt về giá thuê nhà ở 5 thành phố nói trên hay không.
Bài làm:
Nhận xét: Đây là bài toán phân tích phương sai một yếu tố
Giả thiết H0: không có sự khác biệt về giá thuê nhà ở 5 thành phố
Cơ sở lí thuyết:
Phân tích phương sai một yếu tố.
Sự phân tích này nhằm đánh giá sự ảnh hưởng của một yếu tố trên các giá trị quan sát Y i
(i=1,2,…,k)
Mô hình:
Yếu tố thí nghiệm
1
…
2
…
K
…
…
…
…
…
Tổng cộng
Trung bình
…
T
…
…
Bảng ANOVA
Nguồn sai số
Bậc tự do
Tổng số bình phương
Bình phương trung
bình
MSF =
Yếu tố
k-1
Sai số
N-k
SSF =
SSE = SST - SSF
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 24
MSB =
Giá trị thống kê
=
Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Tổng cộng
( rc – 1)
SST =
Giả thuyết:
“Các giá trị trung bình bằng nhau”
“Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
Biện luận:
Nếu
=> Chấp nhận giả thiết H0
Giải toán trên Excel:
Nhập bảng số liệu như hình dưới:
Vào Data /Data analysis, chọn Anova: Single Factor rồi bấm OK
Trên màng hình sẽ hiện lên hộp thoại của Anova: Single Factor
Ta nhập các thông số như hình dưới
• Phạm vi của biến số Y(Input Range): ta kéo chuột từ ô A1 tới ô I5
• Alpha: 0.05
• Group by: Rows
• Xuất kết quả (Output options): kích vào New Worksheet Ply
GVHD: PGS. TS. Nguyễn Đình Huy
Trang 25
Nhóm 1A