Tải bản đầy đủ (.doc) (25 trang)

BÁO cáo bài tập lớn môn xác SUẤT THỐNG kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (668.72 KB, 25 trang )

Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

BÁO CÁO BÀI TẬP LỚN
MÔN XÁC SUẤT THỐNG KÊ
HỌC KỲ I 2012-2013

Mục lục:
Bài 1:
Ví dụ 3.4:............................................................ 02
Ví dụ 4.2:........................................................... 04
Bài 2:..................................................................... 12
Bài 3:..................................................................... 15
Bài 4:..................................................................... 17
Bài 5:..................................................................... 21

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 1


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Bài 1: Trình bài lại ví dụ 3.4 trang 207 và ví dụ 4.2 trang 216 sách bài
tập Xác suất thống kê 2012 (Nguyễn Đình Huy)
Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu
theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Yếu tố



Yếu tố
B

A
A1
A2
A3
A4

B1
C1
C2
C3
C4

B2
9
12
13
10

B3

C2
C3
C4
C1

14

15
14
11

C3
C4
C1
C2

B4
16
12
11
13

C4
C1
C2
C3

12
10
14
13

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
Bài làm:


Ta giả thiết:

H0: Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) bằng
nhau.
H1: Có ít nhất hai giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C)
khác nhau.

Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để kết luận ảnh
hưởng của các yếu tố đến hiệu suất của phản ứng.
• Cơ sở lý thuyết:
Khi phân tích phương sai ba yếu tố ta thường dung mô hình vuông La tinh có dạng như sau:
Yếu tố
A
A1
A2
A3
A4
T.i.

Yếu tố
B
B1
C1
C2
C3
C4

B2
Y111
Y212
Y313
Y414

T.1.

C2
C3
C4
C1

B3
Y122
Y223
Y324
Y421
T.2.

C3
C4
C1
C2

B4
Y133
Y234
Y331
Y432
T.3.

C4
C1
C2
C3


Y144
Y241
Y342
Y443
T.4.

Ti..
T1..
T2..
T3..
T4..

Bảng ANOVA:
Nguồn
sai số

Bậc tự do

Yếu tố A
(hàng)

r-1

Tổng số bình phương
SSR =

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 2


Bình phương
trung bình

Giá trị thống kê

MSR = SSR / (r 1)

FR = MSR / SSE


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Yếu tố B
(cột)

r-1

SSC =

MSC = SSC / (r 1)

FC = MSC /SSE

Yếu tố C

r-1


SSF =

MSF = SSF / (r 1)

F = MSF / SSE

Sai số

(r-1)(r-2)

Tổng
cộng

r2 - 1

SSE = SST – (SSF + SSR +
SSC)

MSE =

SST =

Giải toán trên Excel:
Nhập dữ liệu vào bảng như sau:



Tính các giá trị Ti.. T.j. T..k và T...
Các giá trị Ti..
Chọn ô B7 và nhập biểu thức =SUM(B2:E2)

Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8
Các giá trị T..k
Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)
Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
Giá trị T…
Chọn ô B10 và nhập biểu thức =SUM(B2:E5)



Tính các giá trị và

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 3


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
-

Các giá trị

Nhóm 1A




Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G10






Giá trị

Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC, SSF, SST và SSE
- Các giá trị SSR, SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9
- Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
- Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF, và MSE
- Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhập biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9
- Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính giá trị G và F
Chọn ô M7 và nhập biểu thức =K7/K10
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9


Kết quả và biện luận:
FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận giả thiết H0 (pH)
Fc = 11,95 > F0.05(3.6) =4,76 => Bác bỏ giả thiết H0 (Nhiệt độ)
F = 30,05 > F0.05(3.6) =4,76 => Bác bỏ giả thiết H0 (Chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất.
Ví dụ 4.2: Người ta dung ba mức nhiệt độ gồm 105, 120 và 135oC kết hợp với ba
khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu
suất của phản ứng (%) được trình bày trong bảng sau đây:
Thời gian (phút)
X1
15
30
60
15
30
60
15
GVHD: PGS. TS. Nguyễn Đình Huy

Nhiệt độ (oC)
X2
105
105
105
120
120
120
135
Trang 4


Hiệu suất (%)
Y
1.87
2.02
3.28
3.05
4.07
5.54
5.03


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
30
60

135
135

Nhóm 1A
6.45
7.26

Hãy cho biết yếu tố nhiệt độ hoặc yếu tố thời gian có liên quan tính tuyến với hiệu suất của
phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115oC trong vòng 50 phút thì hiệu suất
phản ứng sẽ là bao nhiêu?

Bài làm:



Ta giả thiết:
H0: Phương trình hồi quy không thích hợp.
H1: Phương trình hồi quy thích hợp.

Ta tìm phương trình hồi quy tính tuyến đa tham số để chỉ ra sự phụ thuộc hoặc không phụ
thuộc giữa yếu tố thời gian (X1) và nhiệt độ (X2) với hiếu suất phản ứng tổng hợp (Y).


Cơ sở lý thuyết:
Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số độc lập Xi
(i=1,2,...,k):
B0 + B1X1 + B2X2 + … + BkXk

Bảng ANOVA:
Nguồn
sai số

Bậc tự do

Tổng số bình phương

Bình phương trung
bình

Giá trị thống kê

Hồi quy

K


SSR

MSR = SSR / k

F = MSR / MSE

Sai số

N-k-1

SSE

MSE = SSE / (N - k 1)

Tổng
cộng

N–1

SST = SSR + SSE

Giá trị thống kê:


Giá trị R-bình phương:
Giá trị R2:
(R3 ≤ 0.81 là khá tốt)
Giá trị R2 được hiệu chỉnh (Adjusted R Square)

GVHD: PGS. TS. Nguyễn Đình Huy


Trang 5


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ


Độ lệch chuẩn:
(S ≤ 0.30 là khá tốt)

Trắc nghiệm thống kê:


Trắc nghiệm t:
Bậc tự do của t:

=N-k-1
;



Trắc nghiệm F:
Bậc tự do của giá trị F: v1 = 1, v2 = N -k - 1

Giải toán trên Excel:
Nhập dữ liệu theo cột:

Sử dụng Regression: Data -> Data Analysis


GVHD: PGS. TS. Nguyễn Đình Huy

Trang 6

Nhóm 1A


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Trong cửa sổ Data Analysis chọn Regression:

Hồi quy theo Thời gian (X1):
Các thông số:
-

Input Y Range: Phạm vi biến số Y
Input X Range: Phạm vi biến số X
Labels: Dữ liệu bao gồm nhãn
Confidence Level: Mức tin cậy (chọn 95%)
Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời gian)

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 7


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê


Nhóm 1A

Kết quả:

Phương trình hồi quy:
YX1 = f(X1) = 2.7667 + 0.0445X1 với R2 = 0.2139 và S = 1.8112
t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay
0.05
 Nên chấp nhận giả thiết H0.
GVHD: PGS. TS. Nguyễn Đình Huy

Trang 8

= 0.0708 > α =


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05
 Nên chấp nhận giả thiết H0.
F = 1.9049 <

= 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay

= 0.2100 > α =

0.05
 Nên chấp nhận giả thiết H0.

Vậy phương trình hồi quy trên không có ý nghĩa thống kê.
Kết luận: Yếu tố thời gian không có liên quan tính tuyến với hiệu suất của phản ứng tổng
hợp.

Hồi quy theo Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là
$B$1:$B$10
Kết quả:

Phương trình hồi quy:
YX2 = f(X2) =11.1411 + 0.1286X2 với R2 = 0.7638 và S = 0.9929
t0 = 3.4179 > t0.05 = 2.365 hay

= 0.0112 < α = 0.05

 Nên bác bỏ giả thiết H0.
t1 = 4.7572 > t0.05 = 2.365 hay PV = 0.0021 < α = 0.05
 Nên bác bỏ giả thiết H0.
GVHD: PGS. TS. Nguyễn Đình Huy

Trang 9


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
F = 22.6309 >

= 5.590 hay

Nhóm 1A


= 0.0021 < α = 0.05

 Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê.
Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.

Hồi quy theo Thời gian (X1) và Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là
$A$1:$B$10
Kết quả:

Phương trình hồi quy:
YX1, X2 = f(X1,X2) = -12.7000 + 0.0445X1 + 0.1286X2 với R2 = 0.9777 và S = 0.3297
t0 = 11.5283 > t0.05 = 2.365 hay

= 2.5607E-05 < α = 0.05

 Nên bác bỏ giả thiết H0.
t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05
 Nên bác bỏ giả thiết H0.
t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05
 Nên bác bỏ giả thiết H0.
F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS = 0.0021 < α =
0.05
GVHD: PGS. TS. Nguyễn Đình Huy

Trang 10


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê


Nhóm 1A

 Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê.

Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là
thời gian và nhiệt độ.
Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X1 + 0.1286X2:

Vẽ biểu đồ: chọn ô C2, vào Insert -> Scatter -> Scatter with only Maker
Sự tính tuyến của phương trình hồi quy YX1, X2 = -12.7000 + 0.0445X1 + 0.1286X2 có thể
được trình bày trên biểu đồ phân tán:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 11


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Dự đoán hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian (X1) 50 phút,
nhiệt độ (X2) 115oC bằng phương trình:
H=-12.7+0.0445*50+0.1286*115=4.310873016
Vậy: Hiệu suất dự đoán của phản ứng tại thời gian (X1) 50 phút và nhiệt độ (X2) 1150C là
4.310873016

Bài 2: Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỷ lệ

những người đi làm bằng xe máy, xe đạp và buýt. Việc điều tra được tiến hành trên
hai nhóm. Kết quả như sau:
Nữ
Nam

Xe máy
25
75

Buyt
100
120

Xe đạp
125
205

Với mức ý nghĩa α = 5%, hãy nhận định xem có sự khác nhau về cơ cấu sử dụng
các phương tiện giao thông đi làm trong hai nhóm công nhân nam và công nhân nữ
hay không.
Bài làm:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 12


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê





Nhóm 1A

Ta giả thiết:
Ho: Cơ cấu sử dụng phương tiện giao thông của công nhân nam và công nhân nữ không
khác nhau.
Cơ sở lý thuyết:
Giá trị thống kê:

Oi - các tần số thực nghiệm (observed frequency)
Ei - các tần số lý thuyết (expected frequency)
Biện luận:
Nếu
Giá trị

=> bác bỏ giả thiết H0
tính theo biểu thức:

Oi - các tần số thực nghiệm của ô thuộc hàng i cột j
Ei - các tần số lý thuyết của ô thuộc hàng i cột j, r là số hàng và c là số cột
Xác xuất

với bậc tự do DF = (r - 1)(c - 1); trong đó r là số hàng và c là số

cột trong bảng VI
Nếu

=> Chấp nhận giả thiết H0 và ngược lại.


Giải toán trên Excel:
Nhập giá trị vào bảng tính:

Tính các tổng:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 13


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê








Nhóm 1A

Tổng hàng:
Chọn E2 và nhập biểu thức =SUM(B2:D2)
Dùng con trỏ kéo nút tự điền từ E2 tới E3
Tổng cột:
Chọn B4 và nhập biểu thức =SUM(B2:B3)
Dùng con trỏ kéo nút tự điền từ B4 tới D4
Tổng cộng:
Chọn E5 và nhập biểu thức =SUM(B2:D3)
Tính các tần số lí thuyết:

Tần số lí thuyết = (tổng hàng x tổng cột) / tổng cộng.
Chọn ô B6 nhập công thức =B$4*$E2/$E$4, dùng con trỏ kéo nút tự điền từ ô B6
đến ô D7

Áp dụng hàm CHITEST:
Chọn B9 và nhập biểu thức =CHITEST(B2:D3,B6:D7)
Ta sẽ có được kết quả của

Biện luận:
= 0.0022 < α = 0.05 => Bác bỏ giả thuyết Ho
GVHD: PGS. TS. Nguyễn Đình Huy

Trang 14


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Kết luận:
Cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm công nhân
nam và nữ khác nhau.

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 15


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê


Nhóm 1A

Bài 3: Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E
yêu cầu những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành
phối mà họ đang sống. Kết quả được cho như sau:
Thành phố

Mức độ thỏa mãn
Rất thỏa
mãn

Tương đối

Không

220
130
84
156
122

121
207
54
95
164

63
75
24

43
73

A
B
C
D
E

Với mức ý nghĩa α = 3%, kiểm định xem mức độ thỏa mãn cuộc sống có phân bố giống nhau trong 5
thành phố trên hay không?
Bài làm:
Giả thiết
H0 : Mức độ thỏa mãn cuộc sống có phân bố giống nhau trong 5 thành phố.
Dạng bài: kiểm tra tính độc lập.

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 16


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê







Nhóm 1A


Tổng hàng
Chọn E3 và nhập biểu thức =SUM(B3:D3)
Dùng con trỏ kéo nút tự điền từ E3 đến E8
Tổng cột
Chọn B8 và nhập biểu thức =SUM(B3:B7)
Dùng con trỏ tự kéo nút tự điền từ B8 đến D8
Tính các tần số lí thuyết
Tần số lí thuyết=(tổng hàng*tổng cột/tổng cộng)
Chọn ô B10 và nhập biểu thức =E$3*$B8/$E$8
Dùng con trỏ tự kéo nút tự điền từ B10 đến D14
Áp dụng hàm CHITEST:
Chọn ô B16 và nhập biểu thức =CHITEST(B3:D7,B10:D14)
Ta sẽ có được kết quả của

Biện luận:
= 5.52299E-13 < α = 0.03 => Bác bỏ giả thuyết Ho

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 17


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 18

Nhóm 1A



Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Kết luận:
Mức độ thỏa mãn cuộc sống phân bố khác nhau trong 5 thành phố trên.
Bài 4: Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội
thành:
Ngày khảo sát
Thứ hai
Thứ ba
Thứ tư
Thứ năm
Thứ sáu
Thứ bảy

Quận nội thành
Q1

Q2

Q3

Q4

Q5

22

21
25
24
28
30

18
18
25
24
19
22

22
22
25
18
15
28

18
18
19
20
22
25

18
19
20

22
25
25

Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn α = 2%.
Lượng báo bán ra có chịu tác động của các yếu tố ngày trong tuần không?
Bài làm:

Cơ sở lí thuyết:
Phân tích phương sai hai yếu tố không lặp:
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá
trị quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
Mô hình:
Yếu tố A
1
2

r
Tổng
cộng
Trung
bình

1



Yếu tố B
2










c

Tổng
cộng

Trung bình









Bảng ANOVA
Nguồn sai

Bậc tự

Tổng số bình


GVHD: PGS. TS. Nguyễn Đình Huy

Trang 19

Bình phương

Giá trị thống


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
số

do

phương

Yếu tố A
(hàng)

(r–1)

( c -1 )

Yếu tố B
( cột )

Nhóm 1A

trung bình


SSB =

SSF =

Sai số

(r-1)(c1)

SSE = SST - (SSF +
SSB)

Tổng
cộng

( rc – 1)

SST =

MSB =

=

MSF =

=

MSB =

-


Giả thuyết:
 “Các giá trị trung bình bằng nhau”
 “Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:

Biện luận:
Nếu

=> Chấp nhận H0 (yếu tố A)

Nếu

=> Chấp nhận H0 (yếu tố B).

Giải toán trên Excel:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 20




Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Áp dụng “Anova: Two-Factor Without Replication”
Vào Data -> Data Analysis. Chọn mục Anova: Two-Factor Without Replication. Chọn OK.


Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định các chi tiết:




Phạm vi đầu vào (Input Range): $A$2:$F$8
Nhãn dữ liệu (Labels in First Row/Column)
Ngưỡng tin cậy (Alpha): 0.02 (mức ý nghĩa = 2%)

Nhấn OK. Ta được bảng sau:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 21


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Kết quả và biện luận:

FR = 3,5672 > F0.02 = 3,4817 =>không chấp nhận giả thiết H0(thứ)
→ Vậy lượng báo bán ra có sự khác nhau theo thứ.
FC = 2,4748< F0.02 = 3,7313=> chấp nhận giả thiết H0 (quận)
→ Vậy lượng báo bán ra theo quận không có sự khác nhau.

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 22



Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Bài 5: Theo dõi ngẫu nhiên giá thuê nhà tại 5 thành phố (với điều kiện thuê nhà
như nhau) thu được các số liệu sau:
Thành phố A
Thành phố B
Thành phố C
Thành phố D
Thành phố E

900
625
415
410
340

1200
640
400
310
425

850
775
420
320

275

1320
1000
560
280
210

1400
690
780
500
575

1150
550
620
385
360

975
840
800
440

750
390

Hãy tìm P-value để kiểm định xem có sự khác biệt về giá thuê nhà ở 5 thành phố nói trên hay
không.

Bài làm:
Nhận xét: Đây là bài toán phân tích phương sai một yếu tố.
Giả thiết H0: không có sự khác biệt về giá thuê nhà ở 5 thành phố.

Cơ sở lí thuyết:
- Phân tích phương sai một yếu tố.
- Sự phân tích này nhằm đánh giá sự ảnh hưởng của một yếu tố trên các giá trị quan
sát Yi (i=1,2,…,k)

Mô hình:
Yếu tố thí nghiệm
1

2











Tổng cộng
Trung bình


T





Bảng ANOVA
Nguồn sai
Bậc tự do
số
Yếu tố
k-1
Sai số

K

Tổng số bình phương
SSF =

MSF =

N-k
SSE = SST - SSF

GVHD: PGS. TS. Nguyễn Đình Huy

Bình phương trung
bình

Trang 23

Giá trị thống kê

=


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

MSB =

Tổng cộng

( rc – 1)

SST =

Giả thuyết:
 “Các giá trị trung bình bằng nhau”
 “Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:

Biện luận:
Nếu

=> Chấp nhận giả thiết H0

Giải toán trên Excel:
Nhập bảng số liệu như hình dưới:

Vào Data /Data analysis, chọn Anova: Single Factor rồi bấm OK

GVHD: PGS. TS. Nguyễn Đình Huy


Trang 24

Nhóm 1A


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Trên màng hình sẽ hiện lên hộp thoại của Anova: Single Factor
Ta nhập các thông số như hình dưới
• Phạm vi của biến số Y(Input Range): ta kéo chuột từ ô A1 tới ô I5
• Alpha: 0.05
• Group by: Rows
• Xuất kết quả (Output options): kích vào New Worksheet Ply

Ta được kết quả như sau:

Kết Quả Và Biện Luận
P-Value = 6.46E-10 < Alpha=0.05
GVHD: PGS. TS. Nguyễn Đình Huy

Trang 25


×