Tải bản đầy đủ (.doc) (26 trang)

báo cáo bài tập lớn môn xác suất thống kê học kỳ hè 2012

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (709.83 KB, 26 trang )

Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

BÁO CÁO BÀI TẬP LỚN
MÔN XÁC SUẤT THỐNG KÊ
HỌC KỲ HÈ 2012

Mục lục:
Bài 1:
Ví dụ 3.4:............................................................................. 02
Ví dụ 4.2:............................................................................. 04
Bài 2:........................................................................................ 11
Bài 3:........................................................................................ 13
Bài 4:........................................................................................ 16
Bài 5:........................................................................................ 20

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 1


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Bài 1: Trình bài lại ví dụ 3.4 trang 207 và ví dụ 4.2 trang 216 sách bài tập Xác suất thống kê 2012
(Nguyễn Đình Huy)
Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH
(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Yếu tố


A
A1
A2
A3
A4

Yếu tố B
B1
C1
C2
C3
C4

B2
9
12
13
10

B3

C2
C3
C4
C1

14
15
14
11


C3
C4
C1
C2

B4
16
12
11
13

C4
C1
C2
C3

12
10
14
13

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
Bài làm:


Ta giả thiết:
H0: Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) bằng nhau.
H1: Có ít nhất hai giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) khác
nhau.


Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để kết luận ảnh hưởng của
các yếu tố đến hiệu suất của phản ứng.
• Cơ sở lý thuyết:
Khi phân tích phương sai ba yếu tố ta thường dung mô hình vuông La tinh có dạng như sau:
Yếu tố
A
A1
A2
A3
A4
T.i.

Yếu tố
B
B1
C1
C2
C3
C4

B2
Y111
Y212
Y313
Y414
T.1.

C2
C3

C4
C1

B3
Y122
Y223
Y324
Y421
T.2.

C3
C4
C1
C2

B4
Y133
Y234
Y331
Y432
T.3.

C4
C1
C2
C3

Y144
Y241
Y342

Y443
T.4.

Ti..
T1..
T2..
T3..
T4..

Bảng ANOVA:
Nguồn sai
số

Bậc tự do

Yếu tố A
(hàng)

r-1

Yếu tố B
(cột)

r-1

Bình phương trung
bình

Giá trị thống kê


SSR =

MSR = SSR / (r - 1)

FR = MSR / SSE

SSC =

MSC = SSC / (r - 1)

FC = MSC /SSE

Tổng số bình phương

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 2


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Yếu tố C

r-1

Sai số

(r-1)(r-2)

Tổng
cộng


r2 - 1

MSF = SSF / (r - 1)

SSF =

SSE = SST – (SSF + SSR + SSC)

SST =

Giải toán trên Excel:
Nhập dữ liệu vào bảng như sau:



Tính các giá trị Ti… T.j. T..k và T
Các giá trị Ti..
Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8
Các giá trị T..k
Chọn ô B9 và nhập biểu thức =SUM(B2;C5;D4;E3)
Chọn ô C9 và nhập biểu thức =SUM(B3;C2;D5;E4)
Chọn ô D9 và nhập biểu thức =SUM(B4;C3;D2;E5)
Chọn ô E9 và nhập biểu thức =SUM(B5;C4;D3;E2)

Giá trị T…
Chọn ô B10 và nhập biểu thức =SUM(B5;C4;D3;E2)



Tính các giá trị và
-

Các giá trị



Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9
-

Giá trị
Chọn ô G10 và nhập biểu thức =POWER(B10,2)

GVHD: PGS. TS. Nguyễn Đình Huy

Nhóm 1A

Trang 3

MSE =

F = MSF / SSE



Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê






Nhóm 1A

Giá trị

Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC, SSF, SST và SSE
- Các giá trị SSR, SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9
- Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
- Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF, và MSE
- Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhập biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9
- Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính giá trị G và F
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9


Kết quả và biện luận:
FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận H0 (pH)
Fc = 11,95 < F0.05(3.6) =4,76 => Bác bỏ H0 (Nhiệt độ)
F = 30,05 < F0.05(3.6) =4,76 => Bác bỏ H0 (Chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất.
Ví dụ 4.2: Người ta dung ba mức nhiệt độ gồm 105, 120 và 135oC kết hợp với ba khoảng thời gian là
15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình
bày trong bảng sau đây:
Thời gian (phút)
X1
15
30
60
15
30
60
15
30
60

Nhiệt độ (oC)
X2
105
105
105
120
120
120
135
135

135

Hiệu suất (%)
Y
1.87
2.02
3.28
3.05
4.07
5.54
5.03
6.45
7.26

Hãy cho biết yếu tố nhiệt độ hoặc yếu tố thời gian có liên quan tính tuyến với hiệu suất của phản ứng
tổng hợp? Nếu có thì điều kiện nhiệt độ 115oC trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao
nhiêu?
Bài làm:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 4


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê


Nhóm 1A

Ta giả thiết:

H0: Phương trình hồi quy không thích hợp.
H1: Phương trình hồi quy thích hợp.

Ta tìm phương trình hồi quy tính tuyến đa tham số để chỉ ra sự phụ thuộc hoặc không phụ thuộc giữa
yếu tố thời gian (X1) và nhiệt độ (X2) với hiếu suất phản ứng tổng hợp (Y).


Cơ sở lý thuyết:
Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số độc lập X i (i=1,2,...,k):
B0 + B1X1 + B2X2 + … + BkXk

Bảng ANOVA:
Nguồn sai
số

Bậc tự do

Tổng số bình phương

Bình phương trung bình

Giá trị thống kê

Hồi quy

k

SSR

MSR = SSR / k


F = MSR / MSE

Sai số

N-k-1

SSE

MSE = SSE / (N - k - 1)

Tổng
cộng

N-1

SST = SSR + SSE

Giá trị thống kê:


Giá trị R-bình phương:
Giá trị R2:
(R3 ≤ 0.81 là khá tốt)
Giá trị R2 được hiệu chỉnh (Adjusted R Square)

sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ


Độ lệch chuẩn:

(S ≤ 0.30 là khá tốt)

Trắc nghiệm thống kê:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 5


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê


Trắc nghiệm t:
Bậc tự do của t:

=N-k-1

;


Trắc nghiệm F:
Bậc tự do của giá trị F: v1 = 1, v2 = N -k - 1

Giải toán trên Excel:
Nhập dữ liệu theo cột:

Sử dụng Regression: Data -> Data Analysis

Trong cửa sổ Data Analysis chọn Regression:


GVHD: PGS. TS. Nguyễn Đình Huy

Trang 6

Nhóm 1A


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Hồi quy theo Thời gian (X1):
Các thông số:
-

Input Y Range: Phạm vi biến số Y
Input X Range: Phạm vi biến số X
Labels: Dữ liệu bao gồm nhãn
Confidence Level: Mức tin cậy (chọn 95%)
Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời gian)

Kết quả:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 7


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê


Nhóm 1A

Phương trình hồi quy:
YX1 = f(X1) = 2.7667 + 0.0445X1 với R2 = 0.2139 và S = 1.8112
t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay

= 0.0708 > α = 0.05

 Nên chấp nhận giả thiết H0.
t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05
 Nên chấp nhận giả thiết H0.
F = 1.9049 <

= 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay

= 0.2100 > α = 0.05

 Nên chấp nhận giả thiết H0.
Vậy phương trình hồi quy trên không có ý nghĩa thống kê.
Kết luận: Yếu tố thời gian không có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.

Hồi quy theo Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là $B$1:$B$10
Kết quả:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 8



Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Phương trình hồi quy:
YX2 = f(X2) =11.1411 + 0.1286X2 với R2 = 0.7638 và S = 0.9929
t0 = 3.4179 > t0.05 = 2.365 hay

= 0.0112 < α = 0.05

 Nên bác bỏ giả thiết H0.
t1 = 4.7572 > t0.05 = 2.365 hay PV = 0.0021 < α = 0.05
 Nên bác bỏ giả thiết H0.
F = 22.6309 >

= 5.590 hay

= 0.0021 < α = 0.05

 Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê.
Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.

Hồi quy theo Thời gian (X1) và Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là $A$1:$B$10
Kết quả:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 9



Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Phương trình hồi quy:
YX1, X2 = f(X1,X2) = -12.7000 + 0.0445X1 + 0.1286X2 với R2 = 0.9777 và S = 0.3297
t0 = 11.5283 > t0.05 = 2.365 hay

= 2.5607E-05 < α = 0.05

 Nên bác bỏ giả thiết H0.
t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05
 Nên bác bỏ giả thiết H0.
t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05
 Nên bác bỏ giả thiết H0.
F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS = 0.0021 < α = 0.05
 Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê.
Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là thời gian và nhiệt độ.
Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X1 + 0.1286X2:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 10


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê


Nhóm 1A

Vẽ biểu đồ: chọn ô C2, vào Insert -> Scatter -> Scatter with only Maker

Hàm lượng dự đoán (Y’)

Sự tính tuyến của phương trình hồi quy YX1, X2 = -12.7000 + 0.0445X1 + 0.1286X2 có thể được trình
bày trên biểu đồ phân tán:

Hàm lượng thực nghiệm (Y)
Dự đoán hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian (X 1) 50 phút, nhiệt độ
(X2) 115oC:
Công thức ô E3:
=B1+B2*E1+B3*E2
Kết quả: 4.3109

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 11


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Bài 2: Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỷ lệ
những người đi làm bằng xe máy, xe đạp và buýt. Việc điều tra được tiến hành trên hai
nhóm. Kết quả như sau:
Nữ
Nam


Xe máy
25
75

Buyt
100
120

Xe đạp
125
205

Với mức ý nghĩa α = 5%, hãy nhận định xem có sự khác nhau về cơ cấu sử dụng các
phương tiện giao thông đi làm trong hai nhóm công nhân nam và công nhân nữ hay
không.
Bài làm:




Ta giả thiết:
Ho: Cơ cấu sử dụng phương tiện giao thông của công nhân nam và công nhân nữ không khác
nhau.
Cơ sở lý thuyết:
Giá trị thống kê:

Oi - các tần số thực nghiệm (observed frequency)
Ei - các tần số lý thuyết (expected frequency)
Biện luận:

Nếu
Giá trị

=> bác bỏ giả thiết H0
tính theo biểu thức:

Oi - các tần số thực nghiệm của ô thuộc hàng i cột j
Ei - các tần số lý thuyết của ô thuộc hàng i cột j, r là số hàng và c là số cột
Xác xuất

với bậc tự do DF = (r - 1)(c - 1); trong đó r là số hàng và c là số cột

trong bảng VI
Nếu

=> Chấp nhận giả thiết H0 và ngược lại.

Giải toán trên Excel:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 12


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Nhập giá trị vào bảng tính:


Tính các tổng:








Tổng hàng:
Chọn E2 và nhập biểu thức =SUM(B2:D2)
Dùng con trỏ kéo nút tự điền từ E2 tới E3
Tổng cột:
Chọn B4 và nhập biểu thức =SUM(B2:B3)
Dùng con trỏ kéo nút tự điền từ B4 tới D4
Tổng cộng:
Chọn E5 và nhập biểu thức =SUM(B2:D3)
Tính các tần số lí thuyết:
Tần số lí thuyết = (tổng hàng x tổng cột) / tổng cộng.
Chọn ô B6 nhập công thức =B$4*$E2/$E$4, dùng con trỏ kéo nút tự điền từ ô B6 đến ô
D7

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 13


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

GVHD: PGS. TS. Nguyễn Đình Huy


Trang 14

Nhóm 1A


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Áp dụng hàm CHITEST:
Chọn B9 và nhập biểu thức =CHITEST(B2:D3,B8:D9)
Ta sẽ có được kết quả của
Biện luận:
= 0.0022 < α = 0.05 => Bác bỏ giả thuyết Ho
Kết luận:
Cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm công nhân nam và nữ khác nhau.
Bài 3: Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E yêu cầu những người
được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phối mà họ đang sống. Kết quả được cho như
sau:
Thành phố

Mức độ thỏa mãn
Rất thỏa mãn

Tương đối

Không

220

130
84
156
122

121
207
54
95
164

63
75
24
43
73

A
B
C
D
E

Với mức ý nghĩa α = 3%, kiểm định xem mức độ thỏa mãn cuộc sống có phân bố giống nhau trong 5 thành phố
trên hay không?
Bài làm:
Dạng bài: kiểm tra tính độc lập, sử dụng MS Excel để giải.
Sử dụng Excel
B1. Khởi động chương trình Excel
B2. Nhập bảng dữ liệu vào chương trình

B3. Thêm dòng tổng cột và dòng tổng hàng
B4. Tính tổng cột và tổng hàng

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 15


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 16

Nhóm 1A


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

B5. Tính tổng: nhập vào ô F9 =SUM(F4:F8)
Kết quả ta được:

B6. Tính bảng tần số lý thuyết: ɣij = mj*ni/n
Nhập vào ô C12 = C$9*$F4/$F$9)
Dùng con trỏ tự diền kéo từ ô C12 đến ô E16
Kết quả ta được:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 17


Nhóm 1A


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
B7. Nhấp chọn ô C17
Gọi hàm CHITEST để tính giá trị P
Nhập giá trị Actual_range: C4:E8
Nhập giá trị Expectd_range: C12:E16

Kết quả ta được:

Kết quả: P= 3.5299E-13
Biện luận:
= 3.5299E-13 < α = 0.03 bc bỏ giả thuyết H0

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 18

Nhóm 1A


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Kết luận:
Mức độ thỏa mãn cuộc sống phân bố khác nhau trong 5 thành phố trên.

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 19


Nhóm 1A


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Bài 4: Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội thành:
Quận nội thành

Ngày khảo sát
Thứ hai
Thứ ba
Thứ tư
Thứ năm
Thứ sáu
Thứ bảy

Q1

Q2

Q3

Q4

Q5

22

21
25
24
28
30

18
18
25
24
19
22

22
22
25
18
15
28

18
18
19
20
22
25

18
19
20

22
25
25

Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn α = 2%. Lượng báo bán ra có
chịu tác động của các yếu tố ngày trong tuần không?
Bài làm:
Cơ sở lí thuyết:
Phân tích phương sai hai yếu tố không lặp:
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Y ij
(i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
Mô hình:
Yếu tố A
1
2

r

Yếu tố B
1



2



Tổng cộng
Trung bình








c






Tổng cộng

Trung bình







Bảng ANOVA
Nguồn sai số

Bậc tự do

Yếu tố A
(hàng)


(r–1)

Tổng số bình phương
SSB =

GVHD: PGS. TS. Nguyễn Đình Huy

Bình phương trung
bình
MSB =

Trang 20

Giá trị thống kê

=


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Yếu tố B
( cột )

( c -1 )

Sai số

(r-1)(c-1)


Tổng cộng

( rc – 1)

MSF =

Nhóm 1A
=

SSF =
SSE = SST - (SSF + SSB)

SST =

MSB =

-

Giả thuyết:
 “Các giá trị trung bình bằng nhau”
 “Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:

Biện luận:
Nếu

=> Chấp nhận H0 (yếu tố A)

Nếu


=> Chấp nhận H0 (yếu tố B).

Giải toán trên Excel:

Áp dụng “Anova: Two-Factor Without Replication”
Vào Data -> Data Analysis. Chọn mục Anova: Two-Factor Without Replication. Chọn OK.

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 21


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định các chi tiết:




Phạm vi đầu vào (Input Range): $A$2:$F$8
Nhãn dữ liệu (Labels in First Row/Column)
Ngưỡng tin cậy (Alpha): 0.02 (mức ý nghĩa = 2%)

Nhấn OK. Ta được bảng sau:

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 22



Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Kết quả và biện luận:

FR = 3,5672 > F0.02 = 3,4817 =>không chấp nhận giả thiết H0(thứ)
→ Vậy lượng báo bán ra có sự khác nhau theo thứ.
FC = 2,4748< F0.02 = 3,7313=> chấp nhận giả thiết H0 (quận)
→ Vậy lượng báo bán ra theo quận không có sự khác nhau.

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 23

Nhóm 1A


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê

Nhóm 1A

Bài 5: Theo dõi ngẫu nhiên giá thuê nhà tại 5 thành phố (với điều kiện thuê nhà như nhau) thu được các
số liệu sau:
Thành phố A
Thành phố B
Thành phố C
Thành phố D
Thành phố E


900
625
415
410
340

1200
640
400
310
425

850
775
420
320
275

1320
1000
560
280
210

1400
690
780
500
575


1150
550
620
385
360

975
840
800
440

750
390

Hãy tìm P-value để kiểm định xem có sự khác biệt về giá thuê nhà ở 5 thành phố nói trên hay không.
Bài làm:
Nhận xét: Đây là bài toán phân tích phương sai một yếu tố
Giả thiết H0: không có sự khác biệt về giá thuê nhà ở 5 thành phố
Cơ sở lí thuyết:
Phân tích phương sai một yếu tố.
Sự phân tích này nhằm đánh giá sự ảnh hưởng của một yếu tố trên các giá trị quan sát Y i
(i=1,2,…,k)
Mô hình:
Yếu tố thí nghiệm
1



2




K








Tổng cộng
Trung bình



T




Bảng ANOVA
Nguồn sai số

Bậc tự do

Tổng số bình phương

Bình phương trung
bình

MSF =

Yếu tố

k-1

Sai số

N-k

SSF =
SSE = SST - SSF

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 24

MSB =

Giá trị thống kê
=


Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê
Tổng cộng

( rc – 1)

SST =


Giả thuyết:
 “Các giá trị trung bình bằng nhau”
 “Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:

Biện luận:
Nếu

=> Chấp nhận giả thiết H0

Giải toán trên Excel:
Nhập bảng số liệu như hình dưới:

Vào Data /Data analysis, chọn Anova: Single Factor rồi bấm OK

Trên màng hình sẽ hiện lên hộp thoại của Anova: Single Factor
Ta nhập các thông số như hình dưới
• Phạm vi của biến số Y(Input Range): ta kéo chuột từ ô A1 tới ô I5
• Alpha: 0.05
• Group by: Rows
• Xuất kết quả (Output options): kích vào New Worksheet Ply

GVHD: PGS. TS. Nguyễn Đình Huy

Trang 25

Nhóm 1A



×