Tải bản đầy đủ (.ppt) (26 trang)

Bài giảng môn Nguyên lý thống kê kinh tế - Phân tích phương sai (ANOVA)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (195.28 KB, 26 trang )


PHÂN TÍCH PHƯƠNG SAI
( Analysis of variance – ANOVA)

MỞ ĐẦU:
Một công ty chuẩn bị xuất bản 4cuốn sách
hướng dẫn học một ngôn ngữ lập trình mới,
công ty muốn biết sách hướng dẫn nào thật sự
tốt. Để làm điều đó, công ty chọn 160 kỹ sư của
công ty và chia làm 4 nhóm cỡ 40. Mỗi nhóm sẽ
học 1 cuốn sách và sau đó làm bài kiểm tra. Dựa
vào kết đó đánh giá các cuốn sách và chọn 1
cuốn sách tốt nhất.

MỞ ĐẦU:
Giả sử là điểm cho các cá thể có phân
phối chuẩn. Ký hiệu , i= 1,…,4; j=1,
…,40 điểm kiểm tra của kỹ sư thứ j trong
nhóm i.
Giả sử độc lập và


ij
x
chưa biết
Cần kiểm định giả thuyết:
ij
x
( )
2
ij


;
i
x N
µ σ
:
ij
x
i
µ
2
,
σ
0 1 2 3 4
:H
µ µ µ µ
= = =
Bằng cách nào để kiểm định giả thuết này?

ANOVA một nhân tố:
Phân tích phương sai một yếu tố là phân
tích ảnh hưởng của một yếu tố nguyên nhân
(định tính) ảnh hưởng đến một yếu tố kết quả
(định lượng) đang nghiên cứu.

I. Trường hợp k tổng thể có phân phối chuẩn và
phương sai bằng nhau:
Giả sử ta muốn so sánh trung bình của k
tổng thể có phương sai bằng nhau dựa trên
những mẫu ngẫu nhiên độc lập gồm n
1

, n
2
, …,
n
k
quan sát từ k tổng thể khác nhau có phân phối
chuẩn. Ký hiệu , i= 1,…,k là trung bình của
các tổng thể
Cần kiểm định giả thuyết:
i
µ
Để kiểm định giả thuết này ta thực hiện như sau:
0 1 2
:
k
H
µ µ µ
= = =
K

Bước 1: Tính các trung bình mẫu
Xét bảng số liệu
Tổng thể
1 2 … k
x
11
x
12

x

1n1
x
21
x
22

x
2n2




x
k1
x
k2

x
knk
( )
i
n
ij
j=1
1
1, ,
i
i
x x i k
n

= =

Các trung bình mẫu:
Trung bình chung k mẫu:
k k
i
i=1 i=1
1
 
= =
 ÷
 
∑ ∑
i i
x n x n n
n

Bước 2: Tính các tổng các độ lệch bình phương
1
w
k
i
i
SS SS
=
=

( )
( )
2

ij
1
1, ,
i
n
i i
j
SS x x i k
=
= − =

Tổng các độ lệch bình phương của từng nhóm:
Hoặc tính trực tiếp:
Tổng các độ lệch bình phương trong nội bộ các nhóm:
( )
2
ij
1 1
w
i
n
k
i
i j
SS x x
= =
= −
∑∑

Bước 2: Tính các tổng các độ lệch bình phương

Tổng các độ lệch bình phương giữa các nhóm:
Ta chứng minh được: SST = SSW + SSG
Tổng các độ lệch bình phương toàn bộ:
( )
2
1
k
i i
i
SSG n x x
=
= −

( )
2
ij
1 1
i
n
k
i j
SST x x
= =
= −
∑∑

Bước 3: Tính các phương sai:
MSw
MSG
F

=
w
w
n - k
SS
MS
=
k-1
SSG
MSG
=
Phương sai trong nội bộ nhóm:
Phương sai giữa các nhóm:
Bước 4: tính tỷ số F
Bác bỏ giả thuyết H
0
cho rằng cho rằng trung
bình của k tổng thể đều bằng nhau khi
1,k n k
F F
α
− −
>

Dạng bảng kết quả ANOVA từ chương trình Exel,SPSS
Nguồn
biến thiên
Tổng các độ
lệch bình
phương(SS)

Bậc tự
do(df)
Phương
sai (MS)
Tỉ số F
Giữa các
nhóm
SSG k-1
Trong nội
bộ các
nhóm
SSW n-k
Toàn bộ SST n-1
k-1
SSG
MSG
=
w
w
n - k
SS
MS
=
MSw
MSG
F
=

Dạng bảng kết quả ANOVA từ chương trình Exel,SPSS
Source of

variance
Sum of
squares
(SS)
Degree of
Fredom
(df)
Mean of
squares
(MS)
F Ratio
Between-
groups
SSG k-1
Within-
groups
SSW n-k
Total SST n-1
k-1
SSG
MSG
=
w
w
n - k
SS
MS
=
MSw
MSG

F
=

Ví dụ 1:
Ban giám hiệu một trường đại học muốn nghiên cứu
ảnh hưởng của việc đi làm thêm đến kết quả học tập
của sinh viên. Một trong những nội dung nghiên cứu
đề tài này là xem xét thời gian đi làm thêm khác nhau
có ảnh hưởng đến kết quả học tập của sinh viên như
nhau không. Thực hiện cuộc khảo sát với 120 sinh
viên, có 22 sinh viên cho biết có công việc làm thêm
đều đặn ít nhất là 16 tuần trong năm học qua. Trong
đó, có 7 sinh viên có thời gian làm thêm dưới
6giờ/tuần; 7 sinh viên có thời gian làm thêm khoảng 6
đến 12giờ/tuần; 8 sinh viên có thời gian làm thêm trên
12giờ/tuần. Dữ liệu về kết quả trung bình học tập của
năm học vừa qua do phòng đào tạo nhà trường cung
cấp được trình bày trong bảng sau:

Điểm trung bình học tập của các sinh viên đi làm thêm
Nhóm 1
(TG làm thêm
dưới 6giờ/tuần)
Nhóm 2
(TG làm thêm từ 6 đến
12giờ/tuần)
Nhóm 3
(TG làm thêm
trên 12giờ/tuần)
6.3

7.0
6.5
6.6
7.2
6.9
6.4
7.2
6.6
6.1
5.8
6.8
7.1
5.9
6.3
5.8
6.0
5.5
5.2
6.5
5.3
6.2
46.9 45.5 46.8

Giải
, i= 1, 2, 3 lần lượt là điểm trung bình của 3
nhóm sinh viên có thời gian đi làm thêm khác
nhau Cần kiểm định giả thuyết:
0 1 2 3
:H
µ µ µ

= =
1
46.9
6.7
7
x = =
2
45.5
6.5
7
x = =
i
µ
Bước 1: Tính TB từng nhóm và TB chung cả 3 nhóm
3
46.8
5.85
8
x = =
7 6.7 7 6.5 8 5.85
6.3273
7 7 8
x
× + × + ×
= =
+ +
Nhóm 1:
Nhóm 2:
Nhóm 3:
Cả 3 nhóm:


Bước 2: Tính tổng các độ lệch bình phương
Nhóm 1:
Nhóm 2:
Nhóm 3:
( ) ( ) ( )
2 2 2
1
6.3 6.7 7.0 6.7 6.4 6.7 0.68SS
= − + − + + − =
( ) ( ) ( )
2 2 2
2
7.2 6.5 6.6 6.5 5.9 6.8 1.96SS
= − + − + + − =
( ) ( ) ( )
2 2 2
3
6.3 5.85 5.8 5.85 6.2 5.85 1.62SS
= − + − + + − =
w = 0.68+1.96+1.62=4.26SS

( ) ( ) ( )
2 2 2
7 6.7 6.3273 7 6.5 6.3273 8 5.85 6.3273 3.004SSG
= − + − + − =
Tính tổng các độ lệch bình phương nội bộ 3 nhóm
Tính tổng các độ lệch bình phương giữa các nhóm

Bước 3: Tính các phương sai

Phương sai trong nội nhóm
1.502
6.7
MSw 0.224
= = =
MSG
F
w 4.26
w 0.224
n - k 22 3
SS
MS
= = =

3.004
1.502
k-1 3 1
SSG
MSG = = =

Phương sai giữa các nhóm
Bước 4: Tính tỉ số F
1, 2,19
0.05
3.52
k n k
F F
α
− −
= =

Tra bảng phân phối F
Vì F = 6.7 > 3.52 cho nên dựa trên dữ liêu thu thập, ta
có thể bác bỏ giả thuyết H
0
cho rằng điểm trung bình
học tập của 3 nhóm sinh viên là bằng nhau,với mức ý
nghĩa 5%.

Ví dụ 2:Một quản trị Marketing muốn xem xét chi phí bán
hàng trung bình trên tháng của một sản phẩm điện tử ở
ba cửa hàng khác nhau. Số liệu như trong bảng sau:
Chi phí bán hàng trung bình/sản phẩm của ba cửa hàng A, B và
C bằng nhau ?

Ví dụ 3:
Có 3 loại xăng, 18 ôtô chạy với tốc độ không đổi. 6
ôtô dùng 3 loại xăng và đo quãng được chạy được:
Loại 1 Loại 2 Loại 3
220
252
238
246
260
224
244
236
258
242
221
230

254
272
232
238
256
250
1440 1431 1502
Xăng có ảnh hưởng đến quãng đường đi được của ôtô?

II Trường hợp các tổng thể được giả định có phân
phối bất kỳ

sử dụng biến W thay cho tỉ số F trong phần tính
toán giá trị kiểm định.
2
1
12
3( 1)
( 1)
n
i
i
i
R
W n
n n n
=
= − +
+


Giả thuyết H
0
bị bác bỏ khi
2
1,
w
α
χ

>
k

II Trường hợp cá tổng thể được giả định có phân phối bất kỳ
= 11,10
2
w>
χ
2;0,5%
= 10,6
Ta có
nên giả thuyết H
0
bị bác bỏ

Phân tích phương sai hai chiều
(1 ô có 1 quan sát)

Phân tích phương sai hai chiều
(1 ô có 1 quan sát)
1 k 1,(k 1)(h 1),

F F
α
− − −
>
1. Giả thuyết H0 cho rằng trung bình của tổng thể
theo chỉ tiêu cột thì bằng nhau, có thể bị bác bỏ
khi:
2. Giả thuyết H0 cho rằng trung bình của tổng
thể theo chỉ tiêu hàng thì bằng nhau, có thể
bị bác bỏ khi:
1 h 1,(k 1)(h 1),
F F
α
− − −
>

VD

Phân tích phương sai hai chiều
(1 ô có nhiều quan sát)

1 k 1,(k 1)(h 1),
F F
α
− − −
>
1. Giả thuyết H0 cho rằng trung bình của tổng thể
theo chỉ tiêu cột thì bằng nhau, có thể bị bác bỏ
khi:
2. Giả thuyết H0 cho rằng trung bình của tổng

thể theo chỉ tiêu hàng thì bằng nhau, có thể
bị bác bỏ khi:
1 h 1,(k 1)(h 1),
F F
α
− − −
>

×