Tải bản đầy đủ (.doc) (5 trang)

Phân tích phương sai ANOVA

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (140.86 KB, 5 trang )

Bài 7 (TKYH)
I. GIỚI THIỆU
ANOVA là kỹ thuật thống kê được sử dụng khi chúng ta muốn so sánh số trung bình của
≥ 3 nhóm. Kỹ thuật này chia phưong sai của 1 quan sát (observation) thành 2 phần:
1
phương
sai giữa các nhóm (between groups) và
2
phương sai nội nhóm (within group). Do phưong sai
là độ phân tán tương đối của các quan sát so với số trung bình nên việc phân tích phương sai
giúp so sánh các số trung bình dễ dàng (bên cạnh việc so sánh các phương sai).
Phần này chỉ đề cập đến ANOVA một chiều (one-way ANOVA) theo đó các nhóm được
so sánh dựa trên 1 biến số (yếu tố).
II. NGUYÊN LÝ CỦA ANOVA
Thí dụ minh họa: Thời gian nằm viện của các bệnh nhân đã được tiểu phẫu không có biến
chứng được so sánh với nhau theo ba bác sĩ điều trị (A, B, C). Chọn 1 mẫu ngẫu nhiên bao
gồm 8 bệnh án cho từng bác sĩ, số liệu như sau:
Bảng 1. Thời gian nằm viện của bệnh nhân theo bác sĩ điều trị
A A
2
B B
2
C C
2
4 16 4 16 5 25
5 25 5 25 3 9
5 25 4 16 3 9
4 16 3 9 3 9
6 36 4 16 3 9
6 36 5 25 3 9
4 16 3 9 4 16


5 25 3 9 5 25
∑A = 39 ∑A
2
= 195 ∑B = 31 ∑B
2
= 125 ∑C = 29 ∑C
2
= 111
4,875A =
3,875B =
3,625C =
4,125X =
Biến số (yếu tố) để so sánh chỉ độc nhất là thời gian nằm viện của bệnh nhân (tính bằng
ngày). Số liệu được phân bố với các ký hiệu như sau:
B/n của BS. A: x
1A
= 4, x
2A
= 5, …………………………… , x
8A
= 5
B/n của BS. B: x
1B
= 4, x
2B
= 5, …………………………… , x
8B
= 3
B/n của BS. C: x
1C

= 5, x
2C
= 3, …………………………… , x
8C
= 5
ij
x
: quan sát thứ i thuộc nhóm j
X
: đại trung bình (số trung bình tính được từ 24 b/n)
, ,A B C
: số trung bình của các nhóm A, B, và C (tính từ 8 b/n của mỗi nhóm)
1
PHÂN TÍCH PHƯƠNG SAI
(ANALYSIS OF VARIANCE/ANOVA)
Chọn x
2A
làm mẫu:
(x
2A

X
) = (5 – 4,125) = 0,875
Hiệu 0,875 có thể được tách ra làm 2:
(x
2A

X
) = (x
2A


A
) + (
A X−
) = (5 – 4,875) + (4,875 – 4,125)
= (0,125) + (0,750) = 0,875
ANOVA xem xét biến thiên của tất cả các quan sát với số đại trung bình và phân chúng ra
làm 2: biến thiên nội nhóm và biến thiên giữa các nhóm. Nếu số trung bình của các nhóm
khác nhau nhiều thì sự biến thiên giữa chúng và đại trung bình (biến thiên giữa các nhóm)
sẽ đáng kể hơn so với các biến thiên giữa các quan sát trong 1 nhóm với trung bình của nhóm
(biến thiên nội nhóm). Nếu số trung bình của các nhóm không khác nhau nhiều thì biến thiên
giữa các nhóm sẽ không lớn hơn so với biến thiên nội nhóm. Phép kiểm định giả thuyết về 2
phương sai, F test, có thể được sử dụng để kiểm định tỉ số phương sai giữa các nhóm và
phương sai nội nhóm. Giả thuyết trống của F test cho rằng 2 phương sai này bằng nhau; nếu
H
0
đúng thì có nghĩa là biến thiên giữa các nhóm sẽ không lớn hơn so với biến thiên nội
nhóm. Trong tình huống này, không thể kết luận là các trung bình khác lẫn nhau (không có 1
cặp trung bình nào khác nhau). Ngược lại, nếu từ chối được H
0
thì kết luận được là không
phải tất cả các trung bình đều bằng nhau (có ít nhất 1 cặp trung bình khác nhau).
III. CÁCH TÍNH TRONG ANOVA
+ Tính phương sai giữa các số trung bình nhóm so với đại trung bình:

2
( )
1 1
j
j

n x X
SSB
j j
Σ −
=
− −
2
Biến
thiên
giữa 1
quan sát
thuộc
nhóm A
và đại
trung
bình
Biến
thiên
giữa 1
quan sát
thuộc
nhóm A
và trung
bình của
nhóm A
Biến thiên giữa
trung bình của
nhóm A và đại
trung bình
Ước lượng

phương sai giữa
các nhóm
Tổng bình phương giữa
các nhóm (Sum of
Squares Between–SSB)
Trung bình bình phương
giữa các nhóm (Mean square
between groups – MSB)

+ Tính phương sai giữa các quan sát trong từng nhóm so với số trung bình của nhóm:
2
( 1)
( 1)
j j
j
n s
SSW
n N j
Σ −
=
Σ − −
+ Lập tỉ số phương sai (VR = F ratio): V.R =
MSB
MSW
IV. PHÉP KIỂM ANOVA
Với thí dụ minh họa trên: Thời gian nằm viện của b/n theo các bác sĩ A, B, C có khác nhau?
1/ Số liệu: bao gồm 1 biến số liên tục (như đã cho)
2/ Giả định: + Thời gian nằm viện (theo 3 BS) phân phối bình thường.
+ Phương sai của các dân số (thời gian nằm viện theo A, B, C) bằng nhau
+ Các mẫu được rút ngẫu nhiên và độc lập.

3/ Giả thuyết:
H
0
: μ
A
= μ
B =
μ
C
H
A
: Có ít nhất 1 cặp μ khác nhau

A ≠
μ
B
hoặc

μ
B ≠
μ
C
hoặc μ
A ≠
μ
C
)
α = 0,05
4/ Số TKKĐ:
V.R =

MSB
MSW
với
5/ PP. của số TKKĐ: Khi H
0
đúng, số TKKĐ sẽ có phân phối F với (3 – 1) độ tự do tử
số và (24 – 3) độ tự do mẫu số.
6/ Qui tắc quyết đònh: Đặt α = 0,05. Giá trò tới hạn của F (tra bảng) bằng 3,47. Từ chối
H
0
nếu V.R. ≥ 3,47.
7/ Tính số TKKĐ : V.R =
MSB
MSW

Tính
2
( )
1 1
j
j
n x X
SSB
MSB
j j
Σ −
= =
− −
2 2 2
[8(4,875 4,125) ] [8(3,875 4,125) ] [8(3,625 4,125) ] 4,5 0,5 2,0

3,5
3 1 2
MSB
− + − + − + +
= = =

3
Ước lượng
phương sai nội
nhóm

Tổng bình phương nội
nhóm (Sum of Squares
Within – SSW)
Trung bình bình phương nội
nhóm (Mean square within
groups – MSW)
j – 1 df
N– j df
Tính
2
( 1)
( 1)
j j
j
n s
SSW
MSW
n N j
Σ −

= =
Σ − −
2 2 2
[(8 1)0,8345 ] [(8 1)0,8345 ] [(8 1)0,9161 ]
24 3
MSW
− + − + −
=

4,875 4,875 5,875
0,74
21
MSW
+ +
= =
V.R =
3,5
4,73
0,74
=
8/ Quyết định thống kê: Từ chối H
0
vì V.R = 4,73 >3,47
9/ Kết luận: Có ít nhất 1 cặp μ khác nhau. p = 0,021
Cách trình bày kết quả ANOVA
Bảng 2. Kết quả so sánh thời gian nằm viện trung bình của b/n thuộc các BS điều trị A, B, C
Tổng bình phương
(Sum of Squares)
Độ tự do
(df)

Trung bình
bình phương
(Mean square)
F
(V.R)
Giá
trị
p
Giữa các nhóm
(Between groups)
7,000 2 3,500 4,704 0,021
Nội nhóm
(Within groups)
15,625 21 0,744
Tổng
(Total)
22,625 23
V. KỸ THUẬT HẬU KIỂM (Post hoc procedures)
Kết quả của ANOVA không cho biết cặp nào của μ khác nhau. Việc tiến hành các kỹ
thuật hậu kiểm sẽ giúp kết luận về việc này. Phần này sẽ giới thiệu 2 phép hậu kiểm: Tukey’s
HSD test (Honestly Significant Difference) sử dụng cho trường hợp các mẫu bằng nhau, và
Scheffé test sử dụng cho trường hợp các mẫu không bằng nhau.
1/ Tukey’s HSD test
Số TKKĐ của HSD:
( )q a
MSW
HSD Multiplier
n
=
MSW: Trung bình bình phương giữa các nhóm

a: số lượng số trung bình cần so sánh
q: df của MSW
4
Tính số TKKĐ:
+ Với 3 số trung bình cần so sánh và 21 df (của SMW) ở ngưỡng α = 0,05, tra bảng để
có multiplier (bội số) là khoảng 3,55;
+ MSW = 0,74;
+ n = 8
0,74
3,55 1,08
8
HSD = =

Hiệu giữa 2 số trung bình ít nhất phải bằng 1,08 thì mới được xem là có sự khác biệt có ý
nghĩa thống kê (ở ngưỡng 0,05).
Như vậy:
4,875 3,875 1,000A B− = − =
μ
A
= μ
B
3,875 3,625 0,250B C− = − =
μ
B
= μ
C
4,875 3,625 1,250A C− = − =
μ
A
≠ μ

C
Kết luận: Thời gian nằm viện trung bình của b/n thuộc BS. A khác có ý nghĩa thống kê với
thời gian nằm viện trung bình của b/n thuộc BS. C.
2/ Scheffé test
Số TKKĐ:
2
1 2
1 2 1 2
( )
( ) /
X X
F
MSW n n n n

=
+
Với
A

B
:
2
(4,875 3,875)
5, 41
0,74(8 8) / 64
F

= =
+
Với

B

C
:
2
(3,875 3,625)
0,34
0,74(8 8) / 64
F

= =
+
Với
A

C
:
2
(4,875 3,625)
8, 45
0,74(8 8) / 64
F

= =
+
Giá trị tới hạn của F được tính bằng cách lấy số nhóm trừ 1 (3-1) rồi nhân cho giá trị tới hạn
của F đã tính được trong phép kiểm ANOVA (4,73).
F (tới hạn) = 2 x 3,47 = 6,94
Sự khác biệt giữa 2 số trung bình được xem là có ý nghĩa thống kê khi F tính được lớn hơn
6,94. Như vậy chỉ có cặp

A

C
thỏa điều kiện này. Kết luận tương tự như kết luận trong
Tukey’s HSD test.


5

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×