Tải bản đầy đủ (.pdf) (6 trang)

PHÂN TÍCH PHƯƠNG SAI - PHƯƠNG PHÁP KIỂM ĐỊNH docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (594.06 KB, 6 trang )

1
Chương VI. PHÂN TÍCH PHƯƠNG SAI
Phương pháp kiểm định sẽ được mở rộng trong trường hợp so sánh trung bình của nhiều tổng
thể, được xây dựng trong việc xem xét các biến thiên (phương sai) của các giá trị trong nội bộ
nhóm. Do vậy, phương pháp kiểm định giả thuyết về sự bằng nhau của trung bình nhiều tổng thể
được gọi chung là phương pháp phân tích phương sai ANOVA.
1. Phân tích phương sai một yếu tố
Phân tích phương sai một yếu tố được sử dụng trong trường hợp chỉ có yếu tố nào đó được xem
xét nhằm xác định ảnh hưởng của nó đến một yếu tố khác.
Yếu tố được xem xét ảnh hưởng sẽ được dùng để phân loại các quan sát thành các nhóm khác
nhau.
Ví dụ: Một nghiên cứu được thực hiện nhằm xét xem phải chăng yếu tố thu nhập có ảnh hưởng
đến số tiền chi mua thực phẩm hàng tháng của các gia đình. Như vậy, dựa vào mức thu nhập, các
gia đình sẽ được chia thành các nhóm khác nhau, ghi nhận số tiền chi mua thực phẩm hàng
tháng, và so sánh số tiền chi mua thực phẩm hàng tháng trung bình theo các mức thu nhập khác
nhau này.
Nếu yếu tố thu nhập không ảnh hưởng thì trung bình của số tiền chi mua thực phẩm bằng nhau
của tất cả các nhóm.
Hay ngược lại, yếu tố thu nhập thực sự có ảnh hưởng, số tiền chi mua thực phẩm hàng tháng
trung bình của các gia đình có các mức thu nhập khác nhau sẽ không bằng nhau.
Tổng quát:
Giả sử ta có k- nhóm (mẫu); , ,…, quan sát được chọn ngẫu nhiên độc lập từ tổng thể
( , ,…, có thể khác nhau về kích thước).
Gọi , ,…, là các trung bình tổng thể;
là quan sát thứ của nhóm thứ .
Bảng các giá trị quan sát của nhóm
Nhóm
1
2

k




….
….
….
….

Với giả định các tổng thể phân phối chuẩn, có phương sai bằng nhau, các sai số là độc lập với
nhau, phân tích phương sai một yếu tố thực hiện như sau:
: = = … = ì ô ị ả ưở ở ế ố đ é
: ô ả ấ ả đề ằ
(
= 1,2,…,
)
2
B1. Tính giá trị trung bình cho từng nhóm;
̅ chung cho tất cả các nhóm.
=

; ̅ =

Trong đó =

.
B2. Gọi là sự biến thiên trong nội bộ từng nhóm;
là sự biến thiên giữa các nhóm;
là tổng bình phương các chênh lệch giữa từng quan sát với trung bình tất cả các
quan sát;
là sự biến thiên trong nội bộ nhóm .
= − ; = 1,2,…, .

=
là tổng bình phương các chênh lệch giữa từng quan sát với trung bình của nhóm mà quan
sát thuộc về.
thể hiện sự biến thiên do các yếu tố khác, không do yếu tố nghiên cứu (yếu tố dùng để phân
chia các nhóm).
=
(
− ̅
)
thể hiện sự biến thiên do sự khác nhau giữa các nhóm, tức là biến thiên do yếu tố nghiên
cứu (yếu tố dùng để phân chia các nhóm).
= + .
Công thức này chính là cơ sở của phương pháp phân tích phương sai một yếu tố:
Biến thiên của các quan sát so với giá trị trung bình là tổng cộng của biển thiên được giải thích
bởi yếu tố nghiên cứu ( )và biến thiên do các yếu tố khác, không nghiên cứu ( ).
B3. Tính các ước lượng cho phương sai chung của tổng thể
=

; =
−1
3
Nếu giả thuyết đúng, ta có hai giá trị ước lượng cho phương sai chung của tổng thể.
Do đó, tỷ số và có thể dùng làm căn cứ để kết luận về giả thuyết .
 Nếu đúng, nghĩa là trung bình của tổng thể bằng nhau, thì tỷ số sẽ gần với giá
trị 1.
 Ngược lại, khi trung bình của tổng thể không bằng nhau thì lớn hơn thì tỷ
số sẽ lớn hơn 1.
B4. Tính giá trị kiểm định = .
Quy tấc quyết định: Bác bỏ ở mức ý nghĩa , nếu >
, ,

; trong đó
, ,

phân phối Fisher với ( −1) bậc tự do của tử số và ( − )bậc tự do của mẫu số.
Bảng phân tích phương sai thường được phân tích bằng máy tính với các phần mềm thông dụng
như Excel, SPSS, Eview dưới dạng bảng sau:
Source (biến thiên)
D. F
(bậc
tự do)
Sum of
Squares (tổng
các chênh
lệch bình
phương)
Mean Squares
(trung bình các
chênh lệch bình
phương -
phương sai)
Ratio
(giá trị kiểm
định )
F Prob.
(giá trị −
của kiểm
định )
Between Groups
(giữa các nhóm)
−1

=
−1
=
− =
, ,
>
Within Groups
(trong nội bộ nhóm)

=

Total (tổng)
−1
Vấn đề đặt ra là một khi giả thuyết cho rằng trung bình của tổng thể bằng nhau bị bác bỏ thì
chấp nhận . Vậy trung bình của những tổng thể nào thì khác nhau, tổng thể nào có trung bình
lớn hơn hay nhỏ hơn?
Ở đây ta đề cập đến phương pháp Tukey so sánh từng cặp trung bình tổng thể với nhau.
2. So sánh từng cặp trung bình tổng thể: kiểm định Tukey
Do so sánh từng cặp trung bình tổng thể nên ta có tất cả bài toán kiểm định trung bình tổng
thể như sau:
: =
: ≠
(1,2) ;
: =
: ≠
(1,3) ;…;
: =
: ≠
( −1, )
Tính giá trị kiểm định = − ; ∀ , = 1,2,…,

4
Tiêu chuẩn so sánh
=
, ,
Trong đó
, ,
là giá trị tra bảng phân phối ở mức ý nghĩa ;
với bậc tự do tương ứng là và
(

)
;
= min{ ; ;…; }.
Quy tắc quyết định: Bác bỏ trong bài toán
(
,
)
ở mức ý nghĩa nếu > .
3. Phân tích phương sai với mẫu ngẫu nhiên theo khối
Đối với phương pháp phân tích phương sai ở trên đánh giá sự khác nhau giữa trung bình của
tổng thể được thực hiện dưới hình thức ngẫu nhiên hoàn toàn, vì các giá trị quan sát của mẫu
hoàn toàn được chọn một cách ngẫu nhiên độc lập từ tổng thể.
Giả sử ta có mẫu các giá trị quan sát với nhóm (xét theo yếu tố nghiên cứu) và khối (xét
theo khối).
Khi đó ta có tất cả . = ô giá trị quan sát; vì mỗi ô chỉ có 1 giá trị quan sát nên ta sẽ có giá
trị quan sát.
Gọi là giá trị quan sát ứng với nhóm , khối .
Bảng giá trị quan sát trong phân tích ANOVA với nhóm và khối.
Khối
Nhóm

1
2

1
2



….
….
….
….

Phân tích phương sai với nhóm, khối được thực hiện như sau:
Giả thuyết : trung bình của tổng thể (xét theo yếu tố nghiên cứu) thì bằng nhau, nghĩa là
: = = = .
(Ta cũng có thể kiểm định giả thuyết : trung bình của tổng thể (xét theo khối) thì bằng
nhau, nghĩa là : = = = .)
B1. Tính các giá trị trung bình nhóm ̅ (xét theo cột); ̅ (xét theo dòng); ̅ (xét theo cả dòng và
cột).
=

; =

; ̅ =

=

5
B2. Tính các đại lượng

thể hiện sự biến thiên do khác biệt giữa các nhóm xét theo yếu tố nghiên cứu
=
(
− ̅
)
thể hiện sự biến thiên do khác biệt giữa các khối
= − ̅
thể hiện sự biến thiên do các yếu tố khác không nghiên cứu, không thể giải thích bởi các
nhóm hay các khối
= − − + ̅
Khi đó ta có = + + . Đây chính là cơ sở phân tích phương sai hai yếu tố (khối
được xem như là yếu tố thứ hai, nhưng với giả định là không có sự tương tác giữa các nhóm và
khối, nghĩa là sự khác nhau giữa các nhóm được giả định không đổi ở tất cả các khối).
B3. Tính các đại lượng trung bình
=
−1
; =
−1
; =
(
−1
)(
−1
)
B4. Tính các giá trị kiểm định = và = .
Quy tắc quyết định: Bác bỏ : = = = ở mức ý nghĩa nếu
>
,
( )( )
,

; trong đó
,
( )( )
,
có phân phối Fisher với ( −1) bậc tự do của
tử số và
(
−1
)(
−1
)
bậc tự do của mẫu số.
(Bác bỏ : = = = ở mức ý nghĩa nếu >
,
( )( )
,
; trong đó
,
( )( )
,
có phân phối Fisher với ( −1)bậc tự do của tử số và
(
−1
)(
−1
)
bậc
tự do của mẫu số).
6
Biến thiên

Tổng các chênh
lệch bình
phương
Bậc tự do
Trung bình các chênh lệch
bình phương (phương sai)
Giá trị
kiểm định
Giữa các nhóm
−1
=
−1
=
Giữa các khối
−1
=

=
Sai số
(
−1
)(
−1
)
=
(
−1
)(
−1
)

Tổng cộng
−1
Giống như trong trường hợp phân tích phương sai một yếu tố, ở đây ta cũng có thể dùng kiểm
định Tukey để xác định từng cặp trung bình tổng thể khác nhau. Ta tính các giá trị so sánh
=
, ,
( )( )

×