Tải bản đầy đủ (.pdf) (82 trang)

phân tích hiệp phương sai và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.9 MB, 82 trang )

TRƢỜNG ĐẠI HỌC CẦN THƠ
KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN






LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC


PHÂN TÍCH HIỆP PHƢƠNG SAI
VÀ ỨNG DỤNG




Giáo viên hƣớng dẫn Sinh viên thực hiện
Ts. VÕ VĂN TÀI NGUYỄN THỊ QUỲNH NHƢ
Bộ môn Toán-Khoa KHTN Ngành: Toán Ứng Dụng K36

Cần Thơ-12/2013





TRƢỜNG ĐẠI HỌC CẦN THƠ
KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN







LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC




PHÂN TÍCH HIỆP PHƢƠNG SAI
VÀ ỨNG DỤNG


Giáo viên hƣớng dẫn Sinh viên thực hiện
Ts. VÕ VĂN TÀI NGUYỄN THỊ QUỲNH NHƢ
Bộ môn Toán-Khoa KHTN Ngành: Toán Ứng Dụng K36
Cần Thơ-12/2013






i
MỤC LỤC

Trang
LỜI CẢM ƠN iii
DANH MỤC CÁC BẢNG iv

PHẦN MỞ ĐẦU 1
Chƣơng 1. PHÂN TÍCH PHƢƠNG SAI 3
1.1 GIỚI THIỆU 3
1.2 PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN 3
1.2.1 Phân tích phƣơng sai đơn biến một nhân tố 3
1.2.2 Phân tích phƣơng sai đơn biến hai nhân tố không tƣơng tác 5
1.2.3 Phân phƣơng sai đơn biến hai nhân tố tƣơng tác 8
1.3 PHÂN TÍCH PHƢƠNG SAI ĐA BIẾN 11
1.3.1 Phân tích phƣơng sai đa biến một nhân tố 11
1.3.2 Phân tích phƣơng sai đa biến hai nhân tố 14
Chƣơng 2. PHÂN TÍCH HIỆP PHƢƠNG SAI 18
2.1 GIỚI THIỆU 18
2.2 PHÂN TÍCH HIỆP PHƢƠNG SAI ĐƠN BIẾN 19
2.2.1 Phân tích hiệp phƣơng sai đơn biến một nhân tố với một
biến covariate 19
2.2.2 Phân tích hiệp phƣơng sai đơn biến hai nhân tố không tƣơng
tác và một biến covariate 27
2.2.3 Phân tích hiệp phƣơng sai đơn biến hai nhân tố tƣơng tác
và một biến covariate 31
2.3 PHÂN TÍCH HIỆP PHƢƠNG SAI ĐA BIẾN 41
2.3.1 Phân tích hiệp phƣơng sai đa biến một nhân tố với q biến
Covariates 41

ii
2.3.2 Phân tích hiệp phƣơng sai đa biến hai nhân tố 45
Chƣơng 3. ỨNG DỤNG 51
3.1 GIỚI THIỆU 51
3.2 ỨNG DỤNG TRONG NÔNG NGHIỆP 52
3.2.1 Bài toán 1 52
3.2.2 Giải quyết bài toán 1 52

3.3 ỨNG DỤNG TRONG KINH TẾ 54
3.3.1 Bài toán 2 54
3.3.2 Giải quyết bài toán 2 54
3.4 ỨNG DỤNG TRONG Y HỌC 56
3.4.1 Bài toán 3 56
3.4.2 Giải quyết bài toán 3 57
3.5 ỨNG DỤNG TRONG GIÁO DỤC 59
3.5.1 Bài toán 4 59
3.5.2 Giải quyết bài toán 4 59
KẾT LUẬN VÀ ĐỊNH HƢỚNG NGHIÊN CỨU 63
TÀI LIỆU THAM KHẢO 64
PHỤ LỤC 65










iii
LỜI CẢM ƠN


Qua thời gian dài học tập tại trƣờng Đại học Cần Thơ, Em đã đƣợc trang bị
những kiến thức bổ ích và quý báu từ quý Thầy Cô và bạn bè.
Em xin bầy tỏ lòng biết ơn và kính trọng nhất đến thầy Võ Văn Tài, ngƣời
đã trực tiếp hƣớng dẫn, chỉ bảo và động viên Em trong suốt quá trình thực hiện đề

tài.
Bên cạnh đó, Em xin gởi lời cảm ơn đến toàn thể quý Thầy Cô của bộ môn
Toán-Khoa Khoa học Tự nhiên. Em xin gởi lời cảm ơn đến thầy Trần Phƣớc Lộc,
Cố vấn học tập và các bạn sinh viên ngành Toán Ứng dụng đã trợ giúp rất nhiều
trong việc hoàn thành đề tài này.
Em xin cảm ơn hội đồng bảo vệ luận văn đã xem xét và điều chỉnh những
sai sót cũng nhƣ đóng góp ý kiến về những mặt còn hạn chế để đề tài đƣợc hoàn
thiện hơn.
Dù đã có nhiều cố gắng cùng với sự hƣớng dẫn tận tình của Thầy hƣớng
dẫn, song do trình độ còn hạn chế nên khó tránh khỏi sai sót. Rất mong nhận
đƣợc sự thông cảm và góp ý từ Thầy Cô và các bạn.


Cần Thơ, ngày 2 tháng 12 năm 2013


Nguyễn Thị Quỳnh Nhƣ

iv
DANH MỤC CÁC BẢNG
Trang
Bảng 1.1 Bảng dữ liệu phân tích ANOVA một nhân tố 4
Bảng 1.2 Bảng tóm tắt phân tích ANOVA một nhân tố 5
Bảng 1.3 Bảng dữ liệu phân tích ANOVA hai nhân tố không
tƣơng tác 6
Bảng 1.4 Bảng tóm tắt phân tích ANOVA hai nhân tố không
tƣơng tác 8
Bảng 1.5 Bảng dữ liệu phân tích ANOVA hai nhân tố tƣơng tác 8
Bảng 1.6 Bảng tóm tắt phân tích ANOVA hai nhân tố tƣơng tác 11
Bảng 1.7 Bảng dữ liệu phân tích MANOVA một nhân tố 12

Bảng 1.8 Bảng tóm tắt phân tích MANOVA một nhân tố 14
Bảng 1.9 Bảng dữ liệu phân tích MANOVA hai nhân tố 15
Bảng 1.10 Bảng tóm tắt kết quả phân tích MANOVA hai nhân tố 17
Bảng 2.1 Bảng dữ liệu phân tích ANCOVA một nhân tố 19
Bảng 2.2 Chiều cao và cân nặng trẻ em đƣợc phân theo giới tính 24
Bảng 2.3 Bảng số liệu phân tích ANCOVA hai nhân tố không
tƣơng tác 27
Bảng 2.4 Bảng số liệu phân tích ANCOVA hai nhân tố tƣơng tác 31
Bảng 2.5 Bảng số liệu về năng suất lúa 37
Bảng 2.6 Bảng dữ liệu phân tích MANCOVA hai nhân tố 45
Bảng 3.1 Bảng kiểm định giá trị phƣơng sai sai số 52
Bảng 3.2 Bảng kiểm định giả thiết
01 02
,HH
trong ANCOVA 52
Bảng 3.3 Bảng kiểm định
03
H
sự tƣơng tác giữa nhân tố và biến
Covariate 53
Bảng 3.4 Bảng kiểm định giả thiết trong phân tích ANOVA 53

v
Bảng 3.5 Bảng kiểm định bằng nhau của ma trận hiệp phƣơng sai 54
Bảng 3.6 Bảng kiểm định giả thiết phân tích MANCOVA một
nhân tố 54
Bảng 3.7 Bảng kiểm định của nhân tố với biến x
1
55
Bảng 3.8 Bảng kiểm định của nhân tố với biến x

2
56
Bảng 3.9 Bảng kiểm định phƣơng sai sai số 57
Bảng 3.10 Bảng kiểm định giả thiết
01 02
,HH
trong phân tích
MANCOVA 57
Bảng 3.11 Bảng kiểm định ảnh hƣởng tƣơng tác giữa nhóm và x
1
58
Bảng 3.12 Bảng kiểm định ảnh hƣởng tƣơng tác giữa nhóm và x
2
58
Bảng 3.13 Bảng kiểm định sự bằng nhau của ma trận hiệp phƣơng sai . 60
Bảng 3.14 Bảng kiểm định các giả thiết thống kê MANCOVA 60
Bảng 3.15 Bảng kiểm định sự tƣơng tác giữa giới tính và độ tuổi 61
Bảng 3.16 Bảng kiểm định sự tƣơng tác giữa năm và độ tuổi 61
Bảng 3.17 Bảng kiểm định tƣơng tác giữa nhân tố năm, giới tính
và tuổi 62






1
PHẦN MỞ ĐẦU

I. GIỚI THIỆU

Trong phân tích và xử lý số liệu, ta thƣờng quan tâm đến mô hình phân tích
hồi qui và phân tích phƣơng sai. Trong đó phân tích phƣơng sai đƣợc xem nhƣ
một công cụ để thực hiện việc so sánh trung bình của hai hay nhiều tổng thể dựa
trên giá trị trung bình của mẫu quan sát. Các tính toán trong phân tích phƣơng sai
liên quan đến sự phân chia tổng phƣơng sai tổng thể thành các thành phần
phƣơng sai bên trong nhóm và phƣơng sai giữa các nhóm. Thành phần bên trong
nhóm cho ta ƣớc lƣợng phƣơng sai sai số, trong khi các thành phần giữa các
nhóm ƣớc lƣợng phƣơng sai do ảnh hƣởng của các nhân tố đang xét. Tỷ số
phƣơng sai giữa các nhóm với phƣơng sai bên trong nhóm cho ta một kiểm
nghiệm đối với giả thiết cho rằng tất cả các trung bình đều bằng nhau. Trái lại,
phân tích hồi qui chủ yếu đƣợc sử dụng để tìm mối quan hệ giữa các biến, chúng
ta có thể ƣớc lƣợng hình thức mối quan hệ giữa một biến đáp ứng và một biến
độc lập.
Phân tích hiệp phƣơng sai là sự kết hợp cả hai phƣơng pháp trên. Phƣơng
pháp này đƣợc R.A.Fisher sử dụng lần đầu tiên trong bài báo nghiên cứu (1932),
Ông xem đây là một kỹ thuật “kết hợp những ƣu điểm và dung hòa các yêu cầu
của hai phƣơng thức đƣợc áp dụng rộng rãi và đƣợc biết dƣới tên là hồi qui và
phân tích phƣơng sai”.
Phân tích hiệp phƣơng sai là một hƣớng nghiên cứu mới trong nhiều lĩnh
vực do nó là sự mở rộng của mô hình phân tích phƣơng sai. Mục tiêu chính của
phân tích hiệp phƣơng sai là đạt đƣợc độ chính xác bởi giảm tổng bình phƣơng
sai số và mục tiêu thứ hai là giảm tác động của các nhân tố mà ngƣời thực hiện thí
nghiệm không kiểm soát đƣợc. Từ đó, việc nghiên cứu ảnh hƣởng của các nhân tố
đến biến đáp ứng chính xác hơn.
II. BỐ CỤC LUẬN VĂN
Bố cục luận văn gồm phần mở đầu, phần nội dung, phần kết luận, phần tài
liệu tham khảo và phần phụ lục. Phần nội dung luận văn gồm 3 chƣơng:
Chương 1. Phân Tích Phương Sai
Trình bày một số mô hình phân tích phƣơng sai thông dụng nhƣ phân tích
phƣơng sai một nhân tố, phân tích phƣơng sai hai nhân tố,… Đây cũng là cở sở

cho việc hình thành phƣơng pháp phân tích hiệp phƣơng sai.

2
Chương 2. Phân tích hiệp phương sai
Trình bày cở sở lý thuyết của các mô hình phân tích hiệp phƣơng sai nhƣ
phân tích hiệp phƣơng sai đơn biến, phân tích hiệp phƣơng sai đa biến,… Bên
cạnh đó còn trình bày một vài ví dụ đƣợc thực hiện thủ công dựa trên cở sở lý
thuyết đã trình bày.
Chương 3. Ứng dụng
Dựa vào những mô hình đã phân tích ở chƣơng 2, chƣơng này đƣa ra một
số ứng dụng của phân tích hiệp phƣơng sai dựa trên số liệu thực tế trong các lĩnh
vực nhƣ giáo dục, nông nghiệp, y học và kinh tế.

3
Chƣơng 1
PHÂN TÍCH PHƢƠNG SAI

1.1 GIỚI THIỆU
Giả sử chúng ta cần nghiên cứu, phân tích sự biến động của một tổng thể
thông qua một biến ngẫu nhiên (chỉ tiêu nghiên cứu). Thông thƣờng chúng ta có
các bài toán ƣớc lƣợng, kiểm định giả thiết về giá trị tham số và quy luật phân
phối xác suất của biến ngẫu nhiên, tuy nhiên phƣơng pháp kiểm định, so sánh
tham số đó chỉ sử dụng đƣợc khi sự biến động của biến ngẫu nhiên đó chỉ chịu tác
động của một nhân tố và cũng ở một hoặc tối đa hai mức cố định. Nếu biến đó
đƣợc tạo nên do nhiều nhân tố cùng tác động hoặc do nhiều nhân tố nhƣng ở mức
tác động khác nhau thì phải tiến hành phân tích phƣơng sai mới thấy đƣợc vai trò
ảnh hƣởng của từng mức nhân tố (nếu có) trong việc tạo nên sự biến đổi, sự sai
khác đó.
Nhân tố đƣợc hiểu là các yếu tố, điều kiện khách quan (thời tiết, khí hậu,
thiên tai,…) hoặc chủ quan (phƣơng pháp thí nghiệm, giống cây trồng,…) có tác

động trực tiếp đến sự biến động của biến ngẫu nhiên mà ta nghiên cứu.
Quan điểm của phân tích phƣơng sai là việc khai triển phƣơng sai của biến
ngẫu nhiên (X) thành tổng của những phƣơng sai của những biến ngẫu nhiên
thành phần độc lập, mà mỗi cái trong chúng đặc trƣng cho sự ảnh hƣởng của yếu
tố này hay yếu tố khác hoặc tác dụng chung giữa chúng. So sánh những phƣơng
sai này cho phép ta đánh giá sự tồn tại ảnh hƣởng của các yếu tố đó với biến ngẫu
nhiên (X) đang xét.
1.2 PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN
1.2.1 Phân tích phƣơng sai đơn biến một nhân tố
Phân tích phƣơng sai đơn biến một nhân tố đƣợc dùng để kiểm định giả thiết
các tổng thể nhóm (tổng thể bộ phận) có giá trị trung bình bằng nhau. Kỹ thuật
này dựa trên cơ sở tính toán mức độ biến thiên trong nội bộ các nhóm và biến
thiên giữa các trung bình nhóm. Dựa trên hai ƣớc lƣợng này của mức độ biến
thiên ta có thể rút ra kết luận về mức độ khác nhau giữa các trung bình nhóm.
Hay nói cách khác ta phân tích ảnh hƣởng của một nhân tố nguyên nhân đến một
nhân tố kết quả.


4
a) Mô hình
Giả sử xét mẫu ngẫu nhiên đƣợc tạo bởi một yếu tố A tác động gồm m mức
đƣợc cho bởi bảng sau:
Bảng 1.1 Bảng dữ liệu phân tích ANOVA một nhân tố
STT quan sát
1
A

2
A


3
A


m
A

1
11
X

21
X

13
X


1m
X

2
21
X

22
X

23
X



2m
X

3
31
X

23
X

33
X


3m
X







i
n

1
1n

X

2
2n
X

3
3n
X


m
Xn m

Giả thiết rằng các quan sát
ij
X
(
1, , ; 1,
j
i n j m
) có phân phối chuẩn
2
( , )N

.
Ứng với mỗi mức nhân tố i ta có biến ngẫu nhiên
i
X
và chúng cũng tuân theo quy

luật phân phối chuẩn. Khi đó mô hình phân tích ANOVA một nhân tố có dạng:
ij ij
+
i
X
  


Trong đó

ij
X
là biến đáp ứng,


là trung bình tất cả các
ij
X
,

i

là mức tác động thứ i của nhân tố A,

ij

là phần dƣ.
b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:


0 1 2
:
m
H
   
   


1
:H
Có ít nhất một cặp kỳ vọng khác nhau
* Tính các tham số đặc trưng:

ij
1
1
i
n
i
j
i
XX
n



: Trung bình mẫu thứ i,

ij
11


1
i
n
m
ij
m
i
i
X
X
n





: Trung bình tất cả các
ij
X
.

2
ij
1
()
i
n
m
i j i

SST X X



: Tổng bình phƣơng chung, phản ánh biến thiên của
biến đáp ứng do chịu ảnh hƣởng của tất cả các nhân tố.

5

2

1
()
m
ii
i
SSB n X X



: Tổng bình phƣơng giữa các mẫu, phản ánh biến
thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố đang nghiên cứu.

2
ij
11
()
i
n
m

i
ij
SSE X X



: Tổng bình phƣơng trong nội bộ mẫu, phản ánh biến
thiên của biến đáp ứng do chịu ảnh hƣởng của các nhân tố không nghiên cứu.
Khi đó
SST SSB SSE
.
* Giá trị quan sát:
1
B
SSB
MSF
m
F
SSE
MSE
Nm




Trong đó

1
B
SSB

MSF
n


, với n-1 là bậc tự do của nhân tố,

SSE
MSE
Nm


, với N-m là bậc tự do của sai số.
* Trả lời:
Bác bỏ giả thiết
0
H
nếu
( 1, )m N m
FF



.
Trong đó
( 1, )m N m
F


là phân vị Fisher với mức ý nghĩa


và bậc tự do
 
1,m N m
.
Bảng 1.2 Bảng tóm tắt phân tích ANOVA một nhân tố
Nguồn biến
động
Tổng bình phƣơng
Bậc tự
do
Trung
bình bình
phƣơng
Giá trị quan sát
Giữa các mẫu
(nhân tố)
2

1
()
m
ii
i
SSB n X X




m-1
B

MSF

1
B
SSB
MSF
n
F
SSE
MSE
Nm




Trong nội bộ
mẫu (sai số)
2
11
()
i
n
m
ij i
ij
SSE X X





N-m
MSE

 Chú ý: Để thực hiện được phân tích phương sai một nhân tố, ta cần quan tâm
một số điều kiện sau:
+
ij

có phân phối chuẩn
2
( , )N

,
+ Các nhóm so sánh phải đƣợc đƣợc chọn một cách ngẫu nhiên và độc lập,
+ Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu đủ lớn,
+ Phƣơng sai các nhóm so sánh phải đồng nhất.

6
1.2.2 Phân tích phƣơng sai đơn biến hai nhân tố không tƣơng tác
Phƣơng pháp phân tích phƣơng sai hai nhân tố là phƣơng pháp ƣớc tính sự
ảnh hƣởng của hai nhân tố thay vì một nhân tố nhƣ trƣớc đó.
a) Mô hình
Giả sử ta có biến ngẫu nhiên
ij
X
có phân phối chuẩn chịu sự ảnh hƣởng
của nhân tố A có m mức (
1,im
) và nhân tố C có n mức (
1,jn

). Cụ thể ta có
bảng số liệu sau:
Bảng 1.3 Bảng dữ liệu phân tích ANOVA hai nhân tố không tƣơng tác
Nhân tố C
Nhân tố A

1
C

2
C


n
C

1
A

11
X

12
X


1n
X

2

A

21
X

22
X


2n
X






m
A

1m
X

2m
X


mn
X


Giả thiết rằng A và C cùng tác động lên X nhƣng theo một cách riêng rẽ. Ta có
mô hình ANOVA 2 nhân tố không tƣơng tác nhƣ sau:

ij ij ij ij
X
   
   

Trong đó

ij
X
là biến đáp ứng,


là trung bình của tất cả các giá trị
ij
X
,

ij

là mức tác động thứ i của nhân tố A,

ij

là mức tác động thứ j của nhân tố B,

ij


là phần dƣ và
2
ij
~ (0, )N

.
b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:

0 1 2 1
0 1 2 1
: ; :
: ; :
AA
mi
CC
nj
HH
HH
     
     
    
    

* Tính các tham số đặc trưng:
Ta đặt

. ij
1
1

n
i
j
XX
n



: Trung bình hàng thứ i,

. ij
1
1
m
j
i
XX
m



: Trung bình cột thứ j,

7

. .
1 1 1 1
1 1 1
.
m n n m

i j ij
i j j i
X X X X
m n n m
   
  
  
: Trung bình tất cả số liệu.

2

1
()
mn
ij
i j i
SST X X



: Tổng bình phƣơng chung, SST phản ánh biến thiên
của biến đáp ứng do chịu ảnh hƣởng của tất cả các nhân tố.

22
. .
1 1 1
( ) ( )
m n m
ii
i j i

SSA X X n X X
  
   
 
: Tổng bình phƣơng giữa các hàng.
SSA phản ánh biến thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố A.

22
. .
1 1 1
( ) ( )
m n n
jj
i j j
SSC X X m X X
  
   
 
: Tổng bình phƣơng giữa các cột.
SSC phản ánh biến thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố C.

2
ij . .
11
()
mn
ij
ij
SSE X X X X


   

: Sai số ngẫu nhiên. SSE phản ánh biến
thiên của biến đáp ứng do chịu ảnh hƣởng của các nhân tố không nghiên cứu.
Khi đó
SST SSA SSC SSE  
.
* Giá trị quan sát cho
0
A
H

1
( 1)( 1)
A
A
MSF
m
F
MSE
mn




* Giá trị quan sát cho
0
C
H


1
( 1)( 1)
C
C
MSF
n
F
MSE
mn




Trong đó

1
A
SSA
MSF
m


, với
( 1)m
là bậc tự do của A,

1
C
SSC
MSF

n


, với
( 1)n 
là bậc tự do của C,

( 1)( 1)
SSE
MSE
mn


, với
( 1)( 1)mn
là bậc tự do của sai số.
* Trả lời:
Bác bỏ giả thiết
0
A
H
nếu
 
( 1),( 1)( 1)m m n
A
FF

  

.

Trong đó
 
1),( 1)( 1m m n
F

  


là phân vị Fisher với mức ý nghĩa

và bậc tự do
 
( 1),( 1)( 1)m m n  
.
Bác bỏ giả thiết
0
C
H
nếu
 
( 1),( 1)( 1)n m n
C
FF

  

.

8
Trong đó

 
( 1),( 1)( 1)n m n
F

  
là phân vị Fisher với bậc tự do

và bậc tự do
 
( 1),( 1)( 1)n m n  
.
Bảng 1.4 Bảng tóm tắt phân tích ANOVA hai nhân tố không tƣơng tác
Nguồn
biến động
Tổng bình phƣơng
Bậc tự do
Giá trị quan sát
Nhân tố
hàng (A)
2
.
1
()
m
i
i
SSA n X X





m-1
1
( 1)( 1)
A
A
MSF
m
F
MSE
mn




Nhân tố
cột (C)
2
.
1
()
n
j
j
m X XSSC




n-1

1
( 1)( 1)
C
C
MSF
n
F
MSE
mn




Sai số
2
. .
11
()
mn
ij i j
ij
SSE X X X X

   


(m-1)(n-1)

Tổng
2


1
()
i
n
m
ij
i j i
SST X X




N-1

1.2.3 Phân tích phƣơng sai đơn biến hai nhân tố tƣơng tác
a) Mô hình
Giả sử có hai yếu tố A, C tác động. Yếu tố A có m mức tác động, yếu tố C có
n mức tác động và giả sử mỗi ô (i,j) chịu tác động bởi
ij
AC
có số quan sát nhƣ
nhau. Với
ijk
X
 
1, ; 1, ; 1,i m j n k l  
là quan sát thứ k trên hàng i và cột j.
Giả sử các
ijk

X
có phân phối chuẩn
2
( , )N

, kỳ vọng
ij
EX ,
k


2
ijk
DX


.
Ta có bảng dữ liệu sau:
Bảng 1.5 Bảng dữ liệu phân tích ANOVA hai nhân tố tƣơng tác
Nhân tố C
Nhân tố A
1
C

2
C


n
C


1
A

111 11

l
XX

121 12

l
XX


1 1 1

n nl
XX

2
A

211 21

l
XX

221 22


l
XX


2 1 2

n nl
XX






m
A

11 1

m m l
XX

21 2

m m l
XX


1


mn mnl
XX

Mô hình phân tích ANOVA hai nhân tố tƣơng tác có dạng:
ij ij ijij
X
    
    

Trong đó

9

ij
X
là biến đáp ứng,


là trung bình của tác cả các giá trị của
ij
X
,

i

là mức tác động thứ i của nhân tố A,

j

là mức tác động thứ j của nhân tố C,


ij

là mức tác động thức ij của nhân tố tƣơng tác AC,

ij

là phần dƣ và
2
ij
~ (0, )N

.
Để kiểm tra sự tƣơng tác giữa hai nhân tố, ta đặt:

. ij
EX
ij


: Trung bình của
ij
AC
,

.
1
1
n
i ij

j
n




: Trung bình của
i
A
,

. . .
1
1
m
j ij
i
m




: Trung bình của
i
C
,

. .
11
11

mn
ij
ij
mn
  



: Trung bình của biến đáp ứng đang nghiên cứu,

ii
  

: Ảnh hƣởng của nhân tố hàng,

ij
  

: Ảnh hƣởng của nhân tố cột,

ij . . .
[ ( ) ( )]
ij i j
      
     
: Tƣơng tác giữa hàng i và cột j.
Khi đó
.ij i j ij
    
   


2
~ ( , )
ijk i j ij
XN
    
  
.
b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:

0 1 2 1
: 0; : 0
AA
mi
HH
   
    


0 1 2 1
: 0; : 0
CC
nj
HH
   
    


0 ij 1 ij

: 0; : 0
AC AC
HH



* Tính các tham số đặc trưng:

.
1
1
l
ij ijk
i
XX
l



: Trung bình các phần tử ở hàng i cột j,


11
1
.
nl
i ijk
jk
XX
nl




: Trung bình tất cả các phần tử ở hàng i,


11
1
.
ml
j ijk
ik
XX
ml



: Trung bình tất cả các phần tử tử cột j,

10


1 1 1
1

m n l
ijk
i j i
XX
m n l

  


: Trung bình tất cả các phần tử.

Chú ý:

i
XX
: Ƣớc lƣợng của
i

.

. . j
XX
: Ƣớc lƣợng của
j

.

. . . . ij i j
X X X X  
: Ƣớc lƣợng của
ij

.
2

1 1 1

()
m n l
ijk
i j i
SST X X
  


: Tổng bình phƣơng chung,
22
i i
1 1 1 1
( ) ( )
m n l m
i j i i
SSA X X nl X X
   
   
 
: Tổng bình phƣơng giữa các hàng,
22
. .
1 1 1 1
( ) ( )
m n l n
ji
i j i j
SSC X X ml X X
   
   

 
: Tổng bình phƣơng giữa các cột,
22
. . . . . .
1 1 1 1 1
( ) ( )
m n l m n
ij i j ij i j
i j i i j
SSAC X X X X l X X X X
    
       
 
: Tổng
bình phƣơng tƣơng tác,
2
.
1 1 1
()
m n l
ijk ij
i j i
SSE X X
  


: Tổng bình phƣơng sai số.
Khi đó
SST SSA SSA SSAE SSE   
.

* Giá trị quan sát cho
0
A
H

( 1)
( 1)
A
SSA
m
F
SSE
mn l




* Giá trị quan sát cho
0
C
H

( 1)
( 1)
C
SSC
n
F
SSE
mn l





* Giá trị quan sát cho
0
AC
H

( 1)( 1)
( 1)
AC
SSAC
mn
F
SSE
mn l




Trong đó

1
A
SSA
MSF
m



,
( 1)m
: Bậc tự do của A,

11

1
C
SSC
MSF
n


,
( 1)n 
: Bậc tự do của C,

. ( 1)
SSE
MSE
m n l


,
. ( 1)mn l 
: Bậc tự do của sai số,

( 1)( 1)
AC
SSAC

MSF
mn


,
( 1)( 1)mn
: Bậc tự do của AC.
*Trả lời:
Bác bỏ giả thiết
0
A
H

0
C
H
nếu
 
( 1)( ( 1)m mn l
A
FF




 
( 1),( ( 1)n mn l
C
FF




.
Trong đó
 
( 1)( ( 1)m mn l
F



 
( 1),( ( 1)n mn l
F


có phân vị Fisher với mức ý nghĩa


bậc tự do lần lƣợt là
 
( 1), ( 1)m mn l

 
( 1), ( 1)n mn l
.
Bác bỏ giả thiết
0
AC
H
nếu

 
( 1)( 1), ( 1)m n mn l
AC
FF

  

.
Trong đó
 
( 1)( 1), ( 1)m n mn l
F

  
có phân vị Fisher với mức ý nghĩa

và bậc tự do
 
( 1)( 1), ( 1)m n mn l  
.
Bảng 1.6 Bảng tóm tắt phân tích ANOVA hai nhân tố tƣơng tác
Nguồn biến động
Tổng bình phƣơng
Độ tự do
Giá trị quan sát F
Nhân tố A
SSA
m-1
( 1)
( 1)

A
SSA
m
F
SSE
mn l




Nhân tố C
SSC
n-1
( 1)
( 1)
C
SSC
n
F
SSE
mn l




Nhân tố AC
SSAC
(m-1)(n-1)
( 1)( 1)
( 1)

AC
SSAC
mn
F
SSE
mn l





1.3 PHÂN TÍCH PHƢƠNG SAI ĐA BIẾN (MANOVA)
1.3.1 Phân tích phƣơng sai đa biến một nhân tố
Phân tích phƣơng sai đa biến một nhân tố là phân tích ảnh hƣởng của một
nhân tố nguyên nhân đến nhiều yếu tố kết quả.




12
a) Mô hình
Giả sử có m mẫu ngẫu nhiên với cỡ mẫu tƣơng ứng là
12
, , ,
m
n n n
và các dữ
liệu lấy từ
1
m

i
i
Nn



biến ngẫu nhiên độc lập. Trong đó
ij
~ ( , )
pi
XN


,
( 1, ; 1, )
i
i m j n
. Ta có bảng dữ liệu sau:
Bảng 1.7 Bảng dữ liệu phân tích MANOVA một nhân tố
Mẫu 1
Mẫu 2

Mẫu m
111 112 11
, ,
p
X X X

211 212 21
, ,

p
X X X


11 12 1
, ,
m m m p
X X X

121 122 11
, ,
p
X X X

221 222 22
, ,
p
X X X


21 22 2
, ,
m m m p
X X X





1 1 1

1 1 1 2 1
, ,
n n n p
X X X

2 2 2
2 1 2 2 2
, ,
n n n p
X X X


12
, ,
m m m
mn mn mn p
X X X

Mô hình phân tích MANOVA một nhân tố có dạng:
ij iji
X
  
  

Trong đó mỗi quan sát
ij
X
là một véc tơ ngẫu nhiên p chiều, có cùng

là ma trận

hiệp phƣơng sai. Cụ thể
ij
X
có dạng:

ij1
ij2
ij
ijp

X
X
X
X








,
ij ij ij ij ij ij
( , ) [ ][ ]
TT
Cov X X E X EX X EX    
,

1

2

p












: Véc tơ trung bình của tất cả các véc tơ
ij
X
,
1
2

i
i
i
ip













: Mức tác động thứ i của nhân tố đang xét,

ij

: Sai số ngẫu nhiên.


13
b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:

0 1 2
1
:
:
m
i
H
H
   

   



Cụ thể

1
11 21
12 22 2
0
12
:


m
m
pp
mp
H


  



   

   

   
  


   

   
   

   


* Tính các tham số đặt trưng:

i. ij
1
1
i
n
j
i
XX
n



: Trung bình mẫu thứ i,

1. 2. .
ij
11
1
i
n

m
m
ij
X X X
XX
Nm

  


: Trung bình tất cả số liệu.
.i
X
,

X
là các véc tơ ngẫu nhiên p chiều có dạng:

.1 1
.2 2
.
.
,

i
i
i
i p p
XX
XX

XX
XX
   
   
   

   
   
   
   


. . . .
1 1 1
( )( ) ( )( )
i
n
mm
TT
i i i i i
i j i
B X X X X n X X X X
  
     
 
: Ma trận tổng
bình phƣơng và tích chéo giữa các mẫu. Ma trận B có độ tự do m-1.


11

( )( )
i
n
m
T
ij i ij i
ij
E X X X X

  

: Ma trận tổng bình phƣơng và tích chéo
trong nội bộ mẫu. Ma trận E có độ tự do là N-m.
* Giá trị quan sát cho
0
H

E
EB



Trong đó
E
là định thức của ma trận E,
EB
là ma trận tổng bình phƣơng và
tích chéo chung.
 Chú ý: Việc đưa ra thống kê kiểm định giả thiết
0

H
trên là dựa vào định lý
kiểm định tỷ số hợp lý của thống kê Wilk sau đây:

14
 Định lý kiểm định tỷ số hợp lý của thống kê Wilk
Nếu
( 1,2, , ; 1,2, , )
ij
Y i k j n
là các quan sát độc lập từ
( , )
pi
N


thì tỷ số
hợp lý cho thống kê kiểm định
0 1 2

m
H
   
    
có thể được biểu diễn:

E
EB




Trong đó


11
. .
1
.
1
.
1 1 1
( )( ) ,
( )( ) ,
1
( 1, ),
11
.
kn
T
ij i ij i
ij
k
T
ii
i
n
i ij
j
k n k
ij i

i j i
E Y Y Y Y
B n Y Y Y Y
Y Y i k
n
Y Y Y
kn k



  
  
  





 

* Trả lời: Bác bỏ giả thiết
0
H
nếu
, 1,p m N m


  
.
Trong đó

, 1,p m N m



là phân vị Wilk với mức ý nghĩa

và bậc tự do là
(
, 1,p m N m
).

Nhận xét: Ta có thể đưa bài toán MANOVA một nhân tố về
p
bài toán ANOVA
một nhân tố.
Bảng 1.8 Bảng tóm tắt phân tích MANOVA một nhân tố
Nguồn biến động
Ma trận tổng bình
phƣơng và tích chéo
Độ tự do
Giá trị quan sát


Giữa các mẫu
B
m-1
E
EB




Trong nội bộ mẫu
E
N-m

1.3.2 Phân tích phƣơng sai đa biến hai nhân tố
Phân tích phƣơng sai đa biến hai nhân tố là phân tích ảnh hƣởng của hai
nhân tố nguyên nhân ảnh hƣởng đến nhiều kết quả.
a) Mô hình
Tƣơng tự nhƣ phân tích ANOVA hai nhân tố, ta giả sử biến đáp ứng
ij
X
chịu
ảnh hƣởng bởi hai nhân tố A và C. Nhân tố A đƣợc xem xét ở các mức
12
, , ,
m
A A A
và nhân tố C đƣợc xem xét ở các mức
12
, , ,
n
C C C
.


15
Bảng 1.9 Bảng dữ liệu phân tích MANOVA hai nhân tố
Nhân tố C
Nhân tố A

1
C

2
C


n
C

1
A

111 11

l
XX

121 12

l
XX


1 1 1

n nl
XX

2

A

211 21

l
XX

221 22

l
XX


2 1 2

n nl
XX






m
A

11 1

m m l
XX


21 2

m m l
XX


1

mn mnl
XX

Mô hình phân tích MANCOVA hai nhân tố có dạng:
ij ij ijk i j k
X
    
    

Trong đó

ij 1
ij 2
ij
ij

k
k
k
kp
X

X
X
X








 
1, ; 1, ; 1,i m j n k l  
: Véc tơ ngẫu nhiên có phân phối
chuẩn p chiều, độc lập và có cùng ma trận hiệp phƣơng sai

.

1
2

p













: Véc tơ trung bình của tất cả các véc tơ
ij
X
,

1
2

i
i
i
ip












: Mức tác động thứ i của nhân tố A,


1
2

j
j
j
jp












: Mức tác động thứ j của nhân tố C,

ij1
ij2
ij
ijp














: Mức tác động thứ i của nhân tố A và mức tác động thứ j của

16
nhân tố C,

ijk

: Véc tơ sai số ngẫu nhiên.
b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:
 
1
11 21
12 22 2
01
12
0
0
: ; : 0




0
m
m
AA
ip
pp
mp
HH


  




   


   


   

    

   


   


   


   



 
1
11 21
12 22 2
01
12
0
0
: ; : 0



0
n
n
CC
jp
pp
np
HH


  





   


   


   

    

   


   

   


   


 
ij1
ij2
0 1 ij
ijp

0
0
: ; : 0


0
AC AC
p
HH



















* Tính các tham số đặc trưng:


ij ij
1
1
l
k
k
XX
l



: Trung bình các phần tử ở hàng i cột j,

ij
11
1
.
nl
ik
jk
XX
nl



: Trung bình tất cả các phần tử ở hàng i,

. . ij
11
1

.
ml
jk
ik
XX
ml



: Trung bình tất cả các phần tử ở cột j,

ij
1 1 1
1

m n l
k
i j k
XX
m n l
  


: Trung bình tất cả các phần tử.


1
( )( ) ( )( )
m
TT

i i i i
i j k i
A X X X X nl X X X X

     
 
: Ma trận
tổng bình phƣơng và tích chéo giữa các hàng. Ma trận A có bậc tự do là
( 1)m 
.

. . . . . . . .
1
( )( ) ( )( )
n
TT
j j j j
i j k j
C X X X X ml X X X X

     
 
: Ma trận
tổng bình phƣơng và tích chéo giữa các cột. Ma trận C có bậc tự do là
( 1)n 
.

17

ij . . ij . .

( )( )
T
k i j k i j
i j k
AC X X X X X X X X      



ij . . ij . .
11
( )( )
mn
T
k i j k i j
ij
l X X X X X X X X

      

: Ma trận tổng
bình phƣơng và tích chéo tƣơng tác. Ma trận AC có bậc tự do là
( 1)( 1)mn
.

ij ij. ij ij.
( )( )
T
kk
i j k
E X X X X  


: Ma trận sai số. Ma trận E có bậc tự do

( 1)mn l 
.

ij ij
( )( )
T
kk
i j k
T X X X X  

: Ma trận tổng bình phƣơng và tích chéo
chung. Ma trận T có bậc tự do là
mnl
.
Ma trận T đƣợc phân tích nhƣ sau:
T A C AC E   
.
Ta có bảng tóm tắt kết quả phân tích MANOVA hai nhân tố nhƣ sau:
Bảng 1.10 Bảng tóm tắt kết quả phân tích MANOVA hai nhân tố
Nguồn
biến
động
Bậc tự do
Ma trận tổng
bình phƣơng
và tích chéo
Giá trị quan

sát


Miền bác bỏ
Hàng
m-1
A
A
E
EA



,( 1), ( 1)p m mn l
A


  

Cột
n-1
C
C
E
EC



,( 1), ( 1)p n mn l
C



  

Tƣơng
tác
(m-1)(n-1)
AC
AC
E
E AC



,( 1)( 1), ( 1)p m n mn l
AC

  
  

Sai số
mn(l-1)
E




18
Chƣơng 2
PHÂN TÍCH HIỆP PHƢƠNG SAI


2.1 GIỚI THIỆU
Phân tích hiệp phƣơng sai là phƣơng pháp phân tích tích sử dụng cả hai mô
hình hồi qui tuyến tính và phân tích phƣơng sai. Ngoài biến đáp ứng, có một hoặc
nhiều biến có khả năng ảnh hƣởng đến kết quả, những biến đó đƣợc xem nhƣ các
biến Covariates. Phân tích hiệp phƣơng sai xác định sự tƣơng quan giữa các biến
Covariates và biến đáp ứng. Từ đó loại bỏ phƣơng sai liên kết với các biến
Covariates trong biến đáp ứng trƣớc khi so sánh giữa các nhóm.
Trong giới hạn của một biến đáp ứng và một biến Covariate, phân tích hiệp
phƣơng sai sẽ thành công nếu thỏa mãn 3 giả thiết sau:
i) Biến đáp ứng có mối quan hệ tuyến tính đến biến Covariate(s).
Nếu giữ giả định này, một phần sai số trong mô hình là dự đoán đƣợc và có
thể đƣợc loại bỏ để giảm phƣơng sai sai số. Giả định này, ta có thể kiểm tra bởi
giả thiết
0
:0H


, trong đó

là hệ số dốc từ mô hình hồi qui của biến đáp ứng
trên biến Covariate(s). Phân tích hiệp phƣơng sai sẽ luôn cho sai số nhỏ hơn phân
tích phƣơng sai.
ii) Các nhóm có hệ số dốc bằng nhau.
Chúng ta có thể kiểm tra giả định này bằng giả thiết:

0 1 2
:
k
H

  
  

Trong đó
i

có hệ số dốc trong nhóm thứ i. Nếu giả định này đƣợc giữ, nghĩa là
các đƣờng thẳng hồi qui trong mỗi nhóm là song song nhau. Hay nói cách khác,
nhân tố và biến Covariate không có ảnh hƣởng tƣơng tác nhau.
iii) Biến Covariate X cố định và độc lập với các nhóm mức của nhân tố.
Nếu biến Covariate đƣợc đo trƣớc khi thử nghiệm, sự độc lập của các nhóm
mức và biến Covariate đƣợc thỏa mãn theo định nghĩa. Tuy nhiên, nếu biến
Covariate đƣợc đo sau thử nghiệm, sự độc lập của các nhóm mức Covariate nên
đƣợc kiểm định. Để kiểm tra giả thiết này, ta có thể sử chạy ANOVA sử dụng
biến Covariate X là biến đáp ứng. Với giả thiết là không có sự khác biệt đáng kể
trong X giữa các nhóm mức và ta mong đợi để tìm thấy không có sự khác biệt
đáng kể để có thể thực hiện một phân tích hiệp phƣơng sai tiêu chuẩn.

×