Bài giảng tin ứng dụng
•
Gv: Trần Trung Hiếu
•
Bộ môn CNPM – Khoa CNTT – ĐH Nông Nghiệp Hà Nội
•
Email:
•
Website: />
CHƯƠNG IV: PHÂN TÍCH PHƯƠNG SAI, SO SÁNH VÀ
KIỂM ĐỊNH
Nội dung:
Phân tích phương sai
Kiểm định sự bằng nhau của 2 phương sai
So sánh trung bình 2 mẫu
3
Phân tích phương sai
•
Ví dụ
•
Công cụ chủ yếu để phân tích số liệu khi theo
dõi ảnh hưởng của các mức nhân tố khác nhau
tới kết quả hay ảnh hưởng tương tác của các
nhân tố tới kết quả
4
1.1 Phân tích phương sai một nhân tố
•
Được sử dụng để phân tích số liệu khi theo dõi ảnh hưởng của các mức nhân tố tới
kết quả
Ví dụ:
»
Nhân tố: Công thức cho lợn ăn Mức nhân tố là các công thức khác nhau Xem ảnh
hưởng tới năng suất như thế nào
Bài toán: Kiểm định giả thuyết về tác động giống nhau của các mức nhân tố
»
H0: m1 = m2 =...=m
n
»
H1: tồn tại i, j mà m
i
khác m
j
•
Các bước thực hiện
•
Chuẩn bị dữ liệu
•
Dữ liệu có thể bố trí dưới dạng cột hay hàng
•
Dữ liệu ứng với mỗi mức nhân tố có thể khác nhau
•
Sử dụng công cụ Anova: Single Factor
•
Phân tích kết quả
•
Nếu F thực nghiệm > F lý thuyết (Fcrit) thì các mức nhân tố có tác động khác nhau tới
kết quả (chấp nhận H1) Cần so sánh các công thức để rút ra công thức nào tốt nhất
(sử dụng LSD)
•
Ngược lại: các mức nhân tố không có khác biệt đáng kể trong tác động tới kết quả (chấp
nhận H0)
So sánh các trung bình dùng chỉ số LSD
•
Sử dụng trong trường hợp kết luận các mức nhân tố có tác động
khác nhau tới kết quả
•
Sử dụng để chỉ rõ tác động khác nhau của các mức nhân tố tới
kết quả là ntn: xếp thứ tự về sự tác động của các mức nhân tố tới
kết quả
•
Nếu cần so sánh trung bình CT T
i
(với r
i
lần lặp) với trung bình CT
T
j
(với r
j
lần lặp) có thể tính thêm chỉ số
LSD = t
α,f
* SQRT(s
2
(1/ r
i
+ 1/ r
j
)
t
α,f
= TINV(α, f) với α = 1 – p; f = df & within groups
s
2
= MS within groups: Phương sai chung
r
i
, r
j
: số lần lặp lại dữ liệu đối với các mức nhân tố i, j
1. Căn cứ kết luận
Nếu |m
i
-m
j
| > LSD(i,j) thì tác động của mức nhân tố i, j là khác nhau và
ngược lại
Trong TH khác nhau, nếu mi > mj thì KLuan mức nhân tố i tốt hơn mức nhân
tố j
6
Phân tích phương sai hai nhân tố
1. Ví dụ: Điều tra về chiều dài của cây, hai nhân tố xét đến là phân
bón và nhiệt độ
2. Xảy ra hai trường hợp:
Nhân tố A và B không tương tác, biến động gây nên bởi tác động
đồng thời của A và B gần sát 0.
Nhân tố A và B có tương tác.
Bài toán 1: Xét riêng tác động của các mức nhân tố A
»
H0: m1 = m2 =...=m
n
»
H1: tồn tại i, j mà m
i
khác m
j
Bài toán 2: Xét riêng tác động của các mức nhân tố B
»
H0: m1 = m2 =...=m
n
»
H1: tồn tại i, j mà m
i
khác m
j
Bài toán 3: Xét riêng tác động đồng thời của (A,B)
»
H0: Tác động đồng thời của 2 nhân tố không có tác động đáng kể tới kết
quả
»
H1: Tác động đồng thời của 2 nhân tố có tác động đáng kể tới kết quả
7
Phân tích phương sai hai nhân tố không
tương tác
1. Không xét đến tác động đồng thời của hai nhân tố A, B
2. Cần giải quyết bài toán 1, bài toán 2
3. Các bước thực hiện
Bố trí dữ liệu
Sử dụng công cụ: Anova: Two-Factor Without Replication
Phân tích kết quả:
»
Xét giá trị F thực nghiệm và F lý thuyết tương ứng với các nhân tố,
nếu F thực nghiệm > F lý thuyết thì kết luận các mức của nhân tố
tương ứng có ảnh hưởng khác nhau tới kết quả và ngược lại
8
Phân tích phương sai hai nhân tố tương tác
1. Xét đến cả tác động đồng thời của 2 nhân tố A, B
2. Cần giải quyết 3 bài toán về phân tích phương sai
3. Các bước thực hiện
Bố trí dữ liệu
Sử dụng công cụ Anova: Two Factor With Replication
Phân tích kết quả
»
Xét giá trị F thực nghiệm và F lý thuyết tương ứng với các nhân tố,
nếu F thực nghiệm > F lý thuyết thì kết luận các mức của nhân tố
tương ứng có ảnh hưởng khác nhau tới kết quả (chấp nhận H1) và
ngược lại (chấp nhận H0)
»
Xét giá trị F tn và F lt tương ứng với tác động đồng thời của hai
nhân tố (interaction), nếu Ftn > Flt thì chấp nhận H1, tác động đồng
thời là đáng kể tới kết quả, ngược lại chấp nhận H0
9
2. Kiểm định sự bằng nhau của hai
phương sai
Kiểm định hai phía
»
H
0
: δ
1
2 =
δ
2
2
(phương sai của biến X bằng phương sai
của biến Y)
»
Đối thuyết H
1
:
δ
1
2
≠
δ
2
2
Kiểm định một phía
»
H
0
: δ
1
2 =
δ
2
2
(phương sai của biến X bằng phương sai
của biến Y)
»
Đối thuyết H
1
:
δ
1
2
>
δ
2
2
10
Phân tích kết quả
Trong Excel, sử dụng công cụ F-Test Two Sample
for Variances để kiểm định một phía
1. Nếu F < 1
nếu F > F Critical one-tail thì chấp nhận H
0
(δ
1
2 =
δ
2
2
)
ngược lại bác bỏ H
0
, chấp nhận H
1
δ
1
2 >
δ
2
2
1. Nếu F >= 1
nếu F < F Critical one-tail thì chấp nhận H
0
(δ
1
2 =
δ
2
2
)
ngược lại bác bỏ H
0
, chấp nhận H
1
δ
1
2 >
δ
2
2
3. So sánh trung bình 2 mẫu
•
Với X, Y là 2 DLNN độc lập, có phân phối chuẩn N(m
X
;
σ
2
X
), N(m
Y
; σ
2
Y
) ta có thể gặp các bài toán về kiểm định
giả thuyết giá trị trung bình của 2 mẫu như sau:
-
Kiểm định hai phía:
Giả thuyết H
0
: m
X
= m
Y
+d
Đối thuyết H
1
: m
X
≠ m
Y
+d
-
Kiểm định một phía:
Giả thuyết H
0
: m
X
= m
Y
+d
Đối thuyết H
1
: m
X
> m
Y
+d
hoặc
Giả thuyết H
0
: m
X
= m
Y
+d
Đối thuyết H
1
: m
X
< m
Y
+d
* Khi giá trị sai khác d=0 ta có bài toán kiểm định sự bằng nhau của 2 giá trị trung bình
3. So sánh trung bình 2 mẫu
Các trường hợp:
1. Lấy mẫu độc lập
TH biết phương sai σ
2
X
, σ
2
Y
TH không biết phương sai
»
Kích thước mẫu lớn (n
X
>=30; n
Y
>=30)
»
Kích thước mẫu nhỏ
•
Hai phương sai bằng nhau
•
Hai phương sai khác nhau
1. Lấy mẫu theo cặp
dữ liệu của 2 mẫu được lấy ngẫu
nhiên, 2 mẫu là độc lập với nhau
dữ liệu của 2 mẫu lấy theo từng cặp
tương ứng
3. So sánh trung bình 2 mẫu
1. So sánh TB 2 mẫu độc lập khi biết phương sai
σ
2
X
, σ
2
Y
Qui tắc kiểm định trong xác suất
»
Xét đại lượng Z=(X
tb
-Y
tb
-(m
X
-m
Y
)-d)/sqrt(σ
2
X
/n
X
+ σ
2
Y
/n
Y
) có phân
phối chuẩn tắc
»
Nếu giả thuyết H
0
đúng thì Z=(X
tb
-Y
tb
-d)/sqrt(σ
2
X
/n
X
+ σ
2
Y
/n
Y
) có
phân phối chuẩn tắc khi đó ta có bảng quy tắc kiểm định
sau:
* Trường hợp này được trình bày chi tiết, các trường hợp khác tương tự
Sử dụng khi trong một tình huống nào đó ta đã biết
được phương sai (thường xảy ra khi điều tra lại
một tổng thể sau một thời gian chưa lâu, nên
phương sai chưa thay đổi, do đó lấy phương sai
của lần điều tra trước để tính toán)