Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (477.67 KB, 34 trang )
<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>
• Gv: Trần Trung Hiếu
• Bộ mơn CNPM – Khoa CNTT – ĐH Nơng Nghiệp Hà Nội
• Email:
CHƯƠNG IV: PHÂN TÍCH PHƯƠNG SAI, SO SÁNH VÀ
KIỂM ĐỊNH
• Được sử dụng để phân tích số liệu khi theo dõi ảnh hưởng của các mức nhân tố tới
kết quả
<sub>Ví dụ:</sub>
» Nhân tố: Công thức cho lợn ăn Mức nhân tố là các công thức khác nhau Xem
ảnh hưởng tới năng suất như thế nào
<sub>Bài toán: Kiểm định giả thuyết về tác động giống nhau của các mức nhân tố</sub>
» H0: m1 = m2 =...=mn
» H1: tồn tại i, j mà mi khác mj
• Các bước thực hiện
• Chuẩn bị dữ liệu
• Dữ liệu có thể bố trí dưới dạng cột hay hàng
• Dữ liệu ứng với mỗi mức nhân tố có thể khác nhau
• Sử dụng cơng cụ Anova: Single Factor
• Phân tích kết quả
• Sử dụng trong trường hợp kết luận các mức nhân tố có tác động
khác nhau tới kết quả
• Sử dụng để chỉ rõ tác động khác nhau của các mức nhân tố tới
kết quả là ntn: xếp thứ tự về sự tác động của các mức nhân tố tới
kết quả
• Nếu cần so sánh trung bình CT Ti (với ri lần lặp) với trung bình
CT Tj (với rj lần lặp) có thể tính thêm chỉ số
<i>LSD = tα,f * SQRT(s2(1/ ri + 1/ rj )</i>
<i><sub>t</sub><sub>α,f </sub><sub>= TINV(α, f) với α = 1 – p; f = df & within groups</sub></i>
<i><sub>s</sub>2= MS within groups: Phương sai chung</i>
<i><sub>r</sub><sub>i</sub><sub>, r</sub><sub>j</sub><sub>: số lần lặp lại dữ liệu đối với các mức nhân tố i, j</sub></i>
1. Căn cứ kết luận
<i><sub>Nếu |m</sub><sub>i</sub><sub>-m</sub><sub>j</sub><sub>| > LSD(i,j) thì tác động của mức nhân tố i, j là khác nhau và </sub></i>
<i>ngược lại</i>
<i><sub>Trong TH khác nhau, nếu mi > mj thì KLuan mức nhân tố i tốt hơn mức </sub></i>
bón và nhiệt độ
2. Xảy ra hai trường hợp:
<sub>Nhân tố A và B không tương tác, biến động gây nên bởi tác động </sub>
đồng thời của A và B gần sát 0.
<sub>Nhân tố A và B có tương tác.</sub>
<sub>Bài tốn 1: Xét riêng tác động của các mức nhân tố A</sub>
» H0: m1 = m2 =...=mn
» H1: tồn tại i, j mà mi khác mj
<sub>Bài toán 2: Xét riêng tác động của các mức nhân tố B</sub>
» H0: m1 = m2 =...=mn
» H1: tồn tại i, j mà mi khác mj
<sub>Bài toán 3: Xét riêng tác động đồng thời của (A,B)</sub>
1. Không xét đến tác động đồng thời của hai nhân tố A, B
2. Cần giải quyết bài toán 1, bài toán 2
3. Các bước thực hiện
<sub>Bố trí dữ liệu</sub>
<sub>Sử dụng cơng cụ: Anova: Two-Factor Without Replication</sub>
<sub>Phân tích kết quả:</sub>
2. Cần giải quyết 3 bài tốn về phân tích phương sai
3. Các bước thực hiện
<sub>Bố trí dữ liệu</sub>
<sub>Sử dụng cơng cụ Anova: Two Factor With Replication</sub>
<sub>Phân tích kết quả</sub>
» Xét giá trị F thực nghiệm và F lý thuyết tương ứng với các nhân tố,
nếu F thực nghiệm > F lý thuyết thì kết luận các mức của nhân tố
tương ứng có ảnh hưởng khác nhau tới kết quả (chấp nhận H1) và
ngược lại (chấp nhận H0)
» H0: δ12 = δ22 (phương sai của biến X bằng phương
sai của biến Y)
» Đối thuyết H1: δ12 ≠ δ22
» H0: δ12 = δ22 (phương sai của biến X bằng phương
sai của biến Y)
nếu F > F Critical one-tail thì chấp nhận H<sub>0</sub> (δ<sub>12 = </sub>δ<sub>22</sub> )
<sub>ngược lại bác bỏ H</sub><sub>0</sub><sub>, chấp nhận H</sub><sub>1</sub><sub> δ</sub><sub>12 > </sub><sub>δ</sub><sub>22</sub>
• Với X, Y là 2 DLNN độc lập, có phân phối chuẩn N(mX;
σ<sub>2X</sub>), N(mY; σ2Y) ta có thể gặp các bài tốn về kiểm định
giả thuyết giá trị trung bình của 2 mẫu như sau:
- Kiểm định hai phía:
Giả thuyết H0: mX = mY+d
Đối thuyết H1: mX ≠ mY+d
- Kiểm định một phía:
Giả thuyết H0: mX = mY+d
Đối thuyết H1: mX > mY+d
hoặc
Giả thuyết H0: mX = mY+d
Đối thuyết H1: mX < mY+d
» Kích thước mẫu lớn (nX>=30; nY>=30)
» Kích thước mẫu nhỏ
• Hai phương sai bằng nhau
• Hai phương sai khác nhau
dữ liệu của 2 mẫu được lấy ngẫu
nhiên, 2 mẫu là độc lập với nhau
<sub>Qui tắc kiểm định trong xác suất</sub>
» Xét đại lượng Z=(Xtb-Ytb-(mX-mY)-d)/sqrt(σ2X/nX+ σ2Y/nY) có
phân phối chuẩn tắc
» Nếu giả thuyết H0 đúng thì Z=(Xtb-Ytb-d)/sqrt(σ2X/nX+ σ2Y/nY)
có phân phối chuẩn tắc khi đó ta có bảng quy tắc kiểm định
sau:
* Trường hợp này được trình bày chi tiết, các trường hợp khác tương tự
<i>Sử dụng khi trong một tình huống nào đó ta đã biết </i>
<i>được phương sai (thường xảy ra khi điều tra lại </i>
<i>một tổng thể sau một thời gian chưa lâu, nên </i>
<i>phương sai chưa thay đổi, do đó lấy phương sai </i>
H<sub>0</sub>: m<sub>X</sub> = m<sub>Y</sub>+d
H<sub>1</sub>: m<sub>X</sub> ≠ m<sub>Y</sub>+d
H<sub>0</sub>: m<sub>X</sub> = m<sub>Y</sub>+d
H<sub>1</sub>: m<sub>X</sub> > m<sub>Y</sub>+d
H<sub>0</sub>: m<sub>X</sub> = m<sub>Y</sub>+d
H<sub>1</sub>: m<sub>X</sub> < m<sub>Y</sub>+d
Ta có: P(|Z|>Z<sub>α/2</sub>)=α
từ đây có quy tắc
bác bỏ H<sub>0</sub> là:
+Nếu |Z|>Z<sub>α/2</sub> quyết
định bác bỏ H<sub>0</sub>
+Nếu |Z|<=Z<sub>α/2</sub> quyết
định chấp nhận H<sub>0</sub>
Ta có: P(Z>Z<sub>α</sub>)=α từ
+Nếu Z>Z<sub>α</sub> quyết
định bác bỏ H<sub>0</sub>
+Nếu Z<=Z<sub>α</sub> quyết
định chấp nhận H<sub>0</sub>
Ta có: P(Z<-Z<sub>α</sub>)=α từ
đây có quy tắc bác
bỏ H<sub>0</sub> là:
+Nếu Z<-Z<sub>α</sub> quyết
định bác bỏ H<sub>0</sub>
» So sánh giá trị trung bình của số cừu mắc bệnh
trong 8 nhóm tiêm phịng và 8 nhóm đối chứng.
Mẫu được lấy độc lập, biết phương sai tương
ứng là 22, 18.
Miền biến 1
Giả thiết về sự
khác nhau của hai
trung bình (d)
Miền biến 2
Giả thiết sự khác nhau
của hai trung bình (d)
Số quan sát
Phương sai
Trung bình
Z thực nghiệm
X
1. Kiểm định 2 phía
Nếu |Z<sub>tn</sub>|> Z<sub>hai phía</sub> (z critical two-tail) thì bác bỏ giả thuyết H<sub>0</sub>, chấp
nhận H1 (mX≠mY+d)
<sub>Nếu |Z</sub><sub>tn</sub><sub>|<= Z</sub><sub>hai phía</sub><sub> (z critical two-tail) thì chấp nhận giả thuyết H</sub><sub>0</sub>
(mX=mY+d)
2. Kiểm định một phía
<sub>Nếu Z</sub><sub>tn</sub><sub>>0 ta có bài toán kiểm định</sub>
H0: mX = mY+d
H1: mX > mY+d
» Nếu Ztn> Zmột phía (z critical one-tail) thì bác bỏ H0 và ngược lại
<sub>Nếu Z</sub><sub>tn</sub><sub><0 ta có bài tốn kiểm định</sub>
H0: mX = mY+d
H1: mX < mY+d
Kiểm định 2 phía:
Ta có |z|=2.068>z<sub>2 phía</sub>
nên bác bỏ giả thiết
H<sub>0 </sub>(m<sub>X</sub>=m<sub>Y</sub>)
Kiểm định 1 phía:
Xét đại lượng Z=(X<sub>tb</sub>-Y<sub>tb</sub>-(m<sub>X</sub>-m<sub>Y</sub>)-d)/sqrt(s<sub>2X</sub>/n<sub>X</sub>+
s<sub>2Y</sub>/nY) có phân phối xấp xỉ phân phối chuẩn tắc
(trong đó s2X, s2Y là các giá trị xấp xỉ của phương sai σ2X, σ 2Y có thể tính được bằng hàm
VAR)
<sub>Tương tự trường hợp đã biết phương sai, thay thế </sub>
s2X bởi σ2X, s2Y bởi σ2Y và sử dụng công cụ z-Test:
3. So sánh trung bình 2 mẫu độc lập trường hợp khơng
biết phương sai và kích thước mẫu nhỏ (nX<30 và
nY<30)
<sub>Để giải quyết bài tốn này ta </sub><sub>cần có giả thiết về sự bằng nhau </sub>
hay khác nhau của 2 phương sai σ<sub>2X</sub>, σ<sub>2Y</sub>
<sub>Nếu đề bài chưa cho biết thơng tin đó, cần </sub><sub>kiểm định thêm </sub>
một giả thuyết phụ về sự bằng nhau hay khác nhau của 2
phương sai σ2X, σ2Y đã học ở bài trước (sử dụng công cụ
F-Test: Two-Sample for Variances)
» Nếu σ2X = σ2Y ta giải quyết bài tốn sử dụng cơng cụ phân tích <b></b>
<b>t-Test: Two-Sample Assuming Equal Variances</b>
<b>Ví dụ 1: t-Test: Two-Sample Assuming Equal Variances </b>
Trung bình
Phương sai
Số quan sát
Giả thiết sự khác nhau
t thực nghiệm
P một phía và hai phía
t lý thuyết (tới hạn) một
phía và hai phía
Phương sai chung
Bậc tự do = n1 + n2 -2
<sub>Kiểm định 2 phía</sub>
» Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H0 và
ngược lại
» Trong ví dụ 1: |ttn|=1.5187<thai phía=2.009 nên chấp nhận H0
(mX=mY). Giá trị Phai phía> α là phù hợp với kết luận trên
<sub>Kiểm định một phía</sub>
» Nếu ttn>0 ta có bài tốn kiểm định
H0: mX = mY+d
H1: mX > mY+d
• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại
» Nếu ttn<0 ta có bài tốn kiểm định
<b>Ví dụ 2: t-Test: Two-Sample Assuming Unequal Variances</b>
<b>t-Test: Two-Sample Assuming Unequal Variances</b>
1. Căn cứ để kết luận (giống trường hợp 2 phương sai bằng nhau, chỉ
khác ở giá trị ttn do khác về cơng thức tính)
<sub>Kiểm định 2 phía</sub>
» Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H0 và ngược
lại
» Trong ví dụ 2: |ttn|=1.7133<thai phía=2.009 nên chấp nhận H0 (mX=mY).
Giá trị Phai phía> α là phù hợp với kết luận trên
<sub>Kiểm định một phía</sub>
» Nếu ttn>0 ta có bài tốn kiểm định
H0: mX = mY+d
H1: mX > mY+d
• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại
» Nếu ttn<0 ta có bài tốn kiểm định
H0: mX = mY+d
H1: mX < mY+d
Miền của biến 1, kể cả
hàng đầu của mẫu quan
sát.
Miền của biến 2
Giả thiết về hiệu hai
trung bình của hai tổng
thể. H0: m1 = m2 thì ghi
0. Nếu H0: m1 = m2 + d
thì ghi d
1. Căn cứ để kết luận (giống trường hợp so sánh trung bình 2 mẫu độc lập có
<sub>Kiểm định 2 phía</sub>
» Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H0 và ngược lại
» Trong ví dụ trên: |ttn|=3.3105>thai phía=2.3646 nên chấp nhận H1
(mX≠mY). Giá trị Phai phía<α là phù hợp với kết luận trên
<sub>Kiểm định một phía</sub>
» Nếu ttn>0 ta có bài tốn kiểm định
H0: mX = mY+d
H1: mX > mY+d
• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại
• Trong ví dụ trên: ttn>0 và ttn> tmột phía=1.8945 nên chấp nhận H1 (mX > mY).
Giá trị Pmột phía<α là phù hợp với kết luận trên
» Nếu ttn<0 ta có bài tốn kiểm định