Tải bản đầy đủ (.ppt) (34 trang)

baigiangtinud_tthieu_ch4

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (477.67 KB, 34 trang )

<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>

Bài giảng tin ứng dụng



• Gv: Trần Trung Hiếu


• Bộ mơn CNPM – Khoa CNTT – ĐH Nơng Nghiệp Hà Nội
• Email:


</div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>

CHƯƠNG IV: PHÂN TÍCH PHƯƠNG SAI, SO SÁNH VÀ
KIỂM ĐỊNH


Nội dung:



<sub>Phân tích phương sai</sub>



</div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3>

Phân tích phương sai


• Ví dụ



</div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4>

1.1 Phân tích phương sai một nhân tố



• Được sử dụng để phân tích số liệu khi theo dõi ảnh hưởng của các mức nhân tố tới
kết quả


 <sub>Ví dụ:</sub>


» Nhân tố: Công thức cho lợn ăn  Mức nhân tố là các công thức khác nhau  Xem


ảnh hưởng tới năng suất như thế nào


 <sub>Bài toán: Kiểm định giả thuyết về tác động giống nhau của các mức nhân tố</sub>


» H0: m1 = m2 =...=mn



» H1: tồn tại i, j mà mi khác mj


• Các bước thực hiện


• Chuẩn bị dữ liệu


• Dữ liệu có thể bố trí dưới dạng cột hay hàng


• Dữ liệu ứng với mỗi mức nhân tố có thể khác nhau


• Sử dụng cơng cụ Anova: Single Factor
• Phân tích kết quả


</div>
<span class='text_page_counter'>(5)</span><div class='page_container' data-page=5>

So sánh các trung bình dùng chỉ số LSD



• Sử dụng trong trường hợp kết luận các mức nhân tố có tác động
khác nhau tới kết quả


• Sử dụng để chỉ rõ tác động khác nhau của các mức nhân tố tới
kết quả là ntn: xếp thứ tự về sự tác động của các mức nhân tố tới
kết quả


• Nếu cần so sánh trung bình CT Ti (với ri lần lặp) với trung bình
CT Tj (với rj lần lặp) có thể tính thêm chỉ số


<i>LSD = tα,f * SQRT(s2(1/ ri + 1/ rj )</i>


 <i><sub>t</sub><sub>α,f </sub><sub>= TINV(α, f) với α = 1 – p; f = df & within groups</sub></i>
 <i><sub>s</sub>2= MS within groups: Phương sai chung</i>



 <i><sub>r</sub><sub>i</sub><sub>, r</sub><sub>j</sub><sub>: số lần lặp lại dữ liệu đối với các mức nhân tố i, j</sub></i>


1. Căn cứ kết luận


 <i><sub>Nếu |m</sub><sub>i</sub><sub>-m</sub><sub>j</sub><sub>| > LSD(i,j) thì tác động của mức nhân tố i, j là khác nhau và </sub></i>


<i>ngược lại</i>


 <i><sub>Trong TH khác nhau, nếu mi > mj thì KLuan mức nhân tố i tốt hơn mức </sub></i>


</div>
<span class='text_page_counter'>(6)</span><div class='page_container' data-page=6>

Phân tích phương sai hai nhân tố


1. Ví dụ: Điều tra về chiều dài của cây, hai nhân tố xét đến là phân


bón và nhiệt độ


2. Xảy ra hai trường hợp:


 <sub>Nhân tố A và B không tương tác, biến động gây nên bởi tác động </sub>
đồng thời của A và B gần sát 0.


 <sub>Nhân tố A và B có tương tác.</sub>


 <sub>Bài tốn 1: Xét riêng tác động của các mức nhân tố A</sub>


» H0: m1 = m2 =...=mn


» H1: tồn tại i, j mà mi khác mj


 <sub>Bài toán 2: Xét riêng tác động của các mức nhân tố B</sub>



» H0: m1 = m2 =...=mn


» H1: tồn tại i, j mà mi khác mj


 <sub>Bài toán 3: Xét riêng tác động đồng thời của (A,B)</sub>


</div>
<span class='text_page_counter'>(7)</span><div class='page_container' data-page=7>

Phân tích phương sai hai nhân tố không


tương tác



1. Không xét đến tác động đồng thời của hai nhân tố A, B
2. Cần giải quyết bài toán 1, bài toán 2


3. Các bước thực hiện


 <sub>Bố trí dữ liệu</sub>


 <sub>Sử dụng cơng cụ: Anova: Two-Factor Without Replication</sub>
 <sub>Phân tích kết quả:</sub>


</div>
<span class='text_page_counter'>(8)</span><div class='page_container' data-page=8>

Phân tích phương sai hai nhân tố tương tác


1. Xét đến cả tác động đồng thời của 2 nhân tố A, B


2. Cần giải quyết 3 bài tốn về phân tích phương sai
3. Các bước thực hiện


 <sub>Bố trí dữ liệu</sub>


 <sub>Sử dụng cơng cụ Anova: Two Factor With Replication</sub>
 <sub>Phân tích kết quả</sub>



» Xét giá trị F thực nghiệm và F lý thuyết tương ứng với các nhân tố,
nếu F thực nghiệm > F lý thuyết thì kết luận các mức của nhân tố
tương ứng có ảnh hưởng khác nhau tới kết quả (chấp nhận H1) và
ngược lại (chấp nhận H0)


</div>
<span class='text_page_counter'>(9)</span><div class='page_container' data-page=9>

2. Kiểm định sự bằng nhau của hai


phương sai



<sub>Kiểm định hai phía </sub>



» H0: δ12 = δ22 (phương sai của biến X bằng phương


sai của biến Y)


» Đối thuyết H1: δ12 ≠ δ22


<sub>Kiểm định một phía </sub>



» H0: δ12 = δ22 (phương sai của biến X bằng phương


sai của biến Y)


</div>
<span class='text_page_counter'>(10)</span><div class='page_container' data-page=10>

Phân tích kết quả



Trong Excel, sử dụng công cụ F-Test Two Sample


for Variances để kiểm định một phía



1. Nếu F < 1




 nếu F > F Critical one-tail thì chấp nhận H<sub>0</sub> (δ<sub>12 = </sub>δ<sub>22</sub> )
 <sub>ngược lại bác bỏ H</sub><sub>0</sub><sub>, chấp nhận H</sub><sub>1</sub><sub> δ</sub><sub>12 > </sub><sub>δ</sub><sub>22</sub>


2. Nếu F >= 1



</div>
<span class='text_page_counter'>(11)</span><div class='page_container' data-page=11>

3. So sánh trung bình 2 mẫu



• Với X, Y là 2 DLNN độc lập, có phân phối chuẩn N(mX;


σ<sub>2X</sub>), N(mY; σ2Y) ta có thể gặp các bài tốn về kiểm định


giả thuyết giá trị trung bình của 2 mẫu như sau:


- Kiểm định hai phía:


Giả thuyết H0: mX = mY+d
Đối thuyết H1: mX ≠ mY+d


- Kiểm định một phía:


Giả thuyết H0: mX = mY+d
Đối thuyết H1: mX > mY+d


hoặc


Giả thuyết H0: mX = mY+d
Đối thuyết H1: mX < mY+d


</div>
<span class='text_page_counter'>(12)</span><div class='page_container' data-page=12>

3. So sánh trung bình 2 mẫu




Các trường hợp:



1. Lấy mẫu độc lập



TH biết phương sai σ

<sub>2X</sub>

, σ

<sub>2Y </sub>

<sub>TH không biết phương sai</sub>



» Kích thước mẫu lớn (nX>=30; nY>=30)


» Kích thước mẫu nhỏ


• Hai phương sai bằng nhau
• Hai phương sai khác nhau


dữ liệu của 2 mẫu được lấy ngẫu
nhiên, 2 mẫu là độc lập với nhau


</div>
<span class='text_page_counter'>(13)</span><div class='page_container' data-page=13>

3. So sánh trung bình 2 mẫu



1. So sánh TB 2 mẫu độc lập khi biết phương sai


σ

<sub>2X</sub>

, σ

<sub>2Y </sub>


 <sub>Qui tắc kiểm định trong xác suất</sub>


» Xét đại lượng Z=(Xtb-Ytb-(mX-mY)-d)/sqrt(σ2X/nX+ σ2Y/nY) có
phân phối chuẩn tắc


» Nếu giả thuyết H0 đúng thì Z=(Xtb-Ytb-d)/sqrt(σ2X/nX+ σ2Y/nY)
có phân phối chuẩn tắc khi đó ta có bảng quy tắc kiểm định
sau:



* Trường hợp này được trình bày chi tiết, các trường hợp khác tương tự


<i>Sử dụng khi trong một tình huống nào đó ta đã biết </i>
<i>được phương sai (thường xảy ra khi điều tra lại </i>


<i>một tổng thể sau một thời gian chưa lâu, nên </i>
<i>phương sai chưa thay đổi, do đó lấy phương sai </i>


</div>
<span class='text_page_counter'>(14)</span><div class='page_container' data-page=14>

H<sub>0</sub>: m<sub>X</sub> = m<sub>Y</sub>+d
H<sub>1</sub>: m<sub>X</sub> ≠ m<sub>Y</sub>+d


H<sub>0</sub>: m<sub>X</sub> = m<sub>Y</sub>+d
H<sub>1</sub>: m<sub>X</sub> > m<sub>Y</sub>+d


H<sub>0</sub>: m<sub>X</sub> = m<sub>Y</sub>+d
H<sub>1</sub>: m<sub>X</sub> < m<sub>Y</sub>+d


Ta có: P(|Z|>Z<sub>α/2</sub>)=α


từ đây có quy tắc
bác bỏ H<sub>0</sub> là:


+Nếu |Z|>Z<sub>α/2</sub> quyết
định bác bỏ H<sub>0</sub>


+Nếu |Z|<=Z<sub>α/2</sub> quyết
định chấp nhận H<sub>0</sub>


Ta có: P(Z>Z<sub>α</sub>)=α từ


đây có quy tắc bác
bỏ H<sub>0</sub> là:


+Nếu Z>Z<sub>α</sub> quyết
định bác bỏ H<sub>0</sub>


+Nếu Z<=Z<sub>α</sub> quyết
định chấp nhận H<sub>0</sub>


Ta có: P(Z<-Z<sub>α</sub>)=α từ
đây có quy tắc bác
bỏ H<sub>0</sub> là:


+Nếu Z<-Z<sub>α</sub> quyết
định bác bỏ H<sub>0</sub>


</div>
<span class='text_page_counter'>(15)</span><div class='page_container' data-page=15>

3. So sánh trung bình 2 mẫu



1. So sánh TB 2 mẫu độc lập khi biết



phương sai σ

2X

, σ

2Y


<sub>Ví dụ:</sub>



» So sánh giá trị trung bình của số cừu mắc bệnh
trong 8 nhóm tiêm phịng và 8 nhóm đối chứng.
Mẫu được lấy độc lập, biết phương sai tương
ứng là 22, 18.


</div>
<span class='text_page_counter'>(16)</span><div class='page_container' data-page=16>

Tool

Data Analysis, chọn công cụ phân




</div>
<span class='text_page_counter'>(17)</span><div class='page_container' data-page=17>

Hiện cửa sổ



Miền biến 1


Giả thiết về sự


khác nhau của hai
trung bình (d)


Miền biến 2


</div>
<span class='text_page_counter'>(18)</span><div class='page_container' data-page=18>

Kết quả



Giả thiết sự khác nhau
của hai trung bình (d)
Số quan sát


Phương sai
Trung bình


Z thực nghiệm


</div>
<span class='text_page_counter'>(19)</span><div class='page_container' data-page=19>

1. So sánh TB 2 mẫu độc lập khi biết



phương sai σ

2


X

, σ

2Y
* Căn cứ để kết luận



1. Kiểm định 2 phía


 Nếu |Z<sub>tn</sub>|> Z<sub>hai phía</sub> (z critical two-tail) thì bác bỏ giả thuyết H<sub>0</sub>, chấp


nhận H1 (mX≠mY+d)


 <sub>Nếu |Z</sub><sub>tn</sub><sub>|<= Z</sub><sub>hai phía</sub><sub> (z critical two-tail) thì chấp nhận giả thuyết H</sub><sub>0</sub>


(mX=mY+d)


2. Kiểm định một phía


 <sub>Nếu Z</sub><sub>tn</sub><sub>>0 ta có bài toán kiểm định</sub>


H0: mX = mY+d


H1: mX > mY+d


» Nếu Ztn> Zmột phía (z critical one-tail) thì bác bỏ H0 và ngược lại


 <sub>Nếu Z</sub><sub>tn</sub><sub><0 ta có bài tốn kiểm định</sub>


H0: mX = mY+d


H1: mX < mY+d


</div>
<span class='text_page_counter'>(20)</span><div class='page_container' data-page=20>

Phân tích kết quả



Kiểm định 2 phía:



Ta có |z|=2.068>z<sub>2 phía</sub>
nên bác bỏ giả thiết
H<sub>0 </sub>(m<sub>X</sub>=m<sub>Y</sub>)


Kiểm định 1 phía:


</div>
<span class='text_page_counter'>(21)</span><div class='page_container' data-page=21>

Thực hành



1. Sinh viên thực hành ví dụ vừa rồi với dữ



liệu đảo ngược như sau (σ

2X

=22,



</div>
<span class='text_page_counter'>(22)</span><div class='page_container' data-page=22>

3. So sánh trung bình 2 mẫu



2. So sánh trung bình 2 mẫu độc lập trường hợp


khơng biết phương sai và kích thước mẫu lớn


lớn (n

X

>=30, n

Y

>=30)



 Xét đại lượng Z=(X<sub>tb</sub>-Y<sub>tb</sub>-(m<sub>X</sub>-m<sub>Y</sub>)-d)/sqrt(s<sub>2X</sub>/n<sub>X</sub>+


s<sub>2Y</sub>/nY) có phân phối xấp xỉ phân phối chuẩn tắc


 (trong đó s2X, s2Y là các giá trị xấp xỉ của phương sai σ2X, σ 2Y có thể tính được bằng hàm


VAR)


 <sub>Tương tự trường hợp đã biết phương sai, thay thế </sub>


s2X bởi σ2X, s2Y bởi σ2Y và sử dụng công cụ z-Test:



</div>
<span class='text_page_counter'>(23)</span><div class='page_container' data-page=23>

3. So sánh trung bình 2 mẫu



3. So sánh trung bình 2 mẫu độc lập trường hợp khơng
biết phương sai và kích thước mẫu nhỏ (nX<30 và


nY<30)


 <sub>Để giải quyết bài tốn này ta </sub><sub>cần có giả thiết về sự bằng nhau </sub>


hay khác nhau của 2 phương sai σ<sub>2X</sub>, σ<sub>2Y</sub>


 <sub>Nếu đề bài chưa cho biết thơng tin đó, cần </sub><sub>kiểm định thêm </sub>


một giả thuyết phụ về sự bằng nhau hay khác nhau của 2
phương sai σ2X, σ2Y đã học ở bài trước (sử dụng công cụ
F-Test: Two-Sample for Variances)


» Nếu σ2X = σ2Y ta giải quyết bài tốn sử dụng cơng cụ phân tích <b></b>


<b>t-Test: Two-Sample Assuming Equal Variances</b>


</div>
<span class='text_page_counter'>(24)</span><div class='page_container' data-page=24>

<b>Ví dụ 1: t-Test: Two-Sample Assuming Equal Variances </b>


</div>
<span class='text_page_counter'>(25)</span><div class='page_container' data-page=25>

Ví dụ 1: Kết quả



Trung bình
Phương sai
Số quan sát


Giả thiết sự khác nhau


của hai trung bình


t thực nghiệm


P một phía và hai phía
t lý thuyết (tới hạn) một
phía và hai phía


Phương sai chung


Bậc tự do = n1 + n2 -2


</div>
<span class='text_page_counter'>(26)</span><div class='page_container' data-page=26>

<b>t-Test: Two-Sample Assuming </b>

<b>Equal</b>

<b> Variances</b>



1. Căn cứ để kết luận



 <sub>Kiểm định 2 phía</sub>


» Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H0 và


ngược lại


» Trong ví dụ 1: |ttn|=1.5187<thai phía=2.009 nên chấp nhận H0


(mX=mY). Giá trị Phai phía> α là phù hợp với kết luận trên


 <sub>Kiểm định một phía</sub>


» Nếu ttn>0 ta có bài tốn kiểm định
H0: mX = mY+d



H1: mX > mY+d


• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại
» Nếu ttn<0 ta có bài tốn kiểm định


</div>
<span class='text_page_counter'>(27)</span><div class='page_container' data-page=27>

<b>Ví dụ 2: t-Test: Two-Sample Assuming Unequal Variances</b>


</div>
<span class='text_page_counter'>(28)</span><div class='page_container' data-page=28></div>
<span class='text_page_counter'>(29)</span><div class='page_container' data-page=29>

<b>t-Test: Two-Sample Assuming Unequal Variances</b>


1. Căn cứ để kết luận (giống trường hợp 2 phương sai bằng nhau, chỉ
khác ở giá trị ttn do khác về cơng thức tính)


 <sub>Kiểm định 2 phía</sub>


» Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H0 và ngược
lại


» Trong ví dụ 2: |ttn|=1.7133<thai phía=2.009 nên chấp nhận H0 (mX=mY).


Giá trị Phai phía> α là phù hợp với kết luận trên


 <sub>Kiểm định một phía</sub>


» Nếu ttn>0 ta có bài tốn kiểm định


H0: mX = mY+d


H1: mX > mY+d



• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại


» Nếu ttn<0 ta có bài tốn kiểm định


H0: mX = mY+d


H1: mX < mY+d


</div>
<span class='text_page_counter'>(30)</span><div class='page_container' data-page=30>

3. So sánh trung bình 2 mẫu



3. So sánh trung bình 2 mẫu được lấy theo


cặp



</div>
<span class='text_page_counter'>(31)</span><div class='page_container' data-page=31></div>
<span class='text_page_counter'>(32)</span><div class='page_container' data-page=32>

Hiện ra của sổ



Miền của biến 1, kể cả
hàng đầu của mẫu quan
sát.


Miền của biến 2


Giả thiết về hiệu hai
trung bình của hai tổng
thể. H0: m1 = m2 thì ghi
0. Nếu H0: m1 = m2 + d
thì ghi d


</div>
<span class='text_page_counter'>(33)</span><div class='page_container' data-page=33></div>
<span class='text_page_counter'>(34)</span><div class='page_container' data-page=34>

<b>t-Test: Paired Two Sample for Means</b>



1. Căn cứ để kết luận (giống trường hợp so sánh trung bình 2 mẫu độc lập có


kích thước mẫu nhỏ)


 <sub>Kiểm định 2 phía</sub>


» Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H0 và ngược lại


» Trong ví dụ trên: |ttn|=3.3105>thai phía=2.3646 nên chấp nhận H1


(mX≠mY). Giá trị Phai phía<α là phù hợp với kết luận trên


 <sub>Kiểm định một phía</sub>


» Nếu ttn>0 ta có bài tốn kiểm định


H0: mX = mY+d


H1: mX > mY+d


• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại


• Trong ví dụ trên: ttn>0 và ttn> tmột phía=1.8945 nên chấp nhận H1 (mX > mY).
Giá trị Pmột phía<α là phù hợp với kết luận trên


» Nếu ttn<0 ta có bài tốn kiểm định


</div>

<!--links-->
baigiangtinud_tthieu_ch4
  • 34
  • 3
  • 0

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×