baigiangtinud_tthieu_ch4

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (477.67 KB, 34 trang )

(1)<div class='page_container' data-page=1>

Bài giảng tin ứng dụng

• Gv: Trần Trung Hiếu

• Bộ mơn CNPM – Khoa CNTT – ĐH Nơng Nghiệp Hà Nội
• Email:

</div>
(2)<div class='page_container' data-page=2>

CHƯƠNG IV: PHÂN TÍCH PHƯƠNG SAI, SO SÁNH VÀ
KIỂM ĐỊNH

Nội dung:



Phân tích phương sai

</div>
(3)<div class='page_container' data-page=3>

Phân tích phương sai

• Ví dụ

</div>
(4)<div class='page_container' data-page=4>

1.1 Phân tích phương sai một nhân tố

• Được sử dụng để phân tích số liệu khi theo dõi ảnh hưởng của các mức nhân tố tới
kết quả

 Ví dụ:

» Nhân tố: Công thức cho lợn ăn  Mức nhân tố là các công thức khác nhau  Xem

ảnh hưởng tới năng suất như thế nào

 Bài toán: Kiểm định giả thuyết về tác động giống nhau của các mức nhân tố

» H0: m1 = m2 =...=mn

» H1: tồn tại i, j mà mi khác mj

• Các bước thực hiện

• Chuẩn bị dữ liệu

• Dữ liệu có thể bố trí dưới dạng cột hay hàng

• Dữ liệu ứng với mỗi mức nhân tố có thể khác nhau

• Sử dụng cơng cụ Anova: Single Factor
• Phân tích kết quả

</div>
(5)<div class='page_container' data-page=5>

So sánh các trung bình dùng chỉ số LSD

• Sử dụng trong trường hợp kết luận các mức nhân tố có tác động
khác nhau tới kết quả

• Sử dụng để chỉ rõ tác động khác nhau của các mức nhân tố tới
kết quả là ntn: xếp thứ tự về sự tác động của các mức nhân tố tới
kết quả

• Nếu cần so sánh trung bình CT Ti (với ri lần lặp) với trung bình
CT Tj (với rj lần lặp) có thể tính thêm chỉ số

LSD = tα,f * SQRT(s2(1/ ri + 1/ rj )

 tα,f = TINV(α, f) với α = 1 – p; f = df & within groups
 s2= MS within groups: Phương sai chung

 ri, rj: số lần lặp lại dữ liệu đối với các mức nhân tố i, j

1. Căn cứ kết luận

 Nếu |mi-mj| > LSD(i,j) thì tác động của mức nhân tố i, j là khác nhau và

ngược lại

 Trong TH khác nhau, nếu mi > mj thì KLuan mức nhân tố i tốt hơn mức

</div>
(6)<div class='page_container' data-page=6>

Phân tích phương sai hai nhân tố

1. Ví dụ: Điều tra về chiều dài của cây, hai nhân tố xét đến là phân

bón và nhiệt độ

2. Xảy ra hai trường hợp:

 Nhân tố A và B không tương tác, biến động gây nên bởi tác động 
đồng thời của A và B gần sát 0.

 Nhân tố A và B có tương tác.

 Bài tốn 1: Xét riêng tác động của các mức nhân tố A

» H0: m1 = m2 =...=mn

» H1: tồn tại i, j mà mi khác mj

 Bài toán 2: Xét riêng tác động của các mức nhân tố B

» H0: m1 = m2 =...=mn

» H1: tồn tại i, j mà mi khác mj

 Bài toán 3: Xét riêng tác động đồng thời của (A,B)

</div>
(7)<div class='page_container' data-page=7>

Phân tích phương sai hai nhân tố không

tương tác

1. Không xét đến tác động đồng thời của hai nhân tố A, B
2. Cần giải quyết bài toán 1, bài toán 2

3. Các bước thực hiện

 Bố trí dữ liệu

 Sử dụng cơng cụ: Anova: Two-Factor Without Replication
 Phân tích kết quả:

</div>
(8)<div class='page_container' data-page=8>

Phân tích phương sai hai nhân tố tương tác

1. Xét đến cả tác động đồng thời của 2 nhân tố A, B

2. Cần giải quyết 3 bài tốn về phân tích phương sai
3. Các bước thực hiện

 Bố trí dữ liệu

 Sử dụng cơng cụ Anova: Two Factor With Replication
 Phân tích kết quả

» Xét giá trị F thực nghiệm và F lý thuyết tương ứng với các nhân tố,
nếu F thực nghiệm > F lý thuyết thì kết luận các mức của nhân tố
tương ứng có ảnh hưởng khác nhau tới kết quả (chấp nhận H1) và
ngược lại (chấp nhận H0)

</div>
(9)<div class='page_container' data-page=9>

2. Kiểm định sự bằng nhau của hai

phương sai



Kiểm định hai phía

» H0: δ12 = δ22 (phương sai của biến X bằng phương

sai của biến Y)

» Đối thuyết H1: δ12 ≠ δ22



Kiểm định một phía

» H0: δ12 = δ22 (phương sai của biến X bằng phương

sai của biến Y)

</div>
(10)<div class='page_container' data-page=10>

Phân tích kết quả

Trong Excel, sử dụng công cụ F-Test Two Sample

for Variances để kiểm định một phía

1. Nếu F < 1

 nếu F > F Critical one-tail thì chấp nhận H0 (δ12 = δ22 )
 ngược lại bác bỏ H0, chấp nhận H1 δ12 > δ22

2. Nếu F >= 1

</div>
(11)<div class='page_container' data-page=11>

3. So sánh trung bình 2 mẫu

• Với X, Y là 2 DLNN độc lập, có phân phối chuẩn N(mX;

σ2X), N(mY; σ2Y) ta có thể gặp các bài tốn về kiểm định

giả thuyết giá trị trung bình của 2 mẫu như sau:

- Kiểm định hai phía:

Giả thuyết H0: mX = mY+d
Đối thuyết H1: mX ≠ mY+d

- Kiểm định một phía:

Giả thuyết H0: mX = mY+d
Đối thuyết H1: mX > mY+d

hoặc

Giả thuyết H0: mX = mY+d
Đối thuyết H1: mX < mY+d

</div>
(12)<div class='page_container' data-page=12>

3. So sánh trung bình 2 mẫu

Các trường hợp:

1. Lấy mẫu độc lập



TH biết phương sai σ

2X

, σ

2Y



TH không biết phương sai

» Kích thước mẫu lớn (nX>=30; nY>=30)

» Kích thước mẫu nhỏ

• Hai phương sai bằng nhau
• Hai phương sai khác nhau

dữ liệu của 2 mẫu được lấy ngẫu
nhiên, 2 mẫu là độc lập với nhau

</div>
(13)<div class='page_container' data-page=13>

3. So sánh trung bình 2 mẫu

1. So sánh TB 2 mẫu độc lập khi biết phương sai

σ

2X

, σ

2Y

 Qui tắc kiểm định trong xác suất

» Xét đại lượng Z=(Xtb-Ytb-(mX-mY)-d)/sqrt(σ2X/nX+ σ2Y/nY) có
phân phối chuẩn tắc

» Nếu giả thuyết H0 đúng thì Z=(Xtb-Ytb-d)/sqrt(σ2X/nX+ σ2Y/nY)
có phân phối chuẩn tắc khi đó ta có bảng quy tắc kiểm định
sau:

* Trường hợp này được trình bày chi tiết, các trường hợp khác tương tự

Sử dụng khi trong một tình huống nào đó ta đã biết 
được phương sai (thường xảy ra khi điều tra lại

một tổng thể sau một thời gian chưa lâu, nên 
phương sai chưa thay đổi, do đó lấy phương sai

</div>
(14)<div class='page_container' data-page=14>

H0: mX = mY+d
H1: mX ≠ mY+d

H0: mX = mY+d
H1: mX > mY+d

H0: mX = mY+d
H1: mX < mY+d

Ta có: P(|Z|>Zα/2)=α

từ đây có quy tắc
bác bỏ H0 là:

+Nếu |Z|>Zα/2 quyết
định bác bỏ H0

+Nếu |Z|<=Zα/2 quyết
định chấp nhận H0

Ta có: P(Z>Zα)=α từ

đây có quy tắc bác
bỏ H0 là:

+Nếu Z>Zα quyết
định bác bỏ H0

+Nếu Z<=Zα quyết
định chấp nhận H0

Ta có: P(Z<-Zα)=α từ
đây có quy tắc bác
bỏ H0 là:

+Nếu Z<-Zα quyết
định bác bỏ H0

</div>
(15)<div class='page_container' data-page=15>

3. So sánh trung bình 2 mẫu

1. So sánh TB 2 mẫu độc lập khi biết

phương sai σ

, σ



Ví dụ:

» So sánh giá trị trung bình của số cừu mắc bệnh
trong 8 nhóm tiêm phịng và 8 nhóm đối chứng.
Mẫu được lấy độc lập, biết phương sai tương
ứng là 22, 18.

</div>
(16)<div class='page_container' data-page=16>

Tool



Data Analysis, chọn công cụ phân

</div>
(17)<div class='page_container' data-page=17>

Hiện cửa sổ

Miền biến 1

Giả thiết về sự

khác nhau của hai
trung bình (d)

Miền biến 2

</div>
(18)<div class='page_container' data-page=18>

Kết quả

Giả thiết sự khác nhau
của hai trung bình (d)
Số quan sát

Phương sai
Trung bình

Z thực nghiệm

</div>
(19)<div class='page_container' data-page=19>

1. So sánh TB 2 mẫu độc lập khi biết

phương sai σ

, σ

2Y
* Căn cứ để kết luận

1. Kiểm định 2 phía

 Nếu |Ztn|> Zhai phía (z critical two-tail) thì bác bỏ giả thuyết H0, chấp

nhận H1 (mX≠mY+d)

 Nếu |Ztn|<= Zhai phía (z critical two-tail) thì chấp nhận giả thuyết H0

(mX=mY+d)

2. Kiểm định một phía

 Nếu Ztn>0 ta có bài toán kiểm định

H0: mX = mY+d

H1: mX > mY+d

» Nếu Ztn> Zmột phía (z critical one-tail) thì bác bỏ H0 và ngược lại

 Nếu Ztn<0 ta có bài tốn kiểm định

H0: mX = mY+d

H1: mX < mY+d

</div>
(20)<div class='page_container' data-page=20>

Phân tích kết quả

Kiểm định 2 phía:

Ta có |z|=2.068>z2 phía
nên bác bỏ giả thiết
H0 (mX=mY)

Kiểm định 1 phía:

</div>
(21)<div class='page_container' data-page=21>

Thực hành

1. Sinh viên thực hành ví dụ vừa rồi với dữ

liệu đảo ngược như sau (σ

=22,

</div>
(22)<div class='page_container' data-page=22>

3. So sánh trung bình 2 mẫu

2. So sánh trung bình 2 mẫu độc lập trường hợp

khơng biết phương sai và kích thước mẫu lớn

lớn (n

>=30, n

>=30)

 Xét đại lượng Z=(Xtb-Ytb-(mX-mY)-d)/sqrt(s2X/nX+

s2Y/nY) có phân phối xấp xỉ phân phối chuẩn tắc

 (trong đó s2X, s2Y là các giá trị xấp xỉ của phương sai σ2X, σ 2Y có thể tính được bằng hàm

VAR)

 Tương tự trường hợp đã biết phương sai, thay thế

s2X bởi σ2X, s2Y bởi σ2Y và sử dụng công cụ z-Test:

</div>
(23)<div class='page_container' data-page=23>

3. So sánh trung bình 2 mẫu

3. So sánh trung bình 2 mẫu độc lập trường hợp khơng
biết phương sai và kích thước mẫu nhỏ (nX<30 và

nY<30)

 Để giải quyết bài tốn này ta cần có giả thiết về sự bằng nhau

hay khác nhau của 2 phương sai σ2X, σ2Y

 Nếu đề bài chưa cho biết thơng tin đó, cần kiểm định thêm

một giả thuyết phụ về sự bằng nhau hay khác nhau của 2
phương sai σ2X, σ2Y đã học ở bài trước (sử dụng công cụ
F-Test: Two-Sample for Variances)

» Nếu σ2X = σ2Y ta giải quyết bài tốn sử dụng cơng cụ phân tích

t-Test: Two-Sample Assuming Equal Variances

</div>
(24)<div class='page_container' data-page=24>

Ví dụ 1: t-Test: Two-Sample Assuming Equal Variances

</div>
(25)<div class='page_container' data-page=25>

Ví dụ 1: Kết quả

Trung bình
Phương sai
Số quan sát

Giả thiết sự khác nhau

của hai trung bình

t thực nghiệm

P một phía và hai phía
t lý thuyết (tới hạn) một
phía và hai phía

Phương sai chung

Bậc tự do = n1 + n2 -2

</div>
(26)<div class='page_container' data-page=26>

t-Test: Two-Sample Assuming

Equal

Variances

1. Căn cứ để kết luận

 Kiểm định 2 phía

» Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H0 và

ngược lại

» Trong ví dụ 1: |ttn|=1.5187<thai phía=2.009 nên chấp nhận H0

(mX=mY). Giá trị Phai phía> α là phù hợp với kết luận trên

 Kiểm định một phía

» Nếu ttn>0 ta có bài tốn kiểm định
H0: mX = mY+d

H1: mX > mY+d

• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại
» Nếu ttn<0 ta có bài tốn kiểm định

</div>
(27)<div class='page_container' data-page=27>

Ví dụ 2: t-Test: Two-Sample Assuming Unequal Variances

</div>
(28)<div class='page_container' data-page=28></div>
(29)<div class='page_container' data-page=29>

t-Test: Two-Sample Assuming Unequal Variances

1. Căn cứ để kết luận (giống trường hợp 2 phương sai bằng nhau, chỉ
khác ở giá trị ttn do khác về cơng thức tính)

 Kiểm định 2 phía

» Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H0 và ngược
lại

» Trong ví dụ 2: |ttn|=1.7133<thai phía=2.009 nên chấp nhận H0 (mX=mY).

Giá trị Phai phía> α là phù hợp với kết luận trên

 Kiểm định một phía

» Nếu ttn>0 ta có bài tốn kiểm định

H0: mX = mY+d

H1: mX > mY+d

• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại

» Nếu ttn<0 ta có bài tốn kiểm định

H0: mX = mY+d

H1: mX < mY+d

</div>
(30)<div class='page_container' data-page=30>

3. So sánh trung bình 2 mẫu

3. So sánh trung bình 2 mẫu được lấy theo

cặp

</div>
(31)<div class='page_container' data-page=31></div>
(32)<div class='page_container' data-page=32>

Hiện ra của sổ

Miền của biến 1, kể cả
hàng đầu của mẫu quan
sát.

Miền của biến 2

Giả thiết về hiệu hai
trung bình của hai tổng
thể. H0: m1 = m2 thì ghi
0. Nếu H0: m1 = m2 + d
thì ghi d

</div>
(33)<div class='page_container' data-page=33></div>
(34)<div class='page_container' data-page=34>

t-Test: Paired Two Sample for Means

1. Căn cứ để kết luận (giống trường hợp so sánh trung bình 2 mẫu độc lập có

kích thước mẫu nhỏ)

 Kiểm định 2 phía

» Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H0 và ngược lại

» Trong ví dụ trên: |ttn|=3.3105>thai phía=2.3646 nên chấp nhận H1

(mX≠mY). Giá trị Phai phía<α là phù hợp với kết luận trên

 Kiểm định một phía

» Nếu ttn>0 ta có bài tốn kiểm định

H0: mX = mY+d

H1: mX > mY+d

• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại

• Trong ví dụ trên: ttn>0 và ttn> tmột phía=1.8945 nên chấp nhận H1 (mX > mY).
Giá trị Pmột phía<α là phù hợp với kết luận trên

» Nếu ttn<0 ta có bài tốn kiểm định

</div>


baigiangtinud_tthieu_ch4

baigiangtinud_tthieu_ch4

Bài giảng tin ứng dụng

Nội dung:



<sub>Phân tích phương sai</sub>

Phân tích phương sai

• Ví dụ

1.1 Phân tích phương sai một nhân tố

So sánh các trung bình dùng chỉ số LSD

Phân tích phương sai hai nhân tố

Phân tích phương sai hai nhân tố không

tương tác

Phân tích phương sai hai nhân tố tương tác

2. Kiểm định sự bằng nhau của hai

phương sai



<sub>Kiểm định hai phía </sub>



<sub>Kiểm định một phía </sub>

Phân tích kết quả

Trong Excel, sử dụng công cụ F-Test Two Sample

for Variances để kiểm định một phía

1. Nếu F < 1

2. Nếu F >= 1

3. So sánh trung bình 2 mẫu

3. So sánh trung bình 2 mẫu

Các trường hợp:

1. Lấy mẫu độc lập



TH biết phương sai σ

, σ



<sub>TH không biết phương sai</sub>

3. So sánh trung bình 2 mẫu

1. So sánh TB 2 mẫu độc lập khi biết phương sai

σ

, σ

3. So sánh trung bình 2 mẫu

1. So sánh TB 2 mẫu độc lập khi biết

phương sai σ

, σ



<sub>Ví dụ:</sub>

Tool



Data Analysis, chọn công cụ phân

Hiện cửa sổ

Kết quả

1. So sánh TB 2 mẫu độc lập khi biết

phương sai σ

, σ

Phân tích kết quả

Thực hành

1. Sinh viên thực hành ví dụ vừa rồi với dữ

liệu đảo ngược như sau (σ

=22,

3. So sánh trung bình 2 mẫu

2. So sánh trung bình 2 mẫu độc lập trường hợp

khơng biết phương sai và kích thước mẫu lớn

lớn (n

>=30, n

>=30)

3. So sánh trung bình 2 mẫu

Ví dụ 1: Kết quả

<b>t-Test: Two-Sample Assuming </b>

<b>Equal</b>

<b> Variances</b>

1. Căn cứ để kết luận

3. So sánh trung bình 2 mẫu

3. So sánh trung bình 2 mẫu được lấy theo

cặp

Hiện ra của sổ

<b>t-Test: Paired Two Sample for Means</b>

Tài liệu bạn tìm kiếm đã sẵn sàng tải về