Tải bản đầy đủ (.pdf) (33 trang)

Bài giảng Thống kê ứng dụng trong kinh doanh: Chương 6 - Trường Đại học Bách khoa Hà Nội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (997.39 KB, 33 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH

CHƯƠNG 6

PHÂN TÍCH PHƯƠNG SAI


Nội dung chính
6.1 Tổng quan về phân tích phương sai (Bài giảng video)
6.2 Phân tích phương sai một yếu tố (Bài giảng video)
6.3 Phân tích phương sai hai yếu tố
6.4 Thực hành phân tích dữ liệu bằng phân tích ANOVA với Excel/SPSS

EM3230 Thống kê ứng dụng

2


Mục tiêu của chương
Sau khi kết thúc chương này, người học có thể:
§ Hiểu được phạm vi ứng dụng và những giả định cần có khi thực hiện ANOVA (phân
tích phương sai)
§ Nắm vững quy trình thực hiện ANOVA một yếu tố
§ Biết cách đọc bảng ANOVA và mối liên hệ giữa các chỉ tiêu trong bảng ANOVA
§ Mơ tả được quy trình thực hiện ANOVA hai yếu tố: trường hợp có một quan sát trong
một ơ và nhiều quan sát trong một ơ.
§ Biết cách thực hiện phân tích phương sai với Excel/SPSS

EM3230 Thống kê ứng dụng



3


6.1 Giới thiệu chung
§

ANALYSIS OF VARIANCE: ANOVA

§

Là sự mở rộng của kiểm định trung bình

Biết s

KĐ trên 1 tổng thể

KĐ trung bình

Chưa biết s, mẫu lớn

KĐ tỷ lệ

Chưa biết s, mẫu nhỏ

Kiểm định tham số

KĐ phương sai
Biết s


KĐ trên 2 tổng thể

KĐ trung bình

Chưa biết s, mẫu lớn

KĐ tỷ lệ

Chưa biết s, mẫu nhỏ

KĐ phương sai
ANOVA 1 yếu tố
KĐ trên k tổng thể (k>2)
ANOVA 2 yếu tố

EM3230 Thống kê ứng dụng

4


6.1 Giới thiệu chung
§

ANALYSIS OF VARIANCE: ANOVA

§

Là sự mở rộng của kiểm định trung bình

§


Cho phép so sánh trung bình của nhiều nhóm/ tổng thể cùng một lúc

§

Nghiên cứu mối quan hệ giữa một biến phân loại và một biến định lượng
Cách trưng bày sản phẩm

Doanh thu

EM3230 Thống kê ứng dụng

Cách 1

Cách 2

Cách 3

34

30

23

24

31

28


36

34

28

39

23

30

32

27

31
5


6.1 Giới thiệu chung
Bản chất của ANOVA
§

§

Mục đích của ANOVA: Phân tích ảnh hưởng của biến đầu vào X đến biến đầu ra Y,
trong đó:
§


X có dữ liệu định tính, có từ 3 biểu hiện/ giá trị trở lên

§

Y có dữ liệu định lượng (thang đo khoảng, tỷ lệ)

Xem xét tác động của 1 biến X1 đến Y:
ANOVA một yếu tố (one-way ANOVA/ Single factor ANOVA)

§

Xem xét tác động của 2 biến đầu vào X1 và X2 tới Y:
ANOVA hai yếu tố (two-way/ two-factor ANOVA)

EM3230 Thống kê ứng dụng

6


6.2 Phân tích phương sai một yếu tố
Giả sử cần so sánh số trung bình của k tổng thể độc lập.
§ Lấy k mẫu có số quan sát là n1, n2… nk; tn theo PP chuẩn.
§ Trung bình của các tổng thể được ký hiệu là μ1; μ2 ….μk
§ Mơ hình phân tích phương sai một yếu tố ảnh hưởng được mô tả dưới dạng kiểm
định giả thuyết như sau:
Ho: μ1 = μ2 =….=μk
H1: Tồn tại ít nhất 1 cặp có μi ≠μ j; i ≠ j

EM3230 Thống kê ứng dụng


7


6.2 Phân tích phương sai một yếu tố
Để kiểm định cần 3 giả thiết sau:
§

Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2)

§

Các phương sai tổng thể bằng nhau

§

Lấy k mẫu độc lập từ k tổng thể. Mỗi mẫu được quan sát nj lần.

EM3230 Thống kê ứng dụng

8


6.2 Phân tích phương sai một yếu tố
CÁC BƯỚC KIỂM ĐỊNH
§

Bước 1: Tính các trung bình mẫu của các nhóm và trung bình chung

TT


k nhóm mẫu quan sát
1

2

3



k

1

X11

X12

X13



X1k

2

X21

X22

X23




X2k

3

X31

X32

X33



X3k













j


Xj1

Xj2

Xj3



Xjk

Trung bình mẫu

x1

x2

x3



xk

EM3230 Thống kê ứng dụng

9


6.2 Phân tích phương sai một yếu tố
CÁC B pháp kiểm soát chất lượng đang thử

nghiệm cho ra tỷ lệ lỗi khác nhau

a = .05
Do not
reject H0

MSW

Kết luận:

F2,12,.05= 3.89

0

MSA 2358.2
MSB
=
= 25.275

F = 25.275

19


6.2 Phân tích phương sai một yếu tố
§

Data | data analysis | ANOVA: single factor
SUMMARY
Groups


Count

Sum

Average

Variance

Cách 1

5

1246

249.2

108.2

Cách 2

5

1130

226

77.5

Cách 3


5

1029

205.8

94.2

ANOVA
Source of
Variation

EM3230 Thống kê ứng dụng

SS

df

MS

Between
Groups

4716.4

2

2358.2


Within
Groups

1119.6

12

93.3

Total

5836.0

14

F
25.275

P-value
4.99E-05

F crit
3.89

20


6.2 Phân tích phương sai một yếu tố
Kiểm tra các giả định của phân tích phương sai
1)


Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2)
§

2)

Dùng đồ thị: Histogram, biểu đồ hộp và râu, kiểm định Chi- bình phương (chương 9)
Các phương sai tổng thể bằng nhau

§

Dùng biểu đồ hộp và râu

§

Dùng kiểm định Levene: PP Hartley Fmax (tham khảo trang 264 SGK),
%
%
Tính Fmax =(𝑆"#$
/ 𝑆"&'
) và so sánh với Hartley F(k,df),a , df=𝑛" − 1

3) Lấy k mẫu độc lập từ k tổng thể. Mỗi mẫu được quan sát nj lần: Do cách lấy mẫu

EM3230 Thống kê ứng dụng

21


6.2 Phân tích phương sai một yếu tố

Phân tích sâu/ hậu ANOVA (Post-Hoc Test)
Mục đích: Phân tích sâu hơn trong trường hợp bác bỏ H0 để xác định cặp nhóm/ tng th cú trung
bỡnh ln hn hay nh hn.

H0:ài=àj
H1:àiạàj

Phng phỏp:
Đ

Tukey (HSD- Honestly Significant Difference)
Giá trị kiểm định: D= |𝑥*! - 𝑥*" | ; Giá trị tới hạn T=𝑞#$,&'$ .

i¹j

()*
&!

q- giá trị tra bảng pp Tukey, ni chọn cỡ mẫu nhỏ nhất

§

LSD - Least Significant Difference: Ước lượng KTC
-

-

'&

'(


'+,
𝑥&& - 𝑥&( ± 𝑡)/%
. 𝑀𝑆𝑊. ( +

EM3230 Thống kê ứng dụng

)

Nếu 0 nằm trong KTCà không khác biệt.
Nếu 0 không nằm trong KTCà có khác biệt
22


6.3 Phân tích phương sai hai yếu tố
§

Phân tích phương sai 2 yếu tố nhằm xem xét cùng lúc hai yếu tố nguyên nhân (dưới dạng dữ
liệu định tính) ảnh hưởng đến yếu tố kết quả (dưới dạng dữ liệu định lượng) đang nghiên cứu.

§

Ví dụ: Nghiên cứu ảnh hưởng của loại chất đốt và loại lò sấy đến tỷ lệ vải loại 1 sấy khơ.

§

Phân tích phương sai 2 yếu tố giúp chúng ta đưa thêm yếu tố nguyên nhân vào phân tích làm
cho kết quả nghiên cứu càng có giá trị.

EM3230 Thống kê ứng dụng


23


6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
Lấy mẫu khơng lặp lại à sắp xếp các đơn vị mẫu của yếu tố nguyên nhân thứ nhất thành K nhóm
(cột), các đơn vị mẫu của yếu tố nguyên nhân thứ hai thành H khối (hàng) à Bảng kết hợp 2 yếu tố
nguyên nhân gồm K cột và H hàng và (K x H) ô dữ liệu. Tổng số mẫu quan sát là n = (K x H).

Hàng (Khối)

Cột (nhóm)
1

2



K

1

X11

X21

XK1

2


X12

X22

XK2

X1K

X2K

XKH


H
EM3230 Thống kê ứng dụng

24


6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
Để kiểm định cần 2 giả thiết sau:
1) Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2)
2) Ta lấy K mẫu độc lập từ K tổng thể, H mẫu độc lập từ H tổng thể. Mỗi mẫu được quan sát
1 lần không lặp.

EM3230 Thống kê ứng dụng

25



6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
Bước 1:
§

Tính trung bình riêng của từng nhóm (K cột) và từng khối (H hàng)
K

H

Xi =

åX
j =1

ij

Xj =

i =1

ij

K
j = 1, 2...H

H
i = 1, 2...K

§

åX

Trung bình chung của tồn bộ mẫu quan sát
K

X =
EM3230 Thống kê ứng dụng

H

åå X
i =1 j =1

n

H

K

ij

=

åX
i =1

K


i

=

åX
j =1

j

H
26


6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
Bước 2: Tính tổng các độ lệch bình phương
Tổng các độ lệch bình phương chung (SST)
Phản ánh biến động của yếu tố kết quả do ảnh hưởng của tất cả các yếu tố

K

H

SST = åå ( X i j - X )

2

i =1 j =1

Tổng các độ lệch bình phương giữa các nhóm (SSG)

Phản ánh biến động của yếu tố kết quả do ảnh hưởng của yếu tố nguyên
nhân thứ nhất (xếp theo cột)- H tổng số hàng
Tổng các độ lệch bình phương giữa các khối (SSB) Phản ánh biến động
của yếu tố kết quả do ảnh hưởng của yếu tố nguyên nhân thứ hai (xếp theo
hàng) – K- tổng số cột
Tổng các độ lệch bình phương phần dư (SSE)
Phản ánh biến động của yếu tố kết quả do ảnh hưởng của yếu tố nguyên
nhân khác không nghiên cứu
EM3230 Thống kê ứng dụng

/

" 2
𝑆𝑆𝐺 = 𝐻. 2(𝑋&& − 𝑋)
&.0

" 2
𝑆𝑆𝐵 = 𝐾. 2(𝑋&( − 𝑋)
(.-

𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐺 − 𝑆𝑆𝐵
27


6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
Bước 3: Tính các phương sai
• Phương sai giữa các nhóm (cột)

• Phương sai giữa các khối (dịng)


• Phương sai dư

EM3230 Thống kê ứng dụng

𝑆𝑆𝐺
𝑀𝑆𝐺 =
𝐾−1
𝑆𝑆𝐵
𝑀𝑆𝐵 =
𝐻−1
𝑆𝑆𝐸
𝑀𝑆𝐸 =
(𝐻 − 1)(𝐾 − 1)
28


6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
§

Bước 4: Tính các giá trị kiểm định

𝐹1 =
§

𝑀𝑆𝐺
𝑀𝑆𝐸

𝐹2 =


𝑀𝑆𝐵
𝑀𝑆𝐸

Bước 5: Miền bác bỏ

v H0: trung bình của K tổng thể theo yếu tố nguyên nhân thứ nhất (cột) bằng nhau bị bác bỏ khi

F1>FK-1, (K-1)(H-1),a
v H0: trung bình của H tổng thể theo yếu tố nguyên nhân thứ hai (hàng) bằng nhau bị bác bỏ khi

F2> FH-1, (K-1)(H-1),a
EM3230 Thống kê ứng dụng

29


6.3 Phân tích phương sai hai yếu tố
6.3.2 Trường hợp có nhiều quan sát trong 1 ơ
Cột (nhóm)
1

Hàng
(Khối)

2



K


1

X111, X112, …, X11L

X211, X212, …, X21L



XK11, XK12, …, XK1L

2

X121, X122, …, X12L

X221, X222, …, X22L



XK21, XK22, …, XK2L


H

EM3230 Thống kê ứng dụng


X1H1, X1H2, …, X1HL



X2H1, X2H2, …, X2HL







XKH1, XKH2, …, XKHL

30


6.3 Phân tích phương sai hai yếu tố
6.3.2 Trường hợp có nhiều quan sát trong 1 ơ
Kiểm định 3 giả thuyết H0
§

Trung bình của K tổng thể theo yếu tố ngun nhân thứ nhất (cột) bằng nhau

§

Trung bình của H tổng thể theo yếu tố nguyên nhân thứ hai (dòng) bằng nhau

§

Khơng có tác động qua lại giữa yếu tố thứ nhất (cột) và yếu tố thứ hai (dòng)

Tham khảo quy trình kiểm định trang 271 SGK


EM3230 Thống kê ứng dụng

31


6.4 Thực hành phân tích dữ liệu bằng phân tích ANOVA
với Excel/SPSS
(Sinh viên thực hành theo hướng dẫn của giảng viên)

EM3230 Thống kê ứng dụng

32


TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ

CHÚC CÁC BẠN HỌC TỐT



×