TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH
CHƯƠNG 6
PHÂN TÍCH PHƯƠNG SAI
Nội dung chính
6.1 Tổng quan về phân tích phương sai (Bài giảng video)
6.2 Phân tích phương sai một yếu tố (Bài giảng video)
6.3 Phân tích phương sai hai yếu tố
6.4 Thực hành phân tích dữ liệu bằng phân tích ANOVA với Excel/SPSS
EM3230 Thống kê ứng dụng
2
Mục tiêu của chương
Sau khi kết thúc chương này, người học có thể:
§ Hiểu được phạm vi ứng dụng và những giả định cần có khi thực hiện ANOVA (phân
tích phương sai)
§ Nắm vững quy trình thực hiện ANOVA một yếu tố
§ Biết cách đọc bảng ANOVA và mối liên hệ giữa các chỉ tiêu trong bảng ANOVA
§ Mơ tả được quy trình thực hiện ANOVA hai yếu tố: trường hợp có một quan sát trong
một ơ và nhiều quan sát trong một ơ.
§ Biết cách thực hiện phân tích phương sai với Excel/SPSS
EM3230 Thống kê ứng dụng
3
6.1 Giới thiệu chung
§
ANALYSIS OF VARIANCE: ANOVA
§
Là sự mở rộng của kiểm định trung bình
Biết s
KĐ trên 1 tổng thể
KĐ trung bình
Chưa biết s, mẫu lớn
KĐ tỷ lệ
Chưa biết s, mẫu nhỏ
Kiểm định tham số
KĐ phương sai
Biết s
KĐ trên 2 tổng thể
KĐ trung bình
Chưa biết s, mẫu lớn
KĐ tỷ lệ
Chưa biết s, mẫu nhỏ
KĐ phương sai
ANOVA 1 yếu tố
KĐ trên k tổng thể (k>2)
ANOVA 2 yếu tố
EM3230 Thống kê ứng dụng
4
6.1 Giới thiệu chung
§
ANALYSIS OF VARIANCE: ANOVA
§
Là sự mở rộng của kiểm định trung bình
§
Cho phép so sánh trung bình của nhiều nhóm/ tổng thể cùng một lúc
§
Nghiên cứu mối quan hệ giữa một biến phân loại và một biến định lượng
Cách trưng bày sản phẩm
Doanh thu
EM3230 Thống kê ứng dụng
Cách 1
Cách 2
Cách 3
34
30
23
24
31
28
36
34
28
39
23
30
32
27
31
5
6.1 Giới thiệu chung
Bản chất của ANOVA
§
§
Mục đích của ANOVA: Phân tích ảnh hưởng của biến đầu vào X đến biến đầu ra Y,
trong đó:
§
X có dữ liệu định tính, có từ 3 biểu hiện/ giá trị trở lên
§
Y có dữ liệu định lượng (thang đo khoảng, tỷ lệ)
Xem xét tác động của 1 biến X1 đến Y:
ANOVA một yếu tố (one-way ANOVA/ Single factor ANOVA)
§
Xem xét tác động của 2 biến đầu vào X1 và X2 tới Y:
ANOVA hai yếu tố (two-way/ two-factor ANOVA)
EM3230 Thống kê ứng dụng
6
6.2 Phân tích phương sai một yếu tố
Giả sử cần so sánh số trung bình của k tổng thể độc lập.
§ Lấy k mẫu có số quan sát là n1, n2… nk; tn theo PP chuẩn.
§ Trung bình của các tổng thể được ký hiệu là μ1; μ2 ….μk
§ Mơ hình phân tích phương sai một yếu tố ảnh hưởng được mô tả dưới dạng kiểm
định giả thuyết như sau:
Ho: μ1 = μ2 =….=μk
H1: Tồn tại ít nhất 1 cặp có μi ≠μ j; i ≠ j
EM3230 Thống kê ứng dụng
7
6.2 Phân tích phương sai một yếu tố
Để kiểm định cần 3 giả thiết sau:
§
Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2)
§
Các phương sai tổng thể bằng nhau
§
Lấy k mẫu độc lập từ k tổng thể. Mỗi mẫu được quan sát nj lần.
EM3230 Thống kê ứng dụng
8
6.2 Phân tích phương sai một yếu tố
CÁC BƯỚC KIỂM ĐỊNH
§
Bước 1: Tính các trung bình mẫu của các nhóm và trung bình chung
TT
k nhóm mẫu quan sát
1
2
3
…
k
1
X11
X12
X13
…
X1k
2
X21
X22
X23
…
X2k
3
X31
X32
X33
…
X3k
…
…
…
…
…
…
j
Xj1
Xj2
Xj3
…
Xjk
Trung bình mẫu
x1
x2
x3
…
xk
EM3230 Thống kê ứng dụng
9
6.2 Phân tích phương sai một yếu tố
CÁC B pháp kiểm soát chất lượng đang thử
nghiệm cho ra tỷ lệ lỗi khác nhau
a = .05
Do not
reject H0
MSW
Kết luận:
F2,12,.05= 3.89
0
MSA 2358.2
MSB
=
= 25.275
F = 25.275
19
6.2 Phân tích phương sai một yếu tố
§
Data | data analysis | ANOVA: single factor
SUMMARY
Groups
Count
Sum
Average
Variance
Cách 1
5
1246
249.2
108.2
Cách 2
5
1130
226
77.5
Cách 3
5
1029
205.8
94.2
ANOVA
Source of
Variation
EM3230 Thống kê ứng dụng
SS
df
MS
Between
Groups
4716.4
2
2358.2
Within
Groups
1119.6
12
93.3
Total
5836.0
14
F
25.275
P-value
4.99E-05
F crit
3.89
20
6.2 Phân tích phương sai một yếu tố
Kiểm tra các giả định của phân tích phương sai
1)
Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2)
§
2)
Dùng đồ thị: Histogram, biểu đồ hộp và râu, kiểm định Chi- bình phương (chương 9)
Các phương sai tổng thể bằng nhau
§
Dùng biểu đồ hộp và râu
§
Dùng kiểm định Levene: PP Hartley Fmax (tham khảo trang 264 SGK),
%
%
Tính Fmax =(𝑆"#$
/ 𝑆"&'
) và so sánh với Hartley F(k,df),a , df=𝑛" − 1
3) Lấy k mẫu độc lập từ k tổng thể. Mỗi mẫu được quan sát nj lần: Do cách lấy mẫu
EM3230 Thống kê ứng dụng
21
6.2 Phân tích phương sai một yếu tố
Phân tích sâu/ hậu ANOVA (Post-Hoc Test)
Mục đích: Phân tích sâu hơn trong trường hợp bác bỏ H0 để xác định cặp nhóm/ tng th cú trung
bỡnh ln hn hay nh hn.
H0:ài=àj
H1:àiạàj
Phng phỏp:
Đ
Tukey (HSD- Honestly Significant Difference)
Giá trị kiểm định: D= |𝑥*! - 𝑥*" | ; Giá trị tới hạn T=𝑞#$,&'$ .
i¹j
()*
&!
q- giá trị tra bảng pp Tukey, ni chọn cỡ mẫu nhỏ nhất
§
LSD - Least Significant Difference: Ước lượng KTC
-
-
'&
'(
'+,
𝑥&& - 𝑥&( ± 𝑡)/%
. 𝑀𝑆𝑊. ( +
EM3230 Thống kê ứng dụng
)
Nếu 0 nằm trong KTCà không khác biệt.
Nếu 0 không nằm trong KTCà có khác biệt
22
6.3 Phân tích phương sai hai yếu tố
§
Phân tích phương sai 2 yếu tố nhằm xem xét cùng lúc hai yếu tố nguyên nhân (dưới dạng dữ
liệu định tính) ảnh hưởng đến yếu tố kết quả (dưới dạng dữ liệu định lượng) đang nghiên cứu.
§
Ví dụ: Nghiên cứu ảnh hưởng của loại chất đốt và loại lò sấy đến tỷ lệ vải loại 1 sấy khơ.
§
Phân tích phương sai 2 yếu tố giúp chúng ta đưa thêm yếu tố nguyên nhân vào phân tích làm
cho kết quả nghiên cứu càng có giá trị.
EM3230 Thống kê ứng dụng
23
6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
Lấy mẫu khơng lặp lại à sắp xếp các đơn vị mẫu của yếu tố nguyên nhân thứ nhất thành K nhóm
(cột), các đơn vị mẫu của yếu tố nguyên nhân thứ hai thành H khối (hàng) à Bảng kết hợp 2 yếu tố
nguyên nhân gồm K cột và H hàng và (K x H) ô dữ liệu. Tổng số mẫu quan sát là n = (K x H).
Hàng (Khối)
Cột (nhóm)
1
2
…
K
1
X11
X21
XK1
2
X12
X22
XK2
X1K
X2K
XKH
…
H
EM3230 Thống kê ứng dụng
24
6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
Để kiểm định cần 2 giả thiết sau:
1) Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2)
2) Ta lấy K mẫu độc lập từ K tổng thể, H mẫu độc lập từ H tổng thể. Mỗi mẫu được quan sát
1 lần không lặp.
EM3230 Thống kê ứng dụng
25
6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
Bước 1:
§
Tính trung bình riêng của từng nhóm (K cột) và từng khối (H hàng)
K
H
Xi =
åX
j =1
ij
Xj =
i =1
ij
K
j = 1, 2...H
H
i = 1, 2...K
§
åX
Trung bình chung của tồn bộ mẫu quan sát
K
X =
EM3230 Thống kê ứng dụng
H
åå X
i =1 j =1
n
H
K
ij
=
åX
i =1
K
i
=
åX
j =1
j
H
26
6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
Bước 2: Tính tổng các độ lệch bình phương
Tổng các độ lệch bình phương chung (SST)
Phản ánh biến động của yếu tố kết quả do ảnh hưởng của tất cả các yếu tố
K
H
SST = åå ( X i j - X )
2
i =1 j =1
Tổng các độ lệch bình phương giữa các nhóm (SSG)
Phản ánh biến động của yếu tố kết quả do ảnh hưởng của yếu tố nguyên
nhân thứ nhất (xếp theo cột)- H tổng số hàng
Tổng các độ lệch bình phương giữa các khối (SSB) Phản ánh biến động
của yếu tố kết quả do ảnh hưởng của yếu tố nguyên nhân thứ hai (xếp theo
hàng) – K- tổng số cột
Tổng các độ lệch bình phương phần dư (SSE)
Phản ánh biến động của yếu tố kết quả do ảnh hưởng của yếu tố nguyên
nhân khác không nghiên cứu
EM3230 Thống kê ứng dụng
/
" 2
𝑆𝑆𝐺 = 𝐻. 2(𝑋&& − 𝑋)
&.0
" 2
𝑆𝑆𝐵 = 𝐾. 2(𝑋&( − 𝑋)
(.-
𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐺 − 𝑆𝑆𝐵
27
6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
Bước 3: Tính các phương sai
• Phương sai giữa các nhóm (cột)
• Phương sai giữa các khối (dịng)
• Phương sai dư
EM3230 Thống kê ứng dụng
𝑆𝑆𝐺
𝑀𝑆𝐺 =
𝐾−1
𝑆𝑆𝐵
𝑀𝑆𝐵 =
𝐻−1
𝑆𝑆𝐸
𝑀𝑆𝐸 =
(𝐻 − 1)(𝐾 − 1)
28
6.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ơ
§
Bước 4: Tính các giá trị kiểm định
𝐹1 =
§
𝑀𝑆𝐺
𝑀𝑆𝐸
𝐹2 =
𝑀𝑆𝐵
𝑀𝑆𝐸
Bước 5: Miền bác bỏ
v H0: trung bình của K tổng thể theo yếu tố nguyên nhân thứ nhất (cột) bằng nhau bị bác bỏ khi
F1>FK-1, (K-1)(H-1),a
v H0: trung bình của H tổng thể theo yếu tố nguyên nhân thứ hai (hàng) bằng nhau bị bác bỏ khi
F2> FH-1, (K-1)(H-1),a
EM3230 Thống kê ứng dụng
29
6.3 Phân tích phương sai hai yếu tố
6.3.2 Trường hợp có nhiều quan sát trong 1 ơ
Cột (nhóm)
1
Hàng
(Khối)
2
…
K
1
X111, X112, …, X11L
X211, X212, …, X21L
…
XK11, XK12, …, XK1L
2
X121, X122, …, X12L
X221, X222, …, X22L
…
XK21, XK22, …, XK2L
…
H
EM3230 Thống kê ứng dụng
…
X1H1, X1H2, …, X1HL
…
X2H1, X2H2, …, X2HL
…
…
…
XKH1, XKH2, …, XKHL
30
6.3 Phân tích phương sai hai yếu tố
6.3.2 Trường hợp có nhiều quan sát trong 1 ơ
Kiểm định 3 giả thuyết H0
§
Trung bình của K tổng thể theo yếu tố ngun nhân thứ nhất (cột) bằng nhau
§
Trung bình của H tổng thể theo yếu tố nguyên nhân thứ hai (dòng) bằng nhau
§
Khơng có tác động qua lại giữa yếu tố thứ nhất (cột) và yếu tố thứ hai (dòng)
Tham khảo quy trình kiểm định trang 271 SGK
EM3230 Thống kê ứng dụng
31
6.4 Thực hành phân tích dữ liệu bằng phân tích ANOVA
với Excel/SPSS
(Sinh viên thực hành theo hướng dẫn của giảng viên)
EM3230 Thống kê ứng dụng
32
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
CHÚC CÁC BẠN HỌC TỐT