ĐẠI HỌC CÔNG NGHIỆP TP HCM - CSMT
Business Administration
CHƯƠNG VI:
TƯƠNG QUAN & HỒI QUY
CORRELATION & REGRESSION
NỘI DUNG
Tương quan tuyến tính
Hồi quy đơn tuyến tính
Hồi quy bội tuyến tính
2
1. TƯƠNG QUAN (CORRELATION)
Xem xét mối quan hệ giữa hai hay nhiều
biến định lượng
Tương quan có:
Tương quan 2 biến – Bivariate Correlations
Tương quan riêng phần – Partial Correlations
Điều kiện:
2 hoặc nhiều biến định lượng.
3
1. TƯƠNG QUAN (CORRELATION)
Ví dụ: Đo lường mối quan hệ giữa
doanh số bán hàng (y) với chi phí chào
hàng (x), dữ liệu được thu thập tại 12
khu vực bán hàng trong file tqvahq.
4
1. TƯƠNG QUAN (CORRELATION)
Mục tiêu nghiên cứu: Giả định nhà nghiên cứu
muốn tìm hiểu có mối quan hệ như thế nào giữa
doanh số bán hàng và chi phí chào hàng
Giả thuyết H0: Doanh số và chi phí chào hàng
không có liên hệ với nhau.
5
1. TƯƠNG QUAN (CORRELATION)
1.1. Dùng đồ thị Scatter để xem xét mối liên hệ:
Vào
menu
Graphs
>
Legacy
Dialogs
>
Scatter/Dot…, để mở hộp thoại Scatterplot. Chọn
Simple Scatter và nhấn Define để vào hộp thoại kế
tiếp.
6
1. TƯƠNG QUAN (CORRELATION)
Biến doanh số
Biến chào hàng
7
1. TƯƠNG QUAN (CORRELATION)
8
1. TƯƠNG QUAN (CORRELATION)
1.2. Sử dụng hệ số tương quan r (Pearson)
Dùng để lượng hóa mức độ chặt chẽ mối liên
hệ tuyến tính
Trị tuyệt đối r tiến gần đến 1 khi hai biến có mối
liên hệ chặt chẽ
Giá trị r = 0 khi hai biến không có mối liên hệ
tuyến tính
Không có mối liên hệ
Có liên hệ chặt chẽ nhưng không phải tuyến tính.
9
1. TƯƠNG QUAN (CORRELATION)
1.2. Sử dụng hệ số tương quan r (Pearson)
Xem xét đồng thời r và đồ thị để đánh giá mối
liên hệ
Có liên hệ tương quan chưa chắc đã có mối
quan hệ nhân quả
Hai biến không có mối liên hệ nhưng r rất cao
(tương quan giả).
10
1. TƯƠNG QUAN (CORRELATION)
1.2. Sử dụng hệ số tương quan r (Pearson)
Menu chọn: Analyze > Correlate > Bivariate..
11
1. TƯƠNG QUAN (CORRELATION)
Hộp thoại Bivariate Correlations xuất hiện:
12
1. TƯƠNG QUAN (CORRELATION)
Hộp thoại Option:
Trung
bình và
độ lệch
chuẩn
Tổng
các tích
mômen
chéo và
hiệp
phương
sai
Nhấp continue để trở về hộp
13 thoại trước và nhấp OK.
1. TƯƠNG QUAN (CORRELATION)
Vì Pearson = 0,905 và Sig = 0,000
nên đủ cơ sở bác bỏ H0, nghĩa là….
14
2. MÔ HÌNH HỒI QUY TUYẾN TÍNH
2.1. Hồi quy tuyến tính với dữ liệu chéo
Các yếu tố ảnh hưởng đến sự trung thành của
khách hàng đối với sản phẩm Xoài cát Hòa lộc
Cái bè Tiền Giang.
Mô hình khái quát
Y b0 b1 X 1 b2 X 2 ... bi X i
Y: biến phụ thuộc; Xi: biến độc lập
15
Sử dụng phương pháp bình phương bé nhất
(Ordinary Least Square, OLS) trong kinh tế lượng
để ước lượng bi
Phương trình ước lượng:
Y b0 b1 X 1 b 2 X 2 ... bi X i u
U: Phần dư (Residuals)
Vấn đề: Ước lượng bi và xác định tương quan
tuyến tính của Xi đối với Y. => Sử dụng SPSS
16
Khung lý thuyết:
STT
I
1
II
1
Biến số
Mô tả biến số
Nguồn
Giả
thuyết
Biến phụ thuộc
Khả năng mua lặp lại của
khách hàng đối với XCHL.
KNMUA (Được đo bằng thang đo
(Y)
likert 5 mức độ, với 1:chắc
chắn không mua lại, 5:chắc
chắn mua lại
Ambastha and
Momaya (2004),
Porter (1990),
Aker (1991),
Keller (1998)
Biến độc lập
An toàn của XCHL, được đo
Ambastha and
bằng mức độ hài lòng của
ANT (X1)
Momaya (2004),
khách hàng, (Thang đo likert
Wangwe (1995)
5 mức độ)
17
+
Khung lý thuyết:
STT
Biến số
Mô tả biến số
Nguồn
Giả
thuyết
2
Thông tin truyền thông.
Khách hàng có tiếp nhận
Flanagan (2005),
được
XCHL
qua
các
Ambastha and
THONG phương tiện truyền thông.
Momaya (2004),
TIN (X2) Thông tin được đo biến giả.
Aker (1996),
Giá trị bằng 1 khi có tiếp
Keller (1998)
nhận, nhận giá trị 0 nếu
không có tiếp nhận.
+
3
CHATL
(X3)
Salinger (2001),
Geogre và
Michael (2002)
+
4
Flanagan (2005),
Giá của XCHL. Thang đo 5 Ambastha and
GIA (X4)
mức độ
Momaya (2004),
Aker (1996)
+
Chất lượng XCHL. Thang đo
likert 5 mức độ.
18
Khung lý thuyết:
STT
Biến số
5
THUAN
T (X5)
Mô tả biến số
Nguồn
Tính thuận tiện khi mua Flanagan (2005),
XCHL (Thang đo likert 5 Ambastha and
mức độ)
Momaya (2004)
Giả
thuyết
+
Dữ liệu: Số liệu điều tra 100 khách hàng trong
năm 2013.
File SPSS: P1-DATA-TRUNGTXCHL-LEC
Phương trình ước lượng:
Y b0 b1 X 1 b 2 X 2 b3 X 3 b 4 X 4 b5 X 5 u
Trong đó: Y: biến phụ thuộc, Xi: Biến độc lập, U: Phần dư.
19
XÁC ĐỊNH KÍCH THƯỚC MẪU ĐỐI VỚI MÔ HÌNH HỒI QUY
Theo Green W.H. (1991), Tabachnick & Fidell (2007).
Khi dữ liệu là dạng dữ liệu chéo (Cross-sectional
data).
Kích thước mẫu:
n 50 8 p
p: số biến độc lập
Mô hình nghiên cứu có 5 biến độc lập và 1 biến phụ
thuộc
n 50 8 * 5 90
20
Chọn n=100
HỆ THỐNG KIỂM ĐỊNH
Theo Green W.H. (1991), trong trường hợp số quan
sát >100, cần thực hiện 5 kiểm định.
(1) Kiểm định tương quan từng phần của các hệ số
hồi quy
Các biến độc lập tương quan có ý nghĩa với biến phụ
thuộc hay không (xét riêng từng phần biến độc lập).
Kiểm định t: Mức ý nghĩa (Sig.) của hệ số hồi quy
từng phần có độ tin cậy 95% (sig.<=0,05). Có thể
chọn 90% hoặc 99%.
21
(2) Mức độ phù hợp của mô hình
Mối quan hệ tuyến tính giữa các biến độc lập với
biến phụ thuộc hay không.
Kiểm định F: phân tích
phương sai (Analysis of
variance, ANOVA)
Mức ý nghĩa (sig.) có độ
tin cậy 95% (sig.<=0,05)
(3) Kiểm định hiện tượng đa cộng tuyến
Các biến độc lập gần như có quan hệ tuyến tính.
Độ phóng đại phương
sai (Variance Inflation
Factor, VIF)
VIF <= 10
22
(4) Kiểm định hiện tượng tự tương quan (auto
correlation)
Các ước lượng OLS vẫn là
Các phần dư chuẩn
các ước lượng tuyến tính,
ước lượng sẽ khác
không chệch, nhưng ước
các phần dư thực.
lượng lúc này đã không còn
hiệu quả
Trị số thống kê Durbin-Watson (d) của mô hình:
n
d
(e e
t 2
t
n
2
e
t
t 1
t 1
)
2
Bảng thống kê Durbin-watson
Số quan sát, số tham số (k-1) của mô
hình hồi quy. Mức ý nghĩa 0,1 (90%)
hoặc 0,05.
du: trị số thống kê trên, dL: trị số
thống kê dưới
23
Hình 1: Sơ đồ xác định hiện tượng tự tương quan
Tự tương
quan
dương
0
Không
kết luận
dL
Không có
tự tương
quan
dU
Không
kết luận
4-dU
Tự tương
quan âm
4-dL
Khi d lớn hơn dU và nhỏ hơn (4-dU), kết luận: không
có hiện tượng tự tương quan trong phần dư của mô
hình hồi quy tuyến tính.
24
(5) Hiện tượng phương sai phần dư thay đổi
(Heteroskedasticity)
Hiện tượng các giá
trị phần dư có
phân phối không
giống nhau
Ước lượng OLS của các hệ
số hồi quy không hiệu quả.
Khi số quan sát lớn
(>100)
Kiểm định White (White, H.,
1980)
25