Tải bản đầy đủ (.pdf) (51 trang)

CHUONG VI TƯƠNG QUAN HỒI QUY CORRELATION REGRESSION

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.41 MB, 51 trang )

ĐẠI HỌC CÔNG NGHIỆP TP HCM - CSMT
Business Administration

CHƯƠNG VI:

TƯƠNG QUAN & HỒI QUY
CORRELATION & REGRESSION


NỘI DUNG
Tương quan tuyến tính
Hồi quy đơn tuyến tính
Hồi quy bội tuyến tính

2


1. TƯƠNG QUAN (CORRELATION)

 Xem xét mối quan hệ giữa hai hay nhiều

biến định lượng
 Tương quan có:
 Tương quan 2 biến – Bivariate Correlations
 Tương quan riêng phần – Partial Correlations

 Điều kiện:
 2 hoặc nhiều biến định lượng.
3



1. TƯƠNG QUAN (CORRELATION)

Ví dụ: Đo lường mối quan hệ giữa

doanh số bán hàng (y) với chi phí chào
hàng (x), dữ liệu được thu thập tại 12

khu vực bán hàng trong file tqvahq.

4


1. TƯƠNG QUAN (CORRELATION)
 Mục tiêu nghiên cứu: Giả định nhà nghiên cứu
muốn tìm hiểu có mối quan hệ như thế nào giữa
doanh số bán hàng và chi phí chào hàng
 Giả thuyết H0: Doanh số và chi phí chào hàng

không có liên hệ với nhau.

5


1. TƯƠNG QUAN (CORRELATION)
1.1. Dùng đồ thị Scatter để xem xét mối liên hệ:
Vào

menu

Graphs


>

Legacy

Dialogs

>

Scatter/Dot…, để mở hộp thoại Scatterplot. Chọn
Simple Scatter và nhấn Define để vào hộp thoại kế

tiếp.

6


1. TƯƠNG QUAN (CORRELATION)

Biến doanh số
Biến chào hàng

7


1. TƯƠNG QUAN (CORRELATION)

8



1. TƯƠNG QUAN (CORRELATION)

1.2. Sử dụng hệ số tương quan r (Pearson)
 Dùng để lượng hóa mức độ chặt chẽ mối liên
hệ tuyến tính
 Trị tuyệt đối r tiến gần đến 1 khi hai biến có mối
liên hệ chặt chẽ
 Giá trị r = 0 khi hai biến không có mối liên hệ
tuyến tính

 Không có mối liên hệ
 Có liên hệ chặt chẽ nhưng không phải tuyến tính.
9


1. TƯƠNG QUAN (CORRELATION)

1.2. Sử dụng hệ số tương quan r (Pearson)
 Xem xét đồng thời r và đồ thị để đánh giá mối
liên hệ
 Có liên hệ tương quan chưa chắc đã có mối
quan hệ nhân quả
 Hai biến không có mối liên hệ nhưng r rất cao
(tương quan giả).

10


1. TƯƠNG QUAN (CORRELATION)


1.2. Sử dụng hệ số tương quan r (Pearson)

Menu chọn: Analyze > Correlate > Bivariate..

11


1. TƯƠNG QUAN (CORRELATION)

Hộp thoại Bivariate Correlations xuất hiện:

12


1. TƯƠNG QUAN (CORRELATION)

Hộp thoại Option:

Trung
bình và
độ lệch
chuẩn

Tổng
các tích
mômen
chéo và
hiệp
phương
sai

Nhấp continue để trở về hộp
13 thoại trước và nhấp OK.


1. TƯƠNG QUAN (CORRELATION)

Vì Pearson = 0,905 và Sig = 0,000
nên đủ cơ sở bác bỏ H0, nghĩa là….
14


2. MÔ HÌNH HỒI QUY TUYẾN TÍNH
2.1. Hồi quy tuyến tính với dữ liệu chéo
Các yếu tố ảnh hưởng đến sự trung thành của
khách hàng đối với sản phẩm Xoài cát Hòa lộc
Cái bè Tiền Giang.
Mô hình khái quát

Y  b0  b1 X 1  b2 X 2  ...  bi X i
Y: biến phụ thuộc; Xi: biến độc lập
15


Sử dụng phương pháp bình phương bé nhất
(Ordinary Least Square, OLS) trong kinh tế lượng
để ước lượng bi
Phương trình ước lượng:











Y  b0  b1 X 1  b 2 X 2  ...  bi X i  u
U: Phần dư (Residuals)
Vấn đề: Ước lượng bi và xác định tương quan
tuyến tính của Xi đối với Y. => Sử dụng SPSS

16


Khung lý thuyết:
STT

I

1

II

1

Biến số

Mô tả biến số


Nguồn

Giả
thuyết

Biến phụ thuộc
Khả năng mua lặp lại của
khách hàng đối với XCHL.
KNMUA (Được đo bằng thang đo
(Y)
likert 5 mức độ, với 1:chắc
chắn không mua lại, 5:chắc
chắn mua lại

Ambastha and
Momaya (2004),
Porter (1990),
Aker (1991),
Keller (1998)

Biến độc lập
An toàn của XCHL, được đo
Ambastha and
bằng mức độ hài lòng của
ANT (X1)
Momaya (2004),
khách hàng, (Thang đo likert
Wangwe (1995)
5 mức độ)
17


+


Khung lý thuyết:
STT

Biến số

Mô tả biến số

Nguồn

Giả
thuyết

2

Thông tin truyền thông.
Khách hàng có tiếp nhận
Flanagan (2005),
được
XCHL
qua
các
Ambastha and
THONG phương tiện truyền thông.
Momaya (2004),
TIN (X2) Thông tin được đo biến giả.
Aker (1996),

Giá trị bằng 1 khi có tiếp
Keller (1998)
nhận, nhận giá trị 0 nếu
không có tiếp nhận.

+

3

CHATL
(X3)

Salinger (2001),
Geogre và
Michael (2002)

+

4

Flanagan (2005),
Giá của XCHL. Thang đo 5 Ambastha and
GIA (X4)
mức độ
Momaya (2004),
Aker (1996)

+

Chất lượng XCHL. Thang đo

likert 5 mức độ.

18


Khung lý thuyết:
STT

Biến số

5

THUAN
T (X5)

Mô tả biến số

Nguồn

Tính thuận tiện khi mua Flanagan (2005),
XCHL (Thang đo likert 5 Ambastha and
mức độ)
Momaya (2004)

Giả
thuyết
+

Dữ liệu: Số liệu điều tra 100 khách hàng trong
năm 2013.

File SPSS: P1-DATA-TRUNGTXCHL-LEC
Phương trình ước lượng:














Y  b0  b1 X 1  b 2 X 2  b3 X 3  b 4 X 4  b5 X 5  u
Trong đó: Y: biến phụ thuộc, Xi: Biến độc lập, U: Phần dư.
19


XÁC ĐỊNH KÍCH THƯỚC MẪU ĐỐI VỚI MÔ HÌNH HỒI QUY

Theo Green W.H. (1991), Tabachnick & Fidell (2007).
Khi dữ liệu là dạng dữ liệu chéo (Cross-sectional

data).
Kích thước mẫu:

n  50  8 p


p: số biến độc lập
Mô hình nghiên cứu có 5 biến độc lập và 1 biến phụ
thuộc

n  50  8 * 5  90
20

Chọn n=100


HỆ THỐNG KIỂM ĐỊNH

Theo Green W.H. (1991), trong trường hợp số quan
sát >100, cần thực hiện 5 kiểm định.

(1) Kiểm định tương quan từng phần của các hệ số
hồi quy
Các biến độc lập tương quan có ý nghĩa với biến phụ
thuộc hay không (xét riêng từng phần biến độc lập).
Kiểm định t: Mức ý nghĩa (Sig.) của hệ số hồi quy
từng phần có độ tin cậy 95% (sig.<=0,05). Có thể
chọn 90% hoặc 99%.

21


(2) Mức độ phù hợp của mô hình
Mối quan hệ tuyến tính giữa các biến độc lập với
biến phụ thuộc hay không.

Kiểm định F: phân tích
phương sai (Analysis of
variance, ANOVA)

Mức ý nghĩa (sig.) có độ
tin cậy 95% (sig.<=0,05)

(3) Kiểm định hiện tượng đa cộng tuyến
Các biến độc lập gần như có quan hệ tuyến tính.
Độ phóng đại phương
sai (Variance Inflation
Factor, VIF)

VIF <= 10
22


(4) Kiểm định hiện tượng tự tương quan (auto
correlation)
Các ước lượng OLS vẫn là
Các phần dư chuẩn
các ước lượng tuyến tính,
ước lượng sẽ khác
không chệch, nhưng ước
các phần dư thực.
lượng lúc này đã không còn
hiệu quả
Trị số thống kê Durbin-Watson (d) của mô hình:
n


d

 (e  e
t 2

t

n

2
e
t
t 1

t 1

)

2

Bảng thống kê Durbin-watson
Số quan sát, số tham số (k-1) của mô
hình hồi quy. Mức ý nghĩa 0,1 (90%)
hoặc 0,05.
du: trị số thống kê trên, dL: trị số
thống kê dưới
23


Hình 1: Sơ đồ xác định hiện tượng tự tương quan

Tự tương
quan
dương
0

Không
kết luận
dL

Không có
tự tương
quan
dU

Không
kết luận
4-dU

Tự tương
quan âm
4-dL

Khi d lớn hơn dU và nhỏ hơn (4-dU), kết luận: không
có hiện tượng tự tương quan trong phần dư của mô
hình hồi quy tuyến tính.

24


(5) Hiện tượng phương sai phần dư thay đổi

(Heteroskedasticity)
Hiện tượng các giá
trị phần dư có
phân phối không
giống nhau

Ước lượng OLS của các hệ
số hồi quy không hiệu quả.

Khi số quan sát lớn
(>100)

Kiểm định White (White, H.,
1980)

25


×