Tải bản đầy đủ (.ppt) (19 trang)

Bài giảng môn Nguyên lý thống kê kinh tế - PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (162.31 KB, 19 trang )

PHÂN TÍCH TƯƠNG
QUAN VÀ HỒI QUI


I. HỆ SỐ TƯƠNG QUAN (Correlation
coefficient)
Hệ số tương quan đo lường mức độ quan
hệ tuyến tính giữa hai biến; chính xác hơn
là quan hệ tuyến tính giữa hai biến, khơng
phân biệt biến này phụ thuộc vào biến kia. .


1. Hệ số tương quan mẫu (r): (Sample
correlation coefficient)
Gọi (x1, y1), (x2, y2), ..., (xn, yn) là n cặp quan sát của
một mẫu ngẫu nhiên của hai biến ngẫu nhiên X & Y.
Hệ số tương quan mẫu :








2. Ðặc tính của hệ số tương quan (r):
r khơng có đơn vị.
r ln ln biến động trong [-1, 1], nếu hệ
số tương quan (r) dương cho biết X và Y
biến động cùng chiều và âm thì ngược lại.
r = 1 hoặc r = - 1: X và Y có liên hệ hoàn


toàn chặt chẽ.
r = 0: X và Y khơng có mối liên hệ.


Ví dụ:
Một quảng cáo giới thiệu du lịch được đăng
trong 17 tờ báo hoặc tạp chí. Liên quan đến chiến
dịch quảng cáo này có hai biến liên hệ.
X: chi phí quảng cáo (100.000 đồng)
Y: tỉ suất lợi nhuận (chỉ tính trên 100.000đ chi
phí quảng cáo)


Ví dụ:


Từ số liệu bảng trên ta tính trung bình mẫu:

r = -0.441 chỉ ra mối quan hệ giữa chi phí và tỷ suất lợi
nhuận là mối tương quan nghịch, có nghĩa rằng chi phí cao
thì tỷ suất lợi nhuận thấp và giữa chúng mối liên hệ không
chặt chẽ lắm.


Kiểm định hệ số tương quan
 1. giả thiết:
H 0 : ρ = 0
(1)
 H1 : ρ > 0


 2. Kiểm định

t=

H 0 : ρ = 0
(3)
 H1 : ρ ≠ 0

H 0 : ρ = 0
(2)
H1 : ρ < 0

r
(1 − r 2 )

( n − 2)

 3. Quyết định:

t > t n − 2,α

t < −t n −2,α

t > t n −2,α / 2


II. TƯƠNG QUAN HẠNG: (RANK CORRELATION)

Tương quan hạng dùng để sử


dụng cho kiểm định mối liên hệ
giữa các biến khi phân phối của
tổng thể được giả sử không phải
là phân phối chuẩn hoặc trong
trường hợp hiện diện các giá trị
bất thường của biến quan sát
(lớn quá hoặc nhỏ quá).


II. TƯƠNG QUAN HẠNG: (RANK CORRELATION)

Nếu các hạng được xếp khơng trùng
nhau thì sử dụng cơng thức của
Spearman như dưới đây để tính hệ
số tương quan hạng.
n

r =1−

6∑ d
i =1
2

2
i

n(n − 1)

di : là chêch lệch giữa 2 hạng của xi và yi



Kiểm định hệ số tương quan
 1. giả thiết:
H 0 : ρ = 0
(1)
 H1 : ρ > 0

2. Kiểm định

r =1−
 3. Quyết định:

r > rs ,α
rs ,α

H 0 : ρ = 0
(2)
H1 : ρ < 0

H 0 : ρ = 0
(3)
 H1 : ρ ≠ 0

n

6∑ d i2
i =1
2

n(n − 1)


r < −rs ,α

r > rs,α / 2

Tra bảng phân phối Spearman


III.Hồi qui tuyến tính một chiều (tuyến tính
đơn) Simple linear regression:
• Ðặt (x1,y1), (x2,y2)... (xn,yn) là mẫu gồm n
cặp quan sát trên đường hồi qui tổng thể.

yi = α + βxi + ε i
• Theo phương pháp bình phương bé nhất thì

ước lượng các hệ số α và β là các giá trị a và
b sao cho tổng bình phương sai số của
phương trình sau đây là bé nhất:


1. Phương trình hồi qui tuyến tính một chiều:
Đường hồi qui tuyến tính mẫu của y trên x: y = a + bx
• Các hệ số a và b được tính như sau:


Ví dụ:
Chúng ta có thể quan sát số tiền chi tiêu (yi)
và thu nhập (xi) của 22 hộ gia đình trong một tháng
có mối quan hệ với nhau như thế nào (1.000đ). Số

liệu thu thập được:


Ðường hồi qui quan sát:

y = 1923 + 0,3815x

Nhận xét: Nếu thu nhập của hộ gia đình tăng lên
1.000đ thì trung bình chi tiêu tăng thêm là 381,5đ.
Cịn 1923đ là phần chi tiêu do các nguồn khác.


2. Khoảng tin cậy
 Giả sử đường hồi qui tuyến tính có dạng

yi = α + β xi + ε i
Thống kê:

b−β
t=
sb
s2 =
b

Khoảng ước lượng

2
se
n


∑x
i =1

2
i

−n x

2

 n e2  / n − 2
)
∑ i ÷ (
=  i =1 
n

∑x
i =1

2
i

−n x

2

b − tn −2 ,α / 2 sb < β < b + tn − 2 ,α / 2 sb


Kiểm định tham số hồi qui tổng thể

 1. giả thiết:
H 0 : β = β0
(1)
 H1 : β > β 0

2. Kiểm định

H 0 : β = β0
( 2) 
 H1 : β < β 0

b − β0
t=
Sb

3. Quyết định:

t > t n − 2,α

H 0 : β = β0
(3)
 H1 : β ≠ β 0

t < −t n −2,α

t
 >t n −2 ,α/ 2

t
t

 <− n −2 ,α/ 2


3. Phân tích phương sai hồi qui
Ta có: ∑ ( y − y ) = ∑  y − y  + ∑  y − y 




i

Nguồn
biến động

2

~

2



i

i



2


~



i



Độ tự Tổng bình
Phương Thống Giá trị
do (df) phương (SS) sai (MS) kê F
phân vị

Do hồi qui 1

SSR

Dư số

SSE

n-2

Tổng cộng

SST
2


SSR =∑ y − y 





~

:tổng bình phường hồi qui, là biến động
của y được giải thích bằng đường hồi qui

2

~
y −y 
SSE = ∑ i

i 



(

SST = ∑ yi − y

)

2

:dư số,là biến động của y do các nhân tố
khác gây ra
:tổng biến động của y



IV. Hồi qui nhiều chiều:(Multiple egression)



×