Tải bản đầy đủ (.pdf) (53 trang)

Bài giảng Phương pháp nghiên cứu: Chương 6: phân tích tương quan và lợi quy - Nguyễn Hùng Phong

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (423.88 KB, 53 trang )

PHÂN TÍCH TƯƠNG QUAN VÀ
HOI QUY
MỤC TIÊU
Sau khi hoàn thành phần nầy, học viên sẽ co khả
năng:

Tính toán và phân tích hệ số tương quan giàn đơn giữa hai
biến

Xác định mức độ tin cậy thống kê của hệ số tương quan.

Tính toán và giải thích được hàm tương quan tuyến tính đơn
biến

Thông hiểu được các giả thuyết khi xây dựng hàm tương
quan

Biết được cách kiểm định trong hàm tương quan
Sơ đồ phân tán và hệ số tương quan

Sơ đồ phân tán thể hiện mối quan hệ giửa hai
biến

Phân tích hệ số tương quan dùng để đo lường mối
quan hệ đồng hành giửa hai biến.
 Hệ số tương quan không thể hiện mối quan hệ
nhân quả.
Sơ đồ phân tán (scatter plot)
y
x
y


x
y
y
x
x
Quan hệ tuyến tính Quan hệ phi tuyến
Sơ đồ phân tán (scatter plot)
y
x
y
x
y
y
x
x
Strong relationships Weak relationships
(continued)
Sơ đồ phân tán (scatter plot)
y
x
y
x
X và y không có
quan hệ
(continued)
Hệ số tương quan

Hệ số tương quan của đám đông ký hiệu là ρ
(rho) thể hiện sự đồng hành của hai biến.


Hệ số tương quan của mẩu r dùng ước lượng cho
rho và nó thể hiện tương quan tuyến tính dựa trên
các phần tử quan sát được từ mẩu.
(continued)
Đặc điểm của ρ and r

Không có đơn vị đo lường

Biến động trong phạm vi -1 và1

Càng gần -1, mối quan hệ nghịch biến càng cao

Càng gần +1, mối quan hệ đồng biến càng cao

Càng gần 0, mối quan hệ tuyến tính càng yếu
r = +.3 r = +1
Một số ví dụ về các giá trị của r
y
x
y
x
y
x
y
x
y
x
r = -1
r = 6 r = 0
Cách tính hệ số tương quan






])yy(][)xx([
)yy)(xx(
r
22
Các ký hiệu:
r = Hệ số tương quan của mẩu
n = Cở mẩu
x = các giá trị của biến độc lập
y = Các giá trị của biến phụ thuộc
   






])y()y(n][)x()x(n[
yxxyn
r
2222
Cách tính tương đương
Vớ d
ẹoọ cao
cuỷa caõy
ẹửụứng

kớnh thaõn
caõy
y x xy y
2
x
2
35 8 280 1225 64
49 9 441 2401 81
27 7 189 729 49
33 6 198 1089 36
60 13 780 3600 169
21 7 147 441 49
45 11 495 2025 121
51 12 612 2601 144
=321 =73 =3142 =14111 =713
0
10
20
30
40
50
60
70
0 2 4 6 8 10 12 14
0.886
](321)][8(14111)(73)[8(713)
(73)(321)8(3142)
]y)()y][n(x)()x[n(
yxxyn
r

22
2222







   



Đường kính x
Độ cao
y
Ví dụ về cách tính r
(continued)
r = 0.886 → relatively strong positive
linear association between x and y
Excel Output
Tree Height Trunk Diameter
Tree Height 1
Trunk Diameter 0.886231 1
Excel Correlation Output
Tools / data analysis / correlation…
Correlation between
Tree Height and Trunk Diameter
Kiểm định mức ý nghĩa của hệ số tương
quan


Giả thuyết
H
0
: ρ = 0 (Không có quan hệ tương quan)
H
A
: ρ ≠ 0 (Có quan hệ tương quan)

Công thức tính

(with n – 2 degrees of freedom)
2n
r1
r
t
2



Ví dụ
Có mối quan hệ tương quan giửa chiều cao và
đường kính của cây với mức ý nghĩa 5% ?
H
0
: ρ = 0 (No correlation)
H
1
: ρ ≠ 0 (correlation exists)
a

=.05 , df = 8 - 2 = 6
4.68
28
.8861
.886
2n
r1
r
t
22







4.68
28
.8861
.886
2n
r1
r
t
22








Example: Test Solution
Kết luận: Có mối
quan hệ tương
quan giử chiều
cao và đường
kính của cây o
mức ý nghĩa 5%
Quyết định :
Từ chối H
0
Reject H
0
Reject H
0
a/2=.025
-t
α/2
Do not reject H
0
0
t
α/2
a/2=.025
-2.4469 2.4469
4.68
d.f. = 8-2 = 6
Mô hình hồi quy tuyến tính giản đơn


Chỉ có một biến đôc lập: x

Mối quan hệ giửa x và y là quan hệ tuyến tính

Sự thay đổi của y được giả định là do sự thay
đổi của x.
Các mô hình thể hiện mối quan hệ
Quan hệ đồng biến
Quan hệ nghịch biến
Quan hệ phi tuyến
Khong có quan hệ
εxββy
10

Bộ phận dự đoán tương quan
Hàm tương quan của đám đông
Hằng số
Hệ số góc
Hệ số sai
lệch/phần dư
Biến phụ thuộc
Biến độc lập
Sai lệch ngẩu nhiên
Các giả thuyết của hàm tương quan

Các sai lệch ngẩu nhiên hoàn toàn độc lập với nhau
về phương diện thống kê.

Các sai lệch ngẩu nhiên có phân phối chuẩn


Phân phối xác suất của các sai lệch ngẩu nhiên có
phương sai không đổi

Quan hệ giửa x và y là quan hệ tuyến tính
Hàm tương quan tuyến tính của đám
đông
(continued)
Sai lệch ngẩu
nhiên của biến x
i
y
x
Giá trị quan sát
của y tương ứng
với x.
Giá trị dự đoán
của y ứng với x
εxββy
10

x
i
Slope = β
1
Hằng số = β
0
ε
i
xbby

ˆ
10i


Hàm tương quan ước lượng của mẩu
Hằng số ước
lượng của hàm
tương quan
Hệ số góc ước
lượng
Giá trị ước
lượng/dự đoán
Biến độc lập
Sai lệch ngẩu nhiên có giá trị trung bình bằng 0
Tiêu chuẩn bình phương bé nhất (Least
Squares Criterion)

b
0
và b
1
được tính toán theo tiêu chuẩn tổng bình
phương bé nhất của phần dư (residuals)
2
10
22
x))b(b(y
)y
ˆ
(ye






Hệ số của hàm tương quan theo tiêu
chuẩn tổng bình phương bé nhất

Công thức tính b
1
và b
0
:
Hoặc:








n
x
x
n
yx
xy
b
2

2
1
)(





2
1
)(
))((
xx
yyxx
b
xbyb
10



b
0
là giá trị trung bình của y khi x nhận giá
trị bằng 0

b
1
là sự thay đổi theo ước lượng của giá trị
trung bình của y mổi khi x thay đổi một đơn
vị.

Yù nghĩa của hệ số góc và hằng số
của hàm tương quan

×