Tải bản đầy đủ (.pdf) (12 trang)

Bài giảng Lý thuyết thống kê - Bài 5: Phân tích hồi quy tương quan

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (607.65 KB, 12 trang )

Bài 5: Phân tích hồi quy – tương quan

BÀI 5

PHÂN TÍCH HỒI QUY – TƯƠNG QUAN

Hướng dẫn học
Bài này giới thiệu phương pháp phân tích hồi quy – tương quan, là phương pháp phân
tích mối liên hệ, tác động qua lại giữa hiện tượng kinh tế xã hội. Trong đó, bài học giới
thiệu nhiệm vụ phương pháp phân tích hồi quy tương quan, đưa ra một số mơ hình hồi
quy và cách xác định các tham số trong mơ hình.
Để học tốt bài này, sinh viên cần tham khảo các phương pháp học sau:
 Học đúng lịch trình của mơn học theo tuần, làm các bài luyện tập đầy đủ và tham gia
thảo luận trên diễn đàn.
 Đọc tài liệu: Giáo trình Lý thuyết Thống kê, PGS. TS. Trần Thị Kim Thu chủ biên,
NXB Đại học KTQD.
 Sinh viên làm việc theo nhóm và trao đổi với giảng viên trực tiếp tại lớp học hoặc qua email.
 Tham khảo các thông tin từ trang Web môn học.
Nội dung
Bài này sẽ trình bày những vấn đề chung về phương pháp hồi quy – tương quan, đặc biệt
giới thiệu hồi quy – tương quan đơn giữa hai tiêu thức số lượng, đề cập tới cách xây dựng
phương trình hồi quy và xác định trình độ chặt chẽ của mối liên hệ.
Mục tiêu
Sau khi học xong bài này, sinh viên cần thực hiện được các việc sau:


Phân biệt mối liên hệ hàm số và mối liên hệ tương quan.



Trình bày được khái niệm, nhiệm vụ của phương pháp hồi quy – tương quan.





Xây dựng được phương trình hồi quy tương quan tuyến tính giữa hai tiêu thức số lượng.



Xác định được trình độ chặt chẽ của mối liên hệ tương quan giữa hai tiêu thức số lượng.

STA302_Bai5_v1.0013109210

67


Bài 5: Phân tích hồi quy – tương quan

Tình huống dẫn nhập
Phân tích kết quả kinh doanh
Giả sử bạn là nhân viên phòng kế hoạch của doanh nghiệp sản xuất bánh kẹo. Bạn nhận thấy
doanh thu từ sản phẩm bánh kem của doanh nghiệp đang giảm dần. Từ thực tế đó, phịng bạn đề
xuất tăng thêm chi phí quảng cáo để có thể tăng doanh thu của doanh nghiệp. Bạn với tư cách là
nhân viên phòng kế hoạch, thực hiện tổng hợp dữ liệu về doanh thu và chi phí quảng cáo từ các
cơ sở kinh doanh bánh kẹo của doanh nghiệp để tìm hiểu mối liên hệ giữa chi phí quảng cáo tới
doanh thu.

1. Làm thế nào để xác định mối liên hệ giữa chi phí quảng cáo tới doanh thu?
2. Mối liên hệ giữa chi phí quảng cáo và doanh thu có chặt chẽ hay khơng?

68


STA302_Bai5_v1.0013109210


Bài 5: Phân tích hồi quy – tương quan

5.1.

Những vấn đề chung về phương pháp hồi quy – tương quan

5.1.1.

Khái niệm hồi quy – tương quan

Hồi quy - tương quan là phương pháp phân tích dựa trên mối liên hệ phụ thuộc của
một biến kết quả (biến phụ thuộc) vào một hay nhiều biến nguyên nhân (biến độc lập).
Ví dụ: Phân tích mối liên hệ phụ thuộc giữa vốn tới doanh thu của doanh nghiệp A
năm 2012.
5.1.2.

Liên hệ hàm số và liên hệ tương quan

Liên hệ hàm số
Khái niệm: Là mối liên hệ hoàn toàn chặt chẽ, tức là khi hiện tượng này thay đổi thì
hồn tồn quyết định sự thay đổi của hiện tượng có liên quan theo một tỷ lệ xác định.
Liên hệ hàm số được viết dưới dạng y = f(x)
Đặc điểm: Liên hệ hàm số không những được biểu hiện ở tổng thể mà còn được biểu
hiện trên từng đơn vị cá biệt
Mối liên hệ này thường có trong tự nhiên. Ví dụ trong vật lý: S = v.t
Liên hệ tương quan
Khái niệm: Là mối liên hệ khơng hồn tồn chặt chẽ, tức là khi hiện tượng này thay đổi

thì có thể làm cho hiện tượng có liên quan thay đổi nhưng khơng hồn tồn quyết định.
Đặc điểm: Liên hệ tương quan không được biểu hiện trên từng đơn vị cá biệt mà phải
thông qua hiện tuợng số lớn.
Mối liên hệ này rất phổ biến và thường gặp trong các hiện tượng kinh tế – xã hội. Ví
dụ: Mối liên hệ giữa tuổi nghề và năng suất lao động. Tuổi nghề có ảnh hưởng đến
năng suất lao động nhưng năng suất lao động không chỉ chịu ảnh hưởng của tuổi nghề
mà còn chịu ảnh huởng của các nhân tố khác như tay nghề, bậc thợ...
5.1.3.

Một số dạng liên hệ

Dựa theo phân tích đặc điểm của mối quan hệ hay từ số liệu được điều tra thực tế mà
xây dựng được các phương trình biểu diễn mối liên hệ một cách phù hợp nhất. Một số
dạng liên hệ có thể là:

a. Liên hệ hypebol

STA302_Bai5_v1.0013109210

69


Bài 5: Phân tích hồi quy – tương quan

5.1.4.

Nhiệm vụ của phương pháp hồi quy – tương quan

Phương pháp hồi quy – tương quan giải quyết hai nhiệm vụ chủ yếu sau:
 Xây dựng phương trình hồi quy và giải thích ý nghĩa các tham số trong phương

trình hồi quy.
 Đánh giá mức độ chặt chẽ của mối liên hệ tương quan thơng qua hệ số tương quan
(tuyến tính) và tỷ số tương quan (phi tuyến).
5.2.

Hồi quy – tương quan tuyến tính đơn giữa hai tiêu thức số lượng

5.2.1.

Phương trình hồi quy

Truớc khi đi vào xây dựng phương trình hồi quy, chúng ta hãy xem xét một số khái
niệm có liên quan.
Ðường hồi quy thực nghiệm: là đường được hình thành bởi các tài liệu thực tế.
Ðường hồi quy lý thuyết: là đường
điều chỉnh, bù trừ các chênh lệch
ngẫu nhiên, vạch ra xu hướng cơ bản
của hiện tuợng.
Phương trình hồi quy là phương
trình xác định vị trí của đường hồi
quy lý thuyết sao cho mô tả tốt nhất
mối liên hệ thực tế.
Phương trình hồi quy tuyến tính biểu diễn mối liên hệ giữa 2 tiêu thức số lượng có
dạng: yˆ i  b0  b1x i
Trong đó: xi – giá trị tiêu thức gây ảnh hưởng (nguyên nhân).
yˆ i - trị số điều chỉnh của tiêu thức chịu ảnh hưởng (kết quả) theo quan hệ
với x.
5.2.2.

Phương pháp bình phương nhỏ nhất


Các hệ số b0, b1 ở phương trình hồi quy tuyến tính trên phải được xác định sao cho
đường hồi quy lý thuyết mô tả tốt nhất mối liên hệ thực tế. Trên hình vẽ, khoảng cách
từ điểm thực tế đến điểm thuộc đường hồi quy lý thuyết nhỏ nhất sẽ là tốt nhất. Vì thế,
70

STA302_Bai5_v1.0013109210


Bài 5: Phân tích hồi quy – tương quan

sử dụng phương pháp bình phương nhỏ nhất (OLS - Ordinary Least Square) với nội dung:
tổng bình phương các độ lệch giữa giá trị thực tế và giá trị lý thuyết của biến phụ thuộc
(tiêu thức kết quả) là nhỏ nhất.
S = (yi − y i )2 = min
Hay:

S = ( yi – bo – b1xi)2 = min

Để thỏa mãn điều kiện trên, cần tìm đạo hàm riêng theo 2 tham số cần tìm. Từ đó, b0
và b1 phải thỏa mãn hệ phương trình:





 yi  nb0  b1  x i
 x i yi  b0  x i  b1 x i2

Từ hệ phương trình trên, sau khi biến đổi, b0 và b1 có thể được tính theo cơng thức:


b1 

Trong đó:

x

xy  xy
và b0 = y  b1 x
2x

 xi

y

n

 yi
n

x i2   x i 

2
x 


n

5.2.3.





n




xy 

 x i yi
n

2

 x 2  (x)2

Ý nghĩa các hệ số trong phương trình hồi quy

Sử dụng phương pháp bình phương nhỏ nhất sẽ xác định được giá trị của b0 và b1. Ý
nghĩa của hai tham số này lần lượt như sau:


b0 là hệ số tự do (hệ số chặn), là điểm xuất phát của đường hồi quy lý thuyết, nêu
lên ảnh hưởng của các nhân tố khác (tiêu thức nguyên nhân khác) ngoài x tới sự
biến động của tiêu thức kết quả y.



b1 là hệ số hồi quy nói lên ảnh hưởng trực tiếp của tiêu thức nguyên nhân x tới tiêu

thức kết quả y. Cụ thể, khi x tăng một đơn vị thì làm cho y thay đổi trung bình là
b1 đơn vị.

Giá trị b1 có thể âm, dương hay bằng 0, tùy thuộc vào mối liên hệ giữa x và y. Hệ số hồi
quy b1 nêu lên chiều hướng của mối liên hệ. Cụ thể: b1 > 0, mối liên hệ thuận; b1< 0, mối
liên hệ nghịch.
Ví dụ, có tài liệu về doanh thu và chi phí quảng cáo của 5 cửa hàng giới thiệu sản
phẩm A như sau:
STA302_Bai5_v1.0013109210

71


Bài 5: Phân tích hồi quy – tương quan
`

x2
i

y2
i

Doanh thu

Chi phí quảng cáo

(triệu đồng) yi

(triệu đồng) xi


A

850

2

1700

4

722500

B

870

5

4350

25

756900

C

880

6


5280

36

774400

D

900

9

8100

81

810000

E

910

13

11830

169

828100


Tổng

4410

35

31260

315

3891900

Cửa hàng

xiyi

Yêu cầu: Xây dựng phương trình hồi quy biểu diễn mối liên hệ tương quan tuyến tính
giữa chi phí quảng cáo tới doanh thu của 5 cửa hàng trên.
Theo yêu cầu trên, xác định được tiêu thức nguyên nhân là chi phí quảng cáo (x) và
doanh thu là tiêu thức kết quả (y). Phương trình hồi quy có dạng: yˆ i  b0  b1x i
Có 2 cách xác định các tham số:



Cách 1: Giải hệ phương trình






 yi  nb0  b1  x i
 4410  5b0  35b1

 x i yi  b0  x i  b1  x i2 31260  35b0  315b1

 b0  843, 01

 b1  5,57



Cách 2: Xác định từ các công thức
x

 x i  35  7

y

 yi  4410  882

n

n

xy 

2x

Từ đó, b1 


72

5

5

 x i yi  31260  6252
n

5

x i2   x i 




n




n




2




315 2
 7  14
5

xy  xy 6252  7  882

 5,57
14
2x
STA302_Bai5_v1.0013109210


Bài 5: Phân tích hồi quy – tương quan

b0  y  b1x  882  5,57  7  843,01
Hai cách tính đều cho kết quả b0 và b1 như nhau. Vậy phương trình hồi qui biểu diễn
mối liên hệ tương quan giữa chi phí quảng cáo tới doanh thu là: yˆ i  843,01  5,57x i
Ý nghĩa các hệ số trong phương trình hồi qui tuyến tính:

 b0 = 843,01: nói lên ảnh hưởng của tất cả các tiêu thức ngun nhân trong đó
khơng có chi phí quảng cáo tới doanh thu của 5 cửa hàng.
 b1 = 5,57: nói lên ảnh hưởng trực tiếp của chi phí quảng cáo tới doanh thu. Cụ thể,
khi chi phí quảng cáo tăng lên 1 triệu đồng thì doanh thu tăng trung bình là 5,57
triệu đồng.
Sau khi xây dựng được phương trình hồi quy phản ánh mối liên hệ giữa các hiện
tuợng kinh tế – xã hội, nhiệm vụ tiếp theo của phân tích hồi quy - tương quan là phải
đánh giá trình độ chặt chẽ của mối liên hệ đó.
5.2.4.

Hệ số tương quan


Hệ số tương quan là số tương đối sử dụng để đánh giá trình độ chặt chẽ (chiều hướng
và cường độ) của mối liên hệ tương quan tuyến tính.
Cơng thức tính:
r

xy  x.y

 b1 x
x  y
y

Các tính chất:

 Miền xác định: -1 ≤ r ≤ 1
 r > 0: mối liên hệ tương quan tuyến tính thuận (cùng chiều).
 r < 0: mối liên hệ tương quan tuyến tính nghịch (ngược chiều).
 r = ± 1: mối liên hệ hàm số - hoàn toàn chặt chẽ.
 r = 0: khơng có mối liên hệ tương quan tuyến tính giữa x và y.


r càng gần 1: mối liên hệ càng chặt chẽ.

Trở lại ví dụ trên, tính hệ số tương quan. Ta có:
2

2y  y 2  y 

r  b1


3891900
 8822  456
5

x
14
 5,57
 0,976
y
456

Như vậy, mối liên hệ giữa chi phí quảng cáo tới doanh thu là mối liên hệ tương quan
tuyến tính thuận và rất chặt chẽ.
STA302_Bai5_v1.0013109210

73


Bài 5: Phân tích hồi quy – tương quan

5.3.

Hồi quy - tương quan phi tuyến giữa hai tiêu thức số lượng

5.3.1.

Phương trình hồi quy

Mối liên hệ tương quan phi tuyến là mối liên hệ tương quan giữa các tiêu thức không
được biểu hiện bằng một đường thẳng mà bằng các đường cong có hình dáng khác

nhau. Một số dạng đường cong thường gặp:
 Phương trình parabol (bậc 2)
o

Vận dụng khi tiêu thức nguyên nhân tăng hay giảm với 1 lượng đều nhau thì tiêu
thức kết quả biến động vơi 1 lượng khơng đều nhau (nhanh hơn hoặc chậm hơn).
Ví dụ: tuổi nghề và năng suất lao động.

o

Phương trình hồi quy:
yˆ i  b0  b1x i  b2 x i2
b0, b1, b2 là các tham số của phương trình hồi quy, được xác định bằng phương
pháp bình phương nhỏ nhất và phải thỏa mãn hệ phương trình:







 yi  nb0  b1 xi  b2  x i2
 xi yi  b0  x i  b1 x i2  b2x 3i
 xi2y  b0  x i2  b1 x3i  b2x i4

 Phương trình hypebol
o Vận dụng khi tiêu thức nguyên nhân tăng thì tiêu thức kết quả giảm với tốc độ
khơng đều.
o Phương trình hồi quy:
yˆ i  b0 


b1
xi

b0, b1 là tham số của phương trình hồi quy, được xác định bằng phương pháp bình
phương nhỏ nhất và phải thỏa mãn hệ phương trình:






5.3.2.

1

 yi  nb0  b1 x i
1

1

1

 xi yi  b0  xi  b1 x 2
i

Tỷ số tương quan

Tỷ số tương quan là chỉ tiêu đánh giá mức độ chặt chẽ của mối liên hệ tương quan phi tuyến.
Cơng thức tính:


  yi  yˆ i 
1
2
  yi  y 

2



74

STA302_Bai5_v1.0013109210


Bài 5: Phân tích hồi quy – tương quan

Tính chất:



0  1

 η = 0: khơng có mối liên hệ tương quan phi tuyến.
 η = 1: mối liên hệ tương quan phi tuyến hoàn toàn chặt chẽ.
 η càng gần 1: mối liên hệ càng chặt chẽ.
Nhận xét:

 η ln ≥ 0 nên tỷ số tương quan chỉ có thể đánh giá trình độ chặt chẽ của mối liên
hệ chứ khơng nói được chiều hướng của mối liên hệ.

 η có thể dùng cho cả phi tuyến và tuyến tính (khi r 0).

STA302_Bai5_v1.0013109210

75


Bài 5: Phân tích hồi quy – tương quan

Tóm lược cuối bài


Các hiện tượng kinh tế – xã hội luôn tồn tại trong mối liên hệ ràng buộc lẫn nhau. Tuỳ theo
mức độ chặt chẽ của mối liên hệ mà có thể phân ra thành hai loại: liên hệ hàm số và liên hệ
tương quan.



Phân tích hồi quy - tương quan thực chất là phương pháp phân tích mối liên hệ phụ thuộc với
hai nhiệm vụ chủ yếu: xây dựng phương trình hồi quy biểu diễn mối liên hệ và đánh giá mức
độ chặt chẽ của mối liên hệ.



Với mối liên hệ đơn giản nhất giữa hai tiêu thức số luợng, tuỳ theo việc thăm dị dạng của
phương trình hồi quy mà có thể xây dựng phương trình tuyến tính hoặc phi tuyến. Các hệ số
của mơ hình hồi quy được xác định theo phương pháp bình phương nhỏ nhất. Hệ số tương
quan và tỷ số tương quan được sử dụng để đánh giá mức độ chặt chẽ của mối liên hệ tương
quan giữa hai tiêu thức số lượng.


76

STA302_Bai5_v1.0013109210


Bài 5: Phân tích hồi quy – tương quan

Câu hỏi ôn tập
1. Phân tích sự khác biệt giữa liên hệ hàm số và liên hệ tương quan? Cho ví dụ minh họa.
2. Trình bày nhiệm vụ của phương pháp phân tích hồi quy - tương quan.
3. Trình bày nội dung của phương pháp bình phương nhỏ nhất.
4. Nêu ý nghĩa các tham số trong phương trình hồi quy.
5. Trình bày khái niệm, cơng thức tính, tính chất của hệ số tương quan.
6. Trình bày khái niệm, cơng thức tính, tính chất của tỷ số tương quan.

Bài tập
Bài 1.

Có tài liệu về thu nhập và vốn của 10 trang trại ở một địa phương như sau:
Thu nhập (triệu đồng)

Vốn (triệu đồng)

46,8

93,6

30,3

54,5


25,6

38,7

36,5

65,4

50,7

104,5

89,4

196,0

42,5

85,0

75,2

157,4

80,5

176,8

61,8


120,5

Yêu cầu:
a. Xây dựng phương trình hồi quy tuyến tính phản ánh ảnh hưởng của vốn tới thu nhập. Giải
thích ý nghĩa các hệ số trong phương trình.
b. Một trang trại có vốn là 78 triệu đồng. Dựa vào phương trình hồi quy, xác định thu nhập
trang trại đó đạt khoảng bao nhiêu triệu đồng?
c. Đánh giá trình độ chặt chẽ của mối liên hệ trên.

STA302_Bai5_v1.0013109210

77


Bài 5: Phân tích hồi quy – tương quan

Bài 2.

Có tài liệu về 8 doanh nghiệp công nghiệp cùng sản xuất một loại sản phẩm như sau:
Sản lượng (100 tấn)

Nhiên liệu tiêu hao (10 tấn)

5

4,6

12


7,0

2

3,3

7

4,5

16

7,8

11

5,7

9

5,1

20

9,2

Yêu cầu:
a. Xây dựng phương trình hồi quy tuyến tính phản ánh ảnh hưởng của sản lượng tới nhiên liệu
tiêu hao. Giải thích ý nghĩa các hệ số.
b. Đánh giá trình độ chặt chẽ của mối liên hệ nói trên.

Bài 3.

Có tài liệu về chiều cao và cân nặng của 11 phụ nữ trong độ tuổi 18 – 24 được lựa chọn ngẫu
nhiêu như sau:
Chiều cao (cm)

Cân nặng (kg)

175

65

133

67

185

71

163

71

126

66

198


75

153

67

163

70

159

71

151

69

155

69

Yêu cầu:
a. Khi chiều cao tăng thêm 1 cm thì cân nặng thay đổi như thế nào?
b. Ðánh giá trình độ chặt chẽ giữa cân nặng và chiều cao của nhóm nguời trên.

78

STA302_Bai5_v1.0013109210




×