Tải bản đầy đủ (.pdf) (5 trang)

Thống Kê Học - Phương Pháp Chỉ Số part 18 pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1 MB, 5 trang )


""

Chương 5. Tương quan và hồi quy




Tên công nhân

A
B
C
D
E
F
G
H
I
J


Tuổi nghề (năm)

1
2
5
7
8
9
10


13
15
17


Năng suất lao động
(sản phẩm)
5
6
10
12
11
13
14
12
18
16
Tài liệu trên cho thấy giữa tuổi nghề của công nhân và năng suất lao động
của họ có mối liên hệ với nhau: Nhìn chung, với sự tăng lên của tuổi nghề (tiêu thức
nguyên nhân) thì năng suất lao động (tiêu thức kết quả) cũng
tăng lên. Song mối liên hệ này không hoàn toàn chặt chẽ, tức là cứ không phải tuổi
nghề tăng lên thì năng suất lao động cũng tăng theo một cách tương ứng. Hay nói
cách khác là mối liên hệ giữa tuổi nghề và năng suất lao động là mối liên hệ tương
quan.
Để thấy rõ mối liên hệ này ta dùng hệ trục toạ độ vuông góc, với trục hoành
biểu diễn tuổi nghề (x) và trục tung biểu diễn năng suất lao động (y). Ta có đồ thò
sau:























85

""

Chương 5. Tương quan và hồi quy




Trên đồ thò những cặp trò số (x, y) tạo thành các điểm. Nối chúng lại ta được
đường gấp khúc gọi là đường hồi qui thực nghiệm. Qua đường hồi qui thực nghiệm ta

thấy rõ khi tuổi nghề tăng lên thì năng suất lao động cũng tăng, biểu thò mối tương
quan thuận giữa hai tiêu thức trên. Trên cơ sở quan sát đường hồi qui thực nghiệm
giúp ta phán đoán, tìm phương trình đường thẳng, có cùng hướng, thay thế cho đường
hồi qui thực nghiệm. Đường thẳng này gọi là đường hồi qui lý thuyết. Đường hồi qui
lý thuyết được xác đònh bởi phương trình:
y
x
= a+ bx.
Trong đó:
y
x
: Trò số điều chỉnh của tiêu thức y theo quan hệ phụ thuộc với tiêu thức
x.
x: Trò số của tiêu thức nguyên nhân.
a, b : các tham số xác đònh vò trí của đường hồi qui lý thuyết.
Giữa các trò số thực tế và trò số lý thuyết luôn luôn có sự sai lệch. Gọi e là sai
lệch giữa trò số thực tế và trò số lý thuyết.
e = (y
I
– y
x
)
Trong vô số đường lý thuyết thì đường hồi qui lý thuyết nào có tổng sai lệch
bình phương bé nhất thì đó là đường hồi quy lý thuyết tốt nhất, tức là:
e
2
=  (y – y
x
)
2

-> min
hay e
2
=  (y – a – bx)
2
= min
Muốn vậy, đạo hàm riêng của các tham số phải triệt tiêu, tức ta có hệ phương
trình sau đây, được gọi là hệ phương trình chuẩn:
e
2
/a = 0
e
2
/b = 0
Giải hệ phương trình trên ta được:
y = na + b x
xy = a x + b x
2

Với hệ 2 phương trình chứa 2 ẩn số, ta có thể giải ra để tìm a và b:
b = [n xy – x y]/[n x
2
– (x)
2
]


86

""


Chương 5. Tương quan và hồi quy




và a = y/n – b x/n
Để giải a và b ta lập bảng tính như sau:
Bảng 5.2
Tuổi nghề,
x
1
2
5
7
8
9
Năng suất
lao động, y

5
6
10
12
11
13
xy




5
12
50
84
88
117
x
2




1
4
25
49
64
81
y
2




25
36
100
144
121
169

10
13
15
17
14
12
18
16
140 100
156 169
270 225
272 289
196
144
324
256
87 117 1194 1007 1515



Thay các số liệu trong bảng vào hệ phương trình ta được;
117 = 10 a + 87 b
1194 =87 a + 1007b
Giải ra ta được:
a = 5,61 ; b = 0,7
Đây là phương trình hồi quy phản ánh mối liên hệ giữa tuổi nghề (x) và năng
suất lao động (y) theo tài liệu từ 10 công nhân đã nói ở trên. Trong phương trình
này, giá trò của a = 5,61 có thể xem như mức độ ảnh hưởng của các nguyên nhân
khác đến năng suất lao động ngoài tuổi nghề; b = 0,7 nói lên khi tăng thêm một
năm tuổi nghề thì năng suất lao động tăng bình quân là 0,7 sản phẩm.





87

""

Chương 5. Tương quan và hồi quy




b. Hệ số tương quan:
Hệ số tương quan (được ký hiệu là r) là một số tương đối (biểu hiện bằng lần)
dùng để đánh giá trình độ chặt chẽ của mối liên hệ tương quan tuyến tính. Hệ số
tương quan có thể được tính theo công thức sau đây:


x






y






r 




x

2

y 




2
 
x



x 

 
y





y 

Công thức này dễ nhớ, nhưng đôi khi trong tính toán không được thuận tiện, ta
biến đổi công thức trên thành công thức khác, dễ sử dụng hơn:
Chia tử số và mẫu số cho n và tiếp tục biến đổi ta được:




r 


___

 xy





_ _
x y







(ct. 2)

 
x y


Nhân tử số và mẫu số cho 
x
, rồi tiếp tục biến đổi ta được công thức:
r = b 
x
/ 
y

(ct. 3)
Với b là tham số trong phương trình hồi qui lý thuyết y = a + bx.
Cũng từ công thức (2), ta có thể biến đổi tiếp tục để được công thức:











2









 


2
r [n xy

y]/ [n x ( x)
2
][n y
2
( y) (ct.4)


 Tùy theo số liệu chúng ta có mà chúng ta có thể chọn một công thức thích
hợp từ 4 công thức tính hệ số tương quan r nêu trên để tính cho gọn nhẹ.
 Tất cả các công thức tính hệ số tương quan này có thể vận dụng trong
trường hợp tài liệu phân tổ nhưng phải lưu ý đến quyền số.
 Tính chất của hệ số tương quan:
*.1. Hệ số tương quan có giá trò từ -1 đến 1.
*.2. Nếu : r > 0 : tương quan thuận.



88








*.3. Nếu

""

Chương 4. Lượng hóa các hiện tượng kinh tế xã hội

r < 0 : tương quan nghòch.
r = + 1: giữa x và y có liên hệ hàm số.
*4. r càng gần + 1, môí liên hệ giữa x và y càng chặt chẽ.
*5. r = 0 giữa x và y không có liên hệ tuyến tính.
Tính r:
Để tính theo công thức (1), ta lập bảng sau:
Bảng 5.3
Tuổi nghề
x


1
Năng suất
lao động
y
5
xy







5
x
2

y
2
(x-x)(y-y) (x-x)
2
(y-y)
2





1 25 51,59 59,29 44,89
2 6 12 4 36 38,19 44,89 32,49
5 10 50 25 100 6,29 13,69 2,89
7
8
9
12
11
13
84

88
117
49 144
64 121
81 169
-0,51
0,49
0,39
2,89
0,49
0,09
0,09
0,49
1,69
10 14 140 100 196 2,99 1,69 5,29
13 12 156 169 144 1,29 18,49 0,09
15
17
87
18
16
117
270 225 324
272 289 256
1 194 1 007 1515
39,69 39,69 39,69
35,69 68,89 18,49
176,1 250,1 146,10
Theo công thức 1:



r 




176 ,1
250 ,1 x 146
,1




0,92
Tính theo các công thức 2; 3; 4 ta cũng được kết quả r = 0,92 nhưng các phép
tính gọn nhẹ hơn. r = 0,92 cho phép ta kết luận mối liên hệ giữa tuổi nghề và năng
suất lao động là mối liên hệ thuận và khá chặt chẽ.
5.2.2. Trường hợp số liệu được phân tổ:
Ở phần trên để đơn giản hóa việc trình bày phương pháp, nên ví dụ được đưa
ra là tài liệu về tuổi nghề và năng suất lao động của 10 công nhân. Song như chúng
ta đã biết: Để phản ánh đúng đắn mối liên hệ tương quan đòi hỏi phải nghiên cứu


Trang 89

×