Tải bản đầy đủ (.pdf) (24 trang)

Nguyên lý thống kê tài liệu foxit sofware - 4 ppsx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.33 MB, 24 trang )

Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
73


*Đặc điểm:
- Phương sai đã giải quyết sự không hoàn thiện của hai chỉ tiêu trên.
- Phương sai thường được dùng để đánh giá độ biến thiên của tiêu thức, để
tính hệ số tương quan, xác đònh sai số trong điều tra chọn mẫu.
- Đơn vò tính của phương sai là bình phương đơn vò tính của tiêu thức nghiên
cứu, do đó đơn vò tính của phương sai không biểu hiện.
4.6.2.4. Độ lệch chuẩn: (σ )
Là căn bậc hai của phương sai hay nói cách khác là số bình quân toàn phương
của các độ lệch giữa các lượng biến với số bình quân cộng của chúng. Công thức:
+Trường hợp tài liệu không phân tổ:




+Trường hợp tài liệu phân tổ:




Với ví dụ trên ta tính độ lệch tiêu chuẩn:
σ
xI
= √ 3440 = 58,85 (SP)


σ
xII
= √ 200 = 14,14 (SP)
*Đặc điểm:
- Độ lệch tiêu chuẩn đã giải quyết mọi sự khiếm khuyết của các chỉ tiêu trên.
- Đơn vò tính của độ lệch chuẩn trùng với đơn vò tính của chỉ tiêu nghiên cứu
(trùng với đơn vò tính x
i
) .
- Nếu trò số của độ lệch chuẩn (
σ) tính ra càng nhỏ, chứng tỏ độ phân tán
càng ít, tính chất đồng đều của các đơn vò tổng thể càng cao, tính chất đại biểu của
số bình quân càng cao, tổng thể càng đồng chất, sự sai số của hiện tượng càng ít,
n
)xx(
n
1i
2
i
x

=





=
=




n
1i
i
n
1i
i
2
i
x
f
f)xx(
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
74

mặt chất của hiện tượng càng tốt. (σ còn được gọi là độ lệch chuẩn, sai số chuẩn,
dung sai cho phép).
- Chỉ tiêu này để đánh giá mặt chất của từng tổng thể, từng hiện tượng,
không được dùng để so sánh mặt chất giữa các tổng thể khác nhau.
4.6.2.5. Hệ số biến thiên: (V)
Là số tương đối được xác đònh bằng tỷ số so sánh giữa độ lệch chuẩn với mức
độ bình quân cộng của hiện tượng nghiên cứu. Do đó:


V = (lần hoặc %)

Với ví dụ trên ta có V
I
= (58,65/610)x100 = 9,61%
V
II
= (14,4/610)x100 = 2,23%
Như vậy tính đại biểu của số bình quân ở tổ I thấp hơn tổ II.
*Đặc điểm:
- Đây là chỉ tiêu tốt nhất để đo lường sự biến thiên của chỉ tiêu nghiên cứu.
- Nếu trò số của V tính ra càng nhỏ, chứng tỏ tính chất đồng đều càng cao,
tính chất đại biểu của số bình quân càng cao, tổng thể càng đồng chất, mức độ sai số
của hiện tượng càng ít, mặt chất của tổng thể càng tốt.
- Dùng hệ số biến thiên để so sánh mặt chất giữa các hiện tượng với nhau
hoặc giữa các tổng thể khác nhau, tức là tổng thể nào có hệ số biến thiên của tiêu
thức nghiên cứu nhỏ hơn thì mặt chất tốt hơn.
-Trong thực tế (quản lý) người ta thấy nếu V nhỏ hơn hoặc bằng 10% thì
chứng tỏ mặt chất của hiện tượng tốt hơn và ngược lại.
4.7.
Các phương pháp tính phương sai:
a. Theo đònh nghóa: Chúng ta lập bảng:
Bảng 4.16
Chỉ tiêu nghiên cứu (x
i
)

Tần số (f
i
)


x
i
f
i
( x
i
-x )
2
( x
i
-x )
2
f
i

x
1
x
2

.
f
1

f
2

.
x

1
f
1
x
2
f
2
.
( x
1
-x )
2
( x
2
-x )
2

.
( x
1
-x )
2
f
1

( x
2
-x )
2
f

2

.

σ


x
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
75

.
.
x
n
.
.
f
n

.
.
x
n

f
n


.
.
( x
n
-x )
2

.
.
( x
n
-x )
2
f
n

∑x
i
∑f
i
∑x
i
f
i
∑( x
i

-x )
2
∑( x
i
-x )
2
f
i


x = ; hoặc x =

σ
2
= ; hoặc σ
2
=
b. Công thức rút gọn:



c. Qui tắc cộng phương sai: Phương sai chung bằng bình quân các phương sai
tổ cộng với phương sai của các số bình quân tổ.



Trong đó:

σ
2

– Phương sai chung
σ
2
i
– Bình quân các phương sai tổ
δ
2
– Phương sai của các số bình quân tổ

Câu hỏi và bài tập chương 4
1) Cho ba ví dụ về số tuyệt đối, tương đối và bình quân.
2) Nêu ý nghóa của từng loại chỉ tiêu trên.
3) Nêu ý nghóa của các độ biến thiên.
* Hãy chọn câu trả lời đúng nhất cho các câu hỏi sau:
∑x
i
f
i



f
i

∑x
i

n
∑(x
i

-x)
2
f
i


∑f
i


∑(x
i
-x)
2

n


σ
2
=x
2
- x
2

2
2
i
2
δ+σ=σ


Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
76

4) Số tương đối trong thống kê được dùng để:
a. Biểu hiện kết cấu của tổng thể
b. Biểu hiện nhiệm vụ kế hoạch và kiểm tra tình thực hiện kế hoạch
c. Biểu hiện sự biến động của hiện tượng qua thời gian, không gian
d. Biểu hiện nhiệm vụ kế hoạch và kiểm tra tình thực hiện kế hoạch
e. Biểu hiện mối nhân quả giữa các hiện tượng
f. Cả a, b, c đều đúng
g. Cả a, b, c, d đều đúng
h. Cả a, b, d, e đều đúng
5) Đối với số tuyệt đối thời điểm của một chỉ tiêu thống kê, ta có thể:
a. Cộng dồn theo không gian nếu cùng thời điểm
b. Cộng dồn theo thời gian
c. Cả a, b sai
d. Cả a, b đúng
6) Tất cả các chỉ tiêu sau đều là chỉ tiêu đo lường độ biến thiên, ngoại trừ:
a. Phương sai
b. Số bình quân
c. Khoảng biến thiên
d. Độ lệch tuyệt đối bình quân
7) Phát biểu nào trong số các phát biểu sau về độ lệch chuẩn đúng:

a. Có cùng đơn vò tính với số liệu dùng để tính độ lệc chuẩn của tiêu thức số lượng.
b. Luôn luôn lớn hơn độ lệch tuyệt đối bình quân
c. Là căn bậc hai của phương sai.
d.
a và c đúng
Bài tập:
Bài 1:

Theo báo cáo số liệu thống kê về tình hình sản xuất của các ngành tiểu thủ công
nghiệp (TTCN), nông nghiệp (NN) và dòch vụ (DV) ở một đòa phương như sau:
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
77

- Tỷ trọng giá trò sản xuất ngành TTCN chiếm 20%, ngành NN - 50% trong năm
2000. Dự kiến nhiệm vụ kế hoạch về giá trò sản xuất năm 2001 so với năm 2000 của
ngành NN sẽ tăng 5% và ngành DV tăng 25%. Tính chung cho cả 3 ngành tốc độ
tăng nhiệm vụ kế hoạch về giá trò sản xuất là 10%. Hãy dự báo sự dòch chuyển cơ
cấu ngành nghề trong năm 2001 so với năm 2000.
Bài 2:

a. Một công ty mua 300 tấn gạo có tỷ lệ tấm là 12%. Để xuất khẩu phải loại bớt tấm
để còn tỷ lệ là 8%. Như vậy trọng lượng gạo còn lại để xuất khẩu là bao nhiêu?
b. Một công ty mua 180 tấn lúa có tỷ lệ tạp chất là 15%.
Hãy tính trọng lượng lúa tiêu chuẩn qui đổi tương ứng nếu với tỷ lệ tạp chất là 10%.

Nếu giá mua 1 kg lúa tiêu chuẩn là 1.500đ thì giá mua 1kg lúa trên là bao nhiêu?
Bài 3:

Cho biết tốc độ tăng doanh thu của một Bưu điện năm 2000 so với năm 1999 là
25%. Trong đó doanh thu viễn thông tăng 30%, doanh thu bưu chính tăng 8%. Hãy
xác đònh tỷ trọng của doanh thu Bưu chính, Viễn thông trong từng năm 1999 và
2000.
Bài 4:
Có tài liệu về doanh thu của các bưu cục trực thuộc Bưu điện tỉnh X trong năm
2001 và 2002 như sau:
Doanh thu (tỷ đồng)
2001 2002

Tên Bưu cục
Thực tế Kế hoạch Thực tế
A
B
C
D
E
10,2
12,3
17,8
15,0
20,0
13,2
14,5
20,0
19,0
25,0

13,0
15,0
19,0
20,0
26,5
Hãy tính:
1.
Số tương đối nhiệm vụ kế hoạch của mỗi Bưu cục và của cả Bưu điện tỉnh.
2. Số tương đối hoàn thành kế hoạch của mỗi Bưu cục và của toàn Bưu điện tỉnh.
3.
Số tương đối động thái của mỗi Bưu cục và toàn Bưu điện tỉnh.
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
78

4. Tính doanh thu bình quân mỗi bưu cục trong năm 2001 và 2002
Trình bày các kết quả tính toán trên trong bảng thống kê.
5. Tính độ lệch tuyệt đối bình quân theo doanh thu của các bưu cục trong năm 2001
và 2002
6.
Tính phương sai theo doanh thu của các bưu cục trong năm 2001 và 2002.
Bài 5:

Có số liệu về doanh thu của một Bưu điện tỉnh trong năm 2002 - 2003 như sau:
Doanh thu (tỷ đồng) Nghiệp vụ

2002 2003
Tốc độ phát triển
2003/2002 (%)
Toàn bộ:
Trong đó:
-Bưu chính
-Viễn thông
98

9
?
108

?
?
?

120
?
Hãy điền những số liệu còn trống trong bảng trên?

Bài 6: Có tình hình hoàn thành kế hoạch về doanh thu cước của 4 bưu cục trong một
bưu điện huyện X trong năm 2002 như sau
6 tháng đầu năm 6 tháng cuối năm
Bưu cục

Kế hoạch (tỷ
đồng)
% hoàn thành
KH

Thực hiện (tỷ
đồng)
% hoàn thành
KH
A 3,6 101,3 4,8 98,0
B 3,4 98,5 4,2 102,3
C 1,4 97,4 2,0 103,1
D 2,4 90,0 3,2 100,0
Hãy xác đònh % hoàn thành kế hoạch bình quân về doanh thu của bưu điện huyện
X.
1.
Trong sáu tháng đầu năm.
2.
Trong sáu tháng cuối năm.
3. Trong cả năm 2002.
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
79


Bài 7:
a. Một nhóm 3 công nhân cùng chuyển các bức điện chuyển tiền trong
khoảng thời gian như nhau. Người thứ nhất chuyển một bức điện mất 1 phút, người
thứ hai mất 50 giây t và người thứ ba mất 1 phút 20 giây. Tính thời gian hao phí bình
quân để chuyển xong một bức điện của một điện báo viên trong cả nhóm trên.







b.
Hai tổ điện thoại viên 108 gồm: Tổ 1 có 10 người, tổ
2 có 12 người cùng trực một ca trong khoảng thời gian là 6
giờ. Trong tổ1, bình quân mỗi điện thoại viên trả lời một
cuộc gọi của khách hàng mất 2 phút, mỗi điện thoại viên tổ
2 trả lời một cuộc gọi của khách hàng mất 1 phút 20 giây.
Tính thời gian bình quân một điện thoại viên trả lời một
cuộc gọi của khách hàng của 1 điện thoại viên trong 2 tổ
trên.

Bài 8:
Một xe chở thư khởi hành từ bưu điện A đi bưu điện Bù với vận tốc trung bình là
50km/h và lượt về với vận tốc 40km/h. Đoạn đường đi từ bưu điện A đến bưu điện B
là 100km.Yêu cầu:
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
80

Tính vận tốc bình quân của đoàn xe trên trong hai lượt đi và về. Tính vận tốc bình

quân của đoàn xe trên nếu không có tài liệu về độ dài quãng đường.

Bài 9:

Thu thập tài liệu từ 100 xí nghiệp của cùng một ngành sản xuất và tiến hành phân
tổ, ta có bảng sau:
Năng suất lao động bình quân một công nhân (kg) Giá thành
1kg SP (1000
đ)
40 –50 50-60 60-70 70-80 80-90
Cộng
30-32
28-30
26-28
24-26
22-24
2
6
2
8
6

10
20
10

6
12
4
2



2
6
4
4
30
40
20
6
Cộng 8 16 40 24 12 100
1) Hãy tính giá thành bình quân cho 1kg sản phẩm của các xí nghiệp.
2) Giả sử tất cả các xí nghiệp này đều có cùng một giá trò sản lượng, hãy tính năng
suất lao động bình quân một công nhân nói chung.

Bài 10:

Trên đoạn đường x , ta biết sự phân bố các ngôi nhà như hình vẽ sau:
km

0 1 2 3 4 5 6 7

10


15

25

38


44

28

20


30
Theo bạn ta nên đặt bến xe công cộng ở đâu để tổng khoảng cách từ tất cả
các ngôi nhà đến bến xe là ngắn nhất.

Bài 11
Trên vùng đất hình như hình vẽ dưới dây, có sự phân bố của các ngôi nhà
như sau:
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
81

X km
Y km

Trên vùng đất này sẽ đặt một trạm điện thoại, giả sử mỗi ngôi nhà đều lắp đặt một
máy điện thoại hữu tuyến cố đònh. Hãy xác đònh toạ độ trạm điện thoại sao cho tổng
chiều dài đường dây thuê bao từ tất cả các ngôi nhà đến trạm điện thoại là ngắn

nhất.

Bài 12

Một cơ sở sản xuất loại sản phẩm A có số liệu sau:
Tổ Số lao động

Năng suất lao dộng
bình quân tháng ,
(SP/người)
Giá thành bình quân sản
phẩm tổ
ĐVT: 1000 đồng
I
II
III
IV
V
20
18
22
20
24
37
28
30
32
34
190
205

202
200
195
Hãy tính:
1. Năng suất lao động bình quân một lao động của cả cơ sở nói chung.
5 10 15 20 15
10 15 20 25 22
12 16 18 22 20
15 20 25 30 25
14 16 18 20 16
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
82

2. Giá thành bình quân một sản phẩm của cơ sở và độ lệch chuẩn về giá thành
sản phẩm.
.
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 5. Tương quan và hồi quy



83


Chương 5 TƯƠNG QUAN VÀ HỒI QUY
5.1. MỐI LIÊN HỆ GIỮA CÁC HIỆN TƯNG, NHIỆM VỤ CỦA PHƯƠNG PHÁP
HỒI QUY VÀ TƯƠNG QUAN.
Theo quan điểm của duy vật biện chứng thì các hiện tượng tồn tại trong mối
liên hệ phổ biến và nhiều vẻ, giữa chúng có mối quan hệ mật thiết với nhau, tác
động qua lại lẫn nhau. Không có một hiện tượng nào lại phát sinh, phát triển một
cách cô lập, tách rời hiện tượng khác. Vì vậy, việc nghiên cứu mối liên hệ là một
trong những nhiệm vụ quan trọng của thống kê.
Khi nghiên cứu mối liên hệ, nếu xét theo trình độ chặt chẽ thì có thể phân
thành hai loại là: liên hệ hàm số và liên hệ tương quan.
1.
Liên hệ hàm số: là mối liên hệ hoàn toàn chặt chẽ và được biểu hiện
dưới dạng một hàm số.
Ví dụ: y = f(x). Điều này có nghóa là khi đại lượng x biến đổi thì theo một
qui tắc nào đó, có thể xác đònh được giá trò tương ứng của đại lượng y.
Mối liên hệ hàm số chỉ phổ biến trong toán học, vật lý. Ví dụ: …
2. Liên hệ tương quan: Là mối liên hệ không hoàn toàn chặt chẽ và được
biểu hiện ở chỗ khi một hiện tượng biến đổi thì làm cho hiện tượng có liên quan
biến đổi theo, nhưng nó không có ảnh hưởng hoàn toàn quyết đònh đến sự biến đổi
này.
Ví dụ: Khi năng suất lao động tăng lên thì có thể làm cho giá thành đơn vò
sản phẩm giảm và ngược lại. Nhưng sự biến đổi của giá thành ngoài năng suất lao
động thì còn chòu sự tác động của nhân tố khác. Do đó sự biến động của nó không
hoàn toàn tương ứng với sự biến động của năng suất lao động, tức là mối liên hệ
giữa năng suất lao động và giá thành là mối liên hệ tương quan. Để phản ánh mối
liên hệ này một cách đúng đắn đòi hỏi phải nghiên cứu trên nhiều đơn vò, tức là
nghiên cứu hiện tượng số lớn.
• Phương pháp hồi quy và tương quan.
Hồi quy và tương quan là phương pháp của toán học. Vào khoảng năm 1930,
một nhà thống kê nhân chủng học Thụy Điển là Gante có tiến hành nghiên cứu mối

liên hệ giữa chiều cao của con cái và chiều cao của bố mẹ. Theo quan niệm chung
nếu bố mẹ cao, con cái sẽ cao nữa lên… Và nếu điều đó đúng, ta có thể tạo
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 5. Tương quan và hồi quy



84

ra được những người cao tùy ý. Nhưng Gante đã phát hiện ra điều ngược lại: Nếu
cha mẹ quá cao thì con cái sẽ thấp bớt để trở về trạng thái trung bình của nòi giống.
Hiện tượng đó Gante đặt tên là “Hồi qui”.
Phương pháp tương quan được vận dụng để nghiên cứu mối liên hệ không
hoàn toàn chặt chẽ giữa các hiện tượng hoặc giữa các tiêu thức. Tiêu thức được chọn
ra để nghiên cứu bao giờ cũng có một tiêu thức kết quả và số còn lại là tiêu thức
nguyên nhân.
Ví dụ: Giữa khối lượng sản phẩm sản xuất và tổng chi phí để sản xuất ra khối
lượng sản phẩm đó có mối liên hệ tương quan thuận và khối lượng sản phẩm sản
xuất là tiêu thức nguyên nhân và chi phí là tiêu thức kết quả. Giữa khối lượng sản
phẩm sản xuất và giá thành đơn vò sản phẩm có mối tương quan nghòch và sản lượng
là tiêu thức nguyên nhân còn giá thành sản phẩm là tiêu thức kết quả. Giữa chi phí
quảng cáo và khối lượng sản phẩm bán được (hoặc doanh thu) có mối tương quan
thuận, trong đó chi phí quảng cáo là tiêu thức nguyên nhân, còn lượng sản phẩm bán
được (hoặc doanh thu) là tiêu thức kết quả.
• Phương pháp tương quan bao gồm một số công việc:
- Xác đònh tính chất và hình thức của mối liên hệ.
- Xây dựng đồ thò để xác đònh rõ hơn tính chất và hình thức liên hệ giữa các
tiêu thức nghiên cứu.
- Lập phương trình hồi quy, tính các tham số của phương trình và giải thích

ý nghóa của các tham số.
- Đánh giá trình độ chặt chẽ của mối liên hệ thông qua các chỉ tiêu: hệ số
tương quan, tỷ số tương quan.

5.2. TƯƠNG QUAN TUYẾN TÍNH GIỮA HAI TIÊU THỨC.
5.2.1. Trường hợp số liệu chưa phân tổ:
a. Phương trình hồi quy:
Giả sử có tài liệu về tuổi nghề (năm) và năng suất lao động (sản phẩm) của
10 công nhân tại một xí nghiệp như sau:
(Bảng 5.1)
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 5. Tương quan và hồi quy



85

Tên công nhân Tuổi nghề (năm) Năng suất lao động
(sản phẩm)
A
B
C
D
E
F
G
H
I
J

1
2
5
7
8
9
10
13
15
17
5
6
10
12
11
13
14
12
18
16
Tài liệu trên cho thấy giữa tuổi nghề của công nhân và năng suất lao động
của họ có mối liên hệ với nhau: Nhìn chung, với sự tăng lên của tuổi nghề (tiêu thức
nguyên nhân) thì năng suất lao động (tiêu thức kết quả) cũng
tăng lên. Song mối liên hệ này không hoàn toàn chặt chẽ, tức là cứ không phải tuổi
nghề tăng lên thì năng suất lao động cũng tăng theo một cách tương ứng. Hay nói
cách khác là mối liên hệ giữa tuổi nghề và năng suất lao động là mối liên hệ tương
quan.
Để thấy rõ mối liên hệ này ta dùng hệ trục toạ độ vuông góc, với trục hoành
biểu diễn tuổi nghề (x) và trục tung biểu diễn năng suất lao động (y). Ta có đồ thò
sau:

Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 5. Tương quan và hồi quy



86

Trên đồ thò những cặp trò số (x, y) tạo thành các điểm. Nối chúng lại ta được
đường gấp khúc gọi là đường hồi qui thực nghiệm. Qua đường hồi qui thực nghiệm ta
thấy rõ khi tuổi nghề tăng lên thì năng suất lao động cũng tăng, biểu thò mối tương
quan thuận giữa hai tiêu thức trên. Trên cơ sở quan sát đường hồi qui thực nghiệm
giúp ta phán đoán, tìm phương trình đường thẳng, có cùng hướng, thay thế cho đường
hồi qui thực nghiệm. Đường thẳng này gọi là đường hồi qui lý thuyết. Đường hồi qui
lý thuyết được xác đònh bởi phương trình:
y
x
= a+ bx.
Trong đó:
y
x
: Trò số điều chỉnh của tiêu thức y theo quan hệ phụ thuộc với tiêu thức
x.
x: Trò số của tiêu thức nguyên nhân.
a, b : các tham số xác đònh vò trí của đường hồi qui lý thuyết.
Giữa các trò số thực tế và trò số lý thuyết luôn luôn có sự sai lệch. Gọi e là sai
lệch giữa trò số thực tế và trò số lý thuyết.
e = (y
I
– y

x
)
Trong vô số đường lý thuyết thì đường hồi qui lý thuyết nào có tổng sai lệch
bình phương bé nhất thì đó là đường hồi quy lý thuyết tốt nhất, tức là:
∑e
2
= ∑ (y – y
x
)
2
-> min
hay
∑e
2
= ∑ (y – a – bx)
2
= δ
min

Muốn vậy, đạo hàm riêng của các tham số phải triệt tiêu, tức ta có hệ phương
trình sau đây, được gọi là hệ phương trình chuẩn:
∂∑e
2
/∂a = 0
∂∑e
2
/∂b = 0
Giải hệ phương trình trên ta được:
∑y = na + b ∑x
∑xy = a ∑x + b ∑x

2

Với hệ 2 phương trình chứa 2 ẩn số, ta có thể giải ra để tìm a và b:
b = [n ∑xy – ∑x ∑y]/[n ∑x
2
– (∑x)
2
]
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 5. Tương quan và hồi quy



87

và a = ∑y/n – b ∑x/n
Để giải a và b ta lập bảng tính như sau:
Bảng 5.2
Tuổi nghề,
x
Năng suất

lao động, y

xy x
2
y
2
1 5 5 1 25

2 6 12 4 36
5 10 50 25 100
7 12 84 49 144
8 11 88 64 121
9 13 117 81 169
10 14 140 100 196
13 12 156 169 144
15 18 270 225 324
17 16 272 289 256
87 117 1194

1007

1515

Thay các số liệu trong bảng vào hệ phương trình ta được;
117 = 10 a + 87 b
1194 =87 a + 1007b
Giải ra ta được:
a = 5,61 ; b = 0,7
Đây là phương trình hồi quy phản ánh mối liên hệ giữa tuổi nghề (x) và năng
suất lao động (y) theo tài liệu từ 10 công nhân đã nói ở trên. Trong phương trình
này, giá trò của a = 5,61 có thể xem như mức độ ảnh hưởng của các nguyên nhân
khác đến năng suất lao động ngoài tuổi nghề; b = 0,7 nói lên khi tăng thêm một
năm tuổi nghề thì năng suất lao động tăng bình quân là 0,7 sản phẩm.

Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 5. Tương quan và hồi quy




88

b. Hệ số tương quan:
Hệ số tương quan (được ký hiệu là r) là một số tương đối (biểu hiện bằng lần)
dùng để đánh giá trình độ chặt chẽ của mối liên hệ tương quan tuyến tính. Hệ số
tương quan có thể được tính theo công thức sau đây:
Công thức này dễ nhớ, nhưng đôi khi trong tính toán không được thuận tiện, ta
biến đổi công thức trên thành công thức khác, dễ sử dụng hơn:
Chia tử số và mẫu số cho n và tiếp tục biến đổi ta được:

Nhân tử số và mẫu số cho
σ
x
, rồi tiếp tục biến đổi ta được công thức:
r = b σ
x
/

σ
y
(ct. 3)
Với b là tham số trong phương trình hồi qui lý thuyết y = a + bx.
Cũng từ công thức (2), ta có thể biến đổi tiếp tục để được công thức:



• Tùy theo số liệu chúng ta có mà chúng ta có thể chọn một công thức thích
hợp từ 4 công thức tính hệ số tương quan r nêu trên để tính cho gọn nhẹ.

• Tất cả các công thức tính hệ số tương quan này có thể vận dụng trong
trường hợp tài liệu phân tổ nhưng phải lưu ý đến quyền số.
• Tính chất của hệ số tương quan:
*.1. Hệ số tương quan có giá trò từ -1 đến 1.
*.2. Nếu : r > 0 : tương quan thuận.
∑ ∑






























=
−−
−−
22
yyxx
yyxx
r
yx
yxxy
r
σσ







=
_____
(ct. 2)
∑ ∑ ∑ ∑ ∑ ∑ ∑
−−−= )4.ct()y(yn][)x(xn[/]yxxyn[r
2222


Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
89

r < 0 : tương quan nghòch.
*.3. Nếu r = + 1: giữa x và y có liên hệ hàm số.
*4. r càng gần + 1, môí liên hệ giữa x và y càng chặt chẽ.
*5. r = 0 giữa x và y không có liên hệ tuyến tính.
Tính r:
Để tính theo công thức (1), ta lập bảng sau:
Bảng 5.3
Tuổi nghề

x
Năng suất

lao động
y
xy x
2
y
2
(x-x)(y-y) (x-x)
2


(y-y)
2

1 5 5

1

25

51,59

59,29

44,89

2 6 12

4

36

38,19

44,89

32,49

5 10 50

25


100

6,29

13,69

2,89

7 12 84

49

144

-0,51

2,89

0,09

8 11 88

64

121

0,49

0,49


0,49

9 13 117

81

169

0,39

0,09

1,69

10 14 140

100

196

2,99

1,69

5,29

13 12 156

169


144

1,29

18,49

0,09

15 18 270

225

324

39,69

39,69

39,69

17 16 272

289

256

35,69

68,89


18,49

87 117 1 194

1 007

1515

176,1

250,1

146,10

Theo công thức 1:
Tính theo các công thức 2; 3; 4 ta cũng được kết quả r = 0,92 nhưng các phép
tính gọn nhẹ hơn. r = 0,92 cho phép ta kết luận mối liên hệ giữa tuổi nghề và năng
suất lao động là mối liên hệ thuận và khá chặt chẽ.
5.2.2. Trường hợp số liệu được phân tổ:
Ở phần trên để đơn giản hóa việc trình bày phương pháp, nên ví dụ được đưa
ra là tài liệu về tuổi nghề và năng suất lao động của 10 công nhân. Song như chúng
ta đã biết: Để phản ánh đúng đắn mối liên hệ tương quan đòi hỏi phải nghiên cứu
92,0
1,146x1,250
1
,
176
r ==
Generated by Foxit PDF Creator © Foxit Software

For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
90

hiện tượng số lớn – tức là nghiên cứu nhiều đơn vò. Khi đó tài liệu thường được phân
tổ kết hợp theo tiêu thức nguyên nhân (x) và tiêu thức kết quả (y). Việc phân tổ kết
hợp sẽ hình thành bảng tương quan có dạng sau đây:
Bảng 5.4
x
y
n
y


n
xy


n
x
N

Trong đó:
n
x
: Tần số các tổ được phân tổ theo tiêu thức x.

n
y
: Tần số các tổ được phân tổ theo tiêu thức y.
n
xy
: Tần số các tổ được phân tổ kết hợp theo tiêu thức x và tiêu thức y.
N : Số đơn vò nghiên cứu.
N = ∑n
x
=∑n
y
= ∑∑n
xy.

Từ bảng tương quan, khi tính a, b, r phải nhân với các tần số tương ứng.
Hệ phương trình trong phần 1 sẽ được nhân thêm với các tần số tương ứng:

∑yn
y
= Na + b ∑xn
x

∑xyn
xy
= a ∑xn
x
+ b ∑x
2
n
x


Khi đó hệ số tương quan r sẽ là:
r = ∑ (x – x) (y –y) n
xy
/
√ ∑
( x –x)
2
n
x
∑ (y – y)
2
n
y

5.3. TƯƠNG QUAN PHI TUYẾN TÍNH GIỮA HAI TIÊU THỨC.
Ở mục trên đã trình bày về liên hệ tương quan tuyến tính giữa hai tiêu thức
số lượng, tức phương trình hồi qui là một phương trình đường thẳng.Trong thực tế, ta
thường gặp mối liên hệ tương quan giữa hai tiêu thức số lượng là mối liên hệ tương
quan phi tuyến tính, tức phương trình hồi qui là một đường cong.
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
91

Ví dụ: -Mối quan hệ giữa khối lượng sản phẩm và giá thành đơn vò sản phẩm:

Sự tăng lên của khối lượng sản phẩm có thể dẫn đến việc giảm giá thành đơn vò sản
phẩm nhưng việc giảm này không theo một tỷ lệ tương ứng với sự tăng lên của khối
lượng sản phẩm.
-Mối liên hệ giữa tuổi nghề và năng suất lao động: trong một giới hạn
nào đó sự tăng lên của tuổi nghề dẫn đến năng suất lao động tăng lên, nhưng vượt
qua giới hạn đó thì sự tăng lên của tuổi nghề có thể không làm năng suất lao động
tăng lên mà ngược lại có thể làm giảm năng suất lao động vì cùng với sự tăng lên
của tuổi nghề thì tuổi đời cũng tăng lên, sức khỏe giảm sút làm cho năng suất lao
động cũng giảm.
5.3.1.
Các phương trình hồi quy:
Tùy theo đặc điểm, tính chất của mối liên hệ mà ta lựa chọn phương trình hồi
qui phù hợp. Sau đây là một số phương trình hồi quy phi tuyến tính thường
được sử dụng:
a.
Phương trình đường cong Parabol bậc hai:
y
x
= a + bx + cx
2

Phương trình Parabol bậc 2 thường được sử dụng khi các trò số của tiêu thức
nguyên nhân tăng lên thì các trò số của tiêu thức kết quả tăng (hoặc giảm),
việc tăng (hoặc giảm) đạt đến trò số cực đại (hoặc cực tiểu) rồi sau đó giảm
(hoặc tăng).
Ví dụ: Mối liên hệ giữa tuổi nghề và năng suất lao động xét trong một quá
trình dài.
Các tham số trong phương trình hồi qui Parabol bậc cũng được xác đònh bằng
phương pháp bình phương bé nhất và dẫn đến việc giải hệ ba phương trình ba
ẩn số sau đây:



∑y = na + b ∑x + c ∑x
2

∑xy = a ∑x + b ∑x
2
+ c ∑x
3

∑x
2
y = a ∑x
2
+ b ∑x
3
+ c ∑x
4

b. Phương trình đường cong Hyperbol:
y
x
= a + b/x
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang

92

Phương trình Hyperbol được áp dụng trong trường hợp khi các trò số của tiêu
thức nguyên nhân tăng lên thì các trò số của tiêu thức kết quả cũng có thể giảm và
đến một giới hạn nào đó (y
lt
= a) thì hầu như không giảm.
Ví dụ: Mối liên hệ giữa khối lượng sản phẩm và giá thành đơn vò sản phẩm,
mối liên hệ giữa qui mô cửa hàng và tỷ suất phí lưu thông.
Các tham số a và b của phương trình hồi quy được tính ra từ hệ phương trình
sau đây:
∑y = na + b ∑1/x
∑y/x = a ∑1/x + b ∑1/x
2

c. Phương trình hàm mũ:
y
x
= ab
x

Phương trình hàm mũ được áp dụng trong trường hợp cùng với sự tăng lên của
các trò số tiêu thức nguyên nhân thì các trò số của tiêu thức kết quả thay đổi theo cấp
số nhân, nghóa là có tốc độ phát triển xấp xỉ nhau.
Các tham số a và b được xác đònh từ hệ phương trình sau:

∑lgy = nlga + lgb ∑x
∑xlgy = lga ∑x + lgb ∑x
2


Ngoài ba dạng phương trình phi tuyến ở trên, còn có nhiều dạng khác như Parabol
bậc 3, lũy thừa, logisticque, compec…
5.3.2. Các loại chỉ tiêu đánh giá tương quan phi tuyến.
a.Tỷ số tương quan:
Tỷ số tương quan (ký hiệu η = êta) là một số tương đối (biểu hiện bằng lầàn)
được dùng để đánh giá trình độ chặt chẽ của mối liên hệ tương quan. Phương pháp
tính tỷ số tương quan như sau:
Khi có mối liên hệ giữa tiêu thức x (nguyên nhân) và tiêu thức y (kết quả) thì
có thể tính các loại phương sai sau đây:
- Phương sai chung: phản ánh sự biến thiên của tiêu thức y do ảnh hưởng
của tất cả các nguyên nhân (trong đó có nguyên nhân x).
σ
2
y
= ∑ (y – y)
2
/n.
- Phương sai riêng phản ánh sự biến thiên của tiêu thức y do ảnh hưởng của
riêng tiêu thức nguyên nhân x.
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
93

σ
2

yx
= ∑ (y
x
– y)
2
/n.
- Phương sai riêng phản ánh sự biến thiên của tiêu thức y do ảnh hưởng của
các tiêu thức nguyên nhân khác, trừ tiêu thức x.
σ
2
y(x)
= ∑ (y – y
x
)
2
/n.
- Mối quan hệ giữa ba phương sai là:
σ
2
y
= σ
2
yx
+ σ
2
y(x)

Như vậy, nếu tiêu thức nguyên nhân x càng có ảnh hưởng mạnh mẽ đối với
tiêu thức kết quả y thì σ
2

yx
chiếm phần lớn trong σ
2
y
và ngược lại. Do đó, tỷ
số giữa hai phương sai này có thể dùng làm thước đo đánh giá trình độ chặt
chẽ của mối liên hệ.
Tức là:
η = √ σ
2
yx
/ σ
2
y

Vì : σ
2
yx
= σ
2
y
- σ
2
y(x)

Nên: η = √ [σ
2
y
- σ
2

y(x)
] / σ
2
y


η = √ 1 - σ
2
y(x)
/ σ
2
y

Hay
η = √ 1 – ∑ (y – y
x
)
2
/ ∑ (y – y)
2
Tỷ số tương quan có một số tính chất sau đây:
- Tỷ số tương quan có giá trò trong khoảng [0; 1], tức là 0 < η < 1.
- Nếu η = 0 thì không có liên hệ tương quan giữa x và y.
- Nếu η = 1 có liên hệ hàm số giữa x và y.
- Nếu η càng gần 1 thì liên hệ tương quan càng chặt chẽ.
- Tỷ số tương quan lớn hơn hoặc bằng giá trò tuyệt đối của hệ số tương
quan, tức là η > | r |. Nếu η = | r | thì giữa x và y có liên hệ tương quan
tuyến tính.
c.
Độ co giãn: Trong phân tích hồi quy – tương quan, ngoài việc xác đònh

phương trình hồi quy, tính các hệ số hoặc tỷ số tương quan, người ta còn
sử dụng độ co giãn để nghiên cứu sự biến thiên của tiêu thức nguyên nhân
đã làm làm cho tiêu thức kết quả biến đổi như thế nào?
Độ co giãn có thể được biểu hiện bằng đại lượng tuyệt đối hoặc đại lượng
tương đối.
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
94

Giả sử có phương trình hồi quy y = f(x).
Số gia của tiêu thức nguyên nhân là ∆x, số gia của tiêu thức kết quả là ∆y
= f(x + ∆x) – f(x).
- Độ co giãn tuyệt đối nói lên khi x thay đổi một đơn vò thì y thay đổi bao
nhiêu đơn vò.
-
Nếu gọi E(x) là độ co giãn tuyệt đối thì:

E(x) = ∆y/∆x
Giả sử f(x) tồn tại đạo hàm, ta có:
lim ∆y/∆x = f'(x)

∆x -> 0

Ở ví dụ trên, ta có:
f(x) = 5,61 + 0,7x

E(x) = f’(x) = (5,61 + 0,7x)’ = 0,7
nghóa là khi người công nhân tăng lên một tuổi nghề thì năng suất lao động
bình quân tăng là 0,7 sản phẩm.
- Độ co dãn tương đối (còn gọi là hệ số co giãn) nói lên khi x thay đổi 1%
thì làm cho y thay đổi bao nhiêu phần trăm. Nếu gọi E’(x) là độ co giãn
tương đối thì:
E’(x) =
∆y/y : ∆x/x
E’(x) = ∆y/∆x . x/y
E’(x) = f’(x).x/y
Như vậy E’(x) là một hàm của x và y; ở ví dụ trên ta có:
E’(x) = 0,7. x/ y
Trong thực tế để thuận tiện cho việc tính toán và sử dụng, trong công thức
trên người ta thay x và y bằng số bình quân của chúng. Tức là:
E’(x) = 0,7
x / y
E’(x) = 0,7 .8,7/11,7 =0,52.
Tức là khi tuổi nghề tăng 1% thì năng suất lao động tăng 0,52%.
Hệ số co giãn có một số tính chất sau đây:
- Nếu E’(x) > 0 nói lên x và y biến thiên cùng chiều (thuận) và ngược lại.
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
95

- Nếu |E’(x)| = 1: biến thiên của y trùng với biến thiên của x.

- Nếu |E’(x)| > 1: biến thiên của y nhanh hơn biến thiên của x.
- Nếu |E’(x)| < 1: biến thiên của y chậm hơn biến thiên của x.
- Nếu |E’(x)| = 0: y là hàm không đổi.

5.4. LIÊN HỆ TƯƠNG QUAN TUYẾN TÍNH GIỮA NHIỀU TIÊU THỨC.
Trong thực tế, một kết quả do nhiều nguyên nhân tác động. Ví dụ: năng
suất lao động của công nhân do ảnh hưởng của tuổi nghề, trình độ trang bò kỹ thuật,
trình độ quản lý… Do đó vấn đề đặt ra là cần phải nghiên cứu mối liên hệ giữa một
tiêu thức kết quả với một số tiêu thức nguyên nhân. Ở đây cũng phải giải quyết hai
nhiệm vụ nghiên cứu của phương pháp hồi quy tương quan là xác đònh phương trình
hồi qui và đánh giá trình độ chặt chẽ của mối liên hệ.
Vấn đề trước tiên được đặt ra khi nghiên cứu mối liên hệ giữa một tiêu thức
kết quả với một số tiêu thức nguyên nhân là chọn bao nghiêu tiêu thức nguyên
nhân? Về phương diện lý thuyết, có thể nói rằng: Nếu số tiêu thức nguyên nhân
chọn ra càng nhiều thì càng phản ánh một cách đầy đủ mối liên hệ, song việc tính
toán càng trở nên phức tạp. Vì vậy, chỉ nên chọn những tiêu thức nguyên nhân có
tác động lớn đối với tiêu thức kết quả.
Sau khi đã lựa chọn được một số tiêu thức nguyên nhân có ảnh hưởng lớn
đến tiêu thức kết quả thì phải chọn dạng phương trình hồi quy phản ánh mối liên hệ
đó. Thông thường, người ta chọn dạng tuyến tính vì như vậy tính toán sẽ đơn giản
hơn, mặt khác về mặt lý thuyết cũng có thể chấp nhận kết quả tính toán theo dạng
tuyến tính.
Phương trình hồi quy:
y
x1, x2, x3, … , xn
= a
0
+ a
1
x

1
+ a
2
x
2
+…… + a
n
x
n

Các tham số a
i
(i = 0, 1, 2, 3, … , n) trong phương trình hồi quy được xác đònh
bằng phương pháp bình phương bé nhất.
Giả sử có hai tiêu thức nguyên nhân x
1
và x
2
tác động lớn nhất đối với tiêu
thức kết quả y. Người ta có thể dùng phương trình tuyến tính để phản ánh mối quan
hệ này.
y
x1, x2
= a
0
+ a
1
x
1
+ a

2
x
2

Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Chương 4. Lượng hóa các hiện tượng kinh tế xã hội



Trang
96

Sử dụng phương pháp bình phương nhỏ nhất sẽ dẫn đến hệ phương trình:
∑y = na
0
+ a
1
∑x
1
+ a
2
∑x
2
∑x
1
y = a
0
∑x
1

+ a
1
∑x
1
2
+ a
2
∑x
1
x
2
∑x
2
y = a
0
∑x
2
+ a
1
∑x
1
x
2
+ a
2
∑x
2
2

Để đánh giá trình độ chặt chẽ mối liên hệ tương quan tuyến tính nhiều tiêu

thức người ta thường tính hai loại hệ số tương quan: hệ số tương quan bội và hệ số
tương quan riêng.
Hệ số tương quan bội (ký hiệu là R) được dùng để đánh giá trình độ chặt chẽ
giữa tiêu thức kết quả với tất cả các tiêu thức nguyên nhân được nghiên cứu. Công
thức tổng quát như sau:
R
y,x1,x2– xn
= √ 1 – ∑(y – y
x1,x2– xn
)
2
/∑(y – y)
2
Ví dụ đối vơi trường hợp phương trình hồi qui với hai tiêu thức nguyên nhân x
1
và x
2

ở trên ta có:
R
y,x1,x2
= √ 1 – ∑(y – y
x1,x2
)
2
/∑(y – y)
2

Hoặc có thể tính theo công thức sau đây:
R

y,x11,x2
= √(r
2
yx1
+ r
2
yx2
– 2r
yx1
r
yx2
r
x1x2
)/(1 – r
2
x1x2
)
Trong đó r
yx1
; r
yx2
; r
x1x2
: là các hệ số tương quan tuyến tính đã nói ở mục trên.
Hệ số tương quan bội nhận giá trò trong khoảng [0 ; 1], tức là:
0 <
R < 1
* R = 0 thì không có liên hệ tuyến tính
* R càng gần 1 thì mối liên hệ càng chặt chẽ.
* R = 1 thì có mối liên hệ hàm số.

Hệ số tương quan riêng được dùng để đánh giá trình độ chặt chẽ mối liên hệ giữa
tiêu thức kết quả với từng tiêu thức nguyên nhân với điều kiện loại trừ ảnh hưởng
của các tiêu thức nguyên nhân khác. Như trong trường hợp có mối liên hệ giữa y với
x
1
, x
2
có thể tính:
- Hệ số tương quan riêng giữa y và x
1
(loại trừ ảnh hưởng của x
2
)
r
yx1(x2)
= (r
yx1
– r
yx2
r
x1x2
)/√(1 – r
2
yx2
)(1 – r
2
x1x2
)

- Hệ số tương quan riêng giữa y và x

2
(loại trừ ảnh hưởng của x
1
)
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.

×