Tải bản đầy đủ (.doc) (45 trang)

Phương pháp hồi quy ứng dụng trong phân tích các nhân tố tác động đến Tổng sản phẩm trong nước của Việt Nam thời kỳ 1995- 2006

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (543.36 KB, 45 trang )

Website: Email : Tel : 0918.775.368

LỜI MỞ ĐẦU
Kết quả hoạt động kinh tế của một người bất kỳ được phản ánh trước hết ở
thu nhập của người ấy. Thông thường một người có thu nhập cao dễ cho phép
người ta chi mua những hàng hóa và dịch vụ chất lượng tốt để thỏa mãn nhu cầu
vật chất và tinh thần đa dạng của họ. Trong khi đó, những người có thu nhập thấp
không có khả năng chi trả cho những hàng hóa và dịch vụ đắt tiền và do đó chỉ
được hưởng một mức sống khiêm tốn hơn nhiếu với những người có thu nhậo cao.
Điều tương tự cũng đúng với các nền kinh tế quốc gia. Nền kinh tế hoạt động có
hiệu quả khi mà mọi người trong nền kinh tế tạo ra và hưởng thụ thu nhập cao. Kết
quả là tổng thu nhập do mọi thành viên trong nền kinh tế tạo ra sẽ lớn và mọi
người đựơc hưởng mức sống cao hơn so với các nền kinh tế có mức thu nhập bình
quân đầu người thấp hơn.
GDP là thước đo sản lượng và thu nhập của một nền kinh tế, đó là một trong
những biến số quan trọng nhất của nền kinh tế quốc dân. Do vậy tăng GDP là mục
tiêu hàng đầu của bất cứ một quốc gia nào.Ở Việt Nam GDP qua các năm đều tăng
nhưng so với các nước trong khu vực Đông Nam Á như Thái Lan, Singapor,
Brunay…. thì GDP của nước ta còn kém rất nhiều, thuộc loại thấp trong khu vực.
Do vậy mục tiêu tăng GDP lại càng bức thiết hơn.
Ở Việt Nam liên tục 20 năm qua đã thực hiện những đường lối đổi mới trong
n ền kinh tế, và đã đạt được một số thành tựu đáng kể như:tăng trưởng kinh tế khá
cao, GDP tăng bình quân 7%/năm, riêng năm 2005, 2006 tăng trưởng GDP của
Việt Nam là trên 8%/năm, kết cấu hạ tầng kinh tế-xã hội được đầu tư ngày càng
tốt hơn. Trở thành thành viên trong Tổ chức thương mại quốc tế từ cuối năm 2006
đã mở ra cho Việt Nam nhiều triển vọng phát triển kinh tế hơn. Dự kiến trong 5
năm tới 2006-2010 GDP tăng bình quân 8%/năm và bình quân GDP đầu người
năm 2010 sẽ đạt 1.100-1.200 USD.
Để đạt được mục tiêu đó trước hết cần phải xem xét các nhân tố tác động
làm cho GDP tăng lên hay giảm xuống để có biện pháp làm cho GDP tăng
trưởng.


Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
Làm cho đời sống nhân người dân càng ngày càng được cải thiện.
Xuất phát từ ý nghĩa trên em quyết định chọn đề tài : “Phương pháp hồi quy
ứng dụng trong phân tích các nhân tố tác động đến Tổng sản phẩm trong nước
của Việt Nam thời kỳ 1995- 2006” với mong muốn có thể nhìn nhận rõ hơn về sự
tác động của các nhân tố đến GDP nhằm đưa ra được những biện pháp thích hợp
làm cho tốc độ tăng trưởng GDP ngày càng cao.
Đề án còn rất nhiều thiếu sót do hạn chế về lý luận và thời gian nên em rất
mong nhận được dự góp ý của thầy cô cùng các bạn để đề tài được hoàn thiện hơn
và có ý nghĩa trong thực tế.
Em xin chân thành cảm ơn các thầy cô trong khoa Thống Kê, đặc biệt là
thầy Nguyễn Hữu Chí đã tận tình hướng dẫn để em hoàn thành đề án này.
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
Chương 1: Những vấn đề lý luận chung về phân tích hồi quy

I- KHÁI NIỆM , NHIỆM VỤ , Ý NGHĨA CỦA PHÂN TÍCH HỒI QUY
TƯƠNG QUAN
1.Khái niệm :
Chủ nghĩa duy vật biện chứng khẳng định : Các hiện tượng đều tồn tại trong
mối liên hệ phụ thuộc với nhau. Phương pháp phân tích hồi quy và tương quan là
một trong những phương pháp thường được sử dụng trong thống kê để nghiên cứu
mối liên hệ phụ thuộc đó.
Khi nghiên cứu mối liên hệ phụ thuộc, nếu xét theo mức độ chặt chẽ của mối
liên hệ, có thể phân thành hai loại: Liên hệ hàm số và liên hệ tương quan.
1.1-Liên hệ hàm số:
- Liên hệ hàm số là mối liên hệ hoàn toàn chặt chẽ giữa tiêu thức nguyên
nhân - ký hiệu là x và tiêu thức kết quả - ký hiệu là y.
- Dạng tổng quát của liên hệ hàm số : y = f(x), tức là : Cứ mỗi giá trị của tiêu

thức nguyên nhân sẽ có một giá trị tương ứng của tiêu thức kết quả. Mối liên hệ
này có thể thấy được không những ở toàn bộ tổng thể, mà cả trên từng đơn vị cá
biệt.
- Lĩnh vực áp dụng : Liên hệ hàm số thường gặp khi nghiên cứu các hiện
tượng tự nhiên như trong vật lý , hóa học, v v…như lực tác động tương hỗ giữa
hai vật thể bất kỳ được tính theo công thức F = g(m
A
m
B
/r
2
) với g là hằng số hấp
dẫn, m
A
và m
B
là khối lượng của vật thể B, r là khoảng cách giữa hai vật thể A, B
1.2- Liên hệ tương quan:
- Liên hệ tương quan là mối liên hệ ràng buộc lẫn nhau giữa các tiêu thức của
hiện tượng, trong đó sự biến động của một tiêu thức này (tiêu thức kết quả) là do
tác động của nhiều tiêu thức khác (các chỉ tiêu nguyên nhân) gọi là liên hệ tương
quan - một hình thức liên hệ không chặt chẽ: Cứ mỗi giá trị của tiêu thức nguyên
nhân sẽ có nhiều giá trị tương ứng của tiêu thức kết quả. Đây là đặc điểm để phân
biệt với liên hệ hàm số (Cứ mỗi giá trị của tiêu thức nguyên nhân sẽ có một giá trị
tương ứng của tiêu thức kết quả)
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
- Lĩnh vực áp dụng: liên hệ tương quan thường gặp khi nghiên cứu các hiện
tượng kinh tế - xã hội.
Ví dụ:

+ Mối liên hệ giữa số lượng sản phẩm và giá thành đơn vị. Không phải khi
khối lượng sản phẩm tăng lên thì giá thành đơn vị sản phẩm sẽ giảm theo một tỷ lệ
tương ứng.
+ Mối liên hệ giữa phân bón với năng suất cây trồng .
+ Mối liên hệ giữa vốn đầu tư và kết quả sản xuất.
+Năng suất lúa tăng lên là do tác động của nhiều nhân tố: Phân bón, giống
lúa, làm đất, chăm bón,... thì liên hệ giữa năng suất lúa và các nhân tố nêu trên là
quan hệ tương quan; trong đó năng suất lúa là chỉ tiêu kết quả, còn phân bón,
giống lúa, chi phí chăm bón, làm đất là các chỉ tiêu nguyên nhân
+ Vị dụ 1: cụ thể về tuổi nghề và năng suất lao động của 10 công nhân ở bộ
phận sản xuất của công ty A như sau
Bảng 1:
STT công nhân Tuổi nghề - x (năm)
Năng suất lao động - y
(triệu đồng)
A 1 3
B 3 12
C 4 9
D 5 16
E 7 12
F 8 21
G 9 21
H 10 24
I 11 19
K 12 27
Tổng 70 164
Xét về mối liên hệ giữa tuổi nghề(TN) và năng xuất lao động( NSLĐ)
thường thường thì khi tuổi nghề càng nhiều thì công nhân càng có trình độ cao do
đó năng xuất lao động sẽ tăng. Nhưng không phải cứ khi tuổi nghề tăng thì năng
xuất lao động cũng tăng lên.Cụ thể 2 công nhân F và G, công nhân F có tuổi nghề

là 8 và năng xuất lao động là 21triệu đồng , công nhân G có tuổi nghề là 9 ( hơn 1
năm so với CN F) nhưng mức NSLĐ cũng là 21 triệu đồng .
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
Hoặc khi nghiên cứu nhiều công nhân có cùng tuổi nghề kết quả sẽ cho ta
thấy NSLĐ không phải luôn bằng nhau.
-Chú ý: Vì các mối liên hệ này là các mối liên hệ không hoàn toàn chặt chẽ ,
không biểu hiện được một cách rõ ràng trên từng đơn vị cá biệt. do đó để phản ánh
mối liên hệ tương quan thì phải nghiên cứu hiện tượng số lớn- tức là thu thập tiêu
thức kết quả và tiêu thức nguyên nhân của nhiều đơn vị.
Và trong quan hệ tương quan, tác động của các chỉ tiêu nguyên nhân đối với
chỉ tiêu kết quả có các mức độ khác nhau: Có chỉ tiêu nguyên nhân gây ảnh hưởng
nhiều (tương quan mạnh), có chỉ tiêu nguyên nhân gây ảnh hưởng không đáng kể
(tương quan yếu). Điều này phụ thuộc vào tính chất quan hệ của các chỉ tiêu và
điều kiện cụ thể của từng trường hợp.
Mục đích cuối cùng của phân tích thống kê là nghiên cứu mối quan hệ giữa
các chỉ tiêu khác nhau và xác định mức độ ảnh hưởng của từng chỉ tiêu cũng như
mức độ ảnh hưởng của nhiều chỉ tiêu nguyên nhân đến chỉ tiêu kết quả cụ thể như
thế nào?
Một phương pháp toán học áp dụng vào việc phân tích thống kê nhằm biểu
hiện và nghiên cứu mối liên hệ tương quan giữa các chỉ tiêu của hiện tượng kinh tế
- xã hội là phương pháp phân tích tương quan.
Khi phân tích tương quan không thể xác định quan hệ và mức độ ảnh hưởng
lẫn nhau của tất cả các chỉ tiêu của hiện tượng mà chỉ thể hiện trên hai hay một số
chỉ tiêu nào đó được xem là chủ yếu (có tương quan mạnh hơn) với giả thiết các
chỉ tiêu khác còn lại coi như không thay đổi.
2. Nhiệm vụ của phân tích hồi quy và tương quan
2.1- Phân tích định tính về bản chất của mối quan hệ, đồng thời dùng
phương pháp phân tổ hoặc đồ thị để xác định tính chất và xu thế của
mối quan hệ đó.

- Là xác định đâu là tiêu thức nguyên nhân , đâu là tiêu thức kết quả: Để
giải quyết được vấn đề này đòi hỏi phải có sự phân tích một cách sâu sắc bản chất
của mối liên hệ trong điều kiện lịch sử cụ thể. Đây là vấn đề trước tiên quyết định
sự thành công của nghiên cứu hồi quy:
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
+ Tiêu thức nguyên nhân: là những yếu tố quan trọng nhất, chủ yếu nhất, có
ảnh hưởng lớn đến tiêu htức kết quả. Căn cứ vào nhiệm vụ nghiên cứu cụ thể để
chọn ra một, hai, ba …..tiêu thức nguyên nhân và một tiêu thức kết qủa.
+ Tiêu thức kết quả :chỉ có 1.
- Dùng phương pháp phân tổ hoặc thăm dò bằng đồ thị để xác định tính chất
và xu thế của mối quan hệ đó
2.2- Biểu hiện cụ thể mối liên hệ tương quan bằng phương trình hồi quy
tuyến tính hoặc phi tuyến tính và tính các tham số của các phương
trình.
Từ đó xây dựng mô hình hồi quy có thể là:
- Mô hình hồi quy đơn:
+ Mô hình tuyến tính ( mô hình đường thẳng)
+ Mô hình phi tuyến ( mô hình đường cong)
- Mô hình hồi quy bội : Mô hình hồi quy giũa 2, 3,….tiêu thức nguyên nhân
và một tiêu thức kết quả. Mô hình này thường được xây dựng dưới dạng tuyến tính
và được gọi là mô hình hồi quy tuyến tính bội.
2.3- Đánh giá mức độ chặt chẽ của mối liên hệ tương quan
Việc đánh giá mức độ chặt chẽ của mối liên hệ tương quan được thực hiện
thông qua việc tính toán hệ số tương quan , tỉ số tương quan, hệ sốtương quan bội,
hệ số tương quan riêng phần . Dựa vào kết quả tính toán có thể kết luận về mức độ
chặt chẽ của mối liên hệ, giúp cho việc nhận thức hiện tượng được sâu sắc, từ đó
đề ra những giải pháp cụ thể .
3. Ý nghĩa của phân tích hồi quy và tương quan
- Đây là phương pháp thường sử dụng trong thống kê để nghiên cứu mối

liên hệ giữa các hiện tượng, như mối liên hệ giữa các yếu tố đầu vào của quá trình
sản xuất với kết quả xản xuất , mối liên hệ giữa thu nhập và tiêu dùng, mối quan
hệ giữa phát triển kinh tế với phát triển xã hội…từ đó biết được bản chất của mối
liên hệ và đề ra biện pháp có lợi……
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
- Phương pháp hồi quy tương quan còn được sử dụng trong nhiều phương
pháp thống kê khác như : phân tích dãy số thời gian, dự đoán thống kê, phân tích
nhân tố….
II- QUY TRÌNH VẬN DỤNG PHÂN TÍCH HỒI QUY:
1. Bước 1: Chọn biến
Là xác định trong mối liên hệ thì tiêu thức nào là tiêu thức nguyên nhân( x),
tiêu thức nào là tiêu thức kết quả (y)
Được xác định dựa vào căn cứ sau:
- Tiêu thức nguyên nhân là những yếu tố quan trọng nhất, chủ yếu nhất, có
thể có 1 hoặc nhiều tiêu thức nguyên nhân. Và khi các yếu tố này thay đổi thường
làm cho tiêu thức kết quả thay đổi theo.
- Tiêu thức kết quả: là yếu tố bị ảnh hưởng bởi các yếu tố khác,nó là kết quả
của sự thay đổi của những tiêu thức nguyên nhân , tức là khi một số yếu tố khác
thay đổi thì sẽ làm cho tiêu thức kết quả thay đổi theo, nhưng ngược lai khi tiêu
thức kết quả thay đổi chưa chắc làm cho tiêu thức nguyên nhân thay đổi.
Ví dụ:
+ Ở bảng 1: trong mối liên hệ giữa tuổi nghề và năng xuất lao động thì
Tuổi nghề: là tiêu thức nguyên nhân vì khi tuổi nghề càng nhiều thì tay nghề
càng cao, do đó làm cho năng xuất lao động càng tăng.Tuổi nghề thay đổi có thể
làm cho năng xuất lao động thay đổi.
Năng xuất lao động : là tiêu thức kết quả vì năng xuất lao động tăng không
thể làm cho tuổi nghề tăng lên được. Và khi tuổi nghề thay đổi sẽ làm cho NSLĐ
thay đổi
+ Trong mối liên hệ giữa số lượng sản phẩm và giá thành đơn vị sản phẩm

thì:
Khối lượng sản phẩm: là tiêu thức nguyên nhân vì thường thì khi khối lượng
sản phẩm giảm thì giá thành trên một đơn vị sản phẩm sẽ giảm.
Giá thành đơn vị sản phẩm: là tiêu thức kết quả vì khi giá thành đơn vị thay
đổi không thể làm cho khối lượng sản phẩm thay đổi theo.
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
2. Bước 2: Thăm dò bằng đồ thị để xác định tính chất và xu thế của
mối quan hệ đó.
2.1. Hồi quy đơn
Là hồi quy giữa hai tiêu thức số lượng : một tiêu thức nguyên nhân và một
tiêu thức kết quả
Nhiệm vụ của bước này là dùng đồ thị để biểu hiện mối liên hệ với trục
hoành là tiêu thức nguyên nhân( x) và trục tung là tiêu thức kết quả (y) .Từ đó tìm
ra mối liên hệ giữa hai tiêu thức
Có các dạng đồ thị sau:
a- Đồ thị dạng tuyến tính:
Thăm dò băng đồ thị với trục hoành là tiêu thức nguyên nhân( x) ,trục tung là
tiêu thức kết quả (y). Nếu các điểm trên đồ thị được phân bố theo một trong hai
dang sau đây thì có thể xây dựng mô hình hồi quy tuyến tính đơn
Đồ thị biểu diễn phương trình đường thẳng (y = a
0
+ a
1
t) có dạng:

Trở lại ví dụ ở bảng 1 ,từ số liệu cho thấy : Nhìn chung, cùng với sự tăng lên
của tuổi nghề thì NSLĐ cũng tăng lên , nhưng cũng có trường hợp không hẳn như
vậy như NSLĐ của công nhân I so với công nhân H: tuổi nghề tăng nhưng NSLĐ
lại thấp hơn. Điều này chứng tỏ giữa tuổi nghề và NSLĐ có mối quan hệ không

hoàn toàn chặt chẽ- tức là liên hệ tương quan .
Thăm dò bằng đồ thị ta được kết quả sau:
Vũ Thị Tươi Lớp: Thống kê 46B
y
t
0
a
1
> 0
y
0
a
1
< 0
t
Website: Email : Tel : 0918.775.368
NSLĐ (tr đ)





Tuổi nghề(năm)
Trên đồ thị có các chấm biểu hiện tuổi nghề và NSLĐ của từng công nhân.
Các chấm trên đồ thị tạo thành một băng đường thẳng, từ đó có thể xây dựng mô
hình hồi quy tuyến tính như sau:
y
ˆ
x
= b

0


+ b
1
x (2.1.a)
Trong đó:
y
ˆ
x
là giá trị của tiêu thức kết quả được tính từ mô hình hồi quy
b
0
là hệ số tự do, nói lên sự ảnh hưởng của các tiêu thức khác ngoài tuổi
nghề đối với NSLĐ
b
1
là hệ số góc ( số hồi quy theo x)
Ý nghĩa :cho biết khi tiêu thức nguyên nhân (x) tăng 1 đơn vị thì tiêu thức
kết quả (y) tăng nếu b
1
>0 (hoặc giảm nếu b
1
<0) là b
1
đơn vị.
b- Đồ thị dạng Parabôn:
Thăm dò băng đồ thị với trục hoành là tiêu thức nguyên nhân( x) ,trục tung là
tiêu thức kết quả (y). Nếu các điểm trên đồ thị được phân bố theo một trong hai
dang sau đây thì có thể xây dựng mô hình hồi quy Parabôn:

Phương trình parabol bậc 2 thường được sử dụng khi các trị số của chỉ tiêu
Vũ Thị Tươi Lớp: Thống kê 46B
0
x
yy
0
x
Website: Email : Tel : 0918.775.368
nguyên nhân tăng lên thì trị số của chỉ tiêu kết quả tăng (hoặc giảm), việc tăng
(hoặc giảm) đạt đến trị số cực đại (hoặc cực tiểu) rồi sau đó lại giảm (hoặc tăng).
Ví dụ, nghiên cứu mối liên hệ giữa lượng tiêu hao than và chất lượng gạch máy.
Khi lượng tiêu hao than cho 1000 viên gạch còn thấp thì nếu tăng lượng tiêu hao
than sẽ làm cho gạch nung ra già hơn, chất lượng cao hơn. Nhưng tăng lượng tiêu
hao than đạt đến một mức nào đó (vừa đủ), nếu tiếp tục tăng nữa thì sẽ làm cho
gạch nung ra bị khê phồng tức là làm cho chất lượng gạch lại giảm đi. Khi lượng
tiêu hao than đạt đến mức vừa đủ thì gạch máy sẽ đạt chất lượng cao nhất (đạt giá
trị cực đại).
* Phương trình parabol bậc 2 có dạng:
= b
o
+ b
1
x + b
2
x
2
(2.1.b)
Ví dụ 2: Trong tác phẩm về sự phát triển của CNTB ở Nga ( Lê Nin toàn tập)
nghiên cứu mối quan hệ giàu nghèo và tỷ lệ phần trăm thu bằng tiền của các nông
hộ có mối quan hệ với nhau hay không ( sự giàu nghèo thể hiện bằng số ngựa)

Bảng 2
Số ngựa (x) Tỷ lệ % thu bằng tiền(y)
0 57.1
1 46.47
2 43.57
3 41.47
4 46.95
>=5 60.18
Thăm dò bằng đồ thị ta được dạng đồ thị như sau:
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
SONGUA
6543210-1
TYLETHU
70
60
50
40
Từ đồ thị trên trên ta có thể xây dựng mô hình hồi quy dạng hàm Parabôn
c- Đồ thị dạng Hyperbôn:
Thăm dò băng đồ thị với trục hoành là tiêu thức nguyên nhân( x) ,trục tung là
tiêu thức kết quả (y). Nếu các điểm trên đồ thị được phân bố theo dạng như trong
ví dụ dưới đây thì có thể xây dựng mô hình hồi quy Hyperbôn
Phương trình hyperbôn được áp dụng trong trường hợp khi các trị số của chỉ
tiêu nguyên nhân tăng lên thì trị số của chỉ tiêu kết quả giảm nhưng mức độ giảm
nhỏ dần và đến một giới hạn nào đó (
0
ˆ
by
x

=
) thì hầu như không giảm. Ví dụ,
quan hệ giữa giá thành đơn vị sản phẩm và khối lượng sản phẩm sản xuất là quan
hệ theo phương trình hybecbol như đã nói ở trên.
* Phương trình Hyperbôn có dạng:

x
b
by
x
1
0
ˆ
+=
(2.1.c)
Ví dụ 3: Có tài liệu về số lượng sản phẩm (nghìn sản phẩm) và giá thành đơn
vị sản phẩm( nghìn đồng/ sản phẩm) của 10 xí nghiệp cùng sản xuất một loại sản
phẩm như sau:

Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
Bảng 3
Số lượng SP
(Ng.sp)
Giá thành
(Ng.đ/sp)
Số lượng SP
(Ng.sp)
Giá thành
(Ng.đ/sp)

10 15.60 35 15.15
15 15.40 40 15.14
20 15.27 50 15.12
25 15.24 60 15.10
30 15.20 80 15.05
Với tài liệu trên : Tiêu thức nguyên nhân là số lượng sản phẩm (x) , tiêu thức
kết quả là giá thành đơn vị sản phẩm (y) và có đồ thị sau đây:
GIATHANH
SOLUONG
100806040200
15.7
15.6
15.5
15.4
15.3
15.2
15.1
15.0
Observed
Inverse
Từ đồ thị trên ta có thể xây dựng mô hình hồi quy dạng hàm Hyperbôn.
d- Đồ thị dạng hàm mũ:
Thăm dò băng đồ thị với trục hoành là tiêu thức nguyên nhân( x) ,trục tung là
tiêu thức kết quả (y). Nếu các điểm trên đồ thị được phân bố theo dang sau đây thì
có thể xây dựng mô hình hồi quy dạng hàm mũ.
Đồ thị biểu diễn phương trình hàm số mũ có dạng:
Vũ Thị Tươi Lớp: Thống kê 46B
y
0 x
x

Website: Email : Tel : 0918.775.368
* Phương trình hàm mũ
x
x
bby
10
ˆ
=
(2.1.d)
Phương trình hàm số mũ được áp dụng trong trường hợp cùng với sự tăng
lên của chỉ tiêu nguyên nhân thì trị số của các chỉ tiêu kết quả thay đổi theo cấp số
nhân, nghĩa là có tốc độ tăng xấp xỉ nhau.
2.2. Hồi quy bội
Là hồi quy giữa nhiều tiêu thức nguyên nhân với một tiêu thức kết quả . Mô
hình này thường đựợc xây dựng dưới dạng tuyến tính và được gọi là mô hình hồi
quy tương quan tuyến tính bội.
Trong thực tế các hiện tượng kinh tế - xã hội, một chỉ tiêu kết quả thường do
tác động của nhiều chỉ tiêu nguyên nhân. Ví dụ, năng suất lao động của công nhân
tăng lên do ảnh hưởng của các yếu tố nguyên nhân: Tuổi nghề, trình độ trang bị kỹ
thuật, trình độ quản lý, v.v... Do đó vấn đề đặt ra là cần phải nghiên cứu mối liên
hệ giữa một chỉ tiêu kết quả với một số chỉ tiêu nguyên nhân.
*Phương trình hồi quy tuyến tính bội:
Giả sử có p tiêu thức nguyên nhân : x
1
, x
2
, …, x
p
và tiêu thức kết quả y, mô
hình hồi quy tuyến tính bội sẽ có dạng:

22110
..
ˆ
xbxbby
++=
+ …+ b
p
x
p
(2.2)
Trong đó : + b
0
là hệ số tự do
+ b
1
, b
2
, …, b
p
là các hệ số hồi quy riêng
3. Bước 3: Xây dựng mô hình hồi quy và kiểm định sự phù hợp của
hàm hồi quy
Sau khi thăm dò bằng đồ thị ta đã biết được mối quan hệ giữa các tiêu thức
và xác định được dạng hàm hồi quy. Từ đó xây dựng các bước tính toán tìm ra mô
hình hồi quy chính xác.
3.1- Mô hình hồi quy đơn:
a. Mô hình hồi quy tuyến tính đơn.
* Mô hình hồi quy tuyến tính đơn có dạng:

y

ˆ
x
= b
0


+ b
1
x
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
Các hệ số b
0
và b
1
được xác định bằng phương pháp bình phương nhỏ nhất:
Tức là tìm b
0
và b
1
sao cho tổng bình phương các độ lệch giữa các giá trị thực tế của
tiêu thức kết quả được tính từ mô hình hồi quy là nhỏ nhất ( cực tiểu ).
Q =


2
)
ˆ
( yy
= min

Lấy đạo hàm riêng theo các hệ số rồi cho nó bằng 0 và được một hệ phương trình :




Σ=Σ+Σ
Σ=Σ+
xyxbxb
yxbnb
2
10
10
(3.1.a)
Để tính được b
0
và b
1
cần tính

,x


y
,

2
x
,

xy

bằng cách lập bảng
sau:
x y xy x
2
… … … …
… … … …

,x
=

y
=

xy
=

2
x
=
* Trở lại ví dụ ở bảng 1 với về tuổi nghề và năng suất lao động của các công
nhân.
Ta có bảng sau:
Bảng 4
STT
công nhân
Tuổi nghề x
(Năm)
Năng suất lao động - y
(Triệu đồng)
xy x

2
y
2
A 1 2 3=1x2 4=(1)
2
5=(2)
2
A 1 3 3 1 9
B 3 12 36 9 144
C 4 9 36 16 81
D 5 16 80 25 256
E 7 12 84 49 144
F 8 21 168 64 441
G 9 21 189 81 441
H 10 24 240 100 576
I 11 19 209 121 361
K 12 27 324 144 729
Tổng 70 164 1369 610 3182
Từ số liệu đã cho của x và y ở bảng 1, ta tính toán các đại lượng xy, x
2
và y
2
như cột 3, 4 và 5 của bảng.
Thay số liệu tính được ở bảng 4 vào hệ phương trình 3.1.a ta có:
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368



=+

=+
136961070
1647010
10
10
bb
bb
Giải hệ phương trình tính được: b
0
= 3.52 và b
1
= 1.84.
Mô hình hồi quy tuyến tính phản ánh mối liên hệ giữa tuổi nghề và năng suất
lao động là:
.84.152.3
ˆ
xy
x
+=
+ b
0
= 3.52, nói lên ảnh hưởng các nguyên nhân khác ngoài tuổi nghề ảnh
hưởng đến năng xuất lao động.
+ b
1
= 1.84, nói lên khi thêm tăng môt tuổi nghề thì năng suất lao động tăng
bình quân 1.84 triệu đồng.
*Bằng cách biến đổi hệ phương trình trên, ta có thể tính b
0
và b

1
như sau:
x
yxxy
b
2
1
.
δ

=
b
0
=
xby
1

Với
xy
=(

xy
)/n = 1369/10 = 136.9

x
=(

x
)/n = 70/10 = 7


y
=(

y
)/n = 164/10 = 16.4

2
x
δ
=
2
x
- (
x
)
2
= (610/10) – 7
2
= 12
b
1
= (136.9-7*16.4)/12= 1.84
b
0
= 16.4- 1.84*7=3.51
b. Mô hình hồi quy phi tuyến Parabôn:
* Phương trình parabol bậc 2 có dạng:
x
y
ˆ

= b
o
+ b
1
x + b
2
x
2
Áp dụng phương pháp bình phương nhỏ nhất ta có hệ phương trình:





Σ=Σ+Σ+Σ
Σ=Σ+Σ+Σ
Σ=Σ+Σ+
yxxbxbxb
xyxbxbxb
yxbxbnb
24
2
3
1
2
0
3
2
2
10

2
210
(3.1.b)
Giải hệ phương trình trên ta tìm được các hệ số b
0
,b
1
, b
2
,rồi thay vào
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
phương trình
x
y
ˆ
= b
o
+ b
1
x + b
2
x
2
sẽ có mô hình hồi quy giữa hai tiêu thức.
* Trở lại ví dụ 2 ở Bảng 2 về hồi quy mối quan hệ giữa tỷ lệ giàu nghèo( số
ngựa) và tỷ lệ phần trăm thu bằng tiền.
Để tính được các hệ số ta lập bảng sau:
Bảng 5
số ngựa

(x)
Tỷ lệ % thu
bằng tiền(y)
x
2
y
2
x
3
X
4
xy x
2
y
0 57.1
0 3260.41 0 0 0 0
1 46.47
1 2159.461 1 1 46.47 46.47
2 43.57
4 1898.345 8 16 87.14 174.28
3 41.47
9 1719.761 27 81 124.41 373.23
4 46.95
16 2204.303 64 256 187.8 751.2
>=5 60.18 25 3621.632 125 625 300.9 1504.5
15 295.74 55
14863.9
1 225 979 746.72 2849.68
Từ bảng trên thay vào hệ (3.1.b) ta có hệ phương trình:








=++
=++
=++
68.284997922555
72.7462255515
74.29555156
210
210
210
bbb
bbb
bbb

Giải hệ phương trình trên ta được : b
0
= 57.33, b
1
= -13.22, b
2
= 2.792.
Vậy phương trình hồi quy Parabôn là:
x
y
ˆ

= 57.33 + -13.22x + 2.792x
2
c. Mô hình hồi quy phi tuyến Hyperbôn:
* Phương trình Hyperbôn có dạng:

x
b
by
x
1
0
ˆ
+=

Áp dụng phương pháp bình phương nhỏ nhất ta xây dựng được hệ phương
trình chuẩn tắc xác định hệ số b
0

1
b
của phương trình trên như sau:
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368








Σ=Σ+Σ
Σ=Σ+
x
y
x
b
x
b
y
x
bnb
2
10
10
11
1
(3.1.c)
Giải hệ phương trình trên ta tìm được các hệ số b
0
, b
1
*Quay trở lại ví dụ 3 bảng về mối liên hệ giữa số lượng sản phẩm và giá
thành đơn vị sản phẩm.Từ đồ thị ta có thể xây dựng mô hình Hyperbôn. Căn cứ
vào hệ phương trình của mô hình Hyperbôn ta xây dựng bảng sau đây:
Bảng 6
Số lượng SP
(Ng.đ)- x
Giá thành
(Ng.đ/SP) -y
1/x 1/x

2
y.1/x
10 15.6 0.100 0.010 1.560
15 15.4 0.067 0.004 1.027
20 15.27 0.050 0.003 0.764
25 15.24 0.040 0.002 0.610
30 15.2 0.033 0.001 0.507
35 15.15 0.029 0.001 0.433
40 15.14 0.025 0.001 0.379
50 15.12 0.020 0.001 0.302
60 15.1 0.017 0.001 0.252
80 15.05 0.013 0.001 0.188
365 152.27 0.393 0.025 6.020
Thay số liệu vào hệ phương trình (3.1.c) ta được:



=+
=+
020.6025.0393.0
27.152393.010
10
10
bb
bb
Giải hệ phương trình trên ta tìm được các hệ số: b
0
= 15.08 và b
1
= 3.74

Vậy mô hình hồi quy là:

x
y
x
74.3
08.15
ˆ
+=
.
d. Mô hình hàm mũ.
* Phương trình hàm mũ
Vũ Thị Tươi Lớp: Thống kê 46B
Website: Email : Tel : 0918.775.368
x
x
bby
10
ˆ
=
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây
để tìm giá trị các hệ số b
0
, b
1
:



Σ=Σ+Σ

Σ=Σ+
yxxbxb
yxbbn
ln.lnln
lnlnln
2
10
10
Giải hệ phương trình trên sẽ được lnb
0
, lnb
1
.Tra đối ln, sẽ được giá trị của b
0
,
b
1
.
3.2- Mô hình hồi quy tương quan tuyến tính bội:
*Phương trình hồi quy tuyến tính bội với p tiêu thức nguyên nhân và một tiêu
thức kết quả y
22110
..
ˆ
xbxbby
++=
+ …+ b
p
x
p

(3.2)
Ta xét trường hợp đơn giản với phương trình hồi quy tuyến tính giữa ba chỉ
tiêu. Nếu gọi y là chỉ tiêu kết quả và x
1
, x
2
là các chỉ tiêu nguyên nhân, ta có
phương trình hồi quy tuyến tính giữa 3 chỉ tiêu như sau:
22110,
..
ˆ
21
xbxbby
xx
++=
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây
để tính các hệ số b
0
, b
1
, b
2
:





Σ=Σ+Σ+Σ
Σ=Σ+Σ+Σ

Σ=Σ+Σ+
yxxbxxbxb
yxxxbxbxb
yxbxbnb
2
2
2221120
1212
2
1110
22110
Đồng thời để đánh giá được mức độ ảnh hưởng của từng tiêu thức nguyên
nhân x
i
đối với tiêu thức kết quả y ta dùng Hệ số hồi quy chuẩn hóa – ký hiệu là
beta, được tính theo công thức sau:
beta
i
= b
i
y
x
i
σ
σ
Dấu của beta
i
là dấu của b
i
, phản ánh chiều hướng mối liên hệ là thuận hay

nghịch giữa tiêu thức nguyên nhân x
i
với tiêu thức kết quả y.
i
beta
phản ánh mức độ ảnh hưởng của từng tiêu htức nguyên nhân x
i
đối
Vũ Thị Tươi Lớp: Thống kê 46B

×