Tải bản đầy đủ (.pdf) (131 trang)

Bài giảng Kinh tế lượng - ĐH Quy Nhơn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.64 MB, 131 trang )

TRƢỜNG ĐẠI HỌC QUY NHƠN
KHOA KINH TẾ & KẾ TOÁN

CAO TẤN BÌNH

BÀI GIẢNG KINH TẾ LƢỢNG

Quy Nhơn, 9/2017
1


Chƣơng 1

KHÁI QUÁT VỀ KINH TẾ LƢỢNG

1.1 Giới thiệu về môn học kinh tế lƣợng
Kinh tế lượng có tên tiếng Anh là Econometrics, do nhà kinh tế học người Na uy A. K
Ragnar Frisch sử dụng lần đầu tiên vào khoảng 1930.
Kinh tế lượng là một môn khoa học về đo lường các mối quan hệ kinh tế diễn ra trong
thực tế, là sự kết hợp giữa các lý thuyết kinh tế hiện đại, thống kê toán học và máy vi tính
nhằm định lượng các mối quan hệ kinh tế, dự báo khả năng phát triển của hiện tượng
kinh tế và phân tích các chính sách kinh tế.
Nền tảng của kinh tế lượng:
 Lý thuyết kinh tế: Nêu lên bản chất các mối quan hệ kinh tế dưới dạng định tính.
Chẳng hạn mối quan hệ giữa lượng cầu và giá cả, sản lượng và số lượng công
nhân, thu nhập và chi tiêu, năng suất cây trồng và lượng phân bón, doanh thu và
chi phí quảng cáo, giá nhà và hướng nhà, sự chi tiêu và sự giàu có,…
 Mô hình toán kinh tế: Sử dụng công cụ toán học để mô hình hóa lý thuyết kinh tế
dưới dạng mô hình toán học, chưa quan tâm đến việc kiểm chứng xem liệu những
mô hình toán học này có đúng đắn về mặt thực nghiệm hay không.
 Thống kê: Có vai trò quan trọng trong việc thu thập, xử lý số liệu, và những số


liệu sơ cấp ban đầu này không thể thiếu cho một nhà kinh tế lượng.
Mục đích của kinh tế lượng
 Thiết lập mô hình toán học để nêu ra các giả thiết cũng như các giả định về mối
quan hệ giữa các biến số kinh tế với nhau.
 Thực hiện việc ước lượng tham số để xem xét mức độ ảnh hưởng giữa các biến số.
 Kiểm định giả thuyết.
 Đưa ra dự báo và mô phỏng hiện tượng kinh tế.
 Đề xuất giải pháp, chính sách dựa trên kết quả của được phân tích từ mô hình kinh
tế lượng.
1.2 Phƣơng pháp luận nghiên cứu của kinh tế lƣợng
 Nêu vấn đề nghiên cứu và các giả thuyết: Nghiên cứu quan hệ giữa thu nhập và
tiêu dùng, mức lãi suất thay đổi và cầu về tiền, năng suất lao động với vốn, lao
động và khoa học công nghệ,…
 Thiết lập mô hình: Dựa vào lý thuyết kinh tế để định dạng các mô hình cụ thể cho
các bài toán cụ thể. Chẳng hạn, người ta có thể sử dụng hàm tuyến tính để mô tả
mối quan hệ giữa thu nhập Y và tiêu dùng X như sau:
2


Y   X

Tuy nhiên trong thực tế, với cùng một mức thu nhập thì chi tiêu tiêu dùng có thể
khác nhau. Do vậy mô hình toán học thuần túy như trên chưa phản ánh được tình
huống kinh tế này. Mô hình kinh tế lượng được đề xuất một cách hợp lý với nhiễu
ngẫu nhiên U như sau:
Y     X U

 Thu thập và xử lý số liệu: Quan tâm đến số liệu của mẫu và số liệu của tổng thể.
 Ước lượng các tham số của mô hình: Sử dụng các phương pháp như phương pháp
bình phương tối thiểu OLS (Ordinary Least Squares), phương pháp ước lượng

hàm hợp lý tối đa MLE (Maximum Likelihood Estimation),… Chẳng hạn, phương
trình mô tả quan hệ giữa tiêu dùng Y và thu nhập X từ chuỗi số liệu của Mỹ giai
đoạn 1982-1996 bằng phương pháp OLS là:
Y  184.078  0.706408 X

Nhìn vào kết quả hồi quy này, ta thấy xu hướng tiêu dùng cận biên của nền kinh tế
Mỹ giai đoạn 1982-1996 là  2  0.706408 .
 Kiểm định mô hình: Mục đích của kiểm định là kiểm chứng lại mô hình hoặc lý
thuyết kinh tế. Theo ví dụ trên, ta có trị số về xu hướng tiêu dùng cận biên là

 2  0.706408  0 phù hợp với lý thuyết kinh tế của Keynes về Thu nhập-Tiêu
dùng. Tuy nhiên, ta cũng cần xác định thêm giá trị này có thỏa mãn 0   2  1 với
ý nghĩa thống kê hay không.
 Dự báo và sử dụng mô hình để quyết định chính sách: Dựa vào kết quả của mô
hình trên, có thể dự báo tác động của chính sách kinh tế. Ngoài ra, kết quả hồi quy
này có thể giúp ích cho Chính phủ trong việc phân tích chính sách đầu tư, chính
sách thuế (giảm thuế -> tăng thu nhập khả dụng -> tăng tiêu dùng -> tăng tổng
cầu).
1.3 Số liệu cho nghiên cứu kinh tế lƣợng
Có ba dạng dữ liệu kinh tế có bản: Dữ liệu theo thời gian (Time Series Data), dữ liệu theo
không gian (dữ liệu chéo) (Cross Data) và dữ liệu hỗn hợp (dữ liệu bảng) (Panel Data).
Nguồn số liệu:
 Các cơ quan nhà nước: Tổng cục thống kê, Uỷ ban Nhân dân thành phố,…
 Các cơ quan quốc tế: Ngân hàng thế giới (WB), Qũy tiền tệ thế giới (IMF),…
3


 Các cơ quan và tổ chức tư nhân.
 Wedsite.
1.4 Chất lƣợng của số liệu

Chất lượng của số liệu kinh tế-xã hội thường không tốt bởi các nguyên nhân sau đây:
 Bỏ sót số liệu.
 Sai sót về kỹ thuật thu thập thông tin (bảng câu hỏi không phù hợp, nội dung câu
hỏi không chính xác,…).
 Nhầm lẫn khi quan sát, ghi nhận thông tin.
 Sai số do dụng cụ đo lường.
 Sai số khi chọn mẫu không có tính đại diện cao.
 Mức độ tổng hợp và bảo mật của số liệu sử dụng.
 Đối tượng cung cấp thông tin thiếu trung thực, không đầy đủ hoặc từ chối trả lời.
1.5 Vai trò của máy vi tính và phần mềm chuyên dụng
Hầu hết các bài toán trong kinh tế lượng liên quan đến việc xử lý một khối lượng số liệu
rất lớn, do đó cần đến sự trợ giúp của máy vi tính và các chương trình hỗ trợ tính toán,
chẳng hạn như: Excel, EVIEWS, SPSS, STATA, R,…

4


Chƣơng 2

MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN

2.1 Mô hình và một số khái niệm
2.1.1 Mô hình hồi quy
Mô hình hồi quy tuyến tính hai biến:
Y  1  2 X  U

(2.1.1)

 Y: Biến phụ thuộc hay biến được giải thích (explained variable)
 X: Biến độc lập hay biến giải thích (explanatory variable)

 U: Sai số ngẫu nhiên, giả thiết E (U | X )  0


1 ,  2 : Các hằng số

2.1.2 Hàm hồi quy tổng thể
Khi E (U | X )  0 , từ (2.1.1) ta có
E (Y | X )  1  2 X

(2.1.2)

Phương trình (2.1.2) được gọi là hàm hồi quy tổng thể PRF (Population Regression
Function).


1 : Hệ số chặn, bằng giá trị trung bình của biến Y khi X = 0.



 2 : Hệ số góc, thể hiện quan hệ giữa X và E (Y | X ) .

 2  0 : Khi X tăng (giảm) một đơn vị thì E (Y | X ) tăng (giảm)  2 đơn vị.

 2  0 : Khi X tăng (giảm) một đơn vị thì E (Y | X ) giảm (tăng)  2 đơn vị.
2.1.3 Hàm hồi quy mẫu
Để phản ánh hàm hồi quy tổng thể cho tổng thể, cần xây dựng hàm hồi quy mẫu trên
mẫu. Nếu hàm hồi quy tổng thể mô tả xu thế biến động về mặt trung bình của biến phụ
thuộc theo biến độc lập trong tổng thể, thì hàm hàm hồi quy mẫu là hàm số mô tả xu thế
biến động đó nhưng trong mẫu. Vì hàm hồi quy mẫu dùng để phản ánh cho hàm hồi quy
tổng thể nên phải có dạng giống hàm hồi quy tổng thể.

Giả sử ( X i , Yi ), i  1, n là mẫu ngẫu nhiên kích thước n của ( X , Y ) . Khi đó ta có biểu diễn
dưới đây được gọi là hàm hồi quy mẫu SRF (Sample Regression Function)

Y  1   2 X

(2.1.3)
5


Trong đó 1 ,  2 được gọi là các hệ số số hồi quy mẫu hay hệ số ước lượng, là các ước
lượng điểm lần lượt của 1 ,  2 thông qua mẫu kích thước n ở trên.
Dạng hàm hồi quy mẫu cho từng quan sát:

Y i  1   2 X i

(2.1.4)

Y  1   2 X  U

(2.1.5)

Yi  1   2 X i  U i

(2.1.6)

Dạng ngẫu nhiên:

Nhận xét: Hàm hồi quy mẫu có các tính chất sau đây



n

U
i 1

i

0



cov( X ,U )  0



cov(Y ,U )  0



Y Y



 Đường hồi quy mẫu đi qua điểm X , Y



2.1.4 Tính tuyến tính trong mô hình hồi quy
Tính tuyến tính của mô hình hồi quy được hiểu là tuyến tính theo tham số. Dưới đây là
một số mô hình hồi quy dạng tuyến tính thường gặp:

1
U
X

Y  1  2 X 2  U

Y  1   2

Y  1  2 ln X  U

ln Y  1  2 ln X  U

lnY  1  2 X  U

lnY  1   2

1
U
X

Ví dụ về dạng không tuyến tính (phi tuyến):
Y  e1  2 X  U

Y  1 X 2 eU

6


Y


1

1

Y  0 

 2 X  U

1
U
1   2 X

Trong một số trường hợp, sử dụng phép biến đổi phù hợp, ta có thể biến đổi mô hình hồi
quy phi tuyến về mô hình hồi quy tuyến tính.
2.2 Phƣơng pháp ƣớc lƣợng OLS (Ordinary Least Squares)
Xét mô hình hồi quy tổng thể:
Y  1  2 X  U

(2.2.1)

Để ước lượng các hệ số 1 ,  2 ta cần rút ra một mẫu ngẫu nhiên kích thước n từ tổng thể:

( X i , Yi ), i  1, n . Khi đó ta có
Yi  1  2 X i  U i

(2.2.2)

Y i  1   2 X i

(2.2.3)


Ký hiệu phần dư (Residuals):

U i  Yi  Yi

(2.2.4)

Chúng ta muốn xác định 1 ,  2 sao cho tổng bình phương các phần dư là bé nhất, có
nghĩa là





n

2

n



f 1 ,  2  U i   Yi  Yi
i 1

i 1

2

   Y     X 

n

i 1

i

1

2

2

i

 Min

Đây là bài toán cực trị hai biến không có điều kiện ràng buộc, do đó 1 ,  2 sẽ là nghiệm
của hệ phương trình sau:

 f



 f



 ,   0
1


2

 1

 ,   0
1

 2

2

n

X i  X Yi  Y


i 1
  2 

n
2

Xi  X


i 1

 1  Y   2 X








  X Y  nXY



n

i 1
n

X
i 1

i i
2

i

 

n X

2

với
7



n

X

 Xi
i 1

n

n

,Y 

Y
i 1

i

n

Ví dụ 2.2.1: Xét mẫu số liệu sau đây
Thu nhập
(triệu đồng/tháng)
Chi tiêu
(triệu đồng/tháng)

8


9

10

11

12

15 15 16 17 20

7

8

9

9

10

12 11 13 14 15

Dependent Variable: CHITIEU
Method: Least Squares
Date:
Time: 09:51
Sample: 1 10
Included observations: 10
Variable


Coefficient

Std. Error

t-Statistic

Prob.

THUNHAP
C

0.673035
1.848641

0.042320
0.584110

15.90340
3.164883

0.0000
0.0133

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)


0.969339
0.965506
0.493715
1.950037
-6.015701
252.9182
0.000000

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

10.80000
2.658320
1.603140
1.663657
1.536753
2.400147

Ta có kết quả hồi quy Y i  1.848641  0.673035 X i .
Ý nghĩa các hệ số ước lượng:


 1  1.848641: Chi tiêu dự định trung bình của mẫu gồm 10 hộ gia đình khi không
có thu nhập.




 2  0.673035 : Khuynh hướng tiêu dùng trung bình bằng 0.673035 , có nghĩa là
khi thu nhập tăng thêm 1 triệu đồng thì chi tiêu trung bình tăng thêm khoảng
0.673035 triệu đồng.

8


2.3 Tính không chệch và độ chính xác của ƣớc lƣợng OLS
2.3.1 Các giả thiết của phƣơng pháp OLS
Xét mô hình hồi quy tuyến tính hai biến (2.1.1):
Y  1  2 X  U

thỏa mãn các giả thiết sau đây:
Giả thiết 1: Mô hình được ước lượng trên mẫu ngẫu nhiên

( X ,Y ), i  1, n
i

i

Giả thiết 2: Kỳ vọng có điều kiện bằng 0

E (U | X i )  0, i  1, n
Giả thiết 3: Phương sai có điều kiện không đổi

Var(U | X i )   2 , i  1, n
2.3.2 Tính không chệch
Giả sử mô hình hồi quy tuyến tính hai biến (2.1.1) có hàm hồi quy mẫu là


Y  1   2 X
Ta có định lý sau đây:
Định lý: Khi giả thiết 2 được thỏa mãn thì các ước lượng điểm 1 ,  2 lần lượt là các
ước lượng không chệch của 1 ,  2 , có nghĩa là

 

 

E 1  1 , E  2   2
2.3.3 Độ chính xác của các ƣớc lƣợng
Độ chính xác của các ước lượng được đo bởi phương sai của các ước lượng đó. Khi
phương sai càng bé thì độ chính xác của ước lượng càng cao. Phương sai của các ước
lượng được thể hiện qua định lý dưới đây.

9


Định lý: Khi các giả thiết 1, giả thiết 2 và giả thiết 3 được thỏa mãn thì phương sai của
các hệ số ước lượng được xác định bởi
n

 

Var 1 

X
i 1


2
i



n

n X i  X
i 1

 

Var  2 



2

2

2

 X
n

i 1

i

X




2

Trong thực tế ta thường không biết  2 , do đó ta thay  2 bởi ước lượng điểm không
chệch, tốt nhất  2 của nó trong các công thức ở trên:
n

2 

U

2
i

i 1

n2

Như vậy các sai số chuẩn (Standard error) của 1 ,  2 là
n

 

 

Se 1  Var 1 

X

i 1

n

 

 



n X i  X
i 1

Se  2  Var  2 

2
i



2

2

2

 X
n

i 1


i  X



2

Trở lại ví dụ 2.2.1, ta có
n

2

U i  1.950036738 ,  2 
i 1

 

Var  2 

1.950036738
 0.243754592 ,
10 - 2

2

 X
n

i 1


i

X



2



 X
n

i 1

i  X



2

 136.1

0.243754592
 0.001790996
136.1

10



n

 

Var 1 

X
i 1

n

2
i



n X i  X
i 1



2

 2  190.5  0.001790996  0.341184789

Do đó

 

 


Se 1  Var 1 = 0.341184789  0.584110254

 

 

Se  2  Var  2  0.001790996=0.04232 .

2.4 Độ phù hợp của hàm hồi quy mẫu
Hàm SRF được gọi là phù hợp tốt với số liệu mẫu quan sát nếu Yi gần Yi .
Quan sát hai hình vẽ dưới đây, nhận thấy rằng hàm hồi quy mẫu trong Hình 2.4.1 tốt hơn
so với hàm hồi quy mẫu trong Hình 2.4.2.

Hình 2.4.1

Hình 2.4.2

Ký hiệu
n














TSS   Yi  Y
i 1
n

ESS   Yi  Y
i 1
n

RSS   Yi  Yi
i 1

2

2

2

(Total sum of squares)

(Explained sum of squares)

(Residual sum of squares)
11


TSS  ESS  RSS


Ta có

Với một mẫu cụ thể và sử dụng phương pháp OLS, TSS là giá trị cố định, nhưng ESS và
RSS có giá trị thay đổi tùy thuộc vào dạng hàm hồi quy.

Ký hiệu
n

R2 

ESS
RSS
 1
 1
TSS
TSS

U

2
i

i 1

 Y  Y 
n

i 1

2


 0  R2  1

i

R 2 được gọi là hệ số xác định (Coefficient of determination) của hàm hồi quy.

Vì 0  R 2  1 nên thường đổi thành tỷ lệ % cho thuận tiện trong phân tích. Chẳng hạn,
khi tính được hệ số xác định bằng 0,8 thì có thể nói rằng mô hình và biến độc lập giải
thích được 80% sự biến động của biến phụ thuộc và 20% là do yếu tố ngẫu nhiên khác
giải thích.
Nhận xét:
 Nếu hàm hồi quy mẫu thích hợp tốt với số liệu quan sát thì ESS càng lớn hơn RSS
( Yi càng gần Yi ), có nghĩa là R 2 càng gần 1.
 Nếu hàm hồi quy mẫu kém thích hợp với số liệu quan sát thì ESS càng nhỏ hơn
RSS ( Yi càng xa Yi ), có nghĩa là R 2 càng gần 0.
 Nếu R 2  1 , tức là RSS=0  Yi  Yi , i thì đường hồi quy thích hợp hoàn hảo,
biến độc lập giải thích toàn bộ cho biến phụ thuộc, không còn yếu tố ngẫu nhiên.

12


 Nếu R 2  0 , tức là RSS=TSS  Yi  Y , i thì SRP không thích hợp, biến độc lập
không giải thích được cho biến phụ thuộc.
 Trong thực tế rất hiếm khi R 2  1 hay R 2  0 mà chỉ có R 2 gần 0 hay gần 1.
 Theo kinh nghiệm, với số liệu chuỗi thời gian thì R 2  0,9 được xem là tốt, với số
liệu chéo thì R 2  0,7 được xem là tốt. Để xem xét một mô hình tốt hay không ta
không nên chỉ căn cứ vào R 2 mà còn dựa trên các yếu tố khác như: dấu của hệ số
hồi quy, kinh nghiệm thực tế, khả năng dự báo chính xác,…
 Đối với hai mô hình hồi quy tuyến tính hai biến, mô hình nào có hệ số xác định

lớn hơn sẽ được coi là tốt hơn.
Xét ví dụ 2.2.1, ta có
n

U

2
i

 1.950036738 ,

i 1

 Y  Y 
n

i 1

i

2

 63.6

Như vậy
n

R2 

ESS

RSS
 1
 1
TSS
TSS

U

2
i

i 1

 Y  Y 
n

i 1

2

 1

1.950036738
 0.969339
63.6

i

Vì chuỗi số liệu thời gian đang xét có R2  0.969339  0.9 nên mô hình được sử dụng là
tốt.

2.5 Mô hình hồi quy qua gốc tọa độ
Khi 1  0 , mô hình hồi quy tổng thể (2.1.1)
Y  1  2 X  U

trở thành
Y  2 X  U

(2.5.1)

và được gọi là mô hình hồi quy qua gốc tọa độ.
Khi đó, các hàm hồi quy tổng thể, hàm hồi quy mẫu được viết lại như sau:
E (Y | X )  2 X

(2.5.2)
13


Y  2 X

(2.5.3)

Sử dụng phương pháp OLS, ta tính được
n

n

2 

XY
i 1

n

i i

X
i 1

2

 

, Var  2 

i


n

2

X
i 1

, 2 

U

2
i


i 1

2
i

n 1



RSS
n 1

Đối với mô hình hồi quy qua gốc tọa độ, nếu áp dụng công thức tính hệ số xác định
R2  1 

RSS
TSS

thì R 2 hay có thể âm, không có ý nghĩa. Do vậy người ta đưa ra các hệ số mới, chẳng hạn
2

Rth2 ô

 n

  X iYi 
 n i 1 n 
 X i2  Yi 2
i 1


i 1

để thay thế cho R 2 mà vẫn thỏa mãn điều kiện 0  R 2  1.
Thông thường người ta hay sử dụng mô hình hồi quy có hệ số chặn, sau đó kiểm định hệ
số chặn.
Ví dụ 2.5.1: Trong lý thuyết danh mục đầu tư hiện đại, mô hình định giá tài sản vốn
(CAPM-Capital Asset Pricing Model) có dạng mô hình hồi quy tuyến tính qua gốc tọa
độ:

ERi  rf  i  ERm  rf 
Trong đó ERi là suất sinh lợi kỳ vọng của chứng khoán i, ERi là suất sinh lợi của danh
mục đầu tư thị trường, rf là suất sinh lợi của đầu tư không rủi ro,  i là hệ số Beta, công
cụ đo lường rủi ro có tính hệ thống (những rủi ro không thể loại trừ bằng cách đa dạng
hóa danh mục đầu tư).
2.6 Đơn vị đo lƣờng trong phân tích hồi quy
Với mô hình hồi quy tổng thể ban đầu
14


Y  1  2 X  U

có hàm hồi quy mẫu

Y  1   2 X
Khi nhân các biến với hằng số, ta thu được các biến mới
X *  mX X , Y *  mY Y

Xét mô hình mới như sau:

Y *   1*   2* X *  U *

Y *   1*   2* X *
Khi đó

* 
2

mY
 2 , 1*  mY 1 , Y *  mY Y ,  *2  mY2  2
mX

 

Se  2* 

   

 

mY
Se  2 , Se  1*  mY Se 1
mX

Khi cộng các biến với hằng số, ta thu được các biến mới
X   aX  X , Y   aY  Y

Xét mô hình mới:

Y    1   2 X   U 
Y    1   2 X 
Khi đó






    2 , 1  aY   2 aX  1 , Y   aY  Y ,   2   2
2

15


n

     

Se  2  Se  2 , Se  1  




a

2

i 1
n

X

 Xi 




n X i  X
i 1



2

2.7 Hồi quy với phần mềm Eviews
Dưới sự hỗ trợ của phần mềm Eviews, bài toán về mô hình hồi quy được giải quyết một
cách nhanh chóng và gọn nhẹ. Từ ví dụ 2.2.1, sử dụng phần mềm Eviews, ta có bảng sau
đây:
Dependent Variable: CHITIEU
Method: Least Squares
Date:
Time: 08:27
Sample: 1 10
Included observations: 10
Variable

Coefficient

Std. Error

t-Statistic

Prob.


THUNHAP
C

0.673035
1.848641

0.042320
0.584110

15.90340
3.164883

0.0000
0.0133

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.969339
0.965506
0.493715
1.950037
-6.015701
252.9182
0.000000


Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

10.80000
2.658320
1.603140
1.663657
1.536753
2.400147

Chú thích cho bảng kết quả như sau:







Dependent Variable: Biến phụ thuộc Y.
Method: Least Squares: Sử dụng phương pháp bình phương tối thiểu OLS.
Date, Time: Ngày, giờ thực hiện.
Sample: Phạm vi của mẫu quan sát.
Included observations: Tống số quan sát (cỡ mẫu).
Variable: Danh sách các biến độc lập trong mô hình hồi quy, trong đó C chính là
hệ số 1 .


 Coefficient: Các ước lượng hệ số của mô hình (  1  1.848641 ,  2  0.673035 ).

 

 

 Std. Error: Sai số chuẩn của  1 và  2 ( Se  1  0.584110 , Se  2  0.042320 ).
 t-Statistic: Giá trị (quan sát) của thống kê T.
16


 Prob.: Giá trị p-value của thống kê T.
 R-squared: Hệ số xác định (hệ số tương quan toàn phần) R 2 ( R2  0.969339 ).
2

2

 Adjusted R-squared: Hệ số xác định đã được hiệu chỉnh R ( R  0.965506 ).
2







S.E. of regression: Sai số tiêu chuẩn của hàm hồi quy (     0.493715 ).
Sum squared resid: Tổng bình phương sai số RSS ( RSS  1.950037 ).
Log likelihood: Logarit cơ số e của hàm hợp lý.

F-statistic: Giá trị thống kê của thống kê F ( F  252.9182 ).
Prob(F-statistic): P( F  F  statistic) .








Mean dependent var: Trung bình của biến phụ thuộc ( Y  10.80000 ).
S.D. dependent var: Độ lệch chuẩn của biến phụ thuộc.
Akaike info criterion: Tiêu chuẩn Akaike.
Schwarz criterion: Tiêu chuẩn Schwarz.
Hannan-Quinn criter.: Tiêu chuẩn Hannan-Quinn.
Durbin-Watson stat: Thống kê Durbin-Watson.

17


Chƣơng 3

MÔ HÌNH HỒI QUY BỘI

Trong thực tế, các mối quan hệ kinh tế thường phức tạp, một biến số kinh tế có thể chịu
sự tác động của nhiều biến số kinh tế khác nhau. Chẳng hạn, khi nghiên cứu nhu cầu về
một loại hàng hóa nào đó thì nhu cầu này phụ thuộc đồng thời vào nhiều yếu tố như thu
nhập của người tiêu dùng, giá bán của hàng hóa đó, thị hiếu người tiêu dùng,… Do đó
cần thiết phải nghiên cứu mô hình hồi quy nhiều hơn hai biến, còn gọi là mô hình hồi quy
bội (multiple regression).

3.1 Mô hình hồi quy bội tuyến tính
Dạng mô hình:
Y  1  2 X 2 

 k X k  U

(3.1.1)

 Y: Biến phụ thuộc


X j , j  2, k : Biến độc lập



 j , j  1, k : Hệ số hồi quy bội

 U : Sai số ngẫu nhiên, đại diện cho các yếu tố khác ngoài X j có tác động đến Y
nhưng không được đưa vào mô hình với lý do chúng ta không có quan sát về nó,
hoặc không muốn đưa nó vào mô hình, hoặc không thể đưa nó vào mô hình.
Các giả thiết cho mô hình (3.1.1):
Giả thiết 1: Mô hình được ước lượng trên mẫu ngẫu nhiên

( X

ji

, Yi ) : i  1, n, j  2, k




Giả thiết 2: Kỳ vọng có điều kiện bằng 0

E (U | X 2i ,..., X ki )  0, i  1, n
Giả thiết 3: Phương sai có điều kiện không đổi

Var(U | X 2i ,..., X ki )   2 , i  1, n

18


Giả thiết 4: Giữa các biến độc lập X j , j  2, k không có mối quan hệ đa cộng tuyến
hoàn hảo, có nghĩa là không tồn tại các hằng số  j , j  2, k không đồng thời bằng không
k

sao cho

 X
j 2

j

j

0 .

Ví dụ 3.1.1: Để xem tác động của các hình thức đầu tư lên GDP, người ta sử dụng hàm
hồi quy bội tuyến tính
GDP  1  2GI  3 PI  4 FDI  5 I  U


với GI, DI, FDI, I lần lượt là đầu tư của khu vực nhà nước, đầu tư từ khu vực tư nhân,
đầu tư trực tiếp từ nước ngoài và tổng đầu tư.
Vì I  GI  PI  FDI  GI  PI  FDI  I  0 nên mô hình này vi phạm Giả thiết 4 do
giữa các biến độc lập GI, DI, FDI, I có quan hệ đa cộng tuyến hoàn hảo.
Với Giả thiết 2 được thỏa mãn thì từ mô hình (3.1.1) ta được
E (Y | X 2 ,..., X k )  1  2 X 2 



1  E Y | X 2 



j 

 k X k

 X k  0  : Hệ số chặn

E Y | X 2 ,..., X k 
, j  2, k : Hệ số hồi quy riêng (partial coefficient), cho biết
X j

khi X j , j  2, k thay đổi một đơn vị, các biến khác cố định thì trung bình của Y
thay đổi  j , j  1, k đơn vị.
Nếu có  j nào đó bằng 0, ta nói biến Y không phụ thuộc vào biến độc lập X j , có nghĩa
là biến X j không giải thích cho Y. Nếu tất cả  j đều bằng 0, ta nói các biến độc lập đều
không giải thích cho biến phụ thuộc Y, và hàm hồi quy trong trường hợp này được gọi là
không phù hợp. Ngược lại, chỉ cần có ít nhất một biến độc lập giải thích cho biến phụ
thuộc Y thì hàm hồi quy được gọi là phù hợp.

Ví dụ 3.1.2: Giả sử ta có mô hình hồi quy bội về lạm phát như sau
LP  0,01  0,2m  0,15gdp  U

Trong đó LP, m, gdp lần lượt là tỷ lệ lạm phát, mức tăng trưởng cung tiền và mức tăng
trưởng GDP (đơn vị %). Khi đó ta có phiên giải từ mô hình trên như sau:
19


 Khi mức tăng trưởng cung tiền và GDP bằng 0 thì mức lạm phát trung bình là
0,01.
 Khi cung tiền tăng (giảm) 1% và mức tăng trưởng GDP không thay đổi thì lạm
phát trung bình sẽ tăng (giảm) 0,2 đơn vị.
 Nếu GDP tăng 1% và cung tiền không thay đổi thì lạm phát trung bình sẽ giảm
0,15 đơn vị.
3.2 Phƣơng pháp ƣớc lƣợng OLS (Ordinary Least Squares)
Xét mô hình hồi quy tổng thể:
Y  1  2 X 2 

 k X k  U

(3.2.1)

Để ước lượng các hệ số 1 ,...,  k ta cần rút ra một mẫu ngẫu nhiên kích thước n từ tổng
thể: ( X 2i , Yki ), i  1, n . Khi đó ta có
Yi  1  2 X 2i 

k X ki  Ui

(3.2.2)


Y i  1   2 X 2i 

  k X ki

(3.2.3)

Ký hiệu phần dư (Residuals):

U i  Yi  Yi

(3.2.4)

Chúng ta muốn xác định 1 ,…,  k sao cho tổng bình phương các phần dư là bé nhất, có
nghĩa là





n

2

n



f 1 ,...,  k  U i   Yi  Yi
i 1


i 1

2

   Y     X
n

i 1

i

1

2

2i

  k X ki



2

 Min

Từ đó có được

  XT X 

1


X Y
T

(3.2.5)

20


với

 1 X 21
1 X
22
X 
... ...

 1 X 2n


 n

 n
X
X T X   i 1 2i

 ...
 n
 X
ki

 i 1

n

 X 3i

i 1

X
i 1

 n


Y
X


i
ki 


i 1
 i 1


n
 n



X 2iYi 
...  X 2i X ki  T


X Y  i 1
i 1


,
...
...
...





n
n
2 

...
X ki
X kiYi 


 i 1
i 1




n

 X 2i
n

 1 
... X k1 
Y1 
 
Y 
... X k 2 
 
,Y   2  ,    2 
... 
... ... 
... 
 

 
... X kn 
Yn 
 k

X 31
X 32
...
X 3n

i 1


n

X

2
2i

i 1

...

2i

X 3i

...

n

n

 X ki X 2i

X

i 1

i 1


ki

n

...

X 3i

Ví dụ 3.2.1: Có số liệu quan sát của 15 cửa hàng khác nhau thuộc cùng một công ty kinh
doanh cùng loại sản phẩm về lượng hàng bán được Y (tấn/tháng), chi phí quảng cáo X 2
(triệu đồng/tháng) và giá bán X 3 (ngàn đồng/kg) như sau:
Yi
X 2i
X 3i

14
5
4

21
9
2.2

20
8
2.4

18
7
2.8


19
8
2.8


 15

 15
T
X X    X 2i
 i 1
 15
  X 3i
 i 1

15

18
8
3

17
6
3.1

17
6
3.3


16
5.7
3.7

15
5.5
3.9

13
4
4.1

12 18,5 19
3
7
8.2
4.3 2.7 2.5

22
9.5
2

Khi đó

 X 2i
i 1
15

X
i 1


15

X
i 1

2i

2
2i

X 3i



i 1
  15
99.9
46.8 
15
 
X 2i X 3i   99.9 713.23 293.64

i 1
  46.8 293.64 153.52 
15

X 32i 

i 1


15

X

3i

21


X X 
T

1

 259.5 
19.87 
 46.06 3.12 8.01




T
  3.12 0.22 0.54  , X Y  1801     0.67 
780.65
 8.01 0.54 1.42 
 2.25

Vậy hàm hồi quy mẫu là


Y i  19.87  0.67 X 2i  2.25 X 3i
Từ đó có nhận xét về ý nghĩa kinh tế của các tham số hồi quy:


1  19.87 : Khi doanh nghiệp không quảng cáo và ngay cả khi bán giá cực thấp
( X 3  0 ) thì lượng hàng bán được tối thiểu bình quân khoảng 19.87 tấn/tháng.



 2  0.67  0 : Nếu giữ nguyên giá bán, khi tăng (giảm) mức quảng cáo một triệu
đồng/tháng thì sản lượng tiêu thụ tăng (giảm) bình quân khoảng 0.67 tấn/tháng.



3  2.25  0 : Nếu giữ nguyên chi phí quảng cáo, khi tăng (giảm) giá bán một
ngàn đồng/kg thì sản lượng hàng bán được giảm (tăng) bình quân khoảng 2.25
tấn/tháng.

Sử dụng phần mềm Eviews, ta có bảng như sau:
Dependent Variable: Y
Method: Least Squares
Date:
Time:
Sample: 1 15
Included observations: 15
Variable

Coefficient

Std. Error


t-Statistic

Prob.

C
X2
X3

19.86862
0.669642
-2.252705

2.694140
0.187374
0.473382

7.374756
3.573835
-4.758751

0.0000
0.0038
0.0005

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

F-statistic
Prob(F-statistic)

0.983684
0.980965
0.396969
1.891008
-5.752028
361.7403
0.000000

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

17.30000
2.877251
1.166937
1.308547
1.165429
1.755206

22


Để đo mức độ dao động và tương quan giữa các hệ số ước lượng được, sử dụng ma trận
hiệp phương sai của hệ số hồi quy dạng tổng quát:


 

 Var 
1


C ov  2 , 1
C ov   

...

C ov  , 
k
1


 







C ov 1 ,  2



 







Var  2
...





C ov  k ,  2




... C ov 1 ,  k 


... C ov  2 ,  k 
1
2XTX 

...
...

...
Var  k 





 

Trong thực tế, thường không biết  2 , do đó thay  2 bởi ước lượng điểm không chệch,
tốt nhất  2 của nó trong các công thức ở trên:
n

2

 

2

U i
i 1

nk



 

RSS
nk

 


Các sai số chuẩn của  j , j  1, k là Se  j  Var  j .
Từ số liệu của Ví dụ 3.2.1, dễ dàng tính được:
n

TSS   Yi 2  nY  11.5
2

i 1

ESS  

T

 X Y   nY
T

2

 9.6

RSS  1.9
2

 

RSS
 1.9 /12  0.16
nk

Ma trận hiệp phương sai của  là:

 7.27 0.5 1.26 
C ov    0.5 0.04 0.08 
 1.26 0.08 0.22 

 

 

 

 

Cũng có Var 1  7.27,Var  2  0.04,Var 3  0.22 .
23


Sử dụng Eviews, ta được
C
7.25838
-0.49728
-1.26153

C
X2
X3

X2
-0.49728
0.03510
0.08444


X3
-1.26153
0.08444
0.22409

Định lý Gauss-Markov: Khi các giả thiết 1-4 được thỏa mãn thì các ước lượng thu được
từ phương pháp OLS là các ước lượng tuyến tính, không chệch và có phương sai nhỏ
nhất trong lớp các ước lượng tuyến tính không chệch (tính chất BLUE-Best Linear
Unbiased Estimator).
3.3 Độ phù hợp của hàm hồi quy mẫu
Tương tự như hồi quy hai biến, ta có định nghĩa các tổng bình phương độ lệch và hệ số
xác định như sau:
Ký hiệu
n













TSS   Yi  Y
i 1

n

ESS   Yi  Y
i 1

n

RSS   Yi  Yi
i 1

Ta có

2

n

  Yi 2  nY  Y T Y  nY
2

2

i 1

2

2



T


 X Y   nY
T

 Y TY  

2

X Y

T

T

TSS  ESS  RSS

Hệ số xác định của hàm hồi quy bội cũng được định nghĩa là:

ESS
RSS
R 
 1

TSS
TSS
2



T


 X Y   nY
T

Y T Y  nY

2

2

 0  R2  1

Chú ý rằng hệ số xác định trong mô hình hồi quy tuyến tính k biến là một hàm tăng theo
số biến độc lập. Thật vậy, TSS không phụ thuộc vào số biến độc lập trong mô hình với
bậc tự do là (n-1), RSS là hàm giảm theo số biến độc lập trong mô hình với bậc tự do là
24


(n-k), do đó khi số biến độc lập càng tăng thì hệ số xác định càng lớn và mô hình sẽ phức
tạp hơn, khó phân tích hơn. Ngoài ra, khi số biến độc lập tăng lên sẽ làm tăng mối tương
quan giữa các biến độc lập, đồng thời làm giảm bậc tự do của ESS, RSS. Do vậy cần cân
nhắc cẩn thận trước khi thêm biến độc lập vào mô hình.
Với những chú ý trên, người ta điều chỉnh hệ số xác định bằng cách đưa thêm bậc tự do
2

của các tổng bình phương vào công thức để được hệ số xác định hiệu chỉnh R (Adjustted
R-Squared) sau đây:

RSS
n 1

1 k
R  1  n  k  1  1  R 2 
 R 2  1  R 2 
TSS
nk
nk
n 1
2

2

Người ta sử dụng R để xem xét có nên đưa thêm biến độc lập vào mô hình hay không.
2

Việc đưa thêm biến độc lập vào mô hình là cần thiết khi trị số của R trong mô hình mới
tăng lên, đồng thời hệ số hồi quy của biến độc lập đưa vào khác 0 và có ý nghĩa thống kê.
Trở lại Ví dụ 3.2.1, sử dụng phần mềm Eviews để kiểm tra sự thay đổi của hệ số xác định
trong hai trường hợp: (a) Lượng hàng bán được Y (tấn/tháng) chỉ phụ thuộc vào giá bán
(ngàn đồng/kg) X 3 (triệu đồng/tháng), (b) Lượng hàng bán được Y (tấn/tháng) phụ thuộc
vào cả chi phí quảng cáo X 2 (triệu đồng/tháng) và giá bán X 3 (ngàn đồng/kg):
Dependent Variable: Y
Method: Least Squares
Date:
Time:
Sample: 1 15
Included observations: 15
Variable

Coefficient


Std. Error

t-Statistic

Prob.

X3
C

-3.863273
29.35341

0.200042
0.639968

-19.31231
45.86703

0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.966318

0.963727
0.547984
3.903718
-11.18817
372.9654
0.000000

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

17.30000
2.877251
1.758423
1.852830
1.757417
1.411550

Trường hợp (a)

25


×