Tải bản đầy đủ (.pdf) (14 trang)

KINH TẾ LƯỢNG - THỐNG KÊ MÔ TẢ - 3 potx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (348.53 KB, 14 trang )



28
(1)
()
0e2X
ˆˆ
Y2
ˆ
e
n
1i
i
n
1i
i21i
1
n
1i
2
i
=−=β−β−−=
β∂







∑∑



==
=
(3.7)
(2)

()
0Xe2XX
ˆˆ
Y2
ˆ
e
n
1i
iii
n
1i
i21i
2
n
1i
2
i
=−=β−β−−=
β∂








∑∑

==
=
(3.8)
Từ (3.7) và (3.8) chúng ta rút ra
∑∑
β+β=
i21i
X
ˆˆ
nY (3.9)
∑∑∑
β+β=
2
i2i1ii
X
ˆ
X
ˆ
XY
(3.10)
Các phương trình (3.9) và (3.10) được gọi là các phương trình chuẩn. Giải hệ phương trình chuẩn ta
được
X
ˆ
Y
ˆ

21
β−=β (3.11)
Thay (3.9) vào (3.8) và biến đổi đại số chúng ta có
()()
()


=
=

−−

n
1i
2
i
n
1i
ii
2
XX
XXYY
ˆ
(3.12)
Đặt
XXx
ii
−= và YYy
ii
−= ta nhận được



=
=

n
1i
2
i
n
1i
ii
2
x
xy
ˆ
(3.13)
3.3.3.Tính chất của hàm hồi quy mẫu theo OLS
Tính chất của tham số ước lượng
(1)
1
ˆ
β và
2
ˆ
β là duy nhất ứng với một mẫu xác định gồm n quan sát (Xi,Yi).
(2)

1
ˆ

β và
2
ˆ
β là các ước lượng điểm của 
1
và 
2
. Giá trị của
1
ˆ
β và
2
ˆ
β thay đổi theo mẫu dùng để
ước lượng.
Tính chất của hàm hồi quy mẫu
12

(1) Hàm hồi quy mẫu đi qua giá trị trung bình của dữ liệu
Thật vậy, từ (3.11) ta có X
ˆˆ
Y
21
β−β=

12
Phần chứng minh các tính chất ở phần này có thể tìm đọc ở Gujarati, Basic Econometrics,3
rd
Edition, p56-59.



29
0
50
100
150
200
250
300
350
400
450
500
0 100 200 300 400 500 600 700 800 900
Tiêu dùng, Y (XD)
(SRF): Y
i
=
β
1
+
β
2
X
i
Y
X
Y
(SRF): Y
i

= β
1
+ β
2
X
i
(SRF): Y
i
= β
1
+ β
2
X
i

Thu nhập X (XD)
Hình 3.4. Đường hồi quy mẫu đi qua giá trị trung bình của dữ liệu
(2) Giá trị trung bình của ước lượng bằng giá trị trung bình của quan sát đối với biến phụ
thuộc:
(
)
YY
ˆ
E = .
(3)
Giá trị trung bình của phần dư bằng 0:
(
)
0eE
i

=

(4)
Các phần dư e
i
và Y
i
không tương quan với nhau:

=
=
n
1i
ii
0Ye
(5)
Các phần dư e
i
và X
i
không tương quan với nhau:

=
=
n
1i
ii
0Xe

3.3.4.Phân phối của

1
ˆ
β

2
ˆ
β
13

Ước lượng
1
ˆ
β
2
ˆ
β
Kỳ vọng
(
)
11
ˆ
E β=β
(
)
22
ˆ
E β=β
Phương sai
()
2

n
1i
2
i
n
1i
2
i
1
xn
X
ˆ
var σ=β


=
=
()

=
σ

n
1i
2
i
2
2
x
ˆ

var
Sai số chuẩn
σ=σ


=
=
β
n
1i
2
i
n
1i
2
i
ˆ
xn
X
1

=
β
σ

n
1i
2
i
ˆ

x
2

Phân phối












σββ


=
=
2
n
1i
2
i
n
1i
2
i

11
xn
X
,N~
ˆ












σ
ββ

=
n
1i
2
i
2
22
x
,N~
ˆ


Hiệp phương sai của hai hệ số ước lượng

13
Có thể tính toán chứng minh các biểu thức này dựa vào các định nghĩa và định lý về kỳ vọng và phương sai. Tham khảoVũ Thiếu và đồng
sự, Kinh tế lượng, PL chương 2, trang 61.


30
() ()












σ
−=β−=ββ

=
n
1i
2
i

2
22
x
X
ˆ
varX
ˆ
,
ˆ
cov

Trong các biểu thức trên
()
i
2
var ε=σ với giả định ),0(N~
2
i
σε
3.4.Khoảng tin cậy và kiểm định giả thiết về các hệ số hồi quy
3.4.1. Khoảng tin cậy cho các hệ số hồi quy
Thực sự chúng ta không biết
2
σ
nên ta dùng ước lượng không chệch của nó là
2n
e
ˆ
n
1i

2
i
2



=

Sai số chuẩn của hệ số hồi quy cho độ dốc

=
σ

n
1i
2
i
2
x
ˆ
)(se

Từ
(
)
2
ˆ
22
2
,N~

ˆ
β
σββ với

=
β
σ

n
1i
2
i
2
ˆ
x
2
ta có
)1,0(N~
ˆ
Z
2
22
β
σ
β−β
= (3.14)
Từ tính chất của phương sai mẫu ta có
2
2
2

)2n(
~
ˆ
)2n(

χ
σ
σ
− (3.15)
Từ (3.14) và (3.15) Ta xây dựng trị thống kê
)2n(
2
2n
2
2
22
t~
2n
Z
~
2n
ˆ
)2n(
ˆ
2


β

χ


σ
σ

σ
β−β
(3.16)
Biến đổi vế trái chúng ta được
)
ˆ
(se
ˆ
x
*
ˆ
ˆ
ˆ
ˆ
2n
ˆ
)2n(
ˆ
2
22
n
1i
2
i
2
2

2
22
2
2
2
22
2
2
22
2
2
β
β−β
=
σ
σ
σ
β−β
=
σ
σ
σ
β−β
=

σ
σ

σ
β−β


=
β
β



Thay vào (3.16) ta được
)2n(
2
22
t~
)
ˆ
(se
ˆ

β
β−β
(3.17)
Chứng minh tương tự ta có
)2n(
1
11
t~
)
ˆ
(se
ˆ


β
β−β
(3.18)
Ước lượng khoảng cho hệ số hồi quy với mức ý nghĩa  như sau
)
ˆ
(set
ˆ
)
ˆ
(set
ˆ
1)2/1,2n(111)2/1,2n(1
β+β≤β≤β−β
α−−α−−
(3.19)


31
)
ˆ
(set
ˆ
)
ˆ
(set
ˆ
2)2/1,2n(222)2/1,2n(2
β+β≤β≤β−β
α−−α−−

(3.20)
3.4.2. Kiểm định giả thiết về hệ số hồi quy
Chúng ta quan tâm nhiều đến ý nghĩa thống kê độ dốc (
2
) của phương trình hồi quy hơn là tung độ
gốc (
1
). Cho nên từ đây đến cuối chương chủ yếu chúng ta kiểm định giả thiết thống kê về độ dốc.
Giả thiết
*
21
*
20
2
2
:H
:H
β≠β
β=β

Phát biểu mệnh đề xác suất
α−=










β
β−β

α−−α−
1t
)
ˆ
(se
ˆ
tP
)2/1,2n(
2
22
)2/,2n(

Quy tắc quyết định
¾ Nếu
)2/,2n(
2
*
22
t
)
ˆ
(se
ˆ
α−
<
β

β−β
hoặc
)2/1,2n(
2
*
22
t
)
ˆ
(se
ˆ
α−−
>
β
β−β
thì bác bỏ H
0
.
¾ Nếu
)2/1,2n(
2
*
22
)2/,2n(
t
)
ˆ
(se
ˆ
t

α−−α−

β
β−β
≤ thì ta không thể bác bỏ H
0
.
Quy tắc thực hành-Trị thống kê t trong các phần mềm kinh tế lượng
Trong thực tế chúng ta thường xét xem biến độc lập X có tác động lên biến phụ thuộc Y hay không.
Vậy khi thực hiện hồi quy chúng ta kỳ vọng

β
2
0. Mức ý nghĩa hay được dùng trong phân tích hồi quy
là =5%.
Giả thiết
0:H
0:H
21
20
≠β


Trị thống kê trở thành
t-stat =
)
ˆ
(se
ˆ
2

2
β
β

Quy tắc quyết định
¾ Nếu /t-stat/ > t
(n-2,97,5%)
thì bác bỏ H
0
.
¾ Nếu /t-stat/ ≤ t
(n-2,97,5%)
thì không thể bác bỏ H
0.

Tra bảng phân phối Student chúng ta thấy khi bậc tự do n trên 20 thì trị thống kê
t
97,5%
thì xấp xỉ 2.
Quy tắc thực hành
¾
Nếu /t-stat/ > 2 thì bác bỏ giả thiết 
2
= 0.
¾ Nếu /t-stat/≤ 2 thì ta không thể bác bỏ giả thiết 
2
=0.
Trong các phần mềm bảng tính có tính toán hồi quy, người ta mặc định mức ý nghĩa =5% và giả thiết
H
0

: 
i
=0. Thủ tục tính toán hồi quy của Excel cung cấp cho ta các hệ số hồi quy, trị thống kê t, ước lượng
khoảng của hệ số hồi quy và giá trị p
14
.Sau đây là kết quả hồi quy được tính toán bằng thủ tục hồi quy của
một vài phần mềm thông dụng.
Excel
Kết quả Regresstion cho dữ liệu của ví dụ 3.1. (Chỉ trích phần hệ số hồi quy)
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 92,24091128 33,61088673 2,744376012 0,010462 23,39205354 161,089769
X 0,611539034 0,067713437 9,031280327 8,68E-10 0,472834189 0,750243878

Intercept: Tung độ gốc
Coefficients : Hệ số hồi quy
Standard Error : Sai số chuẩn của ước lượng hệ số
t Stat : Trị thống kê t
(n-2)
P-value : Giá trị p

14
Ở chương 2 chúng ta đã biết ước kiểm định trên ước lượng khoảng, trị thống kê và giá trị p là tương đương nhau.


32
Lower95%: Giá trị tới hạn dưới của khoảng ước lượng với độ tin cậy 95%.
Upper95% : Giá trị tới hạn trên của khoảng ước lượng với độ tin cậy 95%.
Bác bỏ H
0
khi /t-stat/ > 2 hoặc p-value < 0,05 hoặc khoảng (Lower;Upper) không chứa 0.

15

Eviews
Thủ tục Make Equation cho kết quả như sau(chỉ trích phần hệ số hồi quy):
Dependent Variable: Y
Method: Least Squares
Included observations: 30 after adjusting endpoints
Variable Coefficie
nt
Std.
Error
t-
Statistic
Prob.
C 92.24091 33.6108
9
2.74437
6
0.010
5
X 0.611539 0.06771
3
9.03128
0
0.000
0
C : Tung độ gốc
Coefficient : Hệ số hồi quy
Std. Error : Sai số chuẩn của ước lượng hệ số
t – Statistic : Trị thống kê t

(n-2)
Prob: Giá trị p.Bác bỏ H
0
khi /t-Statistic/ > 2 hoặc Prob < 0,05.
SPSS
Thủ tục Regression->Linear. (Chỉ trích phần hệ số hồi quy).
Unstandardiz
ed
Coefficients
Standardiz
e
d

Coefficien
ts
tSi
g.
Model B Std.
Error
Beta
1 (Const
ant)
92,241 33,611 2,7
44
,0
10
X ,612 ,068 ,863 9,0
31
,0
00

Constant: Tung độ gốc
Unstandardized Coefficients: Các hệ số hồi quy
Standardized Coefficients: Các hệ số hồi quy chuẩn hoá
16
.
t: t-StatSig: Giá trị p.
Bác bỏ H
0
khi /t/ >2 hoặc Sig < 0,05
3.5. Định lý Gauss-Markov
Với các giả định của mô hình hồi quy tuyến tính cổ điển, hàm hồi quy tuyến tính theo phương pháp
bình phương tối thiểu là ước lượng tuyến tính không thiên lệch tốt nhất.
Chúng ta sẽ không chứng minh đinh lý này.
17

3.6. Độ thích hợp của hàm hồi quy – R
2

Làm thế nào chúng ta đo lường mức độ phù hợp của hàm hồi quy tìm được cho dữ liệu mẫu. Thước đo
độ phù hợp của mô hình đối với dữ liệu là R
2
. Để có cái nhìn trực quan về R
2
, chúng ta xem xét đồ thị sau

15
Như đã trình bày ở chương 2, đây thực ra là 3 cách diễn đạt từ một mệnh đề xác suất nên kết luận từ 3 trị thống kê t, p và ước lượng
khoảng là tương đương nhau.
16
Khái niệm này nằm ngoài khuôn khổ của giáo trình.

17
Phần chứng minh các tính chất ở phần này có ở Gujarati, Basic Econometrics-3
rd

Edition, trang 97-98.


33

Hình 3.5. Phân tích độ thích hợp của hồi quy
YY
i
− : biến thiên của biến phụ thuộc Y, đo lường độ lệch của giá trị Yi so với giá trị trung bình .Y
YY
ˆ
i
− : biến thiên của Y được giải thích bởi hàm hồi quy
iii
Y
ˆ
Ye −= : biến thiên của Y không giải thích được bởi hàm hồi quy hay sai số hồi quy.
Trên mỗi Xi chúng ta kỳ vọng e
i
nhỏ nhất, hay phần lớn biến thiên của biến phụ thuộc được giải thích
bởi biến độc lập. Nhưng một hàm hồi quy tốt phải có tính chất mang tính tổng quát hơn. Trong hồi quy
tuyến tính cổ điển, người ta chọn tính chất tổng bình phương biến thiên không giải thích được là nhỏ nhất.
Ta có
iii
ii
ii

ey
ˆ
y
eYY
ˆ
YY
eY
ˆ
Y
+=
+−=−
+=

Với
YYy
ii
−= và YY
ˆ
y
ˆ
i
−=
Vậy
∑∑∑∑
====
++=
n
1i
ii
n

1i
2
i
n
1i
2
i
n
1i
2
i
ey
ˆ
2ey
ˆ
y (3.21)
Số hạng cuối cùng của (3.21) bằng 0.
Vậy
∑∑∑
===
+=
n
1i
2
i
n
1i
2
i
n

1i
2
i
ey
ˆ
y

Đặt

=
=
n
1i
2
i
yTSS ,

=
=
n
1i
2
i
y
ˆ
ESS và

=
=
n

1i
2
i
eRSS
TSS(Total Sum of Squares): Tổng bình phương biến thiên của Y.
ESS(Explained Sum of Squares): Tổng bình phương phần biến thiên giải thích được bằng hàm hồi quy
của Y.
RSS(Residual Sum of Squares) : Tổng bình phương phần biến thiên không giải thích được bằng hàm
hồi quy của Y hay tổng bình phương phần dư.Ta có:
TSS = ESS + RSS
Đặt
TSS
RSS
1
TSS
ESS
R
2
−==
Y
Y
i
Y
i
X
i

Yi
Yi
-

Yi
Yi - Y
X
Y
SRF


34
2
y
2
x
2
2
n
1i
2
i
n
1i
2
i
2
2
n
1i
2
i
n
1i

2
i
2
2
n
1i
2
i
n
1i
2
i
2
S
S
ˆ
1n
y
1n
x
ˆ
y
x
ˆ
y
y
ˆ
R β=



























β=
β
==







=
=
=
=
=
=

Mặt khác ta có


=
=

n
1i
2
i
n
1i
ii
2
x
xy
ˆ
Vậy
2
Y,X

n
1i
2
i
n
1i
2
i
2
n
1i
ii
2
r
yx
yx
R =






=
∑∑

==
=
(3.22)


Vậy đối với hồi quy hai biến R
2
là bình phương của hệ số tương quan.
Tính chất của R
2

(1) 0≤ R
2
≤1. Với R
2
=0 thể hiện X và Y độc lập thống kê. R
2
=1 thể hiện X và Y phụ thuộc tuyến tính
hoàn hảo.
(2)
R
2
không xét đến quan hệ nhân quả.
3.7. Dự báo bằng mô hình hồi quy hai biến
Dựa trên X
0
xác định chúng ta dự báo Y
0.

Ước lượng điểm cho Y
0
là :
0210
X
ˆˆ

Y
ˆ
β+β= .
Để ước lượng khoảng chúng ta phải tìm phân phối xác suất của
i
Y
ˆ
.
Dự báo giá trị trung bình
()
0o
XXYE =
Từ
0210
X
ˆˆ
Y
ˆ
β+β=
Suy ra
(
)
(
)
(
)
(
)
(
)

2102
2
010210
ˆ
,
ˆ
covX2
ˆ
varX
ˆ
varX
ˆˆ
varY
ˆ
var ββ+β+β=β+β=

(3.23)
Thay biểu thức của
(
)
1
ˆ
var β
,
(
)
2
ˆ
var β


(
)
21
ˆ
,
ˆ
cov ββ ở mục 3.3.4 vào (3.23) và rút gọn
()













+σ=

=
n
1i
2
i
2
0

2
0
x
)XX(
n
1
Y
ˆ
var

Dự báo giá trị cụ thể của Y
0

Từ
(
)
(
)
0021100
eX
ˆˆ
Y
ˆ
Y +β−β+β−β=−
Ta có
(
)
(
)
(

)
(
)
0eE
ˆ
EX
ˆ
EY
ˆ
YE
0201100
=+β−β+β−β=−


(
)
(
)
(
)
(
)
(
)
02102
2
0100
evar
ˆ
,

ˆ
covX2
ˆ
varX
ˆ
varY
ˆ
Yvar +ββ+β+β=− (3.25)
Số hạng cuối cùng
(
)
2
0
evar σ= . Vậy
()













++σ=−


=
n
1i
2
i
2
0
2
00
x
)XX(
n
1
1Y
ˆ
Yvar
(3.26)

Sai số chuẩn của dự báo


35
Cho giá trị của Y
0

()
2
1
n
1i

2
i
2
0
0
x
)XX(
n
1
1Y
ˆ
se













++σ=

=

Khoảng tin cậy cho dự báo

)Y
ˆ
(setY
ˆ
o)2/1,2n(o α−−
±
Nhận xét: X
0
càng lệch ra khỏi giá trị trung bình thì dự sai số của dự báo càng lớn. Chúng ta sẽ
thấy rõ điều này qua đồ thị sau.






0
100
200
300
400
500
600
700
800
0 100 200 300 400 500 600 700 800 900
Thu nhập khả dụng, X (XD)
Tiêu dùng, Y (XD)

Hình 3.6. Ước lượng khoảng cho Y

0
.
3.8. Ý nghĩa của hồi quy tuyến tính và một số dạng hàm thường được sử dụng
3.8.1. Tuyến tính trong tham số
Trong mục 3.2.1 chúng ta đã đặt yêu cầu là để ước lượng theo phương pháp bình phương tối thiểu thì
mô hình hồi quy phải tuyến tính. Sử dụng tính chất hàm tuyến tính của các phân phối chuẩn cũng là phân
phối chuẩn, dựa vào các giả định chặt chẽ và phương pháp bình phương tối thiểu, người ta rút ra các hàm
ước lượng tham số hiệu quả và các trị thống kê kiểm định.
Hồi quy tuyến tính chỉ yêu cầu tuyến tính trong các tham số
, không yêu cầu tuyến tính trong biến số.
Mô hình
ε+β+β=
X
1
Y
21
(3.27)
là mô hình tuyến tính trong các tham số nhưng phi tuyến theo biến số.
Mô hình
X)1(Y
2
11
β−+β=
(3.28)
là mô hình phi tuyến trong các tham số nhưng tuyến tính trong biến số.
X trung bình
Ước lượng khoảng cho Y
0

bì h

Ước lượng khoảng cho
Y
Y trung bình


3
6
Hồi quy tuyến tính theo OLS chấp nhận dạng mô hình tuyến tính trong tham số như (3.27) mà không
chấp nhận dạng mô hình phi tuyến trong tham số như (3.28).

3.8.2. Một số mô hình thông dụng
Mô hình Logarit kép
Mô hình logarit kép phù hợp với dữ liệu ở nhiều lĩnh vực khác nhau. Ví dụ đường cầu với độ co dãn
không đổi hoặc hàm sản xuất Cobb-Douglas.
Mô hình đường cầu :
ε
β
β= eXY
2
1
(3.29)
Không thể ước lượng mô hình (3.29) theo OLS vì nó phi tuyến trong tham số. Tuy nhiên nếu chúng ta
lấy logarit hai vế thì ta được mô hình
ε+β+β= X)ln()Yln(
21
(3.30)
Đặt )Yln(Y
*
= và )ln(
1

*
1
β=β ta được mô hình
ε+β+β= XY
2
*
1
*
(3.31)
Mô hình này tuyến tính theo tham số nên có thể ước lượng theo OLS.
Chúng ta sẽ chứng minh đặc tính đáng lưu ý của mô hình này là độ co dãn cầu theo giá không đổi.
Định nghĩa độ co dãn:
Y
X
X
Y
X
X
Y
Y
D



=



Lấy vi phân hai vế của (3.30) ta có
X

X
Y
Y
2

β=

=>
2D
Y
X
X
Y
β=




Vậy độ co dãn của cầu theo giá không đổi.

Hình 3.8. Chuyển dạng Log-log
Tổng quát, đối với mô hình logarit kép, hệ số ứng với ln của một biến số độc lập là độ co dãn của biến
phụ thuộc vào biến độc lập đó.
Mô hình Logarit-tuyến tính hay mô hình tăng trưởng
Gọi g là tốc độ tăng trưởng, t chỉ thời kỳ. Mô hình tăng trưởng như sau
0
t
t
Y)g1(Y += (3.32)
Lấy logarit hai vế của (3.32)

)Yln()g1ln(t)Yln(
0t
++= (3.33)
Đặt
)Yln(Y
t
*
t
=
, )Yln(
01
=β và )g1ln(
2
+
=
β ta được mô hình hồi quy
ε+β+β= tY
21
*
t
(3.34)
Mô hình tuyến tính-Logarit (Lin-log)
ε+β+β= )Xln(Y
21
(3.35)

Mô hình này phù hợp với quan hệ thu nhập và tiêu dùng của một hàng hoá thông thường với Y là chi
tiêu cho hàng hoá đó và X là thu nhập. Quan hệ này cho thấy Y tăng theo X nhưng tốc độ tăng chậm dần.
0 X 0
l(X)

Y Y = β
1
X
β
2
ln(Y) ln(Y)


3
7

Hình 3.9. Chuyển dạng Lin-log
Mô hình nghịch đảo hay mô hình Hyperbol
ε+β+β=
X
1
Y
21
(3.36)
Mô hình này phù hợp cho nghiên cứu đường chi phí đơn vị, đường tiêu dùng theo thu nhập Engel hoặc
đường cong Philip.

Hình 3.10. Dạng hàm nghịch đảo
Phụ lục 3.1.PL Số liệu về thu nhập và tiêu dùng, XD.
Thu nhập khả
dụng
Tiêu dùng
STT
X Y
1 173 194

2 361 363
3 355 353
4 366 306
5 581 557
6 382 302
7 633 497
8 406 268
9 375 364
10 267 283
11 783 416
12 515 521
13 705 407
14 493 304
15 367 318
16 159 116
17 492 427
0 X 0
l(X)
Y Y Y =
β
1

XX
YY
β1>0 β2 >0 β1>0 β2<0
Đư
ờng chi phí đ
ơnv
ị Đ
ư

ờng ti
êu dùng


38
18 827 499
19 111 158
20 452 333
21 688 600
22 327 320
23 647 547
24 687 518
25 443 378
26 657 633
27 105 134
28 484 269
29 653 564
30 141 155


CHƯƠNG 4
MÔ HÌNH HỒI QUY TUYẾN TÍNH BỘI
4.1. Xây dựng mô hình
4.1.1. Giới thiệu
Mô hình hồi quy hai biến mà chúng ta đã nghiên cứu ở chương 3 thường không đủ khả năng giải thích
hành vi của biến phụ thuộc. Ở chương 3 chúng ta nói tiêu dùng phụ thuộc vào thu nhập khả dụng, tuy
nhiên có nhiều yếu tố khác cũng tác động lên tiêu dùng, ví dụ độ tuổi, mức độ lạc quan vào nền kinh tế,
nghề nghiệp… Vì thế chúng ta cần bổ sung thêm biến giải thích(biến độc lập) vào mô hình hồi quy. Mô
hình với một bi
ến phụ thuộc với hai hoặc nhiều biến độc lập được gọi là hồi quy bội.

Chúng ta chỉ xem xét hồi quy tuyến tính bội với mô hình tuyến tính với trong tham số, không nhất
thiết tuyến tính trong biến số.
Mô hình hồi quy bội cho tổng thể
ii,kki,33i,221i
X XXY
ε
+β++β+β+β= (4.1)
Với X
2,i
, X
3,i
,…,X
k,i
là giá trị các biến độc lập ứng với quan sát i






…
k
là các tham số của hồi quy

i
là sai số của hồi quy
Với một quan sát i, chúng ta xác định giá trị kỳ vọng của Yi
[]
i,kk
i,

33i,221
X XXs'XYE β++β+β+β= (4.2)
4.1.2. Ý nghĩa của tham số
Các hệ số  được gọi là các hệ số hồi quy riêng
[
]
m
m
X
sX'Y
β=


(4.3)

k
đo lường tác động riêng phần của biến X
m
lên Y với điều kiện các biến số khác trong mô hình
không đổi. Cụ thể hơn nếu các biến khác trong mô hình không đổi, giá trị kỳ vọng của Y sẽ tăng 
m
đơn
vị nếu X
m
tăng 1 đơn vị.
4.1.3. Giả định của mô hình
Sử dụng các giả định của mô hình hồi quy hai biến, chúng ta bổ sung thêm giả định sau:
(1)
Các biến độc lập của mô hình không có sự phụ thuộc tuyến tính hoàn hảo, nghĩa là không thể tìm
được bộ số thực (





k
) sao cho
0X XX
i,kk
i,
33i,221
=λ++λ+λ+λ với mọi i.
Giả định này còn được được phát biểu là “ không có sự đa cộng tuyến hoàn hảo trong mô hình”.
(2)
Số quan sát n phải lớn hơn số tham số cần ước lượng k.
(3)
Biến độc lập X
i
phải có sự biến thiên từ quan sát này qua quan sát khác hay Var(X
i
)>0.
4.2. Ước lượng tham số của mô hình hồi quy bội


39
4.2.1. Hàm hồi quy mẫu và ước lượng tham số theo phương pháp bình phương tối thiểu
Trong thực tế chúng ta thường chỉ có dữ liệu từ mẫu. Từ số liệu mẫu chúng ta ước lượng hồi quy tổng
thể.
Hàm hồi quy mẫu
ii,kk
i,

33i,221i
eX
ˆ
X
ˆ
X
ˆˆ
Y +β++β+β+β= (4.4)
i,kki,33i,221iiii
X
ˆ
X
ˆ
X
ˆˆ
YY
ˆ
Ye β−−β−β−β−=−=

Với các
m
ˆ
β
là ước lượng của tham số 
m
. Chúng ta trông đợi
m
ˆ
β
là ước lượng không chệch của 

m
,
hơn nữa phải là một ước lượng hiệu quả. Với một số giả định chặt chẽ như ở mục 3.3.1 chương 3 và phần
bổ sung ở 4.1, thì phương pháp tối thiểu tổng bình phương phần dư cho kết quả ước lượng hiệu quả 
m.

Phương pháp bình phương tối thiểu
Chọn 



…
k
sao cho
()
2
n
1i
i,kki,33i,221i
n
1i
2
i
X
ˆ
X
ˆ
X
ˆˆ
Ye

∑∑
==
β−−β−β−β−= (4.5)
đạt cực tiểu.







Điều kiện cực trị của (4.5)
()
()
()
0XX
ˆ
X
ˆ
X
ˆˆ
Y2
e

0XX
ˆ
X
ˆ
X
ˆˆ

Y2
e
0X
ˆ
X
ˆ
X
ˆˆ
Y2
e
i,k
n
1i
i,KKi,33i,221i
k
n
1i
2
i
i,2
n
1i
i,KKi,33i,221i
2
n
1i
2
i
n
1i

i,KKi,33i,221i
1
n
1i
2
i
=β−−β−β−β−−=
β∂

=β−−β−β−β−−=
β∂

=β−−β−β−β−−=
β∂







=
=
=
=
=
=
(4.6)
Hệ phương trình (4.6) được gọi là hệ phương trình chuẩn của hồi quy mẫu (4.4).
Cách giải hệ phương trình (4.4) gọn gàng nhất là dùng ma trận. Do giới hạn của chương trình, bài

giảng này không trình bày thuật toán ma trận mà chỉ trình bày kết quả tính toán cho hồi quy bội đơn giản
nhất là hồi quy ba biến với hai biến độc lập. Một số tính chất của hồi quy ta thấy được ở hồi quy hai biến
độc l
ập có thể áp dụng cho hồi quy bội tổng quát.
4.2.2. Ước lượng tham số cho mô hình hồi quy ba biến
Hàm hồi quy tổng thể
ii,33i,221i
XXY ε+β+β+β=
(4.7)
Hàm hồi quy mẫu
ii,33i,221i
eX
ˆ
X
ˆˆ
Y
ˆ
+β+β+β= (4.8)
Nhắc lại các giả định
(1)
Kỳ vọng của sai số hồi quy bằng 0:
(
)
0X,XeE
i,3i,2i
=
(2)
Không tự tương quan:
(
)

0e,ecov
ji
=
, i≠j
(3)
Phương sai đồng nhất:
()
2
i
evar σ=


40
(4) Không có tương quan giữa sai số và từng X
m
:
(
)
(
)
0X,ecovX,ecov
i,3ii,2i
=
=

(5)
Không có sự đa cộng tuyến hoàn hảo giữa X
2
và X
3

.
(6)
Dạng hàm của mô hình được xác định một cách đúng đắn.
Với các giả định này, dùng phương pháp bình phương tối thiểu ta nhận được ước lượng các hệ số như
sau.
33221
X
ˆ
X
ˆ
Y
ˆ
β−β−=β (4.10)
2
n
1i
i,3i,2
n
1i
2
n
1i
2
n
1i
i,3i,2
n
1i
i,3i
n

1i
2
n
1i
i,2i
2
xxxx
xxxyxxy
ˆ
i,3i,2
i,3














































∑∑∑
∑∑∑∑
===
====

(4.11)
2
n
1i
i,3i,2
n
1i
2
n
1i
2
n
1i
i,3i,2
n
1i
i,2i
n
1i
2
n
1i
i,3i
3
xxxx
xxxyxxy
ˆ
i,3i,2
i,2















































∑∑∑
∑∑∑∑
===
====
(4.12)
4.2.3. Phân phối của ước lượng tham số
Trong phần này chúng ta chỉ quan tâm đến phân phối của các hệ số ước lựơng
2
ˆ
β

3
ˆ
β
. Hơn nữa vì
sự tương tự trong công thức xác định các hệ số ước lượng nên chúng ta chỉ khảo sát

2
ˆ
β . Ở đây chỉ trình
bày kết quả
18
.
2
ˆ
β là một ước lượng không chệch :
(
)
22
ˆ
E β=β (4.13)
()
2
2
n
1i
i,3i,2
n
1i
2
i,3
n
1i
2
i,2
n
1i

2
i,3
2
xxxx
x
ˆ
var σ




















∑∑∑

===

=
(4.14)
Nhắc lại hệ số tương quan giữa X
2
và X
3
:












=
∑∑

==
=
n
1i
2
i,3
n
1i

2
i,2
n
1i
i,3i,2
XX
xx
xx
r
32

Đặt
32
XX
r= r
23
biến đổi đại số (4.14) ta được
()
()
2
2
23
n
1i
2
i,2
2
r1x
1
ˆ

var
σ



=
(4.15)


Từ các biểu thức (4.13) và (4.15) chúng ta có thể rút ra một số kết luận như sau:
(1)
Nếu X2 và X3 có tương quan tuyến tính hoàn hảo thì
2
23
r =1. Hệ quả là
(
)
2
ˆ
var
β vô cùng lớn hay
ta không thể xác định được hệ số của mô hình hồi quy.
(2)
Nếu X2 và X3 không tương quan tuyến tính hoàn hảo nhưng có tương quan tuyến tính cao thì
ước lượng
2
ˆ
β
vẫn không chệch nhưng không hiệu quả.
Những nhận định trên đúng cho cả hồi quy nhiều hơn ba biến.

4.3.
2
R và
2
R

hiệu chỉnh

18
Các thao tác chứng minh khá phức tạp, để tự chứng minh độc giả hãy nhớ lại các định
nghĩa và tính chất của giá trị kỳ vọng, phương sai và hiệp phương sai của biến ngẫu nhiên.



41
Nhắc lại khái niệm về
2
R
:
TSS
RSS
1
TSS
ESS
R
2
−==

Một mô hình có
2

R
lớn thì tổng bình phương sai số dự báo nhỏ hay nói cách khác độ phù hợp của mô
hình đối với dữ liệu càng lớn. Tuy nhiên một tính chất đặc trưng quan trọng của là nó có xu hướng tăng
khi số biến giải thích trong mô hình tăng lên. Nếu chỉ đơn thuần chọn tiêu chí là chọn mô hình có
2
R
cao,
người ta có xu hướng đưa rất nhiều biến độc lập vào mô hình trong khi tác động riêng phần của các biến
đưa vào đối với biến phụ thuộc không có ý nghĩa thống kê.
Để hiệu chỉnh phạt việc đưa thêm biến vào mô hình, người ra đưa ra trị thống kê
2
R
hiệu
chỉnh(Adjusted
2
R
)
19

kn
1n
)R1(1R
22


−−=
v
(4.16)
Với n là số quan sát và k là số hệ số cần ước lượng trong mô hình.
Qua thao tác hiệu chỉnh này thì chỉ những biến thực sự làm tăng khả năng giải thích của mô hình mới

xứng đáng được đưa vào mô hình.
4.4. Kiểm định mức ý nghĩa chung của mô hình
Trong hồi quy bội, mô hình được cho là không có sức mạnh giải thích khi toàn bộ các hệ số hồi quy
riêng phần đều bằng không.
Giả thiết
H
0
: 
2
= 
3
=

= 
k
= 0
H
1
: Không phải tất cả các hệ số đồng thời bằng không.

Trị thống kê kiểm định H
0
:
)kn,1k(
F~
k)-(n
SSR
1)-(k
SSE
F

−−
=

Quy tắc quyết định
¾ Nếu F
tt
> F
(k-1,n-k,)
thì bác bỏ H
0
.
¾ Nếu F
tt
≤ F
(k-1,n-k,)
thì không thể bác bỏ H
0
.
4.5.
Quan hệ giữa R
2
và F
)kn(
)R1(
)1k(
R
)R1)(1k(
R)kn(
E1)(1k(
E)kn(

ETSS)(1k(
E)kn(E)kn(
)kn(
RSS
)1k(
E
F
2
2
2
2



=
−−

=
−−

=
−−

=

=


=
SS/TSS)

SS/TSS
SS)
SS
1)RSS-(k
SS
SS

4.6. Ước lượng khoảng và kiểm định giả thiết thống kê cho hệ số hồi quy
Ước lượng phương sai của sai số
kn
e
s
n
1i
2
i
2

=

=
ε
(4.17)
Người ta chứng minh được
2
s
ε
là ước lượng không chệch của 
2
, hay

(
)
22
sE σ=
ε
.
Nếu các sai số tuân theo phân phối chuẩn thì
2
)kn(
2
2
~
s)kn(

ε
χ
σ

.

19
Công thức của Theil, được sử dụng ở đa số các phần mềm kinh tế lượng. Một công thức khác do Goldberger đề xuất là Modified
22
R
n
k
1R







−=
. (Theo Gujarati, Basic Econometrics-3
rd
, trang 208).

×