Chương 4
Mô hình hồi qui bội
1.
Mô hình :
Mô hình hồi qui tuyến tính k biến (PRF) :
E(Y/X
2i
,…,X
ki
) =
β
1
+
β
2
X
2i
+…+
β
k
X
ki
Y
i
=
β
1
+
β
2
X
2i
+ …+
β
k
X
ki
+ U
i
Trong đó :
Y - biến phụ thuộc
X
2
,…,X
k
- các biến độc lập
β
1
là hệ số tự do
β
j
( j=2,…,k) là các hệ số hồi qui riêng, cho biết khi X
j
tăng 1 đvị
thì trung bình của Y sẽ thay đổi
β
j
đvị trong trường hợp các biến
độc lập khác không đổi .
Khi k = 3 thì ta có mô hình hồi qui tuyến tính ba biến :
E(Y/X
2
, X
3
) =
β
1
+
β
2
X
2i
+
β
3
X
3i
(PRF)
Y
i
=
β
1
+
β
2
X
2i
+
β
3
X
3i
+ U
i
2. Các giả thiết của mô hình
Giả thiết 1: Các biến độc lập phi ngẫu nhiên, giá trị được xác
định trước.
Giả thiết 2 : E(U
i
/X
i
) = 0
∀
i
Giả thiết 3 : Var(U
i
/X
i
) =
σ
2
∀
i
Giả thiết 4 : Cov(U
i
, U
j
) = 0 i
≠
j
Giả thiết 5 : Cov(X
i
, U
i
) = 0
∀
i
Giả thiết 6 : U
i
~ N (0,
σ
2)
∀
i
Giả thiết 7 : Không có hiện tượng cộng tuyến giữa các biến độc
lập.
3. Ước lượng các tham số
a. Mô hình hồi qui ba biến :
Y
i
=
β
1
+
β
2
X
2i
+
β
3
X
3i
+ U
i
(PRF)
Hàm hồi qui mẫu :
ii33i221iii
eX
ˆ
X
ˆˆ
eY
ˆ
Y +++=+=
βββ
j
ˆ
β
min
2
→=
∑
i
ef
Giả sử có một mẫu gồm n quan sát các giá
trị (Y
i
, X
2i
, X
3i
). Theo phương pháp OLS,
(j= 1,2,3) phải thoả mãn :
Tức là :
i33i221ii
X
ˆ
X
ˆˆ
Ye
βββ
−−−=
=−−−−
=−−−−
=−−−−
=
∂
∂
⇔=
∂
∂
=
∂
∂
∑
∑
∑
0))(
ˆˆˆ
(2
0))(
ˆˆˆ
(2
0)1)(
ˆˆˆ
(2
0
ˆ
0
ˆ
0
ˆ
333221
233221
33221
3
2
1
iiii
iiii
iii
XXXY
XXXY
XXY
f
f
f
βββ
βββ
βββ
β
β
β
Do
Giải hệ ta có :
33221
3
2
ˆˆˆ
ˆ
ˆ
XXY
βββ
β
β
−−=
−
−
=
−
−
=
∑ ∑ ∑
∑ ∑ ∑ ∑
∑ ∑ ∑
∑ ∑ ∑ ∑
2
3i2i
2
3i
2
2i
i2i3i2i
2
2ii3i
2
3i2i
2
3i
2
2i
i3i3i2i
2
3ii2i
)xx(xx
yxxxxyx
)xx(xx
yxxxxyx
* Phương sai của các hệ số ước lượng
( )
2
3
2
2
2
2
32
1
)
ˆ
(Var
)
ˆ
(Var
XX
n
1
)
ˆ
(Var
σβ
σβ
σβ
×
−
=
×
−
=
×
−
−
+=
∑ ∑ ∑
∑
∑ ∑ ∑
∑
∑ ∑ ∑
∑
2
3i2i
2
3i
2
2i
2
2i
2
3i2i
2
3i
2
2i
2
3i
2
3i2i
2
3i
2
2i
2i3i
)xx(xx
x
)xx(xx
x
)xx(xx
xx
Trong đó : σ
2
= Var(U
i
)
σ
2
chưa biết nên dùng ước lượng của nó là :
3n
e
ˆ
2
i
2
−
=
∑
σ
Với :
i3i2
2
i
2
i
ˆˆ
yESSTSSe yxyx
3i2i
∑∑∑∑
−−=−=
ββ
b. Mô hình hồi qui tuyến tính k biến
Y
i
=
β
1
+
β
2
X
2i
+ …+
β
k
X
ki
+
U
i
(PRF)
Hàm hồi qui mẫu :
Theo phương pháp OLS, (j= 1,2,…,k) phải thoả mãn :
ikiki221iii
eX
ˆ
X
ˆˆ
eY
ˆ
Y ++++=+=
βββ
j
ˆ
β
∑
→= min
2
i
ef
Tức là :
1
0
ˆ
0
ˆ
k
f
f
β
β
∂
=
∂
⇔
∂
=
∂
M
=−−−−−
=−−−−−
∑
∑
0)X)(X
ˆ
X
ˆˆ
Y(2
0)1)(X
ˆ
X
ˆˆ
Y(2
kikiki221i
kiki221i
βββ
βββ
Viết hệ dưới dạng ma trận :
( )
YX
ˆ
XX
TT
=
β
( ) ( )
YXXX
ˆ
T
1
T
−
=⇒
β
=
∑∑∑∑
∑∑∑∑
∑∑∑
2
kii3kii2kiki
kii2i3i2
2
i2i2
kii3i2
T
X XXXXX
XX XXXX
X XXn
XX
=
k
2
1
ˆ
ˆ
ˆ
ˆ
β
β
β
β
=
∑
∑
∑
iki
ii2
i
T
YX
YX
Y
YX
4. Hệ số xác định
* Chú ý : Khi tăng số biến độc lập trong mô hình thì R2 cũng tăng cho
dù các biến độc lập tăng thêm có ảnh hưởng mô hình hay không .
Do đó không thể dùng R2 để quyết định có nên thêm biến vào mô
hình hay không mà thay vào đó có thể sử dụng hệ số xác định hiệu
chỉnh :
2
2
2
1
i
i
e
ESS
R
TSS y
= = −
∑
∑
∑
∑
−
−
−=
)1n/(y
)kn/(e
1R
2
i
2
i
2
Hay:
kn
1n
)R1(1R
22
−
−
−−=
Tính chất của :
-
Khi k > 1, .
-
có thể âm, trong trường hợp âm, ta
coi giá trị của nó bằng 0.
2
R
2
R
1RR
22
≤≤
Biến độc lập đưa vào MH phải thỏa
2 điều kiện:
Biến ĐL đưa vào MH làm hệ số xác định hiệu chỉnh
tăng
.Hệ số hồi qui của biến đưa vào
khác không có ý nghĩa
So sánh hai giá trị R2 :
Nguyên tắc so sánh :
- Cùng mẫu .
- Cùng các biến độc lập.
- Biến p.thuộc phải ở dạng giống nhau. Biến đ.lập có thể ở bất
cứ dạng nào.
Khi đó ta chọn MH có hệ số xác định R2 lớn nhất.
5. Ma trận tương quan
Xét mô hình :
Gọi r
tj
là hệ số tương quan tuyến tính giữa biến thứ t và thứ j. Trong
đó Y được xem là biến thứ 1.
Ma trận tương quan tuyến tính có dạng :
kiki221i
X
ˆ
X
ˆˆ
Y
ˆ
βββ
+++=
1 rr
r 1r
r r1
2k1k
k221
k112
6. Ma trận hiệp phương sai
Để tính ma trận hiệp phương sai của các hệ số, áp dụng công thức :
=
)
ˆ
var( )
ˆ
,
ˆ
cov()
ˆ
,
ˆ
cov(
)
ˆ
,
ˆ
cov( )
ˆ
var()
ˆ
,
ˆ
cov(
)
ˆ
,
ˆ
cov( )
ˆ
,
ˆ
cov()
ˆ
var(
)
ˆ
cov(
k2k1k
k2212
k1211
βββββ
βββββ
βββββ
β
21T
)XX()
ˆ
cov(
σβ
−
=
7. Khoảng tin cậy của các hệ số hồi qui
Khoảng tin cậy của
β
j
(j =1,2, ,k) là :
Trong đó, k là số tham số trong mô hình.
α là múc ý nghĩa, hay độ tin cậy 1-α
/2
( )
ˆ ˆ
( )*
n k
j j
se t
α
β β
−
±
8. Kiểm định giả thiết
a.
Kiểm định H
0
:
β
j
=
β
* ( j = 1, 2, …, k)
Với mức ý nghĩa α ( độ tin cậy 1-α )
Phần này hoàn toàn tương tự như ở mô hình hồi qui hai biến, khác duy nhất ở chỗ
bậc tự do của thống kê t là (n-k).
Nếu F > F
α
(k-1, n-k)
Nếu p(F* > F) <
α
)1)(1(
)(
2
2
−−
−
=
kR
knR
F
b. Kiểm định giả thiết đồng thời :
H
0
: β
2
= β
3
=…= β
k
= 0 ⇔ H
0
: R
2
= 0
H
1
: ∃ β
j
≠ 0 (2 ≤ j ≤ k) ⇔ H
1
: R
2
≠ 0
Cách kiểm định :
-
Tính
⇒ bác bỏ H
0
,
Tức là các hệ số hồi qui không đồng thời
bằng 0 hay hàm hồi qui phù hợp.
9. Dự báo :
a.
Dự báo giá trị trung bình
Cho X
2
0, X
3
0, …, X
k
0. Dự báo E(Y).
-
Dự báo điểm của E(Y) là :
-
Dự báo khoảng của E(Y) : ( mức ý nghĩa α)
0
kk
0
2210
X
ˆ
X
ˆˆ
Y
ˆ
βββ
+++=
)]kn(t)Y
ˆ
(seY
ˆ
;)kn(t)Y
ˆ
(seY
ˆ
[
2/002/00
−+−−
αα
Trong đó :
Var( ) = X0T(XTX)-1X0
σ
2
b. Dự báo giá trị cá biệt của Y khi X=X0.
Trong đó :
0
Y
ˆ
=
0
k
0
2
0
X
X
1
X
)]kn(t)Y
ˆ
Y(seY
ˆ
;)kn(t)Y
ˆ
Y(seY
ˆ
[
2/0002/000
−−+−−−
αα
2
000
)Y
ˆ
(Var)Y
ˆ
Y(Var
σ
+=−
10.Một số dạng hàm:
a) Hàm sản xuất Cobb-Douglas
Y
i
=β
1
X
2i
β2
X
3i
β3
e
Ui
lnY
i
= lnβ
1
+ β
2
lnX
2i
+ β
3
lnX
3i
+ U
i
Hay :lnY
i
= β
o
+ β
2
lnX
2i
+ β
3
lnX
3i
+ U
i
β
2
là hệ số co giãn riêng của Y đối với X
2
,
khi X
3
không đổi.
Tương tự
β
3
là hệ số co giãn riêng của Y đối với X
3
, khi X
2
không
đổi
β
2
+β
3
cho biết hiệu quả của việc tăng qui
mô sản xuất
Nếu β
2
+ β
3
= 1 : tăng qui mô không hiệu
quả
Nếu
β
2
+
β
3
< 1 : tăng qui mô kém hiệu quả
Nếu β
2
+ β
3
> 1 : tăng qui mô có hiệu
quả