Chương IV
Mô hình hồi qui bội
QTKD / ĐHCN tp HCM
Mô hình hồi qui bội (HQ đa biến)
1. Mô hình hồi qui 3 biến
2. Mô hình hồi qui k biến
3. Một số dạng hàm
I.1. Hàm hồi qui tổng thể (PRF) 3 biến
Dạng xác định: E(Y/X2, X3) = β1 + β2 X2 + β3 X3
Dạng ngẫu nhiên: Yi = β1 + β2 X2i + β3 X3i+ ui
β1 – Hệ số tự do (hệ số chặn).
β1 = Y khi X2= X3 = 0. Cần kết hợp thực tế để
giải thích ý nghĩa cho phù hợp.
β2; β3 – Hệ số hồi qui riêng (hệ số góc riêng
phần) là ảnh hưởng riêng của từng biến (X2;
X3) lên Y khi các biến còn lại không đổi
I.2. Hàm hồi qui mẫu (SRF) 3 biến:
Yˆi = βˆ1 + βˆ2 . X 2 i + βˆ3 . X 3i
Yi = βˆ1 + βˆ2 . X 2 i + βˆ3 . X 3i + uˆi
Ví dụ: Hàm hồi qui mẫu như sau:
Yˆi = 3 2 8,1 3 8 3 + 4 , 6 5 X 2 i + 2 , 5 6 X 3 i
Ý nghĩa kinh tế các HSHQ
(1) /Y = β1= 328,1383 = Ymin (khi X2 = X3 = 0). Nghĩa là, khi không
quảng cáo và không chào hàng, doanh số bán hàng bình
quân là 328, 1383 triệu đồng tháng
(2). / β2 = 4,65 > 0
Nếu chi phí chào hàng tăng (giảm) 1 triệu
đồng / tháng, mà các yếu tố khác không đổi, doanh số bán
hàng sẽ tăng (giảm) 4,65 triệu đồng / tháng
(3) / β3 = 2,56 > 0
Nếu chi phí quảng cáo tăng (giảm) 1 triệu
đồng / tháng, mà các yếu tố khác không đổi, doanh số bán
hàng sẽ tăng (giảm) 2, 56 triệu đồng / tháng
I.3. Ước lượng các tham số
1. Phương pháp bình phương nhỏ nhất OLS
2. Công thức
βˆ = Y − βˆ X − βˆ X
1
βˆ 2 =
2
2
3
3
( ∑ y i x 2 i )( ∑ x 32i ) − ( ∑ y i x 3 i )( ∑ x 2 i x 3 i )
( ∑ x 22 i )( ∑ x 32i ) − ( ∑ x 2 i x 3 i ) 2
( ∑ y i x 3 i )( ∑ x ) − ( ∑ y i x 2 i )( ∑ x 2 i x 3 i )
ˆ
β3 =
( ∑ x 22 i )( ∑ x 32i ) − ( ∑ x 2 i x 3 i ) 2
2
2i
T ro n g ñ o ù :
y i = Y i − Y ; x ti = X ti − X t
( t = 2 ; 3)
Sử dụng máy tính
(1). Bước 1: Nhập X2, Y
gian như:
2
2
2
y
=
Y
−
n
(
Y
)
∑ i ∑ i
2
2
2
x
=
X
−
n
(
X
)
∑ 2i ∑ 2i
2
(2). Bước 2: Nhập X3, Y
trung gian như:
∑yx
i
3i
= ∑ Yi X 3i − nYX 3
Tính các đại lượng trung
∑yx
i
2i
= ∑ Yi X 2 i − nYX 2
⇒ YX 2 = β1 + β 2 X
Tính các đại lượng
∑x
2
3i
= ∑ X − n( X 3 )
2
3i
⇒ YX 3 = β1 + β 2 X
(3). Bước 3: Nhập X3, X2
⇒ ∑ x2 i x3i = ∑ X 2 i X 3i − nX 2 X 3
(4). Bước 4: Tính các tham số hồi quy
Phương trình hồi quy
2
Các giả thiết OLS
1. Giá trị trung bình Ui = 0 : E(Ui /X2i ;X3i ) = 0
2. Phương sai các Ui không đổi: Var(Ui) = σ2
3. Không có tự tương quan giữa các Ui
Cov (Ui; Uj ) = 0 ∀ i , j
4. Không có quan hệ tuyến tính rõ ràng giữa 2 biến
giải thích
5. Ui~ N(0,σ2)
I.4. Phương sai các HSHQ
1 X 22 ∑ x32i + X 32 ∑ x 22i − 2 X 2 X 3 ∑ x 2 i x 3i 2
Var ( βˆ1 ) = +
.σ
2
2
2
n
∑ x 2 i ∑ x 3i − ( ∑ x 2 i x 3i )
2
x
∑ 3i
2
Var ( βˆ2 ) =
σ
2
2
2
x
x
(
x
x
)
−
∑ 2 i ∑ 3i ∑ 2 i 3i
Var ( βˆ3 ) =
2
x
∑ 2i
2
2
x
x
∑ 2 i ∑ 3i − ( ∑ x 2 i x 3i )
2
σ
2
Trong do : σ 2 − phuong sai cua Ui nhung chua biet ,
thay bang σˆ 2 =
R SS
n−3
TSS =
∑y
2
i
= ( ∑ Yi ) − n (Y )
2
ESS = βˆ2 ∑ y i x 2 i + βˆ3 ∑ y i x 3i
RSS = TSS − ESS
2
I.5. Hệ số xác định hồi quy bội
e
ESS
∑
R =
= 1−
TSS
∑y
2
i
2
i
2
;
R
2
e
∑
= 1−
∑y
2
i
2
i
/ (n − k )
/ (n − 1)
( R : R coù hieäu chænh − Adjusted R squared )
2
2
n −1
R = 1 − (1 − R )
n−k
2
(k : soá heä soá hoài qui)
2
+ T í n h c h a át : * k > 1 : R
* R 2 l u o ân d ö ô n g
;
2
≤ R
2
≤ 1
R 2 c o ù t h e å a âm
SO SÁN H HÀM
⊕ Phải cùn g cở mẫu (n)
⊕ Nếu cùn g số biến độc lập thì dùn g R
2
Nếu khác số biến độc lập ⇒ phải sử dụn g R
⊕ Biến Y phải cùn g dạn g
⊕ Các biến độc lập có thể khác dạn g
VD: lnYi = β 1 + β 2 X 2 i + β 3i X 3i
khôn g so sán h được với :
Yi = α 1 + α 2 X 2 i + α 3i X 3i
2
Khi nào thêm biến độc lập X k vào mô hình ?
* R 2 t ă n g
* HSHQ (của X k ) ≠ 0 có ý nghóa thốn g kê
(Kiểm đònh HSHQ của biến X )
k
⇒ Biến X k cần thiết đưa vào mô hình
1.6. Khoảng tin cậy các HSHQ
ˆ
ˆ
KTCβ j = βj ± tα/2;(n−3). se(β j )
Ý nghĩa khoảng tin cậy:
Ví dụ: KTC β2=(15;20) với X2: giá vé xe bus (ngàn đồng/vé)
X3: khu vực
Y : Lượng người đi xe bus (tr. người)
Nếu giá vé tăng 1 ngàn đồng/vé, trong
1.7. Kiểm định HSHQ
H0: βj = 0
ˆ
Bước 1: β − β
t0 =
Bước 2
j
ˆ
0
se ( β j )
j = 1; 2; 3
tra bang tα / 2;( n − 3)
Bước 3
* t 0 > tα /2;( n − 3) ⇒ bác bỏ H 0
⇒βj ≠ 0
⇒ X j thực sự cóảnh hưởng đến Yi
* t 0 ≤ tα /2;( n − 3) ⇒ chấp nhận H 0
⇒βj = 0
⇒ X j không cóảnh hưởng đến Yi
Ví dụ C.4
ˆ
* t0 =
β j − β0
ˆ
se(β j )
4,64951
=
= 9,911
0,469148
* t0,025;(9) = 2,262
* Vì t0 > t0,025;(9) ⇒ bác bỏ H 0
⇒ chi phi quảng cáo thực sự có
ảnh hưởng đến doanh số bán hàng
1.8. Kiểm định giả thiết đồng thời
Các bước
* H0 : β2 = β3 = 0 ≈ H0 : R2 = 0
H1 : β2 ≠ 0 hoặc β3 ≠ 0
Ví dụ C.4.1
0,9677(12 − 3)
* F0 =
= 134, 79
2(1 − 0,9677)
R2 (n − 3)
* F0 =
2(1 − R2 )
* Fα (2;n−3)
* Với α = 1% ⇒ F0,01;(2;9) = 8,02
* F0 > Fα (2; n−3) ⇒ bacbo H0
* F0 > F0,01 ⇒ bác bỏ H 0
⇒ các biến Xk (k = 2;3) khôngđồngthời
⇒ chi phí chào hàng ( X 2 ) & chi phí
bằng 0 ⇒ Xk thực sự cóảnhhưởnglên y
(với R 2 = 0,9677)
quảng cáo( X 3 ) đều cóảnh hưởng
* F0 ≤ Fα (2;n−3) ⇒ chấp nhận H0 ⇒ các biến lên doanh số bán
Xk (k = 2;3) cũngbằng 0 ⇒ Xk khôngcóảnh
hưởnglên y
II. 1. Hồi qui tuyến tính k biến
* Yi = β 1 + β 2 X 2 i + β 3 X 3i + ... + β k X ki + U i
* Coù n quan saùt :
Y1 = β 1 + β 2 X 21 + β 3 X 31 + ... + β k X k 1 + U 1
Y2 = β 2 + β 2 X 22 + β 3 X 32 + ... + β k X k 2 + U i 2
...............................................................
Yn = β n + β 2 X 2 n + β 3 X 3 n + ... + β k X kn + U in
Y1
Y2
Y=
...
Yn
β1
U 1
β2
U2
β = U=
...
...
β n
U n
1 X 21 X 31 ... X k 1
1 X 22 X 32 ... X k 2
X =
... ... ... ... ...
1 X 2 n X 3 n ... X kn
Y = β . X +U
2.2 c lng cỏc tham s hi qui
Ta cú:
= ( X T X ) 1 X T Y
n
X 2i
2
X
X
2i 2i
Vụựi X T X =
.....
....
X ki X ki X 2 i
X T : ma traọn X chuyeồn vi
X
X
3i
......
2i
X 3 i ....
....
....
X ki X 3i ....
( X T X ) 1 : ma traọn nghich ủaỷo cuỷa X T X
X
X
ki
2i
X ki
.....
2
X
ki
Ví dụ C.4.2: ước lượng hàm HQ 3 biến
Yi
20
18
19
18
17
17
16
15
13
12
X2i
8
7
8
8
6
6
5
5
4
3
X3i
2
3
4
4
5
5
6
7
8
8
2
Y
∑ i = 2781 ;
2
X
∑ 2i
Ta có
∑ Yi = 165 ;
∑X
2
3i
∑ X 2 i = 60 ;
= 308 ;
∑X
2i
∑ X 3i = 52 ;
X 3 i = 282 ;
−1
∑Y X
i
2i
= 1029 ;
∑Y X
i
3i
= 813
10 60 52
39980 − 3816 − 3256
−1
1
X T X = 60 388 282 =
−
3816
376
300
1528
280
52 282 308
− 3256 300
39980 − 3816 − 32 56 165 29908 / 1528
1
β =
−
3816
376
300
.
1029
=
1164
/
1528
1528
− 3256 300
280 813 − 900 / 1528
14, 99215
ˆ
Hay : β = 0, 76178 ⇒ Yi = 14, 99215 + 0, 76178 X 2 i - 0, 58901 X 3 i
− 0, 58901
2.3 Hệ số xác định hồi qui bội
Hệ số xác định hồi qui bội có thể được tính bằng 1 trong
2 công thức:
ESS
1/ R =
TSS
Trong ñoù : TSS = Y T .Y − n(Y ) 2
2
ˆ
2/R =
2
ˆ
ˆT
ESS = β . X T .Y − n (Y ) 2
ˆ
β 2 ∑ yi x 2 i + β 3 ∑ yi x 3i + ... + β k ∑ yi x ki
2
y
∑ i
2.4. Ma trận tương quan
Xét mô hình HQ bội:
Yi = β 1 + β 2 X 2 i + β 3 X 3 i + ... + β k X ki + U i
Rtj là hệ số tương quan giữa biến thứ t và biến thứ j. Nếu t=1
là hệ số tương quan giữa biến Y và biến Xj
R1 J =
∑yx
∑y ∑x
i
2
i
ij
2
ji
; Rtj =
∑x x
∑x ∑x
ti
ij
2
ti
2
ji
Trong ñoù : x ji = X ji − X j ; Rtj = R jt ; R jj = 1
Ma traän töông quan coù daïn g :
R11
R
R = 21
...
Rk 1
R12 ... R1 k 1 R12 ... R1 k
R22 ... R2 k R21 1 ... R2 k
=
... ... ... ... ... ... ...
Rk 2 ... Rkk Rk 1 Rk 2 ... 1
R1j
2.5 Ma trận hiệp phương sai
Tính Var (βj ) và Cov (βj , βj ) vì chúng có liên quan đến nhiều suy
luận thống kê, ma trận hiệp phương sai của β:
Var ( β 1 ) Cov ( β 1 , β 2 ) ... Cov ( β 1 , β k )
Cov ( β , β ) Var ( β ) Cov ( β , β )
2
1
2
2
k
Cov ( β ) =
... ... ...
...
Cov ( β k , β 1 ) Cov ( β k , β 2 ) Var ( β k )
Cov ( β ) = σ 2 ( X T X ) −1
Trong đó ( X T X ) −1 : ma trận ngh òch đảo của ( X T X )
σ 2 thay bằn g ước lượn g khôn g chệc h của nólà :
2
RSS ∑ ei
σ =
=
n−k n−k
ˆ2
Ví dụ C.4.2: tính ma trận hiệp phương sai
Đã tính được (XTX) -1; ta tính
σ:ˆ 2
TSS = Y T Y − n (Y ) 2 = ∑ Yi 2 − n (Y ) 2 = 2781 − 10(16, 5) 2 = 58, 5
165
ESS = βˆ T ( X T Y ) − n (Y ) 2 = (14, 99215 0, 76178 − 0, 58901) 1029 − 10(16, 5) 2 = 56, 211
813
⇒ RSS = 58, 5 − 56, 211 = 2, 289
RSS 2, 289
σˆ 2 =
=
= 0, 327
7
n−3
39980 − 3816 − 32 56
0, 327
−
Cov ( βˆ ) =
3816
376
300
1528
− 3256
300
280
− 0, 6968
8, 55593 − 0, 81664
⇒ Cov ( βˆ ) = − 0,81664 0, 080466
0, 0642
− 0, 6968
0, 0642
0, 05992
2.6. Kiểm định giả thiết H0 : β2 = β3 = = βk = 0 (R2 =0)
H1 : khơng phải tất cả HSHQ riêng đồng thời bằng 0
R 2 (n − k )
* Bước 1 : F0 =
(1 − R 2 )( k − 1)
* Bước 2 : Tra bản g phân phối Fisher , bậc tự do n1 = ( k − 1)
và n2 = ( n − k )
⇒ Fα ;( k −1),( n − k ) Trong đó : n − số quan sát ; k − số biến trong mô hình ,
kể cả biến phụ thuộc
Fα ;( k −1),( n − k ) thỏa mãn điều kiện : P F0 > Fα ;( k −1),( n − k ) = α
* Bước 3 : Nếu F > Fα ;( k −1),( n − k ) ⇒ bác bỏ H 0
⇒ các hệ số hồi quy khôn g đồn g thời bằn g 0
− Nếu F0 < Fα ;( k −1),( n − k ) ⇒ khôn g bác bỏ H 0 ⇒ các HSHQ đồn g thời bằn g 0
Nghóa là chấp nhận R 2 ≠ 0 có ý nghóa
2.7. Dự báo giá trị trung bình & giá trị cá biệt của Y
Cho 1
0
X2
X 0 = X 30 ⇒ du bao E (Y / X 0 ) = β 1 + β 2 X 20 + ... + β k X k0
...
0
X k
* Du bao diem (uoc luong diem ) cua Y khi X = X 0 ⇒ Yˆ0 = X 0T βˆ
⇒ Var (Yˆ ) = X 0T Cov ( βˆ ) X 0 = σ 2 X 0T ( X T X ) −1 X 0 vi Cov ( βˆ ) = σ 2 ( X T X ) −1
0
Thay σ 2 bang σˆ 2 ⇒ Var (Yˆ0 ) = σˆ 2 X 0T ( X T X ) −1 X 0
Vay voi do tin cay (1 − α ), du bao khoang cua E (Y / X 0 ) :
Yˆ0 − tα / 2; ( n − k ) .SE (Yˆ0 ) ; Yˆ0 + tα / 2; ( n − k ) .SE (Yˆ0 )
* Du bao gia tri ca biet ⇒ tim khoang tin cay cho Y0
Trong do :Var ((Y0 − Yˆ0 ) = Var (Yˆ0 ) + σˆ 2
Yˆ0 ± tα / 2; ( n − k ) .SE (Y0 − Yˆ0 )