Tải bản đầy đủ (.pdf) (18 trang)

BÀI 4: MÔ HÌNH HỒI QUY BỘI pps

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (484.9 KB, 18 trang )


Bài 4: Mô hình hồi quy bội

47
BÀI 4. MÔ HÌNH HỒI QUY BỘI


Mục tiêu

Sau khi kết thúc bài, học viên sẽ hiểu
được những vấn đề sau đây:
• Mô hình hồi quy bội có 2 biến và mô
hình tổng quát k biến.
• Ý nghĩa của các hệ số hồi quy ước lượng.
• Hệ số xác định bội và hệ số xác định
bội đã hiệu chỉnh.
• Khoảng tin cậy và kiểm định giả thiết
cho các hệ số hồi quy.
• Kiểm định về sự phù hợp của mô
hình hay ảnh hưởng của tất cả các
biến độc lập.
• Dự báo trong mô hình hồi quy bội.

Nội dung

Hướng dẫn học
• Mô hình hồi quy bội gồm 2 biến độc lập.
• Mô hình hồi quy bội gồm k biến (k-1 biến
độc lập).
• Phương pháp OLS cho mô hình hồi quy bội.
• Hệ số xác định bội và hệ số xác định bội đã


hiệu chỉnh.
• Ước lượng khoảng tin cậy và kiểm định giả
thuyết cho hệ số hồi quy.
• Kiểm định về sự phù hợp của mô hình
hồi quy.
• Dự báo trong mô hình hồi quy bội.



Thời lượng

• 8 tiết

• Đề nghị học viên ôn lại phần ước
lượng và kiểm định giả thiết trong môn
lý thuyết xác suất và thống kê toán.
• Theo dõi kỹ bài giảng.
• Xem các ví dụ cho mỗi phần bài giảng.
• Làm các ví dụ và trả lời câu hỏi
trắc nghiệm



Bài 4: Mô hình hồi quy bội

48
TÌNH HUỐNG DẪN NHẬP
Tình huống
Hội đồng quản trị của công ty may Đức Giang đang muốn xem xét
ảnh hưởng của 2 yếu tố đầu vào của sản xuất là Vốn (V, tỉ đồng) và

Lao động (L, người) lên sản lượng (SL, triệu sản phẩm) của công ty.
Cụ thể, họ muốn đưa ra quyết định về việc có nên tiếp tục mở rộng
sản xuất, thu hẹp lại hay giữ nguyên như hiện tại. Để tiến hành nghiên
cứu này, phòng kế hoạch của công ty thu thập số liệu về vốn đầu tư,
lao động sử dụng và sản lượng sản xuất ra trong 30 tháng qua tại công ty (có n = 30 quan sát).
Mô hình dùng để nghiên cứu có dạng
log(SL
i
) = β
1
+ β2log(V
i
) + β
3
log(L
i
)+u
i

Dùng số liệu của mẫu, ước lượng được hàm hồi quy mẫu có dạng,

iii
log(SL ) 0.424816 0.7358log(V ) 0.9489log(L ).=+ +

Câu hỏi

• Vậy công ty Đức Giang nên tăng, giảm hay giữ nguyên quy mô sản xuất?
• Liệu cả 2 biến vốn và lao động cùng không có ảnh hưởng đến sản lượng có đúng không?
• Giả sử trong tháng tới, công ty quyết định sử dụng lượng vốn là 10 tỉ đồng và lao động là
3000 thì sản lượng dự báo là bao nhiêu?



Bài 4: Mô hình hồi quy bội

49
Trong bài trước chúng ta đã nghiên cứu mô hình hồi quy tuyến tính đơn giản, đó là hồi quy tuyến
tính đơn, trong mô hình này chúng ta đã nghiên cứu các mối quan hệ giữa một biến được giải
thích là Y và một biến giải thích X. Bài này chúng ta mở rộng nghiên cứu sang mô hình hồi quy
tuyến tính bội với một biến được giải thích Y và (k – 1) biến giải thích
2k
X , ,X . Trong thực tế
mô hình hồi quy tuyến tính bội được sử dụng rộng rãi vì đối với nhiều trường hợp nó giải thích
về hành vi của biến phụ thuộc (biến được giải thích) Y tốt hơn mô hình hồi quy tuyến tính đơn.
Ví dụ trong bài trước chúng ta xét mối quan hệ giữa thu nhập và chi tiêu nhưng thực tế chi tiêu
không chỉ phụ thuộc vào thu nhập mà nó còn phụ thuộc vào các yếu tố khác, chẳng hạn như:
niềm tin vào nền kinh tế, độ tuổi, nghề nghiệp, địa lý… Vì vậy mô hình hồi quy đơn khó giải
thích được hành vi của biến phụ thuộc Y. Do đó việc mở rộng mô hình hồi quy tuyến tính bội sẽ
giúp chúng ta giải thích được rõ hơn về biến phụ thuộc Y.
BÀI TOÁN
Mô hình hồi quy tuyến tính bội là mô hình nghiên cứu mối quan hệ giữa một biến phụ
thuộc Y và (k – 1) biến độc lập
23 k
X ,X , ,X có dạng:
i122i33i kki
YXX Xu=β +β +β + +β +
Trong đó
ii2i3iki
E(u ) 0,E(u | X ,X , ,X ) 0==
(
)

ij
Cov u ,u 0 i j=∀≠
(
)
2i i 3i i ki i
Cov(X ,u ) 0;Cov(X ,u ) 0; ,Cov X ,u 0== =
2
i
Var(u ) , i=σ ∀ .
4.1. Mô hình hồi quy với hai biến giải thích
Định nghĩa: Mô hình hồi quy tổng thể (PRF) với hai biến giải thích có dạng như sau:
i122i33ii
YXXu=β +β +β + (4.1)
với Y là biến phụ thuộc;
23
X ,X là các biến độc lập,
i2i3i
Y ,X ,X là các quan sát thứ i
của
23
Y, X ,X ; u là nhiễu ngẫu nhiên,
i
u là nhiễu tại quan sát thứ i;
1
β là hệ số chặn
(hệ số tự do), bằng giá trị trung bình của Y khi
23
XX0
=
= ;

23
,ββ là các hệ số hồi
quy riêng hay còn gọi là hệ số của các biến độc lập,
2
β
chỉ sự thay đổi của Y khi
3
X
cố định và
2
X tăng hoặc giảm 1 đơn vị, còn
3
β
chỉ sự thay đổi của Y khi
3
X tăng
hoặc giảm 1 đơn vị và
2
X cố định.
Trong mô hình hồi quy hai biến (4.1) ta có các giả thiết sau:

ii2i3i
E(u ) 0,E(u | X ,X ) 0.==
• Các
i
u không tương quan, tức là
ij
Cov(u ,u ) 0, i j.=∀≠



i
u không tương quan với
2i 3i
X,X, tức là
2i i 3i i
Cov(X ,u ) 0;Cov(X , u ) 0.==


i
u có phương sai không thay đổi, tức là:
2
i
Var(u ) , i.
=
σ∀

Bài 4: Mô hình hồi quy bội

50
4.2. Ước lượng tham số của mô hình hồi quy
Tương tự trong bài 3, bài toán đặt ra là từ các dữ liệu quan sát chúng ta cần ước lượng
các hệ số hồi quy
123
,,βββ của mô hình (4.1). Phương pháp ta sẽ sử dụng sau đó chính
là phương pháp bình phương tối thiểu OLS. Hàm hồi quy mẫu (SRF) được xây dựng
từ n quan sát
i23
(Y,X ,X ) có dạng:
i122i33i
ˆˆ ˆ

ˆ
YXX=β +β +β
(4.2)

i122i33ii ii
ˆˆ ˆ
ˆ
ˆˆ
YXXuYu=β +β +β + = +

trong đó
123
ˆˆˆ
,,βββ
là ước lượng của
123
,,
β
ββ,
i
ˆ
u là ước lượng của
i
u, phần dư của
quan sát thứ i.
Từ (4.2) ta có:
()
nn
2
2

ii122i33i
i1 i1
ˆˆ ˆ
ˆ
uY XX
==
=−β−β−β
∑∑
(4.3)
Ta cần xác định
123
ˆˆˆ
,,βββ
sao cho
n
2
i
i1
ˆ
u
=

trong (4.3) đạt giá trị nhỏ nhất.
Theo lý thuyết giải tích nhiều biến, ta thấy để
n
2
i
i1
ˆ
u

=

đạt giá trị nhỏ nhất thì
123
ˆˆˆ
,,βββ

phải là nghiệm của hệ phương trình
12233
nnn n
2
12i22i32i3i i2i
i1 i1 i1 i1
nn nn
2
1 3i 2 2i 3i 3 3i i 3i
i1 i1 i1 i1
ˆˆ ˆ
XXY
ˆˆˆ
XXXXYX
ˆˆ ˆ
XXXXYX
=== =
== ==


β+β +β =



β+β+β =



β+β +β=


∑∑∑ ∑
∑∑ ∑∑
(4.4)
trong đó
nn
22i33i
i1 i1
11
XX,XX
nn
==
==
∑∑

n
i
i1
1
YY.
n
=
=



Hệ phương trình (4.4) được gọi là hệ phương trình chuẩn và phương pháp xác định
123
ˆˆˆ
,,βββ
như trên được gọi là phương pháp bình phương tối thiểu (OLS).
Nghiệm của phương trình (4.4) là:
12233
ˆˆˆ
YX Xβ= −β −β

nnnn
2
i 2i 3i i 3i 2i 3i
i1 i1 i1 i1
2
2
nn n
22
2i 3i 2i 3i
i1 i1 i1
yx x yx x x
ˆ
xx xx
====
== =

β=
⎛⎞


⎜⎟
⎝⎠
∑∑∑∑
∑∑ ∑
nn nn
2
i 3i 3i i 3i 2i 3i
i1 i1 i1 i1
3
nn n
22 2
2i 3i 2i 3i
i1 i1 i1
yx x yx x x
ˆ
xx(xx)
== ==
== =

β=

∑∑∑∑
∑∑ ∑


Bài 4: Mô hình hồi quy bội

51
()
()

2
23
23
nn
222
23 2i 3i
i1 i1
r
ˆˆ
Cov ;
1r x x
==
−σ
ββ =
⎛⎞⎛⎞

⎜⎟⎜⎟
⎝⎠⎝⎠
∑∑
.
với
i i 2i 2i 2 3i 3i 3
yYY,x X X,x X X.=− = − = −
Ta thấy rằng
2
σ
là phương sai của
i
u và
2

σ
là chưa biết. Vì vậy ta thay
2
σ bằng ước
lượng không chênh lệch của nó là
n
2
i
2
i1
ˆ
u
RSS
ˆ
n3 n3
=
σ= =
−−

.
CHÚ Ý
()()
()
23
2
n
2
2i 3i
23 2 3
i1

2
23
22
nn
22
XX
2i 3i
i1 i1
xx
XX X X
r
SS
xx
=
==
⎛⎞
⎜⎟

⎝⎠
==
⎛⎞⎛⎞
⎜⎟⎜⎟
⎝⎠⎝⎠

∑∑

4.3. Phương sai và độ lệch chuẩn của các ước lượng bình phương tối thiểu
Ta đã thu được các ước lượng cho các hệ số hồi quy bằng phương pháp OLS. Để tìm
các ước lượng khoảng và tiến hành kiểm định các hệ số hồi quy, ta cần xác định
phương sai và độ lệch chuẩn của các ước lượng thu được trên đây.

Phương sai và độ lệch chuẩn của các ước lượng hệ số hồi quy theo phương pháp bình
phương tối thiểu được cho bởi các công thức
()
()
2
2
n
22
2i 23
i1
ˆ
Var
x1r
=
σ
β=


;
(
)
(
)
22
ˆˆ
Se Var
β
=β;
()
()

2
3
n
22
3i 23
i1
ˆ
Var
x1r
=
σ
β=


;
(
)
(
)
33
ˆˆ
Se Var
β
=β,
với
23
r là hệ số tương quan giữa
2
X và
3

X.
4.4. Mô hình hồi quy bội
4.4.1. Khái niệm:
Mô hình hồi quy bội là mô hình có hàm hồi quy tổng
thể (PRF) gồm một biến phụ thuộc Y và k – 1 biến độc
lập
23 k
X ,X , ,X có dạng như sau:
i122i33i kkii
Y X X X u=β +β +β + +β + (4.5)
trong đó
1
β là hệ số chặn, hệ số tự do, nó cho ta biết
trung bình của Y khi
23 k
X ,X , ,X bằng 0.

Bài 4: Mô hình hồi quy bội

52
j
(j 1,2, ,k)β=
là các hệ số hồi quy riêng, nó cho ta biết sự thay đổi của Y khi
j
X

thay đổi một đơn vị còn các
(
)
h

Xh j

bằng 0,
i
u là các nhiễu ngẫu nhiên.
Phương trình (4.5) có thể được viết chi tiết dưới dạng hệ phương trình sau:
11221331 kk11
21222332 kk22
n122n33n kknn
Y X X X u
Y X X X u

Y X X X u
=β +β +β + +β +


=β +β +β + +β +




=β +β +β + +β +

(4.6)
Đặt
21 31 k1
1
22 32 k2
2
2n 3n kn

n
1 X X X
Y
1 X X X
Y
Y ; X . . . .
.
. . .
.
1X X X
Y
⎛⎞
⎛⎞
⎜⎟
⎜⎟
⎜⎟⎜⎟
⎜⎟
⎜⎟
==
⎜⎟⎜⎟
⎜⎟
⎜⎟
⎜⎟ ⎜ ⎟
⎝⎠
⎝⎠

11
22
nn
u

u
u;


u
β
⎛⎞ ⎛⎞
⎜⎟ ⎜⎟
β
⎜⎟ ⎜⎟
⎜⎟ ⎜⎟
=β=
⎜⎟ ⎜⎟
⎜⎟ ⎜⎟
⎜⎟ ⎜⎟
β
⎝⎠ ⎝⎠

khi đó hệ phương trình (4.6) có thể viết dưới dạng phương trình ma trận
YX u=β+ (4.7)
4.4.2. Các giả thiết cơ bản
Ta đưa ra các giả thiết cơ bản cho mô hình hồi quy nội
bội như sau:
Giả thiết 1:
Ma trận ngẫu nhiên u có kỳ vọng bằng 0, tức là:
()
(
)
()
()

1
2
n
Eu
0
Eu
0
Eu .
.
.
.
Eu
0
⎛⎞
⎛⎞
⎜⎟
⎜⎟
⎜⎟
⎜⎟
⎜⎟
⎜⎟
==
⎜⎟
⎜⎟
⎜⎟
⎜⎟
⎜⎟
⎜⎟
⎝⎠
⎝⎠


Giả thiết 2:
Các thành phần trong ma trận u là không tương quan, tức là:
(
)
ij
Euu 0= ij


()
2
ii
Euu
=
σ

hoặc ta có thể viết dưới dạng:
(
)
T2
Euu I
=
σ
, với I là ma trận đơn vị cấp n.

Bài 4: Mô hình hồi quy bội

53
Giả thiết 3: Các
i

u có phân bố chuẩn
(
)
2
N0,
σ

i1,n∀=
.
Giả thiết 4: Các
23 k
X ,X , ,X không có quan hệ tuyến tính.
4.4.3. Ước lượng các tham số bằng OLS
Với giả thiết trên, ta cần dựa vào dữ liệu
()
()
i2i3i ki
Y ,X ,X , ,X , i 1,n= quan sát được để tìm ước
lượng véc tơ hệ số
()
T
12 k
, , ,β= β β β của mô hình hồi quy
bội (4.7).
Ký hiệu
(
)
T
12 k
ˆˆˆ ˆ

, , ,β= β β β là ước lượng của
β
, khi đó ta có
phương trình hồi quy mẫu (SRF)
i122i33i kkii
ˆˆ ˆ ˆ
ˆ
Y X X X u=β +β +β + +β +

(
)
i1,n.=
Ta cần tìm các hệ số
()
12 k
ˆˆ ˆ
, , ,ββ β sao cho tổng các phần dư
n
2
i
i1
ˆ
u
=

đạt giá trị
nhỏ nhất.
Kết quả của phương pháp giải tích cho thấy véc tơ ước lượng trên đây thỏa mãn
phương trình ma trận
(

)
ˆ
XX XY
′′
β= (4.8)
trong đó X ,Y
′′
tương ứng là các ma trận chuyển vị của X và Y . Từ giả thiết 4 dẫn
đến sự tồn tại ma trận nghịch đảo của
XX

và do đó
()
1
ˆ
XX XY.

′′
β=
Biểu thức này được gọi là phương trình cơ bản của phương pháp OLS.
4.5. Các tính chất của ước lượng bình phương nhỏ nhất
Xét mô hình hồi quy bội
i122i33i kkii
Y X X X u=β +β +β + +β + .
Giống như mô hình hồi quy đơn, mô hình hồi quy bội này có
các tính chất sau:

Đường hồi quy bội đi qua điểm
(
)

23 k
Y, X , X , ,X .


ˆ
YY= .


n
i
i1
u0
=
=

.


i
u không tương quan với
p
i
X,
(
)
p 2,3, ,k= ,
n
ipi
i1
uX 0

=
=

.

Bài 4: Mô hình hồi quy bội

54
• Các
i
u không tương quan với
i
ˆ
Y
:
n
ii
i1
ˆ
uY 0
=
=

.


i
ˆ
β
là các ước lượng tuyến tính không chệch và có phương sai nhỏ nhất cho các

i
β
()
i1,k= .
4.6. Hệ số xác định bội R
2
và hệ số xác định hiệu chỉnh
Trong mô hình hồi quy tuyến tính đơn ta đã đưa ra hệ
số xác định
2
ESS RSS
r1
TSS TSS
==−.
Từ công thức trên ta thấy khi
2
r càng lớn thì tổng bình
phương sai số dự báo càng nhỏ, do đó mô hình hồi quy
càng phù hợp. Vì vậy hệ số
2
r còn được dùng để đo độ
phù hợp của mô hình. Tương tự cho mô hình hồi quy bội ta cũng xây dựng hệ số xác
định ký hiệu là
2
R được xác định bởi công thức:
2
ESS RSS
R1
TSS TSS
==−.

Dễ dàng chứng minh được rằng
2
2
2
ˆ
XY nY
R
YY nY
′′
β−
=


. (4.9)
Từ các công thức trên có thể thấy hệ số xác định
2
R có tính chất sau:


2
0R 1.≤≤

Nếu
2
R1
=
khi đó đường hồi quy giải thích 100% sự thay đổi của Y bởi vì khi đó:
n
2
i

i1
ˆ
u0
=
=

.

Nếu
2
R0= khi đó mô hình không giải thích được sự thay đổi của Y.

Nếu số biến độc lập càng tăng thì hệ số
2
R càng lớn, hay nói cách khác
2
Rlà một
hàm tăng theo các biến giải thích.
Như vậy, tính phù hợp của mô hình hồi quy tăng lên
khi có nhiều biến giải thích trong mô hình hơn. Tuy
nhiên, người ta luôn muốn dùng một số lượng biến
giải thích vừa đủ sao cho vẫn có được mô hình phù
hợp mà không quá tốn kém khi phải thu thập thông
tin của quá nhiều biến giải thích. Hơn nữa, nhiều
khi đưa thêm một số biến độc lập vào mô hình thì
tác động riêng phần của các biế
n độc lập đó tới biến phụ thuộc lại không thực sự có ý
nghĩa thống kê. Vậy cần có tiêu chuẩn đánh giá sự phù hợp của mô hình, trong đó có
cân nhắc đến số lượng biến giải thích của mô hình. Một trong số các tiêu chuẩn như vậy
là hệ số xác định hiệu chỉnh

2
R của
2
R , cho bằng biểu thức

Bài 4: Mô hình hồi quy bội

55
n
2
i
2
i1
n
2
i
i1
ˆ
u/(n k)
R1
y/(n 1)
=
=

=−



.
trong đó n là số quan sát, k – 1 là số biến độc lập trong mô hình.

Dễ dàng thấy có mối quan hệ giữa
2
R và
2
R, cụ thể là:
22
(n 1)
R1(1R)
(n k)

=− −

.
Từ đó
2
R có các tính chất sau:

Nếu k > 1 thì
22
RR1≤≤ ;

Khi số biến độc lập k –1 tăng lên thì
2
Rcũng tăng lên nhưng tăng chậm hơn so với
2
R;


2
R0≥ , nhưng

2
R có thể âm. Khi
2
R nhận giá trị âm thì để cho tiện, thường thì
người ta gán lại cho nó giá trị bằng 0.
Trong thực hành, khi muốn đánh giá sự phù hợp của mô hình thì
2
R hay được dùng
hơn so với
2
R, vì nếu dùng
2
R ta dễ đưa ra một hình ảnh lạc quan quá mức về sự phù
hợp của mô hình, nhất là đối với các bài toán mà số lượng biến giải thích không nhỏ
hơn nhiều lắm so với số lượng quan sát. Tuy nhiên, quan điểm này còn được điều
chỉnh tùy theo bài toán cụ thể. Hơn nữa, ngoài hai thống kê
2
R và
2
R, người ta còn
dùng một số tiêu chuẩn khác để đánh giá tính phù hợp của mô hình, chẳng hạn như:
quy tắc thông tin Akaike hay quy tắc dự báo Amemiya.
4.7. Quan hệ giữa hệ số xác định và tiêu chuẩn kiểm định F
Xét mô hình hồi quy bội (4.5):
i122i33i kkii
Y X X X u=β +β +β + +β + , i1,n=
Mô hình được gọi là không có
hiệu lực giải thích, hay nói cách khác không giải thích
được sự thay đổi của biến Y, nếu toàn bộ các hệ số hồi quy riêng đều bằng 0. Vì vậy để
kiểm định sức mạnh hay mức ý nghĩa của mô hình ta cần kiểm định bài toán sau:

02 3 k
1i
H : 0
H: 0
β=β= =β=


∃β ≠

(4.10)
Để giải quyết bài toán kiểm định trên, ta dùng tiêu chuẩn thống kê sau:
2
ˆ
(XYnY)/k
F~F(k1,nk)
ˆ
(Y Y X Y)/(n k 1)
′′
β−
=−−
′′′
−β − −

Khi giả thiết thống kê F có phân phối Fisher với k – 1 và n – k bậc tự do. Vậy với
mức ý nghĩa
α
ta có quy tắc kiểm định:

Nếu
()

qs
FFk1,nk
α
>−− thì bác bỏ
0
H.

Nếu
()
qs
FFk1,nk
α
≤−− thì chưa bác bỏ
0
H.
Quan hệ giữa hệ số xác định
2
R và thống kê F được diễn giải như sau: Từ (4.5) và
(4.9), ta thấy bài toán kiểm định (4.10) tương đương với bài toán kiểm định
2
0
2
1
H:R 0
H:R 0

=






(4.11)

Bài 4: Mô hình hồi quy bội

56
Mặt khác:
2
2
2
ˆ
XY nY
R
YY nY
′′
β−
=


.
Do đó ta có:
()
2
2
R/k 1
F.
(1 R ) /(n k)

=

−−

Vậy thống kê F cũng là tiêu chuẩn thống kê cho bài toán kiểm định (4.11).
Ví dụ 1
Một công ty muốn mở rộng thị trường kinh doanh tại
một thành phố. Trước khi quyết định mở chi nhánh tại
thành phố đó, công ty đã tiến hành nghiên cứu thị
trường bằng cách tiến hành quảng cáo và chào bán sản
phẩm của mình từ đó xem xét khả năng tiêu thụ sản
phẩm. Thu thập số liệu trong 10 tuần về số sản phẩm
bán được trong một tuần, giá sản phẩm
2
X và chi phí
cho quảng cáo
3
X ta có bảng số liệu sau:
Giá sản phẩm Cho phí quảng cáo Số sản phẩm bán ra/tuần
4.92 4.79 425
5.5 3.61 467
5.54 5.49 296
5.11 2.78 626
5.62 5.74 165
5.24 1.34 515
4.15 5.81 270
4.02 3.39 689
5.77 3.74 413
4.57 3.59 561
Phân tích số liệu bằng Evievs ta thu được báo cáo:



Bài 4: Mô hình hồi quy bội

57
Dựa vào kết quả báo cáo trong Evievs ta xây dựng được mô hình hồi quy tuyến tính 3
biến chỉ sự phụ thuộc của sản phẩm bán được Y với chi phí quảng cáo
3
X và giá thành sản
phẩm
2
X qua biểu thức
12233
ˆˆ ˆ
ˆ
YXX=β +β +β

với
1
ˆ
1360.84β=
,
2
ˆ
110.2952β=−
,
3
ˆ
89.82406β=−
. Ngoài ra còn có hệ số xác định
bội
2

R 0.772974= , hệ số xác định hiệu chỉnh (Adjusted R-Squared)
2
R 0.708110= ,
giá trị tiêu chuẩn thống kê F (F-Static)
2
qs
F 11.91675= . Vậy mô hình hồi quy cụ thể là:
23
ˆ
Y 1360.84 110.2952X 89.82406X=− −
.
Đối với mô hình này, ta cần đặt ra câu hỏi: Với mức ý nghĩa
0.05
α
= thì giá bán và
chi phí quảng cáo có ảnh hưởng đến số lượng sản phẩm bán ra hay không?
Để trả lời cho câu hỏi này, ta cần kiểm định bài toán:
02 3
123
H: 0
H: , 0
β=β=


∃β β ≠


hoặc kiểm định bài toán tương đương là:
2
0

2
1
H:R 0
H:R 0

=


>



Cả hai bài toán trên đều có thể giải quyết bằng cách sử dụng thống kê F . Ta có
qs
F 11.91675= . Với n = 10, k = 2, tra bảng phân phối Fisher hoặc dùng lệnh Excel ta
tìm được phân vị
()
0.05
F2;74.77= . Rõ ràng
(
)
qs 0.05
FF2;7> , vậy ta bác bỏ
0
H, kết
luận giá bán của sản phẩm và chi phí cho quảng cáo có ảnh hưởng đến số lượng sản
phẩm bán ra.
Hai bài toán kiểm định trên còn có thể giải quyết bằng cách so sánh xác suất ý nghĩa
tương ứng với mức ý nghĩa đã định. Kết quả của Eviews cho thấy xác suất ý nghĩa của
thống kê F

(Prob(F-statistic)) có giá trị bằng 0.005575, nhỏ hơn 0.05, vậy có thể bác
bỏ giả thuyết
0
H.
4.8. Ước lượng khoảng cho hệ số hồi quy
Giả sử trong mô hình hồi quy (4.7), véc tơ nhiễu ngẫu nhiên u có phân phối chuẩn
2
N(0; )σ . Khi đó ta có véc tơ hệ số hồi quy
ˆ
β
có phân phối chuẩn
()
()
1
2
N, XX


βσ
,
các thành phần của véc tơ đó cũng có phân phối chuẩn
()
2
i
ˆ
~N ;
β
βσ , (i 1,k)= , với
2
σ chưa biết và nó có ước lượng không chệch là:

()
n
22
i
i1
ˆ
unk.
=
σ= −



Bài 4: Mô hình hồi quy bội

58
Các thống kê
()
ii
i
ˆ
t
ˆ
Se
β−β
=
β
đều có phân phối student với (n – k) bậc tự do. Do vậy, với
độ tin cậy
1−α ta có khoảng ước lượng cho
i

β
là:
nk nk
ii/2iii/2
ˆˆ ˆˆ
se( )t se( )t ; i 1,k
−−
αα
β− β <β<β+ β = (4.12)
trong đó
nk
/2
t

α
là phân vị của phân phối Student với (n – k) bậc tự do ứng với mức ý
nghĩa
/2α , giá trị này có thể thu được bằng cách tra bảng hoặc dùng lệnh thích hợp
trong Excel.
Ví dụ 2: Từ dữ liệu trong ví dụ 1 hãy tìm ước lượng khoảng của hệ số hồi quy riêng
với độ tin cậy 95%.
Trong bảng kết quả của Eviews ta đã có:
1
ˆ
1360.84β=
,
2
ˆ
110.2952β=−
,

3
ˆ
89.82406β=−

Trong cột Std.Error ta có:
()
1
ˆ
Se 258.4298β= ,
(
)
2
ˆ
Se 47.91851β= ,
(
)
3
ˆ
Se 20.69356β= .
Ta thấy
n10=
,
k3=
,
1 0.95 0.05−α= ⇒α=
. Từ đó tra bảng hoặc sử dụng Excel
(dùng lệnh Tinv(0.05,7)), ta sẽ có
(
)
7

0.025
t 2.365= . Thay các thông số tương ứng vào
(4.12), ta thu được các ước lượng khoảng của
2
β

3
β
lần lượt là:
2
110.2952 47.91851 2.365 110.2952 47.91851 2.365−−×<β<−+×
2
223.622 3.032⇒− <β < .
3
89.82406 20.69365 2.365 89.82406 20.69365 2.365−−×<β<−+×
3
138.765 40.8836⇒− <β <− .
4.9. Kiểm định giả thuyết cho các hệ số hồi quy
Để so sánh các hệ số hồi quy với các giá trị giả định cho trước, ta có các giả thuyết
*
0i i
H:β=β (i 1,k)=
đi kèm với một trong số các đối thuyết tương ứng
*
1i i
H:
β
≠β
hoặc
*

1i i
H:β>β
hoặc
*
1i i
H:β<β
.
Với giả thuyết về sai số ngẫu nhiên u như trong phần 4.4 ta thấy thống kê
()
*
ii
i
i
ˆ
t
ˆ
Se
β
−β
=
β

có phân phối Student với n – k bậc tự do. Dựa vào kết quả đó ta có thể giải quyết một
loạt bài toán kiểm định so sánh ước lượng của các hệ số trong mô hình hồi quy tuyến
tính bội như sau:
Bài toán 1:
*
0i i
*
1i i

H:
H:

β=β


β≠β



Miền bác bỏ:
(n k) (n k)
/2 /2
W( ;t )(t ;).
−−
αα
=−∞− ∪ ∞

Bài 4: Mô hình hồi quy bội

59
Bài toán 2:
*
0i i
*
1i i
H:
H:

β=β



β>β



Miền bác bỏ:
(n k)
W(t ;).

α
=∞
Bài toán 3:
*
0i i
*
1i i
H:
H:

β=β


β<β



Miền bác bỏ:
(n k)
W( ;t )


α
=−∞−

Sử dụng phần mềm Eviews chúng ta có thể tính được ngay giá trị tiêu chuẩn của
thống kê
i
t và xác suất ý nghĩa p tương ứng, từ đó có thể giải quyết bài toán theo hai
cách sau:

Cách 1:
Tìm phân vị
(n k)
/2
t

α
và miền bác bỏ W rồi so sánh tiêu chuẩn thống kê
i
t với W để
đưa ra kết luận.

Cách 2:
So sánh xác suất ý nghĩa p với mức ý nghĩa
α
đã định trước như sau:
o Đối với Bài toán 1, nếu p

α thì bác bỏ giả thuyết
0

H , còn nếu p >α thì
chấp nhận
0
H.
o Đối với các Bài toán 2 và 3, nếu
p/2

α
thì bác bỏ giả thuyết
0
H , còn nếu
p/2>α thì chấp nhận
0
H.
Ví dụ 3: Xét số liệu trong ví dụ 1, với mức ý nghĩa 0.05
α
= có thể cho rằng khi giá
sản phẩm tăng thì doanh số bán hàng sẽ giảm không?
Ta có phương trình hồi quy:
02233
YXXu=β +β +β + .
Nếu
2
β âm thì Y phụ thuộc nghịch biến với
2
X, tức là
2
X tăng thì Y giảm. Vậy để
trả lời cho câu hỏi trên ta cần lập bài toán kiểm định giả thuyết
02

12
H: 0
H: 0
β=


β<


Với kết quả của Eviews đưa ra ở phần trên, ta có:
2
2
2
ˆ
110.2952
t 2.30172
ˆ
47.91851
se( )
β−
== =−
β
.
Mặt khác, với
n10,k3, 0.05==α=, ta có
(
)
7
(n k)
0.05

t t 1.895

α
== .
Vậy miền bác bỏ của bài toán này là
W ( ; 1.895)=−∞− .
Rõ ràng ta có
2
tW∈ , do đó ta có thể bác bỏ giả thuyết
0
H, chấp nhận
1
H và đưa ra
kết luận
2
0β< .

Bài 4: Mô hình hồi quy bội

60
Nếu giải quyết theo Cách 2 thì ta có xác suất ý nghĩa p bằng 0.0549, vậy
p / 2 0.0549 / 2 0.05=<α=.
Do đó có thể bác bỏ giả thuyết
0
H.
4.10. Dự báo cho mô hình hồi quy tuyến tính bội
Một trong những ứng dụng quan trọng của hồi quy là
dự báo, bài toán đặt ra là dựa vào mô hình hồi quy hãy
dự báo giá trị của Y khi biết giá trị của X là X


. Xét
mô hình hồi quy
122 kk
ˆˆ ˆ ˆ
ˆ
Y X X X


+
β
++
β
=
β
.
với
23 k
X (1,X ,X , ,X )


= ;
123 k
ˆˆˆˆ ˆ
( , , , , )'
β
=
βββ β
.
Cho trước giá trị của các biến độc
lập

23 k
X X (1,X , X , ,X )
∗∗∗∗
== , khi đó giá trị dự báo
của Y là
ˆ
Y

:

23 k 1 22 33 kk
ˆˆ ˆ ˆ
ˆ
Y E(Y | X ,X , ,X ) X X X

∗∗ ∗ ∗ ∗ ∗
==β+β+β++β
.
Ví dụ 4: Xét số liệu trong ví dụ 1, hãy dự báo doanh số bán hàng trung bình khi giá
sản phẩm là 4.5 và chi phí quảng cáo là 3.2.
Ta có:
23
ˆ
Y 1360.84 110.2952X 89.824606X .=− −

Vậy với
2
X4.5

=


3
X3.2

=
, ta có:

()
23
ˆ
Y E Y | X 4.5,X 3.2 1360.84 110.2952 4.5 89.824606 3.2 577.07

====−×− ×=.

Bài 4: Mô hình hồi quy bội

61
TÓM LƯỢC CUỐI BÀI
• Mô hình hồi quy bội gồm 2 biến độc lập:
Giả sử nghiên cứu sự phụ thuộc của Y vào 2 biến X
2
và X
3
. Mô hình có dạng:
()
2i 3i 1 2 2i 3 3i
EY/X,X X X=β +β +β
hoặc
i122i33ii
YXXu=β +β +β +

β
1
là hệ số chặn (hệ số tự do): giá trị trung bình của Y khi X
2
= X
3
= 0,
β
2
và β
3
là các hệ số hồi quy riêng, chỉ sự thay đổi của trung bình của Y khi riêng X
2
và X
3

tăng hoặc giảm 1 đơn vị và biến còn lại cố định.

Mô hình hồi quy bội gồm k biến (k–1 biến độc lập):
i122i33i kkii
Y X X X u .
=
β+β +β + +β +
Mô hình này có 1 biến phụ thuộc và k–1 biến độc lập (k biến)
Các hệ số hồi quy riêng β
j
thể hiện ảnh hưởng của riêng từng biến độc lập X
j
lên trung bình
của Y khi các biến khác được giữ không đổi.


Phương pháp OLS cho mô hình hồi quy bội.
Trong mô hình k biến chú ý công thức sau:
n
2
i
2
i1
ˆ
u
RSS
ˆ
.
nk nk
=
σ= =
−−



Hệ số xác định bội R
2
và hệ số xác định bội đã hiệu chỉnh.
Để đo độ phù hợp của hàm hồi quy, dùng R
2
. Giá trị của R
2
cho biết bao nhiêu % sự biến
thiên của biến phụ thuộc được giải thích bởi đồng thời các biến độc lập hoặc được giải thích
bởi hàm hồi quy mẫu

2
ERR RSS
R1.
TSS n k
==−


Vì khi đưa thêm biến độc lập vào mô hình, R
2
luôn luôn tăng lên nên người ta sử dụng hệ số
xác định bội đã điều chỉnh để xem xét việc có nên đưa thêm biến mới vào mô hình hay không:
()
22
22 2
n1
R11R
nk
RR 0R1

=− −

≤≤≤

Hệ số
2
Rcó thể âm.

Khoảng tin cậy với độ tin cậy1−αcho hệ số β
i
là:

()
()
(
)
()
(
)
nk nk
iii
22
ˆˆ ˆˆ
Se t Se t i 1, k
−−
αα
β− β <β<β+ β = .
Khoảng tin cậy này cho biết khi X
i
tăng hoặc giảm 1 đơn vị thì trung bình của biến phụ thuộc
sẽ thay đổi trong khoảng nào.

Kiểm định về sự phù hợp của mô hình hồi quy
Tiêu chuẩn kiểm định:
()
ii
i
i
ˆ
t
ˆ
Se

β−β
=
β
i


Bài 4: Mô hình hồi quy bội

62
Bài toán 1:
*
0i i
*
1i i
H:
H:

β=β


β≠β



Miền bác bỏ:
()
(
)
()
(

)
nk nk
22
W= ; t t ; .
−−
αα

∞− +∞∪
Bài toán 2:
*
0i i
*
1i i
H:
H:

β=β


β>β



Miền bác bỏ:
()
()
nk
W= t ;

α

+∞ .
Bài toán 3:
*
0i i
*
1i i
H:
H:

β=β


β<β



Miền bác bỏ:
()
()
nk
W= ; t

α
−∞ − .

Bài 4: Mô hình hồi quy bội

63
CÂU HỎI THƯỜNG GẶP
1. Trong mô hình hồi quy bội, các giả thiết của phương pháp OLS có khác gì so với mô hình

hồi quy đơn?
2. Vai trò của các hệ số hồi quy trong mô hình hồi quy bội khác thế nào so với mô hình hồi quy đơn?
3. Hệ số xác định bội trong mô hình hồi quy bội cho biết điều gì?
4. Tại sao lại cần đưa ra khái niệm hệ số xác định bội đã điều chỉnh trong hàm hồi quy bội?
5. Khi nào thi nên đưa thêm biến độc lập mới vào mô hình nếu sử dụng hệ số xác định bội đã
điều chỉnh?
6. Khi nào thi ta cần xây dựng khoảng tin cậy cho các hệ số hồi quy?
7. Khi nào thì dùng khoảng tin cậy đối xứng, bên phải hoặc bên trái?
8. Kiểm định giả thiết về một hệ số hồi quy bằng 0 có ý nghĩa gì, kiểm định hệ số hồi quy bằng
một giá trị cụ thể có ý nghĩa gì?
9. Kiểm định F về sự phù hợp của mô hình hồi quy có ý nghĩa gì?
CÂU HỎI TRẮC NGHIỆM
1. Cho mô hình hồi quy
ˆ
Y = 10 – 3X
1
+ 2.5X
2
. Điều khẳng định nào sau đây đúng?
A. X
2
quan trọng hơn X
1
vì dấu của hệ số là dương.
B. Khi X
1
giảm 3 đơn vị, Y giảm 1 đơn vị.
C. Khi X
2
giảm 2.5 đơn vị, Y giảm 1 đơn vị.

D. Khi X
1
giảm 1 đơn vị, Y tăng 3 đơn vị.
2. Hệ số xác định bội đã điều chỉnh liên quan tới điều chỉnh R
2
qua:
A. Tổng số tham số trong mô hình hồi quy.
B. Số biến phụ thuộc trong mô hình và kích thước mẫu.
C. Số biến độc lập trong mô hình và kích thước mẫu.
D. Hệ số tương quan và mức ý nghĩa.
3. Để kiểm định sự phù hợp của hàm hồi quy một mô hình gồm 5 biến độc lập và có 30 quan
sát, bậc tự do trong giá trị phân vị F là:
A. 5 và 30 B. 6 và 29
C. 5 và 24 D. 6 và 25
4. Mô hình hồi quy có dạng
123
ˆ
Y83X 5X 4X=+ + − . Khi X
3
tăng 1 đơn vị, với X
1
và X
2
giữ
không đổi, Y sẽ:
A. Tăng 1 đơn vị. B. Tăng 12 đơn vị.
C. Giảm 4 đơn vị. D. Giảm 16 đơn vị.

Bài 4: Mô hình hồi quy bội


64
5. Từ mô hình hồi quy với 3 biến độc lập và có 25 quan sát, tính được R
2
= 0.769. Giá trị của
hệ số xác định bội đã hiệu chỉnh là:
A. 0.385 B. 0.877
C. 0.591 D. 0.736
6. Một mô hình hồi quy bội thì có:
A. Chỉ duy nhất 1 biến độc lập. B. Chỉ duy nhất 2 biến độc lập.
C. Nhiều hơn 1 biến độc lập. D. Nhiều hơn 1 biến phụ thuộc.
7. Cho mô hình hồi quy:
123
ˆ
Y23X 4X 5X,=− + + 1 đơn vị tăng của X
1
, X
2
và X
3
giữ không
đổi, sẽ dẫn đến:
A. Tăng 3 đơn vị của Y. B. Giảm 3 đơn vị của Y.
C. Đơn vị 8 đơn vị của Y. D. Không có lựa chọn nào ở trên.
8. Để kiểm định sự phù hợp của mô hình hồi quy có 4 biến độc lập, giả thuyết H
0
là:
A.
02345
H: 1.β=β=β=β= B.
012345

H: .
β
=β =β =β =β
C.
02345
H: 0.β=β=β=β=

D.
012345
H: 0.
β
=β =β =β =β ≠
9. Trong mô hình hồi quy bội, giá trị của hệ số R
2
nằm trong khoảng:
A. 1 và +1. B. 0 và +1.
C. 1 và 0. D. không có lựa chọn nào ở trên.
10. Để kiểm định về sự phù hợp của mô hình hồi quy bội, ta kiểm định sự bằng không của tất cả
các hệ số hồi quy bằng kiểm định:
A. Kiểm định t. B. Kiểm định z.
C. Kiểm định F. D. Không có lựa chọn nào ở trên.


×