Tải bản đầy đủ (.pdf) (83 trang)

Bài giảng Kinh tế lượng Chương 5: Hồi qui tuyến tính bội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (788.07 KB, 83 trang )

1
Hồi qui tuyến tính bội
2
Các nội dung chính
 Ôn lại mô hình hồi qui tuyến tính bội
 Kiểm tra các điều kiện áp dụng mô
hình
 Chỉnh sửa các vấn đề
 Số liệu quan sát sai lệch
 Các biến giả (dummy)
 Phương pháp stepwise
 Sự tương tác (Interaction)
3
Y X X X
i i i k ki i
=     b b b
b
e
1 2 2 3 3

Mô hình hồi qui bội
Mối liên hệ giữa một biến phụ thuộc với
ít nhất hai biến độc lập là một hàm tuyến
tính
Biến phụ
thuộc (đáp
số)
Các biến độc
lập
Các hệ số
hồi qui


của tổng
thể
Hệ số chặn
(hằng số)
Sai số
ngẫu
nhiên
4
Mô hình hồi qui bội đối với tổng thể
Mô hình hai
biến
Đáp số
b
0
Y
i
=b
1
+ b
2
X
2i
+ b
3
X
3i
+ e
i
Y
X

1
X
2
e
i
E(Y)=b
1
+ b
2
X
2
+ b
3
X
3
5
Mô hình hồi qui bội đối với một
mẫu
Mô hình hai
biến
Y
Đáp số
X
1
X
2
b
0
e
i

Y
i
=b
1
+ b
2
X
2i
+ b
3
X
3i
+ e
i
6
Ví dụ về hồi tuyến tính qui bội
Phát triển một mô hình để giải
thích về giá của một ngôi nhà
theo diện tích và tuổi của nó, lấy
từ một mẫu 319 ngôi nhà vừa bán
gần đây nhất.
7
Ví dụ về hồi qui tuyến tính bội
tiếp
8
Ví dụ về hồi qui qui tuyến tính bội
tiếp
Coefficients
a
70015,462 5900,669 11,866 ,000

72,500 2,880 ,716 25,172 ,000 ,995 1,005
-1657,031 108,867 -,433 -15,221 ,000 ,995 1,005
(Constant)
surf ace
age
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardi
zed
Coef f icien
ts
t Sig. Tolerance VIF
Collinearity Statistics
Dependent Variable: prixa.
9
Diễn giải các hệ số của một hàm
hồi qui bội
 Các hệ số gốc (
b
j
)
 Sự biến đổi của giá trị trung bình của
các Y khi X
j
tăng thêm 1 đơn vị, mọi
yếu tố khác không đổi.

 Kiểm định: tương tự như hồi qui đơn với
(n-k) bậc tự do
 Hệ số chặn - hằng số (
b
0
)
 Giá trị trung bình của Y khi X
j
= 0
10
Ví dụ về hồi qui tuyến tính bội
tiếp
Coefficients
a
70015,462 5900,669 11,866 ,000
72,500 2,880 ,716 25,172 ,000 ,995 1,005
-1657,031 108,867 -,433 -15,221 ,000 ,995 1,005
(Constant)
surface
age
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardi
zed
Coefficien
ts

t Sig. Tolerance VIF
Collinearity Statistics
Dependent Variable: prix
a.
Với mỗi piê (hơn 30 cm)
vuông tăng thêm, giá trung
bình tăng thêm 72,50$
Với mỗi năm tuổi tăng thêm,
giá trung bình giảm đi
1657,03$.
=70 015,46+ 72,50X
1i
- 1 657,03X
2i
i
Y
ˆ
11
Hệ số xác định bội

Tỉ lệ biến đổi của biến phụ thuộc được giải thích bằng
tất cả các biến độc lập
R
2
= Biến đổi được giải thích = ESS
Tổng biến đổi TSS
 Không bao giờ giảm khi các đại lượng được thêm vào

Vấn đề khi ta so sánh các mô hình
12

10 






R
R
k - n
1 - n
)
R
- (1 - 1 =
R
2
2
2
2

Trong hồi qui bội, ta sử dụng hệ số xác định điều chỉnh
Hệ số xác định bội điều
chỉnh
13
Model Summary
b
,863
a
,746 ,744 $32,014.32 1,344
Model

1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
Durbin-W
atson
Predictors: (Constant), age, surface
a.
Dependent Variable: prix
b.
Ví dụ về hồi qui bội
tiếp
R
2
R
2
điều chỉnh
14
Kiểm định mức ý nghĩa tổng quát
BẢNG PHÂN TÍCH PHƯƠNG SAI
MC
df SC MCR=RSS/p F
Regression
k-1 RSS MCE=ESS/(n-k) MCR/MCE
Residue
n-k ESS
Total
n-1 TSS

15
ANOVA
b
9,49E+11 2 4,746E+11 463,042 ,000
a
3,24E+11 316 1024916646
1,27E+12 318
Regression
Residual
Total
Model
1
Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), age, surface
a.
Dependent Variable: prix
b.
Ví dụ về hồi qui bội
k-1 = 2, số các biến độc
lập
n - 1
mức ý nghĩa (p-value)
tiếp
F với k-1 bậc tự do ở
tử số và n-k ở mẫu số
n - k
16
Ví dụ về hồi qui bội
F

0 3.02
H
0
:
b
1
=
b
2
=…=
b
k
= 0
H
1
:
ít nhất là 1 trong
những
b
i

0
 = .05
bậc tự do= 2 và 316
Giá trị tới hạn
Thống kê kiểm
định:
Quyết định:
Kết luận:
Bác bỏ với rủi ro mức  = 0.05

Có ít nhất một trong các
biến phụ thuộc có liên
quan đến Y
 = 0.05
F
=
463.04
tiếp
3,024311468 =INVERSE.LOI.F(0,05;2;316)
17
Kiểm định mức ý nghĩa đối với
mỗi biến
 Chỉ ra xem liệu có mối liên hệ tuyến tính
giữa X
j
và Y
 Sử dụng thống kê Student với n-k bậc tự
do
 Các giả thuyết:
 H
0
:
b
i
= 0 (Không có mối liên hệ tuyến tính)
 H
1
:
b
i

 0 (có mối liên hệ tuyến tính giữa X
j
và Y)
18
Coefficients
a
70015,462 5900,669 11,866 ,000
72,500 2,880 ,716 25,172 ,000 ,995 1,005
-1657,031 108,867 -,433 -15,221 ,000 ,995 1,005
(Constant)
surface
age
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardi
zed
Coefficien
ts
t Sig. Tolerance VIF
Collinearity Statistics
Dependent Variable: prix
a.
Ví dụ về hồi qui bội
tiếp
i
i

t
b
b
s
b
*
ˆ
ˆ
ˆ
=
19
Các điều kiện vận dụng mô
hình
 Các điều kiện về dạng mô hình :
 Tuyến tính của các biến độc lập so với biến phụ
thuộc
 Các điều kiện về sai số mô hình (error):
 Các sai số mô hình là độc lập (không tự tương quan)
và phân phối giống nhau theo phân phối chuẩn với
trung bình bằng 0 và variance s
2
(homoscédasticité)
 Các điều kiện về các số dự đoán :
 Các biến độc lập không ngẫu nhiên
 Các giá trị của các biến độc lập được đo lường
không có sai số
 Các số dự đoán (prédicteurs) là độc lập theo đường
thẳng, (không có bội tương quan giữa các biến độc
lập - multicollinearity)
 Các điều kiện về quan sát:

 Tất cả các quan sát có cùng một vai trò
20
Mô hình với ảnh hưởng cố định ngược
với mô hình với ảnh hưởng ngẫu nhiên
 Về nguyên tắc, hồi qui được thực hiện đối
với các mô hình có ảnh hưởng cố định
 Các biến độc lập được kiểm soát
 Mô hình cũng hoạt động đối với các biến
có ảnh hưởng ngẫu nhiên
 Các biến độc lập là ngẫu nhiên
 Về nguyên tắc, các biến này phải tuân theo
một phân phối chuẩn đa biến
21
Tuyến tính
 Vẽ biểu đồ từng phần (partial plots)
 Để đánh giá đặc trưng tuyến tính của
một biến X
j
so với Y, chúng ta hồi qui
Y về toàn bộ các biến độc lập trừ X
j
,
và chúng ta hồi qui X
j
bằng các biến
độc lập khác
 Chúng ta vẽ biểu đồ các phần dư
(residues) của hai hồi qui. Như vậy,
chúng ta loại bỏ hiệu lực của các
biến độc lập khác.

22
Tuyến tính
tiếp
Partial Regression Plot
Dependent Variable: prix
surface
3000200010000-1000-2000
prix
200000
100000
0
-100000
-200000
23
Tuyến tính
tiếp
Partial Regression Plot
Dependent Variable: prix
age
806040200-20
prix
200000
100000
0
-100000
-200000
24
Scatterplot
Dependent Variable: prix
Regression Adjusted (Press) Predicted Value

4000003000002000001000000
Regression Studentized Residual
4
2
0
-2
-4
Biểu đồ phần dư (residues)
25
Biểu đồ (histogram) phần dư
(residues)
Regression Standardized Residual
3,2
5
2,7
5
2,25
1
,75
1,
25
,75
,25
-,2
5
-,75
-1,2
5
-1,75
-2

,25
-2,
75
-3,2
5
-3,75
Histogram
Dependent Variable: prix
Frequency
60
50
40
30
20
10
0
Std. Dev = 1,00
Mean = 0,00
N = 319,00

×