9/3/2014
Chương 2: Phân tích mơ hình hồi qui
tuyến tính đa biến
Khái niệm về phân tích hồi quy
Mơ hình hồi qui hai biến
Phương pháp bình phương nhỏ nhất
Mơ hình hồi quy đa biến
Các giả định của mơ hình hồi qui đa biến
Độ chính xác và sai số chuẩn của ước
lượng
Kiểm định giả thuyết mơ hình
Ví dụ mơ hình hồi qui đa biến
1
Khái niệm về phân tích hồi quy
Phân tích hồi quy đề cập đến việc nghiên
cứu sự phụ thuộc của một biến số, biến
phụ thuộc, vào một hay nhiều biến số khác,
biến độc lập, với ý định ước lượng và/hoặc
dự đốn giá trị trung bình (tổng thể) của
biến phụ thuộc dựa trên những giá trị đã
biết hay cố định của biến độc lập.
2
Ví dụ
Chúng ta quan tâm đến việc dự báo
chiều cao trung bình của những người
con khi biết chiều cao của người cha.
Dùng biểu đồ phân tán để biểu diễn
phân phối chiều cao của những người
con trong một tổng thể tương ứng với
chiều cao của những người cha được
cho trước hay cố định
3
1
9/3/2014
Giá trị trung bình
Chiều
cao
của
người
con
(tính
bằng
inch)
Chiều cao của người cha
(tính bằng inch)
Hình 1.1 Phân phối giả thiết của chiều cao của những người con
trai tương ứng với chiều cao của người cha được cho trước
4
Mơ hình hồi qui hai biến
Hàm hồi qui tổng thể (population regression
function – PRF) có dạng:
E(Y|Xi) = f (Xi)
Nếu PRF có 1 biến độc lập thì được gọi là
hàm hồi qui đơn (hồi qui hai biến), nếu có từ
2 biến độc lập trở lên được gọi là hàm hồi qui
bội
Hàm hồi qui tổng thể cho biết giá trị trung
bình của biến Y sẽ thay đổi như thế nào khi
biến X nhận các giá trị khác nhau.
5
Một ví dụ giả thiết
Giả sử có một tổng thể gồm 60 hộ gia đình, có
thu nhập (X) và chi tiêu (Y) hàng tuần như sau
6
2
9/3/2014
Một ví dụ giả thiết
Mặc dù có sự biến động lớn của Y ứng với mỗi
giá trị của X, nhưng, một cách tổng quát ,
X thì Y
Giá trị kỳ vọng của Y ứng với một giá trị nào đó
của X đgl Giá trị kỳ vọng có điều kiện, ký hiệu:
E(Y|X)
Ví dụ: E(Y|X = 80) = 65; E(Y|X = 260) = 173
Giá trị kỳ vọng khơng có điều kiện :
E(Y) = 7273/60 = 121,20
7
Phân phối có điều kiện của chi tiêu ứng với các
mức thu nhập khác nhau
8
Hàm hồi quy tổng thể
Đường nối các điểm tròn đen trong hình
là đường hồi quy tổng thể , biểu diễn sự
hồi quy của Y vào X.
Về mặt hình học, một đường hồi quy
tổng thể là quỹ tích các giá trị trung bình
có điều kiện của biến phụ thuộc ứng với
mỗi giá trị cố định của biến giải thích.
9
3
9/3/2014
Mơ hình hồi quy tuyến tính
Vậy kỳ vọng có điều kiện E(Y|Xi) là một
hàm số của Xi:
E(Y|Xi) = f (Xi)
Dạng hàm f(Xi) phụ thuộc vào các mối
quan hệ kinh tế (thường được xác định dựa
vào các lý thuyết kinh tế).
Hàm hồi quy tuyến tính: hàm số f (X) có
dạng hàm số bậc nhất.
10
Mơ hình hồi qui hai biến
Thuật ngữ “tuyến tính” ở đây được hiểu theo
hai nghĩa: tuyến tính đối với tham số và
tuyến tính đối với biến.
- Tuyến tính đối với tham số: E(Y|Xi) = β1+ β2Xi2
- Tuyến tính đối với biến số: E(Y|Xi) = β1+ β22Xi.
Chỉ phân tích hàm hồi qui tuyến tính đối với
tham số!!!
11
Các hàm số tuyến tính đối với tham số
12
4
9/3/2014
Mơ hình nào sau đây là tuyến tính???
1.
2.
3.
4.
Y 0 K L e u
5.
y i xi
1
Yi e
2
0 1 X i u i
Yi 0 12 X i ui
Yi
1
0 1 X i ui
1
ui
zi
13
Mơ hình hồi qui hai biến
PRF tuyến tính với tham số và biến số:
E(Y|Xi) = β1+ β2Xi
trong đó β1, β2 là các tham số chưa biết nhưng
cố định – các tham số hồi qui.
β1 là hệ số tự do, cho biết giá trị trung bình của
biến phụ thuộc Y khi biến X nhận giá trị 0.
2
EY | X
: tác động biên của X lên Y: hệ số
X
góc, cho biết giá trị trung bình của biến phụ thuộc
Y sẽ thay đổi (tăng or giảm) bao nhiêu đơn vị khi
giá trị của biến độc lập X tăng 1 đơn vị với điều
kiện các yếu tố khác không thay đổi.
14
Tác động biên của X lên Y ???
yi 1 xi 2 xi2 ui
ln yi 1 ln x1i 2 x2i ui
yi 1 ln x1i 2x2i ui
yi xi ui
y i xi
1
ui
zi
15
5
9/3/2014
Mơ hình hồi qui hai biến
Ứng với mỗi giá trị của X, giá trị Y của một số
quan sát có độ lệch so với giá trị kỳ vọng.
Giá trị quan sát thứ i của biến phụ thuộc Y
được ký hiệu làYi.
- Ký hiệu ui là chênh lệch giữa Yi và E(Y|Xi)
ui = Yi - E(Y|Xi)
Yi = E(Y|Xi) + ui (dạng ngẫu nhiên PRF)
ui đgl đại lượng ngẫu nhiên hay sai số ngẫu
nhiên, hay phần nhiễu, phần dư ngẫu nhiên.
16
Mơ hình hồi qui hai biến
Tại sao mỗi quan sát có một sai số so
với E(Y|X)???
Lý do cho sự tồn tại của ui
Yếu tố đại diện cho các biến khơng
đưa vào mơ hình:
biến khơng rõ, khơng có số liệu,
ảnh hưởng q nhỏ,
mơ hình tiết kiệm, dùng dạng sai, …
17
Mơ hình hồi qui hai biến
Trong thực tế, ta không thu thập được
số liệu tổng thể
Khơng tìm được hàm PRF,
Phải dựa trên hệ số hồi quy của mẫu để
suy diễn cho hệ số của PRF.
Hàm hồi qui mẫu (sample regression
function – SRF): được xác định từ số
liệu các mẫu được rút ra từ tổng thể.
18
6
9/3/2014
Mơ hình hồi qui hai biến
Nếu hàm PRF có dạng tuyến tính:
E(Y|Xi) = β1+ β2Xi,
Ta có SRF:
Yi 1 2 X i
trong đó Y i là ước lượng điểm của E(Y|Xi)
1 là ước lượng điểm của β1;
2 là ước lượng điểm của β2;
19
Hàm hồi qui mẫu
Do Ŷi là ước lượng của E(Yi|Xi) nên nó
có một chênh lệch ûi với Yi, hay:
Yi = Ŷi + ûi
(ûi còn được ký hiệu là ei: là ước lượng
điểm của ui và gọi là phần dư hay sai số
ngẫu nhiên)
Dạng ngẫu nhiên của SRF:
Yi 1 2 X i ei
20
Hàm hồi qui mẫu
Do 1 , 2 là các ước lượng của β1 và β2
nên:
ˆ1 1 và ˆ2 2
Các đường hồi quy mẫu không trùng với
đường hồi quy tổng thể.
Các giá trị ước lượng có thể có sự
chênh lệch với giá trị tổng thể
21
7
9/3/2014
Hàm hồi qui mẫu SRF và PRF
600
(PRF)
500
Tiêu dùng, Y (X D)
(SRF)
E(Y/Xi)
400
i
Yi
ei
Yi
300
2
200 1
2
100
1
Xi
0
0
100
200
300
400
500
600
700
800
900
22
Hàm hồi qui mẫu
Rõ ràng, các ước lượng từ hàm hồi quy
mẫu có thể ước lượng cao hơn
(overestimate) hay ước lượng thấp hơn
(underestimate) giá trị thực của tổng thể.
Vấn đề đặt ra là SRF được xây dựng
như thế nào để càng gần i thực càng
tốt, mặc dù ta không bao giờ biết i thực.
23
Phương pháp bình phương nhỏ nhất (OLS)
Ta có hàm SRF:
Yi 1 2 X i ei Yˆi ei
ei Yi Yˆi Yi 1 2 X i
ˆ
Ta muốn tìm ˆ 1 và 2 sao cho Yˆ gần bằng với Y
nhất, hay các ei nhỏ nhất.
Tiêu chuẩn 1: tìm các ˆ sao cho ei nhỏ nhất.
ei thường rất nhỏ và thậm chí bằng 0 vì các
sai số âm, dương triệt tiêu lẫn nhau.
24
8
9/3/2014
Phương pháp bình phương nhỏ nhất (OLS)
Tiêu chuẩn 2 : tìm các ˆ sao cho ei2
nhỏ nhất.
Khắc phục được sự triệt tiêu của các sai
số âm, dương.
Tìm được một bộ ˆ duy nhất từ số liệu
mẫu
Phương pháp “Bình phương nhỏ nhất”
thơng thường
OLS: Ordinary Least Squares
25
Phương pháp OLS
e Y
2
i
i
ei2 f ˆ1, ˆ2
ˆ 1 ˆ 2 X i
Tìm ˆ1 và ˆ 2sao cho hàm số:
đạt cực tiểu
2
Làm thế nào tìm giá trị cực tiểu của biểu
thức trên ???
Tính đạo hàm của f theo ˆ1 và ˆ2và cho
các đạo hàm = 0.
Giải hệ phương trình để tìm ˆ
26
Phương pháp OLS
Ta được hệ phương trình chuẩn:
Giải hệ ta được:
27
9
9/3/2014
Phương pháp OLS
Các hệ số ước lượng OLS
không tồn tại trong trường hợp
nào???
Khi X là hằng số!!!
28
Phương pháp OLS
ˆ1 và ˆ 2 đgl các ước lượng bình phương
nhỏ nhất của 1 và 2
Các thuộc tính của ˆ1 và ˆ 2
I. Ứng với 1 mẫu cho trước, ước lượng OLS là duy nhất.
II. Các ước lượng OLS là các ước lượng điểm, có nghĩa là,
với mẫu cho trước, mỗi ước lượng chỉ cho biết duy nhất
một giá trị của tham số của tổng thể nghiên cứu.
III. Một khi thu được các ước lượng từ mẫu, ta có thể vẽ
được đường hồi quy mẫu và đường này có những đặc
tính sau:
29
Đặc điểm của đường hồi quy mẫu
1. Nó đi qua giá trị trung bình mẫu của X và Y,
do
30
10
9/3/2014
Đặc điểm của đường hồi quy mẫu
2. Giá trị ước lượng trung bình của Y bằng với giá
trị trung bình của Y quan sát.
3. Giá trị trung bình của sai số ei bằng 0: ei = 0.
4. Sai số ei khơng có tương quan với giá trị dự
báo Yi. Chứng minh!!!
5. Sai số ei khơng có tương quan với Xi. Chứng
minh!!!
31
Mơ hình hồi quy bội (đa biến)
Giả sử ta có mơ hình
Yi ˆ1 ˆ2 X2i ˆ3 X3i ei
hồi quy 3 biến của mẫu:
Những quy tắc tương tự
cũng được dùng cho
minei2 min Yi ˆ1 ˆ2 X2i ˆ3 X3i
mơ hình đa biến:
2
Các hệ số được tính
bằng cơng thức:
32
Độ chính xác hay sai số chuẩn của các
ước lượng OLS
Các giá trị của ước lượng OLS phụ thuộc
vào số liệu của mẫu. Số liệu giữa các mẫu
khác nhau lại khác nhau => cần đo lường
độ chính xác của các ước lượng.
Nếu ˆ là ước lượng khơng chệch của , ta
có E(ˆ ) = , nhưng ˆ .
Sự phân tán của ˆ quanh được đo lường
bằng sai số chuẩn (standard error – s.e.)
33
11
9/3/2014
Phương sai và Sai số chuẩn của các ước lượng
OLS trong mơ hình 2 biến
Trong đó:
var: phương sai;
se: sai số chuẩn và
2: phương sai của sai số, có
thể được ước lượng bằng
cơng thức:
e2
ˆ 2 i
n2
2
i
e
: Tổng bình phương
của các sai số
(Residual sum of
squares – RSS)
e ( Y Yˆ ) y
2
i
2
i
i
2
i
ˆ 22 x i2
34
Phương sai và Sai số chuẩn của các
ước lượng OLS trong mơ hình 2 biến
ˆ
e
2
i
Sai số chuẩn của hồi quy
(se):
• Độ lệch giữa giá trị Y so với
n 2 đường hồi quy
• “Độ tin cậy của mơ hình ”
(goodness of fit).
35
Phương sai và Sai số chuẩn của các
ước lượng OLS trong mơ hình 3 biến
2: phương sai
của sai số, có
thể được ước
lượng bằng
cơng thức:
ˆ 2
e
2
i
n3
36
12
9/3/2014
Một số đặc điểm của phương sai hay se
của các ước lượng OLS
1. Phương sai của ước lượng 2 tỷ lệ với 2,
nhưng nghịch biến với xi2. Do vậy, X biến
động càng lớn, se càng nhỏ => ước lượng
càng chính xác; n càng lớn, càng chính
xác.
2. Phương sai của ước lượng 1 tỷ lệ với 2
và Xi2, nhưng nghịch biến với xi2 và cở
mẫu
37
Hệ số xác định R2: một thước đo Độ tin
cậy của mơ hình
Gọi TSS (Tổng bình phương sai số tổng cộng):
TSS = (Yi -Y)2
ESS: bình phương sai số được giải thích
ESS = ( Yˆi -Y)2
RSS: tổng bình phương sai số:
RSS = ei2
Ta chứng minh được: TSS = ESS + RSS
R2
ESS
RSS
1
TSS
TSS
38
Hệ số xác định R2
R2 cho biết % sự biến động của Y được giải thích
bởi các biến số X trong mơ hình.
0 < R2 < 1
R2 1: mơ hình giải thích được càng nhiều sự
biến động của Y mơ hình càng đáng tin cậy.
Một nhược điểm của R2 là giá trị của nó tăng khi
số biến X đưa vào mơ hình tăng, bất chấp biến
đưa vào khơng có liên quan.
Cần sử dụng R2 điều chỉnh (adjusted R2 -R2) để
quyết định việc đưa thêm biến vào mơ hình.
39
13
9/3/2014
Hệ số xác định điều chỉnhR2
2
R 1 (1 R2 )
n 1
nk
• Khi k > 1, R2 < R2. Do vậy, khi số biến X
tăng,R2 sẽ tăng ít hơn R2.
• Khi đưa thêm biến vào mơ hình mà làm
choR2 tăng thì nên đưa biến vào và ngược
lại.
40
Giả định của mơ hình hồi qui đa biến
(1) Giả định 1: Tuyến tính các tham số hồi qui
(linear in parameters).
(2) Giả định 2: Các giá trị mẫu của Xj được ước
lượng đúng, không có sai số (random
sampling): Giá trị các biến giải thích là các
số đã được xác định.
(3) Giả định 3: Kỳ vọng hoặc trung bình số học
của các sai số là bằng 0 (zero conditional
mean).
E(u|xi) = 0
41
Giả định 3: E(ui|xi) = 0
42
14
9/3/2014
Giả định của mơ hình hồi qui đa biến
(4) Giả định 4: Các sai số u độc lập với biến
giải thích.
Cov(ui, Xi) = 0
(5) Giả định 5: Các sai số ui có phương sai bằng
nhau (homoscedasticity) ở tất cả các giá trị
của Xi.
Var(ui|Xi) = σ2
43
Giả định 5: Var(u|Xi) = σ2
44
Phương sai sai số không đồng nhất:
var(ui|Xi) = i2
45
15
9/3/2014
Giả định của mơ hình hồi qui đa biến
(6) Giả định 6: Các sai số u từng cặp độc lập với nhau.
Cov(ui, ui’) = E(uiui’) = 0, nếu i i’
46
Giả định của mơ hình hồi qui đa biến
(7) Giả định: Khơng có biến độc lập nào là hằng số,
và khơng tồn tại các mối liên hệ tuyến tính hồn
tồn chính xác giữa các biến độc lập (no perfect
multicollinearity).
(8) Số quan sát n phải lớn hơn số biến độc lập.
(9) Mơ hình hồi quy được xác định đúng đắn: khơng
có sai lệch về dạng mơ hình.
47
Sai lệch về dạng mơ hình
48
16
9/3/2014
Định lý Gauss-Markov
Một ước lượng được gọi là “ước lượng khơng chệch tuyến
tính tốt nhất” (BLUE) nếu thỏa các điều kiện:
Nó là tuyến tính, có nghĩa i là một hàm tuyến tính của một
biến ngẫu nhiên, chẳng hạn như Y.
Nó khơng chệch, E ˆ
i
i
Nó có phương sai nhỏ nhất, hay cịn gọi là ước lượng hiệu quả
(efficient estimator).
Định lý : Với những giả định của mơ hình hồi quy cổ điển,
các ước lượng bình phương bé nhất có phương sai nhỏ
nhất, trong nhóm những ước lượng tuyến tính khơng chệch,
tức là, chúng là BLUE.
49
Chứng minh định lý Gauss-Markov
xi yi xi Yi Y xiYi xi Y
ˆ 2
xi2
xi2
xi2
x Y Y X X x Y
x
x
x
k Y
i i
2
i
i
i i
2
i
2
i
Y
X X x Y
i
2
i
x
i i
2
i
x
i i
Trong đó:
ki
xi
2
i
x
Vậy 2 là một hàm tuyến tính của Y.
50
Một số thuộc tính của ki
1. Do Xi là không ngẫu nhiên nên ki cũng không
ngẫu nhiên.
2. ki = 0.
3. ki2 = 1/xi2.
4. kixi = kiXi = 1.
Chứng minh:
x 0
x
k x k X X k X
x
x
x 1
x
x
k
i
i
i
i
2
i
i
i
i
2
i
i
i
2
i
2
i
i
X ki ki X i
51
17
9/3/2014
Chứng minh: không chệch
ˆ 2 k i Yi k i 1 2 X i u i
1 k i 2 k i X i k i ui
2 ki ui
E ˆ 2 2 ki E ui 2
Lấy kỳ vọng 2 vế:
(Do ki là phi ngẫu nhiên nên có thể được xem như là
đại lượng cố định)
52
Phương sai của ˆ 2
E ˆ
var ˆ 2 E ˆ 2 E ˆ 2
2
2
2
2
E k iu i
2
E k12 u12 k 22 u22 ... k n2u n2 2k1k 2 u1u 2 ... 2k n 1k n u n 1u n
Theo giả thiết: E(ui2) = 2 với mỗi i và E(uiuj) = 0, ta có:
2
var ˆ 2 2 k i2
xi2
Chứng minh phương sai của ˆ 2 là nhỏ nhất, xem
Gujarati (2004), trang 104.
53
Kiểm định giả thuyết mơ hình
Kiểm định giả thuyết về các giá trị của
Tại sao lại cần kiểm định một khi đã tìm
được các ˆ ???
ˆ được tính từ mẫu,
Mỗi mẫu có thể cho các ˆ khác nhau,
Cần xây dựng khoảng tin cậy cho của
tổng thể:
Pr ˆ ˆ 1
54
18
9/3/2014
Kiểm định giả thuyết mơ hình
CLRM cịn giả định ui theo phân phối chuẩn:
ui ~ N(0, 2) Yi ~ N( 1 + 2Xi, 2).
Do ui theo phân phối chuẩn, các ước lượng
OLS của 1 và 2 cũng theo phân phối
chuẩn vì chúng là các hàm số tuyến tính của
ui.
Chúng ta có thể áp dụng các kiểm định t, F,
và 2 để kiểm định các giả thuyết về các ước
lượng OLS.
55
1. Xây dựng khoảng tin cậy của 1 và 2
Xây dựng khoảng tin cậy cho 2
Pr( 2 - 2 2 + ) = 1 - .
( 2 - , 2 + ): là khoảng tin cậy,
1 - : hệ số tin cậy,
với (0 < < 1): là mức ý nghĩa.
Ví dụ: nếu = 0,05 = 5%, ta đọc “xác
suất để khoảng tin cậy chứa giá trị thực
của 2 là 95%.
56
Khoảng tin cậy của 2
Do 2 không biết trước, ta thường dùng ước
lượng không chệch của nó là 2, ta có:
Biến t sẽ theo phân phối t với bậc tự do n – k (số
tham số được ước lượng kể cả hệ số tự do).
Khoảng tin cậy từ phân phối t:
Pr(-t/2 < t < t/2)
57
19
9/3/2014
Kiểm định 2 đuôi
Giả sử ta muốn kiểm định giả thuyết:
H0: K = 0 và H1: K 0.
Quy tắc quyết định: Xây dựng khoảng
tin cậy 100(1-) cho 2.
Nếu giá trị 2 nằm trong khoảng tin cậy
này, ta chấp nhận H0,
Nếu nó nằm ngồi, ta bác bỏ H0.
Hay so sánh |t | với t/2, n - k
58
Kiểm định giả thuyết mơ hình
1. Kiểm định giả thuyết về từng phần tử của
Thông thường, đặt giả thuyết H0: k = 0, nghĩa là
biến Xk không ảnh hưởng đến Y, khi đó:
t
ˆ k
~ t ( nk )
se ( ˆ k )
Nếu |t| < t/2, (n-k): chấp nhận H0: k = 0 ở mức ý nghĩa ,
có nghĩa là Xk khơng có ảnh hưởng đến Y.
Nếu |t| > t/2, (n-k): bác bỏ H0 và chấp nhận H1: i 0 ở
mức ý nghĩa , có nghĩa là Xk có ảnh hưởng đến Y.
59
Kiểm định 2 đuôi
Nếu:
t nk
ˆ k
t n k , / 2
se ˆ k
• Chấp nhận H0: k = 0, hay bác bỏ H1.
• Ngược lại, bác bỏ H0, chấp nhận H1: k 0
60
20
9/3/2014
Kiểm định giả thuyết mơ hình
2. Kiểm định ảnh hưởng tất cả các biến độc lập
cùng lúc
Giả thuyết của kiểm định này là:
H0: 2 = 3 =... = k = 0
F
ESS n k
.
k 1 RSS
Bác bỏ H0 khi F > F(k-1, n-k),, nghĩa là có ít nhất một tham
số khác 0 ; hoặc là có ít nhất một biến có ảnh hưởng
đến Y.
F < F(k - 1, n – k), thì chấp nhận H0, nghĩa là tất cả các
tham số 2, 3, ... , k đều bằng 0; hoặc là khơng có biến
độc lập nào ảnh hưởng đến Y.
61
Phương pháp dự đoán trong mơ hình hồi
qui
Cho trước 1 giá trị X0, ta có thể dùng mơ hình hồi
quy để dự báo giá trị Y ứng với một mức tin cậy
nào đó. Công thức:
1 ( X o x) 2
( ˆ1 ˆ2 X 0 ) t / 2 s
n
xi 2
s: sai số chuẩn của ước lượng
s ˆ
e
2
i
n2
62
Ví dụ: Có bộ số liệu về chi tiêu và thu nhập của
hộ gia đình ở VN 1998 như sau:
Variable Obs
Mean
Std.Dev
Totalexp 5999
rincome 5999
hhsize
5999
dur_asset5999
14178.5
15274
4.77196
1841.79
11859.6 678.37 219548
18534.7 -29524.4 445334
1.9651
1
19
3211.03 0
81398.3
Min
Max
Label
total expenditures
Real Total Income
Household size
Consumer durable
Ta cần kiểm định mối quan hệ giữa mức chi tiêu của hộ gia
đình với thu nhập của hộ gia đình, số nhân khẩu, giá trị tài
sản của hộ.
63
21
9/3/2014
Kết quả ước lượng mơ hình hồi quy
reg totalexp rincome hhsize dur_asset
Source |
SS
df
MS
-------------+-----------------------------Model | 5.9149e+11 3 1.9716e+11
Residual | 2.5214e+11 5995 42057950.5
-------------+-----------------------------Total | 8.4362e+11 5998 140651047
Number of obs = 5999
F( 3, 5995) = 4687.88
Prob > F
= 0.0000
R-squared = 0.7011
Adj R-squared = 0.7010
Root MSE
= 6485.2
-----------------------------------------------------------------------------totalexp |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------rincome | 0.1632861 .0058562 27.88 0.000 .1518057 .1747664
hhsize | 1142.227 43.80872 26.07 0.000 1056.346 1228.107
dur_asset | 2.237371 .0330819 67.63 0.000 2.172518 2.302224
_cons | 2113.036 221.9352 9.52 0.000 1677.963 2548.109
-----------------------------------------------------------------------------64
Trình bày Kết quả
Dạng phương trình:
totalex p 2113 0,163rincome 1142hhsize 2,237dur _ asset
se
(222) (0,006)
(20,222)
(0,033)
t
9,52*** 27,88***
N = 5999
R2
43,81***
67, 63***
= 0,70
65
Trình bày Kết quả
Dạng bảng:
----------------------------------------Mơ hình
totalexp
t
----------------------------------------rincome
0.163***
(27.88)
hhsize
1142.2***
(26.07)
dur_aaset
2.237***
(67.63)
Hằng số
2113.0***
(9.52)
----------------------------------------Số quan sát
5999
R2
0.701
----------------------------------------* p<0.05, ** p<0.01, *** p<0.001
66
22
9/3/2014
Trình bày và giải thích Kết quả
Các biến độc lập trong mơ hình giải thích
70% sự biến động trong chi tiêu của hộ.
Hệ số ước lượng của các biến độc lập đều
có ý nghĩa thống kê, chứng tỏ các biến độc
lập đều có ảnh hưởng đến chi tiêu.
Khi thu nhập tăng thêm 1 đồng, chi tiêu
bình quân tăng 0,163 đồng, trong điều kiện
các yếu tố khác không đổi.
Ý nghĩa của các hệ số ước lượng của biến
hhsize và dur_aaset???
67
Câu hỏi và bài tập
1. Gọi kids và educ lần lượt là số con và số
năm học của những người phụ nữ. Giả sử
ta thực hiện mơ hình hồi quy đơn giản sau:
kids = 0 + 1educ + u,
a. u có thể bao gồm có yếu tố nào, chúng có
tương quan với educ khơng?
b. Mơ hình trên có thể biểu diễn tác động của
educ lên kids trong điều kiện các yếu tố
không đổi không?
68
Câu hỏi và bài tập
2. Bảng sau chứa thông tin về điểm thi đầu
vào (dv) và điểm trung bình tích lũy (dtb)
của 8 sinh viên.
SV
1
2
3
4
5
6
7
8
dv
21
24
26
27
29
25
25
30
dtb
2.8
3.4
3.0
3.5
3.6
3.0
2.7
3.7
a. Ước lượng mơ hình: dtb = 0 + 1dv + u bằng
OLS. Hằng số trong mơ hình này có ý nghĩa
gì khơng? Diễn giải kết quả. Nếu dv tăng
thêm 5 điểm thì dtb trung bình tăng thêm bao
nhiêu
69
23
9/3/2014
Câu hỏi và bài tập
b. Tính giá trị dự báo và sai số cho từng quan
sát và chứng tỏ tổng các sai số = 0.
c. Tính giá trị dự báo khi dv = 20.
d. Dv giải thích bao nhiêu % sự biến động của
dtb đối với số liệu của mẫu này?
e. Thực hiện các kiểm định t và F về hệ số hồi
quy của các biến độc lập.
70
Câu hỏi và bài tập
3. Giải thích các phát biểu sau đây đúng, sai
hay không chắc chắn.
a. Do hệ số tương quan giữa X và Y nằm trong
khoảng [-1;1], hiệp phương sai giữa chúng,
cov(X,Y) cũng nằm trong khoảng này.
b. Nếu hệ số tương quan giữa 2 biến số = 0, có
nghĩa là khơng có mối quan hệ nào giữa 2
biến này.
c. Nếu ta hồi quy giữa Y với Ŷ, hệ số tự do và hệ
số góc lần lượt là 0 và 1.
71
24