chuong 2 hoi quy tuyen tinh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2 MB, 24 trang )

9/3/2014

Chương 2: Phân tích mơ hình hồi qui
tuyến tính đa biến







Khái niệm về phân tích hồi quy
Mơ hình hồi qui hai biến
Phương pháp bình phương nhỏ nhất
Mơ hình hồi quy đa biến
Các giả định của mơ hình hồi qui đa biến
Độ chính xác và sai số chuẩn của ước
lượng
 Kiểm định giả thuyết mơ hình
 Ví dụ mơ hình hồi qui đa biến
1

Khái niệm về phân tích hồi quy
 Phân tích hồi quy đề cập đến việc nghiên
cứu sự phụ thuộc của một biến số, biến
phụ thuộc, vào một hay nhiều biến số khác,
biến độc lập, với ý định ước lượng và/hoặc
dự đốn giá trị trung bình (tổng thể) của
biến phụ thuộc dựa trên những giá trị đã
biết hay cố định của biến độc lập.

2

Ví dụ
 Chúng ta quan tâm đến việc dự báo
chiều cao trung bình của những người
con khi biết chiều cao của người cha.
 Dùng biểu đồ phân tán để biểu diễn
phân phối chiều cao của những người
con trong một tổng thể tương ứng với
chiều cao của những người cha được
cho trước hay cố định
3

1

9/3/2014

Giá trị trung bình
Chiều
cao
của
người
con
(tính
bằng
inch)

Chiều cao của người cha
(tính bằng inch)

Hình 1.1 Phân phối giả thiết của chiều cao của những người con
trai tương ứng với chiều cao của người cha được cho trước

4

Mơ hình hồi qui hai biến
 Hàm hồi qui tổng thể (population regression
function – PRF) có dạng:
E(Y|Xi) = f (Xi)
Nếu PRF có 1 biến độc lập thì được gọi là
hàm hồi qui đơn (hồi qui hai biến), nếu có từ
2 biến độc lập trở lên được gọi là hàm hồi qui
bội
 Hàm hồi qui tổng thể cho biết giá trị trung
bình của biến Y sẽ thay đổi như thế nào khi
biến X nhận các giá trị khác nhau.
5

Một ví dụ giả thiết
 Giả sử có một tổng thể gồm 60 hộ gia đình, có
thu nhập (X) và chi tiêu (Y) hàng tuần như sau

6

2

9/3/2014

Một ví dụ giả thiết

 Mặc dù có sự biến động lớn của Y ứng với mỗi
giá trị của X, nhưng, một cách tổng quát ,
X thì Y
 Giá trị kỳ vọng của Y ứng với một giá trị nào đó
của X đgl Giá trị kỳ vọng có điều kiện, ký hiệu:
E(Y|X)
 Ví dụ: E(Y|X = 80) = 65; E(Y|X = 260) = 173
 Giá trị kỳ vọng khơng có điều kiện :
E(Y) = 7273/60 = 121,20
7

Phân phối có điều kiện của chi tiêu ứng với các
mức thu nhập khác nhau

8

Hàm hồi quy tổng thể
 Đường nối các điểm tròn đen trong hình
là đường hồi quy tổng thể , biểu diễn sự
hồi quy của Y vào X.
 Về mặt hình học, một đường hồi quy
tổng thể là quỹ tích các giá trị trung bình
có điều kiện của biến phụ thuộc ứng với
mỗi giá trị cố định của biến giải thích.

9

3

9/3/2014

Mơ hình hồi quy tuyến tính
 Vậy kỳ vọng có điều kiện E(Y|Xi) là một
hàm số của Xi:
E(Y|Xi) = f (Xi)
 Dạng hàm f(Xi) phụ thuộc vào các mối
quan hệ kinh tế (thường được xác định dựa
vào các lý thuyết kinh tế).
 Hàm hồi quy tuyến tính: hàm số f (X) có
dạng hàm số bậc nhất.
10

Mơ hình hồi qui hai biến
 Thuật ngữ “tuyến tính” ở đây được hiểu theo
hai nghĩa: tuyến tính đối với tham số và
tuyến tính đối với biến.
- Tuyến tính đối với tham số: E(Y|Xi) = β1+ β2Xi2
- Tuyến tính đối với biến số: E(Y|Xi) = β1+ β22Xi.
 Chỉ phân tích hàm hồi qui tuyến tính đối với
tham số!!!

11

Các hàm số tuyến tính đối với tham số

12

4

9/3/2014

Mơ hình nào sau đây là tuyến tính???
1.
2.
3.
4.

Y   0 K  L e u

5.

y i     xi  

1

Yi  e

2

 0  1 X i  u i

Yi   0  12 X i  ui
Yi 

1
 0   1 X i  ui

1

 ui
zi
13

Mơ hình hồi qui hai biến
 PRF tuyến tính với tham số và biến số:
E(Y|Xi) = β1+ β2Xi
trong đó β1, β2 là các tham số chưa biết nhưng
cố định – các tham số hồi qui.
 β1 là hệ số tự do, cho biết giá trị trung bình của
biến phụ thuộc Y khi biến X nhận giá trị 0.


2 

EY | X 
: tác động biên của X lên Y: hệ số
X

góc, cho biết giá trị trung bình của biến phụ thuộc
Y sẽ thay đổi (tăng or giảm) bao nhiêu đơn vị khi
giá trị của biến độc lập X tăng 1 đơn vị với điều
kiện các yếu tố khác không thay đổi.
14

Tác động biên của X lên Y ???



yi    1 xi   2 xi2  ui





ln yi    1 ln x1i  2 x2i  ui
yi    1 ln x1i  2x2i  ui
yi     xi  ui

y i     xi  

1
 ui
zi

15

5

9/3/2014

Mơ hình hồi qui hai biến
 Ứng với mỗi giá trị của X, giá trị Y của một số
quan sát có độ lệch so với giá trị kỳ vọng.
 Giá trị quan sát thứ i của biến phụ thuộc Y
được ký hiệu làYi.
- Ký hiệu ui là chênh lệch giữa Yi và E(Y|Xi)
ui = Yi - E(Y|Xi)
 Yi = E(Y|Xi) + ui (dạng ngẫu nhiên PRF)

ui đgl đại lượng ngẫu nhiên hay sai số ngẫu
nhiên, hay phần nhiễu, phần dư ngẫu nhiên.
16

Mơ hình hồi qui hai biến
 Tại sao mỗi quan sát có một sai số so
với E(Y|X)???
 Lý do cho sự tồn tại của ui
 Yếu tố đại diện cho các biến khơng
đưa vào mơ hình:
 biến khơng rõ, khơng có số liệu,
 ảnh hưởng q nhỏ,
 mơ hình tiết kiệm, dùng dạng sai, …
17

Mơ hình hồi qui hai biến
 Trong thực tế, ta không thu thập được
số liệu tổng thể
 Khơng tìm được hàm PRF,
 Phải dựa trên hệ số hồi quy của mẫu để
suy diễn cho hệ số của PRF.

 Hàm hồi qui mẫu (sample regression
function – SRF): được xác định từ số
liệu các mẫu được rút ra từ tổng thể.
18

6

9/3/2014

Mơ hình hồi qui hai biến
 Nếu hàm PRF có dạng tuyến tính:
E(Y|Xi) = β1+ β2Xi,



 Ta có SRF:
Yi  1   2 X i


trong đó Y i là ước lượng điểm của E(Y|Xi)
 1 là ước lượng điểm của β1;

 2 là ước lượng điểm của β2;
19

Hàm hồi qui mẫu
 Do Ŷi là ước lượng của E(Yi|Xi) nên nó
có một chênh lệch ûi với Yi, hay:
Yi = Ŷi + ûi
(ûi còn được ký hiệu là ei: là ước lượng
điểm của ui và gọi là phần dư hay sai số
ngẫu nhiên)
 Dạng ngẫu nhiên của SRF:




Yi  1  2 X i  ei
20

Hàm hồi qui mẫu




 Do 1 ,  2 là các ước lượng của β1 và β2
nên:
ˆ1  1 và ˆ2   2
 Các đường hồi quy mẫu không trùng với
đường hồi quy tổng thể.
 Các giá trị ước lượng có thể có sự
chênh lệch với giá trị tổng thể

21

7

9/3/2014

Hàm hồi qui mẫu SRF và PRF
600
(PRF)

500
Tiêu dùng, Y (X D)

(SRF)

E(Y/Xi)

400

i

Yi
ei

Yi

300

2

200 1
2
100

1
Xi

0
0

100

200

300

400

500

600

700

800

900
22

Hàm hồi qui mẫu
 Rõ ràng, các ước lượng từ hàm hồi quy
mẫu có thể ước lượng cao hơn
(overestimate) hay ước lượng thấp hơn
(underestimate) giá trị thực của tổng thể.
 Vấn đề đặt ra là SRF được xây dựng
như thế nào để càng gần  i thực càng
tốt, mặc dù ta không bao giờ biết  i thực.
23

Phương pháp bình phương nhỏ nhất (OLS)
Ta có hàm SRF:




Yi  1  2 X i  ei  Yˆi  ei




 ei  Yi Yˆi  Yi  1  2 X i

ˆ

 Ta muốn tìm ˆ 1 và  2 sao cho Yˆ gần bằng với Y
nhất, hay các ei nhỏ nhất.
 Tiêu chuẩn 1: tìm các ˆ sao cho ei nhỏ nhất.
 ei thường rất nhỏ và thậm chí bằng 0 vì các
sai số âm, dương triệt tiêu lẫn nhau.
24

8

9/3/2014

Phương pháp bình phương nhỏ nhất (OLS)
 Tiêu chuẩn 2 : tìm các ˆ sao cho ei2
nhỏ nhất.
 Khắc phục được sự triệt tiêu của các sai
số âm, dương.
 Tìm được một bộ ˆ duy nhất từ số liệu
mẫu

 Phương pháp “Bình phương nhỏ nhất”
thơng thường
 OLS: Ordinary Least Squares
25

Phương pháp OLS

 e   Y
2
i

i


ei2  f ˆ1, ˆ2 

 ˆ 1  ˆ 2 X i

 Tìm ˆ1 và ˆ 2sao cho hàm số:
đạt cực tiểu

2

Làm thế nào tìm giá trị cực tiểu của biểu
thức trên ???
 Tính đạo hàm của f theo ˆ1 và ˆ2và cho
các đạo hàm = 0.
 Giải hệ phương trình để tìm ˆ
26

Phương pháp OLS
 Ta được hệ phương trình chuẩn:

 Giải hệ ta được:

27

9

9/3/2014

Phương pháp OLS
Các hệ số ước lượng OLS
không tồn tại trong trường hợp
nào???
Khi X là hằng số!!!

28

Phương pháp OLS
ˆ1 và ˆ 2 đgl các ước lượng bình phương
nhỏ nhất của  1 và  2

Các thuộc tính của ˆ1 và ˆ 2
I. Ứng với 1 mẫu cho trước, ước lượng OLS là duy nhất.
II. Các ước lượng OLS là các ước lượng điểm, có nghĩa là,
với mẫu cho trước, mỗi ước lượng chỉ cho biết duy nhất
một giá trị của tham số của tổng thể nghiên cứu.

III. Một khi thu được các ước lượng từ mẫu, ta có thể vẽ
được đường hồi quy mẫu và đường này có những đặc
tính sau:
29

Đặc điểm của đường hồi quy mẫu
1. Nó đi qua giá trị trung bình mẫu của X và Y,
do

30

10

9/3/2014

Đặc điểm của đường hồi quy mẫu

2. Giá trị ước lượng trung bình của Y bằng với giá
trị trung bình của Y quan sát.

3. Giá trị trung bình của sai số ei bằng 0: ei = 0.
4. Sai số ei khơng có tương quan với giá trị dự
báo Yi. Chứng minh!!!
5. Sai số ei khơng có tương quan với Xi. Chứng
minh!!!
31

Mơ hình hồi quy bội (đa biến)
 Giả sử ta có mơ hình

Yi  ˆ1  ˆ2 X2i  ˆ3 X3i  ei
hồi quy 3 biến của mẫu:
 Những quy tắc tương tự
cũng được dùng cho
minei2  min Yi  ˆ1  ˆ2 X2i  ˆ3 X3i
mơ hình đa biến:





2

 Các hệ số được tính

bằng cơng thức:

32

Độ chính xác hay sai số chuẩn của các
ước lượng OLS
 Các giá trị của ước lượng OLS phụ thuộc
vào số liệu của mẫu. Số liệu giữa các mẫu
khác nhau lại khác nhau => cần đo lường
độ chính xác của các ước lượng.
 Nếu ˆ là ước lượng khơng chệch của , ta
có E(ˆ ) = , nhưng ˆ  .
 Sự phân tán của ˆ quanh  được đo lường
bằng sai số chuẩn (standard error – s.e.)
33

11

9/3/2014

Phương sai và Sai số chuẩn của các ước lượng
OLS trong mơ hình 2 biến
Trong đó:
var: phương sai;
se: sai số chuẩn và
2: phương sai của sai số, có
thể được ước lượng bằng
cơng thức:

e2
ˆ 2   i
n2

2
i

e

: Tổng bình phương
của các sai số
(Residual sum of
squares – RSS)

 e   ( Y  Yˆ )   y

2
i

2

i

i

2
i

 ˆ 22  x i2
34

Phương sai và Sai số chuẩn của các
ước lượng OLS trong mơ hình 2 biến

ˆ 

e

2
i

Sai số chuẩn của hồi quy
(se):
• Độ lệch giữa giá trị Y so với

n  2 đường hồi quy

• “Độ tin cậy của mơ hình ”
(goodness of fit).
35

Phương sai và Sai số chuẩn của các
ước lượng OLS trong mơ hình 3 biến
2: phương sai
của sai số, có
thể được ước
lượng bằng
cơng thức:

ˆ 2 

e

2
i

n3

36

12

9/3/2014

Một số đặc điểm của phương sai hay se

của các ước lượng OLS
1. Phương sai của ước lượng 2 tỷ lệ với 2,
nhưng nghịch biến với xi2. Do vậy, X biến
động càng lớn, se càng nhỏ => ước lượng
càng chính xác; n càng lớn, càng chính
xác.
2. Phương sai của ước lượng 1 tỷ lệ với 2
và Xi2, nhưng nghịch biến với xi2 và cở
mẫu
37

Hệ số xác định R2: một thước đo Độ tin
cậy của mơ hình
 Gọi TSS (Tổng bình phương sai số tổng cộng):
TSS = (Yi -Y)2
 ESS: bình phương sai số được giải thích
ESS = ( Yˆi -Y)2
 RSS: tổng bình phương sai số:
RSS = ei2
 Ta chứng minh được: TSS = ESS + RSS

R2 

ESS
RSS
1
TSS
TSS
38

Hệ số xác định R2
 R2 cho biết % sự biến động của Y được giải thích
bởi các biến số X trong mơ hình.
 0 < R2 < 1
 R2  1: mơ hình giải thích được càng nhiều sự
biến động của Y  mơ hình càng đáng tin cậy.
 Một nhược điểm của R2 là giá trị của nó tăng khi
số biến X đưa vào mơ hình tăng, bất chấp biến
đưa vào khơng có liên quan.
 Cần sử dụng R2 điều chỉnh (adjusted R2 -R2) để
quyết định việc đưa thêm biến vào mơ hình.
39

13

9/3/2014

Hệ số xác định điều chỉnhR2
2

R  1 (1 R2 )

n 1
nk

• Khi k > 1, R2 < R2. Do vậy, khi số biến X
tăng,R2 sẽ tăng ít hơn R2.
• Khi đưa thêm biến vào mơ hình mà làm
choR2 tăng thì nên đưa biến vào và ngược

lại.
40

Giả định của mơ hình hồi qui đa biến
(1) Giả định 1: Tuyến tính các tham số hồi qui
(linear in parameters).
(2) Giả định 2: Các giá trị mẫu của Xj được ước
lượng đúng, không có sai số (random
sampling): Giá trị các biến giải thích là các
số đã được xác định.
(3) Giả định 3: Kỳ vọng hoặc trung bình số học
của các sai số là bằng 0 (zero conditional
mean).
E(u|xi) = 0
41

Giả định 3: E(ui|xi) = 0

42

14

9/3/2014

Giả định của mơ hình hồi qui đa biến
(4) Giả định 4: Các sai số u độc lập với biến
giải thích.
Cov(ui, Xi) = 0
(5) Giả định 5: Các sai số ui có phương sai bằng

nhau (homoscedasticity) ở tất cả các giá trị
của Xi.
Var(ui|Xi) = σ2

43

Giả định 5: Var(u|Xi) = σ2

44

Phương sai sai số không đồng nhất:
var(ui|Xi) = i2

45

15

9/3/2014

Giả định của mơ hình hồi qui đa biến
(6) Giả định 6: Các sai số u từng cặp độc lập với nhau.
Cov(ui, ui’) = E(uiui’) = 0, nếu i  i’

46

Giả định của mơ hình hồi qui đa biến
(7) Giả định: Khơng có biến độc lập nào là hằng số,
và khơng tồn tại các mối liên hệ tuyến tính hồn
tồn chính xác giữa các biến độc lập (no perfect

multicollinearity).
(8) Số quan sát n phải lớn hơn số biến độc lập.
(9) Mơ hình hồi quy được xác định đúng đắn: khơng
có sai lệch về dạng mơ hình.

47

Sai lệch về dạng mơ hình

48

16

9/3/2014

Định lý Gauss-Markov
 Một ước lượng được gọi là “ước lượng khơng chệch tuyến
tính tốt nhất” (BLUE) nếu thỏa các điều kiện:
 Nó là tuyến tính, có nghĩa i là một hàm tuyến tính của một
biến ngẫu nhiên, chẳng hạn như Y.
 Nó khơng chệch, E ˆ  
i
i
 Nó có phương sai nhỏ nhất, hay cịn gọi là ước lượng hiệu quả
(efficient estimator).

 

 Định lý : Với những giả định của mơ hình hồi quy cổ điển,

các ước lượng bình phương bé nhất có phương sai nhỏ
nhất, trong nhóm những ước lượng tuyến tính khơng chệch,
tức là, chúng là BLUE.

49

Chứng minh định lý Gauss-Markov





 xi yi   xi Yi  Y   xiYi   xi Y
ˆ 2 
 xi2
 xi2
 xi2
 x Y  Y  X  X    x Y
x
x
x
 k Y


i i
2
i

i

i i
2
i

2
i



Y

 X   X    x Y
i

2
i

x

i i
2
i

x

i i

Trong đó:

ki 

xi
2
i

x

Vậy  2 là một hàm tuyến tính của Y.
50

Một số thuộc tính của ki
1. Do Xi là không ngẫu nhiên nên ki cũng không
ngẫu nhiên.
2. ki = 0.
3. ki2 = 1/xi2.
4. kixi = kiXi = 1.
Chứng minh:

x 0
x
 k x   k X  X    k X
 x 
x
x    1
 
x 
x


k

i



i

i

i
2
i

i

i

i

2
i

i

i

2
i
2
i

i

 X  ki   ki X i
51

17

9/3/2014

Chứng minh: không chệch
ˆ 2   k i Yi   k i  1   2 X i  u i 
 1  k i   2  k i X i   k i ui
  2   ki ui

 

E ˆ 2   2  ki  E ui    2

Lấy kỳ vọng 2 vế:

(Do ki là phi ngẫu nhiên nên có thể được xem như là
đại lượng cố định)
52

Phương sai của ˆ 2

  
 E ˆ   

 

var ˆ 2  E ˆ 2  E ˆ 2
2

2

2

2

 E  k iu i 

2



 E k12 u12  k 22 u22  ...  k n2u n2  2k1k 2 u1u 2  ...  2k n 1k n u n 1u n



Theo giả thiết: E(ui2) = 2 với mỗi i và E(uiuj) = 0, ta có:

2
var ˆ 2   2  k i2 
 xi2

 

Chứng minh phương sai của ˆ 2 là nhỏ nhất, xem
Gujarati (2004), trang 104.

53

Kiểm định giả thuyết mơ hình
 Kiểm định giả thuyết về các giá trị của 
 Tại sao lại cần kiểm định một khi đã tìm
được các ˆ ???
 ˆ được tính từ mẫu,
 Mỗi mẫu có thể cho các ˆ khác nhau,
 Cần xây dựng khoảng tin cậy cho  của
tổng thể:





Pr ˆ      ˆ    1  
54

18

9/3/2014

Kiểm định giả thuyết mơ hình
 CLRM cịn giả định ui theo phân phối chuẩn:
ui ~ N(0, 2)  Yi ~ N( 1 +  2Xi, 2).
 Do ui theo phân phối chuẩn, các ước lượng

OLS của  1 và  2 cũng theo phân phối
chuẩn vì chúng là các hàm số tuyến tính của
ui.
 Chúng ta có thể áp dụng các kiểm định t, F,
và 2 để kiểm định các giả thuyết về các ước
lượng OLS.
55

1. Xây dựng khoảng tin cậy của  1 và  2
 Xây dựng khoảng tin cậy cho  2


Pr( 2 -    2   2 + ) = 1 - .


 ( 2 - ,  2 + ): là khoảng tin cậy,
 1 - : hệ số tin cậy,
  với (0 <  < 1): là mức ý nghĩa.
 Ví dụ: nếu  = 0,05 = 5%, ta đọc “xác
suất để khoảng tin cậy chứa giá trị thực
của  2 là 95%.
56



Khoảng tin cậy của  2
 Do 2 không biết trước, ta thường dùng ước

lượng không chệch của nó là 2, ta có:

 Biến t sẽ theo phân phối t với bậc tự do n – k (số
tham số được ước lượng kể cả hệ số tự do).
 Khoảng tin cậy từ phân phối t:
Pr(-t/2 < t < t/2)

57

19

9/3/2014

Kiểm định 2 đuôi
 Giả sử ta muốn kiểm định giả thuyết:
H0:  K =  0 và H1:  K   0.
 Quy tắc quyết định: Xây dựng khoảng
tin cậy 100(1-) cho  2.
 Nếu giá trị  2 nằm trong khoảng tin cậy
này, ta chấp nhận H0,
 Nếu nó nằm ngồi, ta bác bỏ H0.
 Hay so sánh |t | với t/2, n - k
58

Kiểm định giả thuyết mơ hình
1. Kiểm định giả thuyết về từng phần tử của 
Thông thường, đặt giả thuyết H0: k = 0, nghĩa là
biến Xk không ảnh hưởng đến Y, khi đó:

t

ˆ k
~ t ( nk )
se ( ˆ k )

Nếu |t| < t/2, (n-k): chấp nhận H0:  k = 0 ở mức ý nghĩa ,
có nghĩa là Xk khơng có ảnh hưởng đến Y.
Nếu |t| > t/2, (n-k): bác bỏ H0 và chấp nhận H1:  i  0 ở
mức ý nghĩa , có nghĩa là Xk có ảnh hưởng đến Y.

59

Kiểm định 2 đuôi
 Nếu:

t nk 

ˆ k
 t n k , / 2
se ˆ k

 

• Chấp nhận H0:  k = 0, hay bác bỏ H1.
• Ngược lại, bác bỏ H0, chấp nhận H1:  k  0

60

20

9/3/2014

Kiểm định giả thuyết mơ hình
2. Kiểm định ảnh hưởng tất cả các biến độc lập
cùng lúc
Giả thuyết của kiểm định này là:
H0:  2 =  3 =... =  k = 0

F




ESS n  k
.
k  1 RSS

Bác bỏ H0 khi F > F(k-1, n-k),, nghĩa là có ít nhất một tham
số khác 0 ; hoặc là có ít nhất một biến có ảnh hưởng
đến Y.
F < F(k - 1, n – k), thì chấp nhận H0, nghĩa là tất cả các
tham số  2,  3, ... ,  k đều bằng 0; hoặc là khơng có biến
độc lập nào ảnh hưởng đến Y.
61

Phương pháp dự đoán trong mơ hình hồi
qui
Cho trước 1 giá trị X0, ta có thể dùng mơ hình hồi
quy để dự báo giá trị Y ứng với một mức tin cậy
 nào đó. Công thức:

1 ( X o  x) 2
( ˆ1  ˆ2 X 0 )  t / 2 s

n
xi 2
s: sai số chuẩn của ước lượng

s  ˆ 

e

2
i

n2
62

Ví dụ: Có bộ số liệu về chi tiêu và thu nhập của
hộ gia đình ở VN 1998 như sau:

Variable Obs

Mean

Std.Dev

Totalexp 5999
rincome 5999
hhsize
5999

dur_asset5999

14178.5
15274
4.77196
1841.79

11859.6 678.37 219548
18534.7 -29524.4 445334
1.9651
1
19
3211.03 0
81398.3

Min

Max

Label
total expenditures
Real Total Income
Household size
Consumer durable

Ta cần kiểm định mối quan hệ giữa mức chi tiêu của hộ gia
đình với thu nhập của hộ gia đình, số nhân khẩu, giá trị tài
sản của hộ.
63

21

9/3/2014

Kết quả ước lượng mơ hình hồi quy
reg totalexp rincome hhsize dur_asset
Source |
SS
df
MS
-------------+-----------------------------Model | 5.9149e+11 3 1.9716e+11
Residual | 2.5214e+11 5995 42057950.5
-------------+-----------------------------Total | 8.4362e+11 5998 140651047

Number of obs = 5999
F( 3, 5995) = 4687.88
Prob > F
= 0.0000
R-squared = 0.7011
Adj R-squared = 0.7010
Root MSE
= 6485.2

-----------------------------------------------------------------------------totalexp |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]

-------------+---------------------------------------------------------------rincome | 0.1632861 .0058562 27.88 0.000 .1518057 .1747664
hhsize | 1142.227 43.80872 26.07 0.000 1056.346 1228.107
dur_asset | 2.237371 .0330819 67.63 0.000 2.172518 2.302224
_cons | 2113.036 221.9352 9.52 0.000 1677.963 2548.109
-----------------------------------------------------------------------------64

Trình bày Kết quả
Dạng phương trình:


totalex p  2113  0,163rincome  1142hhsize  2,237dur _ asset
se
(222) (0,006)
(20,222)
(0,033)
t

9,52*** 27,88***

N = 5999

R2

43,81***

67, 63***

= 0,70

65

Trình bày Kết quả
Dạng bảng:
----------------------------------------Mơ hình
totalexp
t
----------------------------------------rincome
0.163***
(27.88)
hhsize
1142.2***
(26.07)
dur_aaset
2.237***
(67.63)
Hằng số
2113.0***
(9.52)
----------------------------------------Số quan sát
5999
R2
0.701
----------------------------------------* p<0.05, ** p<0.01, *** p<0.001
66

22

9/3/2014

Trình bày và giải thích Kết quả
 Các biến độc lập trong mơ hình giải thích
70% sự biến động trong chi tiêu của hộ.
 Hệ số ước lượng của các biến độc lập đều
có ý nghĩa thống kê, chứng tỏ các biến độc
lập đều có ảnh hưởng đến chi tiêu.
 Khi thu nhập tăng thêm 1 đồng, chi tiêu
bình quân tăng 0,163 đồng, trong điều kiện
các yếu tố khác không đổi.
 Ý nghĩa của các hệ số ước lượng của biến
hhsize và dur_aaset???
67

Câu hỏi và bài tập
1. Gọi kids và educ lần lượt là số con và số
năm học của những người phụ nữ. Giả sử
ta thực hiện mơ hình hồi quy đơn giản sau:
kids = 0 + 1educ + u,
a. u có thể bao gồm có yếu tố nào, chúng có
tương quan với educ khơng?
b. Mơ hình trên có thể biểu diễn tác động của
educ lên kids trong điều kiện các yếu tố
không đổi không?
68

Câu hỏi và bài tập
2. Bảng sau chứa thông tin về điểm thi đầu
vào (dv) và điểm trung bình tích lũy (dtb)
của 8 sinh viên.
SV

1

2

3

4

5

6

7

8

dv

21

24

26

27

29

25

25

30

dtb

2.8

3.4

3.0

3.5

3.6

3.0

2.7

3.7

a. Ước lượng mơ hình: dtb =  0 +  1dv + u bằng
OLS. Hằng số trong mơ hình này có ý nghĩa
gì khơng? Diễn giải kết quả. Nếu dv tăng
thêm 5 điểm thì dtb trung bình tăng thêm bao
nhiêu
69

23

9/3/2014

Câu hỏi và bài tập
b. Tính giá trị dự báo và sai số cho từng quan
sát và chứng tỏ tổng các sai số = 0.
c. Tính giá trị dự báo khi dv = 20.
d. Dv giải thích bao nhiêu % sự biến động của
dtb đối với số liệu của mẫu này?
e. Thực hiện các kiểm định t và F về hệ số hồi
quy của các biến độc lập.

70

Câu hỏi và bài tập
3. Giải thích các phát biểu sau đây đúng, sai
hay không chắc chắn.
a. Do hệ số tương quan giữa X và Y nằm trong
khoảng [-1;1], hiệp phương sai giữa chúng,
cov(X,Y) cũng nằm trong khoảng này.
b. Nếu hệ số tương quan giữa 2 biến số = 0, có
nghĩa là khơng có mối quan hệ nào giữa 2
biến này.
c. Nếu ta hồi quy giữa Y với Ŷ, hệ số tự do và hệ
số góc lần lượt là 0 và 1.
71

24

chuong 2 hoi quy tuyen tinh

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về