Tải bản đầy đủ (.pdf) (21 trang)

Baitap chuong2 hoiquydabien answer

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (306.33 KB, 21 trang )

Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

HỒI QUY ĐA BIẾN
Ví dụ 2.1. Theo 1 chủ đề nghiên cứu người ta thấy giá căn nhà (Price) trên cùng 1 khu vực phụ
thuộc vào : SQFT (Diện tích); BEDRMS (Số phòng ngủ); BATHS (Số phòng tắm). Người ta thu
thập được một mẫu gồm 13 căn nhà có số liệu như sau:
STT

PRICE

SQFT

BEDRMS

BATHS

(1000 USD)

(m2)

1

199.9

1065

3

1.75



2

228

1254

3

2

3

235

1300

3

2

4

285

1577

4

2.5


5

239

1600

3

2

6

293

1750

4

2

7

285

1800

4

2.75


8

365

1870

4

2

9

295

1935

4

2.5

10

290

1948

4

2


11

385

2254

4

3

12

505

2600

3

2.5

13

425

2800

4

3


14

415

3000

4

3

(số phòng ngủ) (số phòng tắm)

a) Tính hệ số tương quan tuyến tính ( rXY ) giữa các cặp: RICE & SQFT; PRICE & BEDRMS;
PRICE& BATHS. Hãy giải thích các giá trị thu được này?
b) Hãy chạy hàm hồi quy mẫu trên các phần mềm thông dụng các mô hình sau:
Hàm hồi quy 1: PRICE = f (SQFT)
Hàm hồi quy 2: PRICE = g (BEDRMS)
Hàm hồi quy 3: PRICE = h( BATHS)
Hàm hồi quy 4: PRICE = k (SQFT, BEDRMS)
Hàm hồi quy 5: PRICE = h (SQFT, BATHS)
Hàm hồi quy 6: PRICE = f (SQFT, BEDRMS, BATHS)

Mail:

Trang |1


Chương 2. Hồi quy đa biến


Mr U- Giảng viên BM Toán – Thống kê

c) Dựa trên kết quả của phần mềm Eviews hãy cho biết hàm hồi quy mẫu nào là tốt nhất? Tại sao
d) Dựa trên hàm hồi quy mẫu tốt nhất được chọn, hãy giải thích các hệ số đứng trước các biến giải
thích.
e) Hãy dự báo giá nhà trung bình trong hàm hồi quy 5 nếu diện tích là 300 m2 và số phòng tắm là 2
f) Hãy dự báo giá nhà trung bình trong hàm hồi quy 1 nếu diện tích là 300 m2 và so sánh giá trị tìm
được này với giá trị ở câu e). Bạn có rút ra nhận xét gì?
g) Trong hàm hồi quy 4 kiểm định giả thiết H 0 : 1  2  0 với β1, β2 lần lượt là các hệ số đứng
trước các biến PRICE, BEDRMS
h) Theo 1 số chuyên gia về bất động sản nhận định rằng giá căn nhà sẽ tăng khi giá trị của các biến
giải thích tăng nhưng tuân theo quy luật cận biên giảm dần, nên họ đề xuất mô hình sau:
PRICE = f (SQFT, BEDRMS, BATHS, SQFT2 )
1. Bạn kỳ vọng các hệ số đứng trước các biến giải thích này sẽ có giá trị âm hay dương ?
Giải thích ?
2. Bạn hãy sử dụng phần mềm Eviews để chạy mô hình hồi quy tuyến tính trên và cho biết
các hệ số chạy trên phần mềm Eviews có dấu như bạn kỳ vọng không?
3. Hãy giải thích ý nghĩa của các hệ số đứng trước các biến giải thích trong mô hình trên?

Mail:

Trang |2


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

Giải.
a) Tính hệ số tương quan tuyến tính ( rXY ) giữa các cặp:PRICE & SQFT; PRICE & BEDRMS;

PRICE& BATHS. Hãy giải thích các giá trị thu được này?

rPRICE&SQFT  0,905
rPRICE&BEDRMS  0,315
rPRICE&BATHS  0,669
Giải thích các giá trị này:
................................................................................................................................................................
................................................................................................................................................................
................................................................................................................................................................
................................................................................................................................................................
................................................................................................................................................................
................................................................................................................................................................
................................................................................................................................................................
................................................................................................................................................................
................................................................................................................................................................
................................................................................................................................................................
................................................................................................................................................................

Mail:

Trang |3


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

b) Hàm hồi quy mẫu chạy trong Eviews:
Hàm hồi quy 1: PRICE = f (SQFT)
Dependent Variable: PRICE

Method: Least Squares
Date: 03/11/15 Time: 16:29
Sample: 1 14
Included observations: 14

Variable

Coefficient

Std. Error

t-Statistic

Prob.

SQFT

0.138750

0.018733

7.406788

0.0000

C

52.35091

37.28549


1.404056

0.1857

R-squared

0.820522

Mean dependent var

317.4929

Adjusted R-squared

0.805565

S.D. dependent var

88.49816

S.E. of regression

39.02304

Akaike info criterion

10.29774

Sum squared resid


18273.57

Schwarz criterion

10.38904

Log likelihood

-70.08421

F-statistic

54.86051

Prob(F-statistic)

0.000008

Mail:

Hannan-Quinn criter. 10.28929
Durbin-Watson stat

1.975057

Trang |4


Chương 2. Hồi quy đa biến


Mr U- Giảng viên BM Toán – Thống kê

Hàm hồi quy 2: PRICE = g (BEDRMS)
Dependent Variable: PRICE
Method: Least Squares
Date: 03/11/15 Time: 16:30
Sample: 1 14
Included observations: 14

Variable

Coefficient Std. Error

t-Statistic

Prob.

BEDRMS

56.17556 48.75114

1.152292

0.2716

C

112.8533 179.1231


0.630032

0.5405

R-squared

0.099625

Mean dependent var 317.4929

Adjusted R-squared 0.024594

S.D. dependent var

S.E. of regression

87.40314

Akaike info criterion 11.91050

Sum squared resid

91671.71

Schwarz criterion

Log likelihood

-81.37352


Hannan-Quinn criter. 11.90205

F-statistic

1.327777

Durbin-Watson stat

Prob(F-statistic)

0.271640

Mail:

88.49816

12.00180

0.775382

Trang |5


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

Hàm hồi quy 3: PRICE = h( BATHS)
Dependent Variable: PRICE
Method: Least Squares

Date: 03/11/15 Time: 16:32
Sample: 1 14
Included observations: 14

Variable

Coefficient Std. Error

t-Statistic

Prob.

BATHS

132.7821 42.51527

3.123162

0.0088

C

4.506552 101.8689

0.044239

0.9654

R-squared


0.448381

Mean dependent var 317.4929

Adjusted R-squared 0.402413

S.D. dependent var

S.E. of regression

68.41242

Akaike info criterion 11.42055

Sum squared resid

56163.11

Schwarz criterion

Log likelihood

-77.94385

Hannan-Quinn criter. 11.41210

F-statistic

9.754139


Durbin-Watson stat

Prob(F-statistic)

0.008803

Mail:

88.49816

11.51184

2.271463

Trang |6


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

Hàm hồi quy 4: PRICE = k (PRICE, BEDRMS)
Dependent Variable: PRICE
Method: Least Squares
Date: 03/11/15 Time: 16:32
Sample: 1 14
Included observations: 14

Variable


Coefficient Std. Error

t-Statistic

Prob.

SQFT

0.148314 0.021208

6.993297

0.0000

BEDRMS

-23.91061 24.64191

-0.970323 0.3527

C

121.1787 80.17782

1.511374

R-squared

0.834673


0.1589

Mean dependent var 317.4929

Adjusted R-squared 0.804613

S.D. dependent var

S.E. of regression

39.11846

Akaike info criterion 10.35848

Sum squared resid

16832.79

Schwarz criterion

Log likelihood

-69.50933

Hannan-Quinn criter. 10.34580

F-statistic

27.76736


Durbin-Watson stat

Prob(F-statistic)

0.000050

Mail:

88.49816

10.49542

2.044820

Trang |7


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

Hàm hồi quy 5: PRICE = h (PRICE, BATHS)
Dependent Variable: PRICE
Method: Least Squares
Date: 03/11/15 Time: 16:33
Sample: 1 14
Included observations: 14

Variable


Coefficient Std. Error

t-Statistic

Prob.

SQFT

0.152570 0.031290

4.875991

0.0005

BATHS

-22.72375 40.50734

-0.560979 0.5861

C

79.50531 61.78586

1.286788

R-squared

0.825514


0.2246

Mean dependent var 317.4929

Adjusted R-squared 0.793789

S.D. dependent var

S.E. of regression

40.18743

Akaike info criterion 10.41239

Sum squared resid

17765.32

Schwarz criterion

Log likelihood

-69.88676

Hannan-Quinn criter. 10.39972

F-statistic

26.02110


Durbin-Watson stat

Prob(F-statistic)

0.000068

Mail:

88.49816

10.54934

1.827822

Trang |8


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

Hàm hồi quy 6: PRICE = f (PRICE, BEDRMS, BATHS)
Dependent Variable: PRICE
Method: Least Squares
Date: 03/11/15 Time: 16:34
Sample: 1 14
Included observations: 14

Variable


Coefficient Std. Error

t-Statistic

Prob.

SQFT

0.154800 0.031940

4.846516

0.0007

BATHS

-12.19276 43.25000

-0.281913 0.7838

BEDRMS

-21.58752 27.02933

-0.798670 0.4430

C

129.0616 88.30326


1.461573

R-squared

0.835976

0.1746

Mean dependent var 317.4929

Adjusted R-squared 0.786769

S.D. dependent var

S.E. of regression

40.86572

Akaike info criterion 10.49342

Sum squared resid

16700.07

Schwarz criterion

Log likelihood

-69.45391


Hannan-Quinn criter. 10.47651

F-statistic

16.98894

Durbin-Watson stat

Prob(F-statistic)

0.000299

Mail:

88.49816

10.67600

1.970415

Trang |9


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

BÀI TẬP CHƯƠNG 2
I. Phần Lý thuyết.
Hãy chọn đáp án ĐÚNG cho các câu sau và giải thích lý do chọn đáp án này

Câu 1. Hồi quy đa biến có thể viết dưới nhiều dạng. Hãy xét đến 3 dạng biểu diễn sau:

(i) Y  X  e
  X
(ii)Y

(iii)e  Y  Y

 
Y
  
 1 X11
1
 
 0

 
Y
  1 
1 X21
2


,X  
với Y    ,    
... ...
 ... 
 ... 



 
 
 1 X2n
 k (k 1)1
 Y n  n1
A. Chỉ có (i) đúng

B. Chỉ có (ii) đúng

X21
X22
...
X2n

 e1 
... Xk1 

 
... X k2 
 e2 
,e

 ... 
... ... 

 
e 
... Xkn n(k 1)
 n  n1


C. Chỉ có (iii) đúng

D. Cả (i), (ii) và (iii) đều đúng

Câu 2. Hồi quy đa biến bao hàm việc giải bài toán

 

n

n



 ˆ j   e2i   Yi  ˆ 0  ˆ 1X1i  ...  ˆ k X ki
i 1
i 1



2

 min

Hãy xét các mệnh đề sau:
(i) Hệ số βj (j =0,…, k) được xác định bằng cách lấy đạo hàm riêng phần

(ii) Chỉ cần tìm các
A. Chỉ có (i) đúng


 j

  0

j

 j

  (j =0,…,k) và đặt chúng bằng nhau để xác định các hệ số β (j =1,…,k)
j

j

B. Chỉ có (ii) đúng

C. Cả (i) và (ii) đúng

D. Cả (i) và (ii) đều sai

Câu 3. Hãy xét các mệnh đề sau:
^

(i) yi  yi  ei


^



(ii) (yi  y)  yi  y  ei .


A. Mệnh đề (i) suy ra từ mệnh đề (ii)
B. Mệnh đề (ii) suy ra từ mệnh đề (i)
C. Hai mệnh đề này không liên quan gì nhau
D. Hai mệnh đề (i) và (ii) tương đương nhau
Câu 4. Theo phương pháp OLS thì đường hồi quy đi qua giá trị trung bình của các biến giải thích,

  X (dạng ma trận)
có dạng : Y  Y
với

Mail:

T r a n g | 10


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

 
Y
  
 1 X11
1
 
 0

 
Y

  1 
1 X21
2


Y    ,   
,X  
... ...
 ... 
 ... 

1 X
 
 
2n

 k (k 1)1
 Y n  n1

X21
X22
...
X2n

 e1 
... Xk1 

 
... X k2 
 e2 

,e

 ... 
... ... 

 
e 
... Xkn n(k 1)
 n  n1

Hãy xét các mệnh đề sau:


^



(i) (Yi  Y)  Yi  Y  ei


(ii) (Yi  Y)  X  X   ei





  X
A. Từ mệnh đề (i) ta suy ra mệnh đề (ii) mà không cần điều kiện Y  Y
B. Mệnh đề (i) và (ii) luôn tương đương nhau
C. Mệnh đề (i) chỉ suy ra rằng hàm hồi quy đi qua giá trị trung bình của các biến giải thích


  X
D. Mệnh đề (ii) suy ra mệnh đề (i) , sử dụng điều kiện Y  Y
n

Câu 5. Với quan hệ:

n

2

n

  Y  Y     Y  Y     Y  Y 
2

i

i 1

i

i 1

i

i

2


. Hãy xét các mệnh đề sau:

i 1

(i) Quan hệ trên có nghĩa là: TSS= ESS + RSS
(ii) Quan hệ trên được sử dụng để xác định R2
A. Chỉ có (i) đúng
B. Chỉ có (ii) đúng
C. Cả hai mệnh đề (i) và (ii) đều đúng
D. Cả hai mệnh đề (i) và (ii) đều sai
n

Câu 6. Phương pháp OLS cho ta ước lượng: ˆ k  k   C ki .i . Hãy xét các mệnh đề sau:
i 1

(i) ˆ k là một biến (đại lượng) ngẫu nhiên
(ii) Nếu các sai số ngẫu nhiên ( i ) bằng 0, thì việc hồi quy trở thành tầm thường, vì ta luôn có

ˆ k  k
A. Chỉ có (i) đúng
B. Chỉ có (ii) đúng
C. Cả hai mệnh đề (i) và (ii) đều đúng
D. Cả hai mệnh đề (i) và (ii) đều sai

Mail:

T r a n g | 11


Chương 2. Hồi quy đa biến


Mr U- Giảng viên BM Toán – Thống kê
n

Câu 7. Phương pháp OLS cho ta ước lượng: ˆ k  k   C ki .i . Ta nói việc ước lượng ˆ k có tính
i 1

n


chất không chệch: E ˆ k  E  k   Cki .i   k
i 1



 

A. Điều trên chỉ đúng khi và chi ( i ) có phân bố chuẩn
B. Điều trên chỉ đúng khi E( i ) = 0 (i = 1,…,N)
C. Điều trên đúng khi i (i =1,2,…, N) là các biến ngẫu nhiên độc lập
D. Điều trên đúng khi Cov( i ,  j ) = 0 , với mọi i ≠ j

2
Câu 8. Để chứng minh: Var  k 
, các phát biểu nào sau đây là đúng?
Skk

 

A. Ta cần điều kiện i (i = 1,…,N) là các biến ngẫu nhiên độc lập và Var   i   2

B. Ta cần điều kiện i (i = 1,…,N) là các biến ngẫu nhiên độc lập
C. Ta cần điều kiện Var   i    2 (i = 1,…,N)
D. Ta chỉ cần i (i = 1,…,N) tuân theo phân phối chuẩn.
Câu 9. Với Var  k  Var  k  k , Hãy cho biết điều này chỉ đúng khi:

 





A. E( i ) = 0 (i = 1,…,N)

 

B. E ˆ k  k
C. Var   i    2 (i = 1,…,N)
D. i (i = 1,…,N) tuân theo phân phối chuẩn.


2 
Câu 10. Để đi đến kết luận  k ~ N  k ,
 , ta cần phải có những yêu cầu sau:
Skk 


 

(i) E ˆ k  k


2
(ii) Var  k 
Skk

 

(iii) i (i = 1,…,N) tuân theo phân phối chuẩn.

Mail:

T r a n g | 12


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

A. Chỉ cần (i) và (ii)
B. Chỉ cần (ii) và (iii)
C. Cần cả (i), (ii) và (iii)
D. Chỉ cần (i) và (iii)
Câu 11. Để kiểm định biến giải thích Xk có hay không ý nghĩa khi đưa vào mô hình người ta kiểm

H : k  0
định giả thiết:  0
. Trong các phát biểu sau phát biểu nào đúng?
 H1 : k  0

A. Nếu giá trị kiểm định Z0






k

 0

se  k

 

   t

nk
 /2

; t n/ 2k  thì ta nói biến Xk có ý nghĩa ở mức α

B. Nếu p_value > α thì biến Xk đưa vào mô hình là phù hợp
C. Nếu p_value < α thì biến Xk đưa vào mô hình là không phù hợp
D. Cả A, B, C đều sai
Câu 12. Để kiểm định biến giải thích Xk có hay không ý nghĩa khi đưa vào mô hình người ta kiểm

H : k  0
định giả thiết:  0
. Trong các phát biểu sau phát biểu nào đúng?
 H1 : k  0

A. Dùng Z0


  0 


và p_value là 2 phương pháp khác nhau để kiểm định cặp giả thiết trên.
se   
k

k

B. Hai phương pháp dùng Z0

  0 


và p_value là như nhau trong việc kiểm định cặp giả thiết
se   
k

k

trên
C. Khi p_value = 0 thì ta chấp nhận giả thiết H0 mà không quan tâm đến mức ý nghĩa α

D. Khi Z0

  0 


= 0 thì ta kết luận rằng việc đưa biến X

se   
k

k

vào mô hình là phù hợp

k

Câu 13. Giả sử ta đưa thêm biến giải thích có ý nghĩa vào mô hình. Trong các mệnh đề sau, đâu là
mệnh đề đúng?
A. Đưa thêm biến giải thích vào mô hình làm giảm mức độ giải thích của mô hình.
B. RSS luôn giảm xuống.
C. Hệ số R 2 luôn giảm.

Mail:

T r a n g | 13


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

D. RSS tăng và R 2 cũng tăng.
Câu 14. Với hệ số R 2  1 

RSS /  n  k 
TSS /  n  1


, trong các phát biểu sau, phát biểu nào đúng

A. Nếu R 2 giảm thì việc đưa biến mới vào mô hình là tốt
B. R 2 có xu hướng tăng nếu việc đưa thêm biến mới vào mô hình làm RSS tăng.
C. R 2 tăng lên chứng tỏ việc đưa thêm biến mới vào làm độ chính xác khi ước lượng giá trị biến
phụ thuộc giảm
D. R 2 giảm thì ta nên đưa thêm biến vào mô hình.
Câu 15. Với mô hình hồi quy đa biến: Y  0  1X1  2 X2  
Trong các mệnh đều sau, mệnh đề nào đúng?
A. Giả thuyết H 0 : 1  2  0 là hoàn toàn tương đương với việc kiểm định 2 giả thuyết
H 0 : 1  0 or H 0 : 2  0

B. Nếu từng hệ số riêng biệt ( β1, β2) đứng trước hai biến giải thích không có ý nghĩa thống kê,
nhưng khi ta kiểm định một cách đồng thời giả thuyết H 0 : 1  2  0 thì ta nên giữ lại hai biến giải
thích này trong mô hình
C. Nếu giả thuyết H 0 : 1  2  0 bị bác bỏ thì nên loại cả hai biến giải thích
D. Khi kiểm định các giả thuyết H 0 : 1  0 or H 0 : 2  0 nếu chấp nhận H0 trong cả 2 thuyết này
thì việc loại cả 2 biến giải thích là thích hợp trong mô hình.
Câu 16. Xét hai mô hình hồi quy đa biến sau:
Y  0  1X1  2 X2   (1)

'
Y  0  1X1  2 X2  3 X3  4 X 4   (2)
Trong các mệnh đều sau, mệnh đề nào đúng?
A. Mô hình (2) là mô hình (1) khi ta chấp nhận giả thuyết H 0 : 3  4  0
B. Ta luôn có RSS(2)  RSS(1)
C. Nếu RSS(2)  RSS(1) càng lớn thì ta càng có xu hướng chấp nhận giả thuyết H0
D. Nếu RSS(2)  RSS(1) càng lớn thì giá trị kiểm định F0 càng gần 0
Câu 17. Xét hai mô hình hồi quy đa biến sau:


Mail:

T r a n g | 14


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

Y  0  1X1  2 X2   (1)

'
Y  0  1X1  2 X2  3 X3  4 X 4   (2)

Với H 0 : 3  4

RSS   RSS   / m

 0 và F 
2

0

1

RSS1 /  n  k 

Trong các mệnh đều sau, mệnh đề nào đúng?
A. Khi giá trị kiểm định F0 càng lớn thì việc đưa thêm các biến giải thích X3, X4 vào mô hình là
không nên

B. Khi p_value của F0 càng gần 0 thì việc đưa biến giải thích X3, X4 là nên làm.
C. p_value của F0 lớn thì đồng nghĩa với F0 có giá trị lớn
D. Khi giá trị kiểm định F0  F;m;n  k thì nên đưa thêm các biến giải thích X3, X4 vào mô hình
Câu 18.
Xét hai mô hình hồi quy đa biến sau:
Y  0  1X1  2 X2   (1)

'
Y  0  1X1  2 X2  3 X3  4 X 4   (2)
Khi kiểm định tính có ý nghĩa đồng thời của tất cả các biến giải thích ta sử dụng giá trị kiểm định :

A. F0 

B. F0 

C. F0 

 RSS   RSS   /  m  1
2

1

RSS1 /  n  k 

 RSS   RSS   /  m  k 
2

1

RSS1 /  n  k 


 RSS   RSS   /  m 
2

1

RSS1 /  n  k 

RSS   RSS   /  m  2 

D. F 
2

0

1

RSS1 /  n  k 

Câu 19. Với hai nhận định sau
(i) Việc không loại bỏ biến không có ý nghĩa khỏi mô hình (2) sẽ vẫn cho ước lượng không chệch
theo OLS, nhưng độ chính xác giảm đi
(ii) Việc bỏ quên hay không đưa biến có ý nghĩa vào mô hình sẽ làm ước lượng theo OLS bị chệch
Mail:

T r a n g | 15


Chương 2. Hồi quy đa biến


Mr U- Giảng viên BM Toán – Thống kê

Lưu ý: Ước lượng theo OLS bị chệch nghĩa là E  j   j

 

A. (i) đúng
B. (ii) đúng
C. (i) và (ii) đều đúng
D. (i) và (ii) đều sai
Câu 20. Xét hai mô hình hồi quy đa biến sau:
Y  0  1X1  2 X2   (1)

'
Y  0  1X1  2 X2  3 X3  4 X 4   (2)
Trong các mệnh đều sau, mệnh đề nào đúng khi kiểm định giả thiết: H 0 : 3  4  0

RSS   RSS   / m

với F 
2

0

1

RSS1 /  n  k 

A. Việc sử dụng p_value nếu cho kết quả bác bỏ H0 thì dùng kiểm định F0 cũng cho kết quả tương
tự

B. p_value là một cách khác để kiểm định giả thuyết H0
C. Kiểm định bằng F0 nếu chấp nhận H0 thì p_value của F0 sẽ nhỏ hơn mức ý nghĩa α.
D. Cả A, B, C đều đúng.
II. Phần Bài tập
Bài tập 1.
Sử dụng bộ số liệu trong file Eviews ở Sheet “ Baitap_Chuong2” với :
Wage: Tiền lương (1000 USD/tháng).
Grade: Số năm đi học.
Exp: Số năm kinh nghiệm làm việc.
1. Hãy chạy hàm hồi quy mẫu (1): Wage = f (Grade) trên phần mềm Eviews và trả lời các câu sau:
a) Nếu gia tăng một năm học thì mức lương trung bình gia tăng bao nhiêu?
b) Hãy dự báo mức lương của một người có số năm đi học là 13 trong các trường hợp sau:
Trường hợp 1: Dự báo cho mức lương trung bình
Trường hợp 2: Dự báo cho mức lương trung bình với khoảng tin cậy 96%
Trường hợp 3: Dự báo cho mức lương cụ thể ứng với khoảng tin cậy 96%
Giải
Hàm hồi quy mẫu (1): Wage = f(Grade)

Mail:

T r a n g | 16


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

Dependent Variable: WAGE
Method: Least Squares
Date: 04/21/15 Time: 22:18

Sample (adjusted): 1 99
Included observations: 99 after adjustments
Variable

Coefficient

Std. Error t-Statistic

Prob.

GRADE

0.147483

0.324336 0.454724

0.6503

C

47.78541

5.667451 8.431554

0.0000

R-squared

0.002127


Mean dependent var

50.00000

-0.008160

S.D. dependent var

28.72281

S.E. of regression

28.83977

Akaike info criterion

9.581383

Sum squared resid

80678.02

Schwarz criterion

9.633809

Hannan-Quinn criter.

9.602595


Durbin-Watson stat

0.005860

Adjusted R-squared

Log likelihood

-472.2784

F-statistic

0.206774

Prob(F-statistic)

0.650324

Hàm hồi quy mẫu có dạng: Y = 0.147483*X + 47.78541
a. Nếu tăng 1 năm học thì mức lương trung bình tăng 0.147483*1000=147.483 (USD/tháng)
b.
Trường hợp 1: Dự báo cho mức lương trung bình
Đây là dự báo điểm cho mức lương trung bình. Ứng với X=13 thì
E(Y/X=13)= 0.147483*13 + 47.78541=49.702689
Vậy khi số năm đi học là 13 thì mức lương trung bình là 49702.689 (USD/tháng)
Trường hợp 2: Dự báo cho mức lương trung bình với khoảng tin cậy 96%

 

se Yˆi  2.971302

z0.02  2.05
Dự báo khoảng cho mức lương trung bình:

E Y / X  xi    yˆ i  z /2 .se  yˆ i     43.61153;5579386 
Trường hợp 3: Dự báo cho mức lương cụ thể ứng với khoảng tin cậy 96%

se  yi  yˆ i   28.99243
z0.02  2.05
Đây là dự báo khoảng cho mức lương cụ thể :

yi   yˆ i  z /2 .se  yi  yˆ i    ( 9.731784;1091372)

Mail:

T r a n g | 17


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

2. Hãy chạy hàm hồi quy mẫu (2): Wage = f (Grade, Grade2 ) trên phần mềm Eviews và trả lời các
câu sau:
a) Hãy giải thích ý nghĩa của các hệ số đứng trước các biến giải thích? So sánh hệ số đứng
trước biến Grade trong (1) và (2) và giải thích sự khác biệt nếu có?
b) Khi thêm biến Grade2 bạn kỳ vọng dấu hệ số đứng trước biến này là âm hay dương? Điều
bạn kỳ vọng có phù hợp với kết quả trên phần mềm Eviews không? Tại sao.
c) Nếu chọn một mô hình để phản ánh mối liên hệ giữa Wage và các biến giải thích bạn sẽ
chọn mô hình (1) hay (2) ? Tại sao
Giải:

Hàm hồi quy mẫu (2): Wage = f(Grade, Grade^2)

Dependent Variable: WAGE
Method: Least Squares
Date: 04/21/15 Time: 22:39
Sample (adjusted): 1 99
Included observations: 99 after adjustments
Variable

Coefficient

Std. Error t-Statistic

Prob.

0.101655
0.000782
48.23476

0.944505 0.107628
0.015128 0.051698
10.39220 4.641439

0.9145
0.9589
0.0000

GRADE
GRADE^2
C

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
a)

0.002155
-0.018634
28.98918
80675.77
-472.2771
0.103660
0.901632

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

50.00000
28.72281
9.601557
9.680197
9.633375
0.005885


Khi số năm đi học tăng lên thêm 1 năm thì mức lương sẽ tăng thêm trung bình là 101,655 USD +
0,0782*grade*2 nhưng khi số năm đi học tăng lên cao thì mức lương sẽ tăng nhưng tăng chậm.
Hệ số đứng trước biến giải thích grade (2) nhỏ hơn grade (1) điều này là phù hợp vì:
Grade ở mô hình (1) lớn vì ta không xét đến quy luật cận biên giảm dần như ở (2) nhưng nếu xét
chung thì (2) với 2 biến giải thích phù hợp hơn mô hình (1)
b)
Khi thêm biến Grade2 thì ta kỳ vọng dấu trước hệ số này vẫn là dấu dương (+), điều này phù hợp
với kết quả trên phần mềm Eviews vì khi đi học càng lâu thì tiền lương sẽ tăng nhưng do những

Mail:

T r a n g | 18


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

kiến thức học được theo số năm có tăng nhưng sẽ tăng không nhiều nữa vì thế tác động của Grade2
đến Wage sẽ không cao như Grade ở các thời điểm ban đầu nữa
c)
3. Cho rằng Wage còn phụ thuộc vào Exp nên người ta đưa thêm biến này vào mô hình, bạn hãy
chạy hàm hồi quy mẫu (3) : Wage= f (Grade, Exp)
a) Bạn kỳ vọng về dấu các hệ số đứng trước biến giải thích này là âm hay dương? Điều bạn
kỳ vọng có phù hợp với kết quả trên phần mềm Eviews không? Tại sao.
b) Hãy giải thích các hệ số đứng trước các biến giải thích trong mô hình?
b) Nếu gia tăng một năm đi học và số năm kinh nghiệm giữ nguyên thì mức lương trung
bình tăng hay giảm bao nhiêu?
c) Nếu gia tăng một năm kinh nghiệm và số năm đi học giữ nguyên thì mức lương trung

bình tăng hay giảm bao nhiêu?
d) Đối với hàm hồi quy mẫu (3) nếu chỉ quan tâm đến mức lương thì một lao động nên
chọn tăng số năm kinh nghiệm hay số năm đi học? Tại sao.
Giải:
Dependent Variable: WAGE
Method: Least Squares
Date: 04/21/15 Time: 22:51
Sample (adjusted): 1 99
Included observations: 99 after adjustments
Variable

Coefficient Std. Error

t-Statistic

Prob.

GRADE
EXP01
C

0.150291 0.339990
-0.031633 1.086657
48.12284 12.91572

0.442046
-0.029110
3.725912

0.6595

0.9768
0.0003

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

Mail:

0.002136
-0.018653
28.98946
80677.31
-472.2780
0.102746
0.902456

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

50.00000
28.72281

9.601576
9.680216
9.633394
0.005887

T r a n g | 19


Chương 2. Hồi quy đa biến

Mr U- Giảng viên BM Toán – Thống kê

Bài tập 2.
Sức hấp dẫn của rạp Galaxy là đề tài bị cuốn hút bởi nhóm các bạn Phương Dung, Ngọc Bảo
(trưởng nhóm, K05 402 284), Quốc Hạnh, Đăng Khoa, và Phạm Tùng. Vốn là những người yêu
thích xem phim, đồng thời, cũng thấy đó là một thú vui khá đặc biệt của người dân Sài Gòn, các bạn
đã tìm hiểu các yếu tố tác động tới số lần một người đến xem ở rạp Galaxy trong một tháng. Sở dĩ là
Galaxy, mà không phải rạp khác, là do sự khác biệt của nó trong việc hình thành một tổ hợp giải trí
phức hợp, sang trọng, cảnh quan đẹp, phong cách phục vụ chuyên nghiệp, có cả bar-café, shop văn
hóa phẩm, beauty salon, vân vân. Vốn bị ảnh hưởng bởi quan điểm của trường phái Societal
Marketing, được khởi xướng bởi Phillip Kotler, các bạn phân loại các yếu tố ảnh hưởng tới hành vi
của những người đến Galaxy là như sau:
Nhóm biến điều kiện cá nhân, bao gồm:


AGE (độ tuổi), kỳ vọng là mang dấu âm: trẻ hơn thì hay đi xem phim hơn.



INC (thu nhập, triệu đồng), kỳ vọng là mang dấu dương: giàu hơn thì hay đi xem hơn.




DIST (khoảng cách từ nhà tới rạp Galaxy, Km), kỳ vọng là mang dấu âm.



FRIENDS (biến Dummy, rằng có hay đi với bạn hay thích đi một mình)

Nhóm biến tác động tới tâm lý khách hàng, bao gồm:


PR (mức độ ưa thích sự giảm giá 50% vào ngày thứ 3, chia làm 3 cấp độ, tăng dần), kỳ vọng
là mang dấu dương



SPACE (mức độ ưa thích cái thoáng đãng, sang trọng của Galaxy, chia làm 5 cấp độ, tăng
dần), kỳ vọng là mang dấu dương.



CINEMA (biến Dummy, rằng Galaxy có phải là sự lựa chọn số 1 hay không), kỳ vọng là
mang dấu dương.



DVD (thích đến rạp hơn là xem DVD tại nhà, chia làm 3 cấp độ tăng dần), kỳ vọng là mang
dấu dương.


Biến được giải thích là TIMES (số lần đi xem Galaxy trong một tháng).
Nhóm đã điều tra 120 mẫu. Kết quả ước lượng như sau:
TIMES  0.1087 AGE ***  0.002944 INC  0.005425 DIST  0.02166 FRIENDS

(0.023814)

(0.013711)

(0.031695)

(0.088697)

0.4369 PR **  0.548 SPACE ***  0.1504 CINEMA  0.3659 DVD **  5.245 ***

(0.21)

(0.1515)

Mail:

(0.2469)

(0.1566)

(1.16)

T r a n g | 20


Chương 2. Hồi quy đa biến


Mr U- Giảng viên BM Toán – Thống kê



N=120, R 2  0.898 , AIC =2.363, SCHWARZ = 2.572, ESSU  64.264 .
Ghi chú: số trong ngặc là standard error.
*

***

là có ý nghĩa ở mức 0.01;

**

là có ý nghĩa ở mức 0.05;

là có ý nghĩa ở mức 0.1.

1. Kiểm địmh tính có ý nghĩa ở mức 0.05 (hay 5%) của từng biến sau: INC, DIST, và CINEMA,
FRIENDS. Cho trước t 0.05 [120]  2.626 . Trong các mệnh đề sau, đâu là mệnh đề đúng?
A. Chỉ có INC và DIST là không có ý nghĩa
B. Chỉ có INC và CINEMA là không có ý nghĩa
C. Chỉ có FRIENDS là không có ý nghĩa
D. Cả 4 biến INC, DIST, CINEMA, và FRIENDS là không có ý nghĩa.
2. Giả sử biến FRIENDS là không có ý nghĩa. Và biến CINEMA cũng nên bỏ đi, vì chỉ có những
người cực kỳ mê Galaxy thì mới đến đấy đốt tiền. Nên nhóm quyết định loại bỏ 2 biến đó. Nhưng
đối với các biến INC, DIST, khó mà có thể nói chúng không tác động đến hành vi của người tiêu
dùng. Các cô viện dẫn lý thuyết của Keynes, và nói rằng thu nhập (INC) là yếu tố chính quyết định
tới hành vi người tiêu dùng, nhất là ở rạp đắt tiền như Galaxy. Vì vậy, ta không được phép bác bỏ

Keynes vĩ đại, khi chưa thử nghiệm. Nhóm bèn quyết định tiến hành kiểm định giả thuyết đồng
thời:
H 0 :  INC   DIST   CINEMA   FRIENDS  0

Mô hình có ràng buộc [tức là đồng thời bỏ đi INC, DIST, CINEMA, và FRIENDS] có

RSS(2)  64.53 . Cho trước F0.05 (4,111)  2.4534 . Nếu là em, em sẽ chọn quyết định nào trong hai
quyết định sau đây?
(a) Chấp nhận giả thuyết ( DNRH 0 ), và quyết định loại DIST, CINEMA, FRIENDS, và nhất là
INC, ra khỏi mô hình.
Hay:
(b) Bác bỏ giả thuyết ( RH 0 ) và vẫn giữ lại cả 4 biến trên.

Mail:

T r a n g | 21



×