Tải bản đầy đủ (.docx) (15 trang)

Hướng dẫn chạy mô hình OLS, FEM, REM trên stata - làm luận văn thạc sĩ (kèm file excel dữ liệu)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (188.09 KB, 15 trang )

Sử dụng dữ liệu của 47 công ty ngành Bất động sản niêm yết trên thị
trường chứng khoán Việt Nam trong giai đoạn 05 năm từ năm 2010 đến năm
2014, tổng mẫu thu được là 235 (47 cty x 5 năm = 235 quan sát). Với kết quả
này, kích thước mẫu đủ khả năng để tiến hành phân tích hồi quy và kết quả phân
tích đủ độ tin cậy cho việc kết luận về bài nghiên cứu
Mô tả các biến được sử dụng trong mô hình
Biến
Phụ thuộc
MP
Độc lập

Tên biến

Giá thị trường CP

Đo lường

LNST/VCSH
lợi/VCSH
Tỷ suất sinh lợi/TTS LNST/TTS
LNST CP thường/S.lượng CP
Thu nhập một CP
thường đang lưu hành BQ
Giá trị sổ sách một

ROA
EPS
BV

CP
Hê số giá TT/EPS


Hệ số giá TT/BV
Tỷ số nợ trên TTS
Quy mô doanh

PE
PB
TD
SIZE
GROWTH

nghiệp
Tốc độ tăng trưởng
TTS

vọng

Nguồn
tham
khảo

Giá CP trên TTCK niêm yết

Tỷ suất sinh

ROE

Dấu kỳ

(+)
(+)

(+)
(+)

Giá TT/EPS
Giá TT/BV
Tổng nợ/TTS

(-)
(+)
(-)

Logarit Tổng tài sản

(+)

(TTS năm nay – TTS năm
trước)/TTS năm trước

(+)

Mô hình nghiên cứu dự kiến có phương trình như sau:
MPit =

β0 + β1ROEit + β2ROAit + β3EPSit + β4BVit + β5PEit + β6PBit +
β7TDit + β8SIZEit + β9GROWTHit + εit

Syntax:


import excel “đường dẫn đến file dữ liệu”, sheet(“tên sheet”) firstrow  nhập

dữ liệu từ excel
encode MACK, gen (MACK1)  Tạo biến MACK1 do biến MACK có dạng
string, Stata không hiểu
xtset MACK1 YEAR  định dạng dữ liệu thành dạng panel data theo K/gian và
T/gian
1. Thống kê mô tả các biến trong mô hình nghiên cứu
Syntax: sum MP ROE ROA EPS PE BV PB TD SIZE GROWTH  Thống kê mô
tả các biến
Kết quả:
Variable

Obs

Mean

MP
ROE
ROA
EPS
PE

235
235
235
235
205

12378.72
.0686651
.0286103

1253.241
57.43438

BV
PB
TD
SIZE
GROWTH

235
235
235
235
235

14284.98
1.019757
.5323776
6.160365
1.145251

Std. Dev.

Min

Max

9076.464
.1503401
.0555953

1591.287
135.7086

1900
-.6839968
-.2122973
0
1.92392

61500
.6296915
.2735206
9397.78
1024.499

7089.425
.9786483
.1634513
.545282
.3094645

2900
.1499423
.0757027
5.048065
.6268703

36600
7.057057
.9154871

7.956578
3.857517

2. Phân tích mối tương quan giữa các biến
Syntax: corr MP ROE ROA EPS PE BV PB TD SIZE GROWTH  chạy tương
quan các biến
Kết quả:


MP
MP
ROE
ROA
EPS
PE
BV
PB
TD
SIZE
GROWTH

ROE

ROA

EPS

PE

BV


PB

TD

SIZE

GROWTH

1.0000
0.5148 1.0000
0.4631 0.8713 1.0000
0.5297 0.7453 0.7399 1.0000
-0.1462 -0.2933 -0.2966 -0.3154 1.0000
0.2219 -0.0174 0.0630 0.4760 -0.2168 1.0000
0.6362 0.4967 0.3446 0.1125 -0.0236 -0.3787
0.1185 0.2086 -0.1282 0.1020 0.0238 -0.0215
0.4005 0.0971 0.0615 0.0522 -0.0218 0.0820
0.3204 0.3915 0.3130 0.1523 -0.0905 -0.2251

1.0000
0.2066
0.2844
0.4658

1.0000
0.1573
0.1393

1.0000

0.1381

1.0000

3. Kết quả các mô hình hồi quy
Mô hình nghiên cứu sử dụng dữ liệu bảng (panel data) được hồi quy theo 3
cách: pooled, random effect (ảnh hưởng ngẫu nhiên) và fixed effect (ảnh hưởng
cố định). Để tìm hiểu xem phương pháp hồi quy nào là phù hợp nhất trong ba
phương pháp trên, chúng ta sử dụng các kiểm định: kiểm định F, kiểm định
Lagrangian Multiplier (LM test, Breusch và Pagan, 1980) và kiểm định
Hausman (Hausman, 1978).
3.1. Mô hình POLS
Mô hình pooled: Mô hình hồi quy pooled để kiểm định ảnh hưởng của các biến
độc lập đối với biến phụ thuộc. Mô hình pooled thực chất là việc sử dụng dữ liệu
bảng để phân tích bằng hình thức sử dụng tất cả dữ liệu bằng cách sắp xếp
chồng không phân biệt từng cá thể riêng, tức là mô hình này sử dụng dữ liệu như
một phân tích OLS thông thường. Phương pháp bình phương bé nhất (OLS)
được sử dụng để ước lượng đường thẳng hồi quy bởi vì nó cho phép sai số cực


tiểu giữa các điểm ước lượng trên đường thẳng hồi quy và những điểm quan sát
thực tế của đường thẳng hồi quy là phù hợp nhất.
Syntax: reg MP ROE ROA EPS PE BV PB TD SIZE GROWTH  Chạy mô hình
hồi quy OLS
Kết quả:
Source

SS

df


MS

Model
Residual

1.2641e+10
4.4090e+09

9 1.4046e+09
195 22610310.7

Total

1.7050e+10

204 83580760.4

MP

Coef.

ROE
ROA
EPS
PE
BV
PB
TD
SIZE

GROWTH
_cons

-17709.54
2039.249
2.678211
1.77139
.3387856
6637.919
-3501.179
2800.898
985.992
-17773.08

Std. Err.
9401.39
21022.25
.4775668
2.65712
.0714769
467.0285
2823.266
654.5824
1202.593
4103.785

t
-1.88
0.10
5.61

0.67
4.74
14.21
-1.24
4.28
0.82
-4.33

Number of obs
F(9, 195)
Prob > F
R-squared
Adj R-squared
Root MSE

P>|t|
0.061
0.923
0.000
0.506
0.000
0.000
0.216
0.000
0.413
0.000

=
=
=

=
=
=

205
62.12
0.0000
0.7414
0.7295
4755

[95% Conf. Interval]
-36251
-39420.91
1.736352
-3.468994
.1978185
5716.844
-9069.236
1509.928
-1385.766
-25866.58

831.9219
43499.41
3.62007
7.011773
.4797527
7558.995
2066.878

4091.868
3357.75
-9679.579

Syntax: est store POLS  Lưu Mô hình dưới tên POLS, để so sánh với các Mô
hình sau này
- Kiểm định không bị hiện tượng đa cộng tuyến trong mô hình
Syntax: vif
Kết quả:


Variable

VIF

1/VIF

ROE
ROA
EPS
BV
PB
TD
GROWTH
SIZE
PE

10.37
7.92
5.43

2.44
2.04
1.88
1.36
1.18
1.17

0.096408
0.126234
0.184093
0.410395
0.489158
0.531993
0.734538
0.846013
0.852392

Mean VIF

3.76

Theo lý thuyết kinh tế lượng,
khi sử dụng nhân tử phóng đại
phương sai VIF, mô hình có
VIF >10 trong khi R2>0.9 thì
mô hình có biến đa cộng tuyến
cao với các biến khác

Trong mô hình đang thử nghiệm, VIF trung bình là 3.76, R2 = .7414 xem như
hiện tượng đa cộng tuyến trong mô hình được đánh giá là không nghiêm trọng

(theo Gujrati, 2003).
Tuy nhiên, trong mô hình đang nghiên cứu ta có biến ROE có VIF>10. Khi so
sánh dấu của hệ số tương quan giữa ROE
3.2. Mô hình FEM (mô hình hồi quy tác động cố định)
Mô hình ảnh hưởng cố định (FEM – Fixed effects model): Mô hình này giả định
mỗi thực thể đều có những đặc điểm riêng biệt ảnh hưởng đến biến giải thích,
FEM phân tích mối tương quan giữa phần dư của mỗi thực thể với các biến giải
thích qua đó kiểm soát và tách ảnh hưởng của các đặc điểm riêng biệt ra khỏi
các biến giải thích để ước lượng những ảnh hưởng thực của biến giải thích lên
biến được giải thích (biến phụ thuộc). Mô hình ước lượng sử dụng:
Yit = β1i + β2Xit + uit (1)
Yit: biến phục thuộc
Xit: biến độc lập
i: doanh nghiệp; t: thời gian (năm)
β1i: hệ số chặn cho từng cá thể nghiên cứu.
β2: hệ số góc đối với biến giải thích X.
uit: phần dư


Mô hình trên đã thêm vào chỉ số i cho hệ số chặn β1 để phân biệt hệ số chặn của
từng doanh nghiệp khác nhau có thể khác nhau do đặc điểm khác nhau của từng
doanh nghiệp hoặc do sự khác nhau trong chính sách quản lý, hoạt động của
doanh nghiệp.
Syntax: xtreg MP ROE ROA EPS PE BV PB TD SIZE GROWTH, fe  Chạy MH
hồi quy FE
Kết quả:


Fixed-effects (within) regression
Group variable: MACK1


Number of obs
Number of groups

R-sq:
within = 0.7804
between = 0.4119
overall = 0.4216

Obs per group:

corr(u_i, Xb)

=
=

205
51

min =
avg =
max =

1
4.0
5

=
=


57.26
0.0000

F(9,145)
Prob > F

= -0.8809

MP

Coef.

Std. Err.

t

ROE
ROA
EPS
PE
BV
PB
TD
SIZE
GROWTH
_cons

-23562.97
9755.006
2.570255

2.276915
.155983
7498.537
-28213.06
25236.82
2397.017
-142882.2

9496.801
21583.19
.4434001
2.416078
.2241242
521.4591
6723.797
7000.768
1166.513
38349.48

sigma_u
sigma_e
rho

12675.328
3638.3938
.92387712

(fraction of variance due to u_i)

-2.48

0.45
5.80
0.94
0.70
14.38
-4.20
3.60
2.05
-3.73

P>|t|
0.014
0.652
0.000
0.348
0.488
0.000
0.000
0.000
0.042
0.000

F test that all u_i=0: F(50, 145) = 3.76

[95% Conf. Interval]
-42333.02
-32903.29
1.693893
-2.498366
-.2869894

6467.894
-41502.37
11400.08
91.45148
-218678.4

-4792.931
52413.3
3.446618
7.052196
.5989554
8529.179
-14923.75
39073.55
4702.582
-67086

Prob > F = 0.0000

Syntax: est store FEM  Lưu Mô hình dưới tên FEM, để so sánh với các Mô
hình khác
3.3. Mô hình REM (mô hình hồi quy tác động ngẫu nhiên)
Mô hình ảnh hưởng ngẫu nhiên (REM – Random Effects Model): Giả định của
mô hình FEM là có sự biến động giữa các cá thể và có liên quan đến biến giải
thích thì giả định của mô hình REM sự biến động giữa các cá thể là ngẫu nhiên


và không tương quan đến các biến giải thích. Như vậy, sự khác biệt giữa mô
hình FEM và mô hình REM ở sự biến động của các cá thể, nếu sự khác biệt giữa
các cá thể có ảnh hưởng đến biến phụ thuộc thì REM sẽ thích hợp hơn so với

FEM. Trong mộ hình REM phần dư của mỗi thực thể (không tương quan với
biến giải thích) được xem là một biến giải thích mới. Ý tưởng của mô hình REM
cũng bắt đầu từ mô hình:
Yit = β1i + β2Xit + uit (1)
Nếu trong (1) β1i là cố định thì trong REM có giả định rằng nó là một biến
ngẫu nhiên với trung bình là β1 và giá trị hệ số chặn được mô tả như sau: β1i =
β1 + εi (i = 1,2,3,…,n)
εi: sai số ngẫu nhiên có trung bình bằng 0 và phương sai là б2
Thay vào mô hình trên ta có: Yit = β1 + βXit + εi + uit hay Yit = β1 + βXit + wit
(2) với wit = εi + uit
εi: sai số thành phần của các đối tượng khác nhau (đặc điểm riêng khác nhau
của từng doanh nghiệp).
uit: sai số thành phần kết hợp khác của đặc điểm riêng theo từng đối tượng và
theo thời gian.
Syntax: xtreg MP ROE ROA EPS PE BV PB TD SIZE GROWTH, re  Chạy MH
hồi quy RE
Kết quả:


Random-effects GLS regression
Group variable: MACK1

Number of obs
Number of groups

R-sq:

Obs per group:
within = 0.7511
between = 0.7234

overall = 0.7317

corr(u_i, X)

=
=

205
51

min =
avg =
max =

1
4.0
5

=
=

564.48
0.0000

Wald chi2(9)
Prob > chi2

= 0 (assumed)

MP


Coef.

Std. Err.

z

ROE
ROA
EPS
PE
BV
PB
TD
SIZE
GROWTH
_cons

-21964.95
4715.721
2.881886
1.715764
.4271168
6714.805
-6706.076
3404.694
1713.477
-21774.87

9128.096

20436.97
.4311705
2.392245
.0842875
437.6454
3194.503
984.033
1100.163
5936.865

sigma_u
sigma_e
rho

2975.8091
3638.3938
.40081927

(fraction of variance due to u_i)

-2.41
0.23
6.68
0.72
5.07
15.34
-2.10
3.46
1.56
-3.67


P>|z|
0.016
0.818
0.000
0.473
0.000
0.000
0.036
0.001
0.119
0.000

[95% Conf. Interval]
-39855.69
-35340.01
2.036807
-2.97295
.2619163
5857.035
-12967.19
1476.025
-442.8033
-33410.91

Syntax: est store REM  Lưu Mô hình dưới tên REM, để so sánh với các Mô
hình khác
3.4. Kiểm định lựa chọn mô hình phù hợp
Kiểm định Hausman
Syntax: Hausman FEM REM  Kiểm định Hausman mô hình FEM và REM


-4074.215
44771.45
3.726965
6.404477
.5923173
7572.574
-444.9654
5333.363
3869.757
-10138.83


Coefficients
(b)
(B)
FEM
REM
ROE
ROA
EPS
PE
BV
PB
TD
SIZE
GROWTH

-23562.97
9755.006

2.570255
2.276915
.155983
7498.537
-28213.06
25236.82
2397.017

-21964.95
4715.721
2.881886
1.715764
.4271168
6714.805
-6706.076
3404.694
1713.477

(b-B)
Difference

sqrt(diag(V_b-V_B))
S.E.

-1598.021
5039.285
-.3116307
.5611513
-.2711338
783.7318

-21506.98
21832.12
683.5401

2620.517
6940.036
.1034198
.3385263
.2076711
283.5244
5916.469
6931.265
387.8057

b = consistent under Ho and Ha; obtained from xtreg
B = inconsistent under Ha, efficient under Ho; obtained from xtreg
Test:

Ho:

difference in coefficients not systematic
chi2(6) = (b-B)'[(V_b-V_B)^(-1)](b-B)
=
2.30
Prob>chi2 =
0.8898
(V_b-V_B is not positive definite)

So sánh lựa chọn mô hình
Syntax: esttab POLS FEM REM, star(* 0.1 ** 0.05 *** 0.01)  Kết xuất 3 MH

ra dạng bảng
Nếu lệnh esttab chưa có sẵn trong Stata, cài đặt như sau:
Syntax: ssc install estout
Tên biến
ROE
ROA
EPS
PE

Mô hình Pooled Mô hình FEM Mô hình REM
-17709.5*
-23563.0**
-21965.0**
(-1.88)
(-2.48)
(-2.41)
2039.2
9755
4715.7
-0.1
-0.45
-0.23
2.678***
2.570***
2.882***
-5.61
-5.8
-6.68
1.771
2.277

1.716
-0.67
-0.94
-0.72


BV
PB
TD
SIZE
GROWTH
_Cons
N
R2
Fstatistic/Wald.Chi2
Pro.F/Pro.Chi2
Kiểm định Hausman

0.339***
-4.74
6637.9***
-14.21
-3501.2
(-1.24)
2800.9***
-4.28
986
-0.82
-17773.1***
(-4.33)

205
.7414

0.156
-0.7
7498.5***
-14.38
-28213.1***
(-4.20)
25236.8***
-3.6
2397.0**
-2.05
-142882.2***
(-3.73)
205
.7804
57.26
0.0000
Chi2(6)=2.30

0.427***
-5.07
6714.8***
-15.34
-6706.1**
(-2.10)
3404.7***
-3.46
1713.5

-1.56
-21774.9***
(-3.67)
205
.7515
564.48
0.0000
Pro.Chi2 =
0.9898

Các biến ROA, PE không có ý nghĩa thống kê, biến ROE có hệ số hồi quy trái
dấu so với hệ số tương quan → có cần thực hiện việc loại bỏ biến ra khỏi các
mô hình và chạy lại mô hình
Để lựa chọn ra mô hình phù hợp nhất trong 3 mô hình vừa thống kê ở trên,
chúng ta tiến hành các kiểm định:
- Kiểm định F-test: so sánh mô hình Pooled Regression và Fixed effects model
với giả thuyết H0: chọn Pooled Regression. Kết quả cho thấy với mức ý nghĩa
1%, ta có: F = 0,0000 < 1% nên bác bỏ giả thuyết H0 → chọn Fixed effects
model.
- Kiểm định Hausman test: so sánh mô hình Fixed effects model và Random
effects model với giả thuyết H0: chọn Random effects model. Kết quả cho thấy
với mức ý nghĩa 1%, ta có Prob = 2,30% > 1% nên chấp thuận giả thuyết H0 →
chọn Random effects model.
5. Kiểm định phương sai của sai số thay đổi


Cách 1:
Phương sai của sai số thay đổi sẽ làm cho các ước lượng thu được bằng phương
pháp OLS vững nhưng không hiệu quả, các kiểm định hệ số hồi quy không còn
đáng tin cậy. Từ đó dẫn đến hiện tượng ngộ nhận các biến độc lập trong mô hình

nghiên cứu có ý nghĩa, lúc đó kiểm định hệ số hồi quy và R bình phương không
dùng được. Bởi vì phương sai của sai số thay đổi làm mất tính hiệu quả của ước
lượng, nên cần thiết phải tiến hành kiểm định giả thuyết phương sai của sai số
không đổi bằng kiểm định White, với giả thuyết H0: Không có hiện tượng
phương sai thay đổi.
Syntax:
reg MP ROE ROA EPS PE BV PB TD SIZE GROWTH
imtest, white  Kiểm định White mô hình POLS
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(53)
Prob > chi2

=
=

167.37
0.0000

Cameron & Trivedi's decomposition of IM-test

Source

chi2

df

p

Heteroskedasticity

Skewness
Kurtosis

167.37
13.09
3.10

53
9
1

0.0000
0.1585
0.0784

Total

183.56

63

0.0000

Với mức ý nghĩa alpha = 5%, kiểm định White cho kết quả là: Prob = 0,0504.
Vậy, Prob < 5% nên bác bỏ giả thuyết H0 → Có hiện tượng phương sai thay đổi.


Cách 2: Kiểm định phương sai của sai số thay đổi trong mô hình REM (kiểm
định nhân tử Lagrange)
Giả thiết Ho = var(u) = 0 ; phương sai của sai số qua các biến trong mô hình

REM là không đổi
Syntax:
xtreg MP ROE ROA EPS PE BV PB TD SIZE GROWTH, re
xttest0  Kiểm định nhân tử Lagrange mô hình REM
Breusch and Pagan Lagrangian multiplier test for random effects
MP[MACK1,t] = Xb + u[MACK1] + e[MACK1,t]
Estimated results:
Var
MP
e
u
Test:

sd = sqrt(Var)

8.36e+07
1.32e+07
8855440

9142.251
3638.394
2975.809

Var(u) = 0
chibar2(01) =
Prob > chibar2 =

26.63
0.0000


Với mức ý nghĩa alpha = 5%, kiểm định nhân tử Lagrange cho REM có kết quả
là: Prob = 0,0000. Vậy, Prob < 5% nên bác bỏ giả thuyết H0 → Có hiện tượng
phương sai thay đổi.
Cách 3: Kiểm định phương sai của sai số không đổi trong mô hình FEM
(kiểm định Wald - nếu mô hình FEM đươc chọn)
xtreg MP ROE ROA EPS PE BV PB TD SIZE GROWTH, fe


xttest3  Kiểm định Wald mô hình FEM
nếu Stata chưa có thì install bằng lệnh
ssc install xttest3
Kết quả:

Modified Wald test for groupwise heteroskedasticity
in fixed effect regression model
H0: sigma(i)^2 = sigma^2 for all i
chi2 (51) =
Prob>chi2 =

1.2e+05
0.0000

Prob < 5% nên bác bỏ giả thuyết H0 → Có hiện tượng phương sai thay đổi.
6. Kiểm định tương quan chuỗi
Thông thường ta phải thực hiện kiểm định tương quan chuỗi của mô hình nhưng
do khoảng thời gian của mẫu khảo sát tương đối ngắn (5 năm) nên việc kiểm
định tương quan chuỗi là không cần thiết.
Hướng dẫn cách kiểm định tương quan chuỗi
Syntax:
findit xtserial  tìm xem trên Stata có lệnh để kiểm định tương quan chuỗi hay

chưa
net sj 3-2 st0039
net install st0039  install lệnh này
Syntax:
xtserial MP ROE ROA EPS PE BV PB TD SIZE GROWTH
Kết quả:


Wooldridge test for autocorrelation in panel data
H0: no first-order autocorrelation
F( 1,
32) =
33.509
Prob > F =
0.0000
Prob < 5% nên bác bỏ giả thuyết H0 → Có hiện tượng tương quan chuỗi



×