Tải bản đầy đủ (.pdf) (75 trang)

Luận văn Thạc sĩ Kinh tế: Ước lượng sai số chuẩn trong mô hình tài chính với dữ liệu bảng - So sánh các phương pháp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.29 MB, 75 trang )

BỘ GIÁO DỤC ĐÀO TẠO
TRƢỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH
______________________________________

NGUYỄN TRỌNG Ý

ƢỚC LƢỢNG SAI SỐ CHUẨN TRONG MƠ HÌNH
TÀI CHÍNH VỚI DỮ LIỆU BẢNG: SO SÁNH CÁC
PHƢƠNG PHÁP

LUẬN VĂN THẠC SĨ KINH TẾ

Thành phố Hồ Chí Minh -2014


BỘ GIÁO DỤC ĐÀO TẠO
TRƢỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH
__________________________________

NGUYỄN TRỌNG Ý
ƢỚC LƢỢNG SAI SỐ CHUẨN TRONG MƠ HÌNH
TÀI CHÍNH VỚI DỮ LIỆU BẢNG: SO SÁNH CÁC
PHƢƠNG PHÁP
Chuyên ngành : Tài Chính Ngân Hàng
Mã số: 60340201

LUẬN VĂN THẠC SĨ KINH TẾ

NGƢỜI HƢỚNG DẪN KHOA HỌC:
GS.TS TRẦN NGỌC THƠ


Thành phố Hồ Chí Minh -2014


LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi. Các số liệu và kết
quả nghiên cứu trong luận văn này là trung thực và không trùng lặp với các đề tài khác.


MỤC LỤC
Trang phụ bìa
Lời cam đoan
Mục lục
Danh mục bảng
Danh mục hình
Tóm tắt ........................................................................................................................... 1
Chƣơng 1.

Giới thiệu chung ..................................................................................... 1

Chƣơng 2.

Ƣớc lƣợng mơ hình trong điều kiện hiệu ứng cơng ty cố định. ............. 4

2.1.

Các ƣớc lƣợng sai số chuẩn vững (robust standard error estimates). ............. 4

2.2.

Kiểm định các ƣớc lƣợng sai số chuẩn bằng mô phỏng. ................................ 8


2.3.

Sai số chuẩn theo phƣơng pháp Fama-Macbeth. .......................................... 11

2.4.

Mô phỏng ƣớc lƣợng sai số chuẩn Fama-Macbeth. ...................................... 13

2.5.

Các sai số chuẩn Newey-West. ..................................................................... 17

Chƣơng 3.

Ƣớc lƣợng sai số chuẩn trong điều kiện hiệu ứng thời gian. ............... 19

3.1.

Các ƣớc lƣợng sai số chuẩn vững. ................................................................ 20

3.2.

Các ƣớc lƣợng Fama-Macbeth. ..................................................................... 23

Chƣơng 4.
thời gian.

Ƣớc lƣợng sai số chuẩn trong điều kiện cả hiệu ứng công ty và hiệu ứng
.............................................................................................................. 26


4.1.

Sai số chuẩn ƣớc lƣợng theo Rogers. ............................................................ 26

4.2.

Ƣớc lƣợng Fama-Macbeth. ........................................................................... 29

Chƣơng 5.

Ƣớc lƣợng sai số chuẩn trong điều kiện hiệu ứng công ty tạm thời. ... 31

5.1.

Hiệu ứng công ty tạm thời : định dạng cấu trúc dữ liệu. .............................. 31

5.2.

Hiệu ứng cố định- biến giả công ty (Fixed Effects-Firm Dummies). ........... 33

5.3.

Sai số chuẩn Fama-Macbeth hiệu chỉnh. ...................................................... 35

Chƣơng 6.

Ứng dụng thực nghiệm. ........................................................................ 40



6.1.

Ứng dụng trong định giá tài sản. ................................................................... 41

6.2.

Ứng dụng trong Tài Chính Doanh Nghiệp.................................................... 45

Chƣơng 7.

Mơ hình định giá tài sản dựa trên dữ liệu Việt Nam ............................ 50

7.1.
Phân tích so sánh tổng quát giữa sai số chuẩn ƣớc lƣợng theo phƣơng pháp
White và phƣơng pháp Rogers (phân nhóm). ............................................................. 50
7.2.

Mơ hình hồi quy trên dữ liệu thực. ............................................................... 54

Chƣơng 8.

Kết luận ................................................................................................ 62


DANH MỤC BẢNG
Bảng 2.2.1 Kết quả mô phỏng ƣớc lƣợng sai số chuẩn OLS và Rogers trong trƣờng hợp
tồn tại hiệu ứng công ty trong dữ liệu ............................................................................ 9
Bảng 2.4.1 Kết quả mô phỏng ƣớc lƣợng sai số chuẩn theo Fama-Macbeth với hiệu
ứng công ty trong dữ liệu ............................................................................................. 15
Bảng 3.1.1 : Kết quả mô phỏng ƣớc lƣợng sai số chuẩn OLS và Rogers trong trƣờng

hợp tồn tại hiệu ứng công ty trong dữ liệu ................................................................... 21
Bảng 3.2.1 Kết quả mô phỏng ƣớc lƣợng sai số chuẩn theo Fama-Macbeth với hiệu
ứng thời gian trong dữ liệu ........................................................................................... 24
Bảng 4.1.1 Kết quả mô phỏng ƣớc lƣợng sai số chuẩn OLS và Rogers trong trƣờng hợp
tồn tại đồng thời hiệu ứng công ty và thời gian trong dữ liệu...................................... 27
Bảng 4.2.1 Kết quả mô phỏng ƣớc lƣợng sai số chuẩn theo Fama-Macbeth với tồn tại
đồng thời hiệu ứng công ty và thời gian trong dữ liệu ................................................. 30
Bảng 5.2.1 Ƣớc lƣợng sai số chuẩn với hiệu ứng công ty không cố định
Sai số chuẩn OLS và Rogers ........................................................................................ 33
Bảng 5.3.1 Ƣớc lƣợng sai số chuẩn với hiệu ứng công ty không cố định
Sai số chuẩn Fama-Macbeth
...................................................................................................................................... 36
Bảng 6.1.1 Ứng dụng định giá tài sản .......................................................................... 42
Bảng 6.2.1 Ứng dụng tài chính doanh nghiệp- Hồi quy cấu trúc vốn
...................................................................................................................................... 47


Bảng 7.2.1 Thống kê mô tả dữ liệu nghiên cứu ........................................................... 55
Bảng 7.2.2 Kết quả ƣớc lƣợng mơ hình định giá tài sản với dữ liệu Việt Nam .......... 56


DANH MỤC HÌNH
Hình 2.1.1 Ma trận phƣơng sai - hiệp phƣơng sai của phần dƣ .................................. 7
Hình 3.1.1 Sai số chuẩn đúng và sai số chuẩn Rogers khi số lƣợng nhóm (số năm ) thay
đổi .............................................................................................................................. 23
Hình 5.1.1 Hệ số tƣơng quan giữa phần dƣ khi thay đổi hiệu ứng công ty cố định (ρ) và
hệ số tự tƣơng quan bậc 1 (ϕ) ................................................................................... 32
Hình 7.1.1 Ma trận phƣơng sai - hiệp phƣơng sai ƣớc lƣợng theo phƣơng pháp White
................................................................................................................................... 51
Hình 7.1.2 Ma trận phƣơng sai- hiệp phƣơng sai ƣớc lƣợng theo phƣơng pháp Rogers

phân nhóm theo cơng ty ............................................................................................ 53


1

Ƣớc Lƣợng Sai Số Chuẩn Trong Mơ Hình Tài Chính Với Dữ Liệu Bảng: So Sánh Các
Phƣơng Pháp
Tóm tắt
Trong nghiên cứu thực nghiệm định giá tài sản và tài chính doanh nghiệp, các
nhà nghiên cứu thƣờng xuyên đối mặt với dữ liệu bảng. Trong các dữ liệu bảng này,
các phần dƣ có thể tƣơng quan giữa các cơng ty hoặc tƣơng quan giữa các thời kỳ, và
do đó các sai số chuẩn theo OLS có thể bị chệch. Trong lịch sử, có hai hƣớng nghiên
cứu sử dụng các phƣơng pháp khác nhau để giải quyết vấn đề này. Nghiên cứu về tài
chính doanh nghiệp dựa vào sai số chuẩn của Rogers, trong khi đó mơ hình định giá tài
sản sử dụng phƣơng pháp Fama-Macbeth để ƣớc lƣợng sai số chuẩn. Bài nghiên cứu
này tìm hiểu các phƣơng pháp khác nhau đƣợc sử dụng trƣớc đây và lý giải khi nào các
phƣơng pháp khác nhau này thu đƣợc cùng một sai số chuẩn( giá trị đúng) và khi nào
chúng cho ra các kết quả khác nhau. Ý định của bài nghiên cứu nay là nhằm cung cấp
các kiến thức nền tảng để lý giải tại sao các phƣơng pháp khác nhau đôi khi lại cho ra
các kết quả nghiên cứu khác nhau và hƣớng dẫn trong việc sử dụng các phƣơng pháp
này.
Chương 1.

Giới thiệu chung

Chúng ta đều biết rằng các sai số chuẩn theo OLS chỉ đúng khi các phần dƣ có
phân phối độc lập và đồng nhất. Khi các phần dƣ giữa các quan sát tƣơng quan với
nhau, sai số chuẩn theo OLS sẽ bị chệch (biased) và nó sẽ ƣớc lƣợng cao hơn hoặc thấp
hơn mức biến động thực của tham số ƣớc lƣợng. Mặc dù việc sử dụng các dữ liệu bảng
đã khá phổ biến, cách thức mà các nhà nghiên cứu sử dụng để giải quyết vấn đề sai số

ƣớc lƣợng bị chệch cũng khá đa dạng. Trong các nghiên cứu về tài chính có ƣớc lƣợng
dữ liệu bảng mà đƣợc xuất bản gần đây, 45% không báo cáo việc điều chỉnh sai số
chuẩn khi các phần dƣ phụ thuộc lẫn nhau. Trong số các nghiên cứu còn lại, những
phƣơng pháp để ƣớc lƣợng tham số cũng nhƣ sai số chuẩn trong trƣờng hợp tƣơng


2

quan trong nhóm (cluster) cũng đa dạng. 31% các bài nghiên cứu này sử dụng biến giả
cho mỗi nhóm. 34% ƣớc lƣợng cả tham số lẫn sai số chuẩn sử dụng phƣơng pháp
Fama-Macbeth. Hai phƣơng pháp còn lại sử dụng OLS để ƣớc lƣợng tham số nhƣng có
điều chỉnh sai số chuẩn trong tình huống tƣơng quan trong nhóm. 7% trong số này sử
dụng phƣơng pháp điều chỉnh sai số chuẩn bằng Newey-West (Newey-West, 1987)
trong khi 22% sử dụng sai số chuẩn Rogers (Williams, 2000, Rogers, 1993, Moulton,
1990, Moulton, 1986) đó chính sai số chuẩn White đƣợc điều chỉnh để tính tới trƣờng
hợp tƣơng quan trong nhóm. Các sai số chuẩn này còn đƣợc gọi là sai số chuẩn đƣợc
phân theo nhóm.
Mặc dù các nghiên cứu trƣớc đó đã đƣa ra rất nhiều phƣơng pháp để ƣớc lƣợng sai số
chuẩn trong dữ liệu bảng nhƣng nó cung cấp rất ít hƣớng dẫn cho những nhà nghiên
cứu để xem xét khi nào thì phƣơng pháp họ đang sử dụng là hợp lý. Bởi vì các phƣơng
pháp này đơi khi lại cho ra kết quả ƣớc lƣợng khác nhau nên việc hiểu đƣợc làm cách
nào để so sánh giữa các phƣơng pháp với nhau hết sức quan trọng. Ngoài ra, các nhà
nghiên cứu cũng cần phải hiểu đƣợc khi nào các phƣơng pháp này sẽ cho ra các ƣớc
lƣợng sai số chuẩn khác nhau và khi nào chúng lý giải việc lựa chọn các ƣớc lƣợng là
khác nhau. Đây là mục tiêu của bài nghiên cứu này.
Có hai hình thức phụ thuộc rất phổ biến trong ứng dụng tài chính. Hai hình thức này sẽ
đóng vai trị nền tảng cho việc phân tích trong bài nghiên cứu. Các phần dƣ ƣớc lƣợng
có thể tƣơng quan giữa các đơn vị chéo (quan sát giữa các năm khác nhau của một
công ty bị tƣơng quan). Trong bài nghiên cứu này, chúng ta gọi nó là hiệu ứng cơng ty
(firm effect). Ngồi ra, phần dƣ của một năm bất kỳ có thể bị tƣơng quan giữa các cơng

ty, nó đƣợc gọi là hiệu ứng thời gian (time effect). Bài nghiên cứu sẽ xem xét kết quả
mơ phỏng dữ liệu bảng trong cả hai hình thức phụ thuộc trên, đầu tiên sẽ thực hiện
riêng rẽ sau đó sẽ thực hiện đồng thời cả hai hiệu ứng. Với dữ liệu đƣợc mơ phỏng đó,
ta có thể ƣớc lƣợng các tham số và độ lệch chuẩn sử dụng các phƣơng pháp và so sánh


3

kết quả với nhau. Trong phần II của bài nghiên cứu, chúng ta sẽ tìm hiểu các phƣơng
pháp ƣớc lƣợng sai số chuẩn trong điều kiện có hiệu ứng tác động cố định (fixed
effect). Các sai số ƣớc lƣợng theo OLS và Fama-Macbeth đều bị chệnh dƣới và độ lớn
của nó sẽ tăng lên khi hiệu ứng cơng ty gia tăng. Sai số chuẩn Rogers khơng bị chệch
bởi đã tính đến sự phụ thuộc do hiệu ứng công ty. Các sai số chuẩn theo Newey- West
đƣợc điều chỉnh cho dữ liệu dạng bảng tuy cũng bị chệch nhƣng mức độ rất nhỏ.
Trong phần III, một phân tích tƣơng tự sẽ đƣợc thực hiện nhƣng thay vì phân tích hiệu
ứng cơng ty thì phần này phân tích hiệu ứng thời gian. Bởi vì phƣơng pháp FamaMacbeth đƣợc thiết kế để xử lý hiệu ứng thời gian nên các sai số chuẩn của các tham
số ƣớc lƣợng theo phƣơng pháp này sẽ không chệch là tƣơng đối hiệu quả hơn so với
ƣớc lƣợng OLS. Những suy đoán ban đầu trong hai phần đầu sẽ đƣợc đƣa vào phần IV,
phần này sẽ thực hiện mô phỏng dữ liệu dựa trên đồng thời cả hiệu ứng thời gian và
hiệu ứng công ty. Trong những phần nêu trên, hiệu ứng công ty đƣợc giả định nhƣ một
hằng số( không suy giảm theo thời gian). Nhƣng trong thực tế, hiệu ứng cơng ty trong
phần dƣ có thể suy giảm theo thời gian và do đó tƣơng quan giữa các phần dƣ cũng
giảm xuống khi khoảng cách của chúng tăng lên. Trong phần V, chúng ta phân tích kết
quả mơ phỏng dữ liệu với cấu trúc tƣơng quan tổng quát hơn. Điều này không chỉ cho
phép chúng ta có thể so sánh các sai số ƣớc lƣợng giữa các phƣơng pháp OLS, phƣơng
pháp phân nhóm, Fama-Macbeth một cách tổng quát và còn cho phép chúng ta xác
định một cách tƣơng đối lợi ích của việc sử dụng phƣơng pháp hiệu ứng cố định-FE
(sử dụng các biến giả công ty) để ƣớc lƣợng các tham số và liệu điều này có thể thay
đổi cách thức ƣớc lƣợng hay không. Hầu hết các bài nghiên cứu không thực hiện báo
cáo sai số chuẩn ƣớc lƣợng theo các phƣơng pháp khác nhau. Chính vì thế trong phần

VI, chúng ta phân tích kết quả áp dụng các kỹ thuật ƣớc lƣợng sai số chuẩn cho hai bộ
dữ liệu thực và so sánh một cách tƣơng đối các kết quả với nhau. Điều này cho phép
chúng ta thấy đƣợc các chỉ dẫn cho việc sử dụng kỹ thuật ƣớc lƣợng trong các tình


4

huống cụ thể khác nhau cũng nhƣ chỉ ra sự khác biệt của các phƣơng pháp ƣớc lƣợng
để có thể cung cấp các thơng tin cịn thiếu xót trong mơ hình và định hƣớng cải thiện
mơ hình cho tốt hơn.
Chương 2.

Ước lượng mơ hình trong điều kiện hiệu ứng cơng ty cố định.

2.1. Các ước lượng sai số chuẩn vững (robust standard error estimates).
Nhằm đƣa ra phán đoán tại sao sai số chuẩn theo phƣơng pháp OLS không đúng
và sai số chuẩn theo phƣơng pháp Rogers khắc phục điều này thế nào, chúng ta sẽ xem
xét một cách ngắn gọn việc tính tốn phƣơng sai của một tham số ƣớc lƣợng đƣợc diễn
đạt nhƣ thế nào. Mơ hình hồi quy chuẩn cho dữ liệu bảng đƣợc viết nhƣ sau:
Y  βX  ε
it
it
it

(1)

Trong đó chúng ta quan sát trên I công ty qua T thời kỳ. X và ɛ đƣợc giả định là độc
lập lẫn nhau và có trung bình bằng 0. Việc giả định trung bình bằng 0 khơng làm mất
đi tính tổng quát và cho phép bỏ đi hệ số chặn trong mơ hình đồng thời giúp chúng ta
tính phƣơng sai bằng tổng bình phƣơng của chính biến đó. Hệ số ƣớc lƣợng đƣợc xác

định:
N

^

β OLS 

T

 X
i 1 t 1
N T

N

it

Yit

 X
i 1 t 1
N

β



 X

2

it

i 1 t 1
N T

it

 X
i 1 t 1

i 1 t 1

N

it

(X it β  ε it )
T

 X
i 1 t 1

T

 X

T

ε it
2

it

Và phƣơng sai ƣớc lƣợng của các tham số :

2
it

(2)


5

2
2
 N T
  N T 2 
Var( β OLS )  E   X it ε it    X it  
  i 1 t 1
 
 i 1 t 1
^

2
N
T
 N T

2
2 
2 

 E   X it ε it   X it  
 i 1 t 1
 
 i 1 t 1



 NTζ 2X ζ ε2 NTζ 2X

(3)



2

ζ ε2

NTζ 2X

Đây là công thức chuẩn của OLS và dựa trên các giả định rằng các sai số phần dƣ là
độc lập và phân phối đồng nhất. Giả định độc lập đƣợc sử dụng để chuyển từ dòng 1
xuống dòng 2 của phƣơng trình (hiệp phƣơng sai của các phần dƣ là bằng 0). Giả định
phân phối đồng nhất (homoscedastic) đƣợc sử dụng để chuyển từ dòng 2 xuống dòng
3. Giả định độc lập hay bị vi phạm trong mơ hình dữ liệu bảng và bài nghiên cứu sẽ
tập trung giải quyết vấn đề này.
Mở rộng các giả định về phần dƣ độc lập, chúng ta sẽ giả định rằng dữ liệu có hiệu ứng
cố định (fixed effect). Do đó phần dƣ sẽ bao gồm yếu tố công ty cụ thể cùng với đặc
trƣng cho mỗi quan sát. Phần dƣ sẽ đƣợc biểu diễn ở dạng:
ε it  γ i  εit


(4)

Giả định rằng biến độc lập X cũng bao hàm yếu tố công ty:
Xit  μ i  ν it

(5)

Mỗi yếu tố trong biến X (φ và ν) và ɛ (λ và η) đƣợc giả định là độc lập lẫn nhau. Điều
này là cần thiết để các tham số ƣớc lƣợng đƣợc vững (consistent). Đây là cấu trúc đặc
trƣng của một dữ liệu bảng và nó hàm ý mức độ tƣơng quan giữa các quan sát của một
công ty cho trƣớc. Cả biến độc lập và phần dƣ đều tƣơng quan giữa hai quan sát trong
cùng một công ty cho trƣớc, nhƣng giả định độc lập giữa các công ty khác nhau:


6

corr(X it , X js )  1

corr(ε it , ε js )

if i  j, t  s

 ρ X  ζ μ2 /ζ 2X

if i  j, t  s

0

if i  j, t  s


1

if i  j, t  s

 ρ ε  ζ 2γ /ζ ε2

if i  j, t  s

0

(6)

if i  j, t  s

Với cấu trúc dữ liệu nhƣ trên, tôi có thể tính tốn các sai số chuẩn của tham số ƣớc
lƣợng theo phƣơng pháp OLS dựa trên các phƣơng trình (1), (4), (5). Bởi vì các sai số
khơng cịn độc lập trong nhóm, bình phƣơng của tổng các sai số khơng bằng với tổng
các sai số bình phƣơng. Các biến độc lập cũng có tính chất tƣơng tự. Hiệp phƣơng sai
cũng nên đƣợc đƣa vào. Phƣơng sai của tham số ƣớc lƣợng OLS:


Var[ β OLS

2
2
 N T

  N T
2
 β]  E   X it ε it    X it  

  i 1 t 1
 
 i 1 t 1





2
 N

2 N T
T
2
 E i 1 t 1 X it ε it   X it  
 i 1 t 1
 

2
T 1 T
 N T

 N T
2
2
2
 E i 1  t 1 X it ε it  2  X it X is ε it ε is   X it  
t 1 s  t 1

 i 1 t 1

 


(7)

 NTζ 2X ζ ε2  NT(T  1)ρ X ζ 2X ρ ε ζ ε2 NTζ 2X 

2



ζ ε2
1  (T  1)ρ X ρ ε 
NTζ 2X

Giả định phần dƣ độc lập giữa các công ty khác nhau đƣợc sử dụng để suy luận ra dòng
thứ hai. Với cấu trúc dữ liệu đã cho, tƣơng quan trong cùng một nhóm của biến độc lập
cũng nhƣ phần dƣ là dƣơng và độ lớn sẽ bằng với tỷ lệ phƣơng sai do hiệu ứng công ty
trên tổng phƣơng sai. Khi dữ liệu có hiệu ứng cố định, sai số chuẩn theo phƣơng pháp
OLS sẽ thấp hơn giá trị sai số đúng (true standard error) khi và chỉ khi ρX và ρƐ đồng


7

thời khác 0. Mức độ sai lệch gia tăng khi số năm trong dữ liệu tăng lên (Bertrand,
Duflo, và Mullainathan, 2004). Để hiểu đƣợc ý tƣởng này, chúng ta xem xét một
trƣờng hợp đặc biệt trong đó các biến độc lập và phần dƣ tƣơng quan hoàn toàn với
nhau theo thời gian (ρX =1 và ρΕ =1). Trong trƣờng hợp này, mỗi năm gia tăng sẽ
không cung cấp thêm bất cứ thơng tin nào và sẽ khơng có tác động đến sai số chuẩn
chính xác của mơ hình. Tuy nhiên, các sai số chuẩn theo phƣơng pháp OLS sẽ giả định

rằng cứ mỗi năm tăng lên sẽ cung cấp thêm N quan sát và do đó sai số chuẩn ƣớc
lƣợng sẽ nhỏ lại, làm cho kết quả ƣớc lƣợng không chính xác.
Tƣơng quan của các phần dƣ trong nhóm là vấn đề mà phƣơng pháp sai số chuẩn của
Rogers (sai số chuẩn White đƣợc điều chỉnh cho trƣờng hợp nhóm) sẽ xử lý. Bằng cách
bình phƣơng tổng của Xitɛit trong mỗi nhóm, hiệp phƣơng sai giữa các phần dƣ trong
nhóm sẽ đƣợc ƣớc lƣợng (xem hình 2.1.1, trang 7). Mối tƣơng quan này có thể tồn tại
ở nhiều dạng hàm, và đƣợc giả định có cấu trúc phi tham số. Tuy nhiên, tổng của Xitɛit
bình phƣơng đƣợc giả định là có cùng phân phối đối với các nhóm khác nhau. Do đó
các sai số chuẩn sẽ vững khi số lƣợng nhóm tăng lên (Donald và Lang, 2001; và
Wooldridge, 2002). Chúng ta sẽ quay lại thảo luận vấn đề này trong phần III.
Hình 2.1.1 : Ma trận phương sai - hiệp phương sai của phần dư

Công
ty 3

Công
ty 2

Công
ty 1

2

ε11
ε11ε12
ε11ε13
0
0
0
0

0
0

Công ty 1
ε11ε12 ε11ε13
ε122
ε12ε13
ε12ε13
ε132
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
ε212
ε21ε22
ε21ε23
0
0

0

Công ty 2
0
0
0
0
0
0
ε21ε22 ε21ε23
ε222
ε22ε23
ε22ε23
ε232
0
0
0
0
0
0

0
0
0
0
0
0
ε312
ε31ε32
ε31ε33


Công ty 3
0
0
0
0
0
0
0
0
0
0
0
0
ε31ε32 ε31ε33
ε322
ε32ε3
ε32ε3
ε332


8

2.2. Kiểm định các ước lượng sai số chuẩn bằng mơ phỏng.
Để so sánh một cách tƣơng đối sự chính xác của các phƣơng pháp ƣớc lƣợng
khác nhau và củng cố cho những nhận định đƣợc nêu ở trên trong bài nghiên cứu,
chúng ta sẽ phân tích kết quả mơ phỏng một dữ liệu bảng cụ thể và sau đó ƣớc lƣợng
hệ số chặn cũng nhƣ sai số chuẩn của chúng. Bằng việc làm nhƣ thế nhiều lần chúng ta
có thể quan sát đƣợc giá trị sai số chuẩn đúng cũng nhƣ giá trị sai số chuẩn ước lượng
trung bình. Trong lần mô phỏng đầu tiên, bài nghiên cứu chỉ xem xét sự hiện diện của

hiệu ứng công ty cố định trên biến độc lập và phần dƣ, hiệu ứng thời gian cố định
khơng đƣợc đƣa vào. Chính vì đó dữ liệu mơ phỏng sẽ có dạng nhƣ đƣợc mơ tả trong
phƣơng trình (4) và (5) (ở phía trên). Trong suốt q trình mơ phỏng, bài nghiên cứu
này tn theo các giả định rằng độ lệch chuẩn của biến độc lập và phần dƣ là khơng đổi
và lần lƣợt có giá trị là một và hai. Điều này sẽ dẫn đến giá trị R2 chỉ đạt giá trị 20%
nhƣng điều này khơng có gì là bất thƣờng trong mơ hình hồi quy tài chính thực
nghiệm. Trong những q trình mơ phỏng khác, chúng ta sẽ lần lƣợt xem xét các
trƣờng hợp khi giá trị tỷ trọng phƣơng sai đại diện cho hiệu ứng công ty trong biến độc
lập thay đổi. Tỷ trọng này có giá trị từ 0% đến 75% với giá trị cho mỗi lần tăng là 25%
(xem bảng 2.2.1, trang 9). Điều này đƣợc thực hiện tƣơng tự đối với phần dƣ. Cách
làm nay cho phép chúng ta tìm hiểu mức độ chệch của sai số chuẩn OLS phụ thuộc nhƣ
thế nào vào độ lớn của yếu tố hiệu ứng công ty tồn tại trong biến độc lập và phần dƣ.


9

Bảng 2.2.1 : Kết quả mô phỏng ước lượng sai số chuẩn OLS và Rogers
trong trường hợp tồn tại hiệu ứng công ty trong dữ liệu
Avg(βOLS)

Tỷ lệ biến động do hiệu ứng công ty trong biến độc lập

Std(βOLS)
Avg(SEOLS)

0%

25%

50%


75%

1.0004
0.0286
0.0283
0.0283
1.0004
0.0287
0.0283
0.0283
1.0001
0.0289
0.0283
0.0282
1.0000
0.0285
0.0283
0.0282

1.0006
0.0288
0.0283
0.0282
0.9997
0.0353
0.0283
0.0353
1.0002
0.0414

0.0283
0.0411
1.0004
0.0459
0.0283
0.0462

1.0002
0.0279
0.0283
0.0282
0.9999
0.0403
0.0283
0.0411
1.0007
0.0508
0.0283
0.0508
0.9995
0.0594
0.0283
0.0589

1.0001
0.0283
0.0283
0.0282
0.9997
0.0468

0.0283
0.0463
0.9993
0.0577
0.0283
0.0590
1.0016
0.0698
0.0283
0.0693

0%

25%
phần dư

Tỷ lệ biến động do hiệu ứng công ty trong

Avg(SER)

50%

75%

Ghi chú: bảng bao gồm kết quả ước lượng tham số và sai số chuẩn dựa trên mô phỏng 5000
dữ liệu bảng (10 năm và 500 cơng ty mỗi năm). Hệ số góc đúng bằng 1, độ lệch chuẩn của biến độc
lập là bằng 1 và của sai số là bằng 2. Tỷ lệ sai số chuẩn của phần dư do yếu tố cơng ty thay đổi trong
các dịng trong bảng và biến động từ 0% (không tồn tại hiêu ứng công ty) đến 75%. Tỷ lệ sai số chuẩn
của biến độc lập do yếu tố công ty thay đổi trong các cột trong bảng và biến động từ 0% (không tồn tại
hiêu ứng công ty) đến 75%. Mỗi ô trong bảng sẽ bao gồm giá trị trung bình và độ lệch chuẩn của tham

số ước lượng theo phương pháp OLS (Avg(βOLS) và Std(βOLS)). Độ lệch chuẩn chính là giá trị sai số
chuẩn đúng của tham số ước lượng. Giá trị thứ ba trong mỗi ô là sai số chuẩn của tham số được ước
lượng theo phương pháp OLS. Giá trị thứ tư trong mỗi ô là sai số chuẩn của tham số được ước lượng


10

theo phương pháp Rogers (phương pháp phân nhóm). Sai số chuẩn được tính tốn dựa trên phân nhóm
theo cơng ty để xem xét sự tương quan giữa các quan sát trong cùng một công ty ở các năm khác nhau.

Kết quả mô phỏng đƣợc báo cáo ở bảng 2.2.1, trang 9. Hai yếu tố đầu tiên trong mỗi ô
là giá trị trung bình của hệ số ƣớc lƣợng và độ lệch chuẩn của hệ số ƣớc lƣợng. Độ lệch
chuẩn là giá trị sai số chuẩn đúng (true standard error) của hệ số ƣớc lƣợng và là giá trị
lý tƣởng của sai số chuẩn ƣớc lƣợng. Sai số chuẩn ƣớc lƣợng trung bình theo phƣơng
pháp OLS (average standard error estimated by OLS) là giá trị thứ ba trong mỗi ô và
giá trị này bằng với sai số chuẩn đúng trong dòng đầu tiên của bảng kết quả. Khi khơng
có hiệu ứng công ty trong phần dƣ (phần dƣ độc lập giữa các quan sát), sai số chuẩn
ƣớc lƣợng bằng phƣơng pháp OLS là chính xác ( xem bảng 2.2.1, dịng 1, trang 9).
Khi khơng có hiệu ứng cơng ty trên biến độc lập (các quan sát giữa biến độc lập là độc
lập với nhau), giá trị sai số chuẩn trung bình đƣợc ƣớc lƣợng bằng OLS cũng chính xác
ngay cả khi phần dƣ bị tƣơng quan (xem bảng 2.2.1, cột 1, trang 9). Những kết quả này
đều là hệ quả của phƣơng trình (7). Sai số chuẩn theo OLS bị chệch là do sự phụ thuộc
trong biến độc lập và phần dƣ. Khi giá trị tƣơng quan của một trong hai yếu tố này
bằng 0 thì sai số chuẩn theo OLS là khơng chệch.
Khi có hiệu ứng cơng ty cả trong biến độc lập lẫn phần dƣ thì sai số chuẩn OLS bị ƣớc
lƣợng thấp hơn so với giá trị sai số chuẩn đúng và mức độ ƣớc lƣợng thấp này có thể
rất lớn. Ví dụ, khi 50% độ biến động trong cả phần dƣ và biến độc lập là do hiệu ứng
công ty cố định (ρX=ρƐ=0.5), giá trị sai số chuẩn ƣớc lƣợng OLS bằng một nửa giá trị
sai số chuẩn đúng (0.557 = 0.0283/0.0508). Giá trị sai số chuẩn ƣớc lƣợng bằng OLS
không thay đổi khi tôi tăng hiệu ứng công ty ở các cột (trong biến độc lập) hoặc ở các

dịng (trong phần dƣ). Trong khi đó giá trị sai số chuẩn thực sự có tăng lên.
Khi thực hiện ƣớc lƣợng sai số chuẩn của tham số ƣớc lƣợng bằng phƣơng pháp
Rogers, giá trị sai số chuẩn ƣớc lƣợng rất gần với giá trị sai số chuẩn đúng. Những giá
trị ƣớc lƣợng này cũng tăng theo giá trị đúng khi mức độ biến động do hiệu ứng công


11

ty tăng lên. Các sai số chuẩn theo phƣơng pháp Rogers tính tốn một cách chính xác sự
phụ thuộc lẫn nhau của dữ liệu dạng bảng (Rogers, 1993, Williams, 2000).
Mức độ chệch của sai số chuẩn OLS rất nhạy cảm với số lƣợng kỳ (số năm) đƣợc sử
dụng để ƣớc lƣợng. Khi số lƣợng kỳ trong nghiên cứu là gấp đơi thì phƣơng pháp OLS
tạo ra một số lƣợng quan sát cũng gấp đôi. Tuy nhiên nếu biến độc lập và phần dƣ
trong cùng một nhóm là tƣơng quan với nhau, lƣợng thông tin (biến động của biến độc
lập) sẽ không tăng lên gấp đôi. Mức độ chệch tăng từ 30% khi số năm quan sát của mỗi
năm là 5 đến 70% khi số năm là 50 năm (trong trƣờng hợp ρX=ρƐ=0.5). Trong khi đó
giá trị sai số chuẩn vững thì ln gần đúng với giá trị đúng của nó và độc lập với số kỳ
trong dữ liệu.
2.3. Sai số chuẩn theo phương pháp Fama-Macbeth.
Một phƣơng pháp khác để ƣớc lƣợng các hệ số hồi quy và các sai số chuẩn
trong trƣờng hợp các phần dƣ không độc lập với nhau là phƣơng pháp Fama-Macbeth
(Fama and MacBeth, 1973). Trong phƣơng pháp này, các nhà nghiên cứu thực hiện T
lần hồi quy dữ liệu chéo. Giá trị trung bình của T lần ƣớc lƣợng chính là giá trị hệ số
ƣớc lƣợng:



β FM




β
 t
t 1 T
T

 N

 N

X
Y
X it Yit 
it it 
T 
T 
1
1
  β    i 1N

   i 1N
T t 1 
T t 1 

2
2
X it
X it 

 




i 1

 i 1

(8)


12

Và giá trị phƣơng sai ƣớc lƣợng theo phƣơng pháp Fama-Macbeth đƣợc tính tốn theo
cơng thức:



β

β

t
FM 
T


 1 

S 2  β FM   
T 1


 T t 1

2

(9)

Tuy nhiên trong cơng thức tính phƣơng sai, các hệ số hồi quy theo năm (βt) đƣợc giả
định là độc lập với nhau. Nhƣ chúng ta có thể thấy trong cơng thức (8) và (9), cách tính
phƣơng sai ở trên chỉ đúng nếu Xitɛit và Xisɛis không tƣơng quan với nhau, với t khác s.
Nhƣ đã thảo luận ở trên, giả định này là khơng đúng khi có hiệu ứng cơng ty trong dữ
liệu (ρxρƐ khác 0). Do đó, phƣơng sai ƣớc lƣợng theo Fama-Macbeth sẽ rất nhỏ khi có
sự hiện diện của hiệu ứng cơng ty. Trong trƣờng hợp có hiệu ứng công ty, giá trị thực
của phƣơng sai theo ƣớc lƣợng Fama-Macbeth là:


Var( β FM ) 

T 
1
Var(
βt )

T2
t 1
T 1






Var( β t )

T



T



2  Cov(β t , β s )
t 1 s  t 1

T2

(10)





Var( β t ) T(T  1)


Cov(
β
,
β
t

s)
T
T2

Với cấu trúc dữ liệu cho trƣớc trong phƣơng trình (4) và (5), hiệp phƣơng sai của các
hệ số ƣớc lƣợng giữa các năm khác nhau thì độc lập với khoảng cách giữa hai năm t-s
và có thể đƣợc xác định theo công thức sau:


13

1
 N 2  1  N
 N
 N 2  
Cov(β t , β s )  E   X it    X it ε it   X is ε is   X is  
  i 1
 i 1
 i 1
 
 i 1




 N
 N

 (Nζ 2X )  2 E   X it ε it   X is ε is 
 i 1


 i 1
N

 (Nζ 2X )  2 E  X it X is ε it ε is 
 i 1

2 2
2
2
 (Nζ X ) Nρ X ζ X ρ ε ζ ε


(11)

ρ X ρ ε ζ ε2
Nζ 2X

Kết hợp phƣơng trình (10) và (11) ta đƣợc phƣơng trình diễn đạt giá trị đúng của
phƣơng sai ƣớc lƣợng theo Fama-Macbeth:




Var( β t ) T(T  1)
Var( β FM ) 

Cov(
β
,

β
t
s)
T
T2
1  ζ ε2  T(T  1)  ρ X ρ ε ζ ε2 



 
T  Nζ 2X 
T 2  Nζ 2X 




(12)

ζ ε2
1  (T  1)ρ X ρ ε 
NTζ 2X

Phƣơng trình (12) giống nhƣ phƣơng trình diễn đạt phƣơng sai tham số ƣớc lƣợng theo
phƣơng pháp OLS (xem phƣơng trình 7). Chính vì vậy, sai số chuẩn ƣớc lƣợng theo
phƣơng pháp Fama-Macbeth cũng rất nhỏ trong các trƣờng hợp giống nhƣ sai số chuẩn
ƣớc lƣợng bằng OLS. Trong tất cả các trƣờng hợp đó, mức độ ƣớc lƣợng thấp sẽ là một
hàm số của hệ số tƣơng quan giữa các biến độc lập và phần dƣ với số lƣợng thời kỳ
trên mỗi công ty.
2.4. Mô phỏng ước lượng sai số chuẩn Fama-Macbeth.
Để nghiên cứu mức độ chệch của ƣớc lƣợng sai số chuẩn theo phƣơng pháp FamaMacbeth, bài nghiên cứu này phân tích việc tính tốn các giá trị ƣớc lƣợng của hệ số



14

chặn và sai số chuẩn Fama-Macbeth với mỗi bộ dữ liệu mô phỏng gồm 5000 quan sát
nhƣ đã đƣợc sử dụng ở bảng 1 ở trên. Kết quả mô phỏng đƣợc báo cáo trong bảng 2.
Ƣớc lƣợng Fama-Macbeth cũng có đặc tính vững và hiệu quả nhƣ OLS (mức tƣơng
quan của hai phƣơng pháp này ở mức cao trên 0.99). Độ lệch chuẩn của hệ số ƣớc
lƣợng của hai phƣơng pháp này cũng giống nhau (so sánh giá trị thứ hai trong mỗi ô ở
bảng 2.2.1, trang 9 và bảng 2.4.1, trang 15). Giống nhƣ các ƣớc lƣợng sai số chuẩn
OLS, sai số chuẩn Fama-Macbeth có khuynh hƣớng chệch thấp xuống phía dƣới (xem
bảng 2.4.1, trang 15).
Tuy nhiên, mức độ chệch thực tế lớn hơn so với những hàm ý trong phƣơng trình (12)
và lớn hơn so với OLS. Ví dụ, giả sử ρX=ρƐ=75%, sai số chuẩn OLS bị chệch 60%
(0.595 = 1- 0.0283/0.0698, xem bảng 2.2.1, trang 9 ) trong khi sai số chuẩn FamaMacbeth chệch 74% (0.738 = 1 - 0.0699/0.0183, xem bảng 2.4.1, trang 15). Xem xét
tam giác dƣới trong bảng 2, từ bên trái phía trên xuống bên phải phía dƣới, giá trị đúng
của sai số chuẩn tăng lên trong khi sai số chuẩn ƣớc lƣợng theo Fama-Macbeth thì bị
chững lại (shrink). Khi hiệu ứng cơng ty tăng lên (ρX, ρƐ tăng lên) thì độ chệch trong
sai số chuẩn theo Fama-Macbeth thậm chí tăng cịn nhanh hơn so với sai số chuẩn theo
OLS. Mức độ chệch trong ƣớc lƣợng sai số chuẩn của Fama-Macbeth tăng mạnh nhƣ
vậy là do cách tính tốn phƣơng sai ƣớc lƣợng của phƣơng pháp này.


15

Bảng 2.4.1: Kết quả mô phỏng ước lượng sai số chuẩn theo Fama-Macbeth
với hiệu ứng công ty trong dữ liệu
Avg(βFM)

Tỷ lệ biến động do hiệu ứng công ty trong biến độc lập


Std(βFM)

0%
công ty trong phần dư

Tỷ lệ biến động do hiệu ứng

Avg(SEFM)

25%

50%

75%

0%

25%

50%

75%

1.0004
0.0287
0.0276

1.0006
0.0288

0.0276

1.0002
0.0280
0.0277

1.0001
0.0283
0.0275

1.0004
0.0288
0.0275
1.0000
0.0289
0.0276
1.0000
0.0286
0.0277

0.9997
0.0354
0.0268
1.0002
0.0415
0.0259
1.0004
0.0460
0.0248


0.9998
0.0403
0.0259
1.0007
0.0509
0.0238
0.9995
0.0595
0.0218

0.9997
0.0469
0.0250
0.9993
0.0578
0.0219
1.0016
0.0699
0.0183

Ghi chú: Bảng bao gồm kết quả ước lượng tham số và sai số chuẩn dựa trên mô
phỏng 5000 dữ liệu bảng (10 năm và 500 công ty mỗi năm). Hệ số góc đúng bằng 1, độ
lệch chuẩn của biến độc lập là bằng 1 và của sai số là bằng 2. Tỷ lệ sai số chuẩn của
phần dư do yếu tố cơng ty thay đổi trong các dịng trong bảng và biến động từ 0%
(không tồn tại hiêu ứng công ty) đến 75%. Tỷ lệ sai số chuẩn của biến độc lập do yếu
tố công ty thay đổi trong các cột trong bảng và biến động từ 0% (khơng tồn tại hiêu
ứng cơng ty) đến 75%. Gía trị đầu tiên trong mỗi ô là hệ số ước lượng bình quân dựa
trên phương pháp ước lượng Fama-Macbeth (chúng ta thực hiện ước lượng cho mỗi
năm, sau đó lấy giá trị trung bình của 10 năm). Giá trị thứ hai là độ lệch chuẩn của hệ
số ước lượng theo Fama-Macbeth. Đây chính là giá trị sai số chuẩn đúng. Giá trị thứ

ba là sai số chuẩn ước lượng theo phương pháp Fama-Macbeth.


16

Để thấy đƣợc điều này ta sẽ diễn giải mở rộng phƣơng trình (9).
 N
 N
X it ε it
 X ε
T 
1
1 T  i 1 it it
  
i 1

Var β FM  
  N

T t 1 

 T(T  1) t 1  N 2
2
X
  X it

it

 i 1
 i 1









2

N
 N



ν
)(γ
ε
)
  (μ i  ν it )(γ i  ε it ) 
i
it
i  it
T 
T
1
1

 i 1


   i 1 N

N


T(T  1) t 1 
T t 1
2
2


ν
)


ν
)




i
it
i
it

 i 1

 i 1


2

(13)

Giá trị phƣơng sai đúng của các hệ số theo Fama-Macbeth đƣợc đo lƣờng nhƣ là mức
chêch lệch giữa giá trị ƣớc lƣợng hàng năm so với giá trị thực của hệ số này (bằng 1
trong mô phỏng của chúng ta). Tuy nhiên, giá trị phƣơng sai ƣớc lƣợng lại đo lƣờng
mức độ chêch lệch giữa giá trị ƣớc lƣợng hàng năm với giá trị trung bình mẫu. Bởi vì
hiệu ứng công ty tác động đến cả các giá trị ƣớc lƣợng hàng năm và giá trị trung bình
của các ƣớc lƣợng này. Do đó, khi hiệu ứng cơng ty tăng lên (ρx, ρɛ tăng lên) sẽ làm
giảm giá trị sai số chuẩn ƣớc lƣợng trong khi làm gia tăng giá trị sai số chuẩn đúng của
các hệ số. Để nhìn nhận điều này một cách rõ ràng, chúng ta xem xét một trƣờng hợp
đặc biệt khi ρx và ρɛ đều bằng 1. Sai số chuẩn theo OLS ƣớc lƣợng thấp hơn so với giá
trị đúng là √T (sai số ƣớc lƣợng theo OLS là (σƐ/NTσX)1/2 trong khi sai số chuẩn đúng
có giá trị là (σƐ/NσX)1/2 ). Giá trị sai số chuẩn ƣớc lƣợng theo Fama-Macbeth sẽ bằng 0.
Nguyên nhân dẫn đến việc bị chệch này sẽ bị thu nhỏ lại khi số lƣợng năm nghiên cứu
tăng lên bởi khi đó giá trị ƣớc lƣợng của hệ số góc sẽ hội tụ về giá trị đúng của nó.
Hiệu ứng cơng ty có thể sẽ kém quan trọng hơn khi biến phụ thuộc là tỷ suất sinh lợi
(giá trị tỷ suất sinh lợi vƣợt trội khơng có tƣơng quan chuỗi) so với các ứng dụng của
tài chính doanh nghiệp khi các hiệu ứng cơng ty khơng quan sát đƣợc là cực kì quan
trọng (xem phần VI). Hiện tƣợng chệch mà chúng ta đã lƣu ý ở trên sẽ ít quan trọng


17

hơn trong các ứng dụng này. Điều này là không có gì ngạc nhiên khi phƣơng pháp
Fama-Macbeth đƣợc xây dựng để tính tốn cho trƣờng hợp có sự tƣơng quan giữa các
quan sát của các công ty khác nhau trong cùng một năm chứ khơng tính tốn cho sự
tƣơng quan giữa các quan sát cùng một công ty trong các năm khác nhau. Thực tế,
Fama và Macbeth cũng đã tiến hành kiểm tra mức độ tƣơng quan trong phần dƣ ở các

mơ hình của mình và phát hiện ra nó gần nhƣ bằng 0. Tuy nhiên, các ứng dụng của nó
đƣợc nhắc đến trong phần tài liệu tham khảo khơng phải lúc nào cũng đúng với các nền
tảng lý thuyết. Phƣơng pháp Fama-Macbeth đƣợc xây dựng để xử lý hiệu ứng thời gian
trong dữ liệu bảng chứ không phải hiệu ứng công ty, tôi sẽ quay lại với cấu trúc dữ liệu
này trong phần sau.
2.5. Các sai số chuẩn Newey-West.
Một phƣơng pháp khác đƣợc sử dụng để giải quyết trƣờng hợp tƣơng quan giữa
các phần dƣ là Newey-West (Newey and West, 1987). Phƣơng pháp này đƣợc sử dụng
một cách phổ biến để xử lý tƣơng quan chuỗi khi không biết dạng hàm của phần dƣ
trong một chuỗi thời gian bất kỳ. Nó đƣợc điều chỉnh để áp dụng trong trƣờng hợp dữ
liệu bảng bằng cách ƣớc lƣợng tƣơng quan giữa các phần dƣ trễ trong cùng một nhóm
(see Bertrand, Duflo, and Mullainathan, 2004, Doidge, 2004, MacKay, 2003,
Brockman and Chung, 2001). Vấn đề chọn độ dài của trễ thì hết sức đơn giản trong dữ
liệu bảng, bởi vì độ trễ tối đa trong mơ hình thì nhỏ hơn 1 năm so với số năm tối đa cho
mỗi công ty. Để xem xét mức độ hiệu quả tƣơng đối của Newey-West và các phƣơng
khác, chúng ta sẽ phân tích kết quả mơ phỏng 5000 bộ dữ liệu với 5000 quan sát cho
mỗi bộ. Mỗi bộ dữ liệu sẽ bao gồm 500 công ty và 10 năm cho mỗi công ty. Hiệu ứng
công ty đƣợc giả định chiếm 25% mức độ biến động của cả biến độc lập cũng nhƣ
phần dƣ.
Sai số chuẩn ƣớc lƣợng bởi Newey-West là một hàm tăng theo độ dài của trễ trong tiến
trình mơ phỏng này. Khi độ dài của trễ bằng 0, sai số chuẩn ƣớc lƣợng có giá trị đúng


×