1
TÓM TẮT ĐỀ TÀI
Mô hình số liệu mảng ngày càng được sử dụng rộng rãi trong nghiên cứu các
mô hình kinh tế lượng bởi tính ưu việt của nó. Các mô hình số liệu mảng như mô
hình tác động ngẫu nhiên, mô hình tác động cố định, mô hình OLS gộp,… đã được
áp dụng trong nhiều mô hình kinh tế. Trong đề tài này chúng tôi sử dụng mô hình số
liệu mảng áp dụng trong ngành kinh tế Dệt may Việt Nam nhằm nghiên cứu năng
suất, ảnh hưởng của lao động, của tài sản đầu tư lên năng suất và năng suất tổng
hợp của ngành.
ABSTRACT
Panel data models are increasingly widely used in studies of econometric
model by its advantages. The panel data models such as random effects model,
fixed effects model, pooled OLS model, …have been applied in many economic
models. In this thesis we use panel data models applied economics Textile Vietnam
to research productivity, impact of labor and investement of assets on productivity
and total factor productivity of the sector.
i
1
DANH MỤC HÌNH ẢNH VÀ BẢNG BIỂU
Hình 1.1. Giao diện Stata 11
Bảng 1.1. Câu lệnh phân tích số liệu mảng trong Stata
Bảng 2.1: Danh sách các ngành cấp 3 nghiên cứu
Bảng 2.2: Các chỉ tiêu điều tra doanh nghiệp
Bảng 2.3: Kết quả ước lượng TFP theo phương pháp bán tham số của Levpet
Bảng 2.4: Kết quả ước lượng mô hình tác động ngẫu nhiên
Bảng 2.5: Kết quả ước lượng bằng phương pháp biến giả
Bảng 2.6: kết quả ước lượng mô hình tác động ngẫu nhiên
Bảng 2.7: Kết quả ước lượng mô hình bằng phương pháp phương sai mạnh
Bảng phụ 1.1: Kiểm định Hausman
Bảng phụ 2.1: Kết quả kiểm định nhân tử Lagrange của Breusch
Bảng phụ 2.2: tóm tắt các kết quả
ii
1
DANH MỤC TỪ VIẾT TẮT, KÝ HIỆU
OLS Ordinary Least Squared – ình phương nh nhất cổ điển
POLS Pooled Ordinary Least Squared – ình phương nh nhất cổ điển gộp.
LS
eneral Least Squared – ình phương nh nhất tổng quát
R
Random ffect – tác động ngẫu nhiên
F
Fixed ffect – tác động cố định
W within – t ng cá nh n
F
First – ifferences – sai ph n cấp một
TFP: Total Factor Productivity – Năng suất các nhân tố tổng hợp
Trong đề tài này, các ký hiệu về véc tơ và ma trận được sử dụng rộng rãi để
mô tả các mô hình kinh tế lượng cũng như các kết quả ước lượng.
Véc tơ được định nghĩa là véc tơ cột và được ký hiệu bằng chữ thường in
đậm. Ví dụ, với hồi qui tuyến tính, véc tơ biến giải thích x là véc tơ dòng K 1 với
thành phần thứ j là x j và véc tơ tham số là một véc tơ cột K 1 với thành phần
thứ j là j , cho nên
1
và
K 1 K
x1
x
K 1 xK
o đó mô hình hồi qui tuyến tính y 1 x1 2 x2 ... K xK u được biểu
diễn là y x u .
3
1
CHƢƠNG 1: TỔNG QUAN VỀ SỐ LIỆU MẢNG VÀ CÁC PHƢƠNG PHÁP
ƢỚC LƢỢNG SỐ LIỆU MẢNG
1.1. Tổng quan về số liệu mảng
1.1.1. Định nghĩa ([1])
1.1.2. Các đặc trƣng của số liệu mảng
1.1.3. Các nghiên cứu đã thực hiện với số liệu mảng ở trong nƣớc và thế giới
1.1.3.1. Trong nƣớc
1.1.3.2. Thế giới
1.2. Tổng quan về các mô hình phân tích số liệu mảng ([3], [4])
Trong phần này chúng ta xét đến vấn đề biến không quan sát được hay
không được xét đến trong các mô hình kinh tế lượng và động lực của mô hình phân
tích số liệu mảng. Tại sao số liệu mảng lại được sử dụng bởi vì nó ước lượng phù
hợp với mô hình có những biến không quan sát được. Mô hình số liệu mảng với
biến không quan sát được viết dưới dạng sau:
yit xi1 1 xi 2 2 ... xiT T ci uit
(1.1)
Trong đó biến giải thích xit có thể thay đổi theo chiều dọc hoặc theo chiều
ngang, hoặc cả hai chiều, i chỉ số đối tượng (quốc gia, tỉnh, doanh nghiệp,…) t chỉ
số thời gian. uit là sai số ngẫu nhiên thông thường và được giả thiết là th a mãn các
giả thiêt thông thường, nghĩa là phương sai sai số không đổi và không tự tương
quan. Trong thành phần không quan sát được ci được cộng thêm vào, có nhiều cách
gọi tên ci như thành phần không quan sát được, biến ẩn, hoặc biến bị b qua. Nếu i
là cá thể thì thường gọi là tác động cá thể, thường là hộ gia đình, doanh nghiệp,
tỉnh, …Mô hình (1.1) được viết lại dưới dạng vector như sau
yit xit ci uit
(1.2)
Trong đó xit là véc tơ 1 K của biến giải thích, β là véc tơ K 1 các hệ số
ước lượng.
1
1
Những mô hình này người ta thường gọi là mô hình tác động cá thể và ta sẽ
nghiên cứu các mô hình này dưới đ y.
1.2.1. Mô hình tác động ngẫu nhiên
1.2.1.1. Ƣớc lƣợng và những giả thiết cơ bản của mô hình
1.2.1.2. Phƣơng pháp ƣớc lƣợng bình phƣơng bé nhất tổng quát (GLS)
1.2.1.3. Ƣớc lƣợng sử dụng ma trận phƣơng sai mạnh
1.2.2. Mô hình tác động cố định
Người ta sử dụng mô hình tác động ngẫu nhiên khi yếu tố không quan sát
được dạng ci có tương quan đến biến giải thích trong mô hình.
1.2.2.1. Mô hình và các giả thiết
1.2.2.2. Phƣơng pháp ƣớc lƣợng nội bộ
1.2.2.3. Phƣơng pháp ƣớc lƣợng sử dụng biến giả
1.2.3. Một số mô hình khác
1.2.3.1. Mô hình OLS gộp
1.2.3.2. Mô hình sai phân cấp một
1.3. Câu lệnh trong phần mềm Stata
1.3.1. Giới thiệu phần mềm Stata
Stata là phần mềm thống kê dùng để quản lý, phân tích số liệu và vẽ đồ
thị.Stata cho phép lưu trữ thông tin về các đặc điểm của các đối tượng nghiên cứu,
số liệu lưu trữ trong Stata có thể hiển thị dưới dạng bảng.Vì vậy việc phân tích số
liệu mảng người ta thường dùng với Stata.
2
1
1.3.2. Câu lệnh sử dụng các mô hình để phân tích số liệu mảng trong phần
mềm Stata
Câu lệnh phân tích số liệu mảng trong Stata luôn bắt đầu bằng “xt”. Sau đ y
là một số câu lệnh được sử dụng để phân tích số liệu mảng:
Bảng 1.2. Câu lệnh phân tích số liệu mảng trong Stata
STT Câu
Mô tả
Cấu trúc
lệnh
1
xtset
Định dạng số liệu xtset id time
dưới dạng mảng
id: chỉ biến cá thể
time: chỉ biến thời gian
2
xtdes
Mô tả cấu trúc của xtdes [if] [in]
số liệu mảng
if điều kiện
in: chỉ rõ dạng quan sát
3
xtsum
Tóm tắt số liệu
xtsum [varlist] [if]
varlist: danh sách biến
if điều kiện
4
xttab
Tạo bảng số liệu
xttab varname [if]
varname: tên biến
if điều kiện
5
xtreg
Ước lượng số liệu xtreg depvar [indepvar], option
mảng
depvar: biến phụ thuộc
indepvar: biến độc lập
option: lựa chọn mô hình ước lượng
Ước lượng GLS ngẫu nhiên
xtreg depvar [varlist] [if exp]
[, re i(varname) sa theta level(#) ]
Ước lượng tác động cố định
xtreg depvar [varlist] [if exp] ,
fe [ i(varname) level(#) ]
3
1
Ước lượng MLE ngẫu nhiên
xtreg depvar [varlist] [weight] [if exp] ,
mle [ i(varname) noconstant level(#) ]
6
xtdata
Tìm nhanh số liệu xtdata varlist, option
mảng
varlist: danh sách biến
option: lựa chọn
7
xtline
Đồ thị đường thẳng xtline varname, option
varname: tên biến
option: chọn dạng đường thẳng
8
xtlogit
Mô hình logarit
xtlogit depvar [indepvar], option
9
xtprobit
Ước lượng độ tin xtprobit depvar [indepvar], option
cậy
10
xtgraph
Đồ thị trong số liệu xtgraph varname, option
mảng
Trên đ y là một số câu lệnh cơ bản trong ước lượng số liệu mảng, ngoài ra
còn có một số lệnh khác nữa người đọc có thể sử dụng phần “help xt” của phần
mềm Stata.
4
1
CHƢƠNG 2. THỰC NGHIỆM
Trong phần này, chúng tôi sử dụng số liệu điều tra doanh nghiệp được thực
hiện hằng năm t năm 2000 đến 2010, các số liệu được sử dụng là số liệu sơ cấp t
cuộc điều tra, sau đó tác giả tổng hợp xử lý và tính toán lập thành số liệu mảng để
sử dụng các mô hình tính năng suất Levpet, tác động cố định và ngẫu nhiên trong
Stata. Cấu trúc số liệu như sau
Bảng 2.1: Danh sách các ngành cấp 3 nghiên cứu
Ký
Mã
hiệu
ngành
id = 1
1711
Sản xuất sợi và dệt vải
id = 2
1712
Hoàn thiện các sản phẩm dệt
id =3
1721
Sản xuất các sản phẩm dệt may sẵn có
id = 4
1722
Sản xuất thảm và chăn đệm
id = 5
1723
Sản xuất dây bện và lưới
id = 6
1729
Sản xuất các hàng dệt khác
id = 7
1730
Sản xuất hàng đan móc
id = 8
1810
May trang phục tr quần áo da lông thú
id = 9
1820
Year
Ngành
Thuộc và nhuộm da lông thú, sản xuất các sản phẩm t lông
thú
Thời gian t 2000 tới 2010
Bảng 2.2: Các chỉ tiêu điều tra doanh nghiệp
5
1
STT Tên biến
Chỉ tiêu
1
laodong
Lao động
2
thunhap
Thu nhập người lao động
3
taisan
Tài sản – vốn
4
tscddtdh
Tài sản cố định đầu tư dài hạn
5
nguyegia
Nguyên giá
6
khtscd
Khấu hao tài sản cố định
7
tsld
Tài sản lưu động
8
xddodang Chi phí xây dựng dở dang
9
Nophatra
10
Doanhthu Doanh thu
11
Loinhuan
Lợi nhuận trước thuế
12
Thue
Thuế và các khoản phải nộp
13
Vondautu Vốn đầu tư
14
vdt_vay
Vốn đầu tư đi vay
15
Gtsx
Giá trị sản xuất
16
vonpd_vn Vốn pháp định bên Việt Nam
17
vonpd_nn Vốn pháp định nước ngoài
18
Va
Nợ phải trả
Va là giá trị gia tăng
lợi nhuận
thu nhập người lao động
khấu hao tài sản cố định
19
M
Đầu vào trung gian được xác định = Va – doanh thu
2.1. Cách tính năng suất tổng hợp theo phƣơng pháp Levpet
2.1.1. Câu lệnh ƣớc lƣợng năng suất trong Stata
Levpet depvar [if exp] [in range],free(varlist) proxy(varlist) capital(varname)
[[valueadded/revenue] justid grid i(varname) t(varname) reps(#) level(#)]
ú pháp ước lượng bằng phần mềm Stata
6
1
Predict [type]newvarname[if exp] [in range], omega
2.1.2. Các tùy chọn
3.1.3. Kết quả chạy ƣớc lƣợng
Bảng 2.3: Kết quả ƣớc lƣợng TFP theo phƣơng pháp bán tham số của Levpet
Levinsohn-Petrin productivity estimator
Dependent variable represents value added.
Number of obs
=
97
Group variable (i): id
Number of groups =
9
Time variable (t): year
Obs per group: min =
11
avg =
11
max =
---------------------------------------------------------------------------lnva|
Coef. Std. Err.
z
P>|z|
[95% Conf. Interval]
----------------------------------------------------------------------------lnlaodong | .3400428 .0994789
3.42 0.001
.1450678
.5350178
lnvondautu | .4927971 .1485485
3.32 0.001
.2016473
.7839469
-----------------------------------------------------------------------------Wald test of constant returns to scale: Chi2 = 2.75 (p = 0.0156).
2.2. Mô hình tác động cố định
2.2.1. Phƣơng pháp ƣớc lƣợng nội bộ
Câu lệnh trong Stata với mô hình tác động ngẫu nhiên như sau:
xtreg va laodong vondautu, fe
7
11
1
Kết quả chạy ước lượng như bảng sau:
Bảng 2.4: Kết quả ƣớc lƣợng mô hình tác động ngẫu nhiên
Fixed-effects (within) regression
Number of obs
Group variable: id
Obs per group: min =
between = 0.8946
avg =
overall = 0.8567
=
99
Number of groups =
R-sq: within = 0.8590
F(2,88)
=
11
11.0
max =
11
267.96
corr(u_i, Xb) = -0.6977
Prob > F
=
0.0000
-----------------------------------------------------------------------------va|
Coef. Std. Err.
t
P>|t|
[95% Conf. Interval]
----------------------------------------------------------------------------laodong |
42.9308
3.38083
vondautu | 1.462452 .1379941
_cons | -872898.7 309016.4
12.70 0.000
10.60 0.000
-2.82 0.006
36.21211
49.64949
1.188218
-1487004 -258793.5
----------------------------------------------------------------------------sigma_u | 3696305.3
sigma_e | 2062221.5
rho | .7626204 (fraction of variance due to u_i)
------------------------------------------------------------------------------
8
1.736687
9
1
F test that all u_i=0:
F(8, 88) =
8.10
Prob > F = 0.0000
Trong báo cáo Stata u ký hiệu cho ci và e ký hiệu cho uit.
2.2.2. Phƣơng pháp ƣớc lƣợng sử dụng biến giả
Ta tạo ra các biến giả là các ngành t 1 đến 9 bằng câu lệnh trong Stata như
sau:
quietly tab id, gen(nganh)
Câu lệnh ước lượng sử dụng biến giả trong Stata:
xi: reg va laodong vondautu nganh2-nganh9
Kết quả ước lượng bằng Stata:
Bảng 2.5: Kết quả ƣớc lƣợng bằng phƣơng pháp biến giả
Source |
SS
df
MS
Number of obs =
-------------------------------------------
F( 10,
88) = 153.81
Model | 6.5413e+15
10 6.5413e+14
Prob > F
Residual | 3.7424e+14
88 4.2528e+12
R-squared
------------------------------------------Total | 6.9155e+15
99
= 0.0000
= 0.9459
Adj R-squared = 0.9397
98 7.0566e+13
Root MSE
= 2.1e+06
-----------------------------------------------------------------------------va |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
----------------------------------------------------------------------------laodong |
42.9308
3.38083
12.70 0.000
9
36.21211
49.64949
1
vondautu | 1.462452 .1379941
10.60 0.000
1.188218
1.736687
nganh2 | -3533464
1018848
-3.47 0.001
-5558210
-1508718
nganh3 | -3574134
1013755
-3.53 0.001
-5588758
-1559510
nganh4 | -3560481
1035600
-3.44 0.001
-5618518
-1502445
nganh5 | -3177395
1032420
-3.08 0.003
-5229112
-1125677
nganh6 | -3613499
1005882
-3.59 0.001
-5612479
-1614520
nganh7 | -3761585
1026276
-3.67 0.000
-5801093
-1722077
nganh8 | -1.36e+07
1733210
-7.84 0.000
-1.70e+07 -1.01e+07
nganh9 | -3388547
1036368
-3.27 0.002
-5448112
4.05 0.000
1717487
_cons |
3371575 832333.6
-1328983
5025663
Thực chất phương pháp ước lượng với biến giả chính là phương pháp ước
lượng gộp tiến hành với số liệu mảng với n – 1 biến giả thể hiện cho n cá thể.Với
phương pháp này, chúng ta một mặt ước lượng được các giá trị ci mặt khác còn đưa
ra được suy diễn thống kê về sự khác biệt giữa các cá thể.Trong bảng 2.5 nói trên,
2.3. Mô hình tác động ngẫu nhiên
2.3.1. Phƣơng pháp ƣớc lƣợng tác động ngẫu nhiên GLS
Lệnh khai báo: xtset id year
Câu lệnh ước lượng mô hình tác động ngẫu nhiên cho số liệu doanh nghiệp:
xtreg va laodong vondautu, re
Trong đó va là biến phụ thuộc, laodong, vondautu là biến độc lập, re ngụ ý mô
hình tác động ngẫu nhiên.
10
1
Kết quả chạy mô hình như sau
Bảng 2.6: kết quả ƣớc lƣợng mô hình tác động ngẫu nhiên
Random-effects GLS regression
Number of obs
Group variable: id
Number of groups =
9
R-sq: within = 0.7928
Obs per group: min =
11
between = 0.9773
avg =
11.0
overall = 0.9060
max =
11
Random effects u_i ~ Gaussian
corr(u_i, X)
theta
= 0 (assumed)
Wald chi2(2)
Prob > chi2
=
=
=
99
925.62
0.0000
=0
-----------------------------------------------------------------------------va |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
----------------------------------------------------------------------------laodong | 21.45524 1.926044
11.14
0.000
17.68026
25.23021
vondautu | 2.038142 .1356104
15.03
0.000
1.772351
2.303934
_cons | 84284.39 294173.8
0.29
0.774
-492285.7
660854.5
sigma_u |
0
sigma_e | 2062221.5
rho |
0 (fraction of variance due to u_i)
11
1
2.3.2. Phƣơng pháp ƣớc lƣợng phƣơng sai mạnh cho mô hình tác động ngẫu
nhiên
Câu lệnh thực hiện trong Stata như sau
xtreg va laodong vondautu, re robust
Kết quả chạy mô hình như bảng sau:
Bảng 2.7: Kết quả ƣớc lƣợng mô hình bằng phƣơng pháp phƣơng sai mạnh
Random-effects GLS regression
Number of obs
Group variable: id
Number of groups =
9
R-sq: within = 0.7928
Obs per group: min =
11
between = 0.9773
avg =
11.0
overall = 0.9060
max =
11
=
99
Random effects u_i ~ Gaussian
Wald chi2(2)
= 41102.50
corr(u_i, X)
Prob > chi2
=
= 0 (assumed)
0.0000
(Std. Err. adjusted for 9 clusters in id)
Robust
va|
Coef. Std. Err.
z
P>|z|
[95% Conf. Interval]
----------------------------------------------------------------------------laodong | 21.45524 1.665656
12.88 0.000
18.19061
24.71986
vondautu | 2.038142 .1525553
13.36 0.000
1.739139
2.337145
_cons | 84284.39 413967.6
0.20 0.839
-727077.1
895645.9
-----------------------------------------------------------------------------
12
1
sigma_u |
0
sigma_e | 2062221.5
rho |
0 (fraction of variance due to u_i)
KẾT LUẬN
T kết quả chạy thực nghiệm các mô hình số liệu mảng áp dụng cho ngành
Dệt may Việt Nam ta có một số nhận xét sau:
Qua sử dụng hai mô hình tác động ngẫu nhiên và tác động cố định ta thấy
rằng lực lượng lao động có tác động mạnh mẽ lên giá trị gia tăng của ngành dệt
may, nếu lực lượng lao động tăng 1% thì giá trị gia tăng của ngành Dệt may tăng
xấp xỉ 21%. Như vậy để tăng giá trị gia tăng của ngành chúng ta cần n ng cao năng
lực của người lao động.
T hai mô hình ta cũng nhận thấy rằng khi vốn đầu tư cho ngành
ệt may
tăng thì giá trị gia tăng cũng tăng theo, nếu vốn đầu tư tăng 1% thì giá trị gia tăng
xấp xỉ 2%, như vậy vốn đầu tư cũng là một nhân tố ảnh hưởng tới giá trị gia tăng
của ngành.
Ngày nay việc tính năng suất tổng hợp phản ánh các yếu tố vô hình như kiến
thức, kỹ năng lao động, giải pháp công nghệ, …đang dần phổ biến và đóng vai trò
quan trọng tron việc phân tích và dự báo kinh tế. Trong đề tài này cũng đề xuất một
phương pháp tính năng suất tổng hợp sử dụng số liệu mảng.
Như vậy chúng ta thấy rằng việc ứng dụng mô hình số liệu mảng vào tính
toán kinh tế lượng ngày càng phổ biến do tính ưu việt của nó. Ngành Dệt may là
ngành kinh tế mũi nhọn của nước ta, là ngành có kim ngạch xuất khẩu nằm trong
tốp đầu trong nền kinh tế nước ta. Qua các mô hình ước lượng trên ta thấy rằng để
n ng cao năng suất hay sản lượng ngành Dệt may chúng ta phải quan tâm tới lực
lượng lao động và đầu tư đúng mức cho ngành kinh tế này.
13
1
Về mặt ứng dụng của đề tài vào ngành giáo dục. húng tôi đặt ra mục tiêu là
sẽ viết về công cụ nghiên cứu nhằm giới thiệu và trang bị cho người đọc những mô
hình cần thiết và cách thực hiện một mô hình bằng phần mềm Stata. Đề tài cũng đã
giới thiệu được phương pháp tương đối mới trong nền kinh tế hiện nay để xử lý các
vấn đề kinh tế. Đó là phương pháp kinh tế lượng. húng tôi đề xuất, sẽ đưa tài liệu
này vào giảng dạy, làm tài liệu tham khảo cho các bạn sinh viên làm khóa luận tốt
nghiệp trong các ngành Toán Ứng dụng và ngành tài chính ngân hàng.
14
1
TÀI LIỆU THAM KHẢO
[1]. Jeffrey M. Wooldridge (2002), Econometric Analysis of Cross Section and
Panel Data, The MIT Press Cambridge, Massachusetts London, England
[2]. Badi H. Baltagi (2005), Econometric Analysis of Panel Data, 3rd Edition, John
Wiley& Son, Ltd,
[3]. GS.TS. Nguyễn Khắc Minh (2002), Các phương pháp phân tích và dự báo
trong kinh tế, NXB Khoa học và Kỹ Thuật Hà Nội.
[4]. GS.TS. Nguyễn Quang Dong (2008), Bài giảng kinh tế lượng, NXB Giao
thông vận tải Hà Nội.
[5]. Arthur S.Goldberger, Econometric Theory, John Wiley & Sons,Inc
[6]. Damodar N. Gujarati (1995), Basic Econometric, MacGraw-Hill Inc, Third
Ed.
[7]. Madala, G.S-macmillan (19920), Introduction of Econometrics. 2d ed.,
New York.
[8]. Greene, W. 2000. Econometric Analysis. Upper Saddle River, NJ:
Prentice–Hall.
[9]. Brown, M. B., and A. B. Forsythe. 1974. Robust test for the equality of
variances. Journal of the American Statistical Association 69: 364-367
15
1
PHẦN PHỤ LỤC
Phụ lục 1: Kiểm định Hausman
Phụ lục 2: Kiểm định nhân tử Lagrange của Breusch-Pagan
Phụ lục 3: Code chạy chƣơng trình ƣớc lƣợng
Phụ lục 4: Code chạy ƣớc lƣợng bán tham số theo phƣơng pháp Levpet
16