Tải bản đầy đủ (.pdf) (81 trang)

Sử dụng mô hình hồi quy dữ liệu mảng đánh giá tác động của cơ cấu nguồn vốn đến hiệu quả kinh doanh của doanh nghiệp nghành ngân hàng trên TTCK việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.28 MB, 81 trang )

i
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2

PHÙNG THỊ THU

SỬ DỤNG MÔ HÌNH HỒI QUY DỮ LIỆU MẢNG
ĐÁNH GIÁ TÁC ĐỘNG CỦA CƠ CẤU NGUỒN VỐN
ĐẾN HIỆU QUẢ KINH DOANH CỦA DOANH NGHIỆP
NGÀNH NGÂN HÀNG TRÊN TTCK VIỆT NAM

LUẬN VĂN THẠC SĨ TOÁN HỌC

HÀ NỘI - 2017


ii
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2

PHÙNG THỊ THU

SỬ DỤNG MÔ HÌNH HỒI QUY DỮ LIỆU MẢNG
ĐÁNH GIÁ TÁC ĐỘNG CỦA CƠ CẤU NGUỒN VỐN
ĐẾN HIỆU QUẢ KINH DOANH CỦA DOANH NGHIỆP
NGÀNH NGÂN HÀNG TRÊN TTCK VIỆT NAM

Chuyên ngành: Toán ứng dụng
Mã số: 60 46 01 12

LUẬN VĂN THẠC SĨ TOÁN HỌC


Người hướng dẫn khoa học: TS. Nguyễn Thị Thuý Quỳnh

HÀ NỘI - 2017


iii

LỜI CẢM ƠN
Luận văn được hoàn thành dưới sự hướng dẫn của TS. Nguyễn Thị Thuý
Quỳnh. Tác giả xin bày tỏ lòng biết ơn sâu sắc nhất tới TS. Nguyễn Thị Thuý
Quỳnh người đã định hướng chọn đề tài và tận tình hướng dẫn để tác giả hoàn
thành luận văn này.
Tác giả cũng xin bày tỏ lòng biết ơn chân thành tới Phòng Sau đại học,
các thầy cô giáo dạy cao học trường Đại học Sư phạm Hà Nội 2 đã giúp đỡ
tác giả trong suốt quá trình học tập và hoàn thành luận văn tốt nghiệp.
Tác giả xin được gửi lời cảm ơn đến gia đình, bạn bè đã luôn ủng hộ,
quan tâm để tác giả có thể hoàn thành luận văn.
Hà Nội,ngày 20 tháng 12 năm 2017
TÁC GIẢ

Phùng Thị Thu


iv

LỜI CAM ĐOAN
Được sự hướng dẫn của TS. Nguyễn Thị Thuý Quỳnh, luận văn Thạc sĩ
“Sử dụng mô hình hồi quy dữ liệu mảng đánh giá tác động cơ cấu nguồn vốn
đến hiệu quả kinh doanh của doanh nghiệp ngành ngân hàng trên TTCK Việt
Nam” được hoàn thành bởi sự tìm hiểu, nghiên cứu của bản thân, số liệu và

kết quả nghiên cứu trong luận văn là trung thực không trùng với bất kỳ luận
văn nào khác.
Tôi cũng xin cam đoan r ng mọi sự giúp đỡ cho việc thực hiện luận văn
này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ
nguồn gốc.
TÁC GIẢ

Phùng Thị Thu


v

MỤC LỤC
PHẦN MỞ ĐẦU .............................................................................................. 1
CHƢƠNG I ...................................................................................................... 3
MỘT SỐ KIẾN THỨC CHUẨN BỊ .............................................................. 3
1.1. Một số khái niệm ban đầu. ..................................................................................... 3
1.1.1. Quá trình ngẫu nhiên. ...................................................................... 3
1.1.2. Quá trình dừng ................................................................................ 3
1.1.3. Nhiễu trắng .................................................................................... 4
1.2. Một số phân phối thông dụng .................................................................... 4
1.2.1. Phân phối chuẩn .............................................................................. 4
1.2.2. Phân phối T – Student ..................................................................... 6
1.2.3. Phân phối Khi Bình phương ........................................................... 6
1.2.4. Phân phối Fisher.............................................................................. 7
1.3. Mô hình hồi quy tuyến tính.................................................................................... 8
1.3.1. Mô hình hồi quy tuyến tính bội và phương pháp OLS ................... 8
1.3.2. Mô hình hồi quy dữ liệu chuỗi thời gian ...................................... 14
1.3.2.1. Dữ liệu chuỗi thời gian .......................................................... 14
1.3.2.2. Mô hình hồi quy chuỗi thời gian ............................................ 14

1.3.2.3. Mô hình hồi quy với chuỗi thời gian dừng: ........................... 17
1.3.2.3.1. Mô hình hồi quy tĩnh....................................................... 17
1.3.2.3.2. Mô hình hồi quy động ..................................................... 18
1.3.2.3.3. Mô hình xu thế thời gian và mùa vụ ............................... 21
1.3.2.4. Mô hình hồi quy với chuỗi thời gian không dừng ................. 23
1.3.2.4.1. Bước ngẫu nhiên ............................................................. 24
1.3.2.4.2. Quá trình trung bình trượt ............................................... 25
1.3.2.4.3.Quá trình tự hồi quy ......................................................... 27
1.3.2.4.4. Quá trình trung bình trượt tự hồi quy ............................. 33
1.3.2.5. Chuỗi không dừng và mô hình hồi quy cổ điển ..................... 35
1.3.2.6. Mô hình hiệu chỉnh sai số ECM ............................................ 36
1.3.3. Mô hình hồi quy với dữ liệu mảng................................................ 37
1.3.3.1. Dữ liệu mảng ......................................................................... 38


vi
1.3.3.2. Ước lượng các mô hình hồi quy với dữ liệu mảng ................ 38
CHƢƠNG II .................................................................................................. 46
SƠ LƢỢC VỀ CƠ CẤU NGUỒN VỐN VÀ CÁC NHÂN TỐ ................. 46
TÁC ĐỘNG ĐẾN HIỆU QUẢ KINH DOANH CỦA ............................... 46
DOANH NGHIỆP NGÀNH NGÂN HÀNG ............................................... 46
2.1. Khái niệm cơ cấu nguồn vốn của doanh nghiệp ................................................46
2.1.1. Khái niệm ...................................................................................... 46
2.1.2. Các chỉ tiêu phản ánh cơ cấu nguồn vốn của DN ......................... 47
2.1.3. Cơ cấu nguồn vốn mục tiêu của doanh nghiệp ............................. 49
2.2. Các chỉ số đo hiệu quả kinh doanh của doanh nghiệp ......................................50
2.3. Tác động của cơ cấu nguồn vốn đến khả năng sinh lời của doanh nghiệp .....53
CHƢƠNG III ................................................................................................. 55
ỨNG DỤNG MÔ HÌNH HỒI QUY DỮ LIỆU MẢNG ............................. 55
ĐÁNH GIÁ TÁC ĐỘNG CỦA CƠ CẤU NGUỒN VỐN ĐẾN HIỆU QUẢ

KINH DOANH CỦA CÁC DOANH NGHIỆP NGÀNH NGÂN HÀNG
TRÊN TTCK VIỆT NAM ............................................................................ 55
3.1. Giới thiệu về ngành ngân hàng….. .....................................................................55
3.2. Xây dựng mô hình hồi quy các nhân tố tác động của cơ cấu nguồn vốn đến
hiệu quả kinh doanh của doanh nghiệp ngành ngân hàng........................................56
3.3. Giới thiệu phần mềm STATA .............................................................................57
3.4. Ứng dụng STATA phân tích mô hình hồi quy dữ liệu mảng đánh giá tác động
của cơ cấu nguồn vốn đến hiệu quả kinh doanh của các doanh nghiệp ngành ngân
hàng trên TTCK Việt Nam..........................................................................................58
3.5. Thảo luận kết quả mô hình hồi quy.......................................................... 68
III. Kết luận ................................................................................................... 70
IV. Danh mục các tài liệu tham khảo .......................................................... 71


vii

DANH MỤC ĐỒ THỊ VÀ BẢNG BIỂU
Hình 1.1: Đồ thị hàm mật độ của phân phối chuẩn......................................... . 5
Hình 1.2: Đồ thị hàm mật độ của phân phối T-Student. ................................... 6
Hình 1.3: Đồ thị hàm phân phối xác suất biến ngẫu nhiên của phân phối khi
bình phương. ..................................................................................................... 7
Hình 1.4: Minh hoạ đồ thị hàm phân phối F(1;2). ............................................ 8
Hình 1.5: Minh hoạ quan hệ Ut và Us. ............................................................ 16
Bảng 3.1: Danh sách các ngân hàng. .............................................................. 56
Bảng 3.2: Thống kê mô các biến nghiên cứu trong mô hình. ......................... 58
Bảng 3.3: Hệ số tương quan giữa các biến trong mô hình.............................. 59
Bảng 3.4: Hệ số VIF của các biến độc lập trong mô hình. ............................. 59
Bảng 3.5: Bảng kiểm định tính dừng của biến độc lập CCTS. ....................... 60
Bảng 3.6: Kết quả kiểm định tính dừng của các biến trong mô hình. ............ 61
Bảng 3.7: Kiểm tra tính dừng của phần dư. .................................................... 61

Bảng 3.8: Hồi quy mô hình theo phương pháp POOLED. ............................. 62
Bảng 3.9: Bảng hồi quy sử dụng biến giả kiểm định sự khác biệt giữa các
công ty. ............................................................................................................ 63
Bảng 3.10: Mô hình có biến giả theo thời gian............................................... 64
Bảng 3.11: Kiểm định lựa chọn mô hình FEM và REM. ............................... 66
Bảng 3.12: Kết quả mô hình hồi quy tác động cố định FEM. ........................ 66
Bảng 3.13: Mô hình hồi quy tác động cố định đánh giá cơ cấu nguồn vốn đến
hiệu quả kinh doanh của doanh nghiệp ngân hàng sau hiệu chỉnh. ................ 67


viii

DANH MỤC TỪ VIẾT TẮT

Ký hiệu

Giải thích thuật ngữ

BEP

Tỷ suất sinh lời kinh tế của tài sản

CCTS

Cơ cấu tài sản

DN

Doanh nghiệp


FEM

Mô hình các ảnh hưởng cố định (Fixed Effects Model)

KNTT

Hệ số khả năng thanh toán

LSDV
REM
(ECM)

Mô hình hồi quy biến giả bình phương nhỏ nhất (Least Square
Dummy Variable)
Mô hình ảnh hưởng ngẫu nhiên (Random Effects Model, REM)
hay mô hình các thành phần sai số (Error Components Model,
ECM)

ROA

Tỷ suất lợi nhuận sau thuế trên vốn kinh doanh

ROE

Tỷ suất lợi nhuận vốn chủ sở hữu

ROS

Tỷ suất lợi nhuận sau thuế trên doanh thu


SIZE

Quy mô doanh nghiệp

TTCK

Thị trường chứng khoán

TTTS

Tốc độ tăng trưởng tài sản


1

PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Việc ứng dụng các mô hình toán học và kinh tế lượng có sự hỗ trợ của
các phần mềm tin học trong giảng dạy, nghiên cứu khoa học trở nên rất cần
thiết trong các nhà trường. Đặc biệt trong nền kinh tế hiện đại và hội nhập,
bên cạnh việc chú trọng nghiên cứu lý thuyết, ngành toán hiện nay đã có
nhiều nghiên cứu ứng dụng để giải quyết các bài toán trong kinh tế, xã hội.
Với mục tiêu lựa chọn một đề tài có tính ứng dụng toán học trong kinh
tế, tôi đã lựa chọn đề tài “Sử dụng mô hình hồi quy dữ liệu mảng đánh giá tác
động cơ cấu nguồn vốn đến hiệu quả kinh doanh của doanh nghiệp ngành
Ngân hàng trên TTCK Việt nam” làm đề tài tốt nghiệp cao học chuyên ngành
toán ứng dụng. Trước đó đã có các nghiên cứu tương tự nhưng chuyên sâu ở
khía cạnh kinh tế và phân tích trên các bộ dữ liệu của nhóm ngành như xây
dựng, nhóm ngành thép hay một phần các doanh nghiệp niêm yết trên TTCK
Việt Nam,…còn ở đề tài này, tôi lựa chọn phân tích đối với nhóm cổ phiếu

ngành Ngân hàng trong thời gian từ năm 2008-2015, một nhóm ngành có
nhiều biến động nhưng vẫn được cho là trụ cột trên TTCK Việt Nam trong
thời gian qua để thực hiện đề tài.
2. Mục đích nghiên cứu
- Nghiên cứu và tìm hiểu kỹ mô hình hồi quy, trong đó đề tài tập trung
vào mô hình hồi quy tác động cố định và mô hình hồi quy tác động ngẫu nhiên
ứng dụng trên dữ liệu mảng. Đây là một trong những mô hình Kinh tế lượng
được ứng dụng rộng rãi trong nghiên cứu tài chính của các doanh nghiệp.
- Đề tài sẽ sử dụng phần mềm STATA (một trong ba phần mềm xử lý và
phân tích dữ liệu thông dụng nhất trên thế giới hiện nay và là phần mềm có ưu
thế vượt trội trong phân tích Hồi quy) để thực hiện phân tích và đánh giá kết
quả nghiên cứu. Đề tài tập trung làm rõ các bước thực hiện khi ứng dụng mô


2
hình hồi tác động cố định và mô hình hồi quy tác động ngẫu nhiên đánh giá
tác động của cơ cấu nguồn vốn đến hiệu quả kinh doanh của doanh nghiệp
ngành ngân hàng Việt Nam.
3. Nhiệm vụ nghiên cứu
- Trình bày và làm rõ được cơ sở toán học của mô hình hồi quy tác động
cố định và mô hình hồi quy tác động ngẫu nhiên.
- Sử dụng được phầm mềm STATA để thực hiện ước lượng, kiểm định,
đánh giá hình hồi quy tác động cố định và mô hình hồi quy tác động ngẫu
nhiên trên một số liệu cụ thể.
4. Đối tƣợng và phạm vi nghiên cứu
Đối tượng: Mô hình hồi quy tác động cố định và hồi quy tác động ngẫu
nhiên trên dữ liệu mảng cân b ng.
Phạm vi nghiên cứu: Sử dụng các dữ liệu trong báo cáo tài chính của
các ngân hàng có niêm yết trên thị trường chứng khoán Việt Nam trong thời
gian từ năm 2008 - 2015 để thực hiện và phân tích đánh giá.

5. Phƣơng pháp nghiên cứu
Thu thập dữ liệu, đọc tài liệu và tham khảo các nghiên cứu để kế thừa
các kết quả đã có, sử dụng phần STATA phân tích và đưa ra kết quả trên số
liệu thu thập được.
6. Cấu trúc luận văn
Ngoài phần mở đầu, kết luận nội dung của đề tài gồm 3 chương:
Chương I: Một số kiến thức chuẩn bị.
Chương II: Sơ lược về cơ cấu nguồn vốn và các nhân tố tác động đến
hiệu quả kinh doanh của doanh nghiệp ngành ngân hàng.
Chương III: Ứng dụng mô hình hồi quy dữ liệu mảng đánh giá tác động
của cơ cấu nguồn vốn đến hiệu quả kinh doanh của các doanh nghiệp ngành
ngân hàng trên TTCK Việt Nam.


3

CHƢƠNG I
MỘT SỐ KIẾN THỨC CHUẨN BỊ
Trong chương này luận văn trình bày một số khái niệm toán học liên
quan được đề cập trong các mô hình hồi quy, mô hình hồi quy dữ liệu mảng:
1.1. Một số khái niệm ban đầu.
1.1.1. Quá trình ngẫu nhiên.
Giả sử ta nghiên cứu sự tiến triển của một hệ vật chất nào đó theo thời
gian. Gọi Yt là vị trí (tình trạng) của hệ tại thời điểm t, Yt chính là một biến
ngẫu nhiên mô tả vị trí (tình trạng) của hệ thống. Quá trình Yt t 0 được gọi là
một quá trình ngẫu nhiên.
Tập hợp các vị trí (tình trạng) có thể của hệ là không gian trạng thái.
Định nghĩa 1.1: Họ Yt , t  T các biến ngẫu nhiên nhận giá trị trên I
được gọi là một quá trình ngẫu nhiên với tập chỉ số T và không gian trạng thái I.
Giả sử T là một tập vô hạn nào đó. Nếu với mỗi t  T , Yt là biến ngẫu nhiên

thì ký hiệu Y  Yt , t  T và gọi Y là hàm ngẫu nhiên (với tham biến t  T ).

• Nếu T là tập đếm được thì ta gọi Y  Yt , t  T là quá trình ngẫu
nhiên với tham số rời rạc.

• Nếu T là một khoảng của đường thẳng thực, tức là T là một trong các
tập sau:  ,   ;a,   ;  ,b;a,b  ; a,b;  a,b;  a,b  thì ta gọi Y  Yt , t  T
là quá trình ngẫu nhiên với tham số liên tục, trong đó t đóng vai trò thời gian.
1.1.2. Quá trình dừng
Quá trình ngẫu nhiên Y  Yt , t  T được gọi là quá trình dừng nếu kỳ
vọng, phương sai và hiệp phương sai không đổi theo thời gian, nghĩa là:
 E(Yt )=  t
 var(Yt)=E(Yt-  ) 2 =  2 t


4
  k =cov(Yt,Yt-k)=E[(Yt-  )(Yt-k-  )] ,  t
1.1.3. Nhiễu trắng

Quá trình u t
được gọi là nhiễu trắng nếu mỗi thành phần của
t 

 

chuỗi có kỳ vọng b ng 0, phương sai không đổi, hiệp phương sai b ng 0 và
không tự tương quan, tức là:
 E(ut)=0,  t

(1.1.3.1)


 var(ut)=  2 ,  t

(1.1.3.2)

 cov(ut ,ut+s)=0 ,s  0,  t

(1.1.3.3)

Đôi khi điều kiện (2.2.1.3) được thay b ng điều kiện mạnh hơn:
u t , u  độc lập với nhau với t  

(1.1.3.4)

Quá trình thỏa mãn (1.1.3.1), (1.1.3.2), (1.1.3.3) được gọi là nhiễu trắng độc lập
Nếu các điều kiện (1.1.3.1), (1.1.3.2) và (1.1.3.4) được thỏa mãn và
ut ~ N (0,  2 ) thì quá trình ngẫu nhiên đó được gọi là nhiễu trắng Gauss.

Điều kiện (1.1.3.4) suy ra (1.1.3.3) nhưng điều ngược lại không đúng.
Nhiễu trắng là một chuỗi dừng.
1.2. Một số phân phối xác suất thông dụng
1.2.1. Phân phối chuẩn
 Định nghĩa : Biến ngẫu nhiên liên tục X được gọi là tuân theo quy luật
phân phối chuẩn với hai tham số là µ và σ2, ký hiệu là N(µ,σ2), nếu hàm mật độ
xác suất của nó có dạng như sau:
1
f  x 
e
 2


( x   )2
2 2

Đồ thị của hàm mật độ này có dạng:

, (  x  )


5

Hình 1.1 Đồ thị hàm mật độ của phân phối chuẩn.
.

Do hình dáng của hàm mật độ như hình 1.1 nên quy luật chuẩn còn

được gọi là quy luật phân phối hình chuông.
Dễ thấy hàm phân phối xác suất của biến ngẫu nhiên có phân phối
chuẩn có dạng:
1
Fx ( x) 
 2

x

e

( t   )2
2 2

dt , (  x  )




• Hàm đặc trƣng và các mô men
Hàm đặc trưng:
g x (t )  e

1
it  t 2 2
2

Các mô - men
Dùng hàm đặc trưng để tính các mô - men, ta được:
1
i

1
i

1  E ( X )  g 'x (0)  (i )  

1  E ( X 2 ) 

1 n
1
g x (0)  2 [(i )2   2 ]= 2   2
2
i
i


Suy ra V ( X )   2  12   2
Vậy hai tham số µ và σ2 của quy luật chuẩn cũng là hai số đặc trưng kỳ
vọng và phương sai.


6
• Hệ số bất đối xứng và hệ số nhọn
Hệ số bất đối xứng của phân phối chuẩn
S

3 0

0
3 3

Vậy phân phối chuẩn là một phân phối đối xứng. Điều này cũng có thể
nhận thấy qua đồ thị hình chuông của hàm mật độ.
Hệ số nhọn của phân phối chuẩn:
4
3 4
K
3  4 3  0
4


Do kết quả này nên độ nhọn của quy luật chuẩn được dùng làm chuẩn
để đánh giá độ nhọn của các quy luật khác.
1.2.2. Phân phối T - Student
Định nghĩa: Biến ngẫu nhiên liên tục X được gọi là tuân theo quy luật
phân phối Student với n bậc tự do, ký hiệu là T (n) , nếu hàm mật độ xác suất của

nó có dạng:

 n 1 
n 1

  x2  2
1
2

 1
f ( x, n ) 

 (  x  )
n
n 


n 

 
2

Đồ thị của hàm mật độ xác suất này có dạng như sau:
f(x)

0

x

Hình 1.2. Đồ thị hàm mật độ phân phối T (n)

Dễ thấy đồ thị này có dạng đồ thị hàm mật độ chuẩn hóa N (0;1) nhưng
nhọn hơn.
1.2.3. Phân phối Khi Bình phƣơng


7
Định nghĩa: Biến ngẫu nhiên liên tục X được gọi là tuân theo quy luật
"Khi - bình phương" nếu hàm mật độ xác suất của nó có dạng:
(x ≤ 0)

0

f ( x, n) 

x
2

1
n
2  
2
n
2

e x

n
1
2


(x > 0)

Quy luật này được ký hiệu là  2 (n) , trong đó n được gọi là bậc tự do
của phân phối.
Hàm phân phối xác suất của biến ngẫu nhiên  2 (n) có dạng:
x

F ( x, n ) 



f ( x, n)dx . Giá trị hàm này có thể tính gần đúng b ng hàm



CHIDIST(x,n) trong Excel. Chú ý r ng CHIDIST(x,n) = P(  2 (n)  x) . Đồ thị

1-CHIDIST(x,1)

của hàm phân phối này tùy theo giá trị của n có dạng như sau:
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1

0 1

3 5 7

9 11 13 15 17 19 21 23 25 27 29

Hình 1.3 Đồ thị hàm phân phối xác suất của biến ngẫu nhiên
1.2.4. Phân phối Fisher
Định nghĩa : Biến ngẫu nhiên liên tục X được gọi là tuân theo quy luật
Fisher với bậc tự do thứ nhất là m và bậc tự do thứ hai là n nếu hàm mật độ
xác suất của nó có dạng:


8
 mn
m
mn

m

2   m  2 2 1  m  2

f ( x, m, n) 
  x 1  x  ( x  0)
n 
m n n 

  
 2  2


Quy luật này được ký hiệu là F(m,n) với m,n là các bậc tự do của phân phối.
Hàm
x

F ( x, m, n) 

phối

phân



xác

suất

của

biến

ngẫu

nhiên

Fisher:

f ( x, m, n)dx . Giá trị hàm này có thể tính gần đúng nhờ hàm




FDIST(x,m,n) với chú ý r ng: FDIST(x,m,n) = P(F(m,n))>x). Đồ thị của hàm

1-CHIDIST(x,1,2)

phân phối xác suất F(m,n) có dạng như sau:

1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0 1

3 5 7

9 11 13 15 17 19 21 23 25 27 29

Hình 1.4 Minh họa đồ thị hàm phân phối F(1,2)
1.3. Mô hình hồi quy tuyến tính
1.3.1. Mô hình hồi quy tuyến tính bội và phƣơng pháp OLS
Mô hình được giới thiệu với dữ liệu chéo
Dữ liệu chéo: Là các số liệu về một hoặc nhiều biến được thu thập tại một
thời điểm ở nhiều địa phương, đơn vị khác nhau.
Mô hình hồi quy có k biến có dạng nhƣ sau:
Mô hình hồi quy tuyến tính k biến có thể viết dưới dạng sau:

Y  1  2 X 2  ...  k X k  u

(1.3.1.1)


9
Trong đó Y là biến phụ thuộc và các Xj (j = 2,3,...,k) là các biến độc
lập. Ta biết r ng dù có đưa bao nhiêu biến độc lập vào mô hình thì vẫn tồn tại
những yếu tố có tác động đến biến phụ thuộc mà chúng ta hoặc không có
quan sát của chúng, hoặc không thể và cũng không muốn đưa vào mô hình
như là các biến số, do đó với mô hình k biến vẫn tồn tại sai số ngẫu nhiên u,
đại diện cho các yếu tố ngoài các biến Xj (j = 2,3,….,k), có tác động đến Y
nhưng không đưa vào ô hình như là biến số. Như vậy ta có:
Sai số ngẫu nhiên u trong mô hình hồi quy bội là yếu tố đại diện cho
các yếu tố có tác động đến Y nhưng không đưa vào mô hình như các biến số.
Các giả thiết của mô hình
Với mô hình (1.3.1.1), xét ra các giả thiết sau:
Giả thiết 1: Việc ước lượng được dựa trên cơ sở ngẫu nhiên.
Giả thiết này tương tự như trong mô hình hồi quy hai biến: Các cá thể
được chọn một cách ngẫu nhiên, rồi từ đó thu thập các chỉ tiêu của các cá thể
này. Chẳng hạn khi xem xét vấn đề năng suất lao động thì người lao động
được lựa chọn một cách ngẫu nhiên từ tổng thể, sau đó thu thập các số liệu từ
những người được chọn trong mẫu về năng suất, trình độ học vấn, tuổi...
Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (X2i,...,Xki)
b ng 0:
E (u1 x2i ,..., xki )  0

Giả thiết 3: Phương sai của sai số ngẫu nhiên tại các giá trị (X2i,..., Xki)
đều b ng nhau
Var(u x 2i ,..., xki )   2


Giả thiết 4: Giữa các biến độc lập Xj (j = 2,3,…., k) không có mối quan
hệ đa cộng tuyến hoàn hảo, nghĩa là không tồn tại h ng số ( 2 ,...., k không
đồng thời b ng 0) sao cho: 2 X 2  ...  k X k  0;  j  0 ,j=2,3,…,k.


10
Ta thấy r ng nếu giữa các biến Xj (j = 2,3,…., k) là có quan hệ đa cộng
tuyến hoàn hảo thì sẽ có ít nhất một biến trong các biến này suy ra được từ
các biến còn lại, hay nói cách khác, thông tin từ biến này đã được chứa đựng
thông tin của các biến còn lại. Giả thiết 4 loại trừ tình huống còn lại.
Hãy xem xét ví dụ sau đây để minh họa giả thiết 4. Giả sử để xem xét
tác động của các hình thức đầu tư lên GDP, sử dụng hàm hồi quy sau đây:
GDP  1  2GI  3 PI  4 FDI  5 I  u

Trong đó GI, DI, FDI và I lần lượt là đầu tư của khu vực nhà nước, đầu
tư từ khu vực tư nhân, đầu tư trực tiếp nước ngoài và tổng đầu tư. Khi đó mô
hình này sẽ bị vi phạm giả thiết 4 do giữa các biến độc lập trong mô hình trên
có quan hệ đa cộng tuyến hoàn hảo:
GI + PI + FDI - I = 0
Tương tự, giả sử để đánh giá tác động của từng loại phân bón lên năng
suất lúa, chúng ta sử dụng mô hình hồi quy sau đây:
NS  1  2 HC  2VC  u

Với NS, HC, VC lần lượt là năng suất lúa, lượng phân bón hữu cơ và
lượng phân bón vô cơ. Nếu lượng phân bón hữu cơ và vơ cơ là không có liên
hệ với nhau thì mô hình trên không vi phạm giả thiết về không có đa cộng
tuyến hoàn hảo. Tuy nhiên nếu với mỗi 10kg phân hữu cơ, người nông dân lại
sử dụng 1kg phân vô cơ, khi đó ta có mối quan hệ đa cộng tuyến hoàn hảo
giữa hai biến này.

Ý nghĩa của các hệ số hồi quy
Các hệ số hồi quy trong mô hình hồi quy bội còn được gọi là hệ số hồi
quy bội.
Với giả thiết 2 thì :
E (Y xx ,...., xk )  1  2 X 2  ...  k X k


11
Từ đó có thể thấy r ng 1 chính là giá trị trung bình của biến Y khi các
biến độc lập trong mô hình nhận gia trị b ng 0. Tuy nhiên cũng như trong
trường hợp mô hình hồi quy hai biến, ý nghĩa của hệ số này thường không
phải là mối quan tâm chính.
Để tìm hiểu ý nghĩa các hệ số  j ( j  2) , ta lấy đạo hàm riêng hai vế
biểu thức trên theo Xj (giá trị Xj là biến liên tục):
E (Y x2 ,..., xk )
X j

  j , ( j  2,...., k )

Hệ số góc  j (j=2,3,…,k) thể hiện tác động riêng phần của biến Xj lên
giá trị trung bình của biến phụ thuộc khi các yếu tố Xs (s ≠ j) là không đổi. Do
đó trong mô hình hồi quy bội, các hệ số góc còn được gọi là hệ số hồi quy
riêng (partical coefficient).
Mô hình hồi qui mẫu:
Xét mô hình k biến:
Y  1  2 X 2  ...  k X k  u

Giả sử có một mẫu quan sát với các giá trị thực tế là (Y i, X2i,...,Xki) (i =
1,2,...n) và ta sẽ sử dụng thông tin từ mẫu này để xây dựng các ước lượng cho
các hệ số  j ( j  1, 2,..., k ) , ký hiệu bởi  j ( j  1, 2,....k ) tương ứng. Từ các giá trị

ước lượng này có thể viết hàm hồi quy mẫu như sau:
Y  1  2 X 2  ...  k X k

Tại mỗi quan sát i, hàm hồi quy mẫu này được viết thành:
Yi  1  2 X 2i  ...  k X kt

Trong đó Yi là giá trị ước lượng cho Yi và sai lệch giữa hai giá trị này
được gọi là phần dư: ei = Yi –Yi .
Tương tự như với mô hình hồi quy hai biến, phương pháp OLS nh m xác
định các giá trị  j ( j  1, k ) sao cho tổng bình phương các phần dư là bé nhất:


12
n

 e   (Y  
i 1

2
1

1

1

  x X 2  ...   k X k )2

(1.3.1.2)

~ ~

~
 MinB1 ,..., Bk  (Yi  1  2 X 2  ...  k X k )2 

Khi đó dễ thấy r ng các giá trị: 1 , 2 ,..., k là nghiệm của hệ k phương
trình sau:
n

 (Y  
i 1

1

n

X
i 1

2t

1

  2 X 2t  ...   k X kt )  0

(Y1  1   2 X 2  ...   k X kt )  0

(1.3.1.3)

---- ---- ---n

X

i 1

kt

(Y1  1   2 X 2  ...   k X kt )  0

Với điều kiện số quan sát trong mẫu lớn hơn số hệ số hồi quy cần ước
lượng và giả thiết 4 được thỏa mãn thì hệ phương trình trên sẽ có nghiệm duy
nhất. Việc giải hệ phương trình này có thể được thực hiện một cách dễ dàng,
các phần mềm kinh tế lượng và thống kê hiện có đều có thể giải trong vòng
vài giây nếu số biến không quá lớn.
Phƣơng pháp bình phƣơng nhỏ nhất là tìm các ƣớc lƣợng sao cho:

e

2
i

  (Yi  ˆ1  ˆ2 X 2i  ...  ˆk X ki ) 2  min

Định lý Gauss Markov:
Định lý Gauss - Markov: Khi các giả thiết 1 - giả thiết 4 thỏa mãn thì
các ước lượng thu được từ phương pháp OLS là các ước lượng tuyến tính
không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính
không chệch.
Nói một cách khác, khi các giả thiết 1 đến giả thiết 4 được thỏa mãn thì
ước lượng OLS là ước lượng tốn nhất trong lớp các ước lượng tuyến tính
không chệch và thường viết tắt là BLUE (Best linear unbiased estimator)



13
Lý giải chi tiết hơn nội dung của định lý:
Ước lượng tuyến tính:  j được gọi là ước lượng tuyến tính cho hệ số
hồi quy  j nếu nó được biểu diễn dưới dạng là tổ hợp tuyến tính của các giá
trị của biến phụ thuộc:
 j  w1Y1  ...  w nYn

Trong đó w1 là các h ng số nào đó và Yi là các giá trị trong mẫu của
biến phụ thuộc. Khi sai số ngẫu nhiên có mặt trong mô hình dưới dạng cộng
thì việc  j là tuyến tính theo Y cũng có nghĩa ước lượng này là tuyến tính
theo sai số ngẫu nhiên. Như vậy định lý Gauss - Markov khẳng định r ng các
ước lượng OLS là ước lượng tuyến tính.
Ước lượng không chệch: Ước lượng  j được gọi là ước lượng không
chệch của  j nếu E ( j )  B j . Như vậy định lý Gauss - Markov khẳng định r ng:
E ( j )  B j , j  2,3,..., k

Phương sai nhỏ nhất: Khi  j là ước lượng không chệch của  j , thì var (  j )
thể hiện độ chính xác của ước lượng, var (  j ) càng nhỏ có nghĩa là độ chính
xác càng lớn. Vì vậy trong các ước lượng không chệch, ước lượng có phương
sai nhỏ hơn sẽ được ưa thích hơn.
Định lý Gauss - Markov khẳng định r ng khi các giả thiết 1 đến giả
thiết 4 thỏa mãn thì ước lượng thu được từ phương pháp OLS là có phương
sai bé nhất trong số các ước lượng tuyến tính không chệch: var
( j OL S )  var(  ) , với  j là ước lượng tuyến tính không chệch bất kỳ.

Như vậy nếu các giả thiết 1 đến giả thiết 4 được thỏa mãn thì ước lượng
OLS là ước lượng tốt nhất trong số các ước lượng có dạng tuyến tính và ta
không cần tìm đến bất kỳ ước lượng tuyến tính nào khác.
Điều này cũng có nghĩa là khi một trong các giả thiết này không được
thỏa mãn thì các ước lượng OLS sẽ không còn là ước lượng tốt nhất nữa.



14
1.3.2. Mô hình hồi quy dữ liệu chuỗi thời gian
1.3.2.1. Dữ liệu chuỗi thời gian
• Dữ liệu chuỗi thời gian: Chuỗi các quan sát được thu thập trên cùng một
đối tượng tại các mốc thời gian cách đều nhau được gọi là chuỗi thời gian.
• Như vậy trong khi số liệu chéo cho thông tin về các đối tượng khác
nhau tại cùng một thời điểm thì số liệu chuỗi thời gian cho thông tin về cùng
một đối tượng tại các thời điểm khác nhau.
• Một số đặc trưng của số liệu chuỗi thời gian:
* Số liệu chuỗi thời gian và tính tự tương quan: chuỗi các quan sát
trong số liệu chéo thường được xem như là độc lập với nhau và do đó không
tương quan với nhau, tuy nhiên với số liệu chuỗi thời gian, người ta thường
thấy chúng có tính tự tương quan: corr (Yt , Yt-s) thường khác 0.
* Số liệu chuỗi thời gian và yếu tố mùa vụ: các số liệu kinh tế xã hội
thường chịu tác động của yếu tố thời vụ: doanh thu về máy lạnh thường cao
về mùa hè, thấp về mùa đông; giá thực phẩm thường cao trong các dịp Tết, số
người đến vui chơi trong các khu giải trí thường cao hơn vào các ngày nghỉ
cuối tuần... Yếu tố mùa vụ thường xuất hiện với các số liệu có tần suất xuất
hiện bé hơn một năm, như số liệu quý, số liệu tháng...
* Số liệu chuỗi thời gian và yếu tố xu thế: Đa phần chuỗi thời gian còn
có yếu tố xu thế, chỉ xu thế tăng (hay giảm) trong thời kỳ khá dài của chuỗi
số. Chẳng hạn GDP của một nền kinh tế thường có xu hướng gia tăng, do tác
động của sự cải thiện công nghệ, chất lượng nguồn nhân lực và sự gia tăng
các yếu tố đầu vào như vốn và lao động.
1.3.2.2. Mô hình hồi quy chuỗi thời gian
Xét mô hình hồi quy tuyến tính với số liệu chuỗi thời gian như sau:
Y1   1  2 X 2  ...  k X kt  u1


Các giả thiết của mô hình:

(1.3.2.2.1)


15
Chúng ta sẽ phát biểu các giả thiết cho mô hình (1.3.2.2.1)
Giả thiết TS1: Sai số ngẫu nhiên không tự tương quan:
corr(u1 , us x2 ..., xk )  0 t  s

(1.3.2.2.2)

Giả thiết này cho r ng tại mỗi bộ giá trị của (X2...., Xk) thì các ut và us
là không tương quan với nhau khi s khác t.
Để dễ hình dung, chúng ta tạm thời bỏ qua cụm từ "tại mỗi bộ giá trị
của (X2...., Xk) và phát biểu (1.3.2.2.2) một cách đơn giản như sau:
corr(u1 , us )  0 t  s

(1.3.2.2.2’)

Do (1.3.2.2.2) thể hiện về mối liên hệ tương quan giữa bản thân sai số
ngẫu nhiên tại các quan sát khác nhau nên giả thiết này còn được gọi là mô
hình không có tự tương quan.
Từ định nghĩa về hệ số tương quan, ta biết r ng hệ số tương quan
dương giữa hai biến ngẫu nhiên thể hiện mối quan hệ cùng chiều giữa hai
biến số này, nghĩa là nếu một biến nhận giá trị lớn thì chúng ta cũng kỳ vọng
biến còn lại nhận giá trị lớn. Hệ số tương quan âm thể hiện quan hệ ngược
chiều và khi hệ số tương quan giữa hai biến b ng 0 thì khi một biến nhận giá
trị lớn, ta không kỳ vọng gì về việc biến kia sẽ nhận giá trị lớn hay bé.


Hình 1.5 sau đây thể hiện quan hệ có thể có giữa ut và us:


16

Hình 1.5 Quan hệ giữa ut và us
Giả thiết TS1 này thay thế cho giả thiết 1 về mẫu ngẫu nhiên trong mô
hình hồi quy với số liệu chéo. Lý do là vì giả thiết về mẫu ngẫu nhiên là hoàn
toàn không phù hợp với số liệu chuỗi thời gian: chẳng hạn khó có thể cho
r ng GDP các năm liên tiếp của Việt Nam lại là độc lập nhau. Trong thực tế,
các chuỗi số kinh tế thường có tính tự tương quan, nghĩa là có sự phụ thuộc
thống kê giữa các quan sát này.
Giả thiết TS2: Kỳ vọng có điều kiện của sai số ngẫu nhiên b ng 0
E  ut x2 ... xk   0 t

Giả thiết này ngụ ý r ng:
(i) E (ut )  0 t
(ii) cov(ut , X s )  0 t  s
Giả thiết TS2 tương ứng với giả thiết 2 trong mô hình hồi quy với số
liệu chéo và cũng đóng một vai trò quan trọng trong việc xác định tính chất
của ước lượng OLS. Có thể thấy ngay giả thiết TS2 đòi hỏi chặt hơn so với
giả thiết 2: nó không chỉ đòi hỏi sự không tương quan giữa u và X tại cùng
thời điểm:
cov(ut , X t )  0 t

Đây chính là khái niệm về biến giải thích ngoại sinh đã được đề cập
đến trong chương II mà còn yêu cầu sự không tương quan giữa u và X tại các
thời điểm chéo nhau:
cov( X t , us )  0 t, s


Từ đây chúng ta đưa ra một khái niệm tiếp theo:
Biến ngoại sinh chặt (strictly exogenous variable): biến độc lập Xj được
gọi là biến ngoại sinh chặt nếu cov( X t , us )  0 t, s


17
Như vậy giả thiết TS2 yêu cầu r ng các biến độc lập phải là các biến
ngoại sinh chặt - là một khái niệm mạnh hơn yêu cầu trong giả thiết 2 trong
mô hình với số liệu chéo.
Ngoài ra chúng ta cũng có 3 giả thiết tương tự như trong mô hình hồi
quy với số liệu chéo sau đây:
Giả thiết TS3: Phương sai số là b ng nhau tại mọi thời điểm:
var(u t x2 ... xk )   2

t

Giả thiết TS4: Giữa các biến độc lập không có quan hệ đa cộng tuyến
hoàn hảo.
Giả thiết TS5: Sai số ngẫu nhiên tuân theo quy luật chuẩn ut ~ N (0,  2 )
1.3.2.3. Mô hình hồi quy với chuỗi thời gian dừng:
1.3.2.3.1. Mô hình hồi quy tĩnh
Xét mô hình (1.3.2.2.1) trong đó ký hiệu Zt thể hiện giá trị của biến số
tại thời điểm t chứ không phải là các giá trị trễ của các biến số khác:
Yt  t  2 X 2t  ...  k X kt  ut

(1.3.2.3.1.1)

Mô hình này được gọi là tĩnh theo nghĩa r ng chúng ta chỉ xét đến quan
hệ giữa các biến số tính tại cùng một thời điểm, nó cho phép xem xét mối
quan hệ tức thời hoặc mối quan hệ cân b ng dài hạn giữa các biến số.

Ví dụ : Khi hồi quy lạm phát theo cung tiền và GDP94, số liệu từ tháng
7 - 1995 đến tháng 12 - 2008 (trong đó GDP94 được lấy đại diện bởi tổng sản
lượng công nghiệp tính theo giá năm 1994) (Số liệu lấy từ tập ch7/m_lp) ta
thu được kết quả ước lượng sau:
LP = 11.72 + 0.34 M - 0.70 GDP - e
(se)

(1.45) (0.05)

R2 = 0.34, n = 154

(0.13)


×