Tiểu luận Kinh tế lượng
ĐỀ CƯƠNG CHI TIẾT
A – Đặt vấn đề
B – Nội dung
1. Giới thiệu mô hình Arima
2. Cơ sở lý thuyết
2.1. Tính dừng
2.1.1. Khái niệm
2.1.2. Hậu quả của chuỗi không dừng
2.1.3. Kiểm định tính dừng
2.1.4. Biến đổi chuỗi không dừng thành chuỗi dừng
2.2. Quá trình tự hồi quy (AR), trung bình trượt (MA) và mô hình Arima
2.1 Quá trình Tự Hồi Quy (AR)
2.2 Quá trình Trung Bình Trượt (MA)
2.3 Quá trình Trung bình trượt kết hợp Tự hồi quy (ARMA)
2.4 Quá trình Trung bình trượt, Đồng liên kết, Tự hồi quy (ARIMA)
3. Phương pháp Box-Jenkins (BJ)
C – Danh mục tài liệu tham khảo
Học viên: Đặng Thị Thu Hường - CH200522
2
Tiểu luận Kinh tế lượng
A – ĐẶT VẤN ĐỀ
Ra đời vào đầu năm 2000, thị trường chứng khoán Việt Nam đã trở thành một
kênh đầu tư hết sức hấp dẫn đối với các nhà đầu tư, từ các tổ chức đầu tư chuyên
nghiệp cho đến các nhà đầu tư cá nhân nghiệp dư nhỏ lẻ. Tuy nhiên, bên cạnh mức
sinh lợi cao, đây cũng là hoạt động luôn tồn tại nhiều rủi ro tiềm ẩn bởi nhà đầu tư
không phải lúc nào cũng dự đoán được chính xác xu hướng của giá cổ phiếu trong
tương lai. Do đó, việc dự báo chính xác sự biến động giá của cổ phiếu để có một sách
lược nhằm phục vụ cho công việc kinh doanh của các cá nhân, tổ chức hay hoạch
địch chiến lược của một quốc gia đã thu hút rất nhiều sự quan tâm của các nhà kinh
tế lượng tài chính trong và ngoài nước.
Tại thị trường Việt Nam, sự biến động của chỉ số VnIndex phản ánh rủi ro hệ
thống, vì vậy, việc dự báo được sự tăng giảm của VnIndex cũng đồng thời giúp các
nhà đầu tư nhận biết chiều hướng biến động giá của cổ phiếu trên thị trường này.
Trong nội dung đề tài, em sẽ đề xuất việc sử dụng mô hình ARIMA và phương
pháp Box-Jenkins để dự báo chỉ số VnIndex trong ngắn hạn căn cứ vào chuỗi dữ liệu
quá khứ. Em xin chân thành cảm ơn thầy giáo Nguyễn Cao Văn đã giúp đỡ, cung cấp
những tài liệu cần thiết giúp em hoàn thành tiểu luận này.
Học viên: Đặng Thị Thu Hường - CH200522
3
Tiểu luận Kinh tế lượng
B – NỘI DUNG
1. Giới thiệu mô hình Arima:
Như chúng ta đã biết, trong nghiên cứu định lượng, tồn tại 3 loại số liệu cơ bản là
số liệu theo thời gian, số liệu chéo và số liệu hỗn hợp. Đối với các vấn đề kinh tế,
loại số liệu chúng ta thường xuyên tiếp cận nhất có lẽ là số liệu theo thời gian, hay
còn gọi là các chuỗi thời gian như chuỗi số liệu GDP, chỉ số VN-Index hay giá vàng
theo thời gian… Tuy nhiên, chuỗi thời gian cũng gây ra không ít khó khăn cho các
nhà nghiên cứu, bởi nhiều nghiên cứu đã cho thấy, trong nhiều trường hợp, các mô
hình hồi quy cổ điển dường như không hiệu quả với loại dữ liệu này.
Vậy, vấn đề đặt ra là làm thế nào chúng ta có thể nghiên cứu một chuỗi thời gian,
rút ra những kết luận và sử dụng nó để dự báo một cách có hiệu quả? Để trả lời cho
câu hỏi này có nhiều phương pháp khác nhau, tuy nhiên, có hai phương pháp được
hầu hết các nhà nghiên cứu thừa nhận và sử dụng thường xuyên đó là hai mô hình:
ARIMA và VAR.
Mô hình Trung bình trượt, đồng liên kết, tự hồi quy ARIMA dựa trên triết lý “hãy
để dữ liệu tự nói”, nó không sử dụng các biến ngoại sinh độc lập X
1
, X
2
, X
3
.. để giải
thích cho Y, mà nó sử dụng chính các giá trị trong quá khứ của Y để giải thích cho
bản thân nó ở hiện tại. Nó cũng không giả định bất kỳ một mô hình cụ thể nào, mà
việc xác định mô hình là dựa trên phân tích dữ liệu cụ thể từng trường hợp và cả một
chút nghệ thuật của người sử dụng. Chính vì thế, ARIMA đôi khi còn được gọi là mô
hình lý thuyết mới vì nó không dựa bất kỳ một lý thuyết kinh tế nào. Và cũng do đó,
ARIMA có được tính linh hoạt và tiết kiệm hơn hẳn các phương pháp khác, đồng
thời tính hiệu quả của ARIMA trong công tác dự báo cũng đã được thực tế chứng
minh.
Tất cả những điều ấy mang đến cho ARIMA một vị thế nhất định trong lĩnh vực
nghiên cứu định lượng và ngày càng trở nên thông dụng hơn.
Học viên: Đặng Thị Thu Hường - CH200522
4
Tiểu luận Kinh tế lượng
2. Cơ Sở Lý Thuyết
2.1. Tính Dừng
2.1.1. Khái niệm
Dữ liệu của bất kỳ chuỗi thời gian nào đều có thể được coi là được tạo ra từ một
quá trình ngẫu nhiên và một tập hợp dữ liệu cụ thể, có thể được coi là một kết quả (cá
biệt) của quá trình ngẫu nhiên đó. Hay nói các khác, có thể xem quá trình ngẫu nhiên
là tổng thể và kết quả là một mẫu được của tổng thể đó. Một tính chất của quá trình
ngẫu nhiên được các nhà phân tích về chuỗi thời gian đặc biệt quan tâm và xem xét
kỹ lưỡng là Tính dừng.
Một quá trình ngẫu nhiên Y
t
được coi là dừng nếu kỳ vọng, phương sai và hiệp
phương sai tại cùng một độ trễ của nó không đổi theo thời gian.
Cụ thể, Y
t
được gọi là dừng nếu:
- Trung bình: E(Y
t
) = µ (∀t) (1)
- Phương sai: Var(Y
t
)= E(Y
t
–µ)
2
= σ
2
(∀t) (2)
- Đồng phương sai: Cov(Y
t
,Y
t+k
) = E[(Y
t
– µ)(Y
t+k
– µ)]= γ
k
(∀t)(3)
Điều kiện thứ 3 có nghĩa là hiệp phương sai giữa Y
t
và Y
t+k
chỉ phụ thuộc vào độ
trễ về thời gian (k) giữa hai thời đoạn này chứ không phụ thuộc vào thời điểm t. Ví
dụ Cov(Y
2,
Y
7
)=Cov(Y
10
,Y
15
)=Cov(Y
30
,Y
35
)=…=Cov(Y
t
,Y
t+5
). Nhưng Cov(Y
t
,Y
t+5
) có
thể khác Cov(Y
t
,Y
t+6
)…
Quá trình ngẫu nhiên Y
t
được coi là không dừng nếu nó vi phạm ít nhất một trong
ba điều kiện trên.
2.1.2. Hậu quả của Chuỗi không dừng
Trong mô hình hồi quy cổ điển, ta giả định rằng sai số ngẫu nhiên có kỳ vọng
bằng không, phương sai không đổi và chúng không tương quan với nhau. Với dữ liệu
là các chuỗi không dừng, các giả thiết này bị vi phạm, các kiểm định t, F mất hiệu
lực, ước lượng và dự báo không hiệu quả hay nói cách khác phương pháp OLS không
áp dụng cho các chuỗi không dừng.
Học viên: Đặng Thị Thu Hường - CH200522
5
Tiểu luận Kinh tế lượng
Điển hình là hiện tượng hồi quy giả mạo: nếu mô hình tồn tại ít nhất một biến
độc lập có cùng xu thế với biến phụ thuộc, khi ước lượng mô hình ta có thể thu được
các hệ số có ý nghĩa thống kê và hệ số xác định R
2
rất cao. Nhưng điều này có thể chỉ
là giả mạo, R
2
cao có thể là do hai biến này có cùng xu thế chứ không phải do chúng
tương quan chặt chẽ với nhau.
Trong thực tế, phần lớn các chuỗi thời gian đều là chuỗi không dừng, kết hợp với
những hậu quả trình bày trên đây cho thấy tầm quan trọng của việc xác định một
chuỗi thời gian có tính dừng hay không.
2.1.3. Kiểm định tính dừng
2.1.3.1. Dựa trên đồ thị của chuỗi thời gian
Một cách trực quan chuỗi Y
t
có tính dừng nếu như đồ thị Y=f(t) cho thấy trung
bình và phương sai của quá trình Y
t
không đổi theo thời gian.
Ta xét chuỗi chỉ số VNIndex từ ngày 1/6/2009 đến ngày 1/7/2011 có đồ thị theo
thời gian như sau:
Hình 2.1.3.1: Đồ thị VNIndex theo thời gian
Học viên: Đặng Thị Thu Hường - CH200522
6
Tiểu luận Kinh tế lượng
Nhìn vào đồ thị của VNIndex theo thời gian ta thấy trung bình của nó có xu
hướng tăng hoặc giảm theo từng thời kỳ. Như vậy, có thể suy đoán rằng điều kiện
một bị vi phạm và VNIndex là chuỗi không dừng.
Phương pháp này cho ta cái nhìn trực quan, đánh giá ban đầu về tính dừng của
chuỗi thời gian. Tuy nhiên, với những chuỗi thời gian có xu hướng không rõ ràng,
phương pháp này trở nên khó khăn và đôi khi không chính xác.
2.1.3.2. Dựa trên lược đồ tương quan
* Tự tương quan
Một cách kiểm định đơn giản tính dừng là dùng hàm tự tương quan (ACF). ACF
với độ trễ k, ký hiệu bằng ρ
k
, được xác định như sau:
Nếu vẽ đồ thị của ρ
k
theo k, ta được lược đồ tương quan tổng thể. Tuy nhiên, trên
thực tế chúng ta chưa có tổng thể mà chỉ có mẫu. Khi đó ta xây dựng hàm tự tương
quan mẫu với:
Trường hợp mẫu có khích thước nhỏ thì mẫu số của là n-k-1 và của là n-1.
Đồ thị thể hiện ρ
k
ở độ trễ k được gọi là lược đồ tương quan mẫu.
Bartlett đã chỉ ra rằng nếu một chuỗi là ngẫu nhiên và dừng, thì các hệ số tự tương
quan mẫu sẽ có phân phối xấp xỉ chuẩn với kỳ vọng toán bằng 0 và phương sai 1/n,
với n khá lớn. ~ N(0, 1/n).
Ta cần kiểm định giả thiết: H
0
: ρ
k
= 0 (chuỗi dừng)
H
1
: ρ
k
≠ 0
Học viên: Đặng Thị Thu Hường - CH200522
7
Tiểu luận Kinh tế lượng
Nếu ∈(-Z
α
/2
/
n
, Z
α
/2
/
n
) thì chấp nhận giả thiết H
0
với mức ý nghĩa α. Giá trị
của các chỉ số Z tra trong bảng đã được tính toán sẵn.
Với độ tin cậy 95%, khoảng tin cậy ρ
k
của VNIndex là ±1,96/
522
= ±0.0858.
Nếu ∈(-0,0858; +0,0858) ta chấp nhận giả thiết H
0
, ngược lại, nếu không thuộc
khoảng này, ta bác bỏ H
0
(với mức ý nghĩa 5%).
Sử dụng phần mềm EViews ta có bảng kết quả hàm ACF và lược đồ tương quan
của VNIndex với 20 độ trễ như sau:
Bảng 2.1.3.2: Lược đồ tương quan và các kết quả đi kèm của chuỗi VNIndex
(Vào View/Correlogram … , xác định biểu đồ tự tương quan của chuỗi gốc hay
chuỗi sai phân bậc một, bậc hai, và cuối cùng là xác định độ trễ k)
Học viên: Đặng Thị Thu Hường - CH200522
8
Tiểu luận Kinh tế lượng
Có thể thấy toàn bộ ρ
k
của ACF tại 20 độ trễ đều khác 0 có ý nghĩa thống kê. Như
vậy, VNIndex là chuỗi không dừng. Một cách trực quan ta có thể nhận định dựa trên
lược đồ tương quan, nếu đồ thị có xu hướng giảm chậm, tương đối đều dặn theo độ
trễ thì chuỗi không dừng. Ngược lại nếu đồ thị giảm nhanh, ngẫu nhiên, không theo
xu hướng thì chuỗi dừng.
* Tự tương quan riêng
Các hệ số tự tương quan ρ
k
(k≥2) phản ánh mức độ kết hợp tuyến tính của Y
t
và
Y
t+k
. Tuy nhiên, mức độ kết hợp giữa hai biến còn có thể do một số biến khác gây ra.
Trong trường hợp này là ảnh hưởng từ các biên Y
t-1
…Y
t-k+1
. Do đó để đo độ kết hợp
riêng rẽ giữa Y
t
và Y
t-k
ta sử dụng hàm tương quan riêng PACF với hệ số tương quan
riêng ρ
kk
được ước lượng theo công thức đệ quy của Durbin:
Nếu chuỗi dừng thì các có phân phối chuẩn N(0,1/n). Do đó, kiểm định giả
thiết đối với ρ
kk
tương tự như với ρ
k
.
* Kiểm định đồng thời
+ Box – Pierce đã đưa ra kiểm định về sự đồng thời bằng không của các hệ số
tương quan: H
0
: ρ
1
=ρ
2
=…=ρ
m
=0
H
1
: tồn tại ít nhất một ρ
k
=0
Giả thiết H
0
được kiểm định bằng thống kê
Với n: kích thức mẫu, m: độ dài của trễ. Q ~
Học viên: Đặng Thị Thu Hường - CH200522
9