Tải bản đầy đủ (.doc) (44 trang)

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (612.8 KB, 44 trang )

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

BÁO CÁO MÔN HỌC
PHƯƠNG PHÁP TOÁN TRONG TIN HỌC

ĐỀ TÀI
MÔ HÌNH PHÂN TÍCH CHUỖI THỜI GIAN ARMA VÀ
ỨNG DỤNG TRONG DỰ BÁO GDP CỦA VIỆT NAM
Giảng viên hướng dẫn: PGS.TS. Đỗ Văn Nhơn
MSHV: CH1002007
Lớp cao học khóa 5


Báo cáo môn học – Phương pháp toán trong tin học

Hà Nội, Tháng 12/2010

Mục lục

Lời cảm ơn
Em xin bày tỏ lòng biết ơn chân thành đối với PGS.TS.Trần Văn Nhơn, người
đã dạy chúng em chuyên đề “Phương pháp toán trong tin học”. Những kiến thức
Thầy truyền đạt cho chúng em đã giúp em có thể hiểu một cách đầy đủ về môn học,
có ý nghĩa thiết thực cho công tác chuyên môn, đồng thời tạo điều kiện cho chúng em
hoàn thành tốt chương trình học.
Vì điều kiện thời gian và khả năng có hạn nên tiểu luận không thể tránh khỏi
những thiếu sót. Em rất mong nhận được ý kiến đóng góp của thầy đề tiểu luận được
hoàn thiện.
Xin chúc Thầy cùng các Thầy cô trong Trường Đại học Công nghệ Thông
tin - Đại học Quốc gia Thành phố Hồ Chí Minh lời chúc sức khoẻ, hạnh phúc và


thành đạt.

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

2


Báo cáo môn học – Phương pháp toán trong tin học

Mở đầu
“Ngày mai sẽ ra sao?”, “Nếu ta tiến hành như vậy thì cái gì sẽ xẩy ra?”, “Chứng
khoán có tăng điểm vào tuần này không?”, “ Giá vàng ngày mai sẽ ra sao?”..., có lẽ
đây là những câu hỏi mãi mãi mang tính thời sự. Trong cuộc sống hàng ngày, với các
hoạt động riêng tư của mỗi cá nhân, trong các hoạt động của cơ quan Chính phủ, các
tập đoàn, các công ty lớn, nhỏ và ngay cả các quốc gia hùng mạnh, việc đoán trước xu
thế tương lai đóng vai trò cực kỳ quan trọng trong công tác quản lý, điều hành, hoạch
định chính sách. Có nhiều cách cách để dự đoán các xu thế, trong tiểu luận này em xin
trình bày về mô hình phân tích, dự báo chuỗi thời gian (Time serial) một phương pháp
toán học, theo đó người ta có thể rút ra được những quy luật của một quá trình được
“quan sát” thông qua chuỗi số liệu. Đây là mô hình toán học rất sát với thực tế được
ứng dụng hầu hết trong các lĩnh như: Vật lý, Sinh học, Nông nghiệp, Kế hoạch, Tâm
lý, Ngôn ngữ, Kinh tế, Tài chính, Ngân hàng,.... Để ứng dụng chạy mô hình này đã có
nhiều phần mềm tính toán như SAS, SPLUS, EVIEW, SPSS, MINITAB, STATA,
hoặc ít nhất cũng là Microsoft Excell, trong tiểu luận em trình bày sợ bộ về phần mềm
Eview, một công cụ tốt để chạy mô hình phân tích chuỗi thời gian. Dựa trên phương
pháp đề ra, và sử dụng phần mềm Eview em đã tính toán một bài toán thực tế trong đó
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

3



Báo cáo môn học – Phương pháp toán trong tin học

sử dụng số liệu về GDP của Việt Nam để kiểm chứng. Kết quả thu được rất khả quan.
Độ chính xác của dự báo là đáng tin cậy.
Tiểu luận ngoài phần mở đầu và kết luận, sẽ có 3 chương:
Chương 1: Các kiến thức cơ bản về chuỗi thời gian.
Chương 2: Giới thiệu sơ bộ về phần mềm EViews
Chương 3: Ứng dụng phân tích thời gian để dự báo GDP của Việt Nam

Chương 1: Các kiến thức cơ bản về chuỗi thời gian
1. Khái niệm và các thsi dụ về chuối thời gian.
Mục tiêu của các phân tích trong kinh tế, tài chính ứng dụng là chỉ ra các quy
luật, đưa ra các cảnh báo, dự báo để đưa ra các quyết định. Để dự báo được đòi hỏi
phái cố một số lượng các quan sát cho các đại lượng thích hợp để nghiên cứu mối liên
hệ giữa các đại lượng này. Các quan sát này có thể được tiến hành đều đặt qua từng
thời kỳ chặng hạn theo từng tháng, theo từng Quý hoặc hàng năm hoặc chỉ trong
những thời điểm đặc biệt như thời kỳ xẩy ra khủng hoảng kinh tế. Dãy các quan sát
này được gọi là chuỗi thời gian. Như vậy, chỗi thời gian là tập hợp các quan sát mà
mỗi quan sát ghi nhận tại thời điểm t với t Є T. Chuỗi thời gian được gọi là rời rạc nếu
như T là tập rời rạc (Thí dụ các quan sát được thực hiện cách nhau một khoảng thời
gian đều đặn như là doanh thu cước phí internet hàng tháng của một nhà cung cấp
dịch vụ internet từ tháng 12 năm 1997 đến tháng 12 năm 2010). Trái lại nếu T là một
khoảng thì chuỗi được gọi là liên tục. Biểu đồ ghi nhịp tim cảu một bệnh nhân trong 2
giờ là 1 ví dụ minh hoa cho chỗi thời gian liên tục với T = [0, 2].
2. Mục đích của việc phân tích chuỗi thời gian.
Tất cả các kỹ thuật dự báo chuỗi thời gian dựa trên giả định là có một mẫu hình
cơ bản tiềm ẩn trong các số liệu đang nghiên cứu cùng với các yếu tố ngẫu nghiên ảnh
hưởng lên hệ thống đang xét. Công việc chính của phân tích chuỗi thời gian là nghiên
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam


4


Báo cáo môn học – Phương pháp toán trong tin học

cứu các kỹ thuật để tách mẫu hình cơ bản này và sử dụng nó như là cơ sở để dự báo
cho tương lai.
Vấn đề là ở chỗ phần lớn các chuỗi thời gian trong cuộc sống thực tại là rất phức
tạp nên các kỹ thuật đơn giản như làm trơn số liệu không thể sử dụng được cho
phương pháp phân tích chuỗi thời gian. Kỹ thuật dự báo Box Jenkins là phương pháp
dự báo các chuỗi thời gian có độ phức tạp cao. Kỹ thuật này được Box và Gwinlym
Jenkins đề xuất năm 1970 và thường được gọi phương pháp dự báo tự hồi quy kết hợp
trung bình trượt (ARIMA - autoregressive integrated moving average).
Để dự báo được, trước hết ta giả thiét có một mô hình xác suất để biểu diễn dẫy
số liệu. Sau khi chọn ra một mô hình gần với dẫy số liệu, chúng ta tiến hành ước
lượng các tham số của mô hình, kiểm tra mô hình được sử dụng có thích hợp không.
Cách tiếp cận chung để phân tích chuỗi thời gina là:
- Vẽ các số liệu của chuỗi lên một mựt phẳng tọa độ để xét các đặc trưng chính
của chúng, chú ý đến
+ Xu thế,
+ Thành phần theo mùa,
+ Những điểm thời gian thay đổi dáng điệu đơn,
+ Những quan sát dị thường.
- Khử các xu thế và thành phần theo mùa bằng hai phương pháp chính:
+ Ước lựong các xu thế hay các biểu diễn theo mùa nhờ phương pháp bình
phương tối thiểu sau đó trừ các giá trị của hành vừa ước lượng vào số liệu.
+ Sai phân số liệu: Xét một chuỗi thời gian mới {Y t} từ chuỗi ban đầu nhờ toán
tự sai phân Yt = Xt – Xt-d (hoặc lặp lại một vài lần sai phân như vậy). Mục tiêu là nhận
được chuỗi dừng. Khái niệm về chuối dừng chúng ta đề cập tiếp ở phần sau.


Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

5


Báo cáo môn học – Phương pháp toán trong tin học

3. Dự báo
Dự báo là ước lượng các giá trị tương lai y t+h với h ≥ 1 của một biến ngẫu nhiên
dự trên các quan sát và các giá trị quá khú của nó y 1, y2, y3, ,...yn . Dự báo yt+h thường
được ký hiệu là ŷt(h).
Chất lượng của dự báo phụ thuộc vào nhiều yếu tố. Trước hết nó phụ thuộc vào
xu hướng phát triển của chuỗi thời gian. nuếu chuỗi thời gian là hàm “đều đặn” theo
thời gian thì càng dễ dự báo. Ví dụ tiến trình phát triển kinh tế không có những biết
động đặc biệt như khủng hoảng kinh tế thì các dễ dự báo tổng sản phẩn quốc nội GDP
cho những năm sau. Cho đến nay, các phương pháp dự báo chuỗi thời gian chưa có
các nghiên cứu nào cho phép dự báo được giá trị đột biến. Tính chính xác của dự báo
chuỗi thời gian còn phụ thuộc xa gần của thời gian. Dự báo các giá trị càng gần hiện
tại càng chính xác. Như vậy việc ước lượng GDP cho năm sau, quý sau sẽ chính xác
hơn việc ước lượng GDP cho 10 năm sau.
Ngoài ra, phương pháp ước lượng, phần mềm hỗ trợ cũng đóng vai trò hết sức
quan trọng khi thực hiện công tác dự báo. Nếu chỉ có phương pháp và sử dụng công
cụ là giấy trắng và bút chì thì sự gian khó sẽ vô cùng khi chúng ta muốn làm dự báo
chuỗi thời gian, tuy nhiên bằng sự hỗ trợ của các phần mềm phân tích chuyên biệt
chẳng hạn như EVIEWS thì việc dự báo thực hiện khá dễ dàng.
Trong phần tiếp theo em xin trình bày những định nghĩa cơ bản nhất cần dùng
cho việc trình bày báo cáo. Để thuận tiện cho việc trình bày trong nội dung báo cáo
em xin bỏ qua các chứng minh phức tạp về các định lý, các mệnh đề liên quan.
4. Qúa trình dừng và phân tích hệ số tự tương quan

4.1 Khái niệm về quá trình dừng.
Quá trình dừng là quá trình ngẫu nhiên, có một vài đặc trưng không biên đổi theo
thời gian. Đây là một khái niệm cốt lõi trong việc phân tích chuỗi thời gian. Nếu đặc
trưng đó là phân phối đồng thời của các {Xt} thì ta có

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

6


Báo cáo môn học – Phương pháp toán trong tin học

Định nghĩa 4.1.1: Quá trình ngẫu nhiên {Xt} được gọi là dừng theo nghĩa chặt
nêu như với mọi t1 < t2 < t3 < .....< tk và h > 0 ta có (Xt1, Xt2, ....Xtk) có cùng phân phối
với (Xt1+h, Xt2+h, ....Xtk+h).
Định nghĩa 4.1.2: Giả sử {Xt} là chuỗi thời gian với EXt2 < ∞. Khi đó
a) Hàm số μx(t) = EXt, t Є T gọi là hàm trung bình
b) Hàm hai biến γx(t, s) := cov(Xt,Xs) = E[(Xt - μx(t))(Xs - μx(s))] được gọi là
hàm tự hiệp phương sai.
Định nghĩa 4.1.3: Quá trình ngẫu nhiên gọi là dừng theo nghĩa rộng nếu:
a) Hàm μx(t) := EXt hằng số theo thời gian.
b) Với mỗi h = 0; ±1; ±2, .... cố định hàm số
c) γx(t+h, t) :=E[(Xt - μx(t))(Xt+h - μx(t+h))] không phụ thuộc vào t, tức là
γx(t+h, t):= γx(t).
Định nghĩa 4.1.4: Nếu {Xt} t = 0; ±1; ±2, .... là quá trình dừng với EX t2 < ∞
thì hàm (theo h):
γx(h) = cov(Xt, Xt+h) h = 0; ±1; ±2, .... gọi là hàm tự hiệp phương sai
(autocovariance) còn
ρx(h) =γx(h)/γx(0) := cov(Xt, Xt+h) h = 0; ±1; ±2, .... là hàm tự tương
quan.

Định nghĩa 4.1.5: Chuỗi thời gian {Xt} là tuyến tính nếu nó có thể biểu diễn
dưới dạng:


Xt =



ψj Zt-j

j:= −∞

Với mọi t, trong đó Zt là dẫy số có phân phối nhiễu trắng (WN(0,σ2 )), còn ψi


là dãy các hằng số với



ψj < ∞.

j:= −∞

4.2 Hệ số tương quan và tự tương quan mẫu
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

7


Báo cáo môn học – Phương pháp toán trong tin học


4.2.1 Hệ số tương quan mẫu:
Nếu ta quan sát được n giá trị của chuỗi {Xt} là x1, x2, ....xn và n giá trị của chuỗi
{Yt} là y1, y2, ....yn Thì hệ số hiệp phương sai γ = cov(X,Y) sẽ được biểu diễn bởi
ϒˆ = XY - X * Y

Còn hệ số tương quan ρ của X và Y được tính bới công thức:
XY − X ∗ Y

ρ=

( )

X=

X2 =

( )

 ( X 2 − X 2 )(Y 2 − Y 2 



'

1 n
1 n
x
Y
=

;
∑i
∑ yi Là trung bình số học của các số đo xi, yi tương ứng và
n i =1
n i =1

1 n 2
1 n
1 n
x i ; Y 2 = ∑ y 2i ; XY = ∑ x i y

n i =1
n i =1
n i =1

i

4.2.2 Hệ số tự tương quan mẫu
Giả sử có quan sát {xt} của chuỗi thời gian {Xt}. Khi đó ước lượng của hệ số tự
hiệp phương sai γx(h) là hệ số tự hiệp phương sai mẫu ϒˆ x(h) cho bởi:
n− h
ˆϒ(h) = 1 ∑ x − X
n t =1 t + h

(

)(x −X)
t

Và hệ số tự tương quan mẫu là

ρˆ (h) =

ϒˆ (h)
(với độ trễ thời gian là h), trong đó
ϒˆ (0)

ü n = số quan sát của đại lương X
ü xt = thể hiện của Xt tại thời điểm t
ü X giá trị trung bình của các thể hiện của chuỗi thời gian
Nhìn vào công thức ta thấy ϒ h và ρ h đo môi tương quan giữa đoạn số liệu x1, x2,
....xn-h với đoạn số liệu xh+1, xh+2, ....xn cách nhau 1 độ trễ thời gian là h.

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

8


Báo cáo môn học – Phương pháp toán trong tin học

Chúng ta dễ dàng chứng minh được giá trị hệ số tự tương quan mẫu ρ h nằng
giữa -1 và +1. Hơn nữ, dễ dàng nhận thấy ρ h = ρ − h với độ trễ thơờ gian h. Do vậy ta
chỉ xét với những h ≥ 0.
Định nghĩa 4.2.6. Với độ tin cậy 1- α (hay mức có ý nghĩa là α ), nếu cá giá trị
ρˆ (k ) thuộc khoảng tin cây này, tức là:

− uα /2

1
1
< ρˆ (k ) < uα /2

n
n

(*)

Thì ρˆ (k ) được gọi là xấp xỉ 0
Nếu ρˆ (k ) không thoả mãn bất đẳng thức này, ta nói ρˆ (k ) khác 0 thực sự
Quy tắc 4.2.7.1 Nếu các hệ số tự tương quan ρˆ (k ) của một chuỗi thoả mãn bất
đẳng thức (*) ở định nghĩa 4.2.7 thì ta xem rằng dãy số liệu đã cho được phân bổ một
cách ngẫu nhiên. Ngược lại, dù chỉ một giá trị ρˆ (k ) không thoả mãn bất đẳng thức (*)
thì trong chuỗi đang xét nhất thiết phải có tồn tại một mối liên kết nào đó.
(Việt tính toán những hệ số tự tương quan này sẽ rất khó khăn, nếu chúng ta
không sử dụng phần mềm hỗ trợ, với sự trợ giúp của phần mềm Eviews chúng ta có
thể kiểm định khá dễ dàng bằng cách chạy lệnh và quan sát các giá trị ρˆ (k ) nằm
trong dài phân cách giởi hạn ở mức ý nghĩa 95%, như hình ảnh minh họa dưới đây)

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

9


Báo cáo môn học – Phương pháp toán trong tin học

Hình 1: “quan sát” Hệ số tự tương quan và Hệ số tương quan riêng của một
chuỗi số liệu theo thời gian
Chú ý: Nếu việc phân tích các hệ số tự tương quan chỉ ra rằng dãy số đang xét là
ngẫu nhiên, thì giữa các giá trị của số liệu không tồn tại một mối liên kết nào cả. Do
vậy có mô hình hoá để tìm xu thế tiềm ẩn trong nó cũgn vô ích và ta dừng việc phân
tích chuỗi thời gian.
4.2.3 Hệ số tự tương quan riêng

Hệ số tự tương quan riêng là khái niệm ít được sử dụng hơn so với hệ số tự
tương quan trong việc phân tích chuỗi thời gian. Trên thực tế, hệ số tự tương quan
riêng chỉ giúp cho ta việc nhận dạng mô hình tự hồi quy trung bình trượt ARMA để
dự báo (Kỹ thuật phân tích mô hình ARMA sẽ được trình bày ở chương sau). Hệ số tự
tương quan riêng đóng vai trò quyết định trong việc mô hình hoá ARMA. Việc hình
dung về phương diện lý thuyết của hệ số tự tương quan riêng không quá khó, tuy
nhiên sự tính toán nó cũng gặp khá nhiều rắc rối. Để cho dễ hình dung chúng ta hiểu
là hệ số tự tương quan riêng của chuỗi số liệu {X t} nhằm để đo mức độ kết hợp giữa
chuối thời gian {Xt} và chuỗi thời gian trễ {Xt-k} khi ảnh hưởng của các quan sát xen
vào ở giữa đã bị loại trừ (thí dụ k = 4 thì ta loại các X t-1, Xt-2, Xt-3, ra khỏi việc tính
toán).
Định nghĩa 4.3.7. Hệ số tự tương quan riêng của choõi thời gian dừng {Xt},
được ký hiệu là α(k), chính là hệ số tương quan cảu hai biến ngẫu nhiên
Xt - E[Xt | Xt-1, Xt-2, ....,Xt-k+1 ] và Xt-k - E[Xt-k | Xt-1, Xt-2, ....,Xt-k+1]
Nói cách khác α(k) đo sự phụ thuộc của X t và Xt-k sau khi loại boả các ảnh
hưởng của giá trị trung gian
- Trong hình 1 ở trên trung ta có thể quan sát được giá trị tự tương quan riêng
bằng sự trợ giúp của phần mềm Eviews.
5. Phương pháp dự báo chuỗi thời gian ARMA
5.1 Dự báo chuỗi thời gian dừng
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

10


Báo cáo môn học – Phương pháp toán trong tin học

Giả sử ta có chuỗi thời gian dừng {X t} với giá trị trung bình μ và hàm tự tương
quan γ(h) đã được biết. Ta muốn dự báo giá trị X n+h theo các giá trị của X1, X2,
..........,Xn . Mục tiêu của chúng ta là tìm một hàm số g(x 1, x2,..........xn) để g(X1, X2,

..........,Xn) là dự báo cho Xn+h có sai số bình phương trung bình nhỏ nhất. Ta ký hiệu
dự báo tốt nhất này là P nXn+h . Người ta chứng minh được rằng trong trường hợp {X t}
có phân phối chuẩn thì ta có thể chọn g là một tổ hợp tuyến tính theo cá biến x 1,
x2,..........xn.
Mặt khác, phần lớn các chuỗi thời gian trong thực tế đều có phân phối chuẩn
hoặc xấp xỉ chuẩn, hoặc chúng ta có thể biến đổi chúng trở thành chuỗi thời gian có
phân phối gần chuẩn, vì vậy lẽ tự nhiên ta giả thiết.
PnXn+h = a0 + a1Xn + ...........+ anX1
Vấn đề bây giờ là tìm các hệ số a0, a1.............. an
5.2 Quá trình tự hồi quy AR (Auto Regressive):
Qúa trình tự hội quy cấp p (ký hiệu tắt AR(p) ) là quá trình mà các số liệu của chuỗi
thời gian sẽ liên hệ với nhau theo biểu thức:
Xt = Φ1 Xt-1 + Φ2 Xt-2 + Φ3 Xt-3 + .....+ Φp Xt-p

+ Zt

Trong đó:
Φ1 , Φ2 , Φ3 ... Φp : là các hệ số của phương trình
Còn Zt là ồn trắng ( hay là nhiều trắng - white noise ), ký hiệu là WN(0,σ2), nghĩa
là chuỗi độc lập, cùng phân phối với trung bình zero và phương sai σ2. Ta gọi chuỗi
số liệu Xt là tự hồi quy vì giá trị hiện tại của nó được truy hồi từ các giá trị Xt-1 , Xt-2
....,

Xt-p đứng trước nó. Ồn trắng Zt biểu thị các yếu tố ngẫu nhiên tham gia vào mà

không thể giải thích được bằng mô hình.
Các giá trị Φ1 , Φ2 , Φ3 ... Φp là các hệ số bằng số mô ta mối quan hệ giữa các
giá trị thực tại với các giá trị trước nó.
Giá trị của p là cấp của quá trình tự hồi quy AR(p).
5.3 Quá trình trung bình trượt MA(q):

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

11


Báo cáo môn học – Phương pháp toán trong tin học

Chuỗi thời gian Xt là quá trình trung bình trượt cấp q (viết tắt là MA(q) ) nếu:
Xt = Zt + θ 1 Zt-1 + θ2 Zt-2 + θ 3 Zt-3 + .....+ θ q Zt-q
Trong đó:
Zt là dẫy số có phân phối nhiễu trắng (WN(0,σ2 ))
θ1, θ2 , .....θq là các hệ số chỉ mối liên hệ của các gía trị Xt và các giá trị của nhiễu
cho đến thời điểm t.
q là cấp của mô hình trung bình trượt MA(q),
5.4 Quá trình tự hồi quy kết hợp trung bình trượt ARIMA(p,q):
Mô hình ARIMA(p,q) là sự hỗn hợp của 2 quá trình AR và MA. Dạng chung của
quá trình được định nghĩa bởi công thức sau:
Xt = Φ1 Xt-1

+ Φ2 Xt-2 + Φ3 Xt-3 + .....+ Φp Xt-p + Zt + θ1 Zt-1 + θ2 Zt-2 + θ3 Zt-3

+ .....+ θq Zt-q (* *)
Trong đó: các đại lượng của công thức này được giải thích như ở ở phần 5.3, 5.4.
Quá trình Xt thoả mãnh (* *) gọi là quá trình tự hồi quy cấp P, trùng bình trược cấp q
và ký hiệu là ARMA (p, q). Có một lưu ý là ARIMA(p,0) = AP(p) và ARIMA(0,q) =
MA(q).
5.5 Kỹ thuật dự báo quá trình ARMA
Câu hỏi đặt ra là khi tiến hành dự báo một chuỗi thời gian theo mô hình ARIMA
thì làm sao ta biết được là nó tuân theo một quá trình tự hồi quy AR( và nếu có thì giá
trị của p bậc của mô hình bằng bao nhiêu?) hay một quá trình trung bình trượt MA

(và nếu có thì giá trị của q bậc bằng bao nhiêu) hay một quá trình ARMA (và nếu có
thì các giá trị của p và q bằng bao nhiêu). Phương pháp của hai nhà khoa học BoxJenkins sẽ giúp ta giải quyết vấn đề này.
Bước 1: Nhận dạng và ước lượng
-

Vẽ chuỗi số liệu lên mặt phẳng tọa độ và xét các đặc trưng chính của chúng,
trong đó phải chú ý đến xu thế, thành phần theo mùa, thời điểm thay đổi dáng
điệu lớn, các quan sát dị thường.

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

12


Báo cáo môn học – Phương pháp toán trong tin học

-

Vẽ đồ thị hàm tự tương quan và hàm tự tương quan riêng để, tìm các giá trị
thích hợp của p và q.

Bước 2: Kiểm tra: Sau khi đã lựa chọn được mô hình ARIMA và ước lượng được
các tham số p, q ở bước 1, ta phải kiểm tra xem mô hình đó có phù hợp với dữ liệu
quan sát được hay không bởi rất có thể có một mô hình ARIMA khác cũng phù
hợp với các dự liệu quan sát. Cách kiểm tra là xem sai số bình phương (R bình
phương). Cuối cùng ta sẽ lựa chọn mô hình nào có sai số bình phương nhỏ nhất.
Việc kiểm tra nhận dạng mô hình ở bước này nhiều khi mang tính “nghệ thuật”,
phải mày mò và tốn nhiều công sức mặc dù có những nguyên tắc nhất định.
Bước 3: Dự báo: Một trong số các lý do về tính phổ biến của phương pháp lập mô
hình ARIMA là sự khá chính xác của nó khi dự báo. Tính chính xác của dự báo

phụ thuộc vào nhiều yếu tố. Trước hết nó phụ thuộc vào xu hướng phát triển của
chuỗi thời gian, chẳng hạn nếu tiến trình phát triển kinh tế không có những biến
động đặc biệt thì dễ dàng dự báo tổng sản phẩm quốc nội GDP cho những năm
sau. Chất lượng dự báo còn phụ thuộc còn phụ thuộc vào thời gian định dự báo.
Dự báo càng gần hiện tại thì càng chính xác. Hiển nhiên việc dự báo GDP cho
năm sau sẽ chính xác hơn việc dự báo GDP cho 10 năm tiếp theo.

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

13


Báo cáo môn học – Phương pháp toán trong tin học

Chương 2: Giới thiệu sơ bộ về phần mềm Eviews
Hiện nay, trên thế giới đã có trên 300 phần mềm chuyên dụng cho phân tích số
liệu thống kế, tại Việt Nam hiện nay cũng có nhiều phần mềm phân tích số liệu được
sử dụng như EXCEL, SAS, SPSS, S_Plus, Statisca, STATA, EVIEWS… được dùng
ở một số trường Đại học, cơ sở nghiên cứu hoặc một số cơ quan quản lý.v.v. Các
phần mềm này đều có điểm chung là giúp chúng ta xử lý dữ liệu một cách nhanh
chóng. Tuy nhiên mỗi phần mềm lại có những đặc điểm riêng. STATA có thể tốt các
dữ liệu từ các cuộc điều tra thông kê lớn. SPSS có ưu điểm xử lý dữ liệu mô tả tốt
dưới dạng bảng biểu; EXCEL thì có ở khắp mọi máy tính PC thông thường mà không
cần phải cài đặt gì thêm . . . Trong phần tiếp theo xin giới thiệu phân mềm phân tích
số liệu EVIEWS hiện đang được dùng nhiều ở việt Nam hiện nay.
Ưu điểm chính của EViews có thể là giúp chúng ta tim ra các quan hệ thống kê
và dự báo giá trị tương lai từ các kết quả hiện có. Các lĩnh vực mà Eviews cho kết quả
nhanh chóng và rất tiện ích đó là
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam


14


Báo cáo môn học – Phương pháp toán trong tin học



Dự báo doanh số



Phân tích chi phí và dự báo



Dự báo các chỉ tiêu kinh tế lượng



Mô phỏng



Phân tích và đánh giá số liệu khoa học



Phân tích tài chính, phân tích chuỗi thời gian và dữ liệu dạng bảng.

Eviews chạy trong môi trường Window được phát triển bởi công ty QMS

(Quantitative Micro Software địa chỉ www.eviews.com ). Phiên phải mới nhất của
Eviews là phiên bản 5.0. Việc sử dụng Eviews không qúa khó đối vời người đã quen
làm việc với môi trường Windows bởi Eviews sử dụng hệ thống bảng chọn và các hộp
hội thoại. Một số tính năng cơ bản và đặc thù của Eviews như sau:
• Cho phép Nhập, mở rộng va hiệu chỉnh số liệu (làm sạch số liêu)
• Tính toán các thống kê mô tả: Ma trận hệ số tươnga quan, ma trận hiệp
phương sai
• Tính các chuỗi số liệu dựa trên công thức và các hàm mẫu
• Vẽ và in các đồ thị, các biểu đồ
• Ước lượng và mô hình hồi quy tuyến tính bằng OLS(Ordinary Least
Squares, TSLS = Two- Stage Least Squares),…
• Ước lượng mô hình phí tuyến
• Ước lượng mô hình Probit and Logit
• Ước lượng hệ phương trình tuyến tính và phí tuyến
• Ước lượng và phân tích véc tơ tự hồi quy
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

15


Báo cáo môn học – Phương pháp toán trong tin học

• Quá trình có sai số trung bình trượt và tự hồi quy theo mùa
• Trễ phân phối đa thức
• Dự báo dứ trên phương pháp hồi quy
• Giải các mô hình nhiều phương trình
• Theo dõi dữ liệu theo thời gian (lịch sử của dữ liệu)
• Dọc và ghi ra fie dữ liệu dưới dạng bảng chuẩn
Khi sử dụng Eviews thông thường sẽ chạy qua 3 bước sau:
• Biên tập dữ liệu (Data Editing): Người sử dụng có thể biên tập dự liệu cho

các mô hình phân tích thông qua Menu và các câu lệnh thân thiện với người sử
dụng Window như: New, Open, save, save as … .
• Tính toán dữ liệu (Data Computing). Eview có thể cung cấp công thức tính
toán tương đối phức tạp, người sử dụng phải có những am hiểu nhất định về
mắt ý nghĩa thống kê của công thức này.
• Phân tích thống kê (Satatistical Analysis): Eviews có thể thực hiện được
các kỹ thuật liệt kê ở trên.
Các thuộc tính quan trọng của chương trình Eviews
Đối tượng: Đối tượng trong Eview là các chuỗi số liệu ( series), các biểu thức toán
học, mô hình, ma trận, biến số, bảng biểu, đồ thị.v.v. Mỗi một đối tượng được sử
dụng tương ứng thông qua các chức năng của menu trên của sổ chương trình.
Cửa số chính: Xuất hiện ngay sau khi khởi động Eviews, gồm một thanh tiêu đề, một
menu chính, cửa sổ lệnh, dòng trạng thái và vùng làm việc. Vùng làm việc sẽ xuất
hiện ở chính giữa cửa sổ chính và hiển thị khi các đối tượng được tạo ra.
Cửa sổ lệnh: Xuật hiện phía dưới thanh Menu trong cửa sổ chính, được dùng để tiến
hành những câu lệnh đơn giản.
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

16


Báo cáo môn học – Phương pháp toán trong tin học

Cửa sổ tập tin làm việc (workfile window): Cửa sổ xuất hiện khi tại của sổ chính ta
click chuột vào Menu File/New/Workfile. Khi đưa các mô hình vào chạy trên Eviews
chúng ta cần thiết lập dữ liệu cho mô hình bằng cách nhập dữ liệu vào từ cửa số
Workfile. Cửa sổ này chính là bước đầu tiên để người dùng bắt đầu với Eviews.
Cửa số Group (Group window): Cửa sổ xuất hiện khi chọn cùng lúc nhiều biến số (2
biến trở lên) trên cửa sổ Workfile. Sau đó chọn Open/ as Group. Trong cửa sổ này dữ
liệu liệu xuất hiện trên các bảng tính khác nhau, và chúng ta có thể quan sát chúng

bằng cách biến đổi thành các đồ thị.
Cửa sổ biểu thức (Equation window): Cửa sổ xuất hiện khi tại Menu chương trình
ta chọn Objects/New objects/Equation, hộp hội thoại hiện ra cho phép nhập những
biểu thức cần sử dụng vào. Tại đây sẽ hiển thị cho ta những kết quả từ những tính
toán ước lượng công thức nhập vào.
Cửa sổ dẫy số liệu: Hiển thị cho ta chuỗi số liệu theo thời gian trên các bảng tính
khác nhau bằng cách click vào tên biến trên được hiện thị trên workfile.
Phân tiếp theo trong bài viết này xin giới thiệu với bạn đọc một số thao tác làm việc
với Eviews :
- Khởi động và copy dữ liệu
- Giới thiệu Menu chính trong cừa sổ EViews
- Workfile
- Nhập dữ liệu từ phần mềm khác
- Nhập dữ liệu bằng Copy và Paste
- Nhập dữ liệu bằng bàn phím
- Vẽ đồ thị
Khởi động Eviews
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

17


Báo cáo môn học – Phương pháp toán trong tin học

Cài đặt theo tài liệu hướng dẫn được kèm theo phần mềm.
Biểu tượng của EViews trên màn hình Windows nhìn như thế này :

Nhấn đúp vào biểu tượng EViews và EViews bắt đầu hoạt động.
Hãy ghi nhận menu chính, cửa sổ lệnh, cửa sổ chính và dòng trạng thái (status line).
Menu chính bao gồm những lựa chọn sau: File; Edit; Objects; View; Procs;

Quick Options; Window Help
Nhấp chuột vào mỗi một trong những lựa chọn này và kiểm tra các Menu con xuất
hiện ở phía dưới.
Khi mở EViews lần đầu tiên, cửa sổ chính còn trống vì chưa xác định tập tin làm việc
nào (workfile) để sử dụng .

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

18


Báo cáo môn học – Phương pháp toán trong tin học

Mở tập tin làm việc (Workfile) đã lưu giữ từ trước: Từ File/Open/Eviews
Workfile; một màn hình mở ra, trên đó liệt kê các tập tin trong thư mục mặc định
(default folder). Nếu thư mục mặc định không phải là thư mục mà người sử dụng
mong muốn, thì có thể tìm trong các thư mục cho tới khi tìm ra thư mục mà người sử
dụng muốn dùng

Để chỉ ra các workfile trên EViews, dòng "Files of type" cần xác định Workfile
(*.wf1).
Vì người sử dụng dự định sẽ làm việc với thư mục này thường xuyên thì nhấp chuột
để đánh dấu vào ô vuông giúp cập nhật thư mục mặc định ở góc trái-phiá dưới cừa sổ
Open như trên đây. Lần sau, khi khởi động EViews, khi thực hiện thao tác
File/Open/Eviews Workfile sẽ tự động chỉ tới thư mục này.

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

19



Báo cáo môn học – Phương pháp toán trong tin học

Mở workfile có tên demo bằng cách nhấp đúp vào nó. Cách khác,người sử dụng có
thể bôi đen nó bằng cách nhấp đơn, sau đó nhấp Open.
Với workfile đang mở , màn hình có dạng:

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

20


Báo cáo môn học – Phương pháp toán trong tin học

Thanh trên cùng trên menu của Workfile chỉ toàn bộ đường dẫn đối với Workfile này;
thanh trạng trạng ở dưới đáy của màn hình cũng chỉ đường dẫn này, và nó chỉ
workfile đang sừ dụng : WF = demo.
Menu của workfile chứa các nút bấm dành cho View; Procs, Objects, Print. Save,
Detail +/-, Show , Fetch, Store, Delete, Genr, Sample
Các phím bấm với +/ - là các phím chuyển đổi thực hiện các chức năng bật và tắt.
Thông tin về workfile này xuất hiện dưới thanh menu: Range; Display Filter Default
Equation; Sample
Cuối cùng, phía trong cừa sổ của workfile, chúng ta thấy tất cả các đối tượng đang có
mặt trong workfile này : các chuỗi (các biến ), các nhóm chuỗi , vector hệ số , vector
phần dư, và bất cứ phương trình, đồ thị hay bảng nào đã được đặt tên.
Bây giờ hãy đóng demo.wf1 bằng cách nhấp vào dấu X ở góc phải phía trên của
workfile này.
Bây giờ hãy nhấp File. Ghi nhớ rằng các workfile mới mở gần nhất sẽ hiện ra ở phía
dưới cùng của menu trải ra phía dưới. Nếu người sử dụng muốn mở lại một trong số
đó , chỉ việc nhấp vào tên của nó.


Nhập dữ liệu từ các phần mềm khác

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

21


Báo cáo môn học – Phương pháp toán trong tin học

Dữ liệu có thể được nhập vào từ các tập tin Lotus, Excel, SPSS, MINITAB hoặc
ASCII. Trong mỗi trường hợp đều dùng phương pháp như nhau. Dữ liệu này nằm
trong một tập tin Excel có tên DEMO.xls.
Người sử dụng cần kiểm tra lại tập tin này bằng cách mở file nay ra để xác định
- Tập tin này có bao nhiêu biến,
- Có phải các tên của biến xuất hiện ở phiá trên của tập tin không ,
- Khảng cách giữa các cột dữ liệu
- Có bao nhiêu quan sát (bao nhiêu hàng dữ liệu).
Sau đó đóng tập tin này lại.

Trở lại với menu chính : nhấn File/New/Workfile. Bằng việc nhấp New trong chuỗi
này chúng ta báo cho EViews rằng chúng ta có ý định phát triển một workfile mới.
Việc này làm cho EViews mở ra một hộp thoại để chúng ta xác định các thuộc tính
nhất định của dữ liệu, nhấp vào ô Workfile structure type "unstructured/ undated,"
và chúng ta đánh máy 27 vào ô "observation.". Tại ô Names (optional) nếu ta gõ tên
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

22



Báo cáo môn học – Phương pháp toán trong tin học

vào thì Eview sẽ sử dụng tên đó làm tên mặc định của Workfile trong trường hợp
chúng ta không gõ gì Eviews sẽ để mặc định tên là UNTITLED.

Bây giờ hãy nhấp OK. Một workfile mới xuất hiện với tên là UNTITLED (do ta để
không gõ gì vào phân Names (optional)).
Nhấn Procs/Import/Read Text-Lotus-Excel... và một hộp thoại xuất hiện để mở các
tập tin. Hãy đảm bảo là dòng files of type chỉ Text-ASCII. Excel và Lotus cũng là
những lựa chọn có sẵn. Hãy đưa về DEMO.XLS và nhấp để mở nó.

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

23


Báo cáo môn học – Phương pháp toán trong tin học

Một hộp thoại khác - phức tạp hơn - xuất hiện. Đưa danh sách các biến vào theo thứ
tự OBS, GDP, PR, M1, RP.Kiểm tra lại các lựa chọn còn lại (bạn không cần bất cứ
lựa chọn nào ).

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

24


Báo cáo môn học – Phương pháp toán trong tin học

Nhấn OK và dữ liệu đã đuợc nhập vào.

Xem và kiểm tra dữ liệu: xừ dụng phím Ctrl và nhấp chuột vào các biến gdp, M1,
obs, pr, rp sau đó nhấp đúp vào vùng đánh dấu bảng dữ liệu sẽ được hiện ra như sau:

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

25


×