Tải bản đầy đủ (.pdf) (75 trang)

Mô hình chuỗi thời gian áp dụng trong kinh tế

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (679.71 KB, 75 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
--------------------------------------TRẦN THANH BÌNH

Trần Thanh Bình

TOÁN CÔNG NGHỆ

MÔ HÌNH CHUỖI THỜI GIAN ÁP DỤNG TRONG
KINH TẾ

LUẬN VĂN THẠC SỸ KHOA HỌC
Ngành: Toán Công nghệ

2007 - 2009
Hà Nội – 2009


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------

Trần Thanh Bình

MÔ HÌNH CHUỖI THỜI GIAN ÁP DỤNG TRONG
KINH TẾ

LUẬN VĂN THẠC SỸ KHOA HỌC
Ngành: Toán Công nghệ

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. TỐNG ĐÌNH QUỲ



Hà Nội – 2009


MỤC LỤC
LỜI CẢM ƠN

1

MỞ ĐẦU

5

Chương 1: TỔNG QUAN VỀ CHUỖI THỜI GIAN

6

1.1 GIỚI THIỆU VỀ CHUỖI THỜI GIAN VÀ DỰ

6

1.2 CÁC KHÁI NIỆM CƠ BẢN VỀ CHUỖI THỜI GIAN

8

1.2.1 Chuỗi thời gian……………………………………….. 8
1.2.2 Đặc điểm chuỗi thời gian………………………………9
1.3 PHÂN TÍCH, DỰ BÁO CHUỖI THỜI GIAN………………9
1.4 CÁC ĐẠI LƯỢNG ĐẶC TRƯNG CỦA CHUỖI THỜI
GIAN…………………………………………………………13

1.4.1 Các đại lượng thống kê đặc trưng cho chuỗi…………. 13
1.4.2 Các đại lượng mô tả mối quan hệ giữa các phần tử trong
chuỗi……………………………………………………….. 13
1.5 MỘT SỐ MÔ HÌNH ĐƠN GIẢN CHO CHUỖI THỜI GIAN
1.5.1 Quá trình nhiễu trắng……………………………………17
1.5.2 Mô hình du động ngẫu nhiên………………………….. 18
1.5.3 Mô hình du động ngẫu nhiên có nhiễu…………………19
1.6 TOÁN TỬ LÙI VÀ CHUỖI THỜI GIAN DỪNG ……… 20


1.6.1 Toán tử lùi………………………………………………20
1.6.2 Toán tử sai phân………………………………………..20
1.6.3 Chuỗi thời gian dừng…………………………………22

Chương 2: MỘT SỐ MÔ HÌNH CHUỖI THỜI GIAN …….27
2.1 CÁC MÔ HÌNH DỪNG TUYẾN TÍNH…………………….. 27
2.1.1 Quá trình tuyến tính……………………………………

27

2.1.2 Quá trình tự hồi qui AR(p)……………………………… 28
2.1.3 Quá trình trung bình trượt MA(q)......................................34
2.1.4 Quá trình tự hồi quy trung bình trượt ARMA(p,q)............36
2.1.5 Tính khả nghịch của các mô hình MA(q).......................... 38
2.2

MÔ HÌNH KHÔNG DỪNG TUYẾN TÍNH..........................39
2.2.1 Quá trình tích hợp……………………………………… 39
2.2.2 Mô hình tự hồi qui tích hợp trung bình trượt
ARIMA(p,d,q)……………………………………………40

2.2.3 Qui trình ứng dụng mô hình ARIMA
trong phân tích, dự báo………………………………… 41

2.3

MÔ HÌNH MÙA VỤ…………………………………………52
2.3.1 Chuỗi mùa vụ…………………………………………… 52
2.3.2 Biến đổi chuỗi mùa vụ thành chuỗi dừng……………… 54
2.3.3 Mô hình ARIMA theo mùa vụ hay SARIMA………… 55
2.3.4 Các bước tiến hành xây dựng SARIMA…………………57

Chương 3: CHƯƠNG TRÌNH DỰ BÁO…………………… 59


KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN…………………

67

TÀI LIỆU THAM KHẢO………………………………….

69


1

LỜI CẢM ƠN
Tôi xin trân trọng cám ơn PGS.TS Tống Đình Quỳ, người thầy đã tận
tình hướng dẫn và giúp đỡ tôi trong suốt quá trình làm luận văn. Tôi xin trân
trọng cảm ơn các thầy cô trường Đại Học Bách Khoa đã giảng dậy cho tôi
trong suốt quá trình học cao học, cám ơn các bạn học viên cùng lớp Toán

Công Nghệ đã động viên và giúp đỡ tôi trong thời gian học tập.


2

MỤC LỤC
LỜI CẢM ƠN

1

MỞ ĐẦU

5

Chương 1: TỔNG QUAN VỀ CHUỖI THỜI GIAN

6

1.1 GIỚI THIỆU VỀ CHUỖI THỜI GIAN VÀ DỰ

6

1.2 CÁC KHÁI NIỆM CƠ BẢN VỀ CHUỖI THỜI GIAN

8

1.2.1 Chuỗi thời gian……………………………………….. 8
1.2.2 Đặc điểm chuỗi thời gian………………………………9
1.3 PHÂN TÍCH, DỰ BÁO CHUỖI THỜI GIAN………………9
1.4 CÁC ĐẠI LƯỢNG ĐẶC TRƯNG CỦA CHUỖI THỜI

GIAN…………………………………………………………13
1.4.1 Các đại lượng thống kê đặc trưng cho chuỗi…………. 13
1.4.2 Các đại lượng mô tả mối quan hệ giữa các phần tử trong
chuỗi……………………………………………………….. 13
1.5 MỘT SỐ MÔ HÌNH ĐƠN GIẢN CHO CHUỖI THỜI GIAN
1.5.1 Quá trình nhiễu trắng……………………………………17
1.5.2 Mô hình du động ngẫu nhiên………………………….. 18
1.5.3 Mô hình du động ngẫu nhiên có nhiễu…………………19
1.6 TOÁN TỬ LÙI VÀ CHUỖI THỜI GIAN DỪNG ……… 20
1.6.1 Toán tử lùi………………………………………………20
1.6.2 Toán tử sai phân………………………………………..20


3

1.6.3 Chuỗi thời gian dừng…………………………………22

Chương 2: MỘT SỐ MÔ HÌNH CHUỖI THỜI GIAN …….27
2.1 CÁC MÔ HÌNH DỪNG TUYẾN TÍNH…………………….. 27
2.1.1 Quá trình tuyến tính…………………………………… 27
2.1.2 Quá trình tự hồi qui AR(p)……………………………… 28
2.1.3 Quá trình trung bình trượt MA(q)......................................34
2.1.4 Quá trình tự hồi quy trung bình trượt ARMA(p,q)............36
2.1.5 Tính khả nghịch của các mô hình MA(q).......................... 38
2.2

MÔ HÌNH KHÔNG DỪNG TUYẾN TÍNH..........................39
2.2.1 Quá trình tích hợp……………………………………… 39
2.2.2 Mô hình tự hồi qui tích hợp trung bình trượt
ARIMA(p,d,q)……………………………………………40

2.2.3 Qui trình ứng dụng mô hình ARIMA
trong phân tích, dự báo………………………………… 41

2.3

MÔ HÌNH MÙA VỤ…………………………………………52
2.3.1 Chuỗi mùa vụ…………………………………………… 52
2.3.2 Biến đổi chuỗi mùa vụ thành chuỗi dừng……………… 54
2.3.3 Mô hình ARIMA theo mùa vụ hay SARIMA………… 55
2.3.4 Các bước tiến hành xây dựng SARIMA…………………57

Chương 3: CHƯƠNG TRÌNH DỰ BÁO…………………… 59
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN…………………

67

TÀI LIỆU THAM KHẢO………………………………….

69


4

DANH MỤC CÁC TỪ VIẾT TẮT
ACF (AutoCorrelation Function) Hàm tự tương quan
PACF (Partial AutoCorrelation Function) Hàm tự tương quan riêng
AR (AutoRegressive) Tự hồi quy
MA (Moving Average) Trung bình trượt
MSE (Mean Square Error) Sai số bình phương trung bình



5

MỞ ĐẦU
Dự báo là nghệ thuật và khoa học tiên đoán các sự kiện xảy ra trong
tương lai.
Từ thuở xa xưa, những nhà tiên tri đã giữ một vị trí quan trọng trong
cộng đồng. Khi văn minh nhân loại phát triển đã làm gia tăng các mối quan
hệ phức tạp của các giai đoạn trong cuộc sống, con người có nhu cầu quan
tâm đến tương lai của họ.
Kĩ thuật về dự báo đã hình thành từ thế kỉ 19, tuy nhiên dự báo có ảnh
hưởng mạnh mẽ khi công nghệ thông tin phát triển vì bản chất mô phỏng
của các phương pháp dự báo rất cần thiết sự hỗ trợ của máy tính. Đến năm
50 của thế kỉ này, các lý thuyết về dự báo cùng với các phương pháp luận
được xây dựng và phát triển có hệ thống.
Luận văn nghiên cứu một số mô hình dự báo dùng mô hình chuỗi thời
gian và xây dựng một ứng dụng minh hoạ bằng bài toán dự báo giá gạo.
Luận văn tập trung vào các vấn đề chính sau:
-Nghiên cứu các mô hình dự báo:
+ Mô hình dừng tuyến tính (AR, MA, ARMA)
+ Mô hình không dừng tuyến tính (ARIMA)
+ Mô hình mùa vụ (SARIMA)
-Xây dựng ứng dụng minh hoạ dự báo trên mô hình ARIMA: dự
báo giá gạo.


6

Chương 1: TỔNG QUAN VỀ CHUỖI THỜI GIAN
1.1 GIỚI THIỆU VỀ CHUỖI THỜI GIAN VÀ DỰ BÁO

Dự báo là một nhu cầu không thể thiếu cho những hoạt động của con
người trong bối cảnh bùng nổ thông tin. Dự báo sẽ cung cấp những cơ sở
cần thiết cho các hoạch định vĩ mô hoặc vi mô, và có thể nói rằng nếu không
có khoa học dự báo thì những dự định tương lai của con người vạch ra sẽ
không có sự thuyết phục đáng kể. Hiện nay, khoa học dự báo đang là môn
học của một số trường đại học trên thế giới và trở thành môt trong những
phần quan trọng ở các đơn vị kinh doanh cũng như các bộ phận hoạch định
chiến lược.
Trong công tác phân tích dự báo, vấn đề quan trọng hàng đầu cần đặt
ra là việc nắm bắt tối đa thông tin về lĩnh vực dự báo. Thông tin ở đây có thể
hiểu một các cụ thể gồm:
(1)

Các số liệu quá khứ của lĩnh vực dự báo.

(2)

Diễn biến tình hình hiện trạng cũng như động thái phát triển của

lĩnh vực dự báo.
(3)

Đánh giá một cách đầy đủ nhất các nhân tố ảnh hưởng cả về định

lượng lẫn định tính.
Căn cứ vào nội dung phương pháp và mục đích của dự báo, người ta
chia dự báo thành hai loại:


7


+ Phương pháp định tính
+ Phương pháp định lượng
Phương pháp định tính thường phụ thuộc rất nhiều vào kinh nghiệm
của một hay nhiều chuyên gia trong lĩnh vực liên quan. Phương pháp này
thường được áp dụng, kết quả dự báo sẽ được các chuyên gia trong lĩnh vực
liên quan nhận xét, đánh giá và đưa ra kết luận cuối cùng.
Phương pháp định lượng sử dụng những dữ liệu quá khứ theo thời
gian, dựa trên dữ liệu lịch sử để phát hiện chiều hướng vận động của đối
tượng phù hợp với mô hình toán học nào đó và đồng thời sử dụng mô
hình này để ước lượng. Tiếp cận định lượng dựa trên giả định rằng giá
trị tương lai của biến số dự báo sẽ phụ thuộc vào xu thế vận động của
đối tượng trong quá khứ. Phương pháp dự báo theo chuỗi thời gian là
một phương pháp định lượng.
Phương pháp chuỗi thời gian một chiều sẽ dựa trên việc phân tích
chuỗi quan sát của một biến duy nhất theo biến số độc lập là thời gian. Giả
định chủ yếu là biến số dự báo sẽ giữ nguyên chiều hướng phát triển đã xảy
ra trong quá khứ và hiện tại
Những dữ liệu quan sát liên tục cho một hiện tượng (vật lý, kinh tế ...)
trong một khoảng thời gian sẽ tạo nên một chuỗi thời gian. Ví dụ, doanh số
của công ty trong 20 năm gần đây, hoặc nhiệt độ ghi nhận tại một trạm quan
trắc khí tượng, hoặc công suất điện năng tiêu thụ trong một nhà máy, đó là
các ví dụ điển hình cho một chuỗi thời gian.


8

1.2 CÁC KHÁI NIỆM CƠ BẢN VỀ CHUỖI THỜI GIAN

1.2.1 Chuỗi thời gian


ƒ

Chuỗi thời gian là một tập các quan sát được đo theo thời gian.

ƒ

Phân loại chuỗi thời gian:

o Chuỗi rời rạc: Nếu tập quan sát là rời rạc.
o Chuỗi liên tục: Nếu tập quan sát là liên tục.
ƒ Có thể nói phần lớn dữ liệu phụ thuộc thời gian phản ánh các hoạt
động của đời sống kinh tế - xã hội thường được đo tại các mốc thời gian
cách đều nhau nên trong luận văn này chỉ quan tâm đến chuỗi thời gian rời
rạc, ở đó các quan sát được đo trong các khoảng thời gian như nhau với
phương pháp đo cố định.

ƒ Như vậy, về mặt toán học: chuỗi thời gian là một tập giá trị các
quan sát của biến ngẫu nhiên { zt } đo được trong các khoảng thời gian
như nhau (hàng năm, quý, tháng, tuần, ngày,…) và được xếp theo thứ tự
thời gian.
Ví dụ: - Chuỗi giá trị tổng sản phẩm quốc nội (GDP) được đo từng quý
- Chuỗi giá trị đo lượng mưa hàng năm
- Chuỗi giá trị chỉ số chứng khoán theo ngày
- Chuỗi giá trị đo chỉ số giá tiêu dùng của Việt Nam theo từng tháng
trong năm


9


1.2.2 Đặc điểm chuỗi thời gian
ƒ Tính thời đoạn: Tập dữ liệu được đo ở các thời điểm khác nhau.
Đơn vị phân tích là thời đoạn: hàng ngày, hàng tuần, hàng tháng, hàng
năm…
ƒ Tính mùa vụ: Thể hiện hành vi có tính chu kì của chuỗi thời gian
trên cơ sở năm lịch. Chuỗi thể hiện tính mùa vụ thông thường có xu hướng
được nhắc lại ở những khoảng thời gian theo mùa đều đặn. Những nhân tố
ảnh hưởng đến hiện tượng này như: thị hiếu khách hàng, mùa vụ, thời tiết…
Ví dụ: Chỉ số giá tiêu dùng của Việt Nam thường tăng cao vào những
tháng trước và trong Tết và giảm vào tháng ngay sau Tết. Vậy chỉ số giá tiêu
dùng có tính mùa vụ.
ƒ Tính dừng: Là chuỗi mà dữ liệu của nó được biến thiên quanh giá
trị trung bình hay ở một mức không đổi nào đó.
ƒ Tính xu thế: Tính xu thế thể hiện sự dịch chuyển dữ liệu hoặc,
tăng hoặc giảm của dữ liệu trong giai đoạn dài
ƒ Tính chu kì: Chuỗi dữ liệu thể hiện dưới dạng đồ thị hàm tuần
hoàn (chẳng hạn các hàm lượng giác: sin, cosin,…)
1.3

PHÂN TÍCH, DỰ BÁO CHUỖI THỜI GIAN
Các số liệu kinh tế - xã hội nói chung được thu thập, tính toán theo

những khoảng thời gian nhất định, chẳng hạn ở nước ta tổng sản phẩm quốc
nội (GDP) được thu thập theo quý, chỉ số giá tiêu dùng (CPI) được thu thập
theo tháng…


10

Nếu các số liệu kinh tế - xã hội được liên tục thu thập, tính toán trong

một khoảng thời gian nào đó, ta sẽ nhận được chuỗi số liệu và được gọi là
chuỗi thời gian. Trong trường hợp khoảng thời gian đó đủ dài thì có thể dựa
vào các số liệu quá khứ và hiện tại để dự báo khá chính xác giá trị số liệu ở
tương lai. Cách thức dự báo như vậy được gọi là phương pháp phân tích, dự
báo chuỗi thời gian.
Phương pháp phân tích, dự báo chuỗi thời gian, dựa trên giả định cơ
bản là sự biến động của các hiện tượng trong tương lai sẽ giống với sự biến
động của các hiện tượng trong quá khứ và hiện tại xét về mặt đặc điểm và
cường độ biến động. Nói một các khác, các yếu tố đã ảnh hưởng đến biến
động của các hiện tượng trong quá khứ sẽ tiếp tục tác động đến hiện tượng
theo xu hướng và cường độ giống hoặc gần giống trước. Vì vậy mục tiêu
chính của phân tích, dự báo chuỗi thời gian chỉ ra và tách biệt các yếu tố ảnh
hưởng đến đó. Điều này có ý nghĩa trong việc dự báo và nghiên cứu quy luật
biến động của hiện tượng.
Quá trình phân tích, dự báo chuỗi thời gian { zt } là để tìm ra các mô
hình, quy luật ẩn trong nó, được thực hiện trên các mẫu quan sát, gồm có
những bước sau:

Bước 1: Nhận dạng các thành phần ẩn tồn tại trong chuỗi thời gian
ƒ

Thành phần xu thế (Trend-T): Thể hiện chiều hướng biến

động tăng hoặc giảm của các hiện tượng nghiên cứu trong thời gian dài.


11

ƒ


Thành phần chu kì (Period-P): Thể hiện biến động của hiện

tượng được lặp lại với chu kì nhất định, thường kéo dài từ 2 đến 10 năm.
Đây là thành phần khó khi nhận dạng.
ƒ

Thành phần mùa vụ (Seasonal-S): Biểu diễn sự tăng hoặc

giảm mức độ của hiện tượng ở một số thời điểm (tháng, quý) nào đó và được
lặp đi lặp lại.
ƒ

Thành phần ngẫu nhiên (Irregular-I): Thể hiện những biến

động không có qui luật và hầu như không dự báo, quan sát được lên giá trị
của hiện tượng đang nghiên cứu.
Những thành phần này kết hợp với nhau trong chuỗi thời gian bằng
nhiều cách thức khác nhau, chẳng hạn chuỗi thời gian { zt } được mô tả là :
Z t = T x P x S x I : gọi là mô hình tích

Z t = T + P + S + I : gọi là mô hình tổng
Z t = T x P x S + I : gọi là mô hình hỗn hợp

Do vậy, để phân tích, nghiên cứu hành vi cũng như dự báo biến động
của chuỗi thời gian thì cần thiết phải ước lượng các thành phần nói trên
trong chuỗi thời gian và cách thức kết hợp chúng với nhau trong chuỗi.
Bước 2: Làm trơn số liệu.
Sau khi xác định các thành phần trên trong chuỗi thời gian, tiếp theo
phải tiến hành làm trơn dữ liệu. Cụ thể hơn là loại trừ được thành phần xu
thế và mùa vụ trong chuỗi thời gian. Chuỗi thu được sau cùng không còn

chứa các thành phần đó (chuỗi được làm trơn), khiến cho việc phân tích, dự
báo dễ dàng hơn.


12

Bước 3: Chọn lựa, ước lượng, đánh giá mô hình
Chọn lựa mô hình trong lớp mô hình phân tích, dự báo chuỗi thời
gian, sao cho mô hình được lựa chọn là “tốt nhất”, phải thoả mãn các tiêu
chí kiểm định, đánh giá. Mô hình được lựa chọn cũng phải đơn giản và có
thể hiểu được dễ dàng, sinh ra chuỗi “gần giống” với chuỗi quan sát thực.
Bước 4: Dự báo
Từ mô hình thực hiện dự báo giá trị tương lai cho chuỗi, phân tích sự
phù hợp của giá trị dự báo cả về mặt thực nghiệm và lý thuyết. Xác định độ
chênh giữa giá trị dự báo với giá trị quan sát thực và khoảng tin cậy của dự
báo (giới hạn mà giá trị quan sát thực sẽ nằm trong đó).
Ứng dụng mô hình dự báo trong thực tế
Ứng dụng mô hình để thực hiện các dự báo về các giá trị tương lai của
hiện tượng nghiên cứu, trên cơ sở đó để lập kế hoạch, đề ra các quyết định
trong sản xuất, kinh doanh hoặc đề ra chính sách. Đồng thời cung cấp thêm
các giá trị quan sát mới vào dữ liệu chuỗi quan sát nhằm mục đích hiệu
chỉnh lại mô hình để đưa ra dự báo tốt hơn.
Dự báo chuỗi thời gian
Là ước luợng các giá trị của biến ngẫu nhiên chuỗi thời gian
zt +h (h ≥ 1) tại thời điểm t, kí hiệu là zt (h) , dựa trên cơ sở các giá trị của biến

ngẫu nhiên { zt } được quan sát trong quá khứ đến thời điểm này.
Chất lượng dự báo phụ thuộc vào nhiều yếu tố chẳng hạn sự phức tạp
của chuỗi thời gian khi thực hiện phân tích, tác động của nhiều yếu tố bất
thường không thể lường trước được khi tiến hành dự báo, độ dài của khoảng

thời gian dự báo.


13

1.4 CÁC ĐẠI LƯỢNG ĐẶC TRƯNG CỦA CHUỖI THỜI GIAN
Giả sử có chuỗi thời gian có n quan sát { zt } , t = 1,2,….n…
Trong luận văn chỉ nghiên cứu chuỗi thời gian dừng, khi đó kì vọng,
phương sai không đổi theo thời gian và hiệp phương sai giữa hai quan sát bất
kì chỉ phụ thuộc vào khoảng cách (độ trễ về thời gian) giữa t và t-k, không
phụ thuộc vào thời điểm hiệp phương sai được tính. Tức là về mặt toán học
chuỗi thời gian zt được gọi là dừng nếu:
-Kì vọng:
E ( zt ) = µ =const ∀t

-Phương sai:
Var( zt ) = σ z2

∀t

-Hiệp phương sai:
γ z (k ) = cov( zt , zt − k ) = cov( zq , zq − k )∀t , q t ≠ q

1.4.1 Các đại lượng thống kê đặc trưng cho chuỗi
• Kì vọng: Đại diện cho giá trị trung bình của chuỗi
E ( zt ) = µ

Không mất tính tổng quát, trong luân văn luôn giả thiết:
E ( zt ) = µ = 0


Trong thực tế không thể nghiên cứu được toàn bộ tổng thể của hiện
tượng mà chỉ nghiên cứu được tập con của các phần tử của tổng thể gọi là


14

mẫu. Nói chung để nghiên cứu toàn bộ tổng thể, ta chỉ nghiên cứu một số
phần tử nào đó của tổng thể, tức là chỉ nghiên cứu mẫu thôi, từ đó suy đoán
về tổng thể.
Kì vọng mẫu được tính như sau
z=

1 n
∑ zt
n t =1

• Phương sai: Đại diện cho mức độ phân tán các giá trị của chuỗi xung
quanh kì vọng:
2
Var( zt ) = σ z2 = E ⎡( zt − µ ) ⎤



Phương sai mẫu được tính:

(

1 n
c0 = ∑ zt − z
n t =1


)

2

• Độ lệch chuẩn: Là căn bậc hai của phương sai
σ z = σ z2

1.4.2 Các đại lượng mô tả mối quan hệ giữa các phần từ trong chuỗi
• Hiệp phương sai: Sử dụng để đo mức độ tương quan của hai biến
ngẫu nhiên trong cùng một chuỗi thời gian. Nó phản ánh sự phụ thuộc hay
độc lập của các biến ngẫu nhiên trong chuỗi
Hiệp phương sai giữa hai biến ngẫu nhiên trên chuỗi thời gian tại thời
điểm t và tại thời điểm t+k, giữa chúng có k-1 quan sát được xác định như
sau:
γ z (k ) = cov ( zt , zt + k ) = E ⎡⎣( zt − µ )( zt + k − µ ) ⎤⎦

trong đó:


15

µ là kì vọng của zt

Hiệp phương sai khi k=0 chính là phương sai của zt :
γ z (0) = cov ( zt , zt ) = σ z2

Tương tự, hiệp phương sai mẫu được tính như sau:
ck =


1 n−k
∑ zt − z zt +k − z
n t =1

(

)(

)

với

k=1,2,…n-1

trong đó, z là kì vọng mẫu của zt
• Hàm tự tương quan ACF (AutoCorrelation Function)
Hàm tự tương quan đo lường độ phụ thuộc tuyến tính giữa các cặp
quan sát γ z (t ) và γ z (t + k ) , ứng với thời đoạn k= 1, 2, ….( k còn gọi là độ
trễ). Với mỗi độ trễ k, hàm tự tương quan tại độ trễ k được xác định qua
độ lệch giữa các biến ngẫu nhiên γ z (t ) , γ z (t + k ) so với giá trị trung bình
ρk =

cov [ zt , zt + k ]

σ z2

Tự tương quan mẫu được tính theo công thức
rk =

ck

c0

Một vài tính chất của hàm tự tương quan mẫu:
a) −1 ≤ rk ≤ 1
b) k = 0 => r0 = 1


16

c) rk = r− k
Nếu như zt và zt + k không tương quan với nhau thì tự tương quan ρk =0,
do khi đó cov ( zt , zt + k ) =0
Dựa trên mối quan hệ tự tương quan giữa các phần tử trong chuỗi,
người ta có thể xây dựng được mô hình dự báo chuỗi thời gian.
• Hàm tự tương quan riêng PACF (Partial AutoCorrelation
Function) : Song song với việc xác định hàm tương quan giữa các cặp zt
và zt + k , ta xác định hàm tự tương quan riêng. Hàm tự tương quan tại độ
trễ k kí hiệu là Ck k
zt + k = Ck1 zt + k −1 + Ck 2 zt + k − 2 + .... + Ck k −1 zt +1 + Ck k zt + et

Giải phương trình hồi quy dựa trên bình phương tối thiểu (ordinary
least square) vì hệ số hồi quy Ck j phải được tính ở mỗi độ trễ k, với j chạy
từ 1 đến k.
Giải pháp tối ưu hơn do Durbin phát triển. Dưới đây là phương pháp
Durbin sử dụng cho 3 độ trễ đầu tiên.
- Độ trễ 1: Khởi tạo, giá trị của hàm tự tương quan riêng tại độ
trễ 1 có cùng giá trị với hàm tự tương quan tại độ trễ 1 vì không
có các giá trị trung gian giữa các quan sát kế tiếp : C11 = r1
- Độ trễ 2: Hai giá trị C22 và C21 được tính dựa vào hàm tự tương
quan r1 và r2 , cùng với hàm tự tương quan riêng phần trước đó



17
C22 =

r2 − C11r1
1 − C11r1

C22 = C11 − C22C11

- Độ trễ 3: Tương tự, ba giá trị C33 , C32 và C31 được tính dựa
vào các hàm tự tương quan r1 , r2 , r3 cùng với các hệ số được
tính ở độ trễ thứ 2: C22 và C21
C33 =

r3 − C21r2 − C22 r1
1 − C22 r2 − C21r1

C32 = C21 − C33C22
C31 = C22 − C33C21

Tổng quát, hàm tự tương quan riêng phần được tính theo Durbin
k −1

Ckk =

rk − ∑ Ck −1, j rk − j
j =1
k −1


1 − ∑ Ck −1, j rj
j =1

1.5 MỘT SỐ MÔ HÌNH CHUỖI THỜI GIAN ĐƠN GIẢN
1.5.1 Quá trình nhiễu trắng
Chuỗi là nhiễu trắng nếu như nó không thể hiện một cấu trúc, hình
mẫu rõ rệt nào cũng như không có bất kì sự tự tương quan nào trong
chuỗi.


18

Về mặt toán học dãy các biến ngẫu nhiên {at } được gọi là chuỗi
nhiễu trắng nếu các at có phân phối giống nhau, độc lập và có các đại
lượng đặc trưng sau:
E (at ) = 0 ∀t
Var(at ) = σ a2 ∀t
⎧σ 2 , k = 0
γ k = cov(at , at + k ) = ⎨ a
⎩ 0, k ≠ 0

⎧1, k = 0
ρk = ⎨
⎩0, k ≠ 0

Trong thực tế, rất hiếm chuỗi thời gian là nhiễu trắng, nhưng quá
trình nhiễu trắng lại là công cụ cơ bản để tạo ra mô hình phức tạp.
1.5.2 Mô hình du động ngẫu nhiên
Mô hình du động ngẫu nhiên là mô hình mà giá trị được xác định
bằng giá trị của quan sát trước nó cộng thêm nhiễu trắng:

zt = zt −1 + at

(1)

trong đó t = 1, 2, … và at là nhiễu trắng
Đại lượng đặc trưng cho mô hình :
-Kì vọng: E ( zt ) = E ( zt −1 ) + E (at ) = E ( zt −1 ) =0
-Phương sai: Mô hình được viết truy hồi lại như sau:


19
zt = z0 + a1
z2 = z1 + a2 = z0 + a2 + a1


zt = z0 + a1 + a2 + ... + at
Var( zt ) = Var( z0 + a1 + a2 + ... + at ) = Var( z0 ) + Var(a1 ) + ... + Var(at )

Do z0 là hằng số nên Var( z0 ) =0, các at là nhiễu trắng, vì thế phương sai
của zt được tính là: Var( zt ) = tσ a2
-Hiệp phương sai: nhân hai vế của (1) với zt −1 , thực hiện lấy cov ta được:
cov( zt , zt −1 ) = cov( zt −1 , zt −1 ) + cov(at , zt −1 )
cov(at , zt −1 ) = 0 do at và zt −1 không tương quan nên:

cov( zt , zt −1 ) = cov( zt −1 , zt −1 ) + 0 = (t − 1)σ a2

Tương tự như vậy cuối cùng thu được cov( zt , zt −k ) = (t − k )σ a2 .
-Tự tương quan: ρk =

cov( zt , zt − k ) (t − k )σ a2 t − k

=
=
.
Var( zt )
tσ a2
t

1.5.3 Mô hình du động ngẫu nhiên có nhiễu
Mô hình du động ngẫu nhiên có nhiễu là mô hình du động cộng
thêm một hằng số α :
zt = α + zt −1 + at


20

1.6 TOÁN TỬ LÙI VÀ CHUỖI THỜI GIAN DỪNG
1.5.1 Toán tử lùi
Giả sử có chuỗi các quan sát { zt } , t=1,2,…n
Toán tử lùi, kí hiệu là B, là một toán tử thao tác trên chuỗi thời gian
với tính chất là làm dịch chuyển quan sát tại thời gian t sang quan sát
tại thời gian (t-1)
Bzt = zt −1

Toán tử lùi có các tính chất điển hình sau:
B k zt = zt − k
B 0 zt = zt

Toán tử tiến F
Fzt = zt +1
F m zt = zt + m


1.6.2 Toán tử sai phân
Toán tử sau phân thường được sử dụng để biến đổi chuỗi thời gian
không có tính mùa vụ không dừng thành chuỗi có tính dừng được cải
tiến và được định nghĩa như sau:


×