Tải bản đầy đủ (.pdf) (72 trang)

Mô hình hàm chuyển và ứng dụng xây dựng mô hình dự báo với việc sử dụng chỉ số dẫn báo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.47 MB, 72 trang )


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ






PHẠM TRUNG THÀNH




MÔ HÌNH HÀM CHUYỂN VÀ ỨNG DỤNG XÂY DỰNG MÔ
HÌNH DỰ BÁO VỚI VIỆC SỬ DỤNG CHỈ SỐ DẪN BÁO






LUẬN VĂN THẠC SĨ









HÀ NỘI - 2011

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ





PHẠM TRUNG THÀNH




MÔ HÌNH HÀM CHUYỂN VÀ ỨNG DỤNG XÂY DỰNG
MÔ DỰ BÁO VỚI VIỆC SỬ DỤNG CHỈ SỐ DẪN BÁO


Ngành : Công nghệ thông tin
Chuyên ngành: Hệ thống thông tin
Mã số: 60 48 05





LUẬN VĂN THẠC SĨ




Người hướng dẫn khoa học
PGS. TS. ĐỖ VĂN THÀNH









HÀ NỘI – 2011

Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
1
MỤC LỤC
Danh sách hình 3
Danh sách bảng 4
Chƣơng 1 TỔNG QUAN VỀ CHUỖI THỜI GIAN VÀ CÁC MÔ HÌNH DỰ
BÁO CHUỖI THỜI GIAN 8
1. 1 CHUỖI THỜI GIAN VÀ PHÂN TÍCH, DỰ BÁO CHUỖI THỜI GIAN 8
1.1.1 Chuỗi thời gian 8
1.1.2 Các đại lƣợng đặc trƣng của chuỗi thời gian 9
1.1.3 Toán tử trễ và toán tử sai phân 13
1.1.4 Chuỗi thời gian dừng 13
1.1.5 Phân tích, dự báo chuỗi thời gian 16
1.2 MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN ĐƠN BIẾN 19
1.2.1 Mô hình tích hợp trung bình trƣợt tự hồi quy ARMA(p,q). 20
1.2.2 Mô hình làm trơn hàm mũ chuỗi thời gian 20

1.2.3 Mô hình phƣơng sai thay đổi điều kiện tự hồi quy 21
1.3 MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN ĐA BIẾN 22
1.3.1 Mô hình hàm chuyển 22
1.3.2 Mô hình tự hồi quy véc tơ VAR 22
1.3.3 Mô hình điều chỉnh sai số dạng véc tơ VARX 24
1.4 MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN PHI TUYẾN 24
KẾT LUẬN CHƢƠNG 25
Chƣơng 2 CÁC MÔ HÌNH HÀM CHUYỂN 26
2.1 CÁC MÔ HÌNH HÀM CHUYỂN TUYẾN TÍNH RỜI RẠC 27
2.1.1 Những mô hình hàm chuyển tuyến tính rời rạc 27
2.1.2 Mô hình hàm chuyển rời rạc đƣợc biểu diễn bằng sai phân 29
2.1.3 Những mô hình hàm chuyển rời rạc có nhiễu 31
2.2 XÁC ĐỊNH MÔ HÌNH: NHẬN DẠNG, ƢỚC LƢỢNG VÀ KIỂM TRA MÔ HÌNH
HÀM CHUYỂN 31
2.2.1 Hàm tự tƣơng quan chéo 32
2.2.2 Xác định mô hình hàm chuyển 34
2.2.3 Hiệu chỉnh và kiểm tra mô hình hàm chuyển 43
KẾT LUẬN CHƢƠNG 45
Chƣơng 3 ỨNG DỤNG MÔ HÌNH HÀM CHUYỂN TRONG DỰ BÁO CHỈ
SỐ KINH TẾ VĨ MÔ VIỆT NAM BẰNG CHỈ SỐ DẪN BÁO 46
3.1 CHỈ SỐ DẪN BÁO 46
3.2 DỰ BÁO VỚI MÔ HÌNH HÀM CHUYỂN BẰNG CÁC CHỈ SỐ DẪN BÁO 47
3.2.1 Dự báo sai số bình phƣơng trung bình tối thiểu 47
Tính toán dự báo Giờ, ta viết (3.1) dƣới dạng: 48
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
2
3.3 DỰ BÁO CHỈ TIÊU KINH TẾ VĨ MÔ Ở VIỆT NAM BẰNG VIỆC ỨNG DỤNG
MÔ HÌNH HÀM CHUYỂN 49
3.3.1 Các chỉ tiêu kinh tế vĩ mô 49

3.3.2 Xây dựng và sử dụng mô hình hàm chuyển để dự báo cho chỉ tiêu kinh tế vĩ mô 50
KẾT LUẬN CHƢƠNG 62
KẾT LUẬN ĐỀ TÀI 69
TÀI LIỆU THAM KHẢO 70
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
3

Danh sách hình

Hình 1 Các dạng hàm chuyển với r <= 2, s <= 2, b = 3 39
Hình 2: Biểu đồ hai chuỗi GDP và CNXD 52
Hình 3: Biểu đồ và hàm tự tƣơng quan và tự tƣơng quan từng phần của x
t
53
Hình 4: Biểu đồ và hàm tự tƣơng quan và tự tƣơng quan từng phần của y
t
53
Hình 5: Biễu diễn chuỗi x
t
theo mô hình ARIMA 54
Hình 6: Hàm ACF, PACF của phần dƣ có dạng nhiễu trắng của chuỗi x
t
54
Hình 7: Hàm tự tƣơng quan chéo
()rk

và giá trị ƣớc lƣợng các phản ứng xung v
j
55

Hình 8: Biểu đồ và hàm tự tƣơng quan và tự tƣơng quan từng phần của chuỗi PDU 56
Hình 9: Xác định mô hình nhiễu 57
Hình 10: Kiểm tra tƣơng quan phần dƣ của nhiễu 57
Hình 11 Kết quả bởi phƣơng pháp bình phƣơng tối thiểu 60




Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
4
Danh sách bảng

Bảng 1: Bộ dữ liệu thử nghiệm của hai chuỗi GDP và Công nghiệp xây dựng 52
Bảng 2 : Kết quả dự báo của mô hình hàm chuyển 62
Bảng 3: Kết quả dự báo của mô hình ARIMA cho chuỗi Công nghiệp xây dựng Y
t
65
Bảng 4: Bộ dự liệu cho GDP, Bản lẻ tiêu dùng, nhập khẩu, xuất khẩu 66
Dƣới đây là một số mô hình tìm đƣợc: 67


Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
5
GIỚI THIỆU ĐỀ TÀI

Dự báo có vai trò quan trọng trong việc lập kế hoạch phát triển kinh tế-xã
hội. Tuy nhiên, dự báo là công việc khó và ở nƣớc ta còn là công việc khá mới
mẻ so với nhiều quốc gia phát triển, thậm chí so với ngay cả các nƣớc trong khu

vực. Vì vậy đề tài là một nỗ lực nhằm hƣởng ứng và góp phần vào việc thúc đẩy
và triển khai các hoạt động nghiên cứu và ứng dụng về dự báo.
Có nhiều hƣớng tiếp cận cũng nhƣ phƣơng pháp xây dựng các mô hình dự
báo khác nhau tùy thuộc vào chủ thể nghiên cứu, đối tƣợng nghiên cứu, yêu cầu
của việc nghiên cứu…Trong khuôn khổ đề tài, đối tƣợng nghiên cứu là chuỗi
thời gian thể hiện một giá trị định lƣợng nào đó ở những thời điểm khác nhau,
theo trật tự thời gian về một sự vật, hiện tƣợng hoặc quá trình nhất định. Mục
đích, yêu cầu và cũng là nhu cầu của việc dự báo là trên cơ sở các giá trị hiện tại
và quá khứ của các chuỗi thời gian, ta có thể dự báo đƣợc giá trị tƣơng lai của
một chuỗi nào đó với độ chính xác chấp nhận đƣợc.
Do đối tƣợng nghiên cứu là chuỗi thời gian, mà về mặt toán học là một quá
trình ngẫu nhiên, nên việc xây dựng, kiểm định mô hình và tiến hành dự báo chủ
yếu dựa trên nền tảng toán học xác xuất thống kê. Nói cách khác khi ta nghiên
cứu về chuỗi thời gian, về các tính chất, thuộc tính, qui luật của nó để xây dựng
nên các mô hình dự báo thì về cơ bản là ta làm việc với các giá trị, các đặc trƣng
thống kê của chuỗi. Từ đó, có thể thấy ngay rằng việc xây dựng, kiểm định mô
hình hay dự báo từ mô hình luôn gắn liền với sai số, với sự điều chỉnh không
ngừng để có đƣợc một kết quả ngày càng hợp lý theo thời gian.
Rõ ràng, ngay cả khi xác định đối tƣợng nghiên cứu là chuỗi thời gian, thì
việc tiếp cận và xác định mô hình dự báo cũng vô cùng đa dạng. Chúng ta có thể
phân chia các mô hình dự báo chuỗi thời gian thành mô hình dự báo tuyến tính
và phi tuyến, mô hình dự báo đơn biến và đa biến, hoặc theo tiêu chí thời hạn dự
báo thì có mô hình dự báo ngắn hạn, trung hạn và dài hạn. Mỗi mô hình có các
ƣu, nhƣợc điểm khác nhau và đƣợc áp dụng cho các đối tƣợng có đặc thù và các
bài toán khác nhau. Do đó, không có mô hình nào là tuyệt đối vƣợt trội hoặc là
chìa khóa vạn năng áp dụng cho mọi dạng chuỗi thời gian.
Mô hình mà đề tài nghiên cứu là mô hình hàm chuyển, một mô hình dự báo
đa biến và áp dụng chủ yếu cho việc dự báo ngắn hạn hoặc trung hạn. Mô hình
áp dụng tốt nhất cho các chuỗi, các quá trình có “tính dừng”. Tính đa biến cho
Luận văn cao học - Chuyên ngành: Hệ thống thông tin

Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
6
phép mô hình có khả năng dự báo giá trị tƣơng lai của một chuỗi thông qua giá
trị hiện tại và quá khứ của chính nó và của các chuỗi thời gian khác. Điều đó rất
có giá trị bởi mô hình hàm chuyển biểu diễn đƣợc mối quan hệ tƣơng quan giữa
các chuỗi thời gian khác nhau, và do đó cũng chính là mối quan hệ giữa các sự
vật, hiện tƣợng và quá trình khác nhau. Đây là ƣu điểm vƣợt trội của mô hình
hàm chuyển so với các mô hình dự báo đơn biến - các mô hình chỉ thể hiện đƣợc
sự tƣơng quan giữa các giá trị của cùng một chuỗi, tức mối quan hệ nội tại theo
thời gian của cùng một đối tƣợng, mà không chỉ ra đƣợc sự phụ thuộc của các
đối tƣợng khác nhau - một việc rất cần thiết trong phân tích tình hình kinh tế, xã
hội. Chính vì vậy, mô hình hàm chuyển hiện đang đƣợc coi là trung tâm của các
ứng dụng dự báo về kinh tế, xã hội và cả tự nhiên.
Về bố cục nội dung, luận văn bao gồm phần giới thiệu đề tài, ba chƣơng
chính và phần kết luận đề tài, trong đó:
Chƣơng 1: Trình bày một cách tổng quan về chuỗi thời gian và việc phân
tích, dự báo cho chuỗi thời gian. Qua đó chúng ta có thể hình dung đƣợc một
cách khái quát về chuỗi thời gian - đối tƣợng dữ liệu của dự báo, với các nội
dung cơ bản nhất; đồng thời cũng hiểu sơ bộ về vai trò của công tác dự báo, một
số loại dự báo, một số phƣơng pháp dự báo thƣờng đƣợc sử dụng trong lập kế
hoạch phát triển kinh tế - xã hội.
Chƣơng 2: Là nội dung quan trọng, trình bày nền tảng lý thuyết về mô hình
cũng nhƣ qui trình xây dựng mô hình hàm chuyển. Cụ thể, trong chƣơng này
luận văn sẽ trình bày chi tiết về khái niệm, các bƣớc trong quá trình xác định và
kiểm tra mô hình hàm chuyển; và trong từng bƣớc sẽ chỉ ra các phƣơng pháp,
các thủ tục đƣợc sử dụng để giải quyết các mục tiêu của bƣớc đó. Kết thúc
Chƣơng 2 ta có thể nhận dạng và xây dựng đƣợc các mô hình hàm chuyển rời
rạc cho các chuỗi thời gian và các mô hình này là cơ sở cho việc dự báo đƣợc
trình bày trong Chƣơng 3.
Chƣơng 3: Tập trung trình bày về việc dự báo sử dụng mô hình hàm chuyển

đã đƣợc xây dựng theo qui trình và thủ tục ở Chƣơng 2. Đồng thời cũng trong
chƣơng Ba luận văn sẽ trình bày việc xây dƣng một mô hình hàm chuyển thử
nghiệm cho các chỉ tiêu kinh tế Việt Nam. Đây là một nội dung có tính thực tiễn,
qua đó chúng ta có thể hiểu một cách rõ ràng hơn toàn bộ các vấn đề lý thuyết
đƣợc trình bày ở các chƣơng trƣớc.
Với các nội dung trên, luận văn đã bám sát giải quyết các mục tiêu và các
yêu cầu đề ra. Tuy nhiên mô hình hàm chuyển là một nội dung tƣơng đối mới,
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
7
còn ít đƣợc nghiên cứu tại Việt Nam, do dó việc nghiên cứu phát triển mô hình,
khai thác mô hình trong thực tiễn và kết hợp với các mô hình dự báo khác để có
một mô hình dự báo kết hợp hiệu quả là một vấn đề, cũng là một nhu cầu thực
sự cần thiết . Đây cũng chính là hƣớng phát triển
tƣơng lai.
Equation Chapter 1 Section 1





























Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
8
Chƣơng 1
TỔNG QUAN VỀ CHUỖI THỜI GIAN
VÀ CÁC MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN

Chuỗi thời gian là một khái niệm chỉ một tập quan sát đƣợc đo đạc theo trình
tự thời gian về một thuộc tính, một tính chất hoặc một khía cạnh nào đó của một
(hoặc một vài) sự vật, hiện tƣợng hay quá trình nhất định. Chuỗi thời gian là đối
tƣợng dữ liệu để xây dựng mô hình dự báo chuỗi thời gian. Nó có những thành
phần, những tính chất cơ bản và đặc biệt là các đặc trưng thống kê làm cơ sở để
chúng ta phân tích và dự báo về chuỗi. Trong đó, cần lƣu ý ngay từ đầu rằng tính
dừng của chuỗi là một tiền đề rất quan trọng để xây dựng mô hình dự báo hiệu
quả và chính xác. Do đó một điều kiện cần thiết là biến đổi đƣợc một chuỗi
không dừng thành chuỗi có tính dừng trƣớc khi thực hiện xây dựng mô hình.

Có nhiều mô hình phân tích và dự báo khác nhau cho chuỗi thời gian, tùy
theo từng tiêu chí phân loại. Có thể kể đến các mô hình đơn biến hay đa biến,
các mô hình tuyến tính hoặc phi tuyến, mô hình dự báo ngắn hạn, dài hạn hay
trung hạn. Mỗi mô hình có các ƣu và nhƣợc điểm khác nhau, phù hợp với từng
mục tiêu dự báo, tính chất và yêu cầu dự báo khác nhau. Mô hình mà đề tài
nghiên cứu là mô hình hàm chuyển, một mô hình đƣợc coi là hữu hiệu và cho
kết quả dự báo tƣơng đối chính xác. Tất cả những vấn đề trên sẽ đƣợc trình bày
một cách khái quát trong các nội dung dƣới đây.

1. 1 CHUỖI THỜI GIAN VÀ PHÂN TÍCH, DỰ BÁO CHUỖI THỜI GIAN
1.1.1 Chuỗi thời gian
Chuỗi thời gian là một tập các quan sát đƣợc đo tuần tự theo thời gian. Nếu
tập là liên tục, chuỗi thời gian đƣợc gọi là chuỗi liên tục, ngƣợc lại đƣợc gọi là
chuỗi rời rạc. Có thể nói phần lớn dữ liệu phụ thuộc thời gian phản ánh các hoạt
động của đời sống kinh tế - xã hội thƣờng đƣợc đo tại các mốc thời gian cách
đều nhau, nên trong khuôn khổ đề tài chúng ta chỉ quan tâm đến các chuỗi thời
gian rời rạc, mà ở đó các quan sát đƣợc đƣợc đo tại các thời điểm cách đều
nhau, với hoạt động và phƣơng pháp đo cố định. Các quan sát của một chuỗi
thời gian rời rạc thực hiện tại các thời điểm cách đều nhau
, , ,
1 2 N
t t t
ta kí hiệu là
, , ,
1 2 N
z z z
. Về mặt toán học, chuỗi thời gian rời rạc là một tập giá trị các quan
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
9

sát của biến ngẫu nhiên {z
t
} đo đƣợc trong các khoảng thời gian t nhƣ nhau và
đƣợc xếp theo thứ tự thời gian.
Các tính chất của chuỗi thời gian:
Tính thời đoạn: Tập quan sát của chuỗi thời gian đƣợc đo ở các các điểm
thời gian khác nhau, do đó đơn vị phân tích là thời đoạn: hàng ngày, hàng
tuần, hàng tháng, hàng năm… .
Tính mùa vụ: Chuỗi thể hiện tính mùa vụ thông thƣờng có xu hƣớng
đƣợc nhắc lại ở những khoảng thời gian theo mùa đều đặn.
Tính dừng: Chuỗi mà các quan sát của nó đƣợc biến thiên quanh giá trị trung
bình hay ở một mức không đổi nào đó.
Tính xu thế: Tính xu thế thể hiện sự dịch chuyển dữ liệu hoặc chiều tăng
hoặc giảm của dữ liệu trong dài hạn.
Tính chu kỳ: Chuỗi quan sát của chuỗi thời gian thể hiện dƣới dạng đồ
thị hàm tuần hoàn (chẳng hạn các hàm lƣợng giác: sin, cosin, )
1.1.2 Các đại lƣợng đặc trƣng của chuỗi thời gian
Khi nghiên cứu chuỗi thời gian, ta không xem xét từng phần tử của chuỗi
một cách độc lập, mà xem xét các phần tử của chuỗi trong mối quan hệ tƣơng
quan với nhau, nhằm tìm ra qui luật biểu diễn mối liên hệ của chúng theo thời
gian. Vì vậy, đƣơng nhiên cách tiếp cận của chúng ta là thông qua các đặc trƣng
thống kê của chuỗi, các giá trị định lƣợng có tính ổn định, đại diện cho chuỗi.
Dƣới đây là một số đại lƣợng đặc trƣng của chuỗi thời gian mà ta cần xem xét,
với chú ý rằng các đặc trƣng này, xét tới cùng khi đƣợc tính toán trong thực tế,
chính là các đại lƣợng đƣợc triết xuất từ các mẫu của chuỗi mà thôi.
Giả sử có chuỗi thời gian với n các quan sát {z
t
}, t = 1,2,…n.
Kỳ vọng Đại diện cho giá trị trung bình của chuỗi. Ký hiệu là:
)z(E

t

Trong thực tế không thể nghiên cứu đƣợc toàn bộ tổng thể của hiện tƣợng
mà chỉ nghiên cứu đƣợc tập con các phần tử của tổng thể gọi là mẫu. Lý do là,
thu thập thông tin về toàn bộ tổng thể sẽ đòi hỏi cần nhiều thời gian và chi phí.
Vì thế ta chỉ nghiên cứu một số phần tử nào đó của tổng thể tức là chỉ nghiên
cứu các mẫu, từ đó suy đoán về tổng thể. Các phần tử đƣợc chọn để nghiên cứu
tổng thể đƣợc gọi là mẫu ngẫu nhiên. Nên kỳ vọng tổng thể đƣợc tính dựa trên
mẫu các quan sát gọi là kỳ vọng mẫu, và đƣợc tính nhƣ sau:

(1.1)
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
10



n
t
t1
1
zz
n

Phƣơng sai Đại diện cho mức độ phân tán các giá trị của chuỗi xung quanh
kỳ vọng:
])z[(E)zvar(
2
t
2

zt


Tƣơng tự, phƣơng sai mẫu đƣợc tính:
ˆ
()



n
22
zt
t1
1
zz
n


Độ lệch chuẩn Là căn bậc hai của phƣơng sai mẫu:
ˆˆ

2
z



Dƣới đây là một số đại lƣợng mô tả mối quan hệ (ta gọi là sự tƣơng quan)
giữa các phần tử trong chuỗi:
Hiệp phƣơng sai Sử dụng để đo mức độ tƣơng quan tuyến tính của hai biến
ngẫu nhiên trong cùng một chuỗi thời gian. Nó phản ánh sự phụ thuộc hay độc

lập của các biến ngẫu nhiên trong chuỗi. Hiệp phƣơng sai giữa hai biến ngẫu
nhiên trên chuỗi thời gian nhƣ nhau tại thời điểm t, ký hiệu là z
t
và tại thời điểm
t + k, ký hiệu là z
t + k
, và giữa chúng có k - 1 quan sát gọi là độ trễ k, đƣợc xác
định nhƣ sau:
   
( ) cov , ( )( )

   
z t t k t t k
k z z E z z
  

trong đó,

là kỳ vọng của z
t
và z
t + k
. Hiệp phƣơng sai khi độ trễ k = 0 chính là
phƣơng sai của z
t
:
 
( ) cov ,
2
z t t z

0 z z

.
Tƣơng tự, hiệp phƣơng sai mẫu đƣợc tính nhƣ sau:
ˆ
( ) ( )( )



  

nk
z t t k
t1
1
k z z z z
n

k = 1, 2 n-1
trong đó,
z
là kỳ vọng mẫu của z
t
và z
t + k
.
Hàm tự tƣơng quan (ACF) Đại lƣợng mô tả tƣơng quan tại trễ k giữa các
giá trị trong chuỗi thời gian, đƣợc xác định:
 
   

2
kt
2
t
ktt
zz
z
zz
ktt
k
)z(E)z(E
)z)(z(E
)k(
)z,zcov(
kttktt












(1.2)
(1.3)
(1.4)

(1.5)
(1.6)
(1.7)
(1.8)
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
11
trong đó,
()
z
k

là tự hiệp phƣơng sai,
,

t
tk
zz


lần lƣợt là độ lệch chuẩn của z
t

z
t + k
. Khi chuỗi thời gian là dừng (định nghĩa ở dƣới) thì z
t
và z
t+k
đều có phƣơng

sai nhƣ nhau là
()
2
zz
0

, nên tự tƣơng quan tại trễ k đƣợc tính:
()
()

z
k
z
k
0




Tự tƣơng quan đƣợc xem là một hàm với tham số biến thiên theo trễ k
(k=1,2…) và đƣợc gọi là hàm tự tƣơng quan.
Tự tƣơng quan mẫu đƣợc tính theo công thức:
ˆ
()
ˆ
ˆ
()

z
k

z
k
0




Một vài tính chất của tự tƣơng quan mẫu:
- Tính chất 1:
ˆ
  
k
1 1


- Tính chất 2:
ˆ
  
0
k 0 1


- Tính chất 3:
ˆˆ


kk


Nếu nhƣ z

t
và z
t + k
không tƣơng quan với nhau thì tự tƣơng quan
ˆ

k
0

, do
khi đó cov(z
t
, z
t + k
) = 0, nhƣng điều ngƣợc lại chƣa chắc đã đúng.
Dựa trên mối quan hệ tự tƣơng quan giữa các phần tử trong chuỗi, ngƣời ta
có thể xây dựng đƣợc mô hình dự báo chuỗi thời gian.
Hàm tự tƣơng quan từng phần (PACF) Tự tƣơng quan mẫu
ˆ
k

phản ánh
mức độ tƣơng quan giữa hai biến ngẫu nhiên z
t
và z
t + k
trong chuỗi thời gian.
Tuy nhiên, sự tƣơng quan giữa chúng có thể chịu sự tác động của các biến khác,
trong trƣờng hợp này là k - 1 biến trung gian z
t + 1

, z
t + 2
… z
t + k - 1
ảnh hƣởng đến
sự tƣơng quan giữa biến z
t
và z
t+k
. Do đó hàm tự tƣơng quan từng phần đƣợc
đƣa vào nhằm mục đích mô tả mức độ tƣơng quan trực tiếp giữa hai biến z
t
và z
t
+ k
(không bị ảnh hƣởng ràng buộc bởi mối quan hệ với các biến trung gian),
đƣợc tính theo công thức:
,,
, , ,
  
   
kj k 1 j kk k 1 k j
j 1 2 k 1
   














1
1
,1
1
1
,1
1
k
j
jjk
k
j
jkjkk
kk



, độ trễ k = 1,2,3
Tự tƣơng quan từng phần đƣợc khảo sát nhƣ là một hàm với tham số biến thiên
theo độ trễ k và đƣợc gọi là hàm tự tƣơng quan từng phần. Tự tƣơng quan từng
(1.9)
(1.10)
(1.11)

Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
12
phần cũng đƣợc hiểu theo quan điểm của bài toán dự báo đó là giả định muốn dự
báo giá trị của z
t+h
từ các giá trị z
t+h-1
, z
t
, dựa trên hàm tuyến tính để kết hợp các
giá trị quá khứ này. Khi đó ngƣời ta sử dụng phƣơng pháp tối thiểu sai số bình
phƣơng trung bình (Mean Square Error- MSE)
[( ) ]
  



h
2
t h k t h k
k1
MSE E z a z

trên các giá trị có thể của trọng số a
1
, ,a
h
. Nếu xem xét kết quả này tại một trễ
cụ thể h thì khi đó tự tƣơng quan từng phần PACF đƣợc định nghĩa nhƣ là giá trị

của hệ số a
h
:
hhh
a

Hệ số R
2
Đƣợc sử dụng để đo mức độ phù hợp của hàm hồi qui.
Giả sử cho mô hình hồi qui chuỗi thời gian
  
12t t t
y z a

, với
t
y
gọi là
biến phụ thuộc (biến đƣợc giải thích),
t
z
là biến độc lập,
1

là hệ số chặn,
2

là hệ
số góc, a
t

là nhiễu (phần không giải thích đƣợc). Hệ số R
2
đƣợc tính:
( ( )( ))
( ) ( )







n
2
ii
2
i1
nn
22
ii
i 1 i 1
z z y y
R
z z y y

trong đó, n là số các quan sát,
z
là kỳ vọng mẫu của biến độc lập z
t
,

y
là kỳ vọng
mẫu của biến phụ thuộc y
t
. Dễ dàng thấy

2
0 R 1
nếu R
2
tiến đến 1 thì mô
hình hồi qui đƣợc lựa chọn là hợp lý tức là sự thay đổi giá trị của biến phụ thuộc
đƣợc giải thích bằng mô hình, ngƣợc lại nếu R
2
tiến về 0 thì mô hình đƣợc lựa
chọn là không hợp lý hay mô hình không thể giải thích đƣợc sự biến đổi của
biến phụ thuộc.
Hệ số điều chỉnh
2
R
Đôi khi hệ số R
2
không phản ánh trung thực mức độ
phù hợp của mô hình, chẳng hạn khi thêm các tham biến đƣợc cho là không hợp
lý vào mô hình thì R
2
không những không giảm mà ngƣợc lại còn tăng lên. Vì
thế hệ số điều chỉnh
2
R

đƣợc đƣa ra để thẩm định rõ sự phù hợp của mô hình.
()

  

22
n1
R 1 1 R
nk

trong đó, n là số các quan sát của chuỗi thời gian, k là số các tham biến trong mô
hình.
2
R
luôn nhỏ hơn R
2
, và giảm nếu bổ sung thêm biến hồi qui không hợp lý
vào mô hình.
2
R
càng gần 1 thì mức độ phù hợp của mô hình càng cao.
(1.12)
(1.13)
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
13
1.1.3 Toán tử trễ và toán tử sai phân
Toán tử trễ và toán tử sai phân là hai toán tử thƣờng đƣợc dùng để biểu diễn
trong các mô hình dự báo chuỗi thời gian. Ta có thể hiểu sơ bộ hai toán tử này
nhƣ sau:

Toán tử trễ Giả sử có chuỗi các quan sát {z
t
}, t = 1, 2, n. Toán tử trễ, ký
hiệu B, là một toán tử thao tác trên chuỗi thời gian với tính chất là làm dịch
chuyển quan sát tại thời gian t sang quan sát tại thời gian (t – 1):


t t 1
Bz z

Toán tử trễ có các tính chất điển hình sau:
- B
k
z
t
= z
t-k

- B
0
z
t
= z
t

Toán tử sai phân Toán tử sai phân thƣờng đƣợc sử dụng để biến đổi
chuỗi thời gian không có tính mùa vụ không dừng thành chuỗi dừng và đƣợc
định nghĩa nhƣ sau:
- Sai phân bậc 1:
()


   
tt
t1
z z 1 B z


- Sai phân bậc 2:
()

   
2
t t t
t 1 t 2
z z z 2z z
  
= (1-B)
2
z
t

- Sai phân bậc d:
()


d d 1
tt
zz
  
= (1-B)

d
z
t

Toán tử sai phân theo mùa vụ đƣợc sử dụng để khử tính không dừng theo mùa
vụ trong quá trình biến đổi chuỗi thời gian có tính mùa vụ không dừng thành
thành chuỗi không có tính mùa vụ và dừng, nó đƣợc định nghĩa nhƣ sau:
- Sai phân theo trễ mùa vụ bậc 1:
()

   
s
s t t t s t
z z z 1 B z


- Sai phân theo trễ mùa vụ bậc D:
()
D s D
tt
S
z 1 B z


Ở đây s là khoảng thời gian của một chu kỳ mùa vụ (sẽ đƣợc giải thích rõ hơn ở
phần dƣới).
1.1.4 Chuỗi thời gian dừng
Trƣớc khi phân tích, mô hình hóa chuỗi thời gian cũng nhƣ đƣa ra dự báo,
đối với nhiều mô hình một điều kiện cần đƣợc thỏa mãn là chuỗi thời gian phải
là chuỗi dừng. Bởi vì với chuỗi dừng thì các đại lƣợng đặc trƣng chẳng hạn

phƣơng sai, kỳ vọng của nó mới có nghĩa đồng thời chỉ khi xây dựng mô hình
với chuỗi thời gian dừng thì dự báo đƣa ra mới đáng tin cậy. Do đó ta cần sử
dụng các phƣơng pháp để nhận biết đƣợc một chuỗi có dừng hay không, và nếu
(1.14)
(1.15)
(1.17)
(1.16)
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
14
chuỗi không dừng thì phải có cách thức nào để biến đổi chuỗi không dừng thành
dừng.
Chuỗi thời gian dừng z
t
(t = 1, 2 n) đƣợc gọi là chuỗi dừng nếu kỳ vọng,
phƣơng sai không đổi theo thời gian và hiệp phƣơng sai giữa hai quan sát bất kỳ
chỉ phụ thuộc vào khoảng cách (độ trễ về thời gian) giữa t và t-k, không phụ
thuộc vào thời điểm hiệp phƣơng sai đƣợc tính, tức là về mặt toán học chuỗi thời
gian z
t
đƣợc gọi là dừng nếu :
- - Kỳ vọng:
()  
t
E z const t


- - Phƣơng sai:
var( ) 
2

tz
z t


- Tự hiệp phƣơng sai:
( ) cov( , ) cov( , )

   
z t t k q q k
k z z z z t,q|t q


Chuỗi nhiễu trắng Một chuỗi đƣợc gọi là nhiễu trắng nếu nó hầu nhƣ
không thể hiện một cấu trúc, hình mẫu rõ rệt nào cũng nhƣ không có bất kỳ sự
tự tƣơng quan nào trong chuỗi. Về mặt toán học dãy các biến ngẫu nhiên {a
t
}
đƣợc gọi là chuỗi nhiễu trắng nếu các a
t
có phân phối giống nhau, độc lập và có
các đại lƣợng đặc trƣng nhƣ sau:
















0 ,0
0 ,1

0 ,0
0 ,
),cov(
,)var(
,0)(
2
2
k
k
k
k
aa
ta
taE
k
a
kttk
at
t






Nhiễu trắng a
t
đƣợc ký hiệu
~ ( , )
2
ta
a WN 0

. Trong thực tế, rất hiếm chuỗi
thời gian là nhiễu trắng, nhƣng quá trình nhiễu trắng lại là công cụ cơ bản để tạo
ra mô hình phức tạp.
Các phƣơng pháp kiểm định chuỗi thời gian dừng Có một số phƣơng
pháp hay đƣợc dùng để kiểm định một chuỗi thời gian có dừng hay không, trong
đó phƣơng pháp kiểm định dựa trên tƣơng quan đồ của hàm tự tƣơng quan ACF
là phƣơng pháp đƣợc ƣu tiên sử dụng trong đề tài. Bên cạnh đó, ta có thể kiểm
tra tính dừng bằng phƣơng pháp kiểm định nghiệm đơn vị DF: nếu có tồn tại
nghiệm đơn vị trong chuỗi thì kết luận đây là chuỗi không dừng. Đây là phƣơng
pháp tƣơng đối hữu hiệu. Một phƣơng pháp khác, nhƣng đề tài chỉ dùng để bổ
trợ cho hai phƣơng pháp trên là dùng kiểm định Q để kiểm định tính dừng của
chuỗi.
(1.18)
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
15
Phƣơng pháp kiểm định dựa trên tƣơng quan đồ của hàm ACF đƣợc ƣu tiên
sử dụng vì nó trực quan và khá hiệu quả. Tƣơng quan đồ là đồ thị thể hiện hàm
tự tƣơng quan (ACF) và tự tƣơng quan riêng (PACF) của một chuỗi thời

gian (sẽ trình bày cụ thể ở phần sau). Nếu chuỗi thời gian là ngẫu nhiên, tự
tƣơng quan sẽ gần về 0 ở tất cả khoảng phân chia thời gian. Nếu không ngẫu
nhiên thì một hoặc một số tự tƣơng quan sẽ khác 0. Khoảng tin cậy khoảng
trên 95% của tự tƣơng quan là ± 1.96/N
1/2
. Nếu chuỗi là ngẫu nhiên và dừng
thì hàm tự tƣơng quan sẽ có phân bố xấp xỉ với phân bố chuẩn N(0,1/n) (n là số
các quan sát). Do vậy, nếu chuỗi là dừng thì 95% tự tƣơng quan mẫu sẽ nằm
trong khoảng giới hạn
./1 96 n
(thể hiện bằng hai đƣờng viền nét đứt trong
tƣơng quan đồ của ACF). Còn ngƣợc lại thì chuỗi không phải là dừng khi có
nhiều tự tƣơng quan mẫu nằm ngoài khoảng giới hạn này. Tính chất đặc trƣng
hàm ACF, với tham số trễ k, của chuỗi không dừng là nó giảm rất chậm khi k
tăng, và PACF thì có xu thế đạt điểm cực đại tại độ trễ 1.
Các phƣơng pháp biến đổi chuỗi thời gian dừng Nhƣ đã trình bày ở trên,
để xây dựng đƣợc mô hình dự báo chính xác thì các chuỗi thời gian không dừng
cần đƣợc biến đổi thành các chuỗi thời gian dừng, bằng một số cách nhƣ sau:
Phương pháp khử xu thế: Tính xu thế trong chuỗi thời gian là một trong
những nguyên nhân chủ yếu làm cho chuỗi không dừng. Giả sử mô hình ƣớc
lƣợng biểu diễn chuỗi thời gian không dừng z
t
chứa xu thế tuyến tính đƣợc biểu
diễn nhƣ sau:
ˆˆ
ˆ

t 1 2
zt


trong đó,
ˆˆ
,
12

lần lƣợt là ƣớc lƣợng của hệ số chặn và hệ số góc.
Để biến đổi chuỗi không dừng z
t
thành chuỗi dừng, xem xét chuỗi phần dƣ,
ˆˆ
ˆ
  
t t 1 2
e z t

có dừng không.Ngoài ra xu thế cũng đƣợc biểu diễn mô tả bằng
hàm đa thức, đƣờng cong tuyến tính, hàm mũ…Và phƣơng pháp loại trừ xu thế
trong chuỗi để biến đổi thành chuỗi dừng cũng đƣợc thực hiện bằng phƣơng
pháp tƣơng tự.
Phương pháp sai phân: Loại bỏ thành phần xu thế trong chuỗi bằng ứng
dụng toán tử sai phân bậc d (d ≥ 1):

()


d d 1
tt
zz
  


Loại bỏ thành phần mùa vụ trong chuỗi bằng cách sử dụng toán tử sai phân theo
trễ mùa vụ bậc D (D ≥ 1):

()
D s D
s t t
z 1 B z


(1.19)
(1.20)
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
16
Loại trừ thành phần mùa vụ và xu thế trong chuỗi: ứng dụng kết hợp toán tử sai
phân theo mùa vụ bậc D và sai phân thƣờng bậc d:
( ) ( ) ( ) ( )

     
d D d D d s D
s t t t 1 t t s t
z z z z z 1 B 1 B z


Phương pháp hàm biến đổi: Chuỗi không dừng có thể có nguyên nhân bởi
các dao động trong chuỗi không ổn định. Do đó hàm biến đổi đƣợc sử dụng để
tác động khiến dao động trong chuỗi trở nên ổn định hơn. Một tập hợp các hàm
biến đổi đƣợc Box-Cox đƣa ra, trong đó chẳng hạn là các hàm
log( )
tt

zz
hoặc

tt
zz
.
1.1.5 Phân tích, dự báo chuỗi thời gian
Giả định cơ bản Phƣơng pháp phân tích, dự báo chuỗi thời gian dựa trên
giả định cơ bản là sự biến động của các hiện tƣợng trong tƣơng lai sẽ đƣợc giải
thích đƣợc sự biến động của các hiện tƣợng trong quá khứ và hiện tại. Vì vậy
mục tiêu chính của phân tích, dự báo chuỗi thời gian là chỉ ra và tách biệt các
yếu tố ảnh hƣởng đến nó. Quá trình phân tích, dự báo chuỗi thời gian {z
t
} là để
tìm ra các mô hình, luật ẩn trong nó, đƣợc thực hiện trên mẫu các quan sát, đƣợc
tiến hành nhƣ sau:
Xây dựng mô hình Bắt đầu bằng việc xác định mô hình. Trƣớc tiên ta cần
tiến hành bƣớc chuẩn bị dữ liệu nhằm nhận dạng các thành phần ẩn tồn tại trong
chuỗi thời gian, làm trơn số liệu. Sau đó ta tiến tới bƣớc nhận dạng mô hình, ƣớc
lƣợng các tham số mô hình. Kết quả đƣợc mô hình ở dạng thô. Kết quả ở dạng
thô này cần đƣợc tiếp tục xử lý ở bƣớc hiệu chỉnh và kiểm tra mô hình để đƣợc
mô hình cuối cùng thích hợp nhất; kiểm định để kiểm tra xem thực sự mô hình
cuối cùng này có đảm bảo những yêu cầu mang tính nguyên tắc hay không. Nếu
không đảm bảo, quay lại bƣớc một. Chọn lựa mô hình trong lớp các mô hình
phân tích, dự báo chuỗi thời gian cần đƣợc tiến hành sao cho mô hình đƣợc lựa
chọn là “tốt nhất”, phải thỏa mãn các tiêu chí kiểm định, đánh giá. Mô hình
đƣợc chọn lựa cũng phải đơn giản và có thể hiểu đƣợc dễ dàng, nó sinh ra chuỗi
“gần giống” với chuỗi quan sát thực.
Chú ý: Bƣớc chuẩn bị dữ liệu cần thực hiện các công việc sau:
- Nhận dạng các thành phần ẩn tồn tại trong chuỗi thời gian: Thành phần xu

thế thể hiện chiều hƣớng biến động tăng hoặc giảm của các hiện tƣợng nghiên
cứu trong thời gian dài. Thành phần chu kỳ thể hiện biến động của hiện tƣợng
đƣợc lặp lại với chu kỳ nhất định, thƣờng kéo dài từ 2 đến 10 năm. Thành phần
(1.21)
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
17
mùa vụ biểu hiện sự tăng hoặc giảm mức độ của hiện tƣợng ở một số thời điểm
(tháng, quý) nào đó đƣợc lặp đi lặp lại qua nhiều năm. Thành phần ngẫu nhiên
thể hiện những biến động không có qui luật và hầu nhƣ không dự báo, quan sát
đƣợc lên giá trị của hiện tƣợng đang nghiên cứu. Nhiệm vụ ở bƣớc này là xác
định đƣợc các thành phần của chuỗi để tiến hành khử các chúng ở bƣớc hai.
- Làm trơn số liệu: Sau khi xác định đƣợc các thành phần trên trong chuỗi
thời gian, tiếp theo phải tiến hành làm trơn dữ liệu. Cụ thể hơn là loại trừ đƣợc
thành phần xu thế và mùa vụ trong chuỗi thời gian. Chuỗi thu đƣợc sau cùng
không còn chứa các thành phần đó (chuỗi đƣợc làm trơn), khiến cho việc phân
tích, dự báo dễ dàng hơn. Việc khử các thành phần sẽ biến chuỗi ban đầu thành
một chuỗi mới ổn định hơn mà ta gọi là chuỗi dừng, giúp cho việc dự báo đƣợc
chính xác. Tất nhiên, sau khi dự báo cho chuỗi mới ta sẽ “bù” lại các thành phần
đã đƣợc khử để đƣợc kết quả cuối cùng phù hợp với chuỗi ban đầu.
Một số kiểm định thống kê: Để biết một mô hình có phù hợp với thực tế hay
không, mức độ phù hợp nhƣ thế nào, đã tối ƣu hay chƣa, ta cần cần dùng các
phƣơng pháp kiểm định. Dƣới đây là một số phƣơng pháp kiểm định đƣợc dùng
trong luận văn:
Kiểm định T: Để kiểm định xem mỗi hệ số trong mô hình
i

(i = 1, …, n) =
0 hay không. Nếu Pr(T-Statistic) < 0,1 thì giả thuyết
i


(i = 1, …, n) = 0 ở mức
dƣới 10% (hay giả thuyết này bị bác bỏ ở mức trên 90%); nếu Pr(T-Statistic) <
0,05 thì giả thuyết
i

(i = 1, …, n) = 0 ở mức dƣới 5% (hay giả thuyết bị bác bỏ
ở mức trên 95%) và giả thuyết này bị bác bỏ ở mức trên 99% nếu nếu Pr(T-
Statistic) < 0,01,
Mức mỗi hệ số
i

= 0 bị bác bỏ là do ngƣời sử dụng tự lựa chọn và khi giả
thuyết
i

= 0 bị bác bỏ có nghĩa là
i

khác 0 và biến X
i
vẫn có mặt trong phƣơng
trình hồi qui.
Kiểm định d (Durbin - Watson): Dùng để phát hiện xem chuỗi phần dƣ hay
sai số của mô hình có tự tƣơng quan hay không. Nếu có tự tƣơng quan thì dự
báo sẽ không chính xác. Nếu d nằm trong khoảng gần 2 là tốt (khoảng từ 1,8
đến 2,2), chuỗi phần dƣ không có tự tƣơng quan.
Tiêu chuẩn thông tin Akaike (AIC), Schwarz (SIC): Làm thế nào chọn đƣợc
mô hình đƣợc cho là tối ƣu nhất trong nhiều mô hình ứng cử, hai tiêu chuẩn AIC
hoặc SIC là những tiêu chuẩn cho phép chọn lựa đƣợc một mô hình đƣợc cho là

tối ƣu nhất.
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
18
- Tiêu chuẩn:
ˆ
( ) log
2
2k
AIC k
n


- Tiêu chuẩn:
log
ˆ
()
2
kn
SIC k log
n


trong đó k là số lƣợng các tham số trong mô hình, n là số các quan sát của chuỗi,
ˆ
2

là ƣớc lƣợng phƣơng sai (độ lệch) của mô hình.
Tiêu chí để chọn lựa mô hình hợp lý trong nhiều mô hình ứng cử là chọn giá
trị k (số các tham số) của mô hình ứng cử dẫn đến giá trị AIC(k), SIC(k) là nhỏ

nhất. Nó thể hiện nguyên tắc tằn tiện trong việc lựa chọn mô hình.
Dự báo Dựa trên mô hình đƣa ra các dự báo về giá trị phần tử của chuỗi
trong tƣơng lai. Từ mô hình thực hiện dự báo giá trị tƣơng lai cho chuỗi, phân
tích sự phù hợp của giá trị dự báo cả về mặt thực nghiệm và lý thuyết. Xác định
độ chệch giữa giá trị dự báo với giá trị quan sát thực và khoảng tin cậy của dự
báo tức là giới hạn mà giá trị quan sát thực sẽ nằm trong đó.
Dự báo chuỗi thời gian là ƣớc lƣợng các giá trị của biến ngẫu nhiên chuỗi
thời gian z
t+h
(
h1
) tại thời điểm t, ký hiệu là
ˆ
()
t
zh
, dựa trên cơ sở các giá trị
của biến ngẫu nhiên {z
t
} đƣợc quan sát trong quá khứ và tại thời điểm này. Trên
cơ sở mô hình đã đƣợc xây dựng, ta sẽ tiến hành dự báo các giá trị tƣơng lai của
hiện tƣợng nghiên cứu, trên cơ sở đó để lập kế hoạch, đề ra các quyết định trong
sản xuất, kinh doanh hoặc đề ra chính sách. Đồng thời cung cấp thêm các giá trị
quan sát mới vào dữ liệu chuỗi quan sát nhằm mục đích hiệu chỉnh lại mô hình
để đƣa ra dự báo tốt hơn.
Dự báo trước một bước ngoài mẫu: Giả sử số liệu các biến có đến năm thứ
N. Sử dụng mô hình đƣợc xây dựng để dự báo giá trị các biến Y năm N + 1, thì
giá trị dự báo này đƣợc gọi là đƣợc dự báo trƣớc một bƣớc ngoài mẫu.
Dự báo trước nhiều bước ngoài mẫu: Sử dụng mô hình đƣợc xây dựng để
dự báo giá trị các biến ở năm N + h, thì giá trị dự báo ở thời điểm N + h đƣợc

gọi là đƣợc dự báo trƣớc nhiều bƣớc (ở đây là h bƣớc) ngoài mẫu.
Để dự báo trƣớc nhiều bƣớc ngoài mẫu, ta nên dự báo trƣớc một bƣớc ngoài
mẫu, lấy giá trị này bổ sung vào tập dữ liệu để ƣớc lƣợng lại các tham số mô
hình và thực hiện dự báo trƣớc một bƣớc ngoài mẫu, , cứ nhƣ vậy cho đến khi
nhận đƣợc giá trị dự báo trƣớc nhiều bƣớc ngoài mẫu.
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
19
Đánh giá độ chính xác của dự báo và sai số của dự báo: Một cách đánh giá
độ chính xác dự báo là để lại một vài giá trị cuối cùng của mẫu. Sau đó dựa vào
một số thƣớc đo để đánh giá độ chính xác của kết quả dự báo. Nội dung này
thực chất là bƣớc dự báo kiểm định mô hình nhƣ đã đƣợc giới thiệu trong hộp ở
trên.
Giả sử ta đã dự báo cho các thời kỳ (quan sát) n+1, n+2, , n+p và:
-
ˆ

t t t
e y y
là độ lệch (hay sai số) giữa giá trị thực tế và giá trị dự báo ở thời
điểm;
- t, y
t
là giá trị quan sát thực tế và
t
y
là giá trị dự báo của biến y tại thời điểm t.
Khi đó một số thƣớc đo hay đƣợc sử dụng để đánh giá độ chính xác của dự báo
là:
- Tổng bình phƣơng các sai số dự báo:

()


p
2
j
j1
e

- Căn bậc hai sai số bình phƣơng trung bình:
()


p
2
e
j
j1
p

- Phần trăm sai số tuyệt đối:
ˆ
*

tt
t
yy
100
y



1.2 MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN ĐƠN BIẾN
Tính đơn biến của mô hình đƣợc hiểu ở là trong mô hình chỉ có các thành
phần của một cùng một chuỗi (chỉ có một biến), hoặc có thêm thành phần nhiễu.
Nói cách khác mô hình đó thể hiện mối quan hệ giữa các phần tử của cùng một
chuỗi. Còn với nhiễu, ta hiểu đây là yếu tố mà mọi hệ thống đều có dù ít hay
nhiều. Nhiễu là hệ quả của các tác động tổng hợp mà ta khó có thể mô hình hóa
đƣợc, làm sai lệch đầu ra thực tế so với đầu ra lý thuyết của mô hình trên cùng
một đầu vào. Ta cần xây dựng mô hình sao cho biểu hiện của nhiễu là nhỏ nhất
và đƣa nhiễu về dạng nhiễu trắng.
Ƣu điểm của các mô hình đơn biến là chỉ cần dữ liệu quan sát hiện tại và quá
khứ của chính chuỗi cần dự báo, do đó tính phức tạp trong dữ liệu là nhỏ. Nhƣng
nhƣợc điểm của các mô hình đơn biến lại chính là mặt trái của ƣu điểm trên,
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
20
nghĩa là mô hình đơn biến không cho phép biểu diễn mối quan hệ tƣơng quan
giữa các chuỗi với nhau, do đó không chỉ ra đƣợc sự phụ thuộc, tác động qua lại
của chuỗi này với chuỗi khác. Điều đó dẫn đến, khi tiến hành phân tích, dự báo
các vấn đề kinh tế, xã hội cho nhiều đối tƣợng khác nhau với các mối liên hệ đa
chiều thì mô hình đơn biến gặp nhiều hạn chế.
1.2.1 Mô hình tích hợp trung bình trƣợt tự hồi quy ARMA(p,q).
Quá trình trung bình trƣợt tự hồi qui ARMA(p,q) cho chuỗi dừng {z
t
} đƣợc
biểu diễn nhƣ sau:

( ) ( )       
2 p 2 q
1 2 p t 1 2 q t

1 B B B z 1 B B B a
     
(1.22)
hay

( ) ( )
tt
B z B a

(1.23)
trong đó:
- a
t
là nhiễu trắng
)
2
a
WN(0,~ 
;
-
, ,
1p

là p hệ số tự hồi qui,
,
1q

là q hệ số trung bình trƣợt;
- Đa thức
( ) ( )   

2p
1 1 p
B 1 B B B
   
không có thừa số chung với đa
thức :
( ) ( )    
2q
1 2 q
B 1 B B B
   
.
Phát triển cao hơn của mô hình này áp dụng cho các chuỗi không dừng ta
đƣợc mô hình ARIMA(p,d,q). Với mô hình này, các chuỗi không dừng sẽ đƣợc
sai phân d lần để có tính dừng và sau đó áp dụng mô hình ARMA nhƣ trên.
1.2.2 Mô hình làm trơn hàm mũ chuỗi thời gian
Mô hình làm trơn hàm mũ đƣợc chia thành ba loại :
Làm trơn hàm mũ dạng đơn Đƣợc sử dụng cho các dự báo ngắn hạn, thƣờng
chỉ dự báo trƣớc một hai tháng, một hai quý, một hai năm trong tƣơng lai. Mô
hình này giả sử rằng dữ liệu dao động xung quanh một giá trị trung bình ổn định
chấp nhận đƣợc (không có xu thế tăng hoặc giảm). Nghĩa là đối với chuỗi không
thay đổi hoặc thay đổi rất chậm theo thời gian thì có thể áp dụng phƣơng pháp
này.
Mô hình làm trơn hàm mũ bậc 2 Thực chất là một hệ 2 phƣơng trình với 2
tham số làm trơn. Một tham số làm trơn toàn bộ và một tham số làm trơn xu thế.
Phƣơng pháp này đƣợc sử dụng khi dữ liệu có tính xu thế nhƣng không có tính
mùa vụ.
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
21

Mô hình làm trơn hàm mũ bậc 3 Đƣợc sử dụng khi trong dữ liệu có cả tính
xu thế và tính mùa vụ. Để theo dõi đƣợc tính mùa vụ, cần phải đƣa thêm vào
phƣơng trình thứ ba. Kết quả của hệ các phƣơng trình này đƣợc gọi là phƣơng
pháp làm trơn Holt-Winters (HW). Có hai mô hình Holt-Winters hay đƣợc áp
dụng tuỳ theo đặc trƣng tăng trƣởng của mùa vụ đó là:
- Mô hình mùa vụ nhân (Multiplicative Seasonal Model)
- Mô hình mùa vụ cộng (Additive Seasonal Model)
Phƣơng pháp Holt-Winters cũng đƣợc sử dụng để dự báo chuỗi thời gian có tính
xu thế và không có tính mùa vụ, Khi đó ta có mô hình Holt-Winter không mùa
vụ (no seasonal).
1.2.3 Mô hình phƣơng sai thay đổi điều kiện tự hồi quy
Trong mô hình ARMA(p,q)
( ) ( )
tt
B z B a


đối với chuối thời gian dừng z
t
, khi các nhiễu a
t
đƣợc coi là các biến ngẫu nhiên
độc lập với giả định (thông thƣờng) kỳ vọng bằng không và phƣơng sai không
đổi thì thực chất là ta đã ngầm định rằng phƣơng sai điều kiện của a
t
dựa vào
thông tin quá khứ là hằng số, tức là không phụ thuộc vào quá khứ. Điều đó dẫn
đến khả năng giống nhau về nhiễu của các dự báo trƣớc k bƣớc .
Tuy nhiên với nhiều chuỗi thời gian, nhất là chuỗi thời gian trong lĩnh vực
kinh tế, tài chính tiền tệ và sản xuất kinh doanh, thì sự thay đổi của nhiễu biểu

hiện sự phụ thuộc vào nhiễu trong quá khứ với xu hƣớng độ lệch ngày càng lớn
hơn. Các mô hình ARCH do Engle đề xuất đã chú ý đến phƣơng sai nhiễu có
điều kiện trong các quá trình ARMA phụ thuộc vào những đổi mới sáng tạo
đƣợc điều chỉnh trong quá khứ hơn là phƣơng sai nhiễu là hằng số nhƣ trong mô
hình ARMA với các nhiễu độc lập.
Mô hình ARCH tổng quát hay (GARCH(r,s)) thừa nhận rằng phƣơng sai h
t

của giá trị nhiễu a
t
đƣợc thể hiện bởi công thức






r
i
itiit
s
i
itttt
haaaaEh
1
2
1
021
2
, ),/(



trong đó a
t
là chuỗi nhiễu của mô hình và 
i
 0 đối với mọi i = 1,…, r.
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
22

1.3 MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN ĐA BIẾN
1.3.1 Mô hình hàm chuyển
Khi dự báo chuỗi thời gian bằng mô hình đơn biến, ví dụ mô hình ARIMA,
chúng ta sử dụng thông tin trong quá khứ và hiện tại của một chuỗi để dự báo
cho gía trị tƣơng lai của chính nó. Tuy nhiên có những tình huống mà chuỗi còn
bị tác động của giá trị quá khứ và hiện tại của các chuỗi khác. Chẳng hạn việc
thực hiện các chƣơng trình khuyến mại về một loại sản phẩm có thể tác động tới
doanh thu của sản phẩm này không chỉ hiện tại mà còn trong tƣơng lai. Trong
những tình huống nhƣ vậy, mô hình hàm chuyển, đƣợc đề xuất bởi Box-
Jenkins(1976), trong đó có tính đến tác động của các sự kiện nhƣ vậy lên chuỗi,
sẽ làm tăng tính chính xác của việc dự báo, thêm vào đó nó còn giúp ta đánh giá
đƣợc tác động của các sự kiện này lên chuỗi đang quan tâm.
Mô hình hàm chuyển chính là nội dung nghiên cứu của đề tài, sẽ đƣợc trình
bày cụ thể ở các chƣơng sau.
1.3.2 Mô hình tự hồi quy véc tơ VAR
Trƣớc những năm 1980, mô hình hệ phƣơng trình đồng thời đƣợc sử dụng
rộng rãi trong phân tích và dự báo các biến kinh tế vĩ mô cũng nhƣ trong các
nghiên cứu về chu kỳ kinh tế. Khi đó mối quan tâm của các nhà kinh tế lƣợng
đối với mô hình này xoay quanh vấn đề định dạng của mô hình - liên quan tới

tính nội sinh của các biến số trong mô hình.
Trong mô hình hệ phƣơng trình đồng thời, các biến nội sinh xuất hiện ở vế
phải của các phƣơng trình, và khi đó nếu sử dụng phƣơng pháp OLS thì các ƣớc
lƣợng thu đƣợc nói chung sẽ bị chệch và không vững (nghĩa là ngay khi kích
thƣớc mẫu tiến ra vô cùng thì giá trị ƣớc lƣợng đƣợc cũng không hội tụ về giá trị
thực). Do đó việc ƣớc lƣợng hệ phƣơng trình này thƣờng đƣợc chuyển sang ƣớc
lƣợng hệ phƣơng trình rút gọn. Và để có thể khôi phục đƣợc các hệ số của hệ
ban đầu qua các ƣớc lƣợng của hệ rút gọn thì điều cần thiết là trong mô hình ban
đầu, một số biến có thể xuất hiện trong phƣơng trình này nhƣng lại không có
mặt trong phƣơng trình khác của hệ.
Việc quyết định sự có mặt hay không có mặt của một biến số trong một
phƣơng trình của hệ thƣờng đƣợc dựa trên lý thuyết kinh tế hoặc trực quan của
ngƣời làm mô hình. Chẳng hạn nếu biến Y
1
đƣợc xem nhƣ không có tác động
Luận văn cao học - Chuyên ngành: Hệ thống thông tin
Học viên: Phạm Trung Thành Lớp Hệ thống thông tin K16
23
đến biến Y
2
thì Y
1
có thể có mặt trong phƣơng trình của Y
3
nhƣng không có mặt
trong phƣơng trình của Y
2
. Một trong những vấn đề của cách tiếp cận phi đối
xứng này là các giả định này không kiểm định đƣợc, nên trong trƣờng hợp cơ sở
lý thuyết kinh tế không đủ mạnh thì mô hình có thể dẫn đến các kết luận sai lệch

vì nó không phản ánh hệ thống một cách hợp lý.
Sims (1980) đã thay đổi mối quan tâm của cộng đồng các nhà kinh tế lƣợng
đƣơng thời. Ông cho rằng hầu hết các biến số kinh tế, nhất là biến số kinh tế vĩ
mô đều mang tính nội sinh, nghĩa là đều có tác động qua lại lẫn nhau. Chẳng hạn
tuy cung tiền có thể đƣợc quyết định (tuy không hoàn toàn) bởi Ngân hàng
Trung ƣơng, nhƣng các nhà làm chính sách tiền tệ đƣa ra quyết định của mình
về cung tiền thƣờng dựa trên các thông tin về động thái và thực trạng của các
biến kinh tế vĩ mô khác nhƣ lạm phát, thất nghiệp, tăng trƣởng kinh tế. Do đó
biến cung tiền về thực chất cũng mang tính nội sinh. Từ đó ông đề xuất mô hình
nhiều biến số mà trong đó các biến số trong mô hình đều đóng vai trò nhƣ nhau,
và đều là biến nội sinh.
Tuy vẫn có những phê phán, nhƣng mô hình VAR và các dạng biến thể của
nó đã chứng minh đƣợc tính ƣu việt của nó. Với một số ít biến trong mô hình
nhƣng tính tin cậy của dự báo thu đƣợc thƣờng tốt hơn nhiều so với một mô
hình hệ phƣơng trình đồng thời cồng kềnh nhiều biến và nhiều phƣơng trình. Do
đó ngày nay các mô hình dạng VAR đã trở thành một công cụ quan trọng và
đƣợc sử dụng rộng rãi, đặc biệt là trong các bài toán liên quan đến các biến kinh
tế vĩ mô, trong các khía cạnh sau đây:
- Dự báo, đặc biệt là dự báo trung hạn
- Phân tích cơ chế truyền tải sốc, nghĩa là xem xét tác động của một cú sốc
trên một biến lên các biến khác trong hệ thống.
Khi xây dựng mô hình VAR dạng cơ bản, các biến thƣờng phải đƣợc xử lý
để trở thành các chuỗi dừng, và do đó trong một số trƣờng hợp có thể bỏ mất đi
các thông tin quan trọng về mối quan hệ giữa các biến số, chẳng hạn thông tinh
về sự giống nhau trong xu hƣớng biến đổi không dừng giữa các biến số. Khi đó
một loại mô hình mới dạng VAR đƣợc đƣa ra để áp dụng để thâu tóm các thông
tin này, đó là mô hình VECM – mô hình hiệu chỉnh sai số dạng véc tơ. Mô hình
này tỏ ra rất hữu ích trong việc thể hiện không chỉ mối quan hệ dài hạn giữa các
biến số mà còn thể hiện đƣợc động thái trong ngắn hạn trong quan hệ giữa các
biến số trong việc giữ cho hệ thống quy về mối quan hệ cân bằng dài hạn.

×