Tải bản đầy đủ (.pdf) (72 trang)

(Luận văn thạc sĩ) mô hình hàm chuyển và ứng dụng xây dựng mô hình dự báo với việc sử dụng chỉ số dẫn báo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.47 MB, 72 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

PHẠM TRUNG THÀNH

MƠ HÌNH HÀM CHUYỂN VÀ ỨNG DỤNG XÂY DỰNG MƠ
HÌNH DỰ BÁO VỚI VIỆC SỬ DỤNG CHỈ SỐ DẪN BÁO

LUẬN VĂN THẠC SĨ

HÀ NỘI - 2011


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

PHẠM TRUNG THÀNH

MƠ HÌNH HÀM CHUYỂN VÀ ỨNG DỤNG XÂY DỰNG
MƠ DỰ BÁO VỚI VIỆC SỬ DỤNG CHỈ SỐ DẪN BÁO

Ngành

: Công nghệ thông tin

Chuyên ngành: Hệ thống thông tin
Mã số: 60 48 05

LUẬN VĂN THẠC SĨ

Người hướng dẫn khoa học


PGS. TS. ĐỖ VĂN THÀNH

HÀ NỘI – 2011


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

MỤC LỤC
Danh sách hình ................................................................................................ 3
Danh sách bảng ............................................................................................... 4
Chƣơng 1 TỔNG QUAN VỀ CHUỖI THỜI GIAN VÀ CÁC MÔ HÌNH DỰ
BÁO CHUỖI THỜI GIAN ............................................................................. 8
1. 1 CHUỖI THỜI GIAN VÀ PHÂN TÍCH, DỰ BÁO CHUỖI THỜI GIAN .................. 8
1.1.1 Chuỗi thời gian .................................................................................................... 8
1.1.2 Các đại lƣợng đặc trƣng của chuỗi thời gian ........................................................ 9
1.1.3 Toán tử trễ và toán tử sai phân ........................................................................... 13
1.1.4 Chuỗi thời gian dừng ......................................................................................... 13
1.1.5 Phân tích, dự báo chuỗi thời gian ....................................................................... 16
1.2 MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN ĐƠN BIẾN ........................................... 19
1.2.1 Mơ hình tích hợp trung bình trƣợt tự hồi quy ARMA(p,q). ................................ 20
1.2.2 Mơ hình làm trơn hàm mũ chuỗi thời gian ......................................................... 20
1.2.3 Mơ hình phƣơng sai thay đổi điều kiện tự hồi quy.............................................. 21
1.3 MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN ĐA BIẾN .............................................. 22
1.3.1 Mơ hình hàm chuyển .......................................................................................... 22
1.3.2 Mơ hình tự hồi quy véc tơ VAR ......................................................................... 22
1.3.3 Mơ hình điều chỉnh sai số dạng véc tơ VARX.................................................... 24
1.4 MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN PHI TUYẾN ......................................... 24
KẾT LUẬN CHƢƠNG ................................................................................................... 25

Chƣơng 2 CÁC MƠ HÌNH HÀM CHUYỂN ...............................................26

2.1 CÁC MƠ HÌNH HÀM CHUYỂN TUYẾN TÍNH RỜI RẠC .................................... 27
2.1.1 Những mơ hình hàm chuyển tuyến tính rời rạc.................................................... 27
2.1.2 Mơ hình hàm chuyển rời rạc đƣợc biểu diễn bằng sai phân ................................ 29
2.1.3 Những mơ hình hàm chuyển rời rạc có nhiễu ...................................................... 31
2.2 XÁC ĐỊNH MƠ HÌNH: NHẬN DẠNG, ƢỚC LƢỢNG VÀ KIỂM TRA MƠ HÌNH
HÀM CHUYỂN.............................................................................................................. 31
2.2.1 Hàm tự tƣơng quan chéo ..................................................................................... 32
2.2.2 Xác định mô hình hàm chuyển ........................................................................... 34
2.2.3 Hiệu chỉnh và kiểm tra mơ hình hàm chuyển ..................................................... 43
KẾT LUẬN CHƢƠNG ................................................................................................... 45

Chƣơng 3 ỨNG DỤNG MƠ HÌNH HÀM CHUYỂN TRONG DỰ BÁO CHỈ
SỐ KINH TẾ VĨ MÔ VIỆT NAM BẰNG CHỈ SỐ DẪN BÁO ...................46
3.1 CHỈ SỐ DẪN BÁO .................................................................................................. 46
3.2 DỰ BÁO VỚI MƠ HÌNH HÀM CHUYỂN BẰNG CÁC CHỈ SỐ DẪN BÁO ......... 47
3.2.1 Dự báo sai số bình phƣơng trung bình tối thiểu .................................................. 47
Tính tốn dự báo Giờ, ta viết (3.1) dƣới dạng: ........................................................... 48

Học viên: Phạm Trung Thành

1

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin
3.3 DỰ BÁO CHỈ TIÊU KINH TẾ VĨ MÔ Ở VIỆT NAM BẰNG VIỆC ỨNG DỤNG
MƠ HÌNH HÀM CHUYỂN ............................................................................................ 49
3.3.1 Các chỉ tiêu kinh tế vĩ mô ................................................................................... 49
3.3.2 Xây dựng và sử dụng mơ hình hàm chuyển để dự báo cho chỉ tiêu kinh tế vĩ mô 50

KẾT LUẬN CHƢƠNG ................................................................................................... 62

KẾT LUẬN ĐỀ TÀI ......................................................................................69
TÀI LIỆU THAM KHẢO .............................................................................70

Học viên: Phạm Trung Thành

2

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

Danh sách hình

Hình 1 Các dạng hàm chuyển với r <= 2, s <= 2, b = 3 ............................................. 39
Hình 2: Biểu đồ hai chuỗi GDP và CNXD ................................................................. 52
Hình 3: Biểu đồ và hàm tự tƣơng quan và tự tƣơng quan từng phần của xt ................. 53
Hình 4: Biểu đồ và hàm tự tƣơng quan và tự tƣơng quan từng phần của yt ................. 53
Hình 5: Biễu diễn chuỗi xt theo mơ hình ARIMA ...................................................... 54
Hình 6: Hàm ACF, PACF của phần dƣ có dạng nhiễu trắng của chuỗi xt ................... 54
Hình 7: Hàm tự tƣơng quan chéo r (k ) và giá trị ƣớc lƣợng các phản ứng xung vj... 55
Hình 8: Biểu đồ và hàm tự tƣơng quan và tự tƣơng quan từng phần của chuỗi PDU .. 56
Hình 9: Xác định mơ hình nhiễu ................................................................................ 57
Hình 10: Kiểm tra tƣơng quan phần dƣ của nhiễu ...................................................... 57
Hình 11 Kết quả bởi phƣơng pháp bình phƣơng tối thiểu ........................................... 60

Học viên: Phạm Trung Thành


3

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

Danh sách bảng
Bảng 1: Bộ dữ liệu thử nghiệm của hai chuỗi GDP và Công nghiệp xây dựng ........... 52
Bảng 2 : Kết quả dự báo của mơ hình hàm chuyển ..................................................... 62
Bảng 3: Kết quả dự báo của mô hình ARIMA cho chuỗi Cơng nghiệp xây dựng Yt ... 65
Bảng 4: Bộ dự liệu cho GDP, Bản lẻ tiêu dùng, nhập khẩu, xuất khẩu ....................... 66
Dƣới đây là một số mơ hình tìm đƣợc: ....................................................................... 67

Học viên: Phạm Trung Thành

4

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

GIỚI THIỆU ĐỀ TÀI
Dự báo có vai trị quan trọng trong việc lập kế hoạch phát triển kinh tế-xã
hội. Tuy nhiên, dự báo là cơng việc khó và ở nƣớc ta cịn là cơng việc khá mới
mẻ so với nhiều quốc gia phát triển, thậm chí so với ngay cả các nƣớc trong khu
vực. Vì vậy đề tài là một nỗ lực nhằm hƣởng ứng và góp phần vào việc thúc đẩy
và triển khai các hoạt động nghiên cứu và ứng dụng về dự báo.
Có nhiều hƣớng tiếp cận cũng nhƣ phƣơng pháp xây dựng các mơ hình dự

báo khác nhau tùy thuộc vào chủ thể nghiên cứu, đối tƣợng nghiên cứu, yêu cầu
của việc nghiên cứu…Trong khuôn khổ đề tài, đối tƣợng nghiên cứu là chuỗi
thời gian thể hiện một giá trị định lƣợng nào đó ở những thời điểm khác nhau,
theo trật tự thời gian về một sự vật, hiện tƣợng hoặc q trình nhất định. Mục
đích, u cầu và cũng là nhu cầu của việc dự báo là trên cơ sở các giá trị hiện tại
và quá khứ của các chuỗi thời gian, ta có thể dự báo đƣợc giá trị tƣơng lai của
một chuỗi nào đó với độ chính xác chấp nhận đƣợc.
Do đối tƣợng nghiên cứu là chuỗi thời gian, mà về mặt toán học là một quá
trình ngẫu nhiên, nên việc xây dựng, kiểm định mơ hình và tiến hành dự báo chủ
yếu dựa trên nền tảng tốn học xác xuất thống kê. Nói cách khác khi ta nghiên
cứu về chuỗi thời gian, về các tính chất, thuộc tính, qui luật của nó để xây dựng
nên các mơ hình dự báo thì về cơ bản là ta làm việc với các giá trị, các đặc trƣng
thống kê của chuỗi. Từ đó, có thể thấy ngay rằng việc xây dựng, kiểm định mơ
hình hay dự báo từ mơ hình ln gắn liền với sai số, với sự điều chỉnh khơng
ngừng để có đƣợc một kết quả ngày càng hợp lý theo thời gian.
Rõ ràng, ngay cả khi xác định đối tƣợng nghiên cứu là chuỗi thời gian, thì
việc tiếp cận và xác định mơ hình dự báo cũng vơ cùng đa dạng. Chúng ta có thể
phân chia các mơ hình dự báo chuỗi thời gian thành mơ hình dự báo tuyến tính
và phi tuyến, mơ hình dự báo đơn biến và đa biến, hoặc theo tiêu chí thời hạn dự
báo thì có mơ hình dự báo ngắn hạn, trung hạn và dài hạn. Mỗi mô hình có các
ƣu, nhƣợc điểm khác nhau và đƣợc áp dụng cho các đối tƣợng có đặc thù và các
bài tốn khác nhau. Do đó, khơng có mơ hình nào là tuyệt đối vƣợt trội hoặc là
chìa khóa vạn năng áp dụng cho mọi dạng chuỗi thời gian.
Mơ hình mà đề tài nghiên cứu là mơ hình hàm chuyển, một mơ hình dự báo
đa biến và áp dụng chủ yếu cho việc dự báo ngắn hạn hoặc trung hạn. Mô hình
áp dụng tốt nhất cho các chuỗi, các quá trình có “tính dừng”. Tính đa biến cho
Học viên: Phạm Trung Thành

5


Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

phép mơ hình có khả năng dự báo giá trị tƣơng lai của một chuỗi thông qua giá
trị hiện tại và q khứ của chính nó và của các chuỗi thời gian khác. Điều đó rất
có giá trị bởi mơ hình hàm chuyển biểu diễn đƣợc mối quan hệ tƣơng quan giữa
các chuỗi thời gian khác nhau, và do đó cũng chính là mối quan hệ giữa các sự
vật, hiện tƣợng và quá trình khác nhau. Đây là ƣu điểm vƣợt trội của mơ hình
hàm chuyển so với các mơ hình dự báo đơn biến - các mơ hình chỉ thể hiện đƣợc
sự tƣơng quan giữa các giá trị của cùng một chuỗi, tức mối quan hệ nội tại theo
thời gian của cùng một đối tƣợng, mà không chỉ ra đƣợc sự phụ thuộc của các
đối tƣợng khác nhau - một việc rất cần thiết trong phân tích tình hình kinh tế, xã
hội. Chính vì vậy, mơ hình hàm chuyển hiện đang đƣợc coi là trung tâm của các
ứng dụng dự báo về kinh tế, xã hội và cả tự nhiên.
Về bố cục nội dung, luận văn bao gồm phần giới thiệu đề tài, ba chƣơng
chính và phần kết luận đề tài, trong đó:
Chƣơng 1: Trình bày một cách tổng quan về chuỗi thời gian và việc phân
tích, dự báo cho chuỗi thời gian. Qua đó chúng ta có thể hình dung đƣợc một
cách khái quát về chuỗi thời gian - đối tƣợng dữ liệu của dự báo, với các nội
dung cơ bản nhất; đồng thời cũng hiểu sơ bộ về vai trị của cơng tác dự báo, một
số loại dự báo, một số phƣơng pháp dự báo thƣờng đƣợc sử dụng trong lập kế
hoạch phát triển kinh tế - xã hội.
Chƣơng 2: Là nội dung quan trọng, trình bày nền tảng lý thuyết về mơ hình
cũng nhƣ qui trình xây dựng mơ hình hàm chuyển. Cụ thể, trong chƣơng này
luận văn sẽ trình bày chi tiết về khái niệm, các bƣớc trong q trình xác định và
kiểm tra mơ hình hàm chuyển; và trong từng bƣớc sẽ chỉ ra các phƣơng pháp,
các thủ tục đƣợc sử dụng để giải quyết các mục tiêu của bƣớc đó. Kết thúc
Chƣơng 2 ta có thể nhận dạng và xây dựng đƣợc các mơ hình hàm chuyển rời

rạc cho các chuỗi thời gian và các mơ hình này là cơ sở cho việc dự báo đƣợc
trình bày trong Chƣơng 3.
Chƣơng 3: Tập trung trình bày về việc dự báo sử dụng mơ hình hàm chuyển
đã đƣợc xây dựng theo qui trình và thủ tục ở Chƣơng 2. Đồng thời cũng trong
chƣơng Ba luận văn sẽ trình bày việc xây dƣng một mơ hình hàm chuyển thử
nghiệm cho các chỉ tiêu kinh tế Việt Nam. Đây là một nội dung có tính thực tiễn,
qua đó chúng ta có thể hiểu một cách rõ ràng hơn tồn bộ các vấn đề lý thuyết
đƣợc trình bày ở các chƣơng trƣớc.
Với các nội dung trên, luận văn đã bám sát giải quyết các mục tiêu và các
yêu cầu đề ra. Tuy nhiên mơ hình hàm chuyển là một nội dung tƣơng đối mới,
Học viên: Phạm Trung Thành

6

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

cịn ít đƣợc nghiên cứu tại Việt Nam, do dó việc nghiên cứu phát triển mơ hình,
khai thác mơ hình trong thực tiễn và kết hợp với các mơ hình dự báo khác để có
một mơ hình dự báo kết hợp hiệu quả là một vấn đề, cũng là một nhu cầu thực
sự cần thiết
tƣơng lai.

. Đây cũng chính là hƣớng phát triển

Equation Chapter 1 Section 1

Học viên: Phạm Trung Thành


7

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

Chƣơng 1
TỔNG QUAN VỀ CHUỖI THỜI GIAN
VÀ CÁC MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN
Chuỗi thời gian là một khái niệm chỉ một tập quan sát đƣợc đo đạc theo trình
tự thời gian về một thuộc tính, một tính chất hoặc một khía cạnh nào đó của một
(hoặc một vài) sự vật, hiện tƣợng hay quá trình nhất định. Chuỗi thời gian là đối
tƣợng dữ liệu để xây dựng mô hình dự báo chuỗi thời gian. Nó có những thành
phần, những tính chất cơ bản và đặc biệt là các đặc trưng thống kê làm cơ sở để
chúng ta phân tích và dự báo về chuỗi. Trong đó, cần lƣu ý ngay từ đầu rằng tính
dừng của chuỗi là một tiền đề rất quan trọng để xây dựng mơ hình dự báo hiệu
quả và chính xác. Do đó một điều kiện cần thiết là biến đổi đƣợc một chuỗi
không dừng thành chuỗi có tính dừng trƣớc khi thực hiện xây dựng mơ hình.
Có nhiều mơ hình phân tích và dự báo khác nhau cho chuỗi thời gian, tùy
theo từng tiêu chí phân loại. Có thể kể đến các mơ hình đơn biến hay đa biến,
các mơ hình tuyến tính hoặc phi tuyến, mơ hình dự báo ngắn hạn, dài hạn hay
trung hạn. Mỗi mơ hình có các ƣu và nhƣợc điểm khác nhau, phù hợp với từng
mục tiêu dự báo, tính chất và u cầu dự báo khác nhau. Mơ hình mà đề tài
nghiên cứu là mơ hình hàm chuyển, một mơ hình đƣợc coi là hữu hiệu và cho
kết quả dự báo tƣơng đối chính xác. Tất cả những vấn đề trên sẽ đƣợc trình bày
một cách khái quát trong các nội dung dƣới đây.
1. 1 CHUỖI THỜI GIAN VÀ PHÂN TÍCH, DỰ BÁO CHUỖI THỜI GIAN


1.1.1 Chuỗi thời gian
Chuỗi thời gian là một tập các quan sát đƣợc đo tuần tự theo thời gian. Nếu
tập là liên tục, chuỗi thời gian đƣợc gọi là chuỗi liên tục, ngƣợc lại đƣợc gọi là
chuỗi rời rạc. Có thể nói phần lớn dữ liệu phụ thuộc thời gian phản ánh các hoạt
động của đời sống kinh tế - xã hội thƣờng đƣợc đo tại các mốc thời gian cách
đều nhau, nên trong khuôn khổ đề tài chúng ta chỉ quan tâm đến các chuỗi thời
gian rời rạc, mà ở đó các quan sát đƣợc đƣợc đo tại các thời điểm cách đều
nhau, với hoạt động và phƣơng pháp đo cố định. Các quan sát của một chuỗi
thời gian rời rạc thực hiện tại các thời điểm cách đều nhau t1 , t2 ,..., t N ta kí hiệu là
z1 , z2 ,..., z N . Về mặt toán học, chuỗi thời gian rời rạc là một tập giá trị các quan
Học viên: Phạm Trung Thành

8

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

sát của biến ngẫu nhiên {zt} đo đƣợc trong các khoảng thời gian t nhƣ nhau và
đƣợc xếp theo thứ tự thời gian.
Các tính chất của chuỗi thời gian:
Tính thời đoạn: Tập quan sát của chuỗi thời gian đƣợc đo ở các các điểm
thời gian khác nhau, do đó đơn vị phân tích là thời đoạn: hàng ngày, hàng
tuần, hàng tháng, hàng năm… .
Tính mùa vụ: Chuỗi thể hiện tính mùa vụ thơng thƣờng có xu hƣớng
đƣợc nhắc lại ở những khoảng thời gian theo mùa đều đặn.
Tính dừng: Chuỗi mà các quan sát của nó đƣợc biến thiên quanh giá trị trung
bình hay ở một mức khơng đổi nào đó.
Tính xu thế: Tính xu thế thể hiện sự dịch chuyển dữ liệu hoặc chiều tăng

hoặc giảm của dữ liệu trong dài hạn.
Tính chu kỳ: Chuỗi quan sát của chuỗi thời gian thể hiện dƣới dạng đồ
thị hàm tuần hoàn (chẳng hạn các hàm lƣợng giác: sin, cosin, ...)

1.1.2 Các đại lƣợng đặc trƣng của chuỗi thời gian
Khi nghiên cứu chuỗi thời gian, ta không xem xét từng phần tử của chuỗi
một cách độc lập, mà xem xét các phần tử của chuỗi trong mối quan hệ tƣơng
quan với nhau, nhằm tìm ra qui luật biểu diễn mối liên hệ của chúng theo thời
gian. Vì vậy, đƣơng nhiên cách tiếp cận của chúng ta là thông qua các đặc trƣng
thống kê của chuỗi, các giá trị định lƣợng có tính ổn định, đại diện cho chuỗi.
Dƣới đây là một số đại lƣợng đặc trƣng của chuỗi thời gian mà ta cần xem xét,
với chú ý rằng các đặc trƣng này, xét tới cùng khi đƣợc tính tốn trong thực tế,
chính là các đại lƣợng đƣợc triết xuất từ các mẫu của chuỗi mà thơi.
Giả sử có chuỗi thời gian với n các quan sát {zt}, t = 1,2,…n.
Kỳ vọng Đại diện cho giá trị trung bình của chuỗi. Ký hiệu là:
E(z t )  

(1.1)

Trong thực tế không thể nghiên cứu đƣợc toàn bộ tổng thể của hiện tƣợng
mà chỉ nghiên cứu đƣợc tập con các phần tử của tổng thể gọi là mẫu. Lý do là,
thu thập thông tin về tồn bộ tổng thể sẽ địi hỏi cần nhiều thời gian và chi phí.
Vì thế ta chỉ nghiên cứu một số phần tử nào đó của tổng thể tức là chỉ nghiên
cứu các mẫu, từ đó suy đốn về tổng thể. Các phần tử đƣợc chọn để nghiên cứu
tổng thể đƣợc gọi là mẫu ngẫu nhiên. Nên kỳ vọng tổng thể đƣợc tính dựa trên
mẫu các quan sát gọi là kỳ vọng mẫu, và đƣợc tính nhƣ sau:
Học viên: Phạm Trung Thành

9


Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

z

1 n
 zt
n t 1

(1.2)

Phƣơng sai Đại diện cho mức độ phân tán các giá trị của chuỗi xung quanh
kỳ vọng:
var(z t )   2z  E[(z t  ) 2 ]

(1.3)

Tƣơng tự, phƣơng sai mẫu đƣợc tính:
ˆ z2 

1 n
( zt  z ) 2

n t 1

(1.4)

Độ lệch chuẩn Là căn bậc hai của phƣơng sai mẫu:


ˆ z  ˆ 2

(1.5)

Dƣới đây là một số đại lƣợng mô tả mối quan hệ (ta gọi là sự tƣơng quan)
giữa các phần tử trong chuỗi:
Hiệp phƣơng sai Sử dụng để đo mức độ tƣơng quan tuyến tính của hai biến
ngẫu nhiên trong cùng một chuỗi thời gian. Nó phản ánh sự phụ thuộc hay độc
lập của các biến ngẫu nhiên trong chuỗi. Hiệp phƣơng sai giữa hai biến ngẫu
nhiên trên chuỗi thời gian nhƣ nhau tại thời điểm t, ký hiệu là zt và tại thời điểm
t + k, ký hiệu là zt + k , và giữa chúng có k - 1 quan sát gọi là độ trễ k, đƣợc xác
định nhƣ sau:
 z (k )  cov  zt , zt  k   E ( zt   )( zt  k   ) 

(1.6)

trong đó,  là kỳ vọng của zt và zt + k. Hiệp phƣơng sai khi độ trễ k = 0 chính là
phƣơng sai của zt:  z (0)  cov  zt, zt    z2 .
Tƣơng tự, hiệp phƣơng sai mẫu đƣợc tính nhƣ sau:
ˆz (k ) 

1 nk
 ( zt  z )( zt  k  z )
n t 1

k = 1, 2...n-1

(1.7)


trong đó, z là kỳ vọng mẫu của zt và zt + k.
Hàm tự tƣơng quan (ACF) Đại lƣợng mô tả tƣơng quan tại trễ k giữa các
giá trị trong chuỗi thời gian, đƣợc xác định:
k 

cov(z t , z t  k )
 (k )
 z

 zt  zt k
 zt  ztk

Học viên: Phạm Trung Thành

10

E(z t  )(z t  k  )





E (z t  ) 2 E (z t  k  ) 2



(1.8)

Lớp Hệ thống thông tin K16



Luận văn cao học - Chuyên ngành: Hệ thống thông tin

trong đó,  z (k ) là tự hiệp phƣơng sai,  zt ,  zt  k lần lƣợt là độ lệch chuẩn của zt và
zt + k. Khi chuỗi thời gian là dừng (định nghĩa ở dƣới) thì zt và zt+k đều có phƣơng
sai nhƣ nhau là  z2   z (0) , nên tự tƣơng quan tại trễ k đƣợc tính:
k 

 z (k )
 z (0)

Tự tƣơng quan đƣợc xem là một hàm với tham số biến thiên theo trễ k
(k=1,2…) và đƣợc gọi là hàm tự tƣơng quan.
Tự tƣơng quan mẫu đƣợc tính theo cơng thức:
ˆ k 

ˆz (k )
ˆz (0)

(1.9)

Một vài tính chất của tự tƣơng quan mẫu:
- Tính chất 1:  1  ˆk  1
- Tính chất 2: k  0  ˆ0  1
- Tính chất 3: ˆk  ˆk
Nếu nhƣ zt và zt + k không tƣơng quan với nhau thì tự tƣơng quan ˆk  0 , do
khi đó cov(zt, zt + k) = 0, nhƣng điều ngƣợc lại chƣa chắc đã đúng.
Dựa trên mối quan hệ tự tƣơng quan giữa các phần tử trong chuỗi, ngƣời ta
có thể xây dựng đƣợc mơ hình dự báo chuỗi thời gian.
Hàm tự tƣơng quan từng phần (PACF) Tự tƣơng quan mẫu ˆk phản ánh

mức độ tƣơng quan giữa hai biến ngẫu nhiên zt và zt + k trong chuỗi thời gian.
Tuy nhiên, sự tƣơng quan giữa chúng có thể chịu sự tác động của các biến khác,
trong trƣờng hợp này là k - 1 biến trung gian zt + 1, zt + 2… zt + k - 1 ảnh hƣởng đến
sự tƣơng quan giữa biến zt và zt+k. Do đó hàm tự tƣơng quan từng phần đƣợc
đƣa vào nhằm mục đích mơ tả mức độ tƣơng quan trực tiếp giữa hai biến zt và zt
+ k (không bị ảnh hƣởng ràng buộc bởi mối quan hệ với các biến trung gian),
đƣợc tính theo cơng thức:
kj  k 1, j  kkk 1,k  j

j  1, 2,..., k  1

(1.10)

k 1

 kk 

 k    k 1, j  k  j
j 1
k 1

1    k 1, j  j

, độ trễ k = 1,2,3...

(1.11)

j 1

Tự tƣơng quan từng phần đƣợc khảo sát nhƣ là một hàm với tham số biến thiên

theo độ trễ k và đƣợc gọi là hàm tự tƣơng quan từng phần. Tự tƣơng quan từng
Học viên: Phạm Trung Thành

11

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

phần cũng đƣợc hiểu theo quan điểm của bài toán dự báo đó là giả định muốn dự
báo giá trị của zt+h từ các giá trị zt+h-1,.. zt, dựa trên hàm tuyến tính để kết hợp các
giá trị quá khứ này. Khi đó ngƣời ta sử dụng phƣơng pháp tối thiểu sai số bình
phƣơng trung bình (Mean Square Error- MSE)
h

MSE  E[( zt  h   ak zt  hk ) 2 ]
k 1

trên các giá trị có thể của trọng số a1,...,ah. Nếu xem xét kết quả này tại một trễ
cụ thể h thì khi đó tự tƣơng quan từng phần PACF đƣợc định nghĩa nhƣ là giá trị
của hệ số ah:  hh  a h
Hệ số R2 Đƣợc sử dụng để đo mức độ phù hợp của hàm hồi qui.
Giả sử cho mơ hình hồi qui chuỗi thời gian yt     zt  at , với yt gọi là
1

2

biến phụ thuộc (biến đƣợc giải thích), zt là biến độc lập,  1 là hệ số chặn,  2 là hệ
số góc, at là nhiễu (phần khơng giải thích đƣợc). Hệ số R2 đƣợc tính:

n

R2 

( ( zi  z )( yi  y )) 2
i 1

n

 (z  z ) ( y  y)
i 1

(1.12)

n

2

i

i 1

2

i

trong đó, n là số các quan sát, z là kỳ vọng mẫu của biến độc lập zt, y là kỳ vọng
mẫu của biến phụ thuộc yt. Dễ dàng thấy 0  R2  1 nếu R2 tiến đến 1 thì mơ
hình hồi qui đƣợc lựa chọn là hợp lý tức là sự thay đổi giá trị của biến phụ thuộc
đƣợc giải thích bằng mơ hình, ngƣợc lại nếu R2 tiến về 0 thì mơ hình đƣợc lựa

chọn là khơng hợp lý hay mơ hình khơng thể giải thích đƣợc sự biến đổi của
biến phụ thuộc.
Hệ số điều chỉnh R 2 Đôi khi hệ số R2 không phản ánh trung thực mức độ
phù hợp của mơ hình, chẳng hạn khi thêm các tham biến đƣợc cho là không hợp
lý vào mơ hình thì R2 khơng những khơng giảm mà ngƣợc lại cịn tăng lên. Vì
thế hệ số điều chỉnh R 2 đƣợc đƣa ra để thẩm định rõ sự phù hợp của mơ hình.
R 2  1  (1  R 2 )

n 1
nk

(1.13)

trong đó, n là số các quan sát của chuỗi thời gian, k là số các tham biến trong mơ
hình. R 2 ln nhỏ hơn R2, và giảm nếu bổ sung thêm biến hồi qui khơng hợp lý
vào mơ hình. R 2 càng gần 1 thì mức độ phù hợp của mơ hình càng cao.

Học viên: Phạm Trung Thành

12

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

1.1.3 Toán tử trễ và toán tử sai phân
Toán tử trễ và toán tử sai phân là hai toán tử thƣờng đƣợc dùng để biểu diễn
trong các mơ hình dự báo chuỗi thời gian. Ta có thể hiểu sơ bộ hai tốn tử này
nhƣ sau:

Tốn tử trễ Giả sử có chuỗi các quan sát {zt}, t = 1, 2, ...n. Toán tử trễ, ký
hiệu B, là một toán tử thao tác trên chuỗi thời gian với tính chất là làm dịch
chuyển quan sát tại thời gian t sang quan sát tại thời gian (t – 1):
Bzt  zt 1

(1.14)

Toán tử trễ có các tính chất điển hình sau:
- Bkzt = zt-k
- B0zt = zt

(1.15)

Toán tử sai phân Toán tử sai phân thƣờng đƣợc sử dụng để biến đổi
chuỗi thời gian khơng có tính mùa vụ khơng dừng thành chuỗi dừng và đƣợc
định nghĩa nhƣ sau:
- Sai phân bậc 1:   zt  zt 1  (1  B) zt
- Sai phân bậc 2:  2 zt  ( zt )  zt  2zt 1  zt 2 = (1-B)2zt
- Sai phân bậc d:  d zt  ( d 1 zt ) = (1-B)dzt

(1.16)

Toán tử sai phân theo mùa vụ đƣợc sử dụng để khử tính khơng dừng theo mùa
vụ trong quá trình biến đổi chuỗi thời gian có tính mùa vụ khơng dừng thành
thành chuỗi khơng có tính mùa vụ và dừng, nó đƣợc định nghĩa nhƣ sau:
- Sai phân theo trễ mùa vụ bậc 1: s zt  zt  zt s  (1  B s ) zt
- Sai phân theo trễ mùa vụ bậc D: SD zt  (1  B s ) D zt

(1.17)


Ở đây s là khoảng thời gian của một chu kỳ mùa vụ (sẽ đƣợc giải thích rõ hơn ở
phần dƣới).

1.1.4 Chuỗi thời gian dừng
Trƣớc khi phân tích, mơ hình hóa chuỗi thời gian cũng nhƣ đƣa ra dự báo,
đối với nhiều mơ hình một điều kiện cần đƣợc thỏa mãn là chuỗi thời gian phải
là chuỗi dừng. Bởi vì với chuỗi dừng thì các đại lƣợng đặc trƣng chẳng hạn
phƣơng sai, kỳ vọng của nó mới có nghĩa đồng thời chỉ khi xây dựng mơ hình
với chuỗi thời gian dừng thì dự báo đƣa ra mới đáng tin cậy. Do đó ta cần sử
dụng các phƣơng pháp để nhận biết đƣợc một chuỗi có dừng hay khơng, và nếu

Học viên: Phạm Trung Thành

13

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

chuỗi khơng dừng thì phải có cách thức nào để biến đổi chuỗi không dừng thành
dừng.
Chuỗi thời gian dừng

zt (t = 1, 2...n) đƣợc gọi là chuỗi dừng nếu kỳ vọng,

phƣơng sai không đổi theo thời gian và hiệp phƣơng sai giữa hai quan sát bất kỳ
chỉ phụ thuộc vào khoảng cách (độ trễ về thời gian) giữa t và t-k, không phụ
thuộc vào thời điểm hiệp phƣơng sai đƣợc tính, tức là về mặt tốn học chuỗi thời
gian zt đƣợc gọi là dừng nếu :

- - Kỳ vọng:

E ( zt )    const

- - Phƣơng sai: var( zt )   z2

t

t

(1.18)

- Tự hiệp phƣơng sai:  z (k )  cov( zt , zt k )  cov( zq , zqk ) t,q|t  q
Chuỗi nhiễu trắng

Một chuỗi đƣợc gọi là nhiễu trắng nếu nó hầu nhƣ

khơng thể hiện một cấu trúc, hình mẫu rõ rệt nào cũng nhƣ khơng có bất kỳ sự
tự tƣơng quan nào trong chuỗi. Về mặt toán học dãy các biến ngẫu nhiên {at}
đƣợc gọi là chuỗi nhiễu trắng nếu các at có phân phối giống nhau, độc lập và có
các đại lƣợng đặc trƣng nhƣ sau:
 E (at )  0,

t

 var(at )   ,
2
a

t


 a2 , k  0
  k  cov(at , at  k )  
 0, k  0
1, k  0
 k  
0, k  0

Nhiễu trắng at đƣợc ký hiệu at ~ WN (0,  a2 ) . Trong thực tế, rất hiếm chuỗi
thời gian là nhiễu trắng, nhƣng quá trình nhiễu trắng lại là cơng cụ cơ bản để tạo
ra mơ hình phức tạp.
Các phƣơng pháp kiểm định chuỗi thời gian dừng Có một số phƣơng
pháp hay đƣợc dùng để kiểm định một chuỗi thời gian có dừng hay khơng, trong
đó phƣơng pháp kiểm định dựa trên tƣơng quan đồ của hàm tự tƣơng quan ACF
là phƣơng pháp đƣợc ƣu tiên sử dụng trong đề tài. Bên cạnh đó, ta có thể kiểm
tra tính dừng bằng phƣơng pháp kiểm định nghiệm đơn vị DF: nếu có tồn tại
nghiệm đơn vị trong chuỗi thì kết luận đây là chuỗi khơng dừng. Đây là phƣơng
pháp tƣơng đối hữu hiệu. Một phƣơng pháp khác, nhƣng đề tài chỉ dùng để bổ
trợ cho hai phƣơng pháp trên là dùng kiểm định Q để kiểm định tính dừng của
chuỗi.
Học viên: Phạm Trung Thành

14

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

Phƣơng pháp kiểm định dựa trên tƣơng quan đồ của hàm ACF đƣợc ƣu tiên

sử dụng vì nó trực quan và khá hiệu quả. Tƣơng quan đồ là đồ thị thể hiện hàm
tự tƣơng quan (ACF) và tự tƣơng quan riêng (PACF) của một chuỗi thời
gian (sẽ trình bày cụ thể ở phần sau). Nếu chuỗi thời gian là ngẫu nhiên, tự
tƣơng quan sẽ gần về 0 ở tất cả khoảng phân chia thời gian. Nếu khơng ngẫu
nhiên thì một hoặc một số tự tƣơng quan sẽ khác 0. Khoảng tin cậy khoảng
trên 95% của tự tƣơng quan là ± 1.96/N 1/2. Nếu chuỗi là ngẫu nhiên và dừng
thì hàm tự tƣơng quan sẽ có phân bố xấp xỉ với phân bố chuẩn N(0,1/n) (n là số
các quan sát). Do vậy, nếu chuỗi là dừng thì 95% tự tƣơng quan mẫu sẽ nằm
trong khoảng giới hạn 1.96 / n (thể hiện bằng hai đƣờng viền nét đứt trong
tƣơng quan đồ của ACF). Cịn ngƣợc lại thì chuỗi khơng phải là dừng khi có
nhiều tự tƣơng quan mẫu nằm ngồi khoảng giới hạn này. Tính chất đặc trƣng
hàm ACF, với tham số trễ k, của chuỗi khơng dừng là nó giảm rất chậm khi k
tăng, và PACF thì có xu thế đạt điểm cực đại tại độ trễ 1.
Các phƣơng pháp biến đổi chuỗi thời gian dừng Nhƣ đã trình bày ở trên,
để xây dựng đƣợc mơ hình dự báo chính xác thì các chuỗi thời gian khơng dừng
cần đƣợc biến đổi thành các chuỗi thời gian dừng, bằng một số cách nhƣ sau:
Phương pháp khử xu thế: Tính xu thế trong chuỗi thời gian là một trong
những nguyên nhân chủ yếu làm cho chuỗi khơng dừng. Giả sử mơ hình ƣớc
lƣợng biểu diễn chuỗi thời gian không dừng zt chứa xu thế tuyến tính đƣợc biểu
diễn nhƣ sau:
zˆt  ˆ1  ˆ2t trong đó, ˆ1 , ˆ2 lần lƣợt là ƣớc lƣợng của hệ số chặn và hệ số góc.

Để biến đổi chuỗi không dừng zt thành chuỗi dừng, xem xét chuỗi phần dƣ,
eˆ  z  ˆ  ˆ t có dừng khơng.Ngồi ra xu thế cũng đƣợc biểu diễn mơ tả bằng
t

t

1


2

hàm đa thức, đƣờng cong tuyến tính, hàm mũ…Và phƣơng pháp loại trừ xu thế
trong chuỗi để biến đổi thành chuỗi dừng cũng đƣợc thực hiện bằng phƣơng
pháp tƣơng tự.
Phương pháp sai phân: Loại bỏ thành phần xu thế trong chuỗi bằng ứng
dụng toán tử sai phân bậc d (d ≥ 1):
 d zt  ( d 1 zt )

(1.19)

Loại bỏ thành phần mùa vụ trong chuỗi bằng cách sử dụng toán tử sai phân theo
trễ mùa vụ bậc D (D ≥ 1):
sD zt  (1  B s ) D zt
Học viên: Phạm Trung Thành

15

(1.20)

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

Loại trừ thành phần mùa vụ và xu thế trong chuỗi: ứng dụng kết hợp toán tử sai
phân theo mùa vụ bậc D và sai phân thƣờng bậc d:
 d sD zt  ( zt  zt 1 )d ( zt  zt s ) D  (1  B) d (1  B s ) D zt

(1.21)


Phương pháp hàm biến đổi: Chuỗi khơng dừng có thể có ngun nhân bởi
các dao động trong chuỗi khơng ổn định. Do đó hàm biến đổi đƣợc sử dụng để
tác động khiến dao động trong chuỗi trở nên ổn định hơn. Một tập hợp các hàm
biến đổi đƣợc Box-Cox đƣa ra, trong đó chẳng hạn là các hàm
zt  log( zt ) hoặc zt  zt .

1.1.5 Phân tích, dự báo chuỗi thời gian
Giả định cơ bản Phƣơng pháp phân tích, dự báo chuỗi thời gian dựa trên
giả định cơ bản là sự biến động của các hiện tƣợng trong tƣơng lai sẽ đƣợc giải
thích đƣợc sự biến động của các hiện tƣợng trong q khứ và hiện tại. Vì vậy
mục tiêu chính của phân tích, dự báo chuỗi thời gian là chỉ ra và tách biệt các
yếu tố ảnh hƣởng đến nó. Q trình phân tích, dự báo chuỗi thời gian {zt} là để
tìm ra các mơ hình, luật ẩn trong nó, đƣợc thực hiện trên mẫu các quan sát, đƣợc
tiến hành nhƣ sau:
Xây dựng mơ hình Bắt đầu bằng việc xác định mơ hình. Trƣớc tiên ta cần
tiến hành bƣớc chuẩn bị dữ liệu nhằm nhận dạng các thành phần ẩn tồn tại trong
chuỗi thời gian, làm trơn số liệu. Sau đó ta tiến tới bƣớc nhận dạng mơ hình, ƣớc
lƣợng các tham số mơ hình. Kết quả đƣợc mơ hình ở dạng thô. Kết quả ở dạng
thô này cần đƣợc tiếp tục xử lý ở bƣớc hiệu chỉnh và kiểm tra mơ hình để đƣợc
mơ hình cuối cùng thích hợp nhất; kiểm định để kiểm tra xem thực sự mô hình
cuối cùng này có đảm bảo những u cầu mang tính ngun tắc hay khơng. Nếu
khơng đảm bảo, quay lại bƣớc một. Chọn lựa mơ hình trong lớp các mơ hình
phân tích, dự báo chuỗi thời gian cần đƣợc tiến hành sao cho mơ hình đƣợc lựa
chọn là “tốt nhất”, phải thỏa mãn các tiêu chí kiểm định, đánh giá. Mơ hình
đƣợc chọn lựa cũng phải đơn giản và có thể hiểu đƣợc dễ dàng, nó sinh ra chuỗi
“gần giống” với chuỗi quan sát thực.
Chú ý: Bƣớc chuẩn bị dữ liệu cần thực hiện các công việc sau:
- Nhận dạng các thành phần ẩn tồn tại trong chuỗi thời gian: Thành phần xu
thế thể hiện chiều hƣớng biến động tăng hoặc giảm của các hiện tƣợng nghiên

cứu trong thời gian dài. Thành phần chu kỳ thể hiện biến động của hiện tƣợng
đƣợc lặp lại với chu kỳ nhất định, thƣờng kéo dài từ 2 đến 10 năm. Thành phần
Học viên: Phạm Trung Thành

16

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

mùa vụ biểu hiện sự tăng hoặc giảm mức độ của hiện tƣợng ở một số thời điểm
(tháng, quý) nào đó đƣợc lặp đi lặp lại qua nhiều năm. Thành phần ngẫu nhiên
thể hiện những biến động khơng có qui luật và hầu nhƣ không dự báo, quan sát
đƣợc lên giá trị của hiện tƣợng đang nghiên cứu. Nhiệm vụ ở bƣớc này là xác
định đƣợc các thành phần của chuỗi để tiến hành khử các chúng ở bƣớc hai.
- Làm trơn số liệu: Sau khi xác định đƣợc các thành phần trên trong chuỗi
thời gian, tiếp theo phải tiến hành làm trơn dữ liệu. Cụ thể hơn là loại trừ đƣợc
thành phần xu thế và mùa vụ trong chuỗi thời gian. Chuỗi thu đƣợc sau cùng
khơng cịn chứa các thành phần đó (chuỗi đƣợc làm trơn), khiến cho việc phân
tích, dự báo dễ dàng hơn. Việc khử các thành phần sẽ biến chuỗi ban đầu thành
một chuỗi mới ổn định hơn mà ta gọi là chuỗi dừng, giúp cho việc dự báo đƣợc
chính xác. Tất nhiên, sau khi dự báo cho chuỗi mới ta sẽ “bù” lại các thành phần
đã đƣợc khử để đƣợc kết quả cuối cùng phù hợp với chuỗi ban đầu.
Một số kiểm định thống kê: Để biết một mơ hình có phù hợp với thực tế hay
không, mức độ phù hợp nhƣ thế nào, đã tối ƣu hay chƣa, ta cần cần dùng các
phƣơng pháp kiểm định. Dƣới đây là một số phƣơng pháp kiểm định đƣợc dùng
trong luận văn:
Kiểm định T: Để kiểm định xem mỗi hệ số trong mơ hình  i (i = 1, …, n) =
0 hay không. Nếu Pr(T-Statistic) < 0,1 thì giả thuyết  i (i = 1, …, n) = 0 ở mức

dƣới 10% (hay giả thuyết này bị bác bỏ ở mức trên 90%); nếu Pr(T-Statistic) <
0,05 thì giả thuyết  i (i = 1, …, n) = 0 ở mức dƣới 5% (hay giả thuyết bị bác bỏ
ở mức trên 95%) và giả thuyết này bị bác bỏ ở mức trên 99% nếu nếu Pr(TStatistic) < 0,01, ...
Mức mỗi hệ số  i = 0 bị bác bỏ là do ngƣời sử dụng tự lựa chọn và khi giả
thuyết  i = 0 bị bác bỏ có nghĩa là  i khác 0 và biến Xi vẫn có mặt trong phƣơng
trình hồi qui.
Kiểm định d (Durbin - Watson): Dùng để phát hiện xem chuỗi phần dƣ hay
sai số của mơ hình có tự tƣơng quan hay khơng. Nếu có tự tƣơng quan thì dự
báo sẽ khơng chính xác. Nếu d nằm trong khoảng gần 2 là tốt (khoảng từ 1,8
đến 2,2), chuỗi phần dƣ khơng có tự tƣơng quan.
Tiêu chuẩn thông tin Akaike (AIC), Schwarz (SIC): Làm thế nào chọn đƣợc
mơ hình đƣợc cho là tối ƣu nhất trong nhiều mơ hình ứng cử, hai tiêu chuẩn AIC
hoặc SIC là những tiêu chuẩn cho phép chọn lựa đƣợc một mơ hình đƣợc cho là
tối ƣu nhất.
Học viên: Phạm Trung Thành

17

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin
-

Tiêu chuẩn: AIC (k )  log ˆ 2 

- Tiêu chuẩn: SIC (k )  logˆ 2 

2k
n

k log n
n

trong đó k là số lƣợng các tham số trong mơ hình, n là số các quan sát của chuỗi,

ˆ 2 là ƣớc lƣợng phƣơng sai (độ lệch) của mô hình.
Tiêu chí để chọn lựa mơ hình hợp lý trong nhiều mơ hình ứng cử là chọn giá
trị k (số các tham số) của mơ hình ứng cử dẫn đến giá trị AIC(k), SIC(k) là nhỏ
nhất. Nó thể hiện nguyên tắc tằn tiện trong việc lựa chọn mơ hình.
Dự báo Dựa trên mơ hình đƣa ra các dự báo về giá trị phần tử của chuỗi
trong tƣơng lai. Từ mô hình thực hiện dự báo giá trị tƣơng lai cho chuỗi, phân
tích sự phù hợp của giá trị dự báo cả về mặt thực nghiệm và lý thuyết. Xác định
độ chệch giữa giá trị dự báo với giá trị quan sát thực và khoảng tin cậy của dự
báo tức là giới hạn mà giá trị quan sát thực sẽ nằm trong đó.
Dự báo chuỗi thời gian là ƣớc lƣợng các giá trị của biến ngẫu nhiên chuỗi
thời gian zt+h ( h  1 ) tại thời điểm t, ký hiệu là zˆt (h) , dựa trên cơ sở các giá trị
của biến ngẫu nhiên {zt} đƣợc quan sát trong quá khứ và tại thời điểm này. Trên
cơ sở mơ hình đã đƣợc xây dựng, ta sẽ tiến hành dự báo các giá trị tƣơng lai của
hiện tƣợng nghiên cứu, trên cơ sở đó để lập kế hoạch, đề ra các quyết định trong
sản xuất, kinh doanh hoặc đề ra chính sách. Đồng thời cung cấp thêm các giá trị
quan sát mới vào dữ liệu chuỗi quan sát nhằm mục đích hiệu chỉnh lại mơ hình
để đƣa ra dự báo tốt hơn.
Dự báo trước một bước ngoài mẫu: Giả sử số liệu các biến có đến năm thứ
N. Sử dụng mơ hình đƣợc xây dựng để dự báo giá trị các biến Y năm N + 1, thì
giá trị dự báo này đƣợc gọi là đƣợc dự báo trƣớc một bƣớc ngoài mẫu.
Dự báo trước nhiều bước ngoài mẫu: Sử dụng mơ hình đƣợc xây dựng để
dự báo giá trị các biến ở năm N + h, thì giá trị dự báo ở thời điểm N + h đƣợc
gọi là đƣợc dự báo trƣớc nhiều bƣớc (ở đây là h bƣớc) ngoài mẫu.
Để dự báo trƣớc nhiều bƣớc ngoài mẫu, ta nên dự báo trƣớc một bƣớc ngoài
mẫu, lấy giá trị này bổ sung vào tập dữ liệu để ƣớc lƣợng lại các tham số mơ

hình và thực hiện dự báo trƣớc một bƣớc ngoài mẫu, ..., cứ nhƣ vậy cho đến khi
nhận đƣợc giá trị dự báo trƣớc nhiều bƣớc ngồi mẫu.

Học viên: Phạm Trung Thành

18

Lớp Hệ thống thơng tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

Đánh giá độ chính xác của dự báo và sai số của dự báo: Một cách đánh giá
độ chính xác dự báo là để lại một vài giá trị cuối cùng của mẫu. Sau đó dựa vào
một số thƣớc đo để đánh giá độ chính xác của kết quả dự báo. Nội dung này
thực chất là bƣớc dự báo kiểm định mơ hình nhƣ đã đƣợc giới thiệu trong hộp ở
trên.
Giả sử ta đã dự báo cho các thời kỳ (quan sát) n+1, n+2, ..., n+p và:
- et  yt  yˆt là độ lệch (hay sai số) giữa giá trị thực tế và giá trị dự báo ở thời
điểm;
- t, yt là giá trị quan sát thực tế và yt là giá trị dự báo của biến y tại thời điểm t.
Khi đó một số thƣớc đo hay đƣợc sử dụng để đánh giá độ chính xác của dự báo
là:
- Tổng bình phƣơng các sai số dự báo:

p

 (e )
j 1


2

j

-

Căn bậc hai sai số bình phƣơng trung bình:

-

Phần trăm sai số tuyệt đối:

p
2
 (e j )
j 1
p

yˆt  yt
* 100
yt

1.2 MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN ĐƠN BIẾN
Tính đơn biến của mơ hình đƣợc hiểu ở là trong mơ hình chỉ có các thành
phần của một cùng một chuỗi (chỉ có một biến), hoặc có thêm thành phần nhiễu.
Nói cách khác mơ hình đó thể hiện mối quan hệ giữa các phần tử của cùng một
chuỗi. Còn với nhiễu, ta hiểu đây là yếu tố mà mọi hệ thống đều có dù ít hay
nhiều. Nhiễu là hệ quả của các tác động tổng hợp mà ta khó có thể mơ hình hóa
đƣợc, làm sai lệch đầu ra thực tế so với đầu ra lý thuyết của mô hình trên cùng
một đầu vào. Ta cần xây dựng mơ hình sao cho biểu hiện của nhiễu là nhỏ nhất

và đƣa nhiễu về dạng nhiễu trắng.
Ƣu điểm của các mô hình đơn biến là chỉ cần dữ liệu quan sát hiện tại và quá
khứ của chính chuỗi cần dự báo, do đó tính phức tạp trong dữ liệu là nhỏ. Nhƣng
nhƣợc điểm của các mơ hình đơn biến lại chính là mặt trái của ƣu điểm trên,
Học viên: Phạm Trung Thành

19

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

nghĩa là mơ hình đơn biến khơng cho phép biểu diễn mối quan hệ tƣơng quan
giữa các chuỗi với nhau, do đó khơng chỉ ra đƣợc sự phụ thuộc, tác động qua lại
của chuỗi này với chuỗi khác. Điều đó dẫn đến, khi tiến hành phân tích, dự báo
các vấn đề kinh tế, xã hội cho nhiều đối tƣợng khác nhau với các mối liên hệ đa
chiều thì mơ hình đơn biến gặp nhiều hạn chế.

1.2.1 Mơ hình tích hợp trung bình trƣợt tự hồi quy ARMA(p,q).
Quá trình trung bình trƣợt tự hồi qui ARMA(p,q) cho chuỗi dừng {zt} đƣợc
biểu diễn nhƣ sau:
(1  1B  2 B2 -....  p B p ) zt  (1  1B  2 B2  ....  q Bq )at

(1.22)

 ( B) zt  ( B)at

(1.23)


hay
trong đó:
- at là nhiễu trắng

~ WN(0, a2 )

;

-  ,..., là p hệ số tự hồi qui,  ,... là q hệ số trung bình trƣợt;
1
p
1 q
- Đa thức  ( B) (1  1B  1 B2 -....  p B p ) khơng có thừa số chung với đa
thức :  ( B)  (1  1B  2 B2  ....  q Bq) .
Phát triển cao hơn của mơ hình này áp dụng cho các chuỗi khơng dừng ta
đƣợc mơ hình ARIMA(p,d,q). Với mơ hình này, các chuỗi khơng dừng sẽ đƣợc
sai phân d lần để có tính dừng và sau đó áp dụng mơ hình ARMA nhƣ trên.

1.2.2 Mơ hình làm trơn hàm mũ chuỗi thời gian
Mơ hình làm trơn hàm mũ đƣợc chia thành ba loại :
Làm trơn hàm mũ dạng đơn Đƣợc sử dụng cho các dự báo ngắn hạn, thƣờng
chỉ dự báo trƣớc một hai tháng, một hai q, một hai năm trong tƣơng lai. Mơ
hình này giả sử rằng dữ liệu dao động xung quanh một giá trị trung bình ổn định
chấp nhận đƣợc (khơng có xu thế tăng hoặc giảm). Nghĩa là đối với chuỗi không
thay đổi hoặc thay đổi rất chậm theo thời gian thì có thể áp dụng phƣơng pháp
này.
Mơ hình làm trơn hàm mũ bậc 2 Thực chất là một hệ 2 phƣơng trình với 2
tham số làm trơn. Một tham số làm trơn toàn bộ và một tham số làm trơn xu thế.
Phƣơng pháp này đƣợc sử dụng khi dữ liệu có tính xu thế nhƣng khơng có tính
mùa vụ.

Học viên: Phạm Trung Thành

20

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

Mơ hình làm trơn hàm mũ bậc 3 Đƣợc sử dụng khi trong dữ liệu có cả tính
xu thế và tính mùa vụ. Để theo dõi đƣợc tính mùa vụ, cần phải đƣa thêm vào
phƣơng trình thứ ba. Kết quả của hệ các phƣơng trình này đƣợc gọi là phƣơng
pháp làm trơn Holt-Winters (HW). Có hai mơ hình Holt-Winters hay đƣợc áp
dụng tuỳ theo đặc trƣng tăng trƣởng của mùa vụ đó là:
- Mơ hình mùa vụ nhân (Multiplicative Seasonal Model)
- Mơ hình mùa vụ cộng (Additive Seasonal Model)
Phƣơng pháp Holt-Winters cũng đƣợc sử dụng để dự báo chuỗi thời gian có tính
xu thế và khơng có tính mùa vụ, Khi đó ta có mơ hình Holt-Winter khơng mùa
vụ (no seasonal).

1.2.3 Mơ hình phƣơng sai thay đổi điều kiện tự hồi quy
Trong mơ hình ARMA(p,q)

 ( B) zt  ( B)at
đối với chuối thời gian dừng zt , khi các nhiễu at đƣợc coi là các biến ngẫu nhiên
độc lập với giả định (thông thƣờng) kỳ vọng bằng không và phƣơng sai khơng
đổi thì thực chất là ta đã ngầm định rằng phƣơng sai điều kiện của at dựa vào
thông tin quá khứ là hằng số, tức là không phụ thuộc vào quá khứ. Điều đó dẫn
đến khả năng giống nhau về nhiễu của các dự báo trƣớc k bƣớc .
Tuy nhiên với nhiều chuỗi thời gian, nhất là chuỗi thời gian trong lĩnh vực

kinh tế, tài chính tiền tệ và sản xuất kinh doanh, thì sự thay đổi của nhiễu biểu
hiện sự phụ thuộc vào nhiễu trong quá khứ với xu hƣớng độ lệch ngày càng lớn
hơn. Các mô hình ARCH do Engle đề xuất đã chú ý đến phƣơng sai nhiễu có
điều kiện trong các q trình ARMA phụ thuộc vào những đổi mới sáng tạo
đƣợc điều chỉnh trong quá khứ hơn là phƣơng sai nhiễu là hằng số nhƣ trong mơ
hình ARMA với các nhiễu độc lập.
Mơ hình ARCH tổng quát hay (GARCH(r,s)) thừa nhận rằng phƣơng sai ht
của giá trị nhiễu at đƣợc thể hiện bởi công thức
s

r

i 1

i 1

ht  E (at2 / at 1 , at 2 ,...) 0   i at2i    i ht i

trong đó at là chuỗi nhiễu của mơ hình và i  0 đối với mọi i = 1,…, r.

Học viên: Phạm Trung Thành

21

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

1.3 MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN ĐA BIẾN


1.3.1 Mơ hình hàm chuyển
Khi dự báo chuỗi thời gian bằng mơ hình đơn biến, ví dụ mơ hình ARIMA,
chúng ta sử dụng thông tin trong quá khứ và hiện tại của một chuỗi để dự báo
cho gía trị tƣơng lai của chính nó. Tuy nhiên có những tình huống mà chuỗi còn
bị tác động của giá trị quá khứ và hiện tại của các chuỗi khác. Chẳng hạn việc
thực hiện các chƣơng trình khuyến mại về một loại sản phẩm có thể tác động tới
doanh thu của sản phẩm này khơng chỉ hiện tại mà cịn trong tƣơng lai. Trong
những tình huống nhƣ vậy, mơ hình hàm chuyển, đƣợc đề xuất bởi BoxJenkins(1976), trong đó có tính đến tác động của các sự kiện nhƣ vậy lên chuỗi,
sẽ làm tăng tính chính xác của việc dự báo, thêm vào đó nó cịn giúp ta đánh giá
đƣợc tác động của các sự kiện này lên chuỗi đang quan tâm.
Mơ hình hàm chuyển chính là nội dung nghiên cứu của đề tài, sẽ đƣợc trình
bày cụ thể ở các chƣơng sau.

1.3.2 Mơ hình tự hồi quy véc tơ VAR
Trƣớc những năm 1980, mơ hình hệ phƣơng trình đồng thời đƣợc sử dụng
rộng rãi trong phân tích và dự báo các biến kinh tế vĩ mô cũng nhƣ trong các
nghiên cứu về chu kỳ kinh tế. Khi đó mối quan tâm của các nhà kinh tế lƣợng
đối với mơ hình này xoay quanh vấn đề định dạng của mơ hình - liên quan tới
tính nội sinh của các biến số trong mơ hình.
Trong mơ hình hệ phƣơng trình đồng thời, các biến nội sinh xuất hiện ở vế
phải của các phƣơng trình, và khi đó nếu sử dụng phƣơng pháp OLS thì các ƣớc
lƣợng thu đƣợc nói chung sẽ bị chệch và khơng vững (nghĩa là ngay khi kích
thƣớc mẫu tiến ra vơ cùng thì giá trị ƣớc lƣợng đƣợc cũng khơng hội tụ về giá trị
thực). Do đó việc ƣớc lƣợng hệ phƣơng trình này thƣờng đƣợc chuyển sang ƣớc
lƣợng hệ phƣơng trình rút gọn. Và để có thể khơi phục đƣợc các hệ số của hệ
ban đầu qua các ƣớc lƣợng của hệ rút gọn thì điều cần thiết là trong mơ hình ban
đầu, một số biến có thể xuất hiện trong phƣơng trình này nhƣng lại khơng có
mặt trong phƣơng trình khác của hệ.
Việc quyết định sự có mặt hay khơng có mặt của một biến số trong một

phƣơng trình của hệ thƣờng đƣợc dựa trên lý thuyết kinh tế hoặc trực quan của
ngƣời làm mơ hình. Chẳng hạn nếu biến Y1 đƣợc xem nhƣ khơng có tác động
Học viên: Phạm Trung Thành

22

Lớp Hệ thống thông tin K16


Luận văn cao học - Chuyên ngành: Hệ thống thông tin

đến biến Y2 thì Y1 có thể có mặt trong phƣơng trình của Y3 nhƣng khơng có mặt
trong phƣơng trình của Y2. Một trong những vấn đề của cách tiếp cận phi đối
xứng này là các giả định này không kiểm định đƣợc, nên trong trƣờng hợp cơ sở
lý thuyết kinh tế khơng đủ mạnh thì mơ hình có thể dẫn đến các kết luận sai lệch
vì nó khơng phản ánh hệ thống một cách hợp lý.
Sims (1980) đã thay đổi mối quan tâm của cộng đồng các nhà kinh tế lƣợng
đƣơng thời. Ông cho rằng hầu hết các biến số kinh tế, nhất là biến số kinh tế vĩ
mô đều mang tính nội sinh, nghĩa là đều có tác động qua lại lẫn nhau. Chẳng hạn
tuy cung tiền có thể đƣợc quyết định (tuy khơng hồn tồn) bởi Ngân hàng
Trung ƣơng, nhƣng các nhà làm chính sách tiền tệ đƣa ra quyết định của mình
về cung tiền thƣờng dựa trên các thông tin về động thái và thực trạng của các
biến kinh tế vĩ mô khác nhƣ lạm phát, thất nghiệp, tăng trƣởng kinh tế. Do đó
biến cung tiền về thực chất cũng mang tính nội sinh. Từ đó ơng đề xuất mơ hình
nhiều biến số mà trong đó các biến số trong mơ hình đều đóng vai trị nhƣ nhau,
và đều là biến nội sinh.
Tuy vẫn có những phê phán, nhƣng mơ hình VAR và các dạng biến thể của
nó đã chứng minh đƣợc tính ƣu việt của nó. Với một số ít biến trong mơ hình
nhƣng tính tin cậy của dự báo thu đƣợc thƣờng tốt hơn nhiều so với một mơ
hình hệ phƣơng trình đồng thời cồng kềnh nhiều biến và nhiều phƣơng trình. Do

đó ngày nay các mơ hình dạng VAR đã trở thành một công cụ quan trọng và
đƣợc sử dụng rộng rãi, đặc biệt là trong các bài toán liên quan đến các biến kinh
tế vĩ mơ, trong các khía cạnh sau đây:
- Dự báo, đặc biệt là dự báo trung hạn
- Phân tích cơ chế truyền tải sốc, nghĩa là xem xét tác động của một cú sốc
trên một biến lên các biến khác trong hệ thống.
Khi xây dựng mơ hình VAR dạng cơ bản, các biến thƣờng phải đƣợc xử lý
để trở thành các chuỗi dừng, và do đó trong một số trƣờng hợp có thể bỏ mất đi
các thơng tin quan trọng về mối quan hệ giữa các biến số, chẳng hạn thông tinh
về sự giống nhau trong xu hƣớng biến đổi khơng dừng giữa các biến số. Khi đó
một loại mơ hình mới dạng VAR đƣợc đƣa ra để áp dụng để thâu tóm các thơng
tin này, đó là mơ hình VECM – mơ hình hiệu chỉnh sai số dạng véc tơ. Mơ hình
này tỏ ra rất hữu ích trong việc thể hiện không chỉ mối quan hệ dài hạn giữa các
biến số mà còn thể hiện đƣợc động thái trong ngắn hạn trong quan hệ giữa các
biến số trong việc giữ cho hệ thống quy về mối quan hệ cân bằng dài hạn.
Học viên: Phạm Trung Thành

23

Lớp Hệ thống thông tin K16


×