Tải bản đầy đủ (.pdf) (69 trang)

Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng mô hình Holt - Winters

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.35 MB, 69 trang )


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
***


Tạ Mạnh Cường

DỰ BÁO CHUỖI DỮ LIỆU PHỤ
THUỘC THỜI GIAN THEO MÙA VỤ
BẰNG MÔ HÌNH HOLT-WINTERS




LUẬN VĂN THẠC SĨ




Hà nội - 2006

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
***

Tạ Mạnh Cường

DỰ BÁO CHUỖI DỮ LIỆU PHỤ
THUỘC THỜI GIAN THEO MÙA VỤ
BẰNG MÔ HÌNH HOLT-WINTERS



Ngành:
Công nghệ thông tin
Mã số:
1.01.10

LUẬN VĂN THẠC SĨ

Người hướng dẫn khoa học:
TS Đỗ Văn Thành



Hà nội - 2006
- i -

Mục lục
Lời cảm ơn 1
Mở đầu 2
Chương 1: Chuỗi thời gian và phân tích dự báo chuỗi thời gian 5
1. Chuỗi thời gian và dự báo chuỗi thời gian 5
1.1. Định nghĩa chuỗi thời gian 5
1.2. Dự báo chuỗi thời gian 6
2. Đại lượng đặc trưng chuỗi thời gian 7
2.1. Các đại lượng thống kê đặc trưng cho chuỗi thời gian 7
2.2. Các đại lượng mô tả mối quan hệ giữa các phần tử trong chuỗi 8
3. Phân tích, dự báo chuỗi thời gian 10
4. Các mô hình chuỗi thời gian đơn giản 12
4.1. Nhiễu trắng 12
4.2. Mô hình bước ngẫu nhiên 12

4.3. Bước ngẫu nhiên có bụi 12
5. Một số phép toán và kiểm định thống kê 13
5.1. Kiểm định T 13
5.2. Toán tử trễ 13
6. Kết luận chương 1 14
Chương 2: Mô hình làm trơn hàm mũ Holt-Winters 15
1. Một số khái niệm cơ bản 15
1.1. Mô hình mùa vụ cộng và mô hình mùa vụ nhân 15
1.2. Xu thế tuyến tính, hàm mũ hoặc kết hợp cả hai 18
1.3. Chỉ số mùa vụ SI (Seasonal Index) 18
- ii -

2. Làm trơn hàm mũ (Exponential smoothing) 18
2.1. Làm trơn hàm mũ dạng đơn giản (single exponential smoothing) . 18
2.2. Làm trơn hàm mũ bậc hai (double exponential smoothing) 20
2.3. Làm trơn hàm mũ bậc ba (triple exponential smoothing) 21
3. Mô hình mùa vụ nhân 21
3.1. Khái quát 21
3.2. Ứng dụng mô hình 22
3.3. Chi tiết 22
3.3.1. Các ký hiệu sử dụng 22
3.3.2. Thủ tục cho việc cập nhật các ước lượng tham số mô hình 22
3.3.3. Giá trị dự báo 23
3.3.4. Khởi tạo giá trị của các tham số trong mô hình 24
4. Mô hình mùa vụ cộng 25
4.1. Khái quát 25
4.2. Ứng dụng mô hình 26
4.3. Chi tiết 26
4.3.1. Các ký hiệu sử dụng 26
4.3.2. Thủ tục cho việc cập nhật các ước lượng tham số mô hình 26

4.3.3. Giá trị dự báo 27
5. Xây dựng mô hình làm trơn hàm mũ HW 28
5.1. Các bước xây dựng và lựa chọn các tham số 28
5.2. Đánh giá dự báo và sai số của dự báo 29
5.3. So sánh các bước xây dựng mô hình Holt-Winters và ARIMA: 30
5.4. Chuyển đổi mô hình HW sang mô hình ARIMA 31
5.5. Lựa chọn đặc tính chuỗi phù hợp với mô hình Holt-Winters 32
- iii -

6. Kết luận chương 2 33
Chương 3: Ứng dụng mô hình Holt-Winters cho mùa vụ 34
1. Bài toán 1 - Dự báo chỉ số giá tiêu dùng 34
1.1. Bước 1: Nhận dạng chuỗi 36
1.1.1. Nhận dạng thành phần xu thế 36
1.1.2. Nhận dạng thành phần mùa vụ 37
1.2. Lựa chọn mô hình Holt-Winters theo mùa vụ 38
1.3. Kiểm định các tham số ước lượng mô hình 40
1.4. Dự báo 41
2. Bài toán 2 - Dự báo giá trị hàng hoá xuất khẩu của Việt nam 43
2.1. Bước 1: Nhận dạng chuỗi 44
2.1.1. Nhận dạng thành phần xu thế 44
2.1.2. Nhận dạng thành phần mùa vụ 45
2.2. Lựa chọn mô hình Holt-Winters theo mùa vụ 47
2.3. Kiểm định các tham số ước lượng mô hình 48
2.4. Dự báo 49
3. So sánh, nhận xét giữa mô hình Holt-Winters và SARIMA 51
4. Kết luận chương 3 54
Kết Luận 55
Tài Liệu Tham Khảo 58
- iv -


Danh mục hình vẽ
Hình 1 - Chuỗi nhiễu trắng 12
Hình 2 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ cộng 17
Hình 3 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ nhân 17
Hình 4 - Các bước xây dựng mô hình Holt-Winters 28
- v -

Danh mục bảng biểu
Bảng 1 - So sánh các bước xây dựng mô hình HW và ARIMA 31
Bảng 2 - Chuyển đổi một số mô hình làm trơn hàm mũ sang ARIMA 31
Bảng 3 - Lựa chọn mô hình HW theo đặc tính chuỗi 33
Bảng 4 - Số liệu chỉ số giá tiêu dùng (nguồn dữ liệu: Tổng cục thống kê; đơn
vị tính 1/10.000) 35
Bảng 5 – Giá trị xuất khẩu của Việt nam (nguồn: tổng cục thống kê; đơn vị:
triệu USD) 44
Bảng 6 - Một số kết quả so sánh dự báo giữa mô hình HW & ARIMA 53
Bảng 7 - Một số đánh giá, nhận xét giữa mô hình HW & ARIMA 54
- vi -

Bảng từ ngữ, thuật ngữ viết tắt
Từ hoặc cụm từ
Từ viết
tắt
Từ tiếng Anh
Hàm tự tương quan
ACF
AutoCorrelation Function
Kiểm định DF
ADF

Argumented Dickey-Fuller
Tiêu chuẩn thông tin
AIC/SIC
AIC/SIC
Akaike Information Criteria,
Schwarz Information Criteria
Sai số phần trăm tuyệt đối
APE
Absolute Percent Error
Tự hồi qui
AR
AutoRegression
Tích hợp trung bình trượt tự
hồi qui
ARIMA
AutoRegressive Integrated
Moving Average
Trung bình trượt tự hồi qui
ARMA
AutoRegressive Moving
Average
Kiểm định DW
DW
Durbin-Watson
Mô hình làm trơn hàm mũ
Holt-Winters
HW
Exponential Smoothing (Holt-
Winters)
Phân phối đồng nhất độc lập

I.I.D
Independent Identical
Distribution
Trung bình trượt
MA
Moving Average
Sai số tuyệt đối trung bình
MAE
Mean Absolute Error
Sai số bình phương trung
bình
MSE
Mean Square Error
- vii -

Ước lượng bình phương nhỏ
nhất
OLS
Ordinary Least Square
Hàm tự tương quan từng
phần
PACF
Partial AutoCorrelation
Function
Tự hồi qui theo mùa vụ
SAR
Seasonal AutoRegressive
Tích hợp trung bình trượt tự
hồi qui theo mùa vụ
SARIMA

Seasonal AutoRegressive
Integrated Moving Average
Trung bình trượt theo mùa
vụ
SMA
Seasonal Moving Average
Tổng bình phương sai số
SSE
Sum of Square Error
Nhiễu trắng
WN
White Noise

- 1 -

Lời cảm ơn
Luận văn thạc sĩ chuyên ngành CNTT: “Dự báo chuỗi dữ liệu phụ
thuộc thời gian theo mùa vụ bằng mô hình Holt-Winters” được TS. Đỗ Văn
Thành công tác tại Trung tâm thông tin và dự báo Kinh tế - Xã hội Quốc gia -
Bộ kế hoạch và đầu tư, người đã tận tình hướng dẫn và giúp đỡ tác giả rất
nhiều trong quá trình thực hiện luận văn này, người đã mở ra cho tác giả
những cách tiếp cận mới của công nghệ thông tin vào trong đời sống thực tế.
Qua đây, tác giả xin gửi tới TS. Đỗ Văn Thành lời cảm ơn chân thành và sâu
sắc nhất.
Tác giả cũng xin bày tỏ lời cảm ơn tới các thầy TS. Hà Quang Thụy,
GS.TSKH. Phan Đình Diệu, PGS.TS. Trịnh Nhật Tiến, PGS.TS. Đoàn Văn
Ban, TS. Nguyễn Việt Hà, TS. Hoàng Xuân Huấn, PGS.TS. Nguyễn Ngọc
Bình, PGS TS. Đinh Mạnh Tường những người đã truyền cho tác giả nhiều
kiến thức và kinh nghiệm quý báu trong thời gian tác giả theo học cao học tại
Trường Đại học Công nghệ - Đại học Quốc gia Hà nội.

Tác giả cũng xin gửi lời cảm ơn chân thành đến một số cán bộ thuộc
Tổng cục Thống kê Việt nam, những người đã giúp đỡ nhiệt tình trong việc
cung cấp số liệu đầy đủ, trung thực phục vụ cho luận văn này.
Cuối cùng, tác giả xin gửi lời cảm ơn đến bạn Trần Văn Thái, người đã
giúp đỡ tác giả hoàn thành luận văn này đồng thời cũng xin gửi lời cám ơn tới
tất cả người thân trong gia đình, bạn bè trong quá trình học tập và công tác.


Tác giả


Tạ Mạnh Cường
- 2 -

Mở đầu
Vấn đề dự báo phát triển kinh tế - xã hội luôn là vấn đề quan tâm của
mọi quốc gia, nhất là đối với nước ta đang trong quá trình xây dựng nền kinh
tế thị trường trong bối cảnh toàn cầu hoá kinh tế phát triển ngày càng sâu,
rộng và cạnh tranh gay gắt. Trong nền kinh tế thị trường chức năng quản lý
nhà nước về kinh tế chủ yếu được thực hiện thông qua công cụ chính sách
phát triển kinh tế - xã hội. Kinh nghiệm của các nước có nền kinh tế thị
trường cho thấy để công cụ chính sách phát huy được hiệu quả điều rất quan
trong là phải thực hiện tốt công tác phân tích và dự báo phát triển kinh tế - xã
hội.
Với sự bùng nổ về thông tin và dữ liệu về kinh tế - xã hội, để dự báo
chính xác và kịp thời tình hình biến động của kinh tế - xã hội Việt Nam và thế
giới phục vụ công tác chỉ đạo, điều hành về kinh tế của Chính phủ thì việc
ứng dụng các phương tiện kỹ thuật và công nghệ của CNTT nhằm phát hiện
tri thức mới từ dữ liệu kinh tế - xã hội hiện tại và quá khứ là cách tiếp cận
đang được các nhà nghiên cứu và ứng dụng Việt Nam hết sức quan tâm. Luận

văn này nằm trong hướng nghiên cứu ứng dụng đó.
Như đã biết các dữ liệu phát triển kinh tế - xã hội là phụ thuộc thời
gian, được thu thập định kỳ theo tháng, quý, năm và có tính mùa vụ rất rõ.
Hiện đã có nhiều phương pháp dự báo kinh tế - xã hội khác nhau, mỗi phương
pháp thường phù hợp với một số vấn đề dự báo kinh tế - xã hội nhất định
trong một nền kinh tế cụ thể, bởi vậy việc nghiên cứu xác định phương pháp
dự báo hiệu quả, phù hợp với thực tiễn phát triển kinh tế - xã hội Việt nam là
vấn đề đòi hỏi phải được quan tâm nghiên cứu ứng dụng.
Trong phân tích và dự báo dữ liệu chuỗi thời gian về kinh tế - xã hội,
hiện có bốn mô hình đang được đặc biệt quan tâm, đó là mô hình hồi quy
- 3 -

chuỗi thời gian, mô hình tích hợp trung bình trượt tự hồi quy ARIMA, mô
hình tự hồi quy véc tơ VAR và mô hình làm trơn hàm mũ Holt-Winters. Cùng
với mô hình ARIMA, mô hình Holt-Winters cũng đang được xem là rất thích
hợp cho dự báo ngắn hạn một số vấn đề về kinh tế - xã hội từ dữ liệu chuỗi
thời gian có tính mùa vụ.
Luận văn ”Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng
mô hình Holt-Winters” sẽ tập trung khảo cứu và ứng dụng mô hình làm trơn
hàm mũ Holt-Winters để dự báo biến động về chỉ số giá tiêu dùng và giá cả
một số mặt hàng theo tháng, tổng giá trị xuất khẩu của Việt nam theo tháng
trên những số liệu chính thống do Tổng cục Thống kê thu thập. Việc dự báo
những nội dung trên đã được thực hiện bằng việc ứng dụng mô hình ARIMA
đã được trình bầy trong một luận văn cao học, khoa CNTT - Đại học Công
nghệ thực hiện, trong luận văn này sẽ tập trung nghiên cứu làm rõ sự giống và
khác nhau của hai mô hình này, so sánh kết quả dự báo bằng việc ứng dụng cả
hai mô hình trên cùng tập dữ liệu thử nghiệm.
Luận văn gồm 3 chương nội dung, không kể phần mở đầu, phần kết
luận, phần phụ lục và tài liệu tham khảo.
Chương 1: Chuỗi thời gian và Phân tích chuỗi thời gian, sẽ giới thiệu

một cách tóm tắt những khái niệm chủ yếu liên quan đến chuỗi thời gian và
các bước tiến hành phân tích và dự báo chuỗi thời gian, giới thiệu một số mô
hình chuỗi thời gian đơn giản và một số kiểm định thống kê sử dụng cho phân
tích, dự báo dữ liệu chuỗi thời gian. Chi tiết của những khái niệm này có thể
được tham khảo trong phần phụ lục.
Chương 2: Mô hình làm trơn hàm mũ Holt-Winters. Nội dung chính
của chương là trình bày một cách có hệ thống mô hình làm trơn hàm mũ đơn,
mô hình làm trơn hàm mũ bậc hai và mô hình làm trơn hàm mũ bậc ba (Holt-
Winters) để dự báo dữ liệu chuỗi thời gian có tính chất xu thế và tính chất
- 4 -

mùa vụ. Việc lựa chọn mô hình làm trơn hàm mũ nào phụ thuộc vào tính chất
dữ liệu chuỗi thời gian cụ thể.
Chương 3: Ứng dụng mô hình Holt-Winters. Chương này tập trung
trình bày qui trình ứng dụng mô hình Holt-Winters theo mùa vụ để dự báo
một số chỉ số kinh tế vĩ mô quan trọng phản ánh mức độ tăng trưởng kinh tế
Việt nam như dự báo chỉ số giá tiêu dùng theo tháng (CPI), tổng giá trị hàng
hóa xuất khẩu của Việt nam theo tháng. Dữ liệu được sử dụng để dự báo là số
liệu thực tế của nền kinh tế do Tổng cục Thống kê công bố. Các kết quả dự
báo theo mô hình Holt-Winters sẽ được so sánh với các kết quả dự báo theo
mô hình ARIMA.
Phần kết luận: Tổng kết những công việc đã thực hiện và kết quả đạt
được trong luận văn này, đồng thời đề xuất một số hướng nghiên cứu tiếp
theo.
Phụ lục: Gồm hai phần, Phần 1 của phụ lục sẽ giới thiệu chi tiết hơn
một số khái niệm quan trọng liên quan đến chuỗi thời gian và phân tích, dự
báo dữ liệu chuỗi thời gian, Phần 2 của phụ lục sẽ giới thiệu mô hình ARIMA
cho mùa vụ.
- 5 -


Chương 1:
Chuỗi thời gian và phân tích dự báo chuỗi thời
gian
Phân tích, dự báo chuỗi thời gian có thể được chia làm hai loại: Phân
tích, dự báo theo mức thời gian và phân tích mối liên hệ nguyên nhân - kết
quả. Phương pháp dự báo theo mức thời gian liên quan đến việc dự báo các
giá trị tương lai của yếu tố được nghiên cứu dựa trên sự tương quan với các
quan sát trong quá khứ và hiện tại. Trong khi đó phân tích mối liên hệ nhân
quả liên quan đến việc xác định các nhân tố khác ảnh hưởng đến yếu tố muốn
dự báo, như dùng phương pháp phân tích hồi qui bội xem xét GDP phụ thuộc
vào lượng đầu tư trong nước, lượng đầu tư nước ngoài, dân số…
Luận văn này chỉ tập trung vào phân tích, dự báo theo mức thời gian
dựa trên giả định cơ bản là các yếu tố ảnh hưởng đến biến động của hiện
tượng trong quá khứ và hiện tại sẽ còn tiếp tục tồn tại trong tương lai.
Chương này sẽ trình bày sơ lược một số vấn đề chủ yếu liên quan đến
chuỗi thời gian bao gồm khái niệm, dự báo cho chuỗi thời gian và các đại
lượng đặc trưng của nó, tiếp đó trình bày về các mô hình chuỗi thời gian đơn
giản, đưa ra một số phương pháp kiểm định thống kê cho mô hình chuỗi thời
gian. Chi tiết xin tham khảo ở phần Phụ lục.
1. Chuỗi thời gian và dự báo chuỗi thời gian
1.1. Định nghĩa chuỗi thời gian
Chuỗi dữ liệu phụ thuộc thời gian được chia làm hai loại:
- Chuỗi dữ liệu phụ thuộc thời gian được quan sát, đo đạc trong khoảng
thời gian rời rạc: Các quan sát được thực hiện tại các thời điểm tách
- 6 -

biệt, chúng thường là các quan sát được đo tại các mốc thời gian cách
đều nhau, ví dụ chuỗi thời gian được đo theo tuần, quý, tháng, năm, ….
- Chuỗi dữ liệu liên tục theo thời gian: Các quan sát được đo trong
khoảng thời gian liên tục, ví dụ chuỗi dữ liệu đo nhiệt độ trong ngày

(nhiệt kế).
Luận văn này tập trung vào chuỗi dữ liệu phụ thuộc thời gian được đo
trong khoảng thời gian rời rạc và cách đều nhau, gọi là chuỗi thời gian (series
time data)
Như vậy: Chuỗi thời gian là một tập giá trị các quan sát của biến ngẫu
nhiên, ký hiệu là
}{
t
z
,
1, ,nt 
là số các quan sát, đo được trong các khoảng
thời gian
t
như nhau (hàng năm, quý, tháng, tuần, ngày …) và được xếp theo
thứ tự thời gian.
Ví dụ:
- Chuỗi giá trị tổng sản phẩm quốc nội (GDP) được đo theo từng quý.
- Chuỗi giá trị đo lượng mưa trung bình hàng năm.
- Chuỗi giá trị chỉ số thị trường chứng khoán đo theo ngày.
- Chuỗi giá trị đo sản lượng điện năng tiêu thụ của Việt Nam đo theo
từng tháng, từng quí trong nhiều năm.
- Chuỗi giá trị về chỉ số giá tiêu dùng của Việt Nam theo từng tháng, quý
trong năm.
1.2. Dự báo chuỗi thời gian
Dự báo chuỗi thời gian là ước lượng các giá trị của biến ngẫu nhiên
chuỗi thời gian
ht
z



1)(h 
, ký hiệu là
)(
ˆ
hz
t
, dựa trên sự tương quan với các
giá trị của biến ngẫu nhiên
}{
t
z
đã được quan sát trong quá khứ.
Chất lượng của dự báo phụ thuộc vào nhiều yếu tố chẳng hạn sự phức
tạp của chuỗi thời gian khi thực hiện phân tích, tác động của nhiều yếu tố bất
- 7 -

thường không thể lường trước được khi tiến hành dự báo, ngoài ra độ chính
xác cũng còn phụ thuộc phần lớn vào khoảng cách xa gần của dự báo (dự báo
gần thì cho độ chính xác của dự báo tốt hơn so với dự báo xa).
2. Đại lượng đặc trưng chuỗi thời gian
Giả sử có chuỗi thời gian
}{
t
z
gồm
n
các quan sát,
1, ,nt 
.

2.1. Các đại lượng thống kê đặc trưng cho chuỗi thời
gian
Kỳ vọng: Đại diện cho giá trị trung tâm trong chuỗi:


)(
t
zE

)1.1(

Kỳ vọng của tổng thể được tính dựa trên mẫu các quan sát gọi là kỳ vọng
mẫu, như sau:




n
t
t
z
n
z
1
1

(1.2)

Phương sai: Đại diện cho mức độ phân tán các giá trị trong chuỗi xung
quanh kỳ vọng của nó:


]μ)E[(zσ)(z
tzt
22
var 

(1.3)

Tương tự, phương sai mẫu được tính:

2
1
2
)(
1
ˆ



n
t
tz
zz
n


(1.4)

Độ lệch chuẩn: là căn bậc hai của phương sai mẫu:


2
ˆˆ
zz



(1.5)

- 8 -

2.2. Các đại lượng mô tả mối quan hệ giữa các phần tử
trong chuỗi
Tự hiệp phương sai: Tự hiệp phương sai giữa hai
t
z

kt
z

, giữa
chúng có
1k 
quan sát gọi là
k
độ trễ, được xác định như sau:

   
))((,cov)(




 kttkttz
zzEzzk

(1.6)

Trong đó,

là kỳ vọng chung của
t
z

kt
z

. Tự hiệp phương sai khi
độ trễ
0k
chính là phương sai của
t
z
:
 
2
,cov)0(
zttz
zz


.

Tương tự, tự hiệp phương sai mẫu được tính:

))((
1
)(
ˆ

1
zzzz
n
k
kt
kn
t
tz






,
11, ,nk 

(1.7)

Trong đó,
z
là kỳ vọng mẫu của
t

z

kt
z

.
Hàm tự tương quan (ACF): Mô tả tương quan tại trễ
k
giữa các giá
trị trong chuỗi thời gian, được xác định:

 
   
22
)()(
))((
)(
),cov(













ktt
ktt
zz
z
zz
ktt
k
zEzE
zzE
k
zz
kttktt

(1.8)

Trong đó,
)k(
z

là tự hiệp phương sai,
ktt
zz


,
lần lượt là độ lệch
chuẩn của
t
z


kt
z

.
Tự tương quan mẫu được tính theo công thức:

)0(
ˆ
)(
ˆ
ˆ
z
z
k
k





(1.9)

Nếu như
t
z

kt
z

không tương quan với nhau thì tự tương quan

0
ˆ

k

, do khi đó
0),cov(


 ktt
zz
. Nhưng điều ngược lại chưa hẳn đã đúng.
Hàm tự tương quan từng phần (PACF): Tự tương quan giữa hai biến
t
z

kt
z

gồm
1k 
biến trung gian
1t
z

,
2t
z

, … ,

1kt
z

:
- 9 -













1
1
,1
1
1
,1
1
k
j
jjk
k
j

jkjkk
kk



, độ trễ
2,3, k 

(1.10)


jkkkkjkkj 

,1,1

,
11,2, ,kj 

(1.11)

Giá trị ban đầu,
111



Bằng tính toán tương tự trên các quan sát mẫu có được tự tương quan
từng phần mẫu
kk

ˆ

. Khảo sát tự tương quan từng phần như một hàm với tham
số biến thiên theo độ trễ
k
được gọi là hàm tự tương quan từng phần.
Hệ số R
2
: Được sử dụng để đo độ thích hợp của mô hình ước lượng.
Giả sử cho mô hình hồi qui chuỗi thời gian
ttt
azy 
21

. Hệ số
2
R

được tính:








n
i
i
n
i

i
n
i
ii
yyzz
yyzz
R
1
2
1
2
2
1
2
)()(
)))(((

(1.12)

Trong đó,
n
là số các quan sát,
z
là kỳ vọng mẫu của biến độc lập
t
z
,
y

kỳ vọng mẫu của biến phụ thuộc

t
y
. Dễ dàng thấy
10
2
 R
nếu
2
R
tiến
đến 1 thì mô hình hồi qui được lựa chọn là hợp lý, ngược lại nếu
2
R
tiến về 0
thì mô hình được lựa chọn là chưa hợp lý.
Hệ số điều chỉnh
2
R
: Đôi khi hệ số
2
R

không phản ánh trung thực
mức độ hợp lý của mô hình, chẳng hạn khi thêm các tham biến được cho là
không hợp lý vào mô hình thì
2
R
không những không giảm mà ngược lại còn
tăng lên. Vì thế hệ số điều chỉnh
2

R
được xem xét để thẩm định rõ sự phù
hợp của mô hình:
- 10 -


kn
n
RR



1
)1(1
22

(1.13)

ở đây
n
là số các quan sát của chuỗi thời gian,
k
là số các tham biến trong
mô hình.
2
R
luôn nhỏ hơn
2
R
, và giảm nếu bổ sung thêm biến hồi qui không

hợp lý vào mô hình.
3. Phân tích, dự báo chuỗi thời gian
Quá trình phân tích, dự báo chuỗi thời gian
}{
t
z
là để tìm ra các mô
hình, luật ẩn trong nó, việc này được thực hiện trên các quan sát mẫu, gồm có
những bước sau:
Bước 1: Nhận dạng các thành phần ẩn tồn tại trong chuỗi thời gian [4]
- Thành phần xu thế (Trend - T): Thể hiện chiều hướng biến động tăng
hoặc giảm của các hiện tượng nghiên cứu trong thời gian dài.
- Thành phần chu kỳ (Period - P): Thể hiện biến động của hiện tượng
được lặp lại với chu kỳ nhất định, thường kéo dài từ 2 đến 10 năm.
- Thành phần mùa vụ (Seasonal - S): Biểu hiện sự tăng hoặc giảm mức
độ của hiện tượng ở một số thời điểm (tháng, quý, năm) nào đó được
lặp đi lặp lại qua nhiều năm.
- Thành phần ngẫu nhiên (Irregular - I): Thể hiện những biến động không
có qui luật và hầu như không dự báo hoặc quan sát được trong của hiện
tượng đang nghiên cứu.
Những thành phần này kết hợp với nhau trong chuỗi thời gian bằng
nhiều cách thức khác nhau, chẳng hạn chuỗi thời gian
t
z
được mô tả là tích
các thành phần,
ISPTz
t

gọi là mô hình tích, hoặc

ISPTz
t


gọi là mô hình tổng, hoặc kết hợp cả hai
ISPTz
t

. Do vậy, để phân
tích và nghiên cứu hành vi cũng như dự báo biến động của chuỗi thời gian thì
- 11 -

cần thiết phải ước lượng được các thành phần nói trên trong chuỗi thời gian
và cách thức kết hợp chúng với nhau trong chuỗi.
Bước 2: Làm trơn số liệu
Tuỳ theo mô hình dự báo áp dụng mà cần thiết tiến hành bước làm trơn
số liệu hay không ?. Trong trường hợp mô hình dự báo áp dụng cần quá trình
làm trơn số liệu ta tiến hành loại trừ được thành phần xu thế và mùa vụ trong
chuỗi thời gian. Chuỗi thu được sau cùng không còn chứa các thành phần đó
(chuỗi được làm trơn) sẽ khiến cho việc phân tích dễ dàng hơn.
Bước 3: Chọn lựa, ước lượng và đánh giá mô hình
Chọn lựa mô hình trong lớp các mô hình, sao cho mô hình được lựa
chọn là “tốt nhất” trong số các mô hình ứng cử và nó cũng phải đơn giản và
có thể hiểu được dễ dàng. Sau đó thực hiện ước lượng các tham số, phần dư
cho mô hình vừa chọn lựa và chúng phải thỏa mãn các tiêu chí kiểm định,
đánh giá. Mô hình ước lượng được đánh giá là hợp lý khi đó sẽ sinh ra chuỗi
“gần giống” với chuỗi dữ liệu quan sát thực.
Bước 4: Dự báo
Dựa trên mô hình thực hiện dự báo giá trị tương lai cho chuỗi thời gian,
phân tích sự phù hợp của giá trị dự báo cả về mặt thực nghiệm và lý thuyết.

Xác định độ chệch giữa giá trị dự báo với giá trị quan sát thực và khoảng tin
cậy của dự báo tức là giới hạn mà giá trị quan sát thực sẽ nằm trong.

Ứng dụng kết quả dự báo vào thực tế
Trên cơ sở các dự báo về các giá trị tương lai của hiện tượng nghiên
cứu đề ra các quyết định kinh doanh hoặc chính sách. Đồng thời gộp thêm các
giá trị quan sát mới vào chuỗi dữ liệu quan sát nhằm mục đích hiệu chỉnh lại
mô hình để đưa ra dự báo tốt hơn.
- 12 -

4. Các mô hình chuỗi thời gian đơn giản
4.1. Nhiễu trắng
[2]

Chuỗi thời gian là nhiễu trắng nếu nó hầu như không thể hiện một cấu
trúc, hình mẫu rõ rệt nào cũng như không có bất kỳ sự tự tương quan nào
trong chuỗi. Chuỗi nhiễu trắng, ký hiệu
t
a
, là dãy các biến ngẫu nhiên có
phân phối đồng nhất độc lập (Independent Identical Distribution - i.i.d)
Nhiễu trắng
t
a
được ký hiệu
),0(~
2
at
WNa




Hình 1 - Chuỗi nhiễu trắng.
Trong thực tế, rất hiếm chuỗi thời gian là nhiễu trắng, nhưng nó lại là
công cụ cơ bản để tạo ra mô hình phức tạp.
4.2. Mô hình bước ngẫu nhiên
[9]
[3]

Mô hình bước ngẫu nhiên là mô hình mà giá trị sinh ra từ nó được xác
định bằng giá trị của quan sát ngay trước nó cộng thêm nhiễu trắng:

ttt
azz 
1

(1.14)

trong đó,
1,2 t 

t
a
là nhiễu trắng,
t
a

t
z
không tương quan với nhau.

4.3. Bước ngẫu nhiên có bụi
Mô hình bước ngẫu nhiên có bụi là mô hình bước ngẫu nhiên cộng
thêm một hằng số α:
- 13 -


ttt
azz 
1


(1.15)

5. Một số phép toán và kiểm định thống kê
Xét mô hình tổng quát:

tt21t
azy 

(1.16)

trong đó, giả định
t
a
là nhiễu trắng,
1

là hệ số chặn và
2


là hệ số góc. Một
số phép toán và kiểm định thống kê cho mô hình trên gồm:
5.1. Kiểm định T
Do các hệ số
1

,
2

là tổng thể, chúng chỉ có thể ước lượng được qua
từng mẫu cụ thể, gọi là hệ số ước lượng mẫu
1
ˆ

,
2
ˆ

. Khi thực hiện các ước
lượng này, điều được quan tâm hơn cả là hệ số ước lượng này có bằng 0 hay
không ? Kiểm định T còn được gọi là kiểm định ý nghĩa của hệ số ước lượng
trong mô hình, với giả thiết kiểm định thống kê
0:H
0

j

để kiểm chứng
điều đó. Thống kê:


jj
jjj
T





ˆˆ
ˆ
ˆ
ˆ
ˆ




(1.17)

trong đó,
j

ˆ
là hệ số ước lượng mẫu
j

j


ˆ

ˆ
là phương sai ước lượng của
hệ số ước lượng mẫu
j
, thống kê T tuân theo phân phối chuẩn T với
1n 

bậc tự do.
5.2. Toán tử trễ
[1]

Giả sử có chuỗi các quan sát
}{
t
z
,
1, ,nt 

Toán tử
B
được gọi là toán tử trễ nếu nó thực hiện phép biến đổi:

1

tt
zBz

(1.18)

- 14 -


Toán tử trễ có các tính chất điển hình sau:
-
ktt
k
zzB



-
00
BzzB
tt


Bên cạnh toán tử trễ, cũng có thêm toán tử sai phân được dùng để thao
tác trên chuỗi thời gian được định nghĩa:
- Sai phân bậc 1:
ttt
zBzz )1(
1



(1.19)

- Sai phân bậc 2:
21
2)(
2





t
z
t
z
t
z
t
z
t
z

(1.20)

- Sai phân bậc
d
:
)
1
(
t
z
d
t
z
d 



(1.21)

- Sai phân theo trễ mùa vụ bậc 1:

t
z
s
B
st
z
t
z
t
z
s
)1( 



(1.22)

- Sai phân theo trễ mùa vụ bậc
D
:
t
z
Ds
B
t

z
D
s
)1( 

(1.23)

6. Kết luận chương 1
Trong chương 1 đã trình bày tóm lược một số khái niệm liên quan đến
chuỗi thời gian, dự báo chuỗi thời gian và giới thiệu một số lĩnh vực trong
thực tế có ứng dụng việc phân tích, dự báo chuỗi thời gian. Các bước chủ yếu
để tiến hành phân tích, dự báo chuỗi thời gian và một số mô hình chuỗi thời
gian đơn giản cũng như các đại lượng đặc trưng như trung bình, phương sai,
tự tương quan, tự tương quan từng phần… cho chuỗi thời gian và công thức
xác định chúng cũng được đề cập đến trong chương này. Chi tiết xin tham
khảo ở phần Phụ lục.
Trong chương tiếp theo của luận văn sẽ trình bày mô hình dự báo dữ
liệu chuỗi thời gian mang tính mùa vụ đang được quan tâm nghiên cứu ứng
dụng: mô hình làm trơn hàm mũ Holt-Winters.
- 15 -

Chương 2:
Mô hình làm trơn hàm mũ Holt-Winters
Có rất nhiều dữ liệu chuỗi thời gian có tính chất mùa vụ, ví dụ số lượng
tiêu thụ quần áo hay doanh thu mặt hàng đồ chơi cho trẻ em, chỉ số giá tiêu
dung trong năm… Bài toán dự báo theo mùa vụ có một vị trí quan trọng trong
dự báo tình hình phát triển kinh tế - xã hội hay trong sản xuất kinh doanh của
bất kỳ đơn vị sản xuất kinh doanh nào. Chương này tập trung giới thiệu mô
hình làm trơn hàm mũ Holt-Winters. Hai mô hình trong kỹ thuật làm trơn
hàm mũ Holt-Winters được giới thiệu trong chương này là: mô hình mùa vụ

nhân (Multiplicative Seasonal Model) và mô hình mùa vụ cộng (Additive
Seasonal Model) cho chuỗi thời gian có tính chất xu thế và tính chất mùa vụ.
1. Một số khái niệm cơ bản
1.1. Mô hình mùa vụ cộng và mô hình mùa vụ nhân
Rất nhiều chuỗi thời gian trong thực tế thể hiện các mẫu, hành vi lặp lại
có tính mùa vụ. Có một sự khác biệt nhỏ trong khái niệm giữa tính chu kỳ và
tính mùa vụ, đó là tính chu kỳ thể hiện một hành vi, mẫu xuất hiện lặp lại
không ít thì nhiều trong một khoảng thời gian nào đó, chẳng hạn chu kỳ nhật
thực, chu kỳ tuần hoàn… còn tính mùa vụ chỉ ra rằng các hành vi, mẫu lặp đi
lặp lại đều đặn trong những khoảng thời gian cố định như hàng năm, hàng
ngày, hàng tuần, hàng thập kỷ. Thuật ngữ “mùa vụ” đã trở thành thông dụng
khi dữ liệu chuỗi thời gian được phân tích theo tháng, quý hoặc năm. Khoảng
thời gian của một mùa vụ được ký hiệu là
s
. Nếu dữ liệu được lấy theo tháng
thì khoảng thời gian cho một mùa vụ
s
là 12 (có 12 tháng/năm), nếu lấy theo
quý thì khoảng thời gian cho một mùa vụ
s
là 4 (có 4 quí/năm), theo ngày thì
- 16 -

s
là 24 (24 giờ/ngày), theo tuần thì
s
là 7; 6; 5 (7 ngày/tuần, 6 ngày/tuần, 5
ngày/tuần tuỳ theo số ngày thu thập dữ liệu).
Ví dụ, doanh thu từ một mặt hàng đồ chơi cho trẻ em nào đó thường lên
đến đỉnh điểm vào tháng 11, 12 trong năm và giảm thấp nhất vào mùa hè

trong năm. Doanh thu bán hàng của mặt hàng đồ chơi này có thể tăng đỉnh
điểm thêm khoảng 1 triệu dollar tháng 12 hàng năm. Vì vậy, chúng ta có thể
đưa vào phần dự báo cho tháng 12 doanh thu tăng thêm 1 triệu dollar (trên
doanh thu trung bình hàng năm) của việc bán hàng và doanh thu này diễn ra
đều đặn hàng năm. Trong trường hợp này, ta nói dữ liệu chuỗi thời gian này
có tính chất mùa vụ tăng trưởng theo cấp số cộng hay tuân theo mô hình mùa
vụ cộng (Additive Seasonal Model).
Một cách khác, trong tháng 12 doanh thu bán hàng của của một mặt
hàng đồ chơi cho trẻ em nào đó có thể tăng 40% (so với doanh thu trung bình
hàng năm) có nghĩa là hệ số tăng trưởng của doanh thu là 1,4. Vì vậy, doanh
thu bán hàng của mặt hàng đồ chơi trong tháng 12 có thể đạt cao hay thấp
nhưng mức độ tăng trưởng doanh thu của tháng sẽ tăng tỷ lệ theo một hệ số
cố định nào đó (trong trường hợp này là 1,4). Trong trường hợp này, ta nói dữ
liệu chuỗi thời gian có tính chất mùa vụ tăng trưởng theo cấp số nhân hay
tuân theo mô hình mùa vụ nhân (Multiplicative Seasonal Model)

×