PHÂN TÍCH DỮ LIỆU VÀ DỰ BÁO
P.
T.B
KHOA KINH TẾ
ptbinh[a-còng]ueh.edu.vn
Bài giảng 3: Các mô hình dự báo giản đơn
Nội dung:
Dự báo thô
Trung bình giản đơn
Trung bình di động đơn/kép
San mũ giản đơn
San mũ Holt/San mũ Winter
Phân tách chuỗi thời gian
Phần mềm ForecastX/Crystal Ball
Phân biệt 3 phương pháp đơn giản:
Các phương pháp dự báo thô: Giả định dữ
liệu gần nhất cung cáp các dự đoán tốt
nhất tương lai.
Các phương pháp bình quân: Dự báo dựa
trên giá trị trung bình của các quan
sát quá khứ (tầm quan trọng như nhau).
Các phương pháp san mũ: Dự báo bằng
cách lấy trung bình giá trị quá khứ của
chuỗi dữ liệu với trọng số giảm dần
(tầm quan trọng giảm dần).
1. Một phương pháp dự báo được chọn dựa
trên phân tích và cảm nhận của người
làm dự báo về bản chất của dữ liệu.
2. Bộ dữ liệu được chia thành 2 phần:
Phần chạy thử và phần kiểm định.
3. Phương pháp dự báo được chọn được sử
dụng để tính các giá trị ước lượng
cho phần chạy thử.
Một chiến lược tốt để đánh giá dự báo
thường gồm các bước sau (Hanke, 2005):
4.Phương pháp được sử dụng
để dự báo phần kiểm định
của dữ liệu, và sai số dự
báo được xác định và dùng
để so sánh/đánh giá.
5.Ra quyết định
Dự báo thô (Naïve forecast)
(hoặc simple random walk!!!)
Thích hợp với các doanh nghiệp
mới thành lập vì có rất ít dữ
liệu.
Giả định giai đoạn gần nhất là
ước lượng tốt nhất cho tương lai:
t
1t
YY
Ví dụ xem file Table4.1H
100
200
300
400
500
600
700
800
2 4 6 8 10 12 14 16 18 20 22 24 26 28
SALES
Lấy dữ liệu trong giai đoạn 1996 –
2001 là dữ liệu ước lượng, vậy giá
trị dự báo 2002Q1 sẽ là:
Sai số dự báo: e
25
= 200, …, e
26
= -
250
Kết hợp đồ thị thấy dữ liệu có xu
thế, nên mô hình dự báo thô giản đơn
sẽ dự báo “thấp”.
24
25
^
Y
Y
650
Y
25
^
Để khắc phục nhược điểm của mô
hình dự báo thô giản đơn ta có
thể xem xét thêm xu hướng của
nó như sau:
Trong đó: P là tỷ lệ thay đổi
giữa hai giai đoạn kế nhau 0
P 1.
P bao nhiêu là tốt nhất?
)Y P(Y YY
1-ttt
1t
Có khi người ta có thể sử
dụng tỷ lệ thay đổi thay cho
số thay đổi tuyệt đối:
Dự báo thô cho dữ liệu mùa
(không xu thế):
1t
t
t
1t
^
Y
Y
Y
Y
3t
1t
^
Y
Y
Nếu dữ liệu mùa và có xu thế thì
cách dự báo như thế sẽ dự báo
“thấp”, vậy:
Nếu dữ liệu theo tháng và có xu
thế?
4
)YY( )YY(
Y
Y
4t3t1tt
3t
1t
^
4
)YY(
Y
Y
4tt
3t
1t
^
Table4.1 H
c1t3&f6
Trung bình giản đơn (simple
average forecast)
Công thức:
t
1i
i
1t
Y
t
1
Y
1t
Y Yt
Y
1t
1t
2t
Phương pháp trung bình giản đơn
phù hợp khi các nhân tố ảnh hưởng
đến đối tượng dự báo có tính ổn
định, và môi trường liên quan đến
chuỗi dữ liệu là không thay đổi.
Phương pháp trung bình giản đơn
sử dụng giá trị trung bình của
tất cả các quan sát quá khứ làm
giá trị dự báo cho giai đoạn tiếp
theo. Phù hợp với dữ liệu dừng.
240
250
260
270
280
290
300
310
320
5 10 15 20 25 30
Table4.3 H
Trung bình di động (moving
average forecast)
Quan tâm đến một số cố định các quan sát
gần nhất.
Khi có thêm một quan sát mới, ta có một giá
trị trung bình mới.
Y
^
t+1
: giá trị dự báo giai đoạn tiếp theo
Y
t
: giá trị thực tại thời điểm t
k : hệ số trượt
)k(MA
k
Y Y Y
Y
1k-t1-tt
1t
240
250
260
270
280
290
300
310
320
5 10 15 20 25 30
GALLONS @MOVAV(GALLONS,4)
Table4.3 H
Công thức trên Eviews: @MOVAV(Y
t
,k)
Chọn hệ số trượt bao nhiêu tùy vào độ
dài của chu kỳ hay bản chất của dữ
liệu.
Để so sánh và chọn mô hình tốt, nên
dựa vào các tiêu chí thống kê (RMSE).
Thường dùng đối với dữ liệu quý hoặc
tháng để làm trơn các thành phần
trong chuỗi thời gian.
Thường dùng với chuỗi dừng.
Trung bình di động kép (double
moving average forecast)
Khi dữ liệu có xu thế tuyến tính thì
ta sử dụng phương pháp bình phương di
động điều chỉnh, được gọi là “trung
bình di động kép”:
k
Y Y Y
Y M
1k-t1-tt
1t
t
k
M M M
M
1k-t1-tt
'
t
)M M(
1-k
2
b
'
ttt
'
tt
'
tttt
M - 2M )M M( M a
pb a Y
tt
pt
Table4.4 H
MSE = 133
MSE = 63.7
San mũ giản đơn (simple
exponential smoothing forecast)
Giống trung bình di động, được sử dụng
khi dữ liệu không có yếu tố xu thế và
mùa vụ.
Trong khi MA chỉ dựa vào các quan sát
gần nhất để dự báo, thì san mũ dựa vào
tất cả các quan sát trước đó để dự báo
nhưng với trọng số giảm dần.
Giá trị dự báo tại bất kỳ thời
điểm nào là giá trị trung bình có
trọng số của tất cả các giá trị
sẵn có trước đó.
Giá trị càng xa hiện tại thì
trọng số càng giảm. Nghĩa là, các
quan sát gần nhất được cho là
chứa đựng thông tin thích hợp
nhất, và có ảnh hưởng lớn hơn các
quan sát quá khứ.