Tải bản đầy đủ (.ppt) (19 trang)

bài giảng lý thuyết xác suất và thống kê toán 2: Chuỗi thời gian Làm trơn và ngoại suy

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (141.39 KB, 19 trang )

1
Chuỗi thời gian
Làm trơn và ngoại suy
2
Khái niệm và ứng dụng

Khái niệm chuỗi thời gian: là chuỗi các giá trị của một
biến số được sắp xếp theo thời gian tại các mốc có
khoảng cách như nhau (1 ngày, 1 giờ, 1 năm,.v.v)

Tại sao dùng mô hình chuỗi thời gian:

Bản thân các biến giải thích trong mô hình cấu trúc
thông thường cũng là biến ngẫu nhiên theo thời gian.
Cần phải dự báo nó trước khi dự báo biến phụ thuộc
là biến đang quan tâm

Có thể có cấu trúc nội tại trong bản thân 1 chuỗi thời
gian (tự tương quan, xu thế, ảnh hưởng của mùa vụ).
Những thông tin này có thể giúp để xây dựng và dự
báo giá trị của chuỗi

Ứng dụng chính của chuỗi thời gian: phân tích và dự báo
(kinh tế, tài chính, kinh doanh v.v)
3
Kỹ thuật chính dùng trong phân tích

Dựa vào số liệu quá khứ (chuỗi số theo thời gian, quan
sát được) để suy diễn cho cấu trúc thực của biến số
(không quan sát được)


Kỹ thuật chính:

Ngoại suy đơn giản

San chuỗi:

Trung bình trượt

San mũ đơn giản/ san mũ Holt-Winters

Mô hình ARIMA Box-Jenkins

Mô hình Box-Jenkins nhiều biến
4
Mô hình ngoại suy đơn giản (tất định)
Mô hình Biểu diễn
Xu thế tuyến tính Y
t
= β
1
+ β
2
t
Dạng mũ Y
t
= α exp(rt) => ln(Y
t
) =ln(α) +rln(t)
Xu thế tự hồi quy Y
t

= β
1
+ β
2
Y
t-1
Bậc 2 Y
t
= β
1
+ β
2
t + β
3
t
2

Logistic Y
t
= (k +ab
t
)
-1
5
Mô hình chuỗi thời gian
Chuỗi hoàn toàn ngẫu nhiên (~chuỗi ngẫu nhiên)
Chuỗi có chứa các thành phần phi ngẫu nhiên
(chuỗi thời gian)
6
Chuỗi ngẫu nhiên- kiểm định đoạn mạch


Thế nào là chuỗi ngẫu nhiên?

Ví dụ: cho chuỗi số theo thứ tự { 2, 4,3, 7, 7, 8, 9 , 6, 5}
Trung vị = 6
Thu được chuỗi dấu tương ứng:{ -,-,-/,+,+,+,+,/0,/-/}
Tổng số đoạn mạch: 3.
Tổng số dấu +: 4, dấu -: 4 => so với bảng: 3>2: không
bác bỏ giả thuyết cho rằng chuỗi là ngẫu nhiên

Khi n>20: Z = (R –n/2 -1)/sqrt((n
2
-2n)/4(n-1))

Nếu |Z|> z
α/2
=> bác bỏ giả thiết cho rằng chuỗi là ngẫu
nhiên, trong đó R: tổng số đoạn mạch

Nếu chuỗi có chứa các thành phần khác, như xu thế
theo thời gian, mùa vụ, v.v => nghiên cứu tiếp
7
Các thành phần của chuỗi thời gian
1. Xu thế: xu thế tăng (giảm) của chuỗi số tính trong khoảng
thời gian dài.
2. Mùa vụ: dao động trong ngắn hạn của chuỗi số do tác động
của yếu tố mùa vụ
3. Chu kỳ:dao động trong trung hạn của chuỗi số, do tác động
của những hiện tượng lặp lại theo chu kỳ (chu kỳ kinh tế)
4. Thành phần bất quy tắc-mang tính ngẫu nhiên, do tác động

của những yếu tố không dự báo được như: ốm đau, thời
tiết, v.v
Các thành phần này có thể liên kết với nhau theo 2 dạng:
Mô hình cộng: Y
t
= T
t
+ S
t
+ C
t
+ I
t
Mô hình nhân: Y
t
= T
t
x S
t
x C
t
x I
t
8
San chuỗi

Tách các ảnh hưởng bất quy tắc lên chuỗi số, nhằm làm rõ
hơn các thành phần (dự báo được) khác: mùa vụ, xu thế,
chu kỳ của chuỗi


Từ đó xây dựng các giá trị dự báo cho chuỗi số

2 kỹ thuật san chuỗi chính:

Trung bình trượt

san mũ
Các loại chuỗi số khác nhau áp dụng các kỹ thuật khác
nhau
9
Trung bình trượt

Trung bình trượt (Moving average)
*)TBT trung tâm: Y
*
t
= (Y
t-m
+Y
t-m+1
+ +Y
t
+ +Y
t+m
)/(2m+1)
( các quan sát đều có vai trò như nhau)
Ví dụ (mở file ch12bt1, tính TBT với 12 thời kỳ
@movav(y(5),12))
*)TBT có trọng số: Y
*

t
= (Y
t-1
+2Y
t
+ Y
t+1
)/4; v.v.
(các quan sát gần với hiện tại có trọng số lớn hơn)
10
Ví dụ về chuỗi trung bình trượt
16
20
24
28
32
36
40
1996 1997 1998 1999
Y YMA12
11
Hiệu chỉnh yếu tố mùa vụ sử dụng TBT

Ví dụ: số liệu về lợi nhuận theo quý của một công ty là
300, 460, 440, 600,

Liệu có phải trong Q4 công ty hoạt động tốt hơn Q1?

Chưa biết, có thể do ảnh hưởng của yếu tố mùa vụ


Nhiều khi muốn tách ảnh hưởng này ra khỏi chuỗi số để
tìm hiểu về các thành phần khác

Làm thế nào?

Tìm chỉ số chỉ tác động của yếu tố mùa vụ

Tùy theo dạng của chuỗi số để tách tác động đó: mô
hình cộng/ mô hình nhân
12
Hiệu chỉnh yếu tố thời vụ sử dụng TBT

Ví dụ 6.2 (mở tệp số liệu ch12bt20)

Giả sử tác động của mùa vụ mang tính ổn định. (Q1 năm 2000
tương tự Q1/2001)

Giả sử mô hình có dạng mô hình nhân: Y
t
= T
t
x S
t
x C
t
x I
t

Các bước tiến hành: giả sử yếu tố mùa là theo quý (s= 4)


B1: Lấy trung bình trượt theo 4 số hạng => Y

(t) ( san đều ảnh
hưởng của yếu tố S và I của cả năm cho từng quý=> còn lại
TxC)

B2: lấy trung bình trượt theo 2 số hạng của Y”, được Y* (để
điều chỉnh thứ tự của các quan sát giữa chuỗi xuất phát và
chuỗi mới)

B3: Tính Y
t
/Y
t
*- còn lại là ảnh hưởng mùa và I (Tx Sx
CxI/TxC= SxI)

B4: Loại bỏ yếu tố I: Giả sử có 5 năm quan sát, chỉ số thời vụ
chung của tháng i sẽ là trung binh trượt của các giá trị (Y/Y*)
tháng i của 5 năm- chính là chỉ số mùa vụ cho từng tháng
(SIN) ( = SxI/I)

B5: Y/SIN sẽ thu được chuỗi đã hiệu chỉnh yếu tố mùa vụ
13
Hiệu chỉnh theo mùa vụ
Scaling Factors:
1 0.999867
2 1.000595
3 1.000352
4 0.999187

2800
3200
3600
4000
4400
4800
5200
70 72 74 76 78 80 82 84 86 88 90
GDPSA
Chỉ số mùa vụ quý 3 là: 1.000352
Trung bình của các chỉ số mùa vụ = 1
14
San mũ giản đơn

Khi yếu tố xu thế và mùa vụ thể hiện không rõ trong
chuỗi số

Muốn dùng số liệu quá khứ để dự báo

=> san đều ảnh hưởng của I

Chính là trung bình trượt có trọng số, trong đó giá trị
càng xa với hiện tại thì trọng số càng bé và tuân theo
quy luật mũ, như sau:
Y
*
t
= αY
t
+


α(1-

α)

Y
t-1
+ + α (1- α )
n
Y
t-n
+
Hay:
Y
*
t
= αY
t
+

(1-

α)

Y*
t-1
Trong đó 0<α<1 : hằng số san, được lựa chọn sao cho:

>−−−=
MinYYRSS

tt
2*
)(
15
Dự báo giá trị của chuỗi

Tại thời điểm n, cần dự báo giá trị tại n+1; n+2; v.v

Y
*
n+h
= Y*
n
với mọi h > 0
16
Mô hình dự báo san mũ Holt-winters

Dùng để:

Dự báo chuỗi có yếu tố xu thế (T)

Dự báo chuỗi có cả yếu tố xu thế và yếu tố thời vụ

Dự báo chuỗi có yếu tố xu thế, không có yếu tố thời vụ
Thực hiện:
Y*
t
= (Y*
t-1
+ T

t-1
)(1-α)αY
t
+
T*
t
= T
t-1
β(Y*
t
-Y*
t-1
)+ (1-β)
giá trị ước tính
ban đầu cho Y*
t
Thông tin mới
xuất hiện
Giá trị tại t của Y*
Tương tự cho T*
Giá trị ban đầu:
T
2
=Y
2
-Y
1
; Y*
2
= Y

2
17
Dự báo

Công thức dự báo: thời kỳ hiện tại: n

Dự báo cho 1 thời kỳ sau: Y*
(n+1)
= Y*
n
+ T
n

Dự báo cho 2 thời kỳ sau: Y*
(n+1)
= Y*
n
+2T
n

Dự báo cho h thời kỳ sau: Y*
(n+1)
= Y*
n
+ hT
n
Parameters: Alpha 0.18
Beta 0.55
Sum of Squared
Residuals 122.60

Root Mean Squared
Error 2.02
End of Period Levels: Mean 104.87
Trend 1.34
Dự báo:
Y*
31
=104.87+1x1.34=106.21
Y*
32
=104.87+2x1.34=107.55

(số liệu: ch12bt5)
18
Dự báo chuỗi có cả yếu tố xu thế và yếu tố thời vụ

Thực hiện:
Y*
t
= α(Y
t
/F
t-s
) +(1- α)(Y*
t-1
+T
t-1
)
T
t

= β(Y*
t
– Y
t-1
) +(1- β)T
t-1
F
t
= λ Y
t
/Y*
t-1
+ (1- λ )F
t-s
Trong đó: F: chỉ số thời vụ, s: số thời kỳ trong 1 năm

Dự báo: dự báo cho thời kỳ (n+h) với thời kỳ hiện tại: n

Y*
(n+h)
= (Y*
n
+h T
n
)F
n+h-s
với h =1,2, s

Y*
(n+h)

= (Y*
n
+h T
n
)F
n+h-2s
với h= s+1; ; 2s

V.v

Ví dụ
19
Parameters: Alpha 0.33
ch12bt4, n=88 Beta 0.53
Gamma 0.00
End of Period
Levels: Mean 1.67
Trend 0.10
Seasonals: 1972M09 0.63
1972M10 0.93
1972M11 0.75
1972M12 1.65
1973M01 0.69
1973M02 1.01
1973M03 0.72
1973M04 1.72
1973M05 0.60
1973M06 0.95
1973M07 0.75
1973M08 1.59


Dự báo
Y*
88
= 1.67; T
88
=0.1;s=12
F
88-11
=0.63;.;F
88-0
= 1.59
Y*
n+1
= (Y*
n
+1x T
n
)F
n+1-12
Y*
n+12
= (Y*
n
+12x T
n
)F
n+12-12

×