Bài tập: Xây dựng mô hình dự báo tốt nhất về
Tổng chi phí xây dựng dịch vụ công của Mỹ từ
1/1993 – 7/2016
Mục lục
Phần I: Giới thiệu số liệu................................................................................3
1.1 Bảng số liệu....................................................................................3
1.2 Định nghĩa biến..............................................................................5
1.3 Mô tả số liệu...................................................................................5
Phần II: Xây dựng mô hình dự báo.................................................................6
2.1 Lựa chọn mô hình dự báo tốt nhất..................................................6
2.1.1 Mô hình tuyến tính...........................................................7
2.1.2 Mô hình phi tuyến tính.....................................................8
2.1.3 Xu thế dạng mũ…………………………………………8
2.2 Kiểm định tính thời vụ....................................................................9
Phần III: Ứng dụng mô hình để dự báo 5 quan sát cuối cùng của mô hình....11
Phần IV: Kết luận...........................................................................................13
Phần I: Giới thiệu
1.1. Số liệu:
Dưới đây là số liệu về Tổng chi phí xây dựng dịch vụ công của nước Mỹ qua
các tháng từ 1/1993 – 7/2016
Tổng số quan sát: 283
ST
T
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Thời
gian
1993M0
1
1993M0
2
1993M0
3
1993M0
4
1993M0
5
1993M0
6
1993M0
7
1993M0
8
1993M0
9
1993M1
0
1993M1
1
1993M1
2
1994M0
1
1994M0
2
1994M0
3
1994M0
4
1994M0
5
1994M0
6
1994M0
7
1994M0
8
1994M0
9
1994M1
Tlpblco
ns
ST
T
113906
95
119243
96
119772
97
126908
98
121634
99
129212
100
129298
101
130039
102
131983
103
126606
104
132425
105
137897
106
126467
107
124573
108
125942
109
123666
110
125991
111
131725
112
133537
113
133205
114
132130
135310
115
116
Thời
gian
2000M1
1
2000M1
2
2001M0
1
2001M0
2
2001M0
3
2001M0
4
2001M0
5
2001M0
6
2001M0
7
2001M0
8
2001M0
9
2001M1
0
2001M1
1
2001M1
2
2002M0
1
2002M0
2
2002M0
3
2002M0
4
2002M0
5
2002M0
6
2002M0
7
2002M0
Tlpblco
ns
ST
T
183993
189
185294
190
188192
191
189203
200
197455
201
201615
202
206540
203
205260
204
204878
205
203649
206
198558
207
206677
208
207550
209
209290
210
217321
211
219966
212
206789
213
208700
214
215094
215
209818
216
213148
212437
217
218
Thời
gian
2008M0
9
2008M1
0
2008M1
1
2009M0
8
2009M0
9
2009M1
0
2009M1
1
2009M1
2
2010M0
1
2010M0
2
2010M0
3
2010M0
4
2010M0
5
2010M0
6
2010M0
7
2010M0
8
2010M0
9
2010M1
0
2010M1
1
2010M1
2
2011M0
1
2011M0
Tlpblco
ns
308559
314332
316897
314453
310870
307866
302635
300330
295857
290265
297753
306401
309314
312059
304301
308370
315041
306567
298865
291499
291154
286998
P a g e 3 | 15
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
0
1994M1
1
1994M1
2
1995M0
1
1995M0
2
1995M0
3
1995M0
4
1995M0
5
1995M0
6
1995M0
7
1995M0
8
1995M0
9
1995M1
0
1995M1
1
1995M1
2
1996M0
1
1996M0
2
1996M0
3
1996M0
4
1996M0
5
1996M0
6
1996M0
7
1996M0
8
1996M0
9
1996M1
0
1996M1
1
1996M1
2
131047
117
135129
118
132958
119
130106
120
135758
121
137352
122
139811
123
142949
124
137475
125
144003
126
142569
127
143657
128
143817
129
140236
130
147112
131
138716
132
140166
133
148123
134
152967
135
144131
136
147315
137
144095
138
149634
139
150834
140
151214
141
144846
142
8
2002M0
9
2002M1
0
2002M1
1
2002M1
2
2003M0
1
2003M0
2
2003M0
3
2003M0
4
2003M0
5
2003M0
6
2003M0
7
2003M0
8
2003M0
9
2003M1
0
2003M1
1
2003M1
2
2004M0
1
2004M0
2
2004M0
3
2004M0
4
2004M0
5
2004M0
6
2004M0
7
2004M0
8
2004M0
9
2004M1
0
212711
219
214144
220
214383
221
221742
222
219258
223
216078
224
208246
225
211887
226
213124
227
218419
228
217640
229
220213
230
219205
231
222735
232
214612
233
212946
234
212536
235
210322
236
221222
237
221765
238
218891
239
222773
240
224037
241
220820
242
218907
243
218000
244
2
2011M0
3
2011M0
4
2011M0
5
2011M0
6
2011M0
7
2011M0
8
2011M0
9
2011M1
0
2011M1
1
2011M1
2
2012M0
1
2012M0
2
2012M0
3
2012M0
4
2012M0
5
2012M0
6
2012M0
7
2012M0
8
2012M0
9
2012M1
0
2012M1
1
2012M1
2
2013M0
1
2013M0
2
2013M0
3
2013M0
4
289665
286053
283505
288061
281556
287675
287590
284052
285979
288337
281687
283378
280202
278112
283869
288911
281342
279697
273563
275276
272983
266604
267129
274250
264594
271398
P a g e 4 | 15
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
1997M0
1
1997M0
2
1997M0
3
1997M0
4
1997M0
5
1997M0
6
1997M0
7
1997M0
8
1997M0
9
1997M1
0
1997M1
1
1997M1
2
1998M0
1
1998M0
2
1998M0
3
1998M0
4
1998M0
5
1998M0
6
1998M0
7
1998M0
8
1998M0
9
1998M1
0
1998M1
1
1998M1
2
1999M0
1
1999M0
2
1999M0
3
144713
143
150267
144
153274
145
152649
146
153063
147
154500
148
156978
149
155647
150
153056
151
157106
152
152798
153
154442
154
149499
155
147429
156
147093
157
150464
158
146590
159
158157
160
160167
161
155684
162
159734
163
158208
164
156912
165
160793
166
159954
167
167072
168
167195
169
2004M1
1
2004M1
2
2005M0
1
2005M0
2
2005M0
3
2005M0
4
2005M0
5
2005M0
6
2005M0
7
2005M0
8
2005M0
9
2005M1
0
2005M1
1
2005M1
2
2006M0
1
2006M0
2
2006M0
3
2006M0
4
2006M0
5
2006M0
6
2006M0
7
2006M0
8
2006M0
9
2006M1
0
2006M1
1
2006M1
2
2007M0
1
225573
245
224471
246
220274
247
226618
248
228202
249
228516
250
234195
251
236913
252
236450
253
237852
254
237879
255
236787
256
237341
257
241758
258
242619
259
246794
260
251494
261
255257
262
253839
263
257741
264
258037
265
254884
266
254781
267
256903
268
260614
269
270232
270
280098
271
2013M0
5
2013M0
6
2013M0
7
2013M0
8
2013M0
9
2013M1
0
2013M1
1
2013M1
2
2014M0
1
2014M0
2
2014M0
3
2014M0
4
2014M0
5
2014M0
6
2014M0
7
2014M0
8
2014M0
9
2014M1
0
2014M1
1
2014M1
2
2015M0
1
2015M0
2
2015M0
3
2015M0
4
2015M0
5
2015M0
6
2015M0
7
269552
274067
273435
271115
270778
272312
267460
267120
265242
263364
267130
273470
277629
277061
281845
278607
275923
287369
276063
280789
272222
274219
279469
288332
291511
300551
297593
P a g e 5 | 15
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
1999M0
4
1999M0
5
1999M0
6
1999M0
7
1999M0
8
1999M0
9
1999M1
0
1999M1
1
1999M1
2
2000M0
1
2000M0
2
2000M0
3
2000M0
4
2000M0
5
2000M0
6
2000M0
7
2000M0
8
2000M0
9
2000M1
0
167681
170
164689
171
166830
172
169934
173
168741
174
168889
175
170663
176
177472
177
185045
178
184676
179
176352
180
187906
181
183725
182
178929
183
175368
184
171776
185
183390
186
185769
187
185369
188
2007M0
2
2007M0
3
2007M0
4
2007M0
5
2007M0
6
2007M0
7
2007M0
8
2007M0
9
2007M1
0
2007M1
1
2007M1
2
2008M0
1
2008M0
2
2008M0
3
2008M0
4
2008M0
5
2008M0
6
2008M0
7
2008M0
8
275052
272
278405
273
281745
274
289401
275
288080
276
288841
277
293431
278
297339
279
295943
280
298893
281
296694
282
294251
283
2015M0
8
2015M0
9
2015M1
0
2015M1
1
2015M1
2
2016M0
1
2016M0
2
2016M0
3
2016M0
4
2016M0
5
2016M0
6
2016M0
7
296652
293233
288662
281812
289622
295186
299567
297390
287902
283466
287028
278190
299323
306539
304512
305320
307558
310609
313684
Nguồn số liệu: US. Cục điều tra dân số Mỹ
Link: />1.2. Định nghĩa biến:
- Tpblcons (biến phụ thuộc): Tổng chi phí xây dựng dịch vụ công
- Đơn vị: Hàng triệu đô-la
1.3. Mô tả số liệu:
- Chuỗi số liệu thời gian, theo tháng, từ 1/1993 đến tháng 7/2016
- Đồ thị chuỗi số liệu:
P a g e 6 | 15
TLPBLCONS
360,000
320,000
280,000
240,000
200,000
160,000
120,000
80,000
94
96
98
00
02
04
06
08
10
12
14
16
Hình 1: Tổng chi phí xây dựng dịch vụ công của Mỹ, hàng tháng, năm
1993 – 2016
Nhận xét: Nhìn vào đồ thị ta thấy chuỗi có tính xu thế khá rõ rệt, đường mô
tả Tổng chi phí xây dựng dịch vụ công có xu hướng tăng.
Từ năm 1993-2000 đường Tổng chi phí xây dựng dịch vụ công ở Mỹ rất
thấp, cho thấy sự suy thoái nền kinh tế Mỹ
- Đồ thị tần suất:
35
Series: TLPBLCONS
Sample 1993M01 2016M07
Observations 283
30
25
20
15
10
5
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
225726.5
222773.0
325481.0
113906.0
62754.70
-0.175481
1.594363
Jarque-Bera
Probability
24.75058
0.000004
0
120000
160000
200000
240000
280000
320000
Hình 2: Histogram của Tổng chi phí xây dựng dịch vụ công của Mỹ
P a g e 7 | 15
Nhận xét:
Mean = 225726.5, trung bình Tổng chi phí xây dựng dịch vụ công
hàng tháng là 225726.5 triệu đô-la
- Skewness (Độ bất đối xứng) = -0.098, nhỏ, phân phối gần như đối
xứng
- Kurtosis (Độ nhọn) = 1.597 < 3, phân phối tập trung kém hơn mức
bình thường, cho thấy các giá trị (rất lớn/rất nhỏ) của phân phối này
xuất hiện ở hai bên ít hơn là phân phối chuẩn
- Kiểm định phân phối chuẩn:
JB = 22.59, Pro = 0.000 << = 0.05 nên bác bỏ H0, Mẫu không có
phân phối chuẩn
-
Phần II: Xây dựng mô hình dự báo (Để lại 5 quan sát cuối cùng)
2.1 Lựa chọn xu thế dự báo tốt nhất
2.1.1 Mô hình xu thế tuyến tính
Dạng mô hình: = +
Trong đó:
: Tổng chi phí xây dựng dịch vụ công (Đv: Triệu đô-la)
TIME : biến thời gian được tạo ra
β0 : hệ số cắt, cho biết giá trị của xu thế tại thời điểm t=0
β1 : hệ số độ dốc của mô hình
Kết quả chạy hồi quy mô hình trên Eviews 6:
Dependent Variable: TLPBLCONS
Method: Least Squares
Date: 09/13/16 Time: 08:22
Sample: 1993M01 2016M02
Included observations: 278
Variable
C
TIME
Coefficient
Std. Error
t-Statistic
Prob.
123195.9
727.1125
2755.044
17.11884
44.71651
42.47439
0.0000
0.0000
R-squared
0.867312
Adjusted R-squared 0.866832
S.E. of regression
22905.94
Sum squared resid
1.45E+11
Log likelihood
-3184.345
F-statistic
1804.074
Prob(F-statistic)
0.000000
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
224628.1
62769.36
22.92335
22.94945
22.93382
0.041831
P a g e 8 | 15
Mô hình xu thế tuyến tính: Y = 323.389 + 4.953*TIME
- Nhận xét:
Prob(F-statistic) = 0.000 << 0.05 Mô hình có năng lực trong dự báo
các giá trị của Tlpbcons
Các hệ số đều có ý nghĩa thống kê (Prob = 0.000 << = 0.05)
DW = 0.04, khá nhỏ (Tự tương quan dương)
R2 = 0.867 => Mô hình ước lượng giải thích được 86,7% biến động
của biến phụ thuộc TLPBCONS
- Kiểm định tính xu thế:
H0: β1 = 0: Mô hình không có tính xu thế
H1: β2 0: Mô hình có tính xu thế
Ta có: β1 = 727.11 > 0, chấp nhận H1
Kết luận: Mô hình có tính xu thế tuyến tính tăng
- Đồ thị:
350,000
300,000
250,000
80,000
60,000
200,000
40,000
20,000
150,000
0
100,000
-20,000
-40,000
-60,000
94
96
98
00
02
Residual
04
06
Actual
08
10
12
14
Fitted
Nhận xét: Từ năm 1994-2006, xu thế gần như tuyến tính. Từ năm 2006-2016
Tổng chi phí xây dựng dịch vụ công có nhiều biến động hơn.
P a g e 9 | 15
2.1.2 Mô hình xu thế bậc 2
Dạng mô hình: = + +
Kết quả chạy hồi quy mô hình trên Eviews 6:
Dependent Variable: TLPBLCONS
Method: Least Squares
Date: 09/13/16 Time: 08:27
Sample: 1993M01 2016M02
Included observations: 278
Variable
Coefficient
C
TIME
TIME2
95077.38
1329.653
-2.159644
R-squared
0.906732
Adjusted R-squared 0.906054
S.E. of regression
19239.22
Sum squared resid
1.02E+11
Log likelihood
-3135.345
F-statistic
1336.747
Prob(F-statistic)
0.000000
Std. Error
t-Statistic
3486.729 27.26836
57.70939 23.04050
0.200321 -10.78093
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Prob.
0.0000
0.0000
0.0000
224628.1
62769.36
22.57802
22.61717
22.59373
0.059413
- Mô hình xu thế bậc 2: TLPBLCONS = 95077.38 + 1329.65*TIME 2.16*TIME2
Nhận xét:
-
Prob(F-statistic) = 0.000 << 0.05 → Mô hình có năng lực trong dự báo
các biến động của TLPBCONS
R2 = 0.91, độ chặt chẽ cao, cho thấy mô hình ước lượng giải thích được
91% biến động của Y
Các hệ số đều có ý nghĩa thống kê (Prob = 0.000 << = 0.05)
- DW = 0.05, khá nhỏ (Tự tương quan dương)
Kiểm định tính xu thế:
Ta có: β1 = 1329.653 0; β2 = -2.159644 0
Kết luận: Mô hình có tính xu thế phi tuyến tính.
2.1.3 Mô hình xu thế dạng mũ
Không có mô hình xu thế dạng mũ
So sánh các mô hình:
P a g e 10 | 15
Xu thế tuyến tính Xu thế hàm bậc 2
R – squared
AIC
SIC
0.87
22.92
22.95
0.91
22.58
22.62
Nhận xét:
Xu thế hàm bậc 2 có:
- R2 cao hơn
- Hệ số AIC và SIC nhỏ hơn
Kết luận: Mô hình xu thế hàm bậc 2 có khả năng dự báo tốt nhất.
2.2 Kiểm định tính thời vụ
Ta kiểm định tính thời vụ cho mô hình xu thế bậc 2 với s=12
- Mô hình không ràng buộc:
12
∑γ D
UR:
TLPBCONSt = β1 * TIME+ 2*TIME2 +
i =1
i
it
+ εt
Kết quả chạy hồi quy mô hình trên Eviews:
Dependent Variable: TLPBLCONS
Method: Least Squares
Date: 09/13/16 Time: 08:30
Sample: 1993M01 2016M02
Included observations: 278
Variable
Coefficient
TIME
TIME2
D1
D2
D3
D4
D5
D6
D7
D8
D9
1328.275
-2.153910
93175.14
93225.27
94443.91
95763.47
96123.48
97934.14
96840.76
96355.08
95212.83
Std. Error
t-Statistic
58.76279 22.60401
0.203979 -10.55947
5164.711 18.04073
5170.497 18.03023
5264.466 17.93988
5270.807 18.16866
5276.974 18.21564
5282.969 18.53771
5288.791 18.31057
5294.440 18.19929
5299.918 17.96496
Prob.
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
P a g e 11 | 15
D10
D11
D12
95219.20
93459.57
93868.38
R-squared
0.907286
Adjusted R-squared 0.902721
S.E. of regression
19577.51
Sum squared resid
1.01E+11
Log likelihood
-3134.517
Durbin-Watson stat 0.056435
5305.225
5310.362
5315.329
17.94819
17.59947
17.65994
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
0.0000
0.0000
0.0000
224628.1
62769.36
22.65120
22.83388
22.72449
Phương trình hồi quy: TLPBLCONS = 1328.27451602*TIME 2.15391007507*TIME2 + 93175.1433521*D1 + 93225.2680803*D2 +
94443.9083002*D3 + 95763.4738493*D4 + 96123.4776534*D5 +
97934.1371037*D6 + 96840.756548*D7 + 96355.0751168*D8 +
95212.8319406*D9 + 95219.2009324*D10 + 93459.5733964*D11 +
93868.3841154*D12
- Mô hình có ràng buộc:
R: = + +
- Kiểm định giả thiết:
H0: các hệ số γi trong mô hình bằng nhau, mô hình không có tính thời
vụ
H1: có ít nhất hai hệ số γi trong mô hình khác nhau
Áp dụng công thức:
=
Thay số liệu ta có:
= = 0.236
F m,t-k = = 1.85
So sánh: < → Chấp nhận , vậy mô hình không có tính thời vụ.
Phần III: Dự báo cho 5 quan sát cuối cùng, tính các sai số
Mô hình dự báo: TLPBLCONS = 95077.3758894 + 1329.65310316*TIME 2.15964380163*TIME2
Dự báo điểm: TLPBLCONSt+h = 95077.3758894 +
1329.65310316*TIMEt+h - 2.15964380163*TIME2t+h
Khoảng tin cậy p = 1 – α, với α = 5% của là:
[- ; +]
P a g e 12 | 15
Trong đó:
là giá trị dự báo tại thời điểm T+h
là giá trị tới hạn tra ở bảng tuần hoàn
là sai số chuẩn của hồi quy xu thế
h là tầm xa của dự báo
Ta có: = 1.96 ; = 19239.22
Bảng kết quả:
Thời
gian
2016M0
3
2016M0
4
2016M0
5
2016M0
6
2016M0
7
Giá trị thực
tế
297390
287902
283466
287028
278190
Dự báo
điểm
Sai số Cận dưới
297941.7
260232.8
1
551.71
4
298064.1 10162.1 260355.2
2
2
5
298182.2 14716.2 260473.3
1
1
4
298295.9
260587.1
9
11267.99
2
298405.4 20215.4 260696.5
4
4
7
Cận trên
335650.5
8
335772.9
9
335891.0
8
336004.8
6
336114.3
1
Nhận xét: Giá trị dự báo chênh lệch với giá trị thực trong khoảng 1-7%. Dự
báo khá tốt
Đồ thị
- Dự báo cho 5 quan sát cuối:
-
Đồ thị dự báo ngoài mẫu:
P a g e 13 | 15
Nhận xét: Từ đồ thị ta thấy chi phí cho xây dịch vụ công của Mỹ giai
đoạn này không có nhiều biến động và đang có xu hướng giảm dần. Số
dự báo nằm trong khoảng tin cậy và sát với số thực tế cho thấy dự báo là
khá tốt.
P a g e 14 | 15
IV. Kết luận
Mô hình xu thế phi tuyến tính là mô hình dự báo tốt nhất cho Tổng chi
phí xây dựng dịch vụ công ở Mỹ từ giai đoạn 1993- 7/2016. Nhìn chung
đường chi phí có xu thế tăng; các giá trị dự báo khá tốt, gần với giá trị
thực tế.
P a g e 15 | 15