BÀI TẬP NHÓM
Môn: KINH TẾ LƯỢNG TRONG DỰ BÁO VÀ
PTKT
GVHD: TS. Nguyễn Thị Dương Nga
Đề tài: Tìm hiểu về doanh thu hành khách Miles cho US Air
Carrier trong nước và quốc tế, theo lich trình hành khách
chuyến bay giai đoạn từ tháng 01/2000 đến 5/2016, xây
dựng mô hình dự báo tốt nhất.
Nhóm thực hiện: 14
Danh sách nhóm
STT
1
2
3
4
5
Họ và tên
Lớp
MSV
Mục lục
Phần I: Giới thiệu số liệu................................................. ....................................2
1.1
1.2
Bảng số liệu..........................................................................................2
Mô tả số liệu.........................................................................................4
Phần II: Xây dựng mô hình dự báo......................................................................7
2.1
2.2
Lựa chọn mô hình dự báo tốt nhất.......................................................7
2.1.1 Mô hình tuyến tính................................................................7
2.1.2 Mô hình phi tuyến tính..........................................................8
Kiểm định tính thời vụ.......................................................................10
Phần III: Ứng dụng mô hình để dự báo 5 quan sát cuối cùng của mô
hình........13
Phần IV: Kết luận...............................................................................................14
Phần I: Giới thiệu số liệu
1.1
Bảng số liệu:
Nghiên cứu về biến động doanh thu hành khách Miles cho US Air
Carrier trong nước và quốc tế theo lich trình hành khách chuyến bay giai
đoạn từ tháng 01/2000 đến 5/2016.
Trong đó, doanh thu hành khách (RPM) được tính bằng ngàn dặm
STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
Observation_date
2000-01-01
2000-02-01
2000-03-01
2000-04-01
2000-05-01
2000-06-01
2000-07-01
2000-08-01
2000-09-01
2000-10-01
2000-11-01
2000-12-01
2001-01-01
2001-02-01
2001-03-01
2001-04-01
2001-05-01
2001-06-01
2001-07-01
2001-08-01
2001-09-01
2001-10-01
2001-11-01
2001-12-01
2002-01-01
2002-02-01
2002-03-01
2002-04-01
2002-05-01
2002-06-01
2002-07-01
2002-08-01
2002-09-01
2002-10-01
2002-11-01
2002-12-01
2003-01-01
RPM
48263245
48580127
59632014
57636732
59749900
64046964
66435577
65252958
55470176
57979416
55302968
54460418
52049391
48845243
60769073
58479185
59190930
63729974
67144380
67664023
38207236
43609263
44598156
47422033
45699949
43964813
56037382
51993221
54695480
59031826
61965515
62332762
48731119
53268604
49186629
55458015
49830903
2
STT
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
Observation_dat
e
2008-05-01
2008-06-01
2008-07-01
2008-08-01
2008-09-01
2008-10-01
2008-11-01
2008-12-01
2009-01-01
2009-02-01
2009-03-01
2009-04-01
2009-05-01
2009-06-01
2009-07-01
2009-08-01
2009-09-01
2009-10-01
2009-11-01
2009-12-01
2010-01-01
2010-02-01
2010-03-01
2010-04-01
2010-05-01
2010-06-01
2010-07-01
2010-08-01
2010-09-01
2010-10-01
2010-11-01
2010-12-01
2011-01-01
2011-02-01
2011-03-01
2011-04-01
2011-05-01
RPM
71791924
75301714
78772769
76359814
60292068
64011438
57684017
62697156
57424037
52712775
65147741
64352894
65015083
70562995
76201891
73607921
60512481
63325757
58170882
62377082
58655574
52438942
67304853
64062751
67970934
73591283
78192819
75714090
64494149
68199554
62471217
64946702
60720980
54492725
69104312
66733086
70797151
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
2003-02-01
2003-03-01
2003-04-01
2003-05-01
2003-06-01
2003-07-01
2003-08-01
2003-09-01
2003-10-01
2003-11-01
2003-12-01
2004-01-01
2004-02-01
2004-03-01
2004-04-01
2004-05-01
2004-06-01
2004-07-01
2004-08-01
2004-09-01
2004-10-01
2004-11-01
2004-12-01
2005-01-01
2005-02-01
2005-03-01
2005-04-01
2005-05-01
2005-06-01
2005-07-01
2005-08-01
2005-09-01
2005-10-01
2005-11-01
2005-12-01
2006-01-01
2006-02-01
2006-03-01
2006-04-01
2006-05-01
2006-06-01
2006-07-01
2006-08-01
2006-09-01
2006-10-01
2006-11-01
2006-12-01
2007-01-01
2007-02-01
45514803
54994261
50304173
53070727
58958204
64470622
63540849
51022359
55549640
52785625
57280778
52332277
51347537
61923381
60744714
61384009
67430529
71593504
69244299
56494925
61743819
58329543
61424449
57936503
54233804
68725711
63817097
67072652
71621917
76041550
72415556
60791372
62624694
60533679
63220661
59828980
55491266
69483900
67122793
68435521
73147256
76711219
73076758
61249897
65091487
62637778
65157505
61896193
56914815
3
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
2011-06-01
2011-07-01
2011-08-01
2011-09-01
2011-10-01
2011-11-01
2011-12-01
2012-01-01
2012-02-01
2012-03-01
2012-04-01
2012-05-01
2012-06-01
2012-07-01
2012-08-01
2012-09-01
2012-10-01
2012-11-01
2012-12-01
2013-01-01
2013-02-01
2013-03-01
2013-04-01
2013-05-01
2013-06-01
2013-07-01
2013-08-01
2013-09-01
2013-10-01
2013-11-01
2013-12-01
2014-01-01
2014-02-01
2014-03-01
2014-04-01
2014-05-01
2014-06-01
2014-07-01
2014-08-01
2014-09-01
2014-10-01
2014-11-01
2014-12-01
2015-01-01
2015-02-01
2015-03-01
2015-04-01
2015-05-01
2015-06-01
75121815
80361588
76193082
65499304
67300832
62528875
65500668
61076689
57448037
70799480
67807033
71155609
76014162
79640786
77738861
65230938
66974008
63372211
65923928
62433674
57526656
72164048
67827983
72981718
77865105
81268540
79332043
66575979
69054445
63029552
70372528
64075229
57888205
73637965
70715384
75191291
79468784
83675271
81231837
68392098
71270226
65178503
71781111
65975447
59784666
75751609
73090871
78002758
82695216
87
88
89
90
91
92
93
94
95
96
97
98
99
100
2007-03-01
2007-04-01
2007-05-01
2007-06-01
2007-07-01
2007-08-01
2007-09-01
2007-10-01
2007-11-01
2007-12-01
2008-01-01
2008-02-01
2008-03-01
2008-04-01
71497177
68813909
70947617
75914661
79865223
78314560
64781658
68397379
65333114
66764862
63504217
60578995
73427185
67956166
187
188
189
190
191
192
193
194
195
196
197
2015-07-01
2015-08-01
2015-09-01
2015-10-01
2015-11-01
2015-12-01
2016-01-01
2016-02-01
2016-03-01
2016-04-01
2016-05-01
88263768
85234949
72483190
76094668
70030247
74827186
69261600
64551963
78684868
75125240
80782086
Nguồn: Mỹ. Cục Giao thông Vận tải Thống kê
Link: />1.2 Mô tả số liệu
Đồ thị chuỗi số liệu
RPM
90,000,000
80,000,000
70,000,000
60,000,000
50,000,000
40,000,000
30,000,000
2000
2002
2004
2006
2008
2010
2012
2014
Để rõ hơn trong việc quan sát, ta sẽ lấy số liệu từ tháng 1/2004 đ ến
12/2016
Ta có đồ thị
4
RPM
80,000,000
75,000,000
70,000,000
65,000,000
60,000,000
55,000,000
50,000,000
04M01
04M07
05M01
05M07
06M01
06M07
Nhận xét: nhìn vào đồ thị ta có th ể th ấy tính th ời v ụ khá rõ r ệt, vào
khoảng tháng 7 hàng năm US Air Carrier sẽ có doanh thu l ớn h ơn nhiều so
với các tháng khác, có thể đây là do giữa mùa hè nên lượng khách đi du l ịch
sẽ đông hơn.
Đồ thị tần suất
24
Series: RPM
Sample 2000M01 2016M05
Observations 197
20
16
12
8
4
0
40000000 50000000 60000000 70000000 80000000 90000000
•
Observations ( số quan sát): 197
- Std. Dev ( đô lệch chuân): 9266004
5
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
64848010
64946702
88263768
38207236
9266004.
-0.132731
2.743320
Jarque-Bera
Probability
1.119241
0.571426
- Kurtosis (đô nhọn): 2.743320 < 3 cho thấy các giá trị phân ph ối
này xuất hiện hai bên ít hơn
- Jarque-Bera: kiểm định chuôi có phân phối chuân hay không
- Probability : 0.571426 > 0.05 chưng to chuôi có phân phối chu ân
Phần II: Xây dựng mô hình dự báo ( bỏ 5 số liệu quan sát cu ối cùng)
2.1 Lựa chọn mô hình dự báo tốt nhất
2.1.1 Mô hình xu thế tuyến tính (mô hình bậc 1)
Hàm xu thế tuyến tính có dạng: RPM = β0 + β1 * TIME
Trong đó:
RPM : doanh thu hành khách ( đơn vị: ngàn dặm )
TIME : biến thời gian được tạo ra
β0 : hệ số cắt, cho biết giá trị của xu thế tại thời điểm t=0
β1 : hệ số đô dốc của mô hình
Bảng kết quả mô hình xu thế tuyến tính:
Dependent Variable: RPM
Method: Least Squares
Date: 09/13/16 Time: 22:24
Sample: 2000M01 2015M12
Included observations: 192
Variable
C
TIME
Coefficient Std. Error
t-Statistic
Prob.
54570431
104119.7
52.29488
11.10371
0.0000
0.0000
R-squared
0.393538
Adjusted Rsquared
0.390346
S.E. of regression 7201453.
Sum squared
resid
9.85E+15
Log likelihood
-3303.071
F-statistic
123.2923
Prob(F-statistic) 0.000000
1043514.
9377.019
Mean dependent var
64617980
S.D. dependent var
Akaike info criterion
9223130.
34.42783
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
34.46176
34.44157
0.872828
Từ mô hình trên ta có phương trình:
RPM = 54570431.2087 + 104119.675029*TIME
6
Đánh giá sơ bô mô hình:
Với α = 5% ta có t tra bảng = 1.96
- P-value của các biến đều bé hơn 0.05 => các biến đều có ý nghĩa
thống kê
- Ta có Prob(F-statistic) = 0.000000 < 0.05 nên mô hình có năng l ực
trong dự báo các giá trị của RPM
- R2 = 0.393538 => mô hình ước lượng giải thích được 39.3538%
biến đông của biến phụ thuôc RPM
Đồ thị dự báo mô hình xu thế tuyến tính
90,000,000
80,000,000
70,000,000
60,000,000
50,000,000
20,000,000
40,000,000
10,000,000
30,000,000
0
-10,000,000
-20,000,000
2000
2002
2004
2006
2008
Residual
2010
Actual
2012
2014
Fitted
Khoảng cách giữa giá trị thực với giá trị d ự báo không g ần nhau, các
sai số dao đông lớn, cho thấy đây là mô hình dự báo không t ốt
2.1.2 Mô hình xu thế phi tuyến tính (mô hình bậc 2)
Hàm xu thế tuyến tính có dạng: RPM = β0 + β1*TIME + β2* TIME2
Trong đó:
RPM : doanh thu hành khách ( đ ơn v ị: ngàn d ặm )
TIME, TIME2 : các biến thời gian được tạo ra
β0 : hệ số cắt, cho biết giá trị của xu thế tại thời điểm t=0
β1 : hệ số đô dốc của mô hình
Bảng kết quả mô hình xu thế phi tuyến tính:
7
Dependent Variable: RPM
Method: Least Squares
Date: 09/13/16 Time: 22:26
Sample: 2000M01 2015M12
Included observations: 192
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
TIME
TIME2
53228542
145621.4
-215.0349
1574325.
37664.02
189.0152
33.81039
3.866327
-1.137659
0.0000
0.0002
0.2567
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.397662
0.391288
7195883.
9.79E+15
-3302.416
62.38877
0.000000
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
64617980
9223130.
34.43142
34.48232
34.45203
0.878765
Từ mô hình trên ta có phương trình:
RPM = 53228541.848 + 145621.407833*TIME - 215.034884997*
TIME2
Đánh giá sơ bô mô hình:
Với α = 5% ta có t tra bảng = 1.96
- P-value (TIME2)= 0.000 < 0.05 => hệ số β1 có ý nghĩa thống kê
- P-value (TIME2)= 0.2567 > 0.05 => hệ số β2 không có ý nghĩa
thống kê
- Ta có Prob(F-statistic) = 0.000000 < 0.05 nên mô hình có năng l ực
trong dự báo các giá trị của RPM
- R2 = 0.397662 => mô hình ước lượng giải thích được 39.7662%
biến đông của biến phụ thuôc RPM
Đồ thị dự báo mô hình xu thế tuyến tính
8
90,000,000
80,000,000
70,000,000
60,000,000
50,000,000
20,000,000
40,000,000
10,000,000
30,000,000
0
-10,000,000
-20,000,000
2000
2002
2004
2006
2008
Residual
2010
Actual
2012
2014
Fitted
Nhận xét: So sánh hai mô hình xu thế trên, ta có
Chỉ tiêu so sánh
Xu thế bậc 1
Xu thế bậc 2
2
R
0.393275
0.393529
AIC
34.42063
34.42524
Mô hình xu thế tuyến tính có
- R2 tuy thấp hơn xu thế bậc 2 nhưng các hệ số đều có ý nghĩa
thống kê
- AIC thấp hơn
Kết luận: Sử dụng mô hình xu thế tuyến tính tốt h ơn trong d ự báo
2.2 Kiểm định tính thời vụ
Mô hình có biến xu thế với s = 12
12
RPMt = β1 * TIME+
� D
i 1
i
it
+ εt
Kiểm định giả thiết:
H0: các hệ số trong mô hình bằng nhau, mô hình không có tính th ời
vụ
H1: có ít nhất hai hệ số trong mô hình khác nhau
9
12
Hồi quy mô hình ban đầu: RPMt = β1 * TIMEt+
Dùng OLS hồi quy mô hình ta có:
� D
i 1
i
it
+ εt
Dependent Variable: RPM
Method: Least Squares
Date: 09/14/16 Time: 02:37
Sample: 2000M01 2015M12
Included observations: 192
Variable
Coefficient
Std. Error
t-Statistic
Prob.
TIME
D1
D2
D3
D4
D5
D6
D7
D8
D9
D10
D11
D12
103243.7
48211278
44111792
57298340
54136216
56907679
61620004
65648174
63460514
49793182
53081581
49020697
52570084
4644.100
985173.3
987174.4
989193.3
991229.8
993283.8
995355.3
997444.1
999550.1
1001673.
1003813.
1005970.
1008144.
22.23116
48.93685
44.68490
57.92431
54.61520
57.29246
61.90755
65.81639
63.48908
49.71001
52.87993
48.72976
52.14541
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
R-squared
Adjusted Rsquared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson
stat
0.860399
Mean dependent var
64617980
0.851040
3559696.
2.27E+15
-3162.061
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
9223130.
33.07356
33.29412
33.16288
0.301816
Mô hình hồi quy không ràng buôc (UR):
UR: RPM = 103243.712571*TIME + 48211277.656*D1 +
44111791.5059*D2 + 57298340.4809*D3 + 54136215.5183*D4 +
56907678.8057*D5 + 61620003.9056*D6 + 65648173.7556*D7 +
63460513.793*D8 + 49793181.7679*D9 + 53081580.6179*D10 +
49020697.2803*D11 + 52570083.9427*D12
10
Hồi quy mô hình có ràng buôc: RPMt = β0 + β1 * TIMEt + εt
Dependent Variable: RPM
Method: Least Squares
Date: 09/13/16 Time: 22:24
Sample: 2000M01 2015M12
Included observations: 192
Variable
C
TIME
Coefficient Std. Error
t-Statistic
Prob.
54570431
104119.7
52.29488
11.10371
0.0000
0.0000
R-squared
0.393538
Adjusted Rsquared
0.390346
S.E. of regression 7201453.
Sum squared
resid
9.85E+15
Log likelihood
-3303.071
F-statistic
123.2923
Prob(F-statistic) 0.000000
1043514.
9377.019
Mean dependent var
64617980
S.D. dependent var
Akaike info criterion
9223130.
34.42783
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
34.46176
34.44157
0.872828
Mô hình có ràng buôc ( R)
R: RPM = 54570431.2087 + 104119.675029*TIME
Tính F quan sát:
SSRr = 9.85E+15
SSRur = 2.27E+15
Fqs = = 54.338 > F tra bảng = 1,8
s: số thời vụ trong 1 năm (s=12)
m = s-1: số ràng buôc trong mô hình
k: số tham số trong mô hình UR
T: tổng số quan sát
Ta thấy Fqs = 54.338 > F tra bảng = 1,8
=> Bác bỏ H0 , mô hình có tính thời vụ
Mô hình tốt nhất là mô hình xu thế có tính thời vụ
11
Chạy mô hình xu thế tuyến tính có tính th ời vụ
90,000,000
80,000,000
70,000,000
60,000,000
10,000,000
50,000,000
5,000,000
40,000,000
0
30,000,000
-5,000,000
-10,000,000
-15,000,000
2000
2002
2004
2006
Residual
2008
2010
Actual
2012
2014
Fitted
Nhận xét: các giá trị dự báo gần nh ư trùng khít v ới các giá tr ị th ực t ế,
các sai số dao dông trong môt khảng nhất định, mô hình xu th ế tuyến tính
có tính thời vụ dự báo tốt.
Phần III. Ứng dụng mô hình để dự báo 5 quan sát cu ối cùng c ủa mô
hình
Mô hình dự báo tốt nhất: RPM = 103243.712571*TIME +
48211277.656*D1 + 44111791.5059*D2 + 57298340.4809*D3 +
54136215.5183*D4 + 56907678.8057*D5 + 61620003.9056*D6 +
65648173.7556*D7 + 63460513.793*D8 + 49793181.7679*D9 +
53081580.6179*D10 + 49020697.2803*D11 + 52570083.9427*D12
Tại thời điểm T+h ( h=1,2,3,4,5)
- Dự báo điểm: RPMT+h=TIMET+h*103243.712571 +
48211277.656*Dh
- Dự báo khoảng tin cậy với Zα/2 = 1.96 và
Cận dưới: RPMT+h - Zα/2 *
12
Cận trên: RPMT+h + Zα/2 *
- Sai số = giá trị thực tế - giá trị dự báo
Ta có bảng kết quả
Date
TIME
2016M01
193
2016M02
194
2016M03
195
2016M04
196
2016M05
197
Dự báo
điểm
68137312.
1
64141069.
8
77430861.
5
74371981.
2
77246687.
9
Cận dưới
Cận trên
61160307.94 75114316.26
57164065.6
4
70453857.3
4
67394977.0
4
70269683.7
4
Đồ thị mô tả kết quả trên excel
13
71118073.96
84407865.66
81348985.36
84223692.06
Sai số
1124287.9
410893.2
1254006.5
753258.8
3535398.1
20
0
20 0 -0
0 120 1-0 0 1
0 320 2-0 0 1
0 520 3-0 0 1
0 720 4-0 0 1
0 920 5 -1 0 1
0 120 7-0 0 1
0 120 8-0 0 1
0 320 9-0 0 1
10 5 -0
20 -0 1
11 720 -0 0 1
1 920 2-1 0 1
1 120 4-0 0 1
1 120 5 -0 0 1
16 3-0
-0 1
501
100000000
90000000
80000000
70000000
60000000
50000000
40000000
30000000
Thự c tế
d ự báo
c ận d ư ớ i
c ận trên
20000000
10000000
0
14
Ta thấy các giá trị dự báo gần với giá th ị th ực tế, giá tr ị th ực n ằm trong
khoảng dự báo mô hình dự báo tốt
Phần IV: Kết luận
Mô hình xu thế tuyến tính có tính th ời v ụ là mô hình d ự báo t ốt nh ất
doanh thu hành khách Miles cho US Air Carrier trong nước và quốc tế, theo
lịch trình hành khách chuyến bay giai đoạn từ tháng 01/2016 đ ến 5/2016.
15