Tải bản đầy đủ (.docx) (16 trang)

Tìm hiểu về doanh thu hành khách miles cho US air carrier trong nước và quốc tế, theo lich trình hành khách chuyến bay giai đoạn từ tháng 012000 đến 52016, xây dựng mô hình dự báo tốt nhất

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (238.84 KB, 16 trang )

BÀI TẬP NHÓM
Môn: KINH TẾ LƯỢNG TRONG DỰ BÁO VÀ
PTKT
GVHD: TS. Nguyễn Thị Dương Nga

Đề tài: Tìm hiểu về doanh thu hành khách Miles cho US Air
Carrier trong nước và quốc tế, theo lich trình hành khách
chuyến bay giai đoạn từ tháng 01/2000 đến 5/2016, xây
dựng mô hình dự báo tốt nhất.

Nhóm thực hiện: 14
Danh sách nhóm
STT
1
2
3
4
5

Họ và tên

Lớp

MSV


Mục lục

Phần I: Giới thiệu số liệu................................................. ....................................2
1.1
1.2



Bảng số liệu..........................................................................................2
Mô tả số liệu.........................................................................................4

Phần II: Xây dựng mô hình dự báo......................................................................7
2.1
2.2

Lựa chọn mô hình dự báo tốt nhất.......................................................7
2.1.1 Mô hình tuyến tính................................................................7
2.1.2 Mô hình phi tuyến tính..........................................................8
Kiểm định tính thời vụ.......................................................................10

Phần III: Ứng dụng mô hình để dự báo 5 quan sát cuối cùng của mô
hình........13
Phần IV: Kết luận...............................................................................................14


Phần I: Giới thiệu số liệu
1.1

Bảng số liệu:

Nghiên cứu về biến động doanh thu hành khách Miles cho US Air
Carrier trong nước và quốc tế theo lich trình hành khách chuyến bay giai
đoạn từ tháng 01/2000 đến 5/2016.
Trong đó, doanh thu hành khách (RPM) được tính bằng ngàn dặm
STT
1
2

3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

33
34
35
36
37

Observation_date
2000-01-01
2000-02-01
2000-03-01
2000-04-01
2000-05-01
2000-06-01
2000-07-01
2000-08-01
2000-09-01
2000-10-01
2000-11-01
2000-12-01
2001-01-01
2001-02-01
2001-03-01
2001-04-01
2001-05-01
2001-06-01
2001-07-01
2001-08-01
2001-09-01
2001-10-01
2001-11-01

2001-12-01
2002-01-01
2002-02-01
2002-03-01
2002-04-01
2002-05-01
2002-06-01
2002-07-01
2002-08-01
2002-09-01
2002-10-01
2002-11-01
2002-12-01
2003-01-01

RPM
48263245
48580127
59632014
57636732
59749900
64046964
66435577
65252958
55470176
57979416
55302968
54460418
52049391
48845243

60769073
58479185
59190930
63729974
67144380
67664023
38207236
43609263
44598156
47422033
45699949
43964813
56037382
51993221
54695480
59031826
61965515
62332762
48731119
53268604
49186629
55458015
49830903
2

STT
101
102
103
104

105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134

135
136
137

Observation_dat
e
2008-05-01
2008-06-01
2008-07-01
2008-08-01
2008-09-01
2008-10-01
2008-11-01
2008-12-01
2009-01-01
2009-02-01
2009-03-01
2009-04-01
2009-05-01
2009-06-01
2009-07-01
2009-08-01
2009-09-01
2009-10-01
2009-11-01
2009-12-01
2010-01-01
2010-02-01
2010-03-01
2010-04-01

2010-05-01
2010-06-01
2010-07-01
2010-08-01
2010-09-01
2010-10-01
2010-11-01
2010-12-01
2011-01-01
2011-02-01
2011-03-01
2011-04-01
2011-05-01

RPM
71791924
75301714
78772769
76359814
60292068
64011438
57684017
62697156
57424037
52712775
65147741
64352894
65015083
70562995
76201891

73607921
60512481
63325757
58170882
62377082
58655574
52438942
67304853
64062751
67970934
73591283
78192819
75714090
64494149
68199554
62471217
64946702
60720980
54492725
69104312
66733086
70797151


38
39
40
41
42
43

44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73

74
75
76
77
78
79
80
81
82
83
84
85
86

2003-02-01
2003-03-01
2003-04-01
2003-05-01
2003-06-01
2003-07-01
2003-08-01
2003-09-01
2003-10-01
2003-11-01
2003-12-01
2004-01-01
2004-02-01
2004-03-01
2004-04-01
2004-05-01

2004-06-01
2004-07-01
2004-08-01
2004-09-01
2004-10-01
2004-11-01
2004-12-01
2005-01-01
2005-02-01
2005-03-01
2005-04-01
2005-05-01
2005-06-01
2005-07-01
2005-08-01
2005-09-01
2005-10-01
2005-11-01
2005-12-01
2006-01-01
2006-02-01
2006-03-01
2006-04-01
2006-05-01
2006-06-01
2006-07-01
2006-08-01
2006-09-01
2006-10-01
2006-11-01

2006-12-01
2007-01-01
2007-02-01

45514803
54994261
50304173
53070727
58958204
64470622
63540849
51022359
55549640
52785625
57280778
52332277
51347537
61923381
60744714
61384009
67430529
71593504
69244299
56494925
61743819
58329543
61424449
57936503
54233804
68725711

63817097
67072652
71621917
76041550
72415556
60791372
62624694
60533679
63220661
59828980
55491266
69483900
67122793
68435521
73147256
76711219
73076758
61249897
65091487
62637778
65157505
61896193
56914815
3

138
139
140
141
142

143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172

173
174
175
176
177
178
179
180
181
182
183
184
185
186

2011-06-01
2011-07-01
2011-08-01
2011-09-01
2011-10-01
2011-11-01
2011-12-01
2012-01-01
2012-02-01
2012-03-01
2012-04-01
2012-05-01
2012-06-01
2012-07-01
2012-08-01

2012-09-01
2012-10-01
2012-11-01
2012-12-01
2013-01-01
2013-02-01
2013-03-01
2013-04-01
2013-05-01
2013-06-01
2013-07-01
2013-08-01
2013-09-01
2013-10-01
2013-11-01
2013-12-01
2014-01-01
2014-02-01
2014-03-01
2014-04-01
2014-05-01
2014-06-01
2014-07-01
2014-08-01
2014-09-01
2014-10-01
2014-11-01
2014-12-01
2015-01-01
2015-02-01

2015-03-01
2015-04-01
2015-05-01
2015-06-01

75121815
80361588
76193082
65499304
67300832
62528875
65500668
61076689
57448037
70799480
67807033
71155609
76014162
79640786
77738861
65230938
66974008
63372211
65923928
62433674
57526656
72164048
67827983
72981718
77865105

81268540
79332043
66575979
69054445
63029552
70372528
64075229
57888205
73637965
70715384
75191291
79468784
83675271
81231837
68392098
71270226
65178503
71781111
65975447
59784666
75751609
73090871
78002758
82695216


87
88
89
90

91
92
93
94
95
96
97
98
99
100

2007-03-01
2007-04-01
2007-05-01
2007-06-01
2007-07-01
2007-08-01
2007-09-01
2007-10-01
2007-11-01
2007-12-01
2008-01-01
2008-02-01
2008-03-01
2008-04-01

71497177
68813909
70947617
75914661

79865223
78314560
64781658
68397379
65333114
66764862
63504217
60578995
73427185
67956166

187
188
189
190
191
192
193
194
195
196
197

2015-07-01
2015-08-01
2015-09-01
2015-10-01
2015-11-01
2015-12-01
2016-01-01

2016-02-01
2016-03-01
2016-04-01
2016-05-01

88263768
85234949
72483190
76094668
70030247
74827186
69261600
64551963
78684868
75125240
80782086

Nguồn: Mỹ. Cục Giao thông Vận tải Thống kê
Link: />1.2 Mô tả số liệu
 Đồ thị chuỗi số liệu
RPM
90,000,000
80,000,000
70,000,000
60,000,000
50,000,000
40,000,000
30,000,000
2000


2002

2004

2006

2008

2010

2012

2014

Để rõ hơn trong việc quan sát, ta sẽ lấy số liệu từ tháng 1/2004 đ ến
12/2016
Ta có đồ thị

4


RPM
80,000,000
75,000,000
70,000,000
65,000,000
60,000,000
55,000,000
50,000,000
04M01


04M07

05M01

05M07

06M01

06M07

Nhận xét: nhìn vào đồ thị ta có th ể th ấy tính th ời v ụ khá rõ r ệt, vào
khoảng tháng 7 hàng năm US Air Carrier sẽ có doanh thu l ớn h ơn nhiều so
với các tháng khác, có thể đây là do giữa mùa hè nên lượng khách đi du l ịch
sẽ đông hơn.
 Đồ thị tần suất

24

Series: RPM
Sample 2000M01 2016M05
Observations 197

20
16
12
8
4
0
40000000 50000000 60000000 70000000 80000000 90000000



Observations ( số quan sát): 197
- Std. Dev ( đô lệch chuân): 9266004
5

Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis

64848010
64946702
88263768
38207236
9266004.
-0.132731
2.743320

Jarque-Bera
Probability

1.119241
0.571426


- Kurtosis (đô nhọn): 2.743320 < 3 cho thấy các giá trị phân ph ối

này xuất hiện hai bên ít hơn
- Jarque-Bera: kiểm định chuôi có phân phối chuân hay không
- Probability : 0.571426 > 0.05 chưng to chuôi có phân phối chu ân
Phần II: Xây dựng mô hình dự báo ( bỏ 5 số liệu quan sát cu ối cùng)
2.1 Lựa chọn mô hình dự báo tốt nhất
2.1.1 Mô hình xu thế tuyến tính (mô hình bậc 1)
Hàm xu thế tuyến tính có dạng: RPM = β0 + β1 * TIME
Trong đó:
RPM : doanh thu hành khách ( đơn vị: ngàn dặm )
TIME : biến thời gian được tạo ra
β0 : hệ số cắt, cho biết giá trị của xu thế tại thời điểm t=0
β1 : hệ số đô dốc của mô hình
Bảng kết quả mô hình xu thế tuyến tính:
Dependent Variable: RPM
Method: Least Squares
Date: 09/13/16 Time: 22:24
Sample: 2000M01 2015M12
Included observations: 192
Variable
C
TIME

Coefficient Std. Error

t-Statistic

Prob.

54570431
104119.7


52.29488
11.10371

0.0000
0.0000

R-squared
0.393538
Adjusted Rsquared
0.390346
S.E. of regression 7201453.
Sum squared
resid
9.85E+15
Log likelihood
-3303.071
F-statistic
123.2923
Prob(F-statistic) 0.000000

1043514.
9377.019

Mean dependent var

64617980

S.D. dependent var
Akaike info criterion


9223130.
34.42783

Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

34.46176
34.44157
0.872828

Từ mô hình trên ta có phương trình:
RPM = 54570431.2087 + 104119.675029*TIME
6


Đánh giá sơ bô mô hình:
Với α = 5% ta có t tra bảng = 1.96
- P-value của các biến đều bé hơn 0.05 => các biến đều có ý nghĩa
thống kê
- Ta có Prob(F-statistic) = 0.000000 < 0.05 nên mô hình có năng l ực
trong dự báo các giá trị của RPM
- R2 = 0.393538 => mô hình ước lượng giải thích được 39.3538%
biến đông của biến phụ thuôc RPM
Đồ thị dự báo mô hình xu thế tuyến tính
90,000,000
80,000,000
70,000,000
60,000,000

50,000,000

20,000,000

40,000,000
10,000,000

30,000,000

0
-10,000,000
-20,000,000
2000

2002

2004

2006

2008

Residual

2010

Actual

2012


2014

Fitted

Khoảng cách giữa giá trị thực với giá trị d ự báo không g ần nhau, các
sai số dao đông lớn, cho thấy đây là mô hình dự báo không t ốt
2.1.2 Mô hình xu thế phi tuyến tính (mô hình bậc 2)
Hàm xu thế tuyến tính có dạng: RPM = β0 + β1*TIME + β2* TIME2
Trong đó:
RPM : doanh thu hành khách ( đ ơn v ị: ngàn d ặm )
TIME, TIME2 : các biến thời gian được tạo ra
β0 : hệ số cắt, cho biết giá trị của xu thế tại thời điểm t=0
β1 : hệ số đô dốc của mô hình
Bảng kết quả mô hình xu thế phi tuyến tính:
7


Dependent Variable: RPM
Method: Least Squares
Date: 09/13/16 Time: 22:26
Sample: 2000M01 2015M12
Included observations: 192
Variable

Coefficient

Std. Error

t-Statistic


Prob.

C
TIME
TIME2

53228542
145621.4
-215.0349

1574325.
37664.02
189.0152

33.81039
3.866327
-1.137659

0.0000
0.0002
0.2567

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)


0.397662
0.391288
7195883.
9.79E+15
-3302.416
62.38877
0.000000

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

64617980
9223130.
34.43142
34.48232
34.45203
0.878765

Từ mô hình trên ta có phương trình:
RPM = 53228541.848 + 145621.407833*TIME - 215.034884997*
TIME2
Đánh giá sơ bô mô hình:
Với α = 5% ta có t tra bảng = 1.96
- P-value (TIME2)= 0.000 < 0.05 => hệ số β1 có ý nghĩa thống kê
- P-value (TIME2)= 0.2567 > 0.05 => hệ số β2 không có ý nghĩa
thống kê

- Ta có Prob(F-statistic) = 0.000000 < 0.05 nên mô hình có năng l ực
trong dự báo các giá trị của RPM
- R2 = 0.397662 => mô hình ước lượng giải thích được 39.7662%
biến đông của biến phụ thuôc RPM
Đồ thị dự báo mô hình xu thế tuyến tính

8


90,000,000
80,000,000
70,000,000
60,000,000
50,000,000

20,000,000

40,000,000
10,000,000

30,000,000

0
-10,000,000
-20,000,000
2000

2002

2004


2006

2008

Residual

2010

Actual

2012

2014

Fitted

Nhận xét: So sánh hai mô hình xu thế trên, ta có
Chỉ tiêu so sánh
Xu thế bậc 1
Xu thế bậc 2
2
R
0.393275
0.393529
AIC
34.42063
34.42524
Mô hình xu thế tuyến tính có
- R2 tuy thấp hơn xu thế bậc 2 nhưng các hệ số đều có ý nghĩa

thống kê
- AIC thấp hơn
Kết luận: Sử dụng mô hình xu thế tuyến tính tốt h ơn trong d ự báo
2.2 Kiểm định tính thời vụ
Mô hình có biến xu thế với s = 12
12

RPMt = β1 * TIME+

� D
i 1

i

it

+ εt

Kiểm định giả thiết:
H0: các hệ số trong mô hình bằng nhau, mô hình không có tính th ời
vụ
H1: có ít nhất hai hệ số trong mô hình khác nhau
9


12

 Hồi quy mô hình ban đầu: RPMt = β1 * TIMEt+
Dùng OLS hồi quy mô hình ta có:


� D
i 1

i

it

+ εt

Dependent Variable: RPM
Method: Least Squares
Date: 09/14/16 Time: 02:37
Sample: 2000M01 2015M12
Included observations: 192
Variable

Coefficient

Std. Error

t-Statistic

Prob.

TIME
D1
D2
D3
D4
D5

D6
D7
D8
D9
D10
D11
D12

103243.7
48211278
44111792
57298340
54136216
56907679
61620004
65648174
63460514
49793182
53081581
49020697
52570084

4644.100
985173.3
987174.4
989193.3
991229.8
993283.8
995355.3
997444.1

999550.1
1001673.
1003813.
1005970.
1008144.

22.23116
48.93685
44.68490
57.92431
54.61520
57.29246
61.90755
65.81639
63.48908
49.71001
52.87993
48.72976
52.14541

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000

R-squared
Adjusted Rsquared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson
stat

0.860399

Mean dependent var

64617980

0.851040
3559696.
2.27E+15
-3162.061

S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.

9223130.
33.07356

33.29412
33.16288

0.301816

Mô hình hồi quy không ràng buôc (UR):
UR: RPM = 103243.712571*TIME + 48211277.656*D1 +
44111791.5059*D2 + 57298340.4809*D3 + 54136215.5183*D4 +
56907678.8057*D5 + 61620003.9056*D6 + 65648173.7556*D7 +
63460513.793*D8 + 49793181.7679*D9 + 53081580.6179*D10 +
49020697.2803*D11 + 52570083.9427*D12
10


 Hồi quy mô hình có ràng buôc: RPMt = β0 + β1 * TIMEt + εt

Dependent Variable: RPM
Method: Least Squares
Date: 09/13/16 Time: 22:24
Sample: 2000M01 2015M12
Included observations: 192
Variable
C
TIME

Coefficient Std. Error

t-Statistic

Prob.


54570431
104119.7

52.29488
11.10371

0.0000
0.0000

R-squared
0.393538
Adjusted Rsquared
0.390346
S.E. of regression 7201453.
Sum squared
resid
9.85E+15
Log likelihood
-3303.071
F-statistic
123.2923
Prob(F-statistic) 0.000000

1043514.
9377.019

Mean dependent var

64617980


S.D. dependent var
Akaike info criterion

9223130.
34.42783

Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

34.46176
34.44157
0.872828

Mô hình có ràng buôc ( R)
R: RPM = 54570431.2087 + 104119.675029*TIME
 Tính F quan sát:
SSRr = 9.85E+15
SSRur = 2.27E+15
Fqs = = 54.338 > F tra bảng = 1,8
s: số thời vụ trong 1 năm (s=12)
m = s-1: số ràng buôc trong mô hình
k: số tham số trong mô hình UR
T: tổng số quan sát
Ta thấy Fqs = 54.338 > F tra bảng = 1,8
=> Bác bỏ H0 , mô hình có tính thời vụ
 Mô hình tốt nhất là mô hình xu thế có tính thời vụ
11



Chạy mô hình xu thế tuyến tính có tính th ời vụ

90,000,000
80,000,000
70,000,000
60,000,000
10,000,000

50,000,000

5,000,000

40,000,000

0

30,000,000

-5,000,000
-10,000,000
-15,000,000
2000

2002

2004

2006


Residual

2008

2010

Actual

2012

2014

Fitted

Nhận xét: các giá trị dự báo gần nh ư trùng khít v ới các giá tr ị th ực t ế,
các sai số dao dông trong môt khảng nhất định, mô hình xu th ế tuyến tính
có tính thời vụ dự báo tốt.
Phần III. Ứng dụng mô hình để dự báo 5 quan sát cu ối cùng c ủa mô
hình
Mô hình dự báo tốt nhất: RPM = 103243.712571*TIME +
48211277.656*D1 + 44111791.5059*D2 + 57298340.4809*D3 +
54136215.5183*D4 + 56907678.8057*D5 + 61620003.9056*D6 +
65648173.7556*D7 + 63460513.793*D8 + 49793181.7679*D9 +
53081580.6179*D10 + 49020697.2803*D11 + 52570083.9427*D12
Tại thời điểm T+h ( h=1,2,3,4,5)
- Dự báo điểm: RPMT+h=TIMET+h*103243.712571 +
48211277.656*Dh
- Dự báo khoảng tin cậy với Zα/2 = 1.96 và
Cận dưới: RPMT+h - Zα/2 *
12



Cận trên: RPMT+h + Zα/2 *
- Sai số = giá trị thực tế - giá trị dự báo

Ta có bảng kết quả
Date

TIME

2016M01

193

2016M02

194

2016M03

195

2016M04

196

2016M05

197


Dự báo
điểm
68137312.
1
64141069.
8
77430861.
5
74371981.
2
77246687.
9

Cận dưới

Cận trên

61160307.94 75114316.26
57164065.6
4
70453857.3
4
67394977.0
4
70269683.7
4

Đồ thị mô tả kết quả trên excel

13


71118073.96
84407865.66
81348985.36
84223692.06

Sai số
1124287.9
410893.2
1254006.5
753258.8
3535398.1


20
0
20 0 -0
0 120 1-0 0 1
0 320 2-0 0 1
0 520 3-0 0 1
0 720 4-0 0 1
0 920 5 -1 0 1
0 120 7-0 0 1
0 120 8-0 0 1
0 320 9-0 0 1
10 5 -0
20 -0 1
11 720 -0 0 1
1 920 2-1 0 1
1 120 4-0 0 1

1 120 5 -0 0 1
16 3-0
-0 1
501

100000000
90000000

80000000

70000000

60000000

50000000

40000000

30000000
Thự c tế
d ự báo
c ận d ư ớ i
c ận trên

20000000

10000000

0


14


Ta thấy các giá trị dự báo gần với giá th ị th ực tế, giá tr ị th ực n ằm trong
khoảng dự báo  mô hình dự báo tốt
Phần IV: Kết luận
Mô hình xu thế tuyến tính có tính th ời v ụ là mô hình d ự báo t ốt nh ất
doanh thu hành khách Miles cho US Air Carrier trong nước và quốc tế, theo
lịch trình hành khách chuyến bay giai đoạn từ tháng 01/2016 đ ến 5/2016.

15



×