Câu 2: Hãy thu thập dữ liệu về một hiện tượng kinh tế - xã hội theo thời gian (Chuỗi
không ít hơn 50 quan sát, có trích dẫn nguồn dữ liệu), từ đó áp dụng mô hình
ARIMA để dự báo cho ít nhất 5 quan sát trong tương lai.
Bảng tốc độ tăng trưởng dân số đô thị Việt Nam (%/năm)
(nguồn: World bank)
Năm
Y(%/năm)
Năm
Y
1968
4,633717953
1996
3,323977569
1969
4,823676052
1997
3,170995056
1970
4,709786714
1998
3,034744589
1971
2,977730867
1999
3,079498987
1972
2,883167349
2000
3,431744248
1973
2,808067685
2001
3,342092307
1974
2,763259352
2002
3,277059266
1975
2,733059703
2003
3,212619925
1976
2,709892070
2004
3,178017865
1977
2,685338537
2005
3,147253382
1978
2,683493486
2006
3,128304833
1979
2,712700363
2007
3,114679715
1980
2,611845077
2008
3,113668324
1981
2,603937451
2009
3,137466150
1982
2,642984151
2010
3,207515032
1983
2,660648362
2011
3,240144499
1984
2,656810870
2012
3,267870079
1985
2,636292701
2013
3,259347044
1986
2,610286892
2014
3,231327447
1987
2,571235999
2015
3,177314330
1988
2,542076087
2016
3,112603055
1989
2,887584290
2017
3,038908384
1990
3,975326304
2018
?
1991
3,939475617
2019
?
1992
3,884302196
2020
?
1993
3,787937766
2021
?
1994
3,656576825
2022
?
1995
3,492844559
1. Kiểm định tính dừng
Kiểm định tính dừng của Y thông qua kiểm định ADF
1
Hình 1.1: Kiểm định ADF với Y
Ta thu được kết quả sau:
Hình 1.2: Kết quả kiểm định ADF với Y
Kết quả cho Prob=0.0012<0.05, vậy chuỗi thời gian Y có tính dừng ngay ở bậc 0
d=0
Mô hình ARIMA có dạng ARMA(p,0,q).
2. Xác định bậc của p và q
Ta sử dụng View → Correlogram ta sẽ được đồ thị AC và PAC để xác định p và q như
sau:
2
Hình 2.1: biểu đồ tự tương quan và tự tương quan riêng phần
Từ đồ thị ta xác định được p=1,2 và q=1,2,15,16,17,18 do đó ta thiết lập được các mô
hình ARIMA sau: ARIMA(1,0,1), ARIMA(1,0,2), ARIMA(1,0,15), ARIMA(1,0,16),
ARIMA(1,0,17), ARIMA(1,0,18), ARIMA(2,0,1), ARIMA(2,0,2), ARIMA(2,0,15),
ARIMA(2,0,16), ARIMA(2,0,17), ARIMA(2,0,18)
3. Ước lượng mô hình.
Kết quả ước lượng bằng phần mềm Eview như sau:
3
Hình 3.1. Kết quả ước lượng cho mô hình ARIMA(1,0,1)
Hình 3.2. Kết quả ước lượng cho mô hình ARIMA(1,0,2)
4
Hình 3.3. Kết quả ước lượng cho mô hình ARIMA(1,0,15)
Hình 3.4. Kết quả ước lượng cho mô hình ARIMA(1,0,16)
5
Hình 3.5. Kết quả ước lượng cho mô hình ARIMA(1,0,17)
Hình 3.6. Kết quả ước lượng cho mô hình ARIMA(1,0,18)
6
Hình 3.7. Kết quả ước lượng cho mô hình ARIMA(2,0,1)
Hình 3.8. Kết quả ước lượng cho mô hình ARIMA(2,0,2)
7
Hình 3.9. Kết quả ước lượng cho mô hình ARIMA(2,0,15)
Hình 3.10. Kết quả ước lượng cho mô hình ARIMA(2,0,16)
8
Hình 3.11. Kết quả ước lượng cho mô hình ARIMA(2,0,17)
Hình 3.12. Kết quả ước lượng cho mô hình ARIMA(2,0,18)
Từ các kết quả ước lượng hồi quy trên ta thấy chỉ có mô hình ARIMA(2,0,1) là có ý nghĩa
thống kê → chọn làm mô hình dự báo.
4. Dự báo
9
Do chỉ có mô mô hình ARIMA(2,0,1) có ý nghĩa thống kê và tốt nhất nên ta tiến hành dự
báo bằng Eview và thu được kết quả dự bảo cho các năm 2018-2022 như sau:
YF
4.8
4.6
4.4
4.2
4.0
3.8
3.6
3.4
3.2
70
75
80
85
90
95
00
05
10
15
20
Hình 4.1. Đồ thị dự báo mô hình ARIMA(2,0,1)
Có thể thấy theo xu hướng trên thì dự báo trong 5 năm tới tốc độ tăng trưởng dân số ở
thành thị sẽ tăng với tốc độ xấp xỉ 3,29% một năm.
Bảng kết quả dự báo tăng trưởng nhân số đô thị (%/năm)
Năm
…
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
Y(%/năm)
…
3,079498987
3,431744248
3,342092307
3,277059266
3,212619925
3,178017865
3,293612997
3,293131829
3,292690211
3,292348863
3,292035572
3,291793414
Năm
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
2022
Y(%/năm)
3,291571160
3,291399370
3,291241699
3,291119828
3,291007974
3,290921517
3,290842166
3,290780832
3,290724539
3,290681027
3,290641092
3,290610224
5. Kiểm định và đánh giá mô hình
10
Hình 5.1. Kết quả kiểm định phần dư
Từ kết quả hình 5.1 cho thấy Prob=0.0000<0.05 điều này có nghĩa là phần dư của mô
hình ARIMA(2,0,1) không có tự tương quan. Và điều này có thể thấy rõ hơn trong
từng hệ số tương quan của các phân dư trong kết quả trong hình 5.2 sau:
Hình 5.2. Biểu đồ tự tương quan phần dư của mô hình ARIMA(2,0,1)
• Đánh giá dự báo
✓ MAPE = 16,99799% là khá nhỏ nên dự báo là đáng tin cậy.
✓ Do chuỗi thời gian là dài hạn nên khi sử dụng mô hình ARIMA dự báo thì độ
chính xác chưa cao. Thông thường, mô hình ARIMA chỉ dự báo một cách
chính xác cho các đối tượng biến động trong ngắn hạn.
11
✓ Ta có thể thấy với chuỗi thời gian trên thì kết quả dự báo thu được là đáng tin
cậy, tuy nhiên ta chỉ nên dự báo trong ngắn hạn.
Câu 3: Hãy thu thập dữ liệu về một biến CẦN GIẢI THÍCH và ít nhất 3 biến GIẢI
THÍCH (Dãy dữ liệu không ít hơn 20 quan sát, có trích dẫn nguồn), từ đó áp dụng
Mô hình hồi quy bội để dự báo biến phụ thuộc (bao gồm dự báo điểm và dự báo
khoảng) tại giá trị trung bình của các biến giải thích.
Bài làm
Sự phụ thuộc của biến tăng trưởng giá trị sản xuất nông nghiệp vào biến tăng trưởng giá
trị sản xuất của các biến trồng trọt, chăn nuôi và dịch vụ nông nghiệp.
Bảng 1: tăng trưởng giá trị sản xuất nông nghiệp giai đoạn 1991- 2012 (%)
Năm
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
Nông
nghiệp
2,7
8,4
6,6
4,9
6,9
6,5
7,0
5,7
7,3
5,4
2,6
6,2
4,5
4,1
3,2
4,1
3,6
7,0
2,8
4,7
4,8
2,8
trồng
Chăn
Dịch vụ
trọt
nuôi
3,3
0,1
2,1
7,6
13,2
3,4
6,8
5,6
6,3
4,7
5,6
8,0
7,3
4,8
6,6
6,9
5,3
1,1
7,0
7,8
2,0
6,0
4,8
1,1
7,6
7,0
1,9
5,2
6,7
3,7
2,3
4,2
1,9
5,5
9,9
3,2
3,8
8,1
2,3
4,6
2,3
2,3
1,4
11,4
2,6
3,4
6,9
2,7
3,4
4,6
2,7
6,9
7,6
3,5
0,9
10,5
3,3
4,3
6,3
3,1
4,7
5,5
3,1
2,7
3,2
3,3
4,831818 6,427273 3,190909
TB
Nguồn: Tổng cục thống kê, Vũ Minh Long (2014)
12
1. Xây dựng mô hình
̂ = â + b̂ *TT + ĉ*CN + d̂*DV
1.1. Hàm hồi quy mẫu (dạng hàm): NN
Trong đó:
-
Biến phụ thuộc: NN là tốc độ tăng trưởng sản xuất nông nghiệp
-
Các biến độc lập:
✓ TT: Tốc độ tăng trưởng ngành trồng trọt
✓ CN: Tốc độ tăng trưởng ngành chăn nuôi
✓ DV: Tốc độ tăng trưởng ngành dịch vụ nông nghiệp.
Kỳ vọng dấu và ý nghĩa các hệ số
-
b̂ >0, cho biết trong điều kiện các yếu tố khác không đổi thì trồng trọt tăng trưởng
1% thì trung bình tăng trưởng giá trị sản xuất nông nghiệp là b̂ %
-
ĉ >0, cho biết trong điều kiện các yếu tố khác không đổi thì chăn nuôi tăng trưởng
1% thì trung bình tăng trưởng giá trị sản xuất nông nghiệp là ĉ %
-
d̂ >0, cho biết trong điều kiện các yếu tố khác không đổi thì dịch vụ nông nghiệp
tăng trưởng 1% thì trung bình tăng trưởng giá trị sản xuất nông nghiệp là d̂%
1.2.
Ước lượng mô hình
Ta tiến hành ước lượng tham số cho mô hình này trên Eview bằng phương pháp OLS và
thu được kết quả như bảng sau:
13
Bảng 2: Kết quả hồi quy mô hình
Cũng từ bảng kết quả hồi quy trên ta có hàm hồi quy mẫu và cũng là hàm dự báo như sau:
̂ = 0,036629+ 0,790226*TT + 0,177234*CN + 0,027527*DV
𝐍𝐍
Ý nghĩa các hệ số ước lượng:
b̂ = 0,790226 cho biết khi trồng trọt tăng 1% thì trung bình nông nghiệp tăng 0,790226%,
trong điều kiện các yếu tố khác không đổi.
ĉ = 0,177234 cho biết khi chăn nuôi tăng 1% thì trung bình nông nghiệp tăng 0,177234%,
trong điều kiện các yếu tố khác không đổi.
ĉ = 0,027527 cho biết khi dịch vụ nông nghiệp tăng 1% thì trung bình nông nghiệp tăng
0,027527%, trong điều kiện các yếu tố khác không đổi.
1.3. Kiểm định các ước lượng và mô hình
Khi các tham số của mô hình được ước lượng, chúng cần được kiểm định xem có ý nghĩa về
mặt thống kê hay không và mô hình có phù hợp với cho mục tiêu dự báo hay không, hay mức
độ ảnh hưởng của các biến độc lập tới biến phụ thuộc. Phần này sẽ đề cập tới kiểm định t,
kiểm định F, hệ số xác định R2 và kiểm định sự thiếu hoặc thừa biến trong mô hình dự báo.
Hệ số xác định R2
14
Dựa vào kết quả hồi quy bảng ta được:
R2 = 0,999141, điều này cho biết các biến TT, CN, DV giải thích được 99,9141% sự thay
đổi của biến NN. Vậy mối quan hệ giữa các TT, CN, DV và NN trong mô hình là chặt chẽ
gần như tuyệt đối.
Kiểm định sự phù hợp của mô hình (kiểm định F)
Kiểm định sự phù hợp của mô hình hồi quy được tiến hành thông qua sử dụng kết quả
kiểm định F-statistic = 6979,105 với giá trị p-value(F-statistic) = 0,000000 trong bảng 2.
Kết quả này khẳng định mô hình sử dụng trong dự báo này là phù hợp.
2. Tiến hành dự báo
Từ dữ liệu bảng 1 ta tính được giá trị trung bình của các biến độc lập lần lượt là:
̅̅̅̅ = 4,831818
TT
̅̅̅̅ = 6,427273
CN
̅̅̅̅ = 3,190909
DV
2.1.
Kết quả dự báo điểm:
̂ = 0,036629+ 0,790226*4,831818 + 0,177234*6,427273 + 0,027527*3,190909 =
𝑵𝑵
5,081818 (%)
Vậy tại các giá trị trung bình, trong năm 2013 tốc độ tăng trưởng sản xuất nông nghiệp dự
kiến sẽ tăng 5,081818 (%).
Hình 1:
thịkhoảng:
giá thị thực tế và giá trị dự báo
2.2.
DựĐồ
báo
-
Khoảng tin cậy:
15
(
)(
X q tp − X q X u tp − X u
S 2u
1 + L qu
Δ = t ( n)
n − m− 1
detL
q, u
1.717* √
0,054897
18
) = 𝑡 22
0,054897
0.05 *√
18
=
= 0,094822
(do các giá trị biến phụ thuộc đều lấy tại giá trị trung bình nên
L
(X
q tp
)(
− X q X u tp − X u
qu
q, u
detL
) = 0)
Vậy, kết quả dự báo khoảng: 5,081818 – 0,094822 < NN < 5,081818 + 0,094822
4,986996 < Y < 5,17664
3. Đánh giá dự báo
3.1.
Các hệ số:
𝑏̂ = 𝟎, 𝟕𝟗𝟎𝟐𝟐𝟔 => Khi trồng trọt tăng 1% thì nông nghiệp tăng 0,790226%. P-value = 0
< 0.05 nên hệ số này có ý nghĩa thống kê.
𝑐̂ = 𝟎, 𝟏𝟕𝟕𝟐𝟑𝟒 => Khi chăn nuôi tăng trưởng 1% thì nông nghiệp tăng trưởng
0,177234%. P-value = 0 < 0.05 nên hệ số này có ý nghĩa thống kê.
𝑑̂ = 𝟎, 𝟎𝟐𝟕𝟓𝟐𝟕 => Khi dịch vụ nông nghiệp tăng trưởng 1% thì nông nghiệp tăng
trưởng 0,027527%. P-value = 0.0011< 0.05 nên hệ số này có ý nghĩa thống kê.
3.2.
Mô hình hồi quy
Prob(F-statistic) = 0,000000 < 0.05 cho thấy đây là mô hình hồi quy tốt và đáng tin cậy.
3.3.
Sai số dự báo
16
9
8
7
6
5
4
3
2
92
94
96
98
00
NNF
02
04
06
08
10
12
Forecast: NNF
Actual: NN
Forecast sample: 1991 2012
Included observations: 22
Root Mean Squared Error
0.049656
Mean Absolute Error
0.043564
Mean Abs. Percent Error
0.979341
Theil Inequality Coefficient 0.004635
Bias Proportion
0.000000
Variance Proportion
0.000215
Covariance Proportion
0.999785
Theil U2 Coefficient
0.018907
Symmetric MAPE
0.981549
± 2 S.E.
Hình 2: Đồ thị sai số dự dự báo
Từ đồ thị ta thấy:
- MAPE = 0,979341
- MSE = 0,049654
Các sai số trên cho thấy dự báo có tính chính xác rất cao.
17