Tải bản đầy đủ (.doc) (14 trang)

tiểu luận dự báo kinh tế dự báo chỉ số sản xuất công nghiệp ngành khai thác và thu gom than của việt nam giai đoạn 2018 2019 sử dụng mô hình ARIMA

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (645.32 KB, 14 trang )

1.

Giới thiệu
Việt Nam là một trong những quốc gia được thiên nhiên ưu đãi có trữ lượng than lớn

và chất lượng tương đối tốt. Than được coi là nguồn năng lượng truyền thống và cơ bản,
phục vụ cho sản xuất và tiêu dùng trong nước. Than là nguyên liệu chính cho hầu hết các
ngành công nghiệp quan trọng có ý nghĩa to lớn đối với nền kinh tế quốc dân như ngành
công nghiệp điện, sản xuất xi măng, luyện kim, xây dựng, công nghiệp vật liệu, hóa chất,
sản xuất phân bón hóa học... Ngành công nghiệp khai thác than của nước ta đã có lịch sử
hơn 100 năm phát triển, và ngày nay đã được đầu tư hơn về vốn và kỹ thuật mang lại hiệu
quả kinh tế lớn, đóng góp đáng kể vào GDP cả nước. Có thể thấy được tầm quan trọng của
ngành than và việc phát triển ngành công nghiệp khai thác và thu gom than ổn định là tiền
đề để phát triển các ngành công nghiệp khác.
Chỉ số sản xuất công nghiệp hàng tháng (gọi tắt là IIP) do Tổng cục Thống kê công
bố được tính toán trên sự biến động của khối lượng sản xuất bao gồm 4 ngành: khai
khoáng; công nghiệp chế biến, chế tạo; sản xuất và phân phối điện, khí đốt, nước nóng và
điều hoà không khí; cung cấp nước, hoạt động quản lý và xử lý rác thải, nước thải.
Nhận thấy tầm quan trọng và vai trò to lớn của ngành khai thác và thu gom than đối
với nền kinh tế nước ta, nhóm chúng em đã quyết định chọn đề tài “Dự báo chỉ số sản
xuất công nghiệp ngành khai thác và thu gom than của Việt Nam giai đoạn 2018-2019 sử
dụng mô hình ARIMA”.
2.

Phương pháp nghiên cứu

2.1.

Dữ liệu
Số liệu về chỉ số sản xuất công nghiệp than cứng dùng cho đề tài được tổng hợp từ


các báo cáo của Tổng cục thống kê www.gso.gov.vn. Số liệu được thu thập theo tháng từ
tháng 1/2013 đến tháng 12/2017 bao gồm 60 quan sát. Chỉ số sản xuất than cứng ở các
năm thì được tính so với tháng bình quân năm gốc của năm 2010, đơn vị tính %.

4


2.2.

Phương pháp nghiên cứu
Mô hình tích hợp trung bình trượt tự hồi quy (mô hình ARIMA) được tích hợp từ 3

quá trình: Tự hồi quy (AR) đối với các số liệu kinh tế - xã hội, trung bình trượt (MA) đối
với phần sai số của số liệu (hay phần nhiễu ngẫu nhiên) và quá trình tích hợp hay sai phân
(I) nhằm biến đổi chuỗi không dừng thành chuỗi dừng trước khi thực hiện các thao tác
phân tích và dự báo khác. Bản chất của mô hình ARIMA là dự báo giá trị tương lai của
một biến số (biểu thị theo chuỗi thời gian) dựa trên giá trị quá khứ và các sai số ngẫu
nhiên. Do đó mô hình ARIMA thích hợp cho dự báo ngắn hạn.
Mô hình ARIMA(p,d,q) có dạng:
Yt =

+

Yt-1+

Yt-2 +……+

pYt-p+ut+

u1+


u2+

+

ut-q

Một đặc điểm rất quan trọng của các dữ liệu chuỗi thời gian về kinh tế - xã hội là có
yếu tố mùa vụ cao, chẳng hạn thực tiễn nền kinh tế nước ta cho thấy GDP thường tăng cao
vào những tháng cuối năm, tăng chậm vào những tháng đầu năm, ... Do đó để dự báo bằng
mô hình ARIMA cho chuỗi có yếu tố mùa vụ, ta có 2 cách làm như sau:

Cách 1: tách yếu tố mùa vụ ra khỏi chuỗi ban đầu thành chuỗi mới Y
cho chuỗi Y
cộng.

SA

SA

rồi dự báo

, sau đó cộng hoặc nhân yếu tố mùa vụ lại tùy vào mô hình là nhân hay

Cách 2: sử dụng mô hình SARIMA để ước lượng
Ở đây, nhóm chọn cách 1 để dự báo chỉ số sản xuất công nghiệp ngành khai thác và
thu gom than của Việt Nam.
2.3.

Các bước thực hiện


2.3.1. Nhận dạng mô hình
Trước hết, cần nhận dạng mô hình là mô hình cộng tính hay mô hình nhân tính bằng
cách dựa vào đồ thị của biến đang xét.
Tiếp theo, cần nhận dạng mô hình là mô hình có yếu tố mùa vụ hay không có yếu tố
mùa vụ, có yếu tố xu thế hay không có yếu tố xu thế. Nếu mô hình có yếu tố mùa vụ thì
5


cần tách yếu tố mùa vụ ra khỏi mô hình trước khi ước lượng bằng phương pháp trung bình
động (MA). Nếu mô hình có yếu tố xu thế thì cần tạo biến xu thế và thêm vào mô hình
ước lượng.
Nhận dạng mô hình ARIMA(p,d,q) phù hợp cho chuỗi dữ liệu được khảo sát, với d là
bậc sai phân của chuỗi dữ liệu, p là bậc tự hồi quy và q là bậc trung bình trượt. Trong đó,
giá trị của p được các định dựa vào giản đồ tương quan riêng (PACF) và giá trị của q được
xác định dựa vào giản đồ tương quan (ACF).
2.3.2. Ước lượng tham số
Tiến hành ước lượng tham số cho mô hình có khả năng phù hợp đã được nhận dạng.
2.3.3. Kiểm tra mô hình
Sau khi mô hình vượt qua được kiểm định bỏ sót biến, dựa vào giá trị sai số của mô
hình để kiểm tra nhiễu trắng. Nếu phần dư không có hiện tượng tự tương quan ở 12 bậc
liên tiếp thì nhiễu được coi là nhiễu trắng. Trường hợp mô hình ước lượng không thoả mãn
điều kiện nhiễu trắng thì phải thay đổi mô hình và tiến hành lại bước ước lượng và kiểm
tra.
3.

Kết quả nghiên cứu

3.1.


Nhận dạng dữ liệu

Để nhận dạng dữ liệu của chuỗi Prod, ta sẽ sử dụng lệnh: Line Prod

6


Hình 1:Nhận dạng dữ liệu
Đồ thị trong hình 1 có biên độ dao động dường như không thay đổi, do đó để tiến
hành ước lượng được ta phải sư dụng mô hình cộng tính.
3.2.

Kiểm định tính dừng

Chuỗi số liệu sử dụng trong mô hình ARIMA được giả định là chuỗi dừng, vì vây để
dự báo sản lượng khai thác và thu gom than cứng của Việt Nam bằng mô hình này, trước
tiên ta cần phải kiểm định tính dừng của chuỗi dữ liệu nghiên cứu. Ta sử dụng kiểm định
nghiệm đơn vị “Unit Roots Test”

7


Hình 2:Kết quả kiểm định Unit Roots Test của chuỗi Prod
Theo kết quả có được ở hình 1 cho thấy, chuỗi Prod dừng ở sai phân bậc 1 và không
có yếu tố xu thế (do yếu tố Trend có giá trị p-value =0.3742 lớn hơn mức ý nghĩa alpha =
5%).
3.3.

Kiểm định tính mùa vụ


Để kiểm tra xem chuỗi Prod có tính mùa vụ hay không ta sử dụng lệnh Graph.

8


Hình 3:Kiểm định tính mùa vụ của chuỗi Prod
Từ kết quả hình 3, ta thấy các đường màu đỏ (Means by Season) của chuỗi có sự
chênh lệch lớn giữa các tháng. Do đó chuỗi Prod có chứa yêu tố mùa vụ.
3.4.

Nhận dạng mô hình
Sau khi kiểm định được chuỗi Prod dừng ở bậc 1, có yếu tố mùa vụ và không có yếu

tố xu thế, ta tiến hành tách yếu tố mùa vụ ra khỏi chuỗi bằng phương pháp Moving
Average Method với Adjustment Method là Multiplicative và đặt tên Factors mùa vụ là: s.
Chuỗi mới được tạo ra là Prodsa.
Ta bắt đầu xác định mô hình thông qua thao tác lập mô hình Correlogram, thu được
kết quả sau:

9


Hình 4: Giản đồ tương quan và tương quan riêng PACF và ACF

Khảo sát ACF ở hình 4 cho thấy, 4 và 12 là độ trễ phù hợp. Tương tự với khảo sát
của PACF tại độ trễ bằng 1 cũng có ý nghĩa thống kê. Sau khi xác định được các giá trị p,
q, ta ước lượng được mô hình theo lệnh:
ls d(prodsa) c ar(1) ma(4) ma(12)
Thu được kết quả:


10


Hình 5: Kết quả chạy mô hình
Ta thấy giá trị Inverted AR Roots = -.35 và Inverted MA Roots=.99, đều thoả mãn
nhỏ hơn 1.
3.5.

Kiểm định mô hình bỏ sót biến

Sau khi ước lượng mô hình, ta tiến hành kiểm định xem mô hình có bị thiếu biến
hay không bằng cách sử dụng kiểm định Ramsay Reset Test.

11


Hình 6: Kiểm định Ramsay Reset Test
Giá trị p-value lớn hơn mức ý nghĩa alpha 5%, do đó ta không bác bỏ giả thuyết Ho
➔ mô hình không bị bỏ sót biến.
3.6.

Kiểm định nhiễu trắng

Ta kiểm định nhiễu trắng cho mô hình bằng kiểm định Serial Correlation LM Test
với Lags include =12.

12


Hình 7:Kiểm định nhiễu trắng bằng Serial Correlation LM Test


Tất cả các giá trị p-value của các độ trễ từ 1 đến 12 đều có giá trị lớn hơn mức ý
nghĩa alpha 5%. Do đó mô hình đảm bảo điều kiện nhiễu trắng (không có tự tương quan ở
12 độ trễ liên tiếp).
3.7.

Kiểm định phân phối của nhiễu
Ta sử dụng kiểm định Normally Test.

Hình 8: Kiểm định Normally Test
Giá trị p-value =0.562712 lớn hơn mức ý nghĩa alpha 5%, do đó nhiễu có phân phối
chuẩn.
13


3.8.

Dự Báo

Từ kết quả các kiểm định trên ta có thể kết luận mô hình là thích hợp và có thể sử
dụng để dự báo. Tuy nhiên trước khi dự báo ngoài mẫu, ta tiến hành cắt một giai đoạn
ngẫu nhiên để kiểm tra độ chính xác của mô hình dự báo. Thực hiện với đoạn 2013m012013m06, thu được kết quả:

Hình 9: Forecast Prodsaf giai đoạn 2013m01-2013m06
Forecast của chuỗi Prodsa trong giai đoạn 2013m01- 2013m06 có giá trị Mean Abs.
Percent Error = 3.004753 <5. Kết quả dự báo so với giá trị thực tế có chênh lệch không
lớn. Do vậy mà sử dụng chuỗi Prodsa trong giai đoạn 2013m01-2017m12 để dự báo
ngoài mẫu là đáng tin cậy. Ta tiến hành dự báo ngoài mẫu cho chuỗi Prodsa và thu được
kết quả như bảng dưới:
time

2018m01
2018m02
2018m03
2018m04
2018m05
2018m06
2018m07
2018m08
2018m09
2018m10

Prodsaf
78.83173
78.37739
77.92306
77.46872
77.01439
76.56005
76.10571
75.65138
75.19704
74.74270

time
2019m01
2019m02
2019m03
2019m04
2019m05
2019m06

2019m07
2019m08
2019m09
2019m10

Prodsaf
73.37970
72.92536
72.47102
72.01669
71.56235
71.10802
70.65368
70.19934
69.74501
69.29067
14


2018m11
2018m12

74.28837
2019m11
73.83403
2019m12
Hình 10: Giá trị dự báo ngoài mẫu của chuỗi Prodsa

68.83633
68.38200


Quay lại cửa sổ Command: Genr Prodf=Prodsaf + s , ta thu được kết quả dự báo
cho chuỗi Prod giai đoạn 2018m01-2019m12.
Time
2018m01
2018m02
2018m03
2018m04
2018m05
2018m06
2018m07
2018m08
2018m09
2018m10
2018m11
2018m12

Prodf
75.54734
61.42538
91.00599
81.44983
84.62512
80.63206
60.13241
54.98926
63.19092
85.31569
84.46598
93.21459


Time
2019m01
2019m02
2019m03
2019m04
2019m05
2019m06
2019m07
2019m08
2019m09
2019m10
2019m11
2019m12

Prodf
70.09530
55.97334
85.55395
75.99780
79.17308
75.18003
54.68038
49.53723
57.73889
79.86366
79.01395
87.76256

Gõ lệnh: Line Prod Prodf – đồ thị thu được cho thấy chuỗi dự báo đã dự báo tốt cho

mô hình.

Hình 11: Giá trị dự báo ngoài mẫu cho chuỗi Prod.
15


Như vậy qua phương pháp dự báo ARIMA ta có thể thấy sản lượng khai thác và thu
gom than cứng của Việt Nam trong giai đoạn 2018-2019 sẽ có biến động nhẹ, tuy nhiên
sản lượng sẽ ở mức thấp hơn và chỉ dao động trong khoảng từ 61 tới 93 (đơn vị:%) so với
năm gốc 2010.
4.

Kết luận
Bài viết đã nghiên cứu được khả năng ứng dụng mô hình ARIMA vào việc dự báo

chỉ số sản xuất than cứng tại Việt Nam cho năm 2018 và năm 2019. Từ kết quả dự báo
cho thấy mô hình ARIMA cho kết quả dự báo về chỉ số sản xuất than cứng là đáng tin cậy.
Dự kiến các tháng năm 2018 sẽ ở mức từ 63%-97% so với năm gốc là năm 2010.
Còn lượng khai thác và thu gom than cứng các tháng năm 2019 được dự báo ở mức từ
62.5%- 87.5% so với năm gốc, mức sản xuất này có xu hướng thấp hơn so với năm 2018.
Do việc khai thác than và sử dụng nhiều than sẽ gây ra sự ô nhiễm môi trường, làm
biến đổi khí hậu do có khí cacbon dioxit thải ra trong quá trình khai thác và sử dụng, là
nguyên nhân cho nhiều bệnh tật nên lượng than khai thác và sử dụng có xu hướng giảm
dần, đúng với kết quả dự báo. Thay vào đó có thể sử dụng những nguồn năng lượng sạch,
thân thiện với môi trường để hạn chế những tác động xấu tới môi trường sống của con
người.
5.

Tài liệu tham khảo
- Nguyễn Quang Dong, Nguyễn Thị Minh, 2015, Giáo trình Kinh tế lượng, NXB


Đại học Kinh tế quốc dân.
- Triển vọng Kinh tế tài chính 2018, Chuyên san Kinh tế Tài chính – Ngân hàng ( Số
15 – tháng 5/2018) , trang 15 – 22.
/>mau_web.pdf?fbclid=IwAR1-kH68m_CZsO4c0DgRw63vGH16OkRmUps72cm6M0PHRJAd6lflPejWyw />16


ocs/SubDomain/fb/Chuy%C3%AAn%20san/cs15_mau_web.pdf?fbclid=IwAR1kH68m_CZsO4c0D-gRw63vGH16OkRmUps72cm6M0PHRJAd6lflPejWyw
- Chỉ số sản xuất công nghiệp của Việt Nam qua các năm – Tổng cục thống kê
www.gso.gov.vn

17



×