Tải bản đầy đủ (.pdf) (73 trang)

Chuyên đề chuyên ngành: Sử dụng mô hình ARIMA, Ramdom Forest và mạng nơ-ron nhân tạo để dự báo giá đồng Ethereum

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (22.29 MB, 73 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

TRUONG ĐẠI HỌC KINH TE QUOC DANKHOA TOAN KINH TE

BO MON TỐN TAI CHÍNH

CHUYEN DE CHUYEN NGANHTOAN TAI CHINH

DE TAI:

SỬ DUNG MO HÌNH ARIMA, RANDOM FOREST VA MẠNG

NO- RON NHAN TAO DE DU BAO GIA DONG ETHEREUM.

<small>Ho va tén sinh vién : Ngô Thi Phương Duyên</small>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

CHUYÊN ĐỀ CHUYÊN NGÀNH - TOÁN KINH TẾ ©)

LỜI CẢM ƠN

Em xin gửi lời cảm ơn sâu sắc nhất tới tồn thé các thầy cơ giảng viên TrườngĐại học Kinh tế Quốc dân nói chung và thầy cơ khoa Tốn Kinh Tế nói riêng đãln đồng hành, dìu dắt và hỗ trợ giúp đỡ va tạo mơi trường học tập, hoan thiệnkiến thức nền tảng chuyên sâu ngành nghề cũng như phát triển bản thân cho chúngem. Bên cạnh đó, em muốn gửi lời cảm ơn sâu sắc tới gia đình và các anh chị cũngnhư những người bạn bè đã bên cạnh động viên, khuyến khích, giúp đỡ em trongsuốt quá trình em thực hiện chuyên đề tốt nghiệp.

Đặc biệt, em muốn gửi lời cảm ơn chân thành và sâu sắc nhất nhất đến tới côThs. Nguyễn Thị Liên — giảng viên hướng dẫn em hoàn thành chuyên đề tốt nghiệpchuyên ngành với đề tài “ Sứ dung mơ hình ARIMA và mạng nơ-ron nhân tạo đểdự báo giá đồng Ethereum” .

Do thời gian thực hiện và kiến thức chun mơn của em cịn hạn hẹp nênchun đề khơng tránh khỏi nhiều sai sót, mơ hình vẫn chưa được hoàn thiện. Emrất mong nhận được lời nhận xét, góp ý từ các thầy cơ đề em có thê rút kinh nghiệmvà trau dồi thêm kiến thức về chuyên ngành.

<small>Em xin chân thành cảm ơn!</small>

<small>Sinh viên</small>

<small>Ngô Thị Phương Duyên</small>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

1. Lý do chon đề tài ---=--~-============r=z====ermzz==mermmx=eeermmme 1

<small>2. Mục tiêu nghiên cứu --- 2</small>

3. Đối tượng và phạm vi nghiên cứu: ---~--========================= 2

<small>4. Phương pháp nghiên cứu --- 2</small>

5. Kết cau chuyên đề ---~~---=~~~================z====r=mz====mmmrm==ee 3

<small>e:00/9) 1e “~-. 4</small>

CƠ SỞ LÝ THUYÉT VA TONG QUAN CÁC PHƯƠNG PHÁP NGHIÊN

(M000 Tư... 11.1, Ĩ 4I. CƠ SỞ LÝ THUY ÉTT---=-~-~¬~============z=======m==z======erm=mmz===emrm= 4

1.1.Cơ sở lý thuyết về dự báo chuỗi thời gian --- 4

1.1.1. Khái niệm chuỗi thời gian--- 4

1.12. Một số các đặc trưng của chuỗi thời gian --- 5

1.1.3. Đánh giá sai số trong dự báo chuỗi thời gian --- 8

1.1.4. Bài toán dự báo chuỗi thời gian trong kinh tế và kinh doanh--- 9

II. PHUONG PHÁP NGHIÊN CUU ---=================================ee 92.1.Téng quan về các phương pháp dự bao--- 9

2.2 Tổng quan về Machine Learning va Deep Learning --- 13

<small>2.2.1 Machine Learning --- 13</small>

2.2.2 Tổng quan về Deep Learning --- 14

2.3 Co sở ly thuyét ve mang no-ron nhân tao --- 15

<small>Ngơ Thi Phương Dun - MSV: 11191354 — Tốn Kinh tế 61</small>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

2.3.1 Mạng nơ-ron hồi quy RNN ---~~~~~~~~~=~~~~==================~z 16

<small>2.3.2 Mạng Long - Short Term Memory --- 18</small>

<small>2.4 Mô hình ARIMA ---~-===============r==e==rxemeemmememm=mm=m 232.4.1 Tinh dimg nnnnnnnnnnnnanẽnnana nan 23</small>

2.4.2 Qua trinh tu hồi quy (AR), trung bình trượt (MA) và mơ hình ARIMA----26

2.4.3 Mơ hình hồi quy kết hợp trung hình trượt ARIMA (p,d,q) --- 27

<small>2.4.4 Phuong pháp Box-Jenkins (BJ) --- 27</small>

<small>2.5 Mơ hình Random Forest ---+ 29</small>

<small>2.5.1 Thuật tốn Decision Tree --- 29</small>

<small>2.5.2 Mơ hình Random Forest (RF) --- 30</small>

<small>/60710/0)/022 7 NV Aggggggggggggggggggg 32</small>

TONG QUAN VE TIEN MÃ HÓ A---~~~~~~~~~~¬~====================r 322.1T ống quan về tiền mã hố (Cryptocurrency) --- 32

2.2 ETHEREUM (ETH) - Đồng tiền chiếm vốn hóa cao thứ hai trênthị trường tiền mã hóa---=--=========================e======emz==m=emm=r 342.3 Ứng dụng của Ethereum --- 38

<small>CHU ONG 3 7 Ợ NA. 39</small>

KET QUÁ NGHIÊN CUU ---====================m=m==============r 39

<small>3.1 Dữ liệu ---====================r==r==r=erememmrmmrmmemmemmemm=mm=m 39</small>

3.2 Phần mềm phân tích --- 41

<small>3.3 Xử lý dữ liệu --- 42</small>

3.3.1 Kiểm định tinh dừng của chuỗi thời gian: --- 42

3.3.2 Xử lý dit liệu đầu vào cho mơ hình LSTM --- 44

<small>3.4 Xây dựng mơ hình --- 46</small>

<small>3.4.1 Mạng LSTM--- 46</small>

<small>3.4.2 Mơ hình ARIMA ---~--~-~--~-~~=~=~~=~~=~==~=~==~=~~=~==~=~~=~=r~===~==~=~=~~ 463.4.3 Random FOT€S{---=--=====~~~==~~=~~~=~~~=~~~==~~~=~==~=~~~==~~==~~=mr 473.5 Đánh giá và so sánh ba mơ hình --- 50CHU ONG 4 ---~~--~~-~==~=====================r==rr=rr=rr=r===rr==rm==rm==em 53</small>

<small>Ngô Thi Phương Duyên - MSV: 11191354 — Toán Kinh tế 61</small>

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

DANH MỤC TỪ VIẾT TẮT

Tên viết tắt Tên đầy đủ

<small>ANN Artificial Neural Network: Mang nơron nhân tao</small>

<small>RNN Recursive Neutral Networks</small>

<small>DL Deep Learning: Hoc sau</small>

<small>LSTM Long Short Term Memory</small>

MSE Mean Squared Error: Sai số bình phương trung

<small>ETH Ethereum</small>

<small>MAPE Mean Absolute Percentage ErrorMAE Mean absolute error</small>

<small>RMSE Root Mean Square Error</small>

<small>CNTN Công nghệ thông tin</small>

<small>ML Machine Learning</small>

<small>Al Tri tué nhan tao</small>

<small>SAC Sample Auto Correllation</small>

<small>Ngô Thi Phương Duyên - MSV: 11191354 — Toán Kinh tế 61</small>

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

DANH MỤC HÌNH ẢNH

Hình 1.1 - Ví dụ về chuỗi thời gian mô tả giá cô phiếu trong năm 2020... 4

Hình 1.2 - Các thành phan của chuỗi thời gian (tính thời vụ)...--.--- 6

Hình 1.3 - Các thành phan của chuỗi thời gian (tính xu thế)...--.--- 6

Hình 1.4 - Các thành phan của chuỗi thời gian (tính chu kỳ...---: 7

Hanh N00 i8: TA “...-‹ŒALAẠH,H... 8

<small>Hinh 2.1 — Mang RNN 1... =... 17</small>

<small>Hình 2.2 — Bidirectional RNN ...cccccecccecceecscesssecsssscsssscessscessscessseesesscssseceessess 1820000 %0) ...+dAH,... 18</small>

<small>Hình 2.4 — Mạng LSTM...--2- 2£ ©+£+E£+EEE2EEECEEEE21E22112112112221e 21 E1 crrk. 19</small>Hình 2.5 — Tế bao trạng thái LSTM giống như một băng trun... 20

Hình 2.6 — Cơng trạng thái LSTM...--2- 2 ©+¿©++++++EE++EEEzrxeerxeerxeerseee 21Hình 2.7 — LSTM bước thứ nhất...----2- 2© +++2E+++EEx++EE++etrxrerrxrerrrree 21<small>Hình 2.8 — LSTM bước thứ hai...- 2-22 56 ©2++2EE+2EEESEEEEEEECEEEEerkrerkrerrrrrree 22Hình 2.9 — LSTM bước thứ ba...--.2- 22 5+©2E+2EESEEESEEEEEEECEEEErkrerkrerrkrrree 22</small>Hình 2.10 — LSTM bước cuối cùng...---2¿5¿++2E++2E+2Ex++Exeerxxerreerree 23<small>Hình 2.11 — Decision 'ÏÏr€€-...-- -- -- << 2+2 33221332131 111 811 1 vn ng ng ng vec 29Hinh 2.12 — Random Forest 0077 ... 30</small>

Hình 3.1 - Biéu đồ tong vốn hố thị trường Tiền mã hố (nguồn: INVESTING)...33

Hình 3.2— Biéu đồ thé hiện phan trăm vốn hóa của thị trường tiền mã hóa... 34

Hình 3.3 — Biểu đồ giá của ETH theo VND và BTC...----2-©5cc©csccc+¿ 35Hình 3.4— Bảng xếp hạng các quốc gia chấp nhận giao dịch tiền mã hóa... 37

Hình 4.1 — Đồ thị chuỗi giá của ETH...-2- 2: ©5¿2++++++2zxtrxeerxesrxeersree 39Hình 4.2 — Đồ thị chuỗi giá của ETH...---¿- 2: 5¿22++2+2Ex2Exeerxxerrxerree 42Hình 4.3 - Đồ thị ACF và PACE của lợi suất giá ETH...---¿-s¿ 47Hình 4.4 - Kết qua MAPE với từng mức biến trễ tương Ung ...---- 48Hình 4.5 — Kết quả dự báo ba mơ hình...--- 2-2 +2 ©++2x++£x++tx+zzxezrxd 50

<small>Hình 4.6 - Mơ tả Confusion MiatFIX...--- <2 E22 E21 E231 E£*3E£#sEczeerse 51</small>

<small>Ngô Thị Phương Duyên - MSV: 11191354 — Toán Kinh tế 61</small>

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE

DANH MỤC BANG

Bảng 1 — Bảng thống kê mô tả lần lượt chuỗi giá ETH...---:-5:

<small>Bảng 2 - Các thư viện được sử dụng ...- --- 5 cà + St nrrrrirrrrrkeBảng 3 - Ket quả phân tích mạng LSŠTÌM...----cccccccerieereerirerrree</small>

<small>Bang 4 - Kiêm định các mơ hình ARIMA...c-ccccceerieriririrreeBang 5 - Két quả mơ hình Random FOT€St...----c5-5cccsextertertererreerreer</small>

<small>Bảng 6 — Bang thê hiện các tiêu chí đánh g1á...- s5 555 5552 seevrsessses</small>

Bảng 7 - Tính tốn các chỉ số từ việc dự báo tăng giảm của ba mô hình

<small>Ngơ Thị Phương Dun - MSV: 11191354 — Tốn Kinh tế 61</small>

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

CHUYÊN ĐỀ CHUYÊN NGÀNH - TỐN KINH TẾ ©)

MO DAU

1. Ly do chon dé tai

Dự báo chuỗi thời gian trong tài chính có lẽ là sự lựa chọn hàng dau cho

<small>các nhà nghiên cứu tải chính trong đó có cả học viện và ngành tài chính do các lĩnh</small>

vực triển khai rộng rãi và tác động đáng ké của dự báo chuỗi thời gian. Các nhànghiên cứu về Học máy (ML) đã tạo ra được nhiều mơ hình khác nhau và một sốlượng lớn các nghiên cứu đã có thê xuất bản tương ứng. Chính vì vậy, một số lượngđáng kể các cuộc điều tra bao gồm các nghiên cứu ML về dự báo chuỗi thời giantài chính. Các mơ hình Học sâu (DL) đã xuất hiện trong lĩnh vực này, DL đã chora kết quả vượt trội hon khá đáng ké so với những đối tac ML truyền thống của nó.Mặc dù, ngày càng có nhiều sự quan tâm đến van dé phát triển các mơ hình dự báochuỗi thời gian tài chính, tuy nhiên vẫn còn thiếu các tài liệu đánh giá chỉ tập trung

<small>vào DL cho tài chính. Do đó, em lựa chọn phương pháp DL là trọng tâm của</small>

chuyên với mong muốn cung cấp một đánh giá khả năng dự báo chuỗi thời giancủa DL so sánh với các phương pháp truyền thống khác, cụ thé là mơ hình ARIMAvà mơ hình Random Forest, qua đó đánh giá chỉ số và đánh giá khả năng dự báocủa mơ hình DL và hiệu quả của nó khi dự báo cụ thê vào đồng Ethereum.

Ngồi ra, song hành với sự phát triển đó, hiện nay, với xu hướng phát triéntất yêu của công nghệ Blockchain, sự xuất hiện và phát triển của các loại tiền mãhoá (Cryptocurrencies) được coi là xu thé của tương lai. Thị trường tiền mã hoángày càng phát triển với tốc độ nhanh chóng cùng với sự đa dạng hoá về loại tiềnmã hoá cũng như tăng trưởng mạnh về quy mô thị trường và quy mô các giao dịchsử dụng tiền mã hoá, thúc day sự lan tod và phơ biến của tiền mã hố trên phạm vitồn cầu. Tuy nhiên, cần có thời gian dé minh chứng cho sự cần thiết dé phát triểncủa các loại tiền mã hóa.

Tại Việt Nam, tuy hệ thong pháp ly khơng cơng nhận tiền mã hố tương tựnhư tiền pháp định quốc gia và cam sử dụng tiền mã hoá trong các lĩnh vực thanhtốn, nhưng hiện tại chưa có quy định chính thức cắm giao dịch, đầu tư tiền mãhố trong bat kì văn bản quy phạm pháp luật nào được ban hành. Chính vì vậy, cáchoạt động giao dịch, đầu tư, đặc biệt là đầu cơ các loại tiền mã hố tại Việt Namvẫn diễn ra hết sức sơi động thơng qua các sàn giao dịch tiền mã hố trong nướcvà quốc tế, chúng thu hút sự quan tâm lớn của công chúng cũng như các nhà đầu

<small>tư.</small>

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

Vẫn đề gia tăng đầu tư tiền mã hoá tại Việt Nam trong bối cảnh còn nhiềuvấn dé hạn chế như hiểu biết của nhà đầu tư còn hạn chế, mơi trường pháp lý củaViệt Nam khơng cơng nhận tính hợp pháp của tiền mã hoá, khiến cho kênh đầu tưtiền mã hoá tiềm 4n nhiều rủi ro cho nhà đầu tư. Thực tế này hiện tại đòi hỏi cầnphải nghiên cứu và nhìn nhận khách quan, đúng đắn hơn về xu hướng phát triểntiền mã hoá trong tương lai, từ đó đưa ra các điều chỉnh, quyết sách kịp thời và hợplý từ phía các cơ quan chức năng, cơ quan quản lý thị trường đối với các giao dịch,hoạt động tiền mã hố. Và cũng thơng qua đó giúp công chúng đầu tư được tiếpcận với một kênh đầu tư mới chính là tiền mã hóa. Xong những người đầu tư vẫnđược phần nào bảo vệ bởi chính luật pháp, đặc biệt đó là trong vấn đề bảo vệ ngườitiêu dùng, giảm thiểu thiệt hại từ các rủi ro an ninh mạng, trộm cắp tài sản số (tiềnmã hố)... trên thị trường tiền mã hố.

Chính vì vậy em lựa chọn đề tài nghiên cứu: “Siw dung mơ hình ARIMA,Ramdom Forest và mạng nơ-ron nhân tao dé du bao giá dong Ethereum” với mong

muốn đưa ra các khuyến nghị mà các nhà đầu tư Việt Nam có thể tham khảo dự

báo đầu tư và những phương pháp dự báo phù hợp cho đồng tiền nay dé có thê đưara các quyết định đầu tư phù hợp và đúng đắn với từng thời điểm trong tương lai.

<small>2. Mục tiêu nghiên cứu</small>

Chun dé tìm hiểu va ứng dụng mơ hình Deep Learning cụ thé là mangNo — ron nhân tao so với các phương pháp truyền thống khác cụ thé là Arima,

Random Forest dé dự báo chuỗi thời gian trong tài chính, từ đó tìm ra mơ hình hiệuquả nhất và đưa ra các khuyến nghị mang tính chất tham khảo giúp nhà đầu tư cóquyết định đúng đắn hơn. Mục tiêu cụ thé gồm:

- Tim hiểu về thị trường tiền mã hóa tại Việt Nam va thé giới

- Cac phương pháp sử dụng trong sự báo dòng tiền bao gồm: mang No - ronnhân tao, Arima, Random Forest dé dự báo đơn chuỗi.

<small>- _ Thông qua các phương pháp đánh giá phù hợp với từng mơ hình dự báo và</small>

tìm ra mơ hình phù hợp cho dự báo đồng tiền mã hóa tại Việt Nam.

3. Đối tượng và phạm vi nghiên cứu:

Đối tượng nghiên cứu của chuyên đề là một chỉ số giá cuối cùng của đồngEthereum. Dữ liệu nghiên cứu được lấy từ ngày 28/04/2018 tới ngày 28/04/2022.

<small>4. Phương pháp nghiên cứu</small>

<small>Ngơ Thị Phương Dun - MSV: TI191554- Tốn Kinh tế 61</small>

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

Chuyên đề sử dụng phương pháp định lượng, kết phương pháp Deeplearning. Đồng thời kết hợp với phương pháp thu thập thông tin từ thị trường, ápdụng phương pháp Deep learning là Mạng Nơ- ron nhân tạo. Từ đó, so sánh và đối

<small>chiêu với kêt quả dự báo của các phương pháp truyén thông( cụ thê là: Arima,</small>

Random Forest) trong phân tích với số liệu thu thập được dé tiến hành dự báo đơn

<small>chuỗi với đôi tượng là chỉ sô gia của đông Ethereum.</small>

5. Kết cấu chuyên đề

Chuyên đề chuyên ngành có kết cấu 04 chương như sau:Chương 1: Cơ sở lý thuyết va tong quan nghiên cứu.

<small>Chương 2: Phương pháp nghiên cứu.</small>

Chương 3: Tổng quan về tiền mã hóa.Chương 4: Kết quả nghiên cứu.

Chương 5: Kết luận và đề xuất.

<small>Ngô Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

CHƯƠNG 1

CƠ SỞ LY THUYET VA TONG QUAN CÁC PHƯƠNG PHAPNGHIEN CUU

I. CƠSỞ LÝ THUYET

1.1. Cơ sở lý thuyết về dự báo chuỗi thời gian

Với sự phát triển của công nghiệp hiện đại ngày nay, đã có rất nhiều ngànhcơng nghiệp, nếu khơng muốn nói là tat cả đều dựa trên các dự báo dé đưa ra đượccác kế hoạch sản xuất hoặc các quyết định mang tính quan trọng. Ví dụ, có thé dựbáo tốt về nhu cầu của từng mặt hàng cụ thê trong tương lai rõ ràng sẽ giúp doanh

nghiệp đưa ra các kế hoạch sản xuất, kế hoạch vận chuyền, kho bãi dễ dàng và

nhanh chóng hơn, từ đó có thể giảm thiểu lượng hàng hóa phải bỏ đi do quá hạnsử dụng. Do đó, các kết quả dự báo tốt đóng vai trị thiết yếu trong hầu hết trongcác lĩnh vực như hoạt động khoa học, công nghiệp, thương mại và cả kinh tế. Muốnlàm được điều đó, thì các nhà quản trị hay các nhà hoạch định chiến lược sẽ sửdụng các thông tin trong quá khứ hay chuỗi thời gian dé đưa ra được các dự báo

<small>trong tương lai.</small>

<small>Major U.S. Airlines’ Stock Price Oscillations in 2020</small>

<small>Price Change as a Percentage of Adj Close Price on January 2nd & Major Events</small>

<small>UNITED & 22</small>

<small>authorizes Mor</small>

<small>COVID-19 v</small>

<small>Jun. Jul Aug. Sept. Oct. Nov. Dec</small>

Hình 1.1 - Ví du về chuỗi thời gian mô ta giá cỗ phiếu trong năm 2020

1.1.1. Khái niệm chuỗi thời gian

<small>Ngô Thị Phương Duyên - MSV: 11191354 - Toán Kinh tế 61</small>

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

Chuỗi thời gian là một tập hợp các quan sát được thực hiện tuần tự qua thời

+ Kiểm soát số lượng hàng tồn kho

+ Lập các kế hoạch bán hàng, sản xuất và năng lực

+ Đánh giá và khuyến nghị các chiến lược kinh tế thay thé

<small>+ Lập dự trù ngân sách</small>

<small>+ Quản ly các rủi ro tài chính</small>

+ Dự báo mức nhiệt độ của thời tiết

1.1.2. Một số các đặc trưng của chuỗi thời gian

Chuỗi thời gian có 4 tính chất bao gồm: tính thời vụ (seasonal), tính xu

<small>hướng (trend), tính chu kì (cyclical) và tính nhiễu (noise).</small>

= Tính thời vụ được biểu thị qua sự biến động có chu kì thời gian nhất

<small>định. Tính thời vụ đặc biệt vơ cùng quan trọng trong dự báo vì tại một</small>

thời điểm dự báo nhất định, giá trị dự báo có thể cao hơn (hoặc thấphơn) hoặc bat thường. Với các số liệu kinh tế thơng thường, mỗi thời kìthường sẽ tính theo tháng, q hoặc năm, nhưng với một số bộ số liệuđặc biệt, một thời kì có thể kéo dài tới vài năm.

<small>Ngơ Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE

<small>Solar cycles have an average duration of about 11 years</small>

Hình 1.2 - Các thành phan của chuỗi thời gian (tính thời vu)

<small>" Tính xu hướng phản ánh xu hướng tăng (giảm) của chuỗi thời gian trong</small>

<small>cả quá trình.</small>

<small>E-Commerce Retail Sales in the United States</small>

Millions of USD

Hình 1.3 - Các thành phần của chuỗi thời gian (tính xu thế)

=" Tính chu kì, cũng giống với tính thời vụ, nó cũng thé hiện sự biến độngtheo chu kì nhưng độ dài của chu kì thường thay đổi, khơng thê biết

<small>trước được.</small>

<small>Ngơ Thị Phương Duyên - MSV: 11191354 - Toán Kinh tế 61</small>

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

CHUYÊN ĐỀ CHUYÊN NGÀNH - TOÁN KINH TẾ @)

<small>Dow Jones Industrials. % change in closing price from previous yearThe great</small>

<small>The downturn</small>

<small>of 2002</small>

<small>( Economic The dot.com</small>

<small>depression 1907 Banker's Recession bubble</small>

<small>AM (1893-97) panic (1937-38) (2000-2001)</small>

<small>1920 1940 1960</small>

Hình 1.4 - Các thành phần của chuỗi thời gian (tinh chu kỳ

=_ Tính nhiễu thé hiện sự ngẫu nhiên sau khi đã bỏ qua tính thời vụ và tínhchu kì khỏi chuỗi thời gian. Tính nhiễu là một thành phần khơng thể biếttrước được hay đo lường được, là tác động ngẫu nhiên của các yếu tốbiết hoặc chưa được biết.

<small>Một dạng đặc biệt của chuỗi thời gian là chuỗi dừng. Chuỗi dừng là chuỗi</small>

thời gian có trung bình, hiệp phương sai và hệ số tương qua không phụ thuộc vào

<small>thời gian được gọi là chuỗi dừng. Nói cách khác, một chuỗi thời gian có xu hướng</small>

vận động xung quanh giá tri trung bình. Vì lẽ đó, đề có thể dự báo được, chuỗi thờigian luôn được giả định rằng xu hướng dao động của dữ liệu trong quá khứ và hiệntại được bảo toàn cho đến cả các giai đoạn tương lai. Theo Gujarati (2003), mộtchuỗi thời gian khơng dừng thì chúng ta chỉ có thé nghiên cứu hành vi của nó trong

<small>khoảng thời gian đang xét mà thơi.</small>

Nhiễu trăng là chuỗi dừng có trung bình bằng 0, phương sai đồng nhất vàkhơng có tự tương quan chuỗi. Khi dự báo chuỗi thời gian, nếu phần dư của mơhình, phần chênh lệch giữa giá trị thực tế và giá trị dự báo, là một nhiễu trắng thì

mơ hình đó có thé dùng dé dự báo được.

<small>Ngô Thị Phương Duyên - MSV: 11191354 - Toán Kinh tế 61</small>

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

<small>ũ 71000 2000 3000 4000</small>

Hình 1.5 — Nhiễu trắng

1.1.3. Đánh giá sai số trong dự báo chuỗi thời gian

Một trong những điều quan trọng của mơ hình chuỗi thời gian là độ chính

<small>xác của dự báo. Độ chính xác càng cao thì khả năng dự báo của mơ hình càng đáng</small>

tin cậy. Độ chính xác của các dự báo chỉ có thé được xác định bằng cách xem xétmơ hình hoạt động tốt như thé nao trên dữ liệu mới không được sử dụng trong khi

<small>xây dựng mơ hình dự báo.</small>

Khi xây dựng một mơ hình dự báo chuỗi thời gian, dữ liệu ban đầu thường

được tách thành hai phần, dữ liệu đào tạo và dữ liệu thử nghiệm, trong đó dữ liệu

dao tạo được sử dụng dé ước tính bat kỳ tham số nao của phương pháp dự báo vàdữ liệu thử nghiệm được sử dụng dé đánh giá độ chính xác của nó. Bởi vì dữ liệuthử nghiệm khơng được sử dụng để xây dựng mơ hình, nó sẽ cung cấp một dấuhiệu đáng tin cậy về khả năng dự báo của mơ hình trên dữ liệu mới. Thơng thường,2 phương pháp tuyệt đối và tương đối thường được sử dụng kết hợp khi đánh giá

<small>độ chính xác.</small>

Phương pháp đánh giá chỉ số tuyệt đối đo lường giá trị sai lệch với giá trị

<small>theo giá trị của bộ dữ liệu. Hai thước đo thường được sử dụng cảu phương phápnày là MAE (Mean absolute error) và RMSE (Root Mean Square Error).</small>

<small>Khi so sánh các phương pháp dự báo được áp dụng cho một chuỗi thời gian</small>

<small>Ngô Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

hoặc một số chuỗi thời gian có cùng đơn vị, MAE rất phơ biến vì nó dé hiểu và détính tốn. Phương pháp dự báo giảm thiểu MAE sẽ dẫn đến dự báo về giá trị trungvị, trong khi giảm thiểu RMSE sẽ dẫn đến dự báo về giá trị trung bình. Do đó,

<small>RMSE cũng được sử dụng rộng rãi, mặc dù khó giải thích hơn.</small>

Phương pháp đánh giá chỉ số tương đối đo lường giá trị phần trăm sai lệch

<small>với giá tri theo giá tri của bộ dữ liệu. Thước đo thường được sử dụng là MAPE</small>

<small>(Mean Absolute Percent Error).</small>

1.1.4. Bài toán dự báo chuỗi thời gian trong kinh tế và kinh doanh

Chuỗi thời gian là một trong những kiểu dữ liệu phổ biến nhất mà các doanhnghiệp sử dụng trong cuộc sống hàng ngày. Các công ty sử dụng nguồn thông tinnày để phát triển các chiến lược kinh doanh cũng như đề ra kế hoạch sản xuất.Ngày nay, Trí tuệ nhân tạo (AI) và dit liệu lớn (Big data) càng củng cố tam quan

trọng của việc sử dụng chuỗi thời gian trong kinh tế và kinh doanh.

Trong kinh tế, các chỉ số tổng sản phẩm quốc nội (GDP), tỷ giá hoái đối, tilệ thất nghiệp hay tỉ lệ lạm phát là vơ cùng quan trọng đối với chính phủ. Việc dựbáo các chỉ số kinh tế này có thé giúp đưa ra các chính sách phù hợp, hiệu quả giúp

chính phủ điều tiết kinh tế.

Trong kinh doanh, việc nam bắt được xu hướng thị trường, năng lực sản xuấtvà nhu cầu thị trường là yếu tố sống còn với các doanh nghiệp. Việc sử dụng cáckết quả dự báo sẽ giúp các doanh nghiệp giảm thiểu rủi ro, kip thời đưa ra cácchiến lược điều chỉnh phù hợp đem lại hiệu quả kinh tẾ cao.

II. PHƯƠNG PHÁP NGHIÊN CỨU

2.1. Tống quan về các phương pháp dự báo

Dự báo liên quan đến việc đưa ra các dự đoán về giá trị trong tương lai trên

<small>cơ sở dữ liệu lịch sử và hiện tại. Từ dữ liệu chuỗi thời gian, các nhà quản lí có được</small>

cái nhìn tổng quan trong q khứ và sử dụng phương pháp dự báo để đưa ra chiến

<small>lược cho doanh nghiệp. Phương pháp dự báo là một quy trình tính tốn các dự báo</small>

<small>Ngơ Thị Phương Dun - MSV: TI191554- Toán Kinh tế 61</small>

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

từ các giá trị hiện tai và quá khứ. Do đó, nó có thé đơn giản là một quy tắc thuậttốn và khơng cần phụ thuộc vào mơ hình xác suất cơ bản.

Một trong những phương pháp dự báo chuỗi thời gian sớm nhất là phương

<small>pháp dự báo của Charles C. Holt (1957) va Peter R. Winters (1960). Holt-Winters</small>

(là một trong những kỹ thuật dự báo phổ biến nhất cho chuỗi thời gian dù nó đã cóti đời hàng thập kỷ nhưng vẫn được sử dụng phố biến trong nhiều ứng dụng, baogồm cả giám sát, nơi nó được sử dụng cho các mục đích như phát hiện bat thườngvà lập kế hoạch. Tiền thân của phương pháp Holt-Winters được gọi là phươngpháp làm mịn theo cấp số nhân đơn giản (Simple Exponential Smoothing - SES).

Phương pháp này phù hợp dé dự báo dữ liệu khơng có xu hướng hoặc mùa vụ rõràng. Holt (1957) đã mở rộng SES dé cho phép dự báo dữ liệu có xu hướng vàWinters (1960) phát triển thêm tính năng xử lí được dự liệu có u tố thời vụ. Tuynhiên, phải đến tận năm 1985, phương pháp Exponential Smoothing (ES) mới nhậnđược công nhận và phát triển thông qua 2 bài báo Gadner (1985) và Syner (1985).Gadner đã cung cấp một đánh giá kỹ lưỡng và tổng hợp những cơng trình về ESvà mở rộng bằng phương pháp phân loại Pegels để giảm thiểu yếu tố xu hướng.Bài báo của ông tập hợp rất nhiều công trình hiện có, đã mơ phỏng việc sử dụngcác phương pháp này và thúc đây một lượng đáng ké các nghiên cứu bồ sung.Trong khi đó, Snyder đã chỉ ra rằng SES có thê được coi là phát triển từ mơ hìnhkhơng gian trạng thái (State Space Model). State space model là mơ hình bao gồmmột phương trình đo lường mô ta dit liệu được quan sát và một số phương trìnhtrạng thai mơ tả cách các thành phần hoặc trạng thái không được quan sát (mứcđộ, xu hướng, theo mùa) thay đồi theo thời gian. Mặc dù thông tin chi tiết này hầunhư không được chú ý vào thời điểm đó, nhưng trong những năm gần đây, cơngtrình của ông đã cung cấp cơ sở cho một lượng lớn nghiên cứu về các phương pháp

<small>ES. Hyndman và cộng sự (2002) và được mở rộng bởi Taylor (2003) đã đưa ra</small>

cung cấp một phân loại hữu ích dé mơ tả 15 phương pháp ES khác nhau mà nỗi

<small>bật là SES, Holt’s linear method, Holt—Winters’ multiplicative method và Holt—</small>

Winters’ additive method với các yếu tố xu hướng và mùa vu khác nhau trong từng

<small>mơ hình.</small>

Yule (1927) đã đưa ra khái niệm ngẫu nhiên trong chuỗi thời gian bằng cáchmặc định rằng mọi chuỗi thời gian có thé được coi là hiện thực của một quá trìnhngẫu nhiên. Dựa trên ý tưởng đơn giản này, một số phương pháp chuỗi thời gianđã được phát triển ké từ đó. Các cơng trình của Slutsky, Walker, Yaglom va Yule

<small>Ngô Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

<small>10</small>

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

CHUYEN ĐỀ CHUN NGANH - TỐN KINH TE @)

lần đầu tiên hình thành khái niệm về mơ hình tự hồi quy (AR) và trung bình trượt(MA) và được tơng hợp lại thành mơ hình ARMA và dạng tối ưu hơn là mơ hìnhARIMA với I (Integrated) là yếu tố sai phân. George Box va Gwilym Jenkins đãphơ biến mơ hình ARIMA (Trung bình động tích hợp tự động) trong sách giáokhoa của họ, phân tích chuỗi thời gian: Dự báo và kiểm soát (Time Series Analysis:

Forecasting and Control, Box & Jenkins, 1970). Do nền tảng lý thuyết của mình,mơ hình ARIMA được giảng dạy rộng rãi trong trường đại học trên thế giới. Nếucác giả định nhất định được đáp ứng, mô hình ARIMA mang lại dự báo tối ưu, mộtthuật ngữ về cơ bản có nghĩa là các lỗi, hay phan dư, từ mơ hình khơng chứa thơngtin có thé cải thiện dự báo hay phan dư là nhiễu trắng (white noise). Tuy nhiên,điều này không ngụ ý rằng các mô hình ARIMA nhất thiết phải ưu việt hơn cáclựa chọn thay thế, đặc biệt nếu dữ liệu không phù hợp với các giả định cần thiết,và dữ liệu kinh doanh thường không thỏa mãn điều kiện trên. Với sự phô biến củamình, đã có rất nhiều mơ hình biến thể của ARIMA được phát triển như mơ hìnhARIMAX (thêm yếu tố ngoại sinh), SARIMA (thêm yếu tố thời vụ), ARMA-GARCH (thêm yếu tố rủi ro), ... Đặc biệt phải ké đến mơ hình VAR (Vector

<small>autoregression) và VECM (vector error correction model) khi đưa thêm các chuỗi</small>

thời gian khác vào trong dự báo chứ không chỉ đơn thuần là 1 chuỗi.

Sự phát triển của khoa học máy tính tạo điều kiện thuận lợi cho sự phát triển

<small>của học máy (machine learning - ML) va học sâu (Deep Learning - DL). ML là</small>

một tập hợp các kỹ thuật cô gắng cho phép máy tính nhận ra các mẫu. Mục dichcủa ML là dé máy tính học cách hệ thống hoạt động dé nó có thể điền vào đữ liệubị thiếu, dự đốn đữ liệu hoặc phân loại dữ liệu. ML có thể được thực hiện theonhiều cách khác nhau nhưng tất cả việc triển khai đều phải có một số phương phápdao tao. ML có thé chia thành 3 loại thuật tốn chính là học có giám sát (Supervised

<small>Learning), học khơng giám sat (Unsupervised Learning), và học tăng cường</small>

(Reinforcement Learning). Học có giám sat là thuật toán mà dữ liệu đầu vào đượcgan nhãn sẵn, có thé là dạng số liên tục (bài toán hồi quy) hoặc dang số đếm rờirạc (bài tốn phân loại). Học khơng giám sát thì ngược lại, dữ liệu đầu vao khơngcó nhãn gan và thường được dùng dé tìm mối quan hệ trong dữ liệu đầu vào. Họctăng cường là thuật toán dé giúp tối ưu quyết định trong bai tốn cụ thé. ML có 2thuật tốn được sử dụng phơ biến nhất trong dự báo chuỗi thời gian là máy vector

<small>hỗ trợ (Support Vector Machine — SVM) và rừng ngẫu nhiên (Random Forest —</small>

<small>RF). Tính hiệu quả của hai phương pháp này đã được chứng minh qua các nghiên</small>

<small>Ngô Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

<small>11</small>

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

cứu của Y Lin (2013) va M Vijh (2020). Ngoai ra phải kể đến sự phát triển của mơhình ANN, tiền thân của các phương pháp Deep Learning sau này.

Deep Learning (DL) là sự phát triển tiếp theo của ML, sử dụng các thuật toándé xử lý dữ liệu và bắt chước quy trình tư duy hoặc dé phát triển các tính năng trừutượng. Deep Learning sử dụng các lớp thuật toán dé xử ly dit liệu, hiểu giọng nóicủa con người và nhận dạng trực quan các đối tượng. Thông tin được chuyền quamỗi lớp (layer), với đầu ra (output) của lớp trước cung cấp đầu vao (input) cho lớptiếp theo. Lớp đầu tiên trong mạng được gọi là lớp đầu vào (input layer), trong khilớp cuối cùng được gọi là lớp đầu ra (output layer). Tất cả các lớp giữa hai lớpđược gọi là các lớp an (hidden layer). Mỗi lớp thường là một thuật toán đơn giản,thống nhất chứa một loại hàm kích hoạt (activation function). DL được ứng dụng

<small>rộng rãi trong thị giác máy tính, xử lý ngơn ngữ tự nhiên và nhận dạng âm thanh hình ảnh. Sự thành cơng vượt bậc của học sâu như một kỹ thuật xử lý dữ liệu đã</small>

-thu hút sự quan tâm của cộng đồng nghiên cứu đặc biệt với dữ liệu chuỗi thời gian.Một vài nghiên cứu về chuỗi thời gian sử dụng DL sớm nhất có thé ké đến nghiêncứu của CL Giles (2001) khi sử dụng mơ hình mạng than kinh hồi quy (RecurrentNeural Network — RNN). Với sự gia tăng của Fintech trong những năm gan đây,

việc sử dụng học sâu trong các dịch vụ tải chính và ngân hàng đã trở nên phô biến.Các nghiên cứu về lĩnh vực này có thé ké đến như Srushti (2008), Mehta (2008)

<small>hay Kalaiselvi (2008) với việc áp dụng mơ hình Long Short-Term Memmory, một</small>

biến thể của mơ hình RNN, trong lĩnh vực dự báo giá chứng khoán. Tuy nhiên thờigian gần đây, khi khoa học máy tính và hệ thống cơ sở dit liệu phát triển, nhữngnghiên cứu về ứng dụng DL trong dự báo chuỗi thời gian, đặc biệt là mô hìnhLSTM tăng lên đáng kể. Karevan (2020) ứng dụng mơ hình LSTM trong dự báothời tiết hay Pathan (2020) cũng áp dụng mơ hình LSTM dự báo số ca nhiễmCOVID-19. Cùng thời gian này, Vidal (2020) kết hợp LSTM với mơ hình Mạngthần kinh chun đồi (Convolutional Neural Network — CNN), một mơ hình đượcứng dụng rộng rãi trong cơng nghệ xử lý ảnh, với mơ hình LSTM dé dự báo giáchứng khoán. Y tưởng của nghiên cứu là kết hợp dữ liệu dạng lịch sử giá và đồ thịgiá dé đưa ra dự báo tốt nhất.

<small>Dự báo có nghĩa là dự đoán các sự kiện trong tương lai, thường dựa trên cơ</small>

so của các báo cáo, dữ liệu trước đó. Trong một thời gian dài, các mơ hình thốngkê thường được sử dụng dé tiễn hành các dự đoán. Vai trị của Học máy đã đượctơng qt hóa, trong trường hợp khi một sản phâm hoặc cửa hàng mới được giới

<small>Ngơ Thị Phương Dun - MSV: TI191554- Tốn Kinh tế 61</small>

<small>12</small>

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

CHUYEN ĐỀ CHUYÊN NGANH - TỐN KINH TE @)

thiệu, hiệu ứng nảy có thé được sử dụng dé đưa ra các dự báo bán hàng vì sự hạnchế của lịch sử dữ liệu cho một chuỗi thời gian cụ thé.

Một số thuật toán của Học máy thường được ứng dụng trong các mơ hình dựbáo hiện nay như: Hồi quy tuyến tính, Hồi quy Gradient Boosting, Hồi quy SupportVector, Hồi quy Rừng ngẫu nhiên. Các thuật tốn Học máy có thể giúp các nhàkinh doanh dễ dàng tìm ra kết quả tốt hơn so với các kỹ thuật phân tích truyềnthống của chuỗi thời gian. Trong đó, thuật tốn Random Forest hay cịn gọi Rừngngẫu nhiên được coi là thuật tốn thích hợp nhất dé áp dụng vào việc đánh giá xu

<small>hướng và đưa ra các ước tính hoặc dự báo đơn chuỗi</small>

2.2 Tong quan về Machine Learning và Deep Learning

<small>2.2.1 Machine Learning</small>

Thể giới đã trải qua bốn cuộc cách mạng công nghiệp (CMCN) lớn trong lịchsử nhân loại. Cuộc cách mạng công nghiệp lần thứ nhất bắt đầu vào năm 1784bằng cách sử dụng năng lượng nước và hơi nước dé cơ giới hóa sản xuất. Đây là

giai đoạn quá độ từ nền sản xuất công nghiệp sang nền sản xuất cơ giới trên cơ sởkhoa học. Cuộc cách mạng lần thứ hai diễn ra sau đó từ khoảng năm 1870 tạo ranhững dây chuyền sản xuất hàng loạt quy mô lớn với sự phát triển của ngành điện,vận tải, hóa học, sản xuất thép và đặc biệt là sản xuất và tiêu dùng. Năm 1969, sựra đồi va lan tỏa của công nghệ thông tin (CNTT) đã nỗ ra cuộc cách mạng côngnghiệp lần thứ 3. Đặc trung của cuộc cách mạng này là sử dụng điện tử và CNTTđể tự động hóa sản xuất. bây giờ, cuộc cách mạng công nghiệp lần thứ tư, hay gọilà cách mạng 4.0 xuất phát từ năm 2013. Cuộc cách mạng 4.0 kết hợp công nghệvà cơ sở sản xuất thông minh dé tạo ra sự hội tụ kỹ thuật số giữa công nghiệp, kinhdoanh, chức năng và quy trình bên trong. Một trong những yếu tố cốt lõi của Kỹthuật số trong CMCN 4.0 là Trí tuệ nhân tạo (AD), hay cu thể hơn là Machine

<small>Learning (ML)</small>

<small>ML hay Học máy là một lĩnh vực con của AI sử dụng các thuật tốn cho phép</small>

máy tính có thé hoc từ các dit liệu dé thực hiện các cơng việc thay vì được lập trìnhcụ thé như truyền thống. May tinh sẽ có khả năng tự học dé giải quyết bài tốn nhờvào sự lập trình của con người. Giống như con người, máy tính càng học nhiều sẽcàng “thông minh” và “thông thạo”, càng dễ dàng xử lý được nhiều cơng việc với

<small>độ chính xác cao hơn.</small>

<small>Ngơ Thị Phương Dun - MSV: TI191554- Tốn Kinh tế 61</small>

<small>13</small>

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

Trên thực tế có rất nhiều ứng dụng của Học máy đóng góp một vai trị quantrọng trong lĩnh vực công nghệ. Những lĩnh vực phô biến ma học máy đóng gópphải kê đến bài tốn xử lý hình ảnh, phân tích thơng tin từ hình ảnh dé thực hiệncác chức năng như gắn thẻ hình ảnh, nhận dạng ký tự. Bài tốn phân tích văn bản

<small>từ các facebook posts, emails, ... lọc spam, khai thác thông tin hay phân tích ngữnghĩa. Khai phá dữ liệu là một ứng dụng quan trọng của Học máy. Quá trình này</small>

<small>sẽ khám phá ra các thơng tin có giá trị hoặc đưa ra các dự đốn từ dữ liệu. Nhờ đó</small>

phát hiện được những bat thường như phát hiện gian lận thẻ tin dụng, phát hiệncác quy luật hay dự đoán chuỗi thời gian giá chứng khoán, được áp dụng rất hiệuquả trong tải chính — kinh tế. AI xuất hiện trên mọi lĩnh vực đời sống như xe tựhành của Google va Tesla, trợ lý ảo Siri của Apple hay hệ thống gợi ý sản phẩm

<small>của Amazon, ... và vô vàn những ứng dụng khác của Học máy.</small>

Những thuật toán Học máy phô biến như:

e Phân cụm K-means: Được đề xuất từ năm 1967 bởi James MacQueenvới ý tưởng là sử dụng trung tâm của các cụm để tính khoảng cách giữa đối tượngvà điểm trung tâm, với số cụm k được cho sẵn.

e Máy Véc-tơ hỗ trợ (Support vector machines): được tìm ra và phát triển

<small>bởi Vladimir N. Vapnik va Corinna Cortes năm 1995. Thuật toán này được giám</small>

sát dé phân loại hoặc giải quyết các van đề hồi quy.

e Thuật tốn hồi quy tuyến tính: Đây là một thuật tốn quan trọng của Họcmáy, phân tích sự tác động của biến độc lập lên biến phục thuộc khác

e_ Mơ hình xác suất: Mơ hình cơ gắng giải quyết bài tốn bằng phân bồ xácsuất. Thuật tốn phơ biến là phân loại Naive Bayers với dau ra là xác suất thé hiệnđộ chính xác cho kết quả đó.

<small>Học sâu (Deep Learning): là xu hướng trong ML dự trên các mơ hình mangnơ-ron nhân tạo (Artificial neutral networks). Mạng nơ-ron sử dụng ý tưởng theo</small>

cách bộ não con người làm việc. DL được phát triển và cải tiễn liên tục với các cầutrúc mới sâu hơn, bao gồm số lượng lớn các nơ-ron liên kết với nhau. DL ngàycàng có nhiều ứng dụng quan trọng trong phục vụ đời sống con người.

Ngồi ra cịn có các thuật tốn như Hồi quy Logistic, Random Forest,

<small>K-NN, Neural Net, ... cũng đang được ứng dung va sử dụng rộng rãi.</small>

2.2.2 Tổng quan về Deep Learning

<small>Ngơ Thị Phương Dun - MSV: TI191554- Tốn Kinh tế 61</small>

<small>14</small>

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

<small>Deep Learning là một phương pháp của ML sử dụng mạng lưới nơ-ron nhân</small>

tạo với nhiều lớp tương tự như não bộ con người. DL được lập trình đề đào tạomột AI có khả năng dự đoán được các đầu ra dựa vào một chuỗi các dữ liệu đầuvào. Giống như con người học hỏi từ kinh nghiệm, một thuật tốn DL có thé lapdi lap lai dé thực hiện một nhiệm vu, mỗi lần điều chỉnh sẽ giúp mơ hình cải thiện

kết quả chính xác hơn. Mạng nơ-ron nhân tạo có khả năng vượt trội trong việc đưa

ra dự đoán trên các đữ liệu phần lớn khơng có cấu trúc. Ngày nay các nhà khoahọc đã nghiên cứu ra rất nhiều thuật toán cải tiễn giúp nâng cao khả năng tự họccủa máy như khả năng tính tonas song song tốc độ cao của GPU, sự ra đời của cáchàm kích hoạt hay nhiều kỹ thuật tối ưu giúp việc tính tốn đạt kết quả chính xácnhất.

Có rất nhiều ứng dụng quan trọng của DL như ứng dụng xe tự động, pháttriển các tính năng cảm biến xác định tuyến đường thuận tiện nhất cho di chuyền,

<small>khả năng dịch giọng nói thành văn bản, tạo ra trợ lý ảo giúp ghi chú hay đặt lịch</small>

<small>hẹn, các tính năng hỗ trợ con người, ...</small>

Một số mơ hình DL phổ biến:

e_ Mơ hình mạng nơ-ron tích chập (CNN): được phát triển đầu tiên tại Nhậttừ năm 1980 và được sử dụng rộng rãi cho đến nay. Mô hình được sử dụng nhiềunhất cho các bài tốn phân loại ảnh.

e M6 hình mạng nơ-ron hồi quy (RNN): sử dụng bộ nhớ dé lưu lại nhữngthông tin trong quá khứ và thực hiện các tính tốn lặp lại dé đưa ra dự đốn chínhxác nhất cho tương lai.

e Mơ hình bộ nhớ ngắn dài han (LSTM): là mơ hình nâng cấp của RNNnhằm giải quyết van dé phục thuộc q dai trong dữ liệu q khứ.

e Mơ hình mạng GRU: gần giống với LSTM nhưng cải tiễn hơn vì có ítcơng hơn, việc huấn luyện nhanh hơn và cần it dit liệu hơn giúp mơ hình dé dàng

<small>tính tốn hơn.</small>

2.3 Cơ sở lý thuyết về mạng nơ-ron nhân tạo

Bên cạnh các mơ hình dự báo chuỗi thời gian kinh tế lượng, các kỹ thuật học

<small>máy (machine learning) va quan trọng hon là học sâu (deep learning) đã đưa ra các</small>

phương pháp tiếp cận mới dé dự đốn trong đó mối quan hệ giữa các biến đượcmơ hình hóa trong hệ thống phân cấp sâu và nhiều lớp. Kỹ thuật học máy dựa vào

<small>các thuật toán như Support Vector Machines hay Random Forests và học sâu dựa</small>

<small>Ngô Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

<small>15</small>

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

vào các thuật toán như mạng nơ-ron hồi quy (Recurrent Neural Network RNN) vàbộ nhớ dai-ngan hạn (Long Short-Term Memory LSTM) đã thu hút được rất nhiềusự chú ý trong những năm gần đây nhờ các ứng dụng của chúng trong nhiều ngànhhọc bao gồm cả lĩnh vực tai chính. Học sâu có khả năng xác định cấu trúc và làm

việc với dữ liệu như phi tuyến tính và dự báo chuỗi thời gian phức tạp. Đặc biệt,

Long-short Term Memory đã được sử dụng trong nhiều lĩnh vực như xử lý ngônngữ tự nhiên, nhận dạng chữ viết tay, nhận dạng giọng nói và đặc biệt là dự báochuỗi thời gian cũng như các ứng dụng cảu nó trong kinh tế và tài chính. LSTM làmột dạng thiết kế đặc biệt của RNN được giới thiệu bởi Hochreiter & Schmidhuber(1997), và sau đó đã được cải tiến và phơ biến bởi rất nhiều người trong ngành. Đềhiểu cách hoạt động của LSTM, cần phải biết một mạng nơ-ron hoạt động như thế

2.3.1 Mạng no-ron héi quy RNN

Trong mơ hình mạng nơ-ron nhân tạo, đặc biệt là trong cấu trúc mạng truyền

thang (feedfoward) khi mà tín hiệu chỉ truyền một chiều từ đầu vào tới dau ra, dirliệu đầu vào thường được xem như độc lập và khơng có mối liên hệ với nhau. Mơ

<small>hình này thường được áp dụng trong nhận dạng mẫu nhưng nó khơng phải mơ hình</small>

tối ưu và phù hợp với các bài tốn dạng chuỗi như mơ tả, hồn thành câu, ... vìnhững dự đốn tiếp theo như từ tiếp theo phụ thuộc vào vị trí của nó trong câu vànhững từ dang trước nó. Chính vì vậy, các nhà nghiên cứu đã phát triển ra mạngnơ-ron hôi quy Recurrent Neural Network RNN với ý tưởng là sử dụng một bộnhớ dé lưu lại thông tin từ những bước tính tốn xử lý trước và dựa vào nó dé cóthé đưa ra dự đốn chính xác nhất cho bước dự đoán hiện tại.

Mạng nơ-ron hồi quy là một mang nơ-ron chứa một vịng lặp bên trong nó.Mạng sẽ coi những dữ liệu đầu vào (input) là một chuỗi liên tục nối tiếp nhau theothứ tự thời gian. Ứng dụng nổi bật nhất của mạng nơ-ron hồi quy là dich máy, mộtđoạn văn bản (text) có thể được coi là một chuỗi các từ vựng hoặc là một chuỗicác ký tự. RNN sẽ thực hiện cùng một tác vụ cho tat cả các phần tử của một chuỗivới đầu ra phụ thuộc vào các phép tính trước đó.

<small>Ngơ Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

<small>16</small>

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

S, = tanh(U,, + W,_.)

RNN chi sử dung một mạng nơ-ron duy nhất (thường là 1 lớp) dé tinh giá tri

<small>dau ra của moi bước. Dữ liệu đâu ra của bước này sau khi trở thành dau vao củabước sau đó sé được nhân với cùng một trọng so W. O, là dau ra tại thời diém thứ</small>

<small>t, là một vecto chứa xác suât của toàn bộ các từ trong từ điện:</small>

<small>0, = softmax(Vs,)</small>

Điều này có nghĩa là mơ hình sẽ chỉ sử dụng bộ tham số (U, V, W) thực hiệncác phép tinh toán giống hệt nhau cho từng phan tử của một chuỗi đữ liệu, đầu vàovà kết quả đầu ra sẽ phụ thuộc vào kết quả của các tính tốn ở phía trước. Tuynhiên trong thực tế thì RNN chỉ tỏ ra hiệu quả với chuỗi dữ liệu có độ dài khơngq lớn vì nếu chuỗi vecto đầu vào q lớn thì việc tính tốn vecto trạng thái ấn hsẽ phải đi qua nhiều lớp tính tốn. Các nhà khoa học đã nghiên cứu vè phát triểnnhiều biến thé của RNN dé khắc phụ những hạn chế của mạng RNN giản đơn.

- Mang nơ-ron hồi quy hai chiều (Bidirectional RNN): dựa trên ý tưởngoutput tại t không chỉ phụ thuộc vào đầu vào trước đó mà cịn phụ thuộc

<small>Ngơ Thị Phương Dun - MSV: TI191554- Tốn Kinh tế 61</small>

<small>17</small>

</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

cả vào các thành phần trong tương lai. Nghĩa là mơ hình sẽ tính tốn dựatrên cả hai thành phần bên trái và bên phải của mạng.

<small>Mạng nơ-ron nhiều tầng (Deep RNN): giống như Bidirectional RNN, mạng cũng</small>

<small>tính tốn output dua vào hai chiều nhưng mơ hình này khác biệt hơn là sử dụng nhiềulớp RNN hai chiều kết hợp với nhau tại một thời điểm.</small>

<small>2.3.2 Mang Long - Short Term Memory</small>

2.3.2.1 Vấn dé phu thuộc dài

Chính vì ý tưởng đầu ra phụ thuộc vào các đầu vào trước đó và xử ly theothứ tự thời gian nên RNN không khả thi với các bộ dữ liệu lớn. Việc tính tốn đầura theo thứ tự sẽ tốn rất nhiều thời gian dé lặp lại và ghi nhớ. Giả sử khi mơ hìnhhóa ngơn ngữ, nếu ta dự đoán từ cuối cùng “nhân tạo” của một câu ngắn như “dựbáo giá cô phiêu bằng mạng nơ-ron nhân tạo”, ta chỉ cần dựa vào những từ trước

đó thì hồn tồn có thê đốn được từ tiếp theo vì khoảng cách đến thông tin liênquan ngắn va dé dé ghi nhớ. Nhưng có rất nhiều trường hợp khó hơn như phải đốn

<small>Ngơ Thị Phương Dun - MSV: TI191554- Tốn Kinh tế 61</small>

<small>18</small>

</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

dựa vào ngữ cảnh, hay cần phải tìm những thơng tin ở xa hơn dé xác định được từcần đốn là gì. Điều này sẽ rất khó khăn và phức tạp vì RNN khơng biết cách kếtnối các thông tin lại với nhau, đặc biệt là những thơng tin ở q xa. Chính vì vậymạng bộ nhớ dài-ngắn (Long — Short Term Memory) ra đời để khắc phục vấn đề

<small>phụ thuộc dai của RNN giản đơn.</small>

<small>2.3.2.2 Phương thức hoạt động của LSTM</small>

Mạng trí nhớ ngắn hạn định hướng dài hạn hay được viết tắt là LSTM là một

kiến trúc đặc biệt của mạng RNN có khả năng học được sự phụ thuộc trong dàihạn được giới thiệu bởi Hochreiter và Schmidhuber năm 1977. Trong nhiều bài

tốn thì LSTM thé hiện tính phù hợp và tối ưu hơn mạng noron hồi quy thơngthường. Chính vì vậy, nó ngày càng được ưa chuộng và sử dụng phô biến. LSTMlà một RNN truyền thống nhưng được thiết kế thêm các hàm tính tốn khác ở cáctrạng thái an. Bộ nhớ của LSTM được gọi là tế bao (Cell) và nó được đánh giá nhưmột hộp đen, nhận đầu vào là trạng thái phía trước ht-1 và đầu vào hiện tại xt. Bêntrong hộp đen này, nó sẽ tự quyết định thứ gì quan trọng cần ghi nhớ, thứ gì cầnloại bỏ. Sau đó, chúng sẽ kết hợp với trạng thái phía trước, sự ghi nhớ hiện tại và

<small>đâu vào hiện tại.</small>

<small>Các kí hiệu được sử dụng trong mạng LSTM là:</small>

<small>Ký hiệu Giải nghĩa</small>

<small>Neural Network</small>

<small>Các lớp ân của mạng nơ-ron LSTM</small>

<small>Ngô Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

<small>19</small>

</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

@ Toán tử Pointwise, biêu diễn các phép toán như cộng, nhân

<small>Pointwise vector.</small>

<small>Vector chỉ dau vào và dau ra của một nút.</small>

> ) Biêu thị phép nơi các tốn hạng.

<small>eo lạ</small>

<small>Wg ; '</small>

Hình 2.5 — Tế bào trạng thai LSTM giống như một băng truyền

LSTM có khả năng thêm hoặc bớt thông tin cho trạng thái tế bào, được quyđịnh và điều chỉnh bởi các cấu trúc gọi là công (gate). Các cổng này là nơi sang

<small>lọc mọi thông tin đi qua nó. Chúng được tạo bởi ham sigmoid và một phép nhân</small>

<small>pointwise. Hàm kích hoạt Sigmoid có giá tri từ [0,1], mô tả độ lớn thông tin được</small>

phép truyền qua tại mỗi lớp mạng. Nếu đầu ra là 0 có nghĩa là khơng cho thơng tinđi qua và ngược lại nếu thu được giá trị là 1 thì có nghĩa là cho phép thơng tin đi

<small>Ngơ Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

<small>20</small>

</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

qua. Một LSTM có ba cơng như vậy dé bảo vệ và điều khiến trạng thái của tế bào.

Hình 2.6 - Cơng trạng thái LSTM

Bước đầu tiên của mơ hình Long-short memory là quyết định xem thông tinnào được đi qua. Quá trình này được quyết định bởi một lớp sigmoid gọi là “tầngcông quên” (forget gate). Đầu vào bao gồm h„_; và x; sẽ cho ra đầu ra là một giátrị trong khoảng [0,1] cho trang thái 6 C,_,. Giá trị gần 0 tương ứng với thông tinbị bỏ đi và giá trị gần 1 thé hiện tồn bộ thơng tin được giữ lại.

Hình 2.7 — LSTM bước thứ nhất

Sau bước lọc thông tin, ta cần quyết định xem thông tin mới nao cần lưu vàotrạng thái tế bào. Đây là q trình diễn ra trong cơng thứ 2 gọi là “tầng công vào”(input gate). Đầu tiên vẫn là tầng sigmoid quyết định thông tin nào được ghi lại và

tiếp theo sau là một tầng hàm Tanh tao ra một vecto mới cho giá tri mới C, được

<small>Ngô Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

<small>21</small>

</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

<small>thêm vao trong 6 trạng thai.</small>

iy = 0 (Wj: [ht-1, 24] + 0;)

Ớ, =tanh(W@-[h¿T-i.#¿} + bơ)

<small>Hình 2.8 —- LSTM bước thứ hai</small>

Sau khi đã quyết định được thông tin nào sẽ giữ lại, thông tin mới nào được

cập nhật vào trạng thái tế bào, cần kết hợp với trạng thái tế bào cũ C t-1 thành trangthái mới C,. Dé thực hiện quá trình, ta nhân trạng thái cũ với ƒ, dé qn di nhữngthơng tin quyết định qn trước đó. Sau đó cộng thêm (i, * €,) dé cập nhật trang

<small>thái mới cho tê bào.</small>

ñị it rên Œịẹ= fi * Cr_1 + % Ct

<small>Hình 2.9 —- LSTM bước thứ ba</small>

Cuối cùng, ta cần quyết định đầu ra (output) là gì. Thông tin đầu ra dựa trêntrạng thái tế bào đã xây dựng, nhưng vẫn sẽ được sảng lọc thêm lần nữa. Đầu tiên,van là tầng sigmoid đảm nhận công việc quyết định phan thông tin nào trong trạngthái tế bào ta muốn xuất ra. Sau đó ta sẽ đưa trạng thái tế bao qua ham Tanh déđưa giá trị về khoảng [-1,1] và nhân với đầu ra của cong Sigmoid dé giữ nhữngphần thông tin đầu ra ta muốn. Đây chính là “tầng cơng ra” (output gate), cơngcuối cùng trong mơ hình LSTM.

<small>Ngơ Thị Phương Dun - MSV: TI191554- Tốn Kinh tế 61</small>

<small>22</small>

</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">

CHUYEN ĐỀ CHUYÊN NGANH - TỐN KINH TE @)

<small>oO, =Ø(WV [he-1, 24] + bo)</small>

Mơ hình trung bình trượt, đồng liên kết, tự hồi quy ARIMA (p,d,q)

<small>(Autogressive Integrated Moving Average) là phương pháp định lượng dựa trên</small>

triết lý “hãy dé dữ liệu tự nói” dựa trên dữ liệu quá khứ phát hiện chiều hướng vậnđộng trong tương lai của các yếu tổ mà không sử dụng biến ngoại sinh độc lập.ARIMA không giả định bất kỳ một mơ hình cụ thể, việc xác định mơ hình là dựatrên việc phân tích dữ liệu cụ thể từng trường hợp, vì thế ARIMA đơi khi cịnđược gọi là mơ hình “lý thuyết mới” vì nó khơng dự trên bất kỳ một lý thuyết kinhtế nào Do đó, mơ hình này có tính linh hoạt và tiết kiệm hơn hắn các phương phápkhác, đồng thời tính hiệu quả của mơ hình trong cơng tác dự báo đã được chứngminh trong thực tế. Vì vậy, mơ hình ARIMA có một vị thé nhất định trong nghiên

<small>cứu định lượng và ngày càng trở nên thơng dụng hơn.2.41 Tính dừng</small>

Dữ liệu của bat kỳ chuỗi thời gian nao đều có thé được coi là được tạo ra từmột quá trình ngẫu nhiên và một tập hợp dữ liệu cụ thê, có thể được coi là một kếtquả (cá biệt) của quá trình ngẫu nhiên đó. Hay nói các khác, có thể xem quá trìnhngẫu nhiên là tong thé và kết quả là một mẫu được của tơng thé đó. Tính dừng làmột tính chất của q trình ngẫu nhiên được các nhà phân tích về chuỗi thời gian

<small>đặc biệt quan tâm và xem xét kỹ lưỡng.</small>

Một quá trình ngẫu nhiên Y, được coi là dừng nếu như trung bình và phươngsai của nó khơng thay đổi theo thời gian và giá trị đồng phương sai giữa hai thời đoạn chỉphụ thuộc vào khoảng cách hay độ trễ về thởi gian giữa hai thời đoạn nay chứ không phụthuộc vào thời điểm thực tế mà đồng phương sai được tính.

<small>Ngơ Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

<small>23</small>

</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

Cụ thé:

<small>- Trung bình: E (¥Y,) = y= const Ut</small>

<small>- Phuong sai: Var (Y,) = ø2 = const Lit</small>

- Dé6ng phương sai: Cov (Y, , Y-4~) = E [ (Yt - u) (Yttk - p) ] = yk

Yt được coi là khơng dừng nếu nó vi phạm ít nhất một trong ba điều kiện trên.(Nguôn:Nguyễn Quang Dong, 2002, Kinh tế lượng-Chương trình nâng cao)

<small>- Hau quả của chuỗi khơng dừng</small>

Trong mơ hình hồi quy cơ điền, ta giả định rằng sai số ngẫu nhiên có kỳ vọngbằng 0, phương sai khơng thay đổi và chúng không tương quan với nhau. Với dữliệu là các chuỗi không dừng, các giả thiết nay bi vi phạm, các kiểm định t, F mat

<small>hiệu lực, ước lượng và dự báo không hiệu quả hay phương pháp OLS khơng áp</small>

<small>dụng cho các chuỗi khơng dừng.</small>

Điển hình là hiện tượng hồi quy gia mạo: nếu mơ hình tồn tại ít nhất một biến

độc lập có cùng xu thế với biến phụ thuộc, khi ước lượng mơ hình ta có thé thuđược các hệ số có ý nghĩa thống kê và hệ số xác định R2 rất cao. Tuy nhiên điềunày chỉ là giả mạo, R2 có thể là do hai biến này có cùng xu thế chứ không phải do

<small>chúng tương quan chặt chẽ với nhau.</small>

Thực tế cho thấy, hầu hết các chuỗi thời gian đều là chuỗi khơng dừng, kếthợp với những hậu quả trình bày trên đây cho thấy tầm quan trọng của việc xác

<small>định một chuỗi thời gian có tính dừng hay khơng</small>

— Cách kiểm định tính dừng của chuỗi thời gian

Tính dừng của chuỗi thời gian có thê nhận biết dựa trên đơ thị của chuỗi thờigian, đồ thị của hàm tự tương quan mẫu hay kiểm định Dickey-Fuller

Dựa trên đồ thị chuỗi thời gian Y= f()

Một cách trực quan chuỗi Yt có tính dừng nếu như đồ thị cho thấy trung bìnhvà phương sai của q trình Yt khơng đổi theo thời gian.

Phương pháp này cho ta cái nhìn trực quan, đánh giá ban đầu về tính dừng

<small>của chuỗi thời gian. Tuy nhiên, với những chuỗi thời gian có xu hướng khơng rõ</small>

<small>ràng, phương pháp này trở nên khó khăn và đơi khi khơng chính xác.</small>

<small>Dựa vào hàm tự tương quan mẫu ( SAC- Sample Auto Correllation)</small>

<small>Ngô Thi Phương Duyên - MSV: 11191354 - Toán Kinh tế 61</small>

<small>24</small>

</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

Chuỗi thời gian U; gọi là nhiễu trang nếu kỳ vọng bằng 0, phương sai không

<small>đôi và hiệp phương sai băng 0.</small>

Bước ngẫu nhiên :

Nếu Y( = Y¡ + U; với U; là nhiễu trắng thì Y; được gọi là bước ngẫu nhiên.

Xét mơ hình Y; = pY¿¡ + Ur voi U; là nhiễu trang.

Nếu p = I thì Y là bước ngẫu nhiên và khơng dừng. Do đó dé kiêm định tính

<small>dừng của Y; ta kiêm định giả thiết:</small>

<small>Ho: p = 1 (chuỗi khơng dừng)</small>

<small>® SE(p)</small> Phân phối theo quy luật DF

<small>Nếu | zgqsl >l cal thì ta bác bỏ giả thiết Họ và kết luận chuỗi dừng.</small>

<small>Ngô Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

<small>25</small>

</div><span class="text_page_counter">Trang 34</span><div class="page_container" data-page="34">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

Tiêu chuẩn DF cũng được áp dụng cho các mơ hình sau:

<small>AY, = YYti + U; U: ~ NO, 0°) (1)AY, = Bi + TY. ¡+ Ur U~ NO, or) (2)AY, = Bi + Bo t+ làm +, U~ NO, or) (3)</small>

Nếu U; tự tương quan, ta cải biên mơ hình (3) thành mơ hình:

— Biến đổi chuỗi khơng dừng thành chuỗi dừng

Xét bước ngẫu nhiên: Y= Y¿¡ + U/ với U là nhiễu trắng

Ta lay sai phân cấp I của Y; : D(Y: ) = Yt - Yt-1 = Ur Trong trường hợp nàyD(Y,) là chuỗi dừng vì U; là nhiễu trắng.

Tổng quát, với mọi chuỗi thời gian nếu sai phân cấp I của Y chưa dừng tatiếp tục lấy sai phân cấp II, II... Các nghiên cứu đã chứng minh luôn tồn tại mộtgiá trị d xác định để sai phân cấp d của Y: là chuỗi dừng. Khi đó Y: được gọi làliên kết bậc d, ký hiệu là I(d).

Sai phân cấp d được lay như sau:

Sai phân cap I của Y: : D(Y( ) = Yt - Yr-1

Sai phân cấp II: D(D(Y: ) ) =D? (Yi) = (Y:- Yr-1) - (Yt-1- Ye2)Sai phân cấp d: D(D*!(Y)

2.4.2 Quá trình tự hồi quy (AR), trung bình trượt (MA) và mơ hình ARIMAMơ hình tự hồi quy (Autoregressive) AR (p)

Trong giá trị q khứ và mơ hình tự hồi quy, q trình phụ thuộc vào tổng cótrọng số của các số hạng ngẫu nhiên hiện hành heo độ trễ.

<small>Yi = Oy + Py Yer +92 Y2 +... + PpYep + O+E</small>

<small>Ngô Thi Phương Duyên - MSV: 11191354 - Toán Kinh tế 61</small>

<small>26</small>

</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

<small>Mơ hình trung bình trượt ( Moving Average) MA (q)</small>

Trong mơ hình trung bình trượt, q trình được mơ tả hoàn toàn bang tongcác giá trị quá khứ và số hạng ngẫu nhiên hiện hành theo độ trễ.

<small>Yt=@+e-Ô1et-1-Ô2£t-2 -... - Ogét-g</small>

Quá trình trung bình trượt kết hợp tự hồi quy ARMA (p,q)

Trong thực tế, có nhiều khả năng Y có cả đặc điểm của AR và MA, khi đó ta

<small>nói Y tn theo qua trình trung bình trượt kết hợp tự hơi quy, ký hiệu ARMA (p,q).</small>

Một q trình ARMA (p,q) sẽ có p số hạng tự hồi quy và q số hạng trung bình

<small>trượt như sau:</small>

<small>Yr=O+[o1Yer +... + OpYt-p] + [Bime1 + ...+ Bqbt-g] + et</small>

Mơ hình ARMA (p,q) cho thấy biến Y tại thời điểm t không chi phụ thuộcvào giá trị quá khứ của nó mà cịn phụ thuộc vào sai số q khứ.

2.4.3. Mơ hình hồi quy kết hợp trung hình trượt ARIMA (p,d,q)

<small>Do mơ hình Box-Jenkins chỉ mơ tả chuỗi dừng hoặc những chuỗi đã sai phân</small>

hóa, nên mơ hình ARIMA (p.d.q) thé hiện những chuỗi dữ liệu không dừng, đã

<small>được sai phân.</small>

Nếu một chuỗi thời gian dừng ở sai phân bậc d, ta nói chuỗi liên kết bậc d,ký hiệu I(d). Kết hợp với q trình ARMA ta có được mơ hình trình trung bìnhtrượt, đồng liên kết, tự hồi quy ARIMA (p,d,q) với p số hạng tự hồi quy và q sốhạng trung bình trượt, va cần lay sai phân bậc d dé chuỗi dừng. Phương trình tong

<small>quát như sau:</small>

<small>Bước 1 : Nhận dang mơ hình</small>

<small>Nhận dạng mơ hình ARIMA(p,d,q) là tìm các giá trị thích hợp của p, d, q.</small>

Với d là sai phân của chuỗi thời gian khảo sát, p là bậc tự hồi quy và q là bậc trungbình trượt. Việc xác định p, q sẽ phụ thuộc vào đồ thị SPACF = f(t) và SACF=f(t).

<small>Ngô Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

<small>27</small>

</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36">

CHUYEN ĐỀ CHUYÊN NGANH - TOÁN KINH TE @)

<small>Với SACF là hàm tự tương quan mẫu và SPACF là ham tự tương quan mẫu riêng</small>

phần ( Sample Part al Autocorrelation):

+ Chon giá trị của p nếu đồ thị SPACF có giá trị cao tại độ trễ 1,2,..., p va

<small>giảm nhiêu sau p và dạng hàm SACF giảm dân.</small>

+ Chọn giá tri của q nếu đồ thị SACF có gia tri cao tại độ trễ 1,2... q và giảmnhiều sau q và dang hàm SPACF giảm dan.

<small>Bước 3 : Kiém tra chán đốn mơ hình</small>

Dựa vào các tiêu chí sau dé lựa chọn mơ hình tốt :Hệ số hồi quy có ý nghĩa thống kê.

Phần dư của mơ hình dự báo phải là một chuỗi ngẫu nhiên. Chúng ta cầnkiểm tra phần dư có phải là một chuỗi ngẫu nhiên hay khơng bằng cách sử dụnggiản đồ tự tương quan.

<small>Tiêu chí AIC/SIC: Mơ hình có giá tri AIC/SIC càng nhỏ thì mơ hình càngphù hợp.</small>

Sai số dự báo càng nhỏ càng tốt. So sá giá trị dự báo với giá trị thực tế. Nếumơ hình có giá trị dự báo càng gần với g á trị thực tế thì đó là mơ hình dự báo tốt.Hệ số xác định R7 càng lớn thì mơ hình hồi quy đã xây dựng được xem là

<small>càng phù hợp.</small>

<small>Ngô Thị Phương Duyên - MSV: TI191554- Toán Kinh tế 61</small>

<small>28</small>

</div>

×