Tải bản đầy đủ (.pdf) (50 trang)

nghiên cứu mô hình arima trong dự báo tỉ lệ sinh viên tốt nghiệp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.62 MB, 50 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

BỘ CƠNGTHƯƠNG

<b>TRƯỜNGĐẠIHỌC CƠNG NGHIỆP THÀNH PHĨ HỊ CHÍ MINH</b>

<b>NGUYỄN QUANG HUY</b>

Ngành: KHOA HỌC MÁY TÍNHMã ngành: 8.480101

<b>LUẬN VĂN THẠC sĩ</b>

<b>THÀNH PHỐ HỊCHÍ MINH, NĂM 2023</b>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

Cơng trình được hồn thànhtại Trường Đại học Cơng nghiệp TP. Hồ Chí Minh.Người hướng dẫn khoahọc: TS. Đoàn Văn Thắng

Luận vănthạc sỹ được bảo vệ tại Hội đồng chấm bảo vệ Luận văn thạc sỹ Trường Đại học Cơng nghiệp TP. Hồ Chí Minh: ngày ... tháng... năm....

Thành phần Hội đồng đánh giáluận văn thạc sỹgồm:

1... - Chủ tịch Hội đồng2... - Phản biện 1

3... - Phản biện 24... - Uỷ viên5... - Thư ký

<i>(Ghi rõ họ,tên, học hàm, họcvịcủa Hội đồng chấm bảovệ ỉuậnvăn thạcSĩ)</i>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

<small>BỘ CÔNG THƯƠNG </small> <b>CỘNG HỊAXÃHỘI CHỦ NGHĨAVIỆT NAMTRƯỜNG ĐẠI HỌC CƠNG NGHIỆPĐộc lập-Tự do - Hạnh phúc</b>

<b>THÀNH PHỐ HỊ CHÍMINH</b>

<b>NHIỆM VỤ LUẬN VĂNTHẠCsĩ</b>

<b>L TÊN ĐÈ TÀI:</b>

<small>Nghiên cứu mơ hình ARIMA trong dự báo tỉ lệ sinh viên tốt nghiệp</small>

<b>NHIỆM VỤ VÀ NỘI DUNG:</b>

<small>Nhiệm vụ: Dựa trên dữ liệu số lượng sinh viên tốt nghiệp trong quá khứ kết hợp ứng dụng mô hình ARIMA dự đốn số lượng sinh viên tốt nghiệp trong tương lai.</small>

<small>Nội dung: phân tích dữ liệu số lượng sinh viên đã tốt nghiệp. Nghiên cứu và xây dựng, kiểm thử mơ hình ARIMA phù hợp cho dự đốn. Dựa trên dữ liệu sinh viên tốt nghiệp tiến hành dự dự đoán cho năm tiếp theo và tiến hành đánh giá mức độ hiệu quả của mơ hình.</small>

<b>II. NGÀY GIAO ĐỀ TÀI: </b><small>25/05/2023</small>

<b>III. NGÀYHOÀN ĐÈ TÀI:</b> <small>25/11/2023</small>

<b>IV. NGƯỜI HƯỚNG DẪNKHOA HỌC:</b> <small>TS. Đồn Văn Thắng</small>

<b>NGƯỜI HƯỚNG DẪN</b>

<i><small>Tp. Hồ Chí Minh, ngày ... tháng ... năm 20...</small></i>

<b>CHỦ NHIỆM Bộ MÔN ĐÀOTẠO</b>

<b>TRƯỞNG KHOA KHOA CNTT</b>

<i><small>(Họ tên và chữ ký</small></i>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>LỜI CẢM ƠN</b>

Tơi bày tỏ lịng biết ơn sâu sắc đến thầy TS. Đoàn Văn Thắng đãhướng dẫn, hỗtrợtậntâm suốt quá trình thực hiện luận văn. Cảmơn lãnh đạoNhàtrường đã tạođiều kiện tốtđể cá nhân tôi, cùng học viên khác hồn thành luậnvăn.

Tơi gửi lời cảm ơn đến bạn bè, đồng nghiệp, người thân, gia đình đã ủng hộ và động viên tơi duy trì sự kiên nhẫn trong quá trình thực hiện luận văn này.

Mặc dù luận văn đã được hồnthành, nhưng nhận thấy vẫn cịn mộtsố hạn chế, vì vậy tơi rất mong nhận được sự đóng góp để chỉnh sửa, bổ sung và hồn thiện hơn.

Xin chân thành cảm ơn.

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<b>TÓM TẤTLUẬNVĂN</b>

ARIMA làmột trong những mơ hình đã và đang được sử dụng ngày càng rộngrãi trong lĩnh vực phân tích dữ liệu nhằm mục đích đưara những dự báo cho tương lai. Luận văn này thực hiện nhằm mục đích giới thiệu một cách cụthể và chi tiết về mơhình ARIMA và ứng dụng thựctế trong việc dự báo tươnglai từ các dữ liệu trong quá khứ.

Trong luận văn này,tập trung vàonghiên cứu: (1) Lý thuyết của dữ liệu chuỗithời gian cùng các mơ hình dựbáo hồi quy, (2) Lýthuyết mơ hình ARIMAvà (3) Giới thiệu phần mem Eviews. Song song với việc nghiên cứu lý thuyết,luận văn cũng tiếnhành ápdụngmơ hình vào thựctế với tập dữ liệu được thu thập từ đơn vị giáo dụctại thành phố HồChí Minh.

Đánh giá, dự báo và đưa kết luận từ việc nghiên cứu với tập dữ liệu hiện có. Kết quảnày sẽ là mộttrong những tư liệu tham khảo có ích cho các đơn vị hay tổ chức có nhu cầu về dự báo tương lai bằng việc phân tích dữ liệu chuỗi thời gian.

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

ARIMA is a model that has been widely used in data analytic to make predictions for the future. Thisthesisis written in detail for an introductorypurpose about the ARIMA model and its usage in giving futureinformation based on historical data.

In thisthesis, the author is going to concentrate on research: (1) Theory of time seriesdata and regression forecast model, (2) Theory of ARIMA model, and(3) Eviews software introduction. Along with theoretical study, practical application is alsoapplied to the datafile collected from the educational unit in HoChi Minh City.Assessment, prediction, and conclusion are based on analysis based on available data

files. This thesis will be one of the references for units or organizations that need to make predictions based on time series date analytic.

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<b>LỜI CAM ĐOAN</b>

Tơi xin cam đoan đây là cơng trình nghiên cứu của cá nhân tôi và giảng viên hướngdẫn. Kết quả nghiên cứu, kết luậntrong luận văn là trungthực,khôngsao chép từnguồnkhác dưới mọi hình thức. Thựchiện trích dẫn, dẫn nguồn tài liệu tham khảo đúng theoquy định.

<b>Học viên</b>

Nguyễn Quang Huy

iv

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<b>MỤC LỤC</b>

MỞ ĐẦU...1

1. Đặtvan đề...1

2. Mụctiêu nghiên cứu...2

3. Đối tượng và phạm vi nghiên cứu...3

4. Cách tiếp cận và phương pháp nghiên cứu...3

4.1 Cách tiếp cận...3

4.2 Phương phápnghiên cứu...3

5. Ýnghĩathực tiễn đề tài...4

6. Phạm vi và giới hạn đề tài...4

7. Cấu trúc luận văn...4

CHƯƠNG 1 CÁC MÔ HÌNH DựBÁO TRONG PHÂN TÍCH DỮ LIỆU...5

1.1 Chuỗi thời gian (Time Series)... 5

1.2 Mơ hình hồi quy đơn...6

1.3 Mơ hình hồi quybội...8

CHƯƠNG 2 MƠ HÌNHARIMA - GIỚI THIỆU VÈ PHẨN MỀM EVIEWS...9

2.1 Mơ hình ARIMA...9

2.2 Xây dựng mơ hình ARIMA...14

2.3 Giới thiệu phần mem Eviews...15

CHƯƠNG 3 ÁP dụng mơhình ARIMAtrong Dự BÁO TỈ LỆ SINHVIÊN TỐT NGHIỆP...23

3.1 Thu thập dữ liệu...23

3.2 Kết quả xâydựng mơ hình...23

3.3 Đánh giá và nhận xét kết quả thựcnghiệm...35

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN...37

DANH MỤC CƠNG TRÌNH ĐẪ CƠNG BỐ CỦA HỌC VIÊN...38

LÝLỊCH TRÍCH NGANG CỦA HỌCVIÊN... 40

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

<b>DANH MỤC HÌNH ẢNH</b>

Hình 1.1 Mộtví dụ mơ hình hồi quy tuyến tính [7]...7

Hình 2.1 Cửasổ Workfile... 17

Hình 2.2 Nhập dữ liệu vào phầm mem Eviews...18

Hình 2.3 Biểu đồ hàm tự tương quan, tự tương quan từngphần...19

Hình 2.4 Kết quảquá trình ước lượng...20

Hình 2.5 Biểu đồthể hiện hàm tự tưong quan, tự tưong quan từng phần của phần dư .21Hình 2.6 Lựa chọn yêu cầu phù hợp chodự báo... 22

Hình 3.1 Biểu đồ biến động số lượng tốt nghiệp từ năm 2007-2022...24

Hình 3.2 Biểu đồ chuỗidừng khi lấy sai phân bậc 1...25

Hình 3.3 Biểu đồ tự tưong quan (ACF),biểu đồ tự tưong quan riêng từng phần (PACF)và giá trị p-value tưong ứng...26

Hình 3.4 Ước lượng mơ hình ARIMA (8,1,1)... 27

Hình 3.5 Kết quả thu được quamơ hình ARIMA (8,1,1)... 28

Hình 3.6 Kiểm traphần dưcó nhiễu trắng ARIMA (8,1,1)...30

Hình 3.7 Nghiệm nghịch đảo quá trìnhAR và MA...31

Hình 3.8 Đồ thị biểu diễn nghiệm củaquá trình AR và MA...32

Hình 3.9 Dự báo...33

Hình 3.10 Kết quả bảngthống kê theo dự báo...34

Hình 3.11 Biểu đồ dựbáo số lượng sinh viên tốt nghiệp năm 2023...35

vi

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

<b>DANHMỤCBẢNG BIỂU</b>

Bảng 2.1 Các trường hợp đặc biệt của mơ hình ARIMA... 13Bảng 3.1 Số liệu sinh viên tốt nghiệp qua từng năm...23Bảng 3.2 Bảng giá tương ứng từng mơ hình...29

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

<b>DANH MỤC TỪ VIẾT TẤT</b>

<b>Ký hiệu chữ viết tắt</b>

<b>ACF</b> Auto Correlation Fucntion Hàm tự tương quan

<b>ARIMA</b> Autoregressive Intergrated MovingAverage

Tự hồi quy tích hợp trungbình trượt

<b>ARMA</b> Autoregressive Moving Average Tự hồi quy trung bình trượt

<b>PACF</b> Partial Auto Correlation Function Hàm tự tương quan từngphân

viii

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

<b>MỞ ĐẦU</b>

<b>1. Đặt vấn đề</b>

Dự báo làcông việc ngày càng cần thiết trong thời điểm hiện tại. Kết quả việc dự báo sẽ cung cấp những thơng tincầnthiết chocác kếhoạch và cóthể khẳng địnhnếu khơngcó nhữngdự báo thì các hoạch định sẽ khơng có sự tin cậy cao.

Trong [1] [2], kỹ thuật dự báo đã rađời rất lâu vào khoảng thế kỉ 19, tuy nhiên vai trò của dựbáo ngày càng mạnh mẽ kể từ khi công nghệ thông tin ngày càng pháttriểnbởibản chất việc mơ hình hóa các phương pháp dự báo lại cần đến sự hỗ trợ giúp sứccủacông cụ máy tính. Cho tới những năm của thập niên 50, thì các lý thuyết về dựbáo, cácphương pháp luận mới được xây dựng, pháttriển một cách có hệ thống.

Trong cơng việc phân tích dự báo, việc thu thập thơng tin đadạng về lĩnh vực dự báo làmột trong những mục tiêu quan trọng nhất. Thơng tin này cóthể được phân chia thành ba phần chính: dữ liệu quákhứ của lĩnh vực dự báo, hiện trạng và diễn biến phát triển của lĩnh vực đó, cùngvới đánh giá chi tiết về các yếu tố ảnh hưởng,bao gồm cảyếu tố định tính vàđịnh lượng.

Thực tế, các phương pháp dự báo thường được phân loại thành hai loại chính: phươngpháp định tính và phương pháp định lượng. Phương pháp định tính phụ thuộc chủ yếu vào kinh nghiệm của các chuyên gia trong lĩnh vựctương ứng và kết quả của phươngpháp nàythường cần sự đánh giá từnhiều chuyên gia khác nhau.

Phương pháp định lượng, ngược lại, sửdụng dữ liệuquá khứđể xác định xu hướng phát triển của đốitượngvà xây dựng mơhìnhtốn học dựa trên dữ liệu đó. Phương pháp dự báo theo chuỗi thời gian là một trong những phương pháp định lượng phổ biến, trongđó chuỗi quan sát được dựa trên một biến duy nhấttheo thời gian.

Phương pháp chuỗi thời gian giả định rằng xu hướng phát triển của biến số dự báo sẽ tiếp tục giữnguyên trongquá khứ và thời điểm hiện tại,từ đó dùng để dự báotương lai.Bài luận văn này đang nghiên cứu mơ hình ARIMAnhằm thực hiện phân tích dữ liệusinh viên tốtnghiệp và tiến hành dự báo lượng sinh viên tốt nghiệp. Mơ hình ARIMA(AutoRegressive Integrate Moving Average) được đề nghị vào năm 1976 bởi Box-

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

Jenkins [3], dựa trên mơhình tự hồi quy AR và mơ hình trung bình trượtMA. Mơ hìnhARIMA dự báo định lượngtheo thời gian, vớixu thế vận độngcủa đối tượng trong quákhứ sẽ quyết định giátrị tưong laicủa biến số dựbáo. Từcác dữ liệu quan sát được, mơhình ARIMA sẽ phân tích tính tưong quan giữachúng để đưa ra mơ hình dự báo quacác giađoạn nhận dạng,ướclượngtham số và kiểm tra chúng nhằm tìm ra mơ hìnhphù họp.

Ngày nay, dự báo chuỗi thời gian được ứngdụng trên nhiều lĩnh vực: dự báo nhiệt độ, lượng mưa,dự báo giá cổ phiếu chứng khoán, dự báo lạm phát, ...

Bài luận văn nghiên cứu mơ hình chuỗi thời gian theo phưong pháp trung bình trượt tích hợp tự hồi quy ARIMA để dự báo tỉ lệ sinh viên tốt nghiệp cho cácnăm tiếp theonhằm mục đích trợ giúp các nhà quản lý và các bên liên quan đưara những chính sách phù hợp.

<b>2.Mụctiêu nghiên cứu</b>

Xây dựng mơhình ARIMA dự đốnbiến động số lượng sinh viên tốt nghiệp tăng hoặcgiảm cho các năm tiếptheo trong tưong lai.

- Tìm hiểu chuỗi thời gian- Tìm hiểu mơ hình ARIMA- Xây dựng mơ hình dự đoán

2

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<b>3. Đối tượng và phạm vi nghiên cứu</b>

Đối tượng nghiên cứu: dữ liệu lịch sử số lượng tốt nghiệp của đơn vị qua các nămPhạm vi nghiên cứu:

• Khơng gian: Trường Đại Học Cơng Nghiệp TP HCM

• Bộ dữ liệu dữ liệu sinh viêntốt nghiệptheo từng năm từ năm 2007 đếnnăm 2022) của khoa CNTT Trường Đại Học Cơng NghiệpTP HCM

• Nội dung: phân tích chuỗi dữ liệu thời giantrongquá khứ, dựbáo số lượng sinh viêntốt nghiệpcho các năm tiếptheo.

<b>4. Cáchtiếp cận và phương phápnghiên cứu</b>

<b>4.1Cách tiếp cận</b>

Tập trung khai thác các kết quả đánh giá thực nghiệm và kết quả nghiên cứu lý luậntrước đây về mơ hình ARIMA; các phân tích, đánh giá liên quan về tính khả thi, hiệuquả của mơ hình

Nghiên cứu lý thuyết và các ứng dụng của mơ hình ARIMA trong việc dự báo thơngqua cácdữ liệu trong quá khứ.

<b>4.2 Phươngphápnghiên cứu</b>

Phương pháp nghiên cứu tổng luận: Nghiên cứu tổng hợp về mặt lý luận về: chuỗi thờigian (Time Series) và các khái niệm có liên quan; mơ hình ARIMA, các khái niệm liênquan và ứngdụng thựctế, ...

Trên cơ sở lý thuyết đãnghiên cứu, tiến hành thực nghiệm dự báo tuyển sinh sử dụngmơhình ARIMA

Phươngpháp mơ phỏng: Sử dụng phần mềm Eviewsđể xây dựng mơ hình nhằm dự báo tuyển sinh trong tương laicủa đơn vị. Mơitrường thực nghiệm được tiến hành trên máytính xác tay Lenovo có cấu hình CPU Intel core Ĩ5-9780H, RAM 16GB và sử dụng hệđiềuhành Windows 10. Dữ liệu thực nghiệm là các dữ liệu tuyển sinh của đơn vị từ quákhứ các năm trước.

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

<b>5. Ý nghĩa thực tiễn đề tài</b>

Hiểu được mơ hình ARIMA và ứng dụng của nó trong dự báo các kết quả tương lai.MơhìnhARIMA lí giải đượccác biến độngcủachuỗi thời gian thơng qua các quan hệvới các giátrị q khứ. Mơhình cũng được ứngdụng một cách minh họanhằm dự báo biến động sinh viên tốt nghiệp tăng hoặc giảm cho các năm tiếp theo của một đơn vịgiáo dục.

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

<b>CHƯƠNG1 CÁC MƠ HÌNH Dự BÁO TRONG PHÂN TÍCHDỮ LIỆU</b>

<b>1.1 Chuỗi thịi gian (TimeSeries)</b>

<i>1.1.2Đặc trưng chithời gian</i>

Từ [4] [5] [6], các thành phần đặctrưng của chuỗi dữ liệu thời gian:

• Tính xu hướng (Trend): Đây là thành phần trong phân tíchchuỗi thời gian cho thấyxu hướngchung của dữ liệu trong một khoảng thời gian dài. Xu hướng có thể là tăngdần, giảm dần hoặc ổn định. Thành phần này giúp chúng ta hiểu được hướng diễn biến tổng thể của dữ liệu và cung cấp thông tin về sự thay đổi dài hạn củabiến số đó. Ví dụ, tronglĩnh vực kinh tế, sựlạm phát thường làm tănggiá cả trung bình theothịi gian, thể hiện mộtxu hướng tăng.

• Tính mùavụ (Seasonality): thành phần chỉ ra những biến đổi tăng hoặc giảm có sựlặp đi lặp lại một cách đều đặncủa dữliệu trong một khoảngthời gian xác định (vídụ: số ngày thứ Hai mỗitháng hoặc các ngày lễ thay đổitheo mỗi năm,...)

• Tính chu kỳ(Cyclicity): thành này nókhác yếu tố mùavụ ỏ chỗ thành phần này cósự biếnđộng trong khoảng thời gian dài hơn và không xác định trong nhiều năm, cótính chất lặpcủa dữ liệu theo thời gian.

• Yeu tố bất thường (Irregularity), hay cịn được gọi là nhiễu trắng (white noise), là thành phần cuối cùng của phân tích chuỗi thời gian. Sau khi đã loại bỏ các thành phần khác như xu hướng, mùavụ và chu kỳ,yếu tố này thể hiệncác biến động ngẫu nhiên của dữ liệu mà khơng có một quy luậthay mơ hìnhcụ thể.

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

- Khi dự báo trên tậpdữ liệu gốc, một đường biểu diễnkhông ổn định và khó dự đốncó thể xuất hiện. Trong trường hợpnày, chúng ta cần chọn các thành phần con củachuỗi dữ liệu mà có tính quy luật và xu hướng vận động cụ thể hon. Sau đó, chúng takết hợp lại những thànhphần này để tạo ra dự báo chính xác hơn. Với Cyclicity, đây làxu hướng biến động trong một khoảng thời gian dài. Tuynhiên, do dữ liệu cóthể khơng đủ lớn hoặc không đủ độ ổn định để xác định một cách chính xác Cyclicity, chúng ta thường chỉ tậptrung vào các thành phần còn lại, bao gồm Trend,Seasonality và Irregularity.

<b>1.2Mơ hình hồi quy đon</b>

<i>Mơ hình hồi quy tuyến tỉnh cổ điển (LinearRegression)</i>

Trong các trường hợp đơn giản,mơ hình hồi quy chophép mối quan hệtuyến tínhgiữa biến dự báo<i>y</i> và một biến dự đoánX

Các hệ số povà pl lần lượtbiểu thị điểm chặn và độ dốc của đường thẳng. Điểm chặnpo biểu thị giátrị dựbáo của ykhi x=0. Độ dốc pl biểu thị sựthay đổi trung bình đượcdự đốn trong y do X tăng một đơn vị.

6

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

60-Hìnli 1.1 Một vídụ mơ hìnhhồi quy tuyến tính [7]

Chú ý: các quan sát không nằm trên đường thẳng mà được phân bố ngẫu nhiên xungquanh nó. Mỗi quan sát có thể được hiểu như sự kết họp giữa phần hệ thống hoặc phần giải thích của mơ hình, po + px, và "lỗi" ngẫu nhiên, st. Thuật ngữ "lỗi" không chỉđon thuần là một sai số mà thựcchấtlà sự sailệchso với mơ hình đường thẳng cơ bản. Điềunày bao gồm tất cả cácyếu tố cóthể ảnh hưởng đếngiá trị yt ngồi giátrị dự đốn từxt.

<i>Phương pháp bỉnhphương nhỏ nhất (OLS - Ordinary LeastSquares)</i>

Phương pháp bìnhphương nhỏnhất cung cấpmột cách chọn hệ số hiệu quả bằng việc giảm thiểu tổng các sai số bình phương. Nghĩa là ta chọn các giá trị po, pl,..., pk saocho cực tiểu hóa

<small>£Ỉ=1 ft — sĩ=i(yt - </small><i>P<small>q</small>-<small> Pixi,t — p2x2,t — Pkxk,ty</small></i><b> (1-2)</b>

Đây được gọi là ước lượng bình phương tối thiểu vì nó mang lại giá trị nhỏ nhất chotổng các sai sốbình phương. Việctìm ra ước tính tốtnhất cho các hệ số thường được gọi là “fitting” mơ hình với dữ liệu, hoặc đơi khilà“learning” hoặc “training” mơhình.

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

<b>1.3 Mơ hình hồi quy bội</b>

<i>Mơhìnhhồi quy tuyển tính đa bội (Multiple linear regression)</i>

Khi có hai hoặc nhiều biến dự đốn, mơ hình được gọi là mơ hình hồi quy đa bội. Dạngtổng quát:

<i><small>yt - Pữ + P1XU + f>2x2,t</small></i> + —I- <i><small>Pkxk,t + £t</small></i> <b>(1.3)</b>

Trong đó y là biến dự báo và%!,..., <i>xk</i> là k biến dự báo. Mỗi biến dự đoán phải là số. Các hệ số pl,... ,pk đolườngtác động của từng yếu tố dự đoán sau khitính đến tác động của tấtcả các yếu tốdự đốn kháctrong mơ hình.

8

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

<b>CHƯƠNG2 MƠHÌNH ARIMA - GIỚI THIỆU VỀPHẢN MỀM EVIEWS</b>

<b>2.1 Mơ hình ARIMA</b>

Hai nhà toán học người Mỹ (George Box và Gwilym Jenkins) đã nghiên cứu mơ hìnhtự hồi quytích hợptrung bình trượt(Autoregressive Integrated Moving Average) đượcviếttắt ARIMAvà mơ hình này được phổ biến trong quyển sách “Time Series Analysis- Forecasting And Control “củahọ năm 1976. về sau, tên họ được đặt (Box-Jenkins) đểgọi tên các quátrình ARIMA tổngquát, áp dụng vào việc phân tíchvà dự báo các chuỗi thời gian [8].

Mơhình ARIMA cung cấp một cáchtiếpcận khác để dự báochuỗi thời gian. Làm mịn hàm mũ và mơ hình ARIMA là hai phương pháp được sử dụng nhiều nhất để dự báo chuỗi thòi gian và đưara các phưong pháp bổ sung cho vấn đề. Trongkhi các mơ hìnhlàm mịn hàm mũ dựa trên mơ tả xu hướng và tính thời vụ trong dữ liệu, các mơ hìnhARIMA nhằm mục đích mơ tả các mối tưong quantự động trong dữ liệu.

Theo [3] [9], bản chất ARIMA làtổng hợp của các mơhình: Mơ hìnhtự hồi quy (AR),mơhìnhtích hợp (I) và mơ hình trung bình trượt(MA) với chuỗi dữ liệu được sử dụng để nghiên cứu phải có tínhdừng.

<i>Tính dừngcủa chuỗi thời gian</i>

Một chuỗi thời gian được coi là chuỗi dừng khi nó thỏa mãn các đặc tính khơng phụ thuộcvào thời điểmquan sát. Điều này cónghĩa là giátrị của chuỗi khơng thay đổi theothời gian và khơng có sự biến động tự nhiên hay xu hướng rõ ràng.

Trong trường hợp củachuỗi thời gian có xu hướng hoặc tính thời vụ, các giátrị trongchuỗi sẽ phụ thuộc vào thời gian vàsẽ thay đổi theo các mẫu và mùa vụ. Do đó, những chuỗi nàythường khơng được coi là dừng.

Mặc khác, một chuỗi nhiễu có tính dừng sẽ không thể phân biệt được ở bất kỳ thời điểmnào. Điều này có nghĩalà khơng có sự biến đổi định kỳ hoặc xu hướng nào được quansát và các giátrị trong chuỗi được xem xét làổn định qua thời gian

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

Trường hợp tự tương quan được sử dụng để phát hiện tính khơng ngẫu nhiên thì nó thường chỉ có hiện tượngtự tương quan ở lần đầu tiên (hay độtrễ 1). Khi tựtương quanđược sử dụng đểxác định mơ hìnhchuỗi thời gian thích hợp, sự tự tương quan thường được biểu diễn dạng biểu đồ cho nhiều độ trễ.

<i>2.1.2Hàmtựtươngquan từng phần - PACF</i>

Hàm tự tương quan từng phần là một cơng cụ trong phân tích chuỗi thời gian để xác định mức độ tương quan giữacác giátrị trong chuỗi thời gian vàcác giá trị trong một khoảngthời gian cố định sau khi loại bỏ tác động của các giátrị nằm giữa chúng.Hàm tự tương quan từng phần tương tự như hàm tự tương quan ngoại trừ việc nó chỉ hiển thị mối tương quan giữa hai quan sát mà độ trễ ngắn hơn giữa các quan sát đókhơng giải thích được

10

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

Trong phân tíchchuỗi thời gian, hàm tự tương quan đo lường mối quan hệ tương quangiữa một quan sát và các quan sát trước đó trong chuỗi thời gian. Tuy nhiên, hàm tựtươngquan cóthể bị ảnh hưởngbởi các giátrị tương quan giữa các quan sát trung gian.Hàm tự tương quantừng phần giúp loại bỏ tác động này bằng cách tính tốn tương quangiữa hai quan sát, khơng tính đến các quan sát nằm giữa chúng.

Hàm tự tương quan từng phần thường được sử dụng trong việc xác định mơ hình chochuỗi thời gian, đặc biệt là khi áp dụng mơ hình ARIMA. Bằng cách này thì hàm tự tương quan từng phần giúp xác định số lượng các độ trễ (lags) cho các thành phần tự hồi quy của mơhình ARIMA.

<i>2.1.3 Mơ hình tự hoi quy- AR bậc p</i>

Trong mơ hình tự hồi quy, chúng ta dự báo biến quan tâm bằng cách sử dụng mộtkết hợp tuyến tính của các giá trị q khứ của chính biến đó. Thuật ngữ "tự hồi quy" chỉ đơn giản là chỉ rarằng biến được dự báo là chínhnó, tức là nó hồi quy hoặc phụ thuộcvào các giátrị của nó trong quá khứ. Trong mơ hình này, chúng ta sử dụng các giá trị quan sát được trướcđócủa biến đểdự đốn giá trị của biến tại các thời điểm trong tương lai.

Do vậy, mơhình tự hồi quybậc p có thể được viết như sau:

<i>2.1.4 Mơ hình trungbìnhtrượt- MA bậc q</i>

Mơhìnhtrung bình trượt(MA) sử dụng các lỗi dựbáo trong quá khứ để dự đoán giá trị của biến quan tâm tại các thời điểm trong tương lai

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

Trong mơ hình trung bình trượt, chúng ta tính trung bình động của các giá trị quan sát trước đó và sử dụng nó đểước lượng giá trị tiếp theo. Thuật ngữ "trung bìnhtrượt" thể hiện cách chúng tadi chuyển qua dữ liệu và tính trung bình của các phần tử trong một cửa sổ thời gian nhất định, sau đó sử dụng trung bình này làm dự báo cho giá trị tiếp theo.

yt = c + £t + ỡ^! + ớ2et_2 + - + <i>0et_q</i> (1.6) Trong đó: t : lànhiễu trắng (white noise) hay sai so

<i>c:</i> trung bìnhcủa chuỗi thời gian y<i>tỡr: </i>hệ số ước lượng

Chúng tơigọi đây làmơ hình trung bình trượtbậc q, được gọi là mơ hình MA(q). Trong mơhình này, ta không thực sự quan sát các giátrị của £t (lỗi), màchỉ sử dụng chúng đểước lượng giátrị của biến trong tưonglai.

Mơhình trung bình trượt khơng phải làmộtsự hồi quy theonghĩathơngthường, nhưng nó làmột kỹ thuật quan trọngtrong phân tíchchuỗi thời gian để dự báo các giá trị tiếp theo.

<i>2.ỉ. 5 Sai phân - Intergrated Ibậcd</i>

Đểlàm cho một chuỗi thời gian trỏ nên dừng, chúngta thường thực hiện các phépbiếnđổi như lấy sai phân. Lấy sai phân là quá trình tính tốn sự khác biệtgiữa các quan sát liên tiếp trongchuỗithời gian. Bằngcách này, chúngta có thể loại bỏ xu hướngvà tínhthời vụ từ chuỗi thời gian.

Thêm vào đó, phép biến đổi như logarit cũng có thể giúp ổn định phương sai của chuỗi thời gian. Bằng cách giảm phương sai, chúng ta có thể làm cho biến thể của chuỗi thờigian trởnên ít biến động hơn và dễ dàng đểthực hiện các phân tích và dự báo.

Q trình lấy sai phân:

- Sai phân bậc 1: 1(1) = <small>A(xt) = Xt - Xt-1</small>

- Sai phânbậc d: 1(d) = <small>Ad(xt) = ỒÍỂ^ÉÍĨÉỈỈ</small>

<i><small>đ ỈJtHL6 s</small></i>

12

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

<i>2.ỉ.6Mơ hình trungbìnhtrượttích họp tự hổi quy- ARIMA(p,d,q)</i>

Khi kết hợp sai phân với tự hồi quy và mơ hình trung bình trượt [10], chúng ta sẽ thuđượcmơ hìnhARIMA. Mơ hìnhARIMA hay cịn gọi là mơ hình trung bình trượttíchhợp tự hồi quy (trong ngữ cảnh này, tích hợp” là đảo ngược của sai phân). Mơ hìnhđược biểu diễn:

<i>y't = + Qiy't-1 +</i> —<i>I- 6py't_p</i> + Ớiốt-1 + —I- <i>ỡq£t-q + £t</i> <b>(1*7)</b>

Trong đó: y't<i>:</i> là chuỗi đã lấy sai phân ( nó cóthể đã được lấy sai phần nhiều hon 1 lần)Các“bộ dự đốn”ỏphíabên phải bao gồm cả giátrị trễcủa<i>yt</i> và lỗi trễ. Chúng tơi gọi đây là mơ hình ARIM(p,d,q). Với:

• p: bậc củaphần tự hồi quy• d: bậc của sai phân

• q: bậc của mơ hình trung bìnhtrượt

Các điều kiện dừng và khả năng nghịch đảo tưong tự được sử dụng cho các mơ hìnhtrung bình độngvà tự hồi quy cũng áp dụngchomơ hình ARIMA.

Nhiều mơ hình chúngta đãthảo luận làtrường hợp đặc biệt của mơ hìnhARIMA,như bảng dưới đây:

Bảng 2.1 Các trường hợp đặc biệt của mơhình ARIMA

Di động ngẫu nhiên ARIMA(0,l,0) khơng có hằng sốBình phưong nhỏnhất ARIMA(0,l,0) có 1 hằng số

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

<b>2.2 Xây dụng mơhình ARIMA</b>

<i>2.2.1 Nhậndạng mơ hình</i>

Để nhận dạng mơ hình ARMA(p,q), ta cần xác định các giá trị thích hợp chocác hệ số pvà q, trong đó p là bậctự hồi quyvà qlàbậctrung bình trượt. Quá trình nàyphụ thuộcvào đồ thị hàm tự tương quan (ACF) và hàm tự hồi quytừng phần (PACF).

Chọn mơ hình AR(p): Neu đồ thị PACF có giátrị cao tại các độ trễ 1, 2,...,p và giảmđángkể sau đó, đồng thời ACF giảm dần, chúngtacó thể chọn mơ hình AR(p).

Chọn mơ hình MA(q): Neu đồ thị ACF có giá trị cao tại các độ trễ 1, 2,...,q và giảm đángkể sau đó, vàđồng thời PACF giảm dần, chúng ta cóthể chọn mơ hình MA(q).Mơ hình ARIMA chỉ áp dụng được cho chuỗi dừng. Neu chuỗi khơng dừng, ta cần chuyển đổi nó thành chuỗi dừng trước khi ước lượng tham số. Thông thường, việc lấysai phân một hoặc nhiều lần (bậc d=0, 1, 2, 3) có thể tạo ra một chuỗi có tính dừng.Trong trường hợp biến đổi này khôngthành công, các phưong pháp biến đổi khác nhưchuyển đổi logarithm cóthể được áp dụng.

<i>2.2.2ưức lượng thôngso</i>

Sau khi xác định được bậc của mô hình ARIMA, q trình tiếp theo là ước lượng cácthơng số của mơ hình. Q trình này thường là một q trình thực nghiệm và thường được thực hiện thơng qua phương pháp bình phương nhỏ nhất, cụ thể là phương phápMaximum Likelihood, để tìm ra mơ hình tốtnhất cho việc dự báo.

Các thơng số của mơ hình ARIMA thường được ước lượngthông quanhiều phần mềm khác nhau như Eviews, SPSS, R, và nhiều phần mềm thống kê và dự báo khác. Mỗiphần mềm có cách thực hiện vàcách ước lượng thơng số của mơ hình một cách riêngbiệt, nhưng mục tiêu cuối cùng là tìm ra một mơ hình ARIMA phù hợp và chính xác nhất chotình huống cụ thể.

14

</div>

×