Tải bản đầy đủ (.pdf) (92 trang)

Tóm tắt: Kỹ thuật dự báo trong vận hành thị trường điện Việt Nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.82 MB, 92 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<i>TP. HỒ CHÍ MINH NĂM 2020 </i>

BỘ GIÁO DỤC VÀ ĐÀO TẠO

<b>TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM </b>

---

<b>NCS. NGUYỄN TUẤN DŨNG </b>

<b>KỸ THUẬT DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG ĐIỆN VIỆT NAM </b>

<b>LUẬN ÁN TIẾN SĨ KỸ THUẬT </b>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<b>TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÀNH PHỐ HỒ CHÍ MINH </b>

Người hướng dẫn khoa học 1: <b>PGS. TS Trần Thu Hà </b>

Người hướng dẫn khoa học 2: <b>PGS. TS Nguyễn Thanh Phương </b>

Luận án sẽ được bảo vệ trước hội đồng chấm Luận án tiến sĩ Kỹ thuật cấp cơ sở Đại học Công nghệ Tp. Hồ Chí Minh họp vào 8 giờ 00, ngày 15 tháng 01 năm 2020 tại Đại học Cơng nghệ Tp. Hồ Chí Minh.

Có thể tìm hiểu luận án tại thư viện: - Đại học Bách khoa Tp. HCM - Đại học Công nghệ Tp. HCM

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

<b>LỜI CAM ĐOAN </b>

Tôi xin cam đoan đây là cơng trình nghiên cứu của riêng tơi. Các số liệu, kết quả nêu trong Luận án là trung thực và chưa từng được ai công bố trong bất kỳ cơng trình nào khác.

Tơi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận án này đã được cảm ơn và các thơng tin trích dẫn trong Luận án đã được chỉ rõ nguồn gốc tham khảo.

<b>Tác giả Luận án </b>

<i> </i>

<i><b>NGUYỄN TUẤN DŨNG </b></i>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>LỜI CÁM ƠN </b>

Tơi xin bày tỏ lịng biết ơn chân thành nhất đến PGS.TS Trần Thu Hà và PGS.TS. Nguyễn Thanh Phương, các Thầy, Cô đã tận tâm chỉ dẫn, truyền đạt những kiến thức và kinh nghiệm quý báu cho tơi trong suốt q trình thực hiện Luận án này.

Và tôi xin được gửi lời cám ơn đến gia đình và bạn bè - những người đã luôn ủng hộ và động viên chúng tôi trong suốt thời gian vừa qua.

<b>Tác giả Luận án </b>

<i> </i>

<i><b>NGUYỄN TUẤN DŨNG </b></i>

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<b>TÓM TẮT </b>

Đặc điểm của quá trình sản xuất và tiêu thụ điện năng là phải đảm bảo sự cân bằng giữa sản xuất và tiêu thụ ở mọi thời điểm, khi có sự mất cân bằng giữa sản xuất và tiêu thụ đều làm cho chất lượng điện năng thay đổi, nặng nề hơn có thể dẫn đến sự sụp đỗ điện áp gây tan rã hệ thống.

Tuy nhiên, điện năng là một mặt hàng rất đặc biệt, đó là về mặt kinh tế không thể lưu trữ và ổn định hệ thống điện đòi hỏi một sự cân bằng liên tục giữa sản xuất và tiêu dùng. Đồng thời, nhu cầu sử dụng

<i>điện còn phụ thuộc vào thời tiết (nhiệt độ, tốc độ gió, mưa,…); nhu </i>

cầu sử dụng của các doanh nghiệp, cũng như các hoạt động hàng

<i>ngày (công suất đỉnh so với giờ cao điểm, các ngày trong tuần so với ngày cuối tuần, ngày lễ và gần ngày lễ,…); công suất phát của các </i>

nguồn năng lượng tái tạo cũng thay đổi theo điều kiện tự nhiên; Do đó, phải cần đến kỹ thuật dự báo điện năng để cung cấp thông tin cho quá trình điều khiển HTĐ nhằm đảm bảo sự cân bằng giữa sản xuất và tiêu thụ. Đặc biệt khi HTĐ được vận hành theo cơ chế thị trường điện cạnh tranh, kết quả dự báo sẽ cung cấp thông tin cho các nhà quản lý điều hành giá mua bán diện.

Đã có nhiều phương pháp dự báo được sử dụng, tuy nhiên phần lớn là các phương pháp dự báo dài hạn và trung hạn dùng để cung cấp thông tin cho việc qui hoạch phát triển nguồn, lưới điện và lập kế hoạch vận hành HTĐ. Luận án sẽ nghiên cứu đề xuất một phương pháp dự báo ngắn hạn mới để cung cấp thông tin phụ tải điện cho các nhà quản lý điều hành thị trường điện cạnh tranh.

Việc nghiên cứu các đặc tính của phụ tải; xây dựng các phương pháp xử lý dữ liệu thiếu, sai sốt dữ liệu; cũng như đề xuất sử dụng

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

biểu đồ phụ tải chuẩn hóa đơn vị (SLP) để cung cấp thơng tin cho các mơ hình dự báo là những nhiệm vụ quan trọng của luận án. Qua phân

<i>tích các mơ hình dự báo đang được sử dụng trên thế giới (Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo, học máy – mơ hình Support Vector Regression; Neural Network, Feedforward Networks; Random Forest), luận án đã đã xây dựng thành công giải thuật mới </i>

đó là sử dụng Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nó giải quyết được câu chuyện chênh lệch ngày âm và ngày dương, các ngày lễ hội, ngày đặc

<i>biệt trong năm và nhất là các ngày trong các tháng 01 và 02 (tháng có </i>

<i><b>Tết Dương lịch và Tết Ngun Đán). Mơ hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) đã </b></i>

hoàn thiện hàm dự báo ngắn hạn, cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện cạnh tranh, các kết quả dự báo

<i>được kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực thuộc Tập đoàn Điện lực Việt Nam. </i>

Ngoài ra, luận án cũng đã có những phân tích sự tác động của giá thị trường SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang về lợi nhuận cao nhất. Các module xử lý dữ liệu thiếu, xây dựng Biểu đồ phụ tải chuẩn hóa đơn vị (SLP), dự báo phụ tải,… được chính tác giả tự lập trình bằng ngơn ngữ Matlab 2017.

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<b>ABSTRACT </b>

The characteristic of the production and consumption of electricity is to ensure a balance between production and consumption at all times, when there is an imbalance between production and consumption, the quality of electricity is changed. More severe changes may result in a voltage collapse resulting in system breakdown.

However, electricity is a very special commodity, it is economically impossible to store and stabilize electrical systems requiring a constant balance between production and consumption. At the same time, the demand for electricity also depends on the weather (temperature, wind speed, rain,...); needs of businesses, as well as daily activities (peak capacity compared to peak hours, days of the week compared to weekends, holidays and close to holidays, ...); The generation capacity of renewable energy sources also varies according to natural conditions; Therefore, it is necessary to use power forecasting technology to provide information for the process of controlling the power system to ensure the balance between production and consumption. Especially when the power system is operated under the competitive electricity market mechanism, the forecast results will provide information to the regulators on the purchase and sale price.

There have been many forecasting methods used, but most of them are long-term and medium-term forecasting methods to provide information for power development planning, power grids and operation planning. The dissertation will study a short-term forecasting method to provide additional charge information for

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

regulators operating the competitive electricity market.

The study of load characteristics; building methods to handle data missing and falsified data; as well as proposing the use of Standardized Load Profiles (SLP) diagram to provide information for forecasting models which are important tasks of the thesis. Through analysis of forecasting models being used in the world (Statistical techniques - SARIMA model; Artificial intelligence, machine learning - Support Vector Regression model; Neural Network, Feedforward Networks; Random Forest), treatise The project has successfully built a new algorithm which is using Standardized Load Profiles (SLP) as the input data set for the regression module building modules that have worked and forecasted results. with low errors, it solves the story of the difference between negative and positive days, festivals, special days of the year and especially the days in January and February (months with New Year's Day and New Year's Day). The combined model of Standardized Load Profiles (SLP) and Support Vector Regression (SVR) has completed the short-term forecasting function, providing forecasting results for regulators operating the competitive electricity market, The forecast results are verified with the data set of 05 Electricity Corporations.

In addition, the thesis also analyzes the impact of SMP market price and CFD contracts on Qc forecast results to minimize risks and take advantage of fluctuations. of the market to bring about the highest profit. The data processing modules are missing, built the Standardized Load Profiles (SLP), Load forecast, ... programmed by the author in Matlab 2017.

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

<b>CÁC CƠNG TRÌNH NGHIÊN CỨU ĐÃ CÔNG BỐ </b>

1. Nguyen Tuan Dung, Tran Thu Ha, Nguyen Thanh Phuong,

<b>2018: COMPARATIVE STUDY OF SHORT-TERM </b>

<b>ELECTRIC LOAD FORECASTING: CASE STUDY EVNHCMC - 2018 4th International Conference on Green </b>

Technology and Sustainable Development (GTSD) – IEEE Conference 2018.

2. Nguyen Tuan Dung, Nguyen Thanh Phuong, tháng 7 năm

<b>2018: Comparative Study of Short-Term Electric Load </b>

<b>Forecasting: Case Study EVNHCMC – Hội thảo Quốc gia </b>

lần thứ XXI – Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông – Thanh Hóa.

3. <b>Nguyen Tuan Dung, Nguyen Thanh Phuong, 2018: DỰ BÁO </b>

<b>PHỤ TẢI ĐIỆN NGẮN HẠN BẰNG SUPPORT VECTOR REGRESSION (SVR) – Hội nghị Khoa học công nghệ 2018 </b>

– Trường Đại học Công nghệ thành phố Hồ Chí Minh.

4. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019:

<b>HANDLING MISSING DATA USING STANDARDIZED LOAD PROFILE (SLP) AND SUPPORT VECTOR REGRESSION (SVR) - 2019 International Conference on </b>

System Science and Engineering (ICSSE) – IEEE Conference 2019.

5. <b>Nguyen Tuan Dung, Nguyen Thanh Phuong, 2020: LOAD </b>

<b>FORECASTING FOR MONTHS OF THE LUNAR NEW YEAR HOLIDAY USING STANDARDIZED LOAD PROFILE AND SUPPORT REGRESSION VECTOR: </b>

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

<b>CASE STUDY HO CHI MINH CITY - The International </b>

Conference On Science, Technology And Society Studies (STS 2020) – Trường Đại học Công nghệ thành phố Hồ Chí Minh.

<b>HỌC </b>

6. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2017:

<b>DEALING WITH MISSING DATA FOR THE POWER </b>

<b>REGRESSION (SVR) - ISSN 1859-1531 - Tạp chí KHOA </b>

HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ Số 3(112).2017-Quyển 1; Trang: 28-33.

7. <b>Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019: XỬ LÝ </b>

<b>DỮ LIỆU THIẾU BẰNG BIỂU ĐỒ CHUẨN HÓA ĐƠN VỊ (SLP) VÀ SUPPORT VECTOR REGRESSION (SVR) - </b>

ISSN 1859-3585 - Tạp chí KHOA HỌC & CƠNG NGHỆ, Số 50.2019, trang 21.

8. <b>Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019: </b>

<b>SHORT-TERM ELECTRIC LOAD FORECASTING USING </b>

<b>SUPPORT VECTOR REGRESSION (SVR) - Engineering, </b>

Technology & Applied Science Research Vol. 9, No. 4, 2019, 4548-4553.

9. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019:

<b>IMPROVE THE ACCURACY OF SHORT-TERM FORECASTING ALGORITHMS BY STANDARDIZED </b>

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

<b>LOAD PROFILE AND SUPPORT REGRESSION VECTOR: CASE STUDY VIETNAM - Advances in </b>

Science, Technology and Engineering Systems Journal Vol. 4, No. 5, 243-249 (2019). ASTESJ ISSN: 2415-6698.

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

1.1.3. Trí tuệ nhân tạo, học máy 10 1.2. Các yếu tố tác động đến dự báo phụ tải ngắn hạn 15

1.4. Nhiệm vụ và giới hạn của luận án 18

2.2. DỮ LIỆU THIẾU TRONG NGHIÊN CỨU PHỤ TẢI ĐIỆN25 2.2.1. Phương pháp xử lý dữ liệu thiếu trong nghiên cứu phụ tải điện 25

a) Xây dựng mơ hình hồi quy cho việc dự đốn các giá trị thiếu26

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

b) Kết quả xử lý dữ liệu thiếu 27 + Phương pháp thông thường: sử dụng giá trị trung bình trong cùng thời gian cho 4 tuần trước đó của chuổi dữ liệu đang xét,

+ Phương pháp xây dựng đường cong hồi qui bằng giải thuật SVR (Support Vector Regression) 28 CHƯƠNG III: NGHIÊN CỨU PHỤ TẢI VÀ BIỂU ĐỒ CHUẨN

3.1.1. Đặc tính tải ngày – tuần (week day) 30 3.1.2. Đặc tính tải giờ – ngày (hour day) 30

3.2. BIỂU ĐỒ PHỤ TẢI CHUẨN HÓA ĐƠN VỊ 32

3.2.2. Ứng dụng xử lý dữ liệu thiếu bằng Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) 32 3.2.3. Kết quả áp dụng SLP vào xử lý dữ liệu thiếu: 35 CHƯƠNG VI: XÂY DỰNG MƠ HÌNH DỰ BÁO NGẮN HẠN 41

4.2.2. Xây dựng đồ thị chuẩn hóa đơn vị: 48 4.2.3. Xây dựng các mơ hình hồi quy cho STLF: 48

4.2.6. Kiểm chứng bằng bộ dữ liệu ngày Tết Nguyên Đán

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

4.2.7. Kiểm chứng với bộ dữ liệu của 05 Tổng cơng ty Điện lực

<i>thuộc Tập đồn Điện lực Việt Nam (Chi tiết theo Phụ lục đính </i>

CHƯƠNG V – DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG

5.1. Các yêu cầu về dự báo phụ tải trong VWEM 56 5.2. Dự báo phục vụ công tác vận hành thị trường điện cạnh tranh58 5.3. Kết quả áp dụng Kỹ thuật dự báo vào vận hành Thị trường

điện Bán buôn Việt Nam (phạm vi Tổng công ty Điện lực 6.3. HƯỚNG PHÁT TRIỂN CỦA LUẬN ÁN 68

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

<b>CHƯƠNG I: TỔNG QUAN 1.1. Tổng quan về vấn đề nghiên cứu </b>

Vấn đề dự báo điện năng đóng một vai trị hết sức quan trọng và có tính quyết định đối với nền kinh tế và đời sống của chúng ta. Đây là một môn khoa học quan trọng nhằm nghiên cứu các phương pháp luận khoa học để đưa ra các con số chính xác nhất sẽ xảy ra trong tương lai, giúp cho chúng ta định hướng được phương hướng và kế hoạch cho tương lai, chủ động trong công việc và xử lí được những biến cố. Nếu như khơng thực hiện công tác dự báo điện năng, ta sẽ gặp phải hai trường hợp có thể xảy ra, đó là: sẽ thiếu hụt điện năng sử dụng hay dư thừa điện năng sản xuất.

Trong những năm qua, dự báo tiêu thụ điện năng thu hút một sự quan tâm lớn từ các Công ty điện lực và các nhà nghiên cứu từ các khu vực khác nhau. Đối với các Công ty điện lực đây là một vấn đề lớn bởi vì họ cần phải ước lượng điện cần thiết để đáp ứng nhu cầu khách hàng của họ. Đối với họ, đây không phải là một nhiệm vụ dễ dàng bởi vì nhu cầu điện ngày càng tăng trong những năm qua và cũng vì mơ hình tiêu thụ điện ngày càng khác nhau với nhiều yếu tố tác động. Vì vậy, một trong những mục tiêu của Công ty điện lực là dự báo phải bám sát với nhu cầu thực tế để ngăn ngừa sự thiếu hụt hoặc lãng phí điện năng.

Việc tìm kiếm các phương pháp dự báo tốt nhất không phải là một nhiệm vụ dễ dàng vì có nhiều biến như: nhiệt độ, độ ẩm, gió, nhân khẩu học, số lượng trung bình của các thiết bị điện trong nước, mùa trong năm, ngày trong tuần, ngày lễ đã được đưa vào xem xét. Ngoài ra, việc xây dựng các nhà máy và hệ thống điện ln cần có thời gian. Do vậy, muốn đáp ứng được nhu cầu sử dụng điện, ngành điện phải

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

làm tốt công tác dự báo để lập kế hoạch triển khai. Chính sự phát triển nhanh của nhu cầu sử dụng điện đang gây ra mất cân đối về tài chính để đảm bảo sự phát triển bền vững của ngành Điện. Giá điện mua cạnh tranh sẽ là công cụ của thị trường để tạo ra sự cân bằng tự nhiên nhu cầu sử dụng điện, lợi nhuận của các ngành sản xuất và các đơn vị cung cấp điện [1].

Hiện nay, do sự phát triển nhanh về khoa học kĩ thuật, đặc biệt là những công cụ tính tốn, nhiều phương pháp dự báo đã, đang và sẽ được nghiên cứu để đưa vào sử dụng. Chúng ta có thể chia dự báo thành các dạng mơ hình chính như sau:

<b>1.1.1. Các phương pháp thống kê (1) Phương pháp bình quân di động </b>

Phương pháp này sử dụng khi các số liệu trong dãy số biến động không lớn lắm. Các số bình qn di động được tính từ các số liệu của dãy số thời gian có khoảng cách đều nhau.

<b>(2) Phương pháp bình quân di động có trọng số </b>

Những số liệu mới xuất hiện trong các thời kỳ cuối có giá trị lớn hơn những số liệu xuất hiện đã lâu. Để xét đến vấn đề này ta sử dụng các trọng số để nhấn mạnh giá trị các số liệu gần nhất, vừa xảy ra. Việc chọn các trọng số phụ thuộc vào kinh nghiệm và sự nhạy cảm

<b>của người làm công tác dự báo. </b>

<b>(3) Phương pháp san bằng số mũ </b>

Phương pháp này rất tiện lợi khi dùng máy tính. Đây cũng là kỹ thuật tính số bình qn di động nhưng khơng địi hỏi phải có nhiều số liệu quá khứ.

<b>(4) Phương pháp san bằng số mũ có điều chỉnh xu hướng </b>

Phương pháp san bằng số mũ giản đơn không thể hiện rõ xu

<i>hướng biến động. Do đó cần phải sử dụng thêm kỹ thuật điều chỉnh </i>

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

<i>xu hướng. Cách làm như sau: đầu tiên tiến hành dự báo theo phương </i>

pháp san bằng số mũ giản đơn sau đó sẽ thêm vào một lượng điều chỉnh (có thể âm hay dương)

Phương pháp Winter là một trong một số phương pháp làm mịn hàm mũ giúp phân tích các chuỗi thời gian theo mùa một cách trực tiếp. Phương pháp này được dựa trên ba hằng số làm mịn cho tính dừng, xu hướng và mùa. Kết quả phân tích của Barakat et al. [2] cho thấy rằng mơ hình độc đáo của năng lượng và nhu cầu liên quan đến các khu vực phát triển nhanh rất khó để phân tích và dự đốn bằng cách áp dụng trực tiếp phương pháp Winter. El-Keib et al. [3] trình bày một cách tiếp cận lai, trong đó làm mịn hàm mũ được tăng cường với phân tích phổ điện và mơ hình tự điều chỉnh tự hồi quy.

<b>(5) Phương pháp dự báo theo đường khuynh hướng </b>

Các phương pháp dự báo theo đường khuynh hướng cũng dựa vào dãy số thời gian. Dãy số này cho phép ta xác định đường khuynh hướng lý thuyết trên cơ sở kỹ thuật bình phương cực tiểu, tức là tổng khoảng cách từ các điểm thể hiện nhu cầu thực tế trong quá khứ đến đường khuynh hướng lấy theo trục tung là nhỏ nhất. Sau đó dựa vào đường khuynh hướng lý thuyết ta tiến hành dự báo nhu cầu cho các năm trong tương lai.

Có thể sử dụng được đường khuynh hướng dự báo theo đường khuynh hướng để dự báo ngắn hạn, trung và dài hạn. Đường khuynh hướng có thể là tuyến tính hay phi tuyến.

Để xác định được đường khuynh hướng là tuyến tính trước hết ta cần biểu diễn các nhu cầu thực tế trong quá khứ lên biểu đồ và phân tích xu hướng phát triển của các số liệu đó. Qua phân tích nếu thấy rằng các số liệu tăng hay giảm tương đối đều đặn theo một chiều hướng nhất định thì ta có thể vạch ra một đường biểu hiện chiều

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

hướng đó. Nếu các số liệu biến động theo hướng đặc biệt hơn như tăng giảm ngày càng nhanh hay ngày càng biến động chậm thì ta có thể sử dụng các đường cong thích hợp để mơ tả biến động đó (đường parabol, hyperbol, logarit,…)

<b>(6) Dự báo từ các mô hình chuỗi thời gian (mơ hình BOX-JENKINS) </b>

Các mơ hình kinh tế lượng chủ yếu dựa trên một động thái rõ nét của các đối tượng có liên quan đến hệ thống kinh tế. Tuy nhiên một họ các mơ hình thay thế khác được sử dụng rộng rãi, đặc biệt trong

<i>dự báo ngắn hạn, được gọi là các mô hình chuỗi thời gian. </i>

Một phương pháp rất phổ biến trong việc lập mơ hình chuỗi thời

<i><b>gian là phương pháp trung bình trượt kết hợp tự hồi quy </b></i>

<b>(autoregressive integrated moving average - ARIMA), thường </b>

<b>được gọi là phương pháp luận Box-Jenkins. Trọng tâm của các </b>

phương pháp dự báo này khơng phải là xây dựng các mơ hình đơn phương trình hay phương trình đồng thời mà là phân tích các tính chất xác suất hay ngẫu nhiên của bản thân các chuỗi thời gian kinh tế

<i>theo triết lý “hãy để dữ liệu tự nói” [4] – [8]. </i>

Sau đây là một hình theo phương pháp luận Box-Jenkins trong quá trình dự báo từ mơ hình chuỗi thời gian:

<b>a) Mơ hình tự hồi quy (AR): </b>

Mơ hình chuỗi thời gian tự hồi quy hồn tồn có cấu trúc như sau: hay

Trong đó Y<small>t</small><sup>*</sup><i> là quan sát thứ t đối với biến phụ thuộc sau khi trừ đi giá trị trung bình (μ) của chính nó, và u</i><small>t</small> là thành phần sai số có trung bình bằng 0 và phương sai không đổi, và không tương quan với u

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

<i><b>nếu t ≠ s (khái niệm này gọi là nhiễu trắng – white noise). Thành </b></i>

phần hằng số được bỏ qua vì Y<small>t</small> được biểu diễn dạng độ thiên lệch khỏi giá trị trung bình. Nói cách khác, Y<small>t</small> được mơ hình hóa chỉ với

<i><b>q khứ của nó và khơng với các biến độc lập khác. Đây là các mơ hình tự hồi qui, AR và mơ hình trong phương trình trên được gọi là </b></i>

mơ hình AR (p), với p là bậc tự hồi quy.

- Nếu ta lập mô hình Y<small>t</small><i> như sau: (Y</i><small>t</small> - μ) = α<small>1</small>(Y<small>t-1</small> - μ) + u<small>t</small>

<i>với μ là giá trị trung bình của Y và u</i><small>t</small><i> là một số hạng sai số ngẫu </i>

nhiên khơng tương quan (có giá trị trung bình bằng 0 và phương sai khơng đổi σ<small>2</small>) thì ta nói rằng Y<small>t</small><i><b> tn theo q trình ngẫu nhiên tự hồi </b></i>

<b>quy bậc nhất hay AR(1). </b>

- Nhưng nếu xem xét mơ hình sau:

(Y<small>t</small> - μ) = α<small>1</small>(Y<small>t-1</small> - μ) + α<small>2</small>(Y<small>t-2</small> - μ) + u<small>t </small>

thì ta có thể nói rằng Y<small>t</small><i><b> tn theo quá trình tự hồi quy bậc hai hay </b></i>

<i><b>AR(2). Tức là, giá trị của Y trong thời đoạn t phụ thuộc vào giá trị </b></i>

<i>của nó trong hai thời đoạn trước đó, với các giá trị của Y được biểu </i>

diễn xung quanh giá trị trung bình μ, ta có thể viết mơ hình sau: (Y<small>t</small> - μ) = α<small>1</small>(Y<small>t-1</small> - μ) + α<small>2</small>(Y<small>t-2</small> - μ) + … + α<small>p</small>(Y<small>t-p</small> - μ) + u<small>t </small>

Trong trường hợp này, Y<small>t</small><i><b> là quá trình tự hồi quy bậc p hay </b></i>

<b>AR(p). </b>

<b>b) Mô hình trung bình trượt (MA) </b>

Quá trình AR vừa đề cập trên khơng phải là cơ chế duy nhất có thể tạo ra chuỗi dữ liệu Y.

<i>- Giả sử ta lập mơ hình Y như sau:</i>

với μ là hằng số và u<small>t</small> là số hạng sai số nhiễu ngẫu nhiên thuần

<i>túy. Ở đây, Y trong thời gian t bằng một hằng số cộng với trung bình </i>

trượt của sai số hiện tại và quá khứ. Vậy trong trường hợp này, ta nói

<i><b>rằng Y tn theo q trình trung bình trượt bậc nhất hay MA(1). </b></i>

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

<i>- Nhưng nếu Y tuân theo biểu thức: </i>

<b>thì đó là một q trình trung bình trượt bậc hai hay MA(2). - Tổng quát hơn, ta có mơ hình cho q trình trung bình trượt </b>

<b>c) Các mơ hình ARIMA </b>

Phối hợp giữa các mơ hình tự hồi quy (AR) và trung bình trượt (MA) ta tạo ra được mơ hình ARMA. Do đó, mơ hình ARMA (p, q) có dạng tổng qt:

<b>• Sai phân hố </b>

<i><b>Hầu hết các chuỗi dữ liệu trong kinh tế ln có tính khơng dừng </b></i>

bởi vì chúng tăng trưởng dần theo thời gian. Việc ước lượng của q trình ARMA địi hỏi Y<small>t</small> phải là một chuỗi dừng. Hầu hết các chuỗi thời gian khơng dừng đều có thể được chuyển thành dạng dừng thơng

<i><b>qua q trình sai phân hóa. </b></i>

Giả sử, xét một xu hướng tuyến tính có dạng Y<small>t</small><i><b> = α + βt. Sai phân bậc nhất của Y</b></i><small>t</small> được định nghĩa là: ΔY<small>t</small> = Y<small>t</small> –Y<small>t-1</small>.

Ta thấy: ΔY<small>t </small>= α + βt – α – β(t–1) = β là hằng số và do đó nó có tính dừng. Do đó, xu hướng tuyến tính có thể được loại bỏ bằng cách lấy sai phân một lần. Nếu một chuỗi tăng trưởng theo lũy thừa với mức tăng không đổi, ln(Y<small>t</small>) sẽ có xu hướng tuyến tính và có thể lấy sai phân.

Một dạng khác mà trong đó tính khơng dừng thường xuất hiện đó là tính mùa. Tính khơng dừng trong các chuỗi theo tháng và theo quý thường có thể được loại bỏ bằng cách lấy sai phân thích hợp: Δ<small>4</small> = Y<small>t</small>

– Y đối với dữ liệu theo quý và Δ = Y – Y đối với dữ liệu theo

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

tháng.

<b>• Mơ hình ARIMA </b>

Đa số dữ liệu kinh tế theo chuỗi thời gian khơng có tính dừng mà có tính kết. Để nhận được dữ liệu có tính dừng, chúng ta phải sử dụng sai phân của dữ liệu.

+ Các bậc sai phân

- Sai phân bậc 0 là I(0): chính là dữ liệu gốc Y<small>t</small>. - Sai phân bậc 1 là I(1): w<small>t</small> = Y<small>t</small> – Y<small>t-1</small>.

- Sai phân bậc 2 là I(2): w<small>2</small>

<small>t</small> = w<small>t</small> – w<small>t-1</small>

- Sai phân bậc d ký hiệu I(d).

Mô hình ARMA(p,q) áp dụng cho I(d) được gọi là mô hình ARIMA(p,d,q).

<b>• Mơ hình SARIMA </b>

Trong mơ hình ARIMA nếu chúng ta tính tốn sai phân bậc nhất với độ trễ lớn hơn 1 để khử tính mùa vụ như sau w<small>t </small>= Y<small>t </small>– Y<small>t-s</small>, với s là số kỳ giữa các mùa thì mơ hình lúc này được gọi là SARIMA hay ARIMA có tính mùa vụ.

<b>1.1.2. Phương pháp chuyên gia </b>

<b>(1) Phương pháp tính hệ số vượt trước (hệ số đàn hồi) </b>

Phương pháp này xác định tỷ số của nhịp độ phát triển năng lượng điện với nhịp độ phát triển của nền kinh tế quốc dân. Phương pháp này giúp ta thấy được khuynh hướng phát triển của nhu cầu và sơ bộ cân đối nhu cầu này với nhịp độ phát triển của nền kinh tế quốc dân nói chung. Chẳng hạn như, trong giai đoạn 5 năm 1994 - 1999, sản lượng cơng nghiệp tăng 185%, cịn sản lượng điện năng cũng trong thời gian ấy tăng 194%, như vậy hệ số vượt trước sẽ là: K = 194 / 185 = 1,05

Như vậy phương pháp này chỉ nói lên xu thế phát triển với một

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

mức độ chuẩn xác nào đó và trong tương lai xu thế này còn chịu ảnh hưởng của các nhân tố biến động không lường trước khác như:

- Suất tiêu hao năng lượng với mỗi sản phẩm công nghiệp ngày càng giảm xuống do tiến bộ về mặt kỹ thuật và về mặt quản lý. - Điện năng ngày càng được sử dụng rộng rãi trong lĩnh vực

kinh tế xã hội và trong cuộc sống. - Cơ cấu kinh tế không ngừng thay đổi,…

Vì những lý do nêu trên nên hệ số giá trị vượt trước biến động khá nhiều, nên nếu dùng hệ số vượt trước (hệ số đàn hồi) để xác định nhu cầu điện năng ở năm dự báo sẽ khơng hồn tồn chuẩn xác.

<b>(2) Phương pháp tính trực tiếp </b>

Phương pháp này xác định nhu cầu điện năng của năm dự báo, dựa trên tổng sản lượng kinh tế của các ngành ở năm đó và suất tiêu hao điện năng đối với từng loại sản phẩm. Đối với những trường hợp khơng có suất tiêu hao điện năng thì xác định nhu cầu điện năng cho

<i>từng trường hợp cụ thể (như cơng suất điện trung bình cho 1 hộ gia đình, bệnh viện, trường học, ...). Phương pháp tính trực tiếp được sử </i>

dụng phổ biến ở những nước kinh tế phát triển có kế hoạch, ổn định và không bị khủng hoảng.

Phương pháp này có ưu điểm là tính tốn đơn giản và ngồi việc xác định tổng điện năng dự báo, chúng ta còn biết được tỷ lệ sử dụng điện năng trong các ngành kinh tế, chẳng hạn tỷ lệ dùng điện trong công nghiệp, nông nghiệp, dân dụng,.. cũng như xác định được nhu cầu điện năng ở các khu vực địa lý khác nhau, như vậy tạo điều kiện thuận lợi cho công tác thiết kế quy hoạch cung cấp điện. Tuy nhiên mức độ chính xác của phương pháp này bị phụ thuộc vào mức độ chính xác của tổng sản lượng các ngành kinh tế quốc dân trong tương lai, cũng như phụ thuộc vào suất tiêu hao điện. Phương pháp này

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

thường được áp dụng để dự báo nhu cầu điện năng với thời gian ngắn và trung bình.

<b>(3) Phương pháp ngoại suy theo thời gian </b>

Phương pháp ngoại suy theo thời gian nghiên cứu sự diễn biến của nhu cầu điện năng trong một thời gian quá khứ tương đối ổn định, tìm ra quy luật và áp dụng quy luật ấy ra để dự đoán cho tương lai. Phương pháp này chỉ cho ta kết quả chính xác nếu tương lai khơng có nhiều thay đổi lớn so với quá khứ và sự phát triển ở tương lai phải tuân theo đúng quy luật ở quá khứ.

<b>(4) Phương pháp tương quan </b>

Phương pháp này nghiên cứu mối tương quan giữa các thành phần kinh tế nhằm phát hiện những quan hệ về mặt định lượng của các tham số trong nền kinh tế quốc dân, dựa vào những phương pháp thống kê toán học. Cụ thể mục đích của chúng ta là dự báo nhu cầu điện năng, cho nên ta cần nghiên cứu sự tương quan giữa điện năng tiêu thụ với các chỉ tiêu kinh tế khác như tổng giá trị sản lượng công nghiệp, tổng giá trị sản lượng kinh tế quốc dân (đồng/năm).

<b>(5) Phương pháp đối chiếu so sánh </b>

Phương pháp này so sánh đối chiếu nhu cầu phát triển điện năng của các nước có hồn cảnh phát triển kinh tế - xã hội hoàn toàn tương tự. Phương pháp này chỉ nên dùng kiểm tra, xử lý lại kết quả dự báo mà ta đã dùng phương pháp ngoại suy và phương pháp tương quan.

<b>(6) Phương pháp chuyên gia </b>

Trong những năm gần đây người ta quan tâm nhiều và đánh giá cao những kinh nghiệm của các chuyên gia trong lĩnh vực dự báo, qui hoạch trong các ngành của nền kinh tế quốc dân, để dự báo các chỉ tiêu kinh tế. Chuyên gia ở đây chúng ta có thể hiểu là cá nhân, hay 1 cơng trình kết quả tính tốn dự báo của 1 viện nghiên cứu hay cơng

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

trình nào đó đã thực hiện.

<b>1.1.3. Trí tuệ nhân tạo, học máy </b>

Trí tuệ nhân tạo là một lĩnh vực nghiên cứu tương đối mới. Thuật tốn tính tốn thường được sử dụng để chỉ các lĩnh vực của hệ thống mờ, mạng nơ ron nhân tạo (ANN) và học máy.

<b>(1) Fuzzy logic </b>

Một hệ thống logic mờ với việc giải mờ có thể xác định và gần đúng bất kỳ hệ thống động không xác định nào (ở đây là tải) trên thiết lập nhỏ gọn đến độ chính xác tùy ý. Liu [9] đã quan sát thấy rằng một hệ thống logic mờ có khả năng tuyệt vời trong việc vẽ các điểm tương đồng từ dữ liệu khổng lồ.

Trình dự báo dựa trên logic mờ hoạt động theo hai giai đoạn: đào tạo và dự báo trực tiếp. Trong giai đoạn đào tạo, dữ liệu tải quá khứ được sử dụng để đào tạo một bộ đếm thời gian dựa trên mô-đun 2m đầu vào, 2n đầu ra để tạo cơ sở dữ liệu mẫu và cơ sở nguyên tắc mờ bằng cách sử dụng sự khác biệt thứ nhất và thứ hai của dữ liệu. Sau khi đào tạo đủ, nó sẽ được liên kết với một bộ điều khiển để dự đoán thay đổi tải trực tuyến. Nếu có thể tìm thấy mơ hình phù hợp nhất với khả năng cao nhất, thì mơ hình đầu ra sẽ được tạo ra thông qua một phần mềm giải mờ centroid [10] – [23].

<b>(2) Neural networks </b>

Mạng thần kinh được mô phỏng theo nguyên tắc hoạt động cơ bản của bộ não con người. Chúng bao gồm một vài nơ-ron, một nơ-ron nhận được thông tin về các nút đầu vào và tổng hợp thơng tin. Sau đó, nó xác định kích hoạt của nó và truyền phản ứng của nó qua nút đầu ra cho các nơ-ron khác. Mạng thần kinh thường được áp dụng cho dự báo tải (xem ví dụ Hippert và cộng sự [24] để kiểm tra).

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

Hình 1.1 – Mạng nơ-ron truyền thẳng

Một mạng nơ-ron truyền thẳng bao gồm một vài lớp kế tiếp các nơ-ron với một một nơ-ron đầu vào, một số lớp ẩn và một lớp đầu ra, các nơ-ron được kết nối bằng các vectơ trọng số. Phương pháp học cơ bản hoặc điều chỉnh trọng số là sự truyền ngược trở lại giá trị lỗi và điều chỉnh trọng số cho phù hợp [25] – [34].

<b>(3) Genetic algorithms </b>

Các thuật toán di truyền (GAs) đại diện cho một cách tiếp cận mạnh mẽ và có hiệu quả cao để phát triển cho các vấn đề tối ưu hoá tổ hợp quy mơ lớn. Nói chung, GA mã hố vấn đề thành một tập hợp các chuỗi, mỗi chuỗi gồm một vài bit, sau đó hoạt động trên các chuỗi để mô phỏng q trình tiến hóa [35] – [42]. Trong lĩnh vực STLF, có rất ít phương pháp dự báo tải dựa trên GA đã được báo cáo nhưng kết quả đáng khích lệ đã xuất hiện [43] – [44]. Gần đây, Srinivasan [45] – [47] đã sử dụng một GA để phát triển cấu trúc mạng thần kinh tối ưu và kết nối trọng lượng cho một ngày trước vấn đề dự báo tải điện.

<b>(4) Mơ hình Bộ hồi quy dựa theo vector hỗ trợ – Support vector regression (SVR) </b>

Ý tưởng cơ bản của SVR là ánh xạ không gian đầu vào sang một

</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">

không gian đặc trưng nhiều chiều mà ở đó, ta có thể áp dụng được

<i>hồi quy tuyến tính (mà nếu ta áp dụng trực tiếp hồi quy tuyến tính thì khơng hiệu quả). </i>

Đặc điểm của SVR là cho ta một giải pháp thưa (sparse solution); nghĩa là để xây dựng được hàm hồi quy, ta không cần phải sử dụng hết tất cả các điểm dữ liệu trong bộ huấn luyện. Những điểm có đóng góp vào việc xây dựng hàm hồi quy được gọi là những Support Vector. Việc phân lớp cho một điểm dữ liệu mới sẽ chỉ phụ thuộc vào các support vector.

Hình 1.2 – Biến đổi không gian dữ liệu sang không gian đặc trưng (thủ thuật Kernel)

<i>x </i>

là véc tơ đầu vào;  )(<i>x R<sup>m</sup></i> là véc tơ đặc trưng;  làm hàm ánh xạ từ không gian đầu vào sang không gian đặc trưng [48] – [52]. Như vậy, mục tiêu của việc huấn luyện SVR là tìm ra được w và b.

Cho tập huấn luyện {(x1, t1), (x2, t2), …, (xN, tN)}

<i>R</i>

<i><sup>n</sup></i>

<i>R</i>

.

<i>Với bài toán hồi quy đơn giản, để tìm w và b ta phải tối thiểu hóa </i>

hàm lỗi chuẩn hóa:

</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27">

với  là hằng số chuẩn hóa

Để có được một giải pháp thưa, ta sẽ thay hàm lỗi trên bằng hàm

<i>lỗi ε-insensitive. Đặc điểm của hàm lỗi này là nếu trị tuyệt đối của sự </i>

sai khác giữa giá trị dự đốn y(x) và giá trị đích nhỏ hơn ε (với ε> 0) thì nó coi như độ lỗi bằng 0.

Như vậy bây giờ, ta phải tối thiểu hóa hàm lỗi chuẩn hóa sau:

( , C là hằng số chuẩn hóa giống như  nhưng được nhân với hàm lỗi thay vì

<i><sub>w</sub></i>

<sup>2</sup>.

Để cho phép một số điểm nằm ngoài ống ε, ta sẽ đưa thêm các biến lỏng (slack variable) vào. Đối với mỗi điểm dữ liệu

<i>x</i>

<i><sub>n</sub></i>, ta cần hai biến lỏng

<i><sub>n</sub></i>

<sub>0</sub>

ˆ 

<i><sub>n</sub></i>

0

, trong đó

<i><sub>n</sub></i>

<sub>0</sub>

ứng với điểm mà

+  ( <i><sub>n</sub></i>)

<i>t</i> (nằm ngoài và phía trên ống) và

ˆ 

<i><sub>n</sub></i>

0

ứng với điểm mà <i>t<sub>n</sub></i> <i>y</i>(<i>x<sub>n</sub></i>)−

(nằm ngồi và phía dưới ống).

Hình 1.3 – Minh họa cho các biến lỏng<i><small>n</small></i>

Điều kiện để một điểm đích nằm trong ống là:

<i>y</i>

với y<small>n</small> = y(x<small>n</small>). Với việc sử dụng các biến lỏng, ta cho phép các các điểm đích nằm ngoài ống (ứng với các biến lỏng > 0) và như thế thì điều kiện bây giờ sẽ là:

</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">

Dùng hàm Lagrange và điều kiện Karush-Kuhn-Tucker, ta có bài tốn tối ưu hóa tương đương: nào thỏa điều kiện Mercer thì đều có thể được dùng làm hàm nhân. Hàm nhân được sử dụng phổ biến nhất là hàm

Như vậy, với SVR sử dụng hàm lỗi ε-insensitive và hàm nhân Gaussian ta có ba tham số cần tìm: hệ số chuẩn hóa C, tham số  của hàm nhân Gaussian và độ rộng của ống ε [53] – [55]. Cả ba tham số

</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">

này đều ảnh hưởng đến độ chính xác dự đốn của mơ hình và cần phải chọn lựa kỹ càng. Nếu C quá lớn thì sẽ ưu tiên vào phần độ lỗi huấn luyện, dẫn đến mơ hình phức tạp, dễ bị q khớp. Cịn nếu C quá nhỏ thì lại ưu tiên vào phần độ phức tạp mơ hình, dẫn đến mơ hình q đơn giản, giảm độ chính xác dự đốn. Ý nghĩa của ε cũng tương tự C. Nếu ε q lớn thì có ít vectơ hỗ trợ, làm cho mơ hình q đơn giản. Ngược lại, nếu ε q nhỏ thì có nhiều vectơ hỗ trợ, dẫn đến mơ hình phức tạp, dễ bị q khớp. Tham số  phản ánh mối tương quan giữa các vectơ hỗ trợ nên cũng ảnh hưởng đến độ chính xác dự đốn của mơ hình.

<b>(5) Mơ hình Rừng ngẫu nhiên (Random Forest Regression) </b>

RF là một bộ các cây phân loại và hồi qui (CART), được đưa ra bởi Breiman (2001) [56]. Trong RF, mẫu huấn luyện được đặt cho một nhà phân loại cơ bản được xây dựng bằng cách sử dụng thuật toán Bagging [57]. Khi xây dựng một cơ sở phân loại, các nút bên trong được kết hợp với một tập hợp thuộc tính ứng cử viên ngẫu nhiên.

Trong CART truyền thống, mỗi nút bên trong là tập con của tập dữ liệu ban đầu và nút gốc chứa tất cả dữ liệu ban đầu. Các rừng ngẫu nhiên để hồi quy được hình thành bằng cách hình thành cây dựa vào một vector ngẫu nhiên sao cho cây tiên đốn có các giá trị số cao hơn so với các nhãn lớp. Tập huấn luyện được rút ra một cách độc lập từ sự phân bố của vector ngẫu nhiên, các dự đốn rừng ngẫu nhiên được hình thành bằng cách lấy trung bình trên k của cây. Giải thuật rừng ngẫu nhiên sinh ra mơ hình có độ chính xác cao đáp ứng được u cầu thực tiễn cho vấn đề phân loại, hồi qui [58] – [63].

<b>1.2. Các yếu tố tác động đến dự báo phụ tải ngắn hạn </b>

Dự báo phụ tải ngắn hạn trong vận hành thị trường điện thường là

</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">

dự báo phụ tải cho ngày tới, tuần tới với chu kỳ 60/30 phút, nó được chia thành các loại ngày trong tuần, chẳng hạn như: ngày bình thường (thứ ba đến thứ 6); ngày thứ 2; ngày thứ 7; ngày chủ nhật, các ngày lễ, Tết (Dương lịch và Nguyên Đán); các kỳ nghỉ trong năm. Mỗi loại ngày có một đặc điểm hình thái riêng của nó, do đó mơ hình dự báo được thiết lập phải làm sao phản ánh được các đặc tính này.

Các mẫu phụ tải điện bao gồm các yếu tố tiềm ẩn, nó thường có xu hướng tương đồng mơ hình tải trước đó, tuy nhiên, nó sẽ dẫn đến dự đoán sai giữa các ngày tiếp theo nếu kiểu ngày khác so với ngày trước đó hoặc có một sự kiện nào đó tác động. Ngồi ra, sự biến đổi theo mùa, xu thế khí tượng học (như El nino, La nina) cũng được xem xét cẩn thận.

Các biến thời tiết có ảnh hưởng đáng kể đến nhu cầu tải. Nhiều biến thời tiết có thể được xem xét trong dự báo tải (nhiệt độ, tốc độ gió, độ che phủ mây, độ ẩm), nhưng ảnh hưởng của chúng đến nhu cầu tải là khác nhau. Theo nhiều tác giả, nhiệt độ là một biến được chấp nhận rộng rãi trong dự báo tải điện. Tuy nhiên, ở đây cần phải cẩn thận vì dự báo nhiệt độ là một vấn đề phức tạp hơn nhiều so với dự báo tải điện và nhiệt độ ước tính được sử dụng cho đầu vào thay vì số thực. Tuy nhiên, không phải lúc nào nhiệt độ cũng là sự lựa chọn tốt cho đầu vào dự báo, đơi khi có thể làm giảm độ chính xác của kết quả dự báo.

Ngoài ra, đối với các nước Châu Á có sử dụng lịch âm thì một vấn đề cần được quan tâm và khó dự đốn nhất đó chính là các ngày lễ, Tết Nguyên Đán (thường rơi vào các ngày cuối tháng 1 hoặc đầu tháng 2 dương lịch). Thường kết quả dự báo giai đoạn này có sai số lớn, do có sự sai lệch chu kỳ phụ tải giữa ngày dương lịch và ngày âm lịch.

</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">

Đối với các bài toán dự báo trước đây, các tác giả thường lấy giá trị quá khứ của bộ dữ liệu như: phụ tải ngày trước, giờ trước, trung bình của tuần trước,… để làm dữ liệu đầu vào huấn luyện. Như trình bày trên, do đặc thù là nước sử dụng cả lịch âm và lịch dương nên trên thực tế việc sử dụng các dữ liệu đầu vào này sẽ bị ảnh hưởng rất lớn do sự chênh lệch ngày âm và ngày dương, cũng như làm cho kết quả dự báo bị ảnh hưởng rất nhiều, nhất là trong các tháng 01 và 02. Quan sát biểu đồ phụ tải của tháng 01 và tháng 02, chúng ta sẽ thấy có sự biến động rất lớn về hình dáng biểu đồ qua các năm, làm cho việc sử dụng các dữ liệu quá khứ để dự báo cho khoảng thời gian này là hết sức phức tạp. Trên thực tế, các thuật toán khi áp dụng để dự báo cho Việt Nam đều phải thực hiện qua một khâu trung gian đó là qui đổi các tháng này thành các tháng thông thường và sau khi chạy kết quả dự báo sẽ qui đổi ngược lại hoặc là chấp nhận sai số lớn. Các phần mềm thương mại do nước ngoài cung cấp đều gặp rắc rối này.

Thêm nữa, với sự tác động của biến đổi khí hậu tồn cầu thì các số liệu dự báo thời tiết gần đây hầu như không chuẩn xác và khoảng thời gian dự báo tin cậy cũng rất ngắn chỉ từ 05 đến 07 ngày, khó đáp ứng yêu cầu ngày càng cao của các qui định thị trường điện bán buôn cạnh tranh (các Tổng công ty Điện lực phải công bố bảng chào Qc tháng N+1 24 chu kỳ trước ngày 20 của tháng N,…).

<b>1.3. Mục tiêu của luận án </b>

<i><b>Luận án đặt mục tiêu xây dựng Mơ hình kết hợp Biểu đồ phụ tải </b></i>

<i>chuẩn hóa đơn vị (SLP) – Support Vector Regression (SVR) để giải quyết các vấn đề khó khăn tác động đến các mơ hình dự báo phụ tải ngắn hạn nêu trên và đáp ứng các yêu cầu về dự báo ngắn hạn của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương. Đồng thời, áp </i>

dụng giải thuật này vào thực tế dự báo ngắn hạn của EVNHCMC,

</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32">

cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện cạnh tranh, cũng như đánh giá, hiệu chỉnh kết quả dự báo Q<small>c</small> để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang về lợi nhuận cao nhất từ thị trường.

<b>1.4. Nhiệm vụ và giới hạn của luận án </b>

Một số vấn đề ra cần phải giải quyết khi nghiên cứu như sau: - Nghiên cứu các đặc tính, các thành phần của chuỗi dữ liệu quá khứ điện năng ghi nhận được theo năm, theo tháng, theo ngày và theo giờ (thành phần xu hướng, thành phần chu kỳ, thành phần bất qui tắc và thành phần theo mùa).

- Nghiên cứu các kỹ thuật ước lượng lại dữ liệu bị lỗi, thiếu và sai sót.

- Các mơ hình dự báo phụ tải điện.

- Nghiên cứu các mô hình dự báo tiên tiến trên thế giới để xây dựng giải thuật mới để áp dụng dự báo phụ tải theo từng tháng/năm; dự báo ngày/tháng và dự báo phụ tải 24 giờ/ngày, có xem xét tác động của yếu tố thời tiết và các yếu tố tác động khác (nếu có), tạo tiền đề để áp dụng trong dự báo thị trường điện phân phối và bán lẻ cạnh tranh.

- Đánh giá sự ảnh hưởng của thị trường điện đến công tác dự báo nhu cầu phụ tải nhằm đảm bảo hạn chế rủi ro, tối đa hóa lợi nhuận của hoạt động Sản xuất – Kinh doanh các Tổng công ty Điện lực phân phối trong môi trường thị trường điện.

<b>1.5. Phương pháp nghiên cứu </b>

- Thống kê, tổng hợp và xử lý các số liệu điện thương phẩm, công suất cực đại – cực tiểu (Pmax – Pmin), tốc độ phát triển điện, tốc độ tăng trưởng của nền kinh tế, số liệu thống kê nhiệt độ thời tiết, giá điện các thành phần,… dữ liệu quá khứ điện năng ghi nhận được

</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33">

theo năm, theo tháng, theo ngày và theo giờ trong các năm vừa qua (từ khoảng 4 – 5 năm).

- Xử lý các thành phần của chuỗi dữ liệu quá khứ điện năng ghi nhận được theo năm, theo tháng, theo ngày và theo giờ để xác định các thành phần xu hướng, thành phần chu kỳ, thành phần bất qui tắc và thành phần theo mùa.

- Nghiên cứu mơ hình thống kê Box-Jenkin (SARIMA), nghiên cứu các mô hình học máy tiên tiến như: Neural Network, Support Vector Regression, Random Forest,… để xây dựng mơ hình dự báo (dự báo ngắn hạn, trung hạn) theo yêu cầu của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương.

- Nghiên cứu và đánh giá sự ảnh hưởng thị trường điện đến việc dự báo nhu cầu phụ tải điện. Đồng thời, xác định các mối quan hệ tác động ảnh hưởng đến các thành phần phụ tải, dự báo xu hướng để xây dựng kế hoạch phát triển dài hạn.

- Các modules về xử lý dữ liệu, về các giải thuật dự báo đều được chính tác giả lặp trình bằng ngơn ngữ Matlab 2017; Bộ dữ liệu sử dụng trong luận án là bộ dữ liệu được thu thập trong quá trình vận hành hệ thống điện của EVNHCM và dữ liệu vận hành Thị trường điện bán buôn (VWEM) của A0;

<b>1.6. Đóng góp của luận án </b>

- Luận án đã nghiên cứu, xây dựng được công cụ tự động ước

<i>lượng các dữ liệu bị lỗi (dữ liệu thiếu, sai sót, ngoại lai,…) mà trước </i>

đây phải thực hiện thực một cách thủ công. Đã đề xuất Mơ hình kết hợp Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) góp một phần khơng nhỏ trong kỹ thuật ước lượng lại dữ liệu bị lỗi.

</div><span class="text_page_counter">Trang 34</span><div class="page_container" data-page="34">

- Luận án đã xây dựng thành công giải thuật mới là sử dụng Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nó giải quyết được câu chuyện chênh lệch ngày âm và ngày dương, các ngày lễ hội, ngày đặc biệt trong năm và nhất là các ngày trong các tháng 01 và 02 (tháng có Tết âm lịch);

- Luận án cũng đã thử nghiệm được nhiều mơ hình dự báo tiên tiến theo xu hướng thế giới như: Kỹ thuật thống kê – mơ hình SARIMA; Trí tuệ nhân tạo (học máy) – mơ hình Support Vector Regression (SVR); mạng Neural Network, Feedforward Networks; Rừng ngẫu nhiên (Random Forest); Qua đó, đã đánh giá kết quả các giải thuật xây dựng đường cong hồi qui của từng mơ hình, với những bộ trọng số khác nhau, để từ đó lựa chọn được mơ hình có sai số phù hợp làm hàm dự báo STLF;

- Ngồi ra, luận án cũng đã có những phân tích sự tác động của giá thị trường SMP và các hợp đồng CFD đến các kết quả dự báo Q<small>c</small>

để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang về lợi nhuận cao nhất;

<b>1.7. Ý nghĩa thực tiễn của luận án </b>

Việc dự báo nhu cầu phụ tải điện có ý nghĩa khác nhau đối với các đơn vị có chức năng khác nhau khi tham gia vào thị trường điện, cụ thể:

- Xây dựng được cho ngành điện thêm một công cụ dự báo mang tính ứng dụng cao giải quyết các vấn đề của các nghiên cứu trước đây: vẫn còn nặng về nghiên cứu phương pháp luận và học thuật, chưa đi vào số liệu cụ thể, sai số dự báo còn cao và nhất là khả năng áp dụng còn nhiều giới hạn; Áp dụng giải thuật này vào thực tế

</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35">

dự báo ngắn hạn của EVNHCMC, cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện cạnh tranh;

- Các thành viên tham gia thị trường cần phải dự báo nhu cầu phụ tải trước để lên kế hoạch sản xuất kinh doanh, cũng như lập kế hoạch phân bổ nguồn vốn đầu tư một cách hợp lý để tối ưu hoá lợi nhuận, hạn chế rủi ro;

- Những đơn vị điều hành thị trường điện cũng có thể vận dụng dự báo nhu cầu phụ tải và giá điện để xác định phản ứng của thị trường tại vào các thời điểm khác nhau từ đó có chiến lược điều tiết thị trường một cách hợp lý;

<b>1.8. Bố cục của luận án </b>

Luận án được xây dựng với bố cục như sau: - CHƯƠNG I: TỔNG QUAN

Chương này cho biết tổng quan về các kỹ thuật dự báo, mục tiêu nghiên cứu của luận án, phạm vi và phương pháp nghiên cứu, và những điểm mới của luận án. Bên cạnh đó, những giá trị thực tiễn từ luận án nghiên cứu cũng đã được đề cập đến.

- CHƯƠNG II: CHUỖI DỮ LIỆU VÀ XỬ LÝ GIÁ TRỊ THIẾU Chương này đề cập đến việc thu thập và phân tích dữ liệu, cũng như thảo luận về các vấn đề khác nhau gây ra bởi các giá trị còn thiếu và những cách khác nhau mà chúng ta có thể giải quyết. Đồng thời, chương này cũng sẽ đề xuất phương pháp xây dựng đường cong hồi qui bằng giải thuật huấn luyện SVR (Support Vector Regression), từ đó ước lượng, xử lý các vấn đề thiếu, sai sót dữ liệu trong q trình nghiên cứu, dự báo phụ tải điện.

- CHƯƠNG III: NGHIÊN CỨU PHỤ TẢI VÀ BIỂU ĐỒ CHUẨN HÓA ĐƠN VỊ

Chương này đề cập đến việc nghiên cứu/phân tích phụ tải để hiểu

</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36">

<i>rõ hơn về những gì chúng ta đang cố gắng dự báo (xu hướng, tổng nhu cầu, sự khác biệt các vùng, đặc tính tải,...), kiểm tra bất kỳ biến </i>

động đặc thù nào đó và là cách tuyệt vời để kiểm tra dữ liệu sai. Đồng thời, tác giả đã xây dựng khái niệm Biểu đồ phụ tải chuẩn hóa

<i>đơn vị (Standardized Load Profiles - SLP) và Ứng dụng xử lý dữ liệu </i>

thiếu bằng Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) theo cấp độ theo 24 chu kỳ/ ngày.

- CHƯƠNG IV: XÂY DỰNG MƠ HÌNH DỰ BÁO NGẮN HẠN

Dự báo phụ tải ngắn hạn (STLF) đóng một vai trò quan trọng trong việc xây dựng các chiến lược kinh doanh, đảm bảo tin cậy và an toàn cho hệ thống điện. Chương này đã đề xuất giải thuật mới là Mơ hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) - Support

<i>Vector Regression (SVR) để làm hàm dự báo STLF (kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực). </i>

Ngoải ra, trong chương này tác giả còn chạy thử nghiệm được nhiều mơ hình dự báo tiên tiến theo xu hướng thế giới như: Kỹ thuật thống kê – mơ hình SARIMA; Trí tuệ nhân tạo (học máy) – mạng Neural Network, Feedforward Networks; Rừng ngẫu nhiên (Random Forest) để so sánh đánh giá, để từ đó lựa chọn được mơ hình có sai số phù hợp làm hàm dự báo STLF.

- CHƯƠNG V – DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG ĐIỆN CẠNH TRANH CỦA VIỆT NAM

Chương này cung cấp các thông tin tổng quan về thị trường điện cạnh tranh Việt Nam và tác giả cũng đã chạy các kết quả dự báo dài hạn (5-10 năm), dự báo theo tháng/ năm và kết quả dự báo ngắn hạn 24/48 chu kỳ của 365 ngày/năm theo đúng qui định của thị trường cho Tổng công ty Điện lực TP.HCM.

</div><span class="text_page_counter">Trang 37</span><div class="page_container" data-page="37">

Chương này cũng đánh giá việc áp dụng giải thuật này vào thực tế dự báo ngắn hạn của EVNHCMC trong các năm vừa qua (đánh giá thông qua sai số dự báo theo chu kỳ/ngày/tuần/tháng/năm), cũng như tác giả đã có những phân tích thật sự sâu về tác động của giá thị trường SMP và các hợp đồng CFD đến các kết quả dự báo Q<small>c</small> để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến dộng của thị trường để mang về lợi nhuận cao nhất.

- CHƯƠNG VI – KẾT LUẬN

Chương này tổng hợp các nội dung đã nghiên cứu và trình bày trong luận án, theo đó đã tóm lược các điểm mới và hạn chế trong quá trình nghiên cứu, cũng như trình bày hướng phát triển tiếp theo của luận án.

</div><span class="text_page_counter">Trang 38</span><div class="page_container" data-page="38">

<b>CHƯƠNG II: CHUỖI DỮ LIỆU VÀ XỬ LÝ GIÁ TRỊ THIẾU 2.1. CHUỖI DỮ LIỆU </b>

<b>2.1.1. Xác định yêu cầu dữ liệu </b>

Điều đầu tiên cần thực hiện khi lập kế hoạch thu thập dữ liệu là phải xác định xem các dữ liệu nào là cần thiết để có thể giải quyết bài toán. Về tổng thể, có thể cần sự trợ giúp của các chuyên gia trong

<i>lĩnh vực của bài toán cần giải quyết. Cần biết: i) Các dữ liệu chắc chắn có liên quan đến bài toán; ii) Các dữ liệu nào có thể liên quan; iii) Các dữ liệu nào là phụ trợ. Các dữ liệu có liên quan và có thể liên </i>

quan đến bài toán cần phải được xem là các đầu vào cho hệ thống.

<b>2.1.2. Xác định nguồn dữ liệu </b>

Bước kế tiếp là quyết định nơi sẽ lấy dữ liệu, điều này cho phép ta xác định được các ước lượng thực tế về những khó khăn và phí tổn cho việc thu thập dữ liệu. Nếu ứng dụng yêu cầu các dữ liệu thời gian thực, những ước lượng này cần tính đến khả năng chuyển đổi các dữ liệu tương tự thành dạng số. Trong một số trường hợp, ta có thể chọn lựa dữ liệu mơ phỏng từ các tình huống thực tế. Tuy nhiên, cần phải quan tâm đến độ chính xác và khả năng thể hiện của dữ liệu đối với các trường hợp cụ thể.

<b>2.1.3. Xác định lượng dữ liệu </b>

Ta cần phải ước đoán số lượng dữ liệu cần thiết để có thể sử dụng trong việc xây dựng giải thuật. Nếu lấy q ít dữ liệu thì những dữ liệu này sẽ khơng thể phản ánh tồn bộ các thuộc tính mà giải thuật cần xử lý. Mặt khác, cũng không nên đưa vào quá nhiều dữ liệu đầu vào làm cho giải thuật thêm phức tạp.

Việc định lượng gần đúng lượng dữ liệu cần đưa vào xử lý là hết sức cần thiết. Thơng thường, dữ liệu thường thiếu hồn chỉnh (trong

</div><span class="text_page_counter">Trang 39</span><div class="page_container" data-page="39">

một số trường hợp dữ liệu ghi nhận bị đứt quản do thiết bị ghi nhận bị sự cố hoặc nhân viên vận hành quên ghi nhận), do đó nếu muốn giải thuật có khả năng thực hiện được những điều mà ta mong đợi thì nó cần phải được xử lý với lượng dữ liệu lớn hơn.

<b>2.2. DỮ LIỆU THIẾU TRONG NGHIÊN CỨU PHỤ TẢI ĐIỆN </b>

Nghiên cứu phụ tải là hoạt động phân tích biểu đồ phụ tải hệ thống điện nhằm chia thành biểu đồ của các thành phần phụ tải, phân nhóm phụ tải, các khách hàng sử dụng điện cuối cùng và các công nghệ sử dụng điện, để đưa ra các thông tin quan trọng như: Công suất và thời gian xuất hiện phụ tải đỉnh; Xu hướng tăng trưởng của Phụ tải đỉnh và Hệ số phụ tải; Chênh lệch phụ tải cao/thấp điểm của hệ thống; Lập kế hoạch, thiết kế và triển khai các chương trình DSM; Nâng cao độ chính xác của dự báo phụ tải ngắn hạn;....

Đây là một hoạt động chuyên sâu về phân tích số liệu, trong đó dữ liệu được thu thập thường là rất lớn, thơng qua các hình thức thu thập tự động hoặc thủ cơng. Do đó dữ liệu bị lỗi là rất khó tránh khỏi, bởi có rất nhiều nguyên nhân như: sự cố đường truyền, sự cố thiết bị đo đếm, sự cố thiết bị lưu trữ hay do việc xữ lý dữ liệu thủ công không đúng phương pháp, ...

<b>2.2.1. Phương pháp xử lý dữ liệu thiếu trong nghiên cứu phụ tải điện </b>

Một số phương pháp ước lượng số liệu đo đếm của các phụ tải điện bị lỗi trong quá trình thu thập dữ liệu của các Công ty điện lực thường được sử dụng như sau [99]:

- Nội suy tuyến tính: nội suy từ đường đặc tính xu thế tiêu thụ điện; - Ngày tương đồng: sử dụng dữ liệu ngày tương đồng của tuần hiện

tại hoặc tuần trước;

</div><span class="text_page_counter">Trang 40</span><div class="page_container" data-page="40">

- Tự động ước lượng: sử dụng trong trường hợp dữ liệu bị thiếu không quá bảy (07) ngày;

- Kiểm tra trực quan đồ thị: để biết được dữ liệu bị sai và quyết định về dữ liệu được ước lượng;

- Hiệu chỉnh ước lượng số liệu thủ công: được sử dụng khi dữ liệu bị thiếu nhiều hơn bảy (07) ngày;

- Hiệu chỉnh ước lượng giá trị trung bình các tuần của ngày tham chiếu: dựa vào dữ liệu của bốn (04) tuần gần nhất;

Tuy nhiên, các cách làm này đều thực hiện một cách thủ công và phụ thuộc rất nhiều vào năng lực kinh nghiệm của chuyên gia thực hiện ước lượng.

Luận án xin đề xuất một phương pháp xử lý dữ liệu thiếu bằng cách xây dựng các xây dựng các mơ hình hồi quy tối ưu hóa các thông số tự động thông qua quá trình huấn luyện học máy Support Vector Regression (SVR), từ đó ước lượng lại các dữ liệu đã mất hoặc khơng ghi nhận được trong q trình đo đếm.

<b>2.2.2. Kết quả nghiên cứu </b>

<b>a) Xây dựng mơ hình hồi quy cho việc dự đốn các giá trị thiếu </b>

Dựa trên mối quan hệ tuyến tính của ba thành phần số liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t<small>0</small>), luận án đề xuất giải thuật xây dựng mơ hình hồi qui dự đốn các giá trị thiếu cho chuỗi dữ liệu điện năng tiêu thụ (Atổng), trên cơ sở ràng buộc của bộ dữ liệu huấn luyện là thành phần số liệu công suất (Pmax) và nhiệt độ (t<small>0</small>). Yêu cầu đặt ra là thực hiện việc xử lý các dữ liệu điện năng tiêu thụ bị lỗi trong quá trình đo đếm theo từng giờ trong ngày hoặc tổng điện năng tiêu thụ tổng từng ngày theo tháng. Giải thuật như sau:

</div>

×