BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------
NGUYỄN VIỆT HƯNG
SỬ DỤNG PHƯƠNG PHÁP ĐA HỒI QUY ĐỂ DỰ BÁO
NHU CẦU PHỤ TẢI TỈNH QUẢNG NINH NĂM 2025
LUẬN VĂN THẠC SĨ KỸ THUẬT
CHUYÊN NGÀNH: KỸ THUẬT ĐIỆN - HỆ THỐNG ĐIỆN
HÀ NỘI - 2014
Luận văn cao học
Dự báo nhu cầu điện năng
MỤC LỤC
LỜI CAM ĐOAN ……………………………………………………………. 6
LỜI CẢM ƠN ………………………………………………………………..
7
PHẦN MỞ ĐẦU ….………………………………………………………….
8
CHƯƠNG I. TỔNG QUAN VỀ PHƯƠNG PHÁP KINH TẾ LƯỢNG …
10
1.1. Giới thiệu về phương pháp kinh tế lượng ……………………………. 10
1.2. Phương pháp luận của kinh tế lượng ……………………………….... 10
1.3. Dự báo với phân tích hồi quy …………………………………………. 12
1.3.1. Xây dựng các mô hình dự báo hồi quy ………………………………. 13
1.3.2. Mối tương quan giữa các biến số …………………………………….
14
1.3.3. Hồi quy tuyến tính đơn ……………………………………………….. 14
1.3.4. Kiểm tra sai số dự báo và mức độ phù hợp của mô hình dự báo …… 16
1.3.5. Dự báo khoảng và sai số chuẩn dự báo ……………………………… 19
1.4. Dự báo với phân tích hồi quy bội ……………………………………..
20
1.4.1. Phương trình hồi quy bội ……………………………………………..
21
1.4.2. Ước lượng các tham số bằng phương pháp bình phương cực tiểu …
22
1.4.3. Phương pháp bình phương nhỏ nhất tổng quát và thủ tục ước lượng
Grid Search (GS) ……………………………………………………...
23
1.4.4. Phân tích sai số dự báo và đánh giá mô hình ……………………….
26
1.4.5. Các biến số định tính (dummy variables) ……………………………
28
1.4.6. Tương quan giữa các biến độc lập …………………………………… 29
1.4.7. Lựa chọn phương trình hồi quy tốt nhất …………………………….
30
CHƯƠNG II. TÍNH TOÁN DỰ BÁO NHU CẦU ĐIỆN NĂNG DÙNG
PHẦN MỀM SIMPLE E ……………………………………………………
32
A. Giới thiệu các mô hình dự báo đã được áp dụng trong quy hoạch phát
triển điện lực của Việt Nam ………………………………………………… 32
2.1. Phương pháp trực tiếp ………………………………………………….
Nguyễn Việt Hưng
32
Khóa học 2012A
-1-
Luận văn cao học
Dự báo nhu cầu điện năng
2.2. Phương pháp gián tiếp ………………………………………………….
32
2.2.1. Phương pháp đàn hồi …………………………………………………. 32
2.2.2. Phương pháp cường độ điện năng ……………………………………
33
2.2.3. Phương pháp đa hồi quy ........................................................................
33
B. Giới thiệu phần mềm báo được áp dụng trong đề tài .............................. 34
B.1. Phần mềm Simple E(version 2004) ........................................................
34
2.3. Giới thiệu chung về phần mềm Simple E ...............................................
34
2.4. Những khái niệm cơ bản của Simple E ................................................... 35
2.5. Các dạng hàm áp dụng trong phần mềm Simple E …………………... 37
2.6. Các biến số trong phần mềm Simple E ………………………………... 39
2.7. Phân tích mô hình trong phần mềm Simple E ....................................... 39
2.8. Mô phỏng và dự báo trong phần mềm simple E ...................................
40
C. Áp dụng các phần mềm cho dự báo nhu cầu phụ tải điện ...................... 42
C.1. Áp dụng phần mềm Simple E cho dự báo nhu cầu phụ tải điện ........
42
2.9. Các bước tiến hành dự báo nhu cầu điện năng .....................................
42
2.10. Phân tích và xây dựng hàm cầu điện năng ..........................................
42
2.11 Ký hiệu các biến cụ thể sử dụng trong phần mềm Simple E ..............
43
2.12. Những ưu điểm của mô hình .................................................................
43
2.13. Hạn chế của mô hình .............................................................................. 44
CHƯƠNG III. TỔNG QUAN VỀ TÌNH HÌNH KINH TẾ - XÃ HỘI
TỈNH QUẢNG NINH ...................................................................................... 45
3.1. Hiện trạng phát triển kinh tế tỉnh Quảng Ninh ..................................... 45
3.2. Phương hướng phát triển kinh tế - xã hội tỉnh đến năm 2025 .............. 48
3.2.1. Mục tiêu phát triển kinh tế ……………………………………………. 48
3.2.2. Định hướng phát triển không gian đô thị và kết cấu hạ tầng ………..
49
3.2.2.1. Quy mô dân số ………………………………………………………..
49
3.2.2.2. Phát triển đô thị .................................................................................... 50
Nguyễn Việt Hưng
Khóa học 2012A
-2-
Luận văn cao học
Dự báo nhu cầu điện năng
3.2.2.3. Phát triển hệ thống cơ sở hạ tầng ……………………………………. 54
3.3.2. Phướng hướng phát triển các ngành kinh tế ………………………...
56
3.3.2.1. Ngành công nghiệp – tiểu thủ công nghiệp và xây dựng …………….. 56
3.3.2.2. Công nghiệp sản xuất vật liệu xây dựng ……………………………..
58
3.3.2.3. Ngành công nghiệp cơ khí và luyện kim ............................................... 59
3.3.2.4. Công nghiệp chế biến nông lâm thuỷ sản & Công nghiệp sản xuất
hàng tiêu dùng ...................................................................................................
62
3.3.2.5. Các ngành công nghiệp khác ...............................................................
62
3.3.2.6. Phát triển tiểu, thủ công nghiệp ...........................................................
62
3.3.2.7. Quy hoạch phát triển các khu, cụm công nghiệp tập trung .................. 62
3.2.3.8. Ngành thương mại, du lịch, dịch vụ .....................................................
70
3.2.3.9. Ngành nông lâm thủy sản ..................................................................... 71
3.2.4. Quan hệ giữa phát triển kinh tế - xã hội và phát triển điện lực ……..
72
CHƯƠNG IV. DỰ BÁO NHU CẦU PHỤ TẢI TỈNH QUẢNG NINH
ĐẾN NĂM 2025 BẰNG PHẦN MỀM SIMPLE E ....................................... 78
4.1. Dự báo nhu cầu điện điện năng theo các biến phụ thuộc …………….. 78
4.1.1. Tiến hành khai báo biến và nhập dữ liệu …………………………….. 78
4.1.2. Kết quả dự báo nhu cầu phụ tải tỉnh Quảng Ninh đến năm 2025
bằng phần mềm Simple E ……………………………………………………
89
4.2. Kiểm tra lại kết quả dự báo theo phương pháp ngoại suy ...................
91
4.2.1. Xác định hàm dự báo ………………………………………………….
91
4.2.2 Xác định các hệ số của hàm dự báo theo phương pháp bình phương
cực tiểu .............................................................................................................. 93
4.2.3 Nhận xét kết quả tính toán của các phương pháp dự báo ..................... 94
CHƯƠNG VI. KẾT LUẬN VÀ KIẾN NGHỊ ............................................... 96
Nguyễn Việt Hưng
Khóa học 2012A
-3-
Luận văn cao học
Dự báo nhu cầu điện năng
DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Sơ đồ phân tích và dự báo bằng phương pháp kinh tế lượng
Hình 2.1. Sơ đồ chu trình thực hiện tính toán bằng phần mềm Simple E
Hình 3.1. Biểu đồ điện thương phẩm tỉnh Quảng Ninh qua các năm 20002009
Hình 3.2. Cơ cấu điện năng tỉnh Quảng Ninh năm 2000
Hình 3.3. Cơ cấu điện năng tỉnh Quảng Ninh năm 2009
Hình 3.4. Biểu đồ phụ tải ngày điển hình tỉnh Quảng Ninh năm 2009
Hình 4.1. Nhập dữ liệu tại bảng Data
Hình 4.2. Nhập lệnh tại bảng Model
Hình 4.3. Hiển thị kết quả tại bảng Simulation
Nguyễn Việt Hưng
Khóa học 2012A
-4-
Luận văn cao học
Dự báo nhu cầu điện năng
DANH MỤC CÁC BẢNG BIỂU
Bảng 3.1. Một số chỉ tiêu kinh tế chủ yếu xã hội tỉnh Quảng Ninh 2005-2010
Bảng 3.2. Các chỉ tiêu kinh tế - xã hội tổng hợp tỉnh Quảng Ninh
giai đoạn đến 2020
Bảng 3.3. Dự báo dân số tỉnh Quảng Ninh giai đoạn đến 2020
Bảng 3.4. Quy hoạch phát triển sản lượng khai thác than khu vực tỉnh Quảng
Ninh
Bảng 3.5. Quy hoạch các khu công nghiệp tỉnh Quảng Ninh giai đoạn đến
2020
Bảng 3.6. Danh sách các cụm công nghiệp tỉnh Quảng Ninh giai đoạn đến
2015 (đã có QĐ phê duyệt và QH chi tiết)
Bảng 3.7. Cơ cấu điện năng tỉnh Quảng Ninh giai đoạn 2008 -2013 (MWh)
Bảng 3.8. Bảng tổng hợp chỉ tiêu phát triển kinh tế - xã hội tỉnh Quảng Ninh
giai đoạn đến 2025
Bảng 4.1. Bảng kết quả tính toán dự báo nhu cầu phụ tải tỉnh Quảng Ninh
Bảng 4.2. Điện năng tiêu thụ qua các năm của tỉnh Quảng Ninh
Bảng 4.3. Bảng tính toán các thông số
Bảng 4.4. Kết quả dự báo nhu cầu điện năng theo phương pháp ngoại suy
Bảng 4.5. So sánh kết quả dự báo giữa hai phương án
Nguyễn Việt Hưng
Khóa học 2012A
-5-
Luận văn cao học
Dự báo nhu cầu điện năng
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là công trình nghiên cứu của riêng cá nhân tôi,
các số liệu được tổng hợp từ nhiều nguồn tham khảo và qua liên hệ thực tế, tổng hợp
chính từ Sở Công Thương Quảng Ninh và Công ty Điện lực Quảng Ninh. Kết quả
trong luận văn là trung thực, không sao chép của bất kỳ luận văn nào trước đó.
Tôi xin hoàn toàn chịu trách nhiệm về nội dung của luận văn này.
Hà Nội, tháng 3 năm 2014
Tác giả luận văn
Nguyễn Việt Hưng
Nguyễn Việt Hưng
Khóa học 2012A
-6-
Luận văn cao học
Dự báo nhu cầu điện năng
LỜI CẢM ƠN
Trong quá trình thực hiện đề tài, bản thân tôi đã nỗ lực hết mình và được sự
hướng dẫn tận tình của các thầy, cô trong Bộ môn Hệ thống điện. Đặc biệt là PGS.TS
Nguyễn Lân Tráng, Thầy hướng dẫn trực tiếp cho tôi và có những chỉ dạy, góp ý vô
cùng quý báo để giúp tôi hoàn thành luận văn này.
Do thời gian thực hiện đề tài có hạn, trình độ chuyên môn về tin học và ngoại
ngữ của bản thân còn hạn chế nên luận văn còn nhiều khuyếm khuyết. Tôi rất mong
nhận được sự đóng góp quý báu của các thầy cô, bạn bè và đồng nghiệp trong ngành để
luận văn được hoàn thiện và áp dụng vào thực tế hiệu quả.
Tôi xin trân trọng cảm ơn các thầy cô trong Bộ môn Hệ thống điện - Viện Điện Trường Đại học Bách Khoa Hà Nội, Viện đào tạo sau đại học - Trường Đại học Bách
Khoa Hà Nội đã tạo điều kiện học tập, nghiên cứu cho tôi trong suốt quá trình thực
hiện tại trường.
Tôi xin trân trọng cảm ơn Ban lãnh đạo Công ty Điện lực Quảng Ninh, Sở Công
Thương Quảng Ninh đã tạo mọi điều kiện tốt nhất giúp tôi hoàn thành đề tài luận văn
này.
Xin trân trọng cảm ơn!
Tác giả
Nguyễn Việt Hưng
Nguyễn Việt Hưng
Khóa học 2012A
-7-
Luận văn cao học
Dự báo nhu cầu điện năng
PHẦN MỞ ĐẦU
Tỉnh Quảng Ninh đang có những thay đổi lớn về quy hoạch phát triển kinh tế xã
hội, hệ thống đô thị, giao thông và công nghiệp. Đây là một trong những cửa ngõ giao
thông quan trọng của vùng kinh tế trọng điểm Bắc Bộ đối với khu vực và quốc tế, một
khu vực phát triển năng động của kinh tế ven biển và biển, có tốc độ tăng trưởng cao
và bền vững, có thế và lực ngày càng lớn thúc đẩy sự phát triển và khả năng cạnh
tranh. Quảng Ninh đang đặt mục tiêu phát triển theo hướng công nghiệp hóa, hiện đại
hóa, kinh tế hướng mạnh về xuất khẩu. Phát huy tối đa thế mạnh về du lịch, giải quyết
hài hòa giữa phát triển du lịch với các lĩnh vực khác, trong đó ưư tiên phát triển du lịch
nhưng phải chú trọng giữ gìn cảnh quan, bảo vệ môi trường. Coi trọng hàng đầu việc
xây dựng kết cấu hạ tầng kỹ thuật hạ tầng xã hội để phát triển nhanh và bền vững hơn.
Để đáp ứng đầy đủ điện năng cho yêu cầu phát triển kinh tế xã hội, cũng như sự thay
đổi về quy hoạch tổng thể phát triển đô thị, phát triển hệ thống giao thông của tỉnh cần
thiết phải nghiên cứu, tính toán dự báo nhu cầu sử dụng điện trên phạm vi toàn tỉnh
nhằm đưa ra các giải pháp phát triển về nguồn cũng như lưới điện tối ưu nhất.
Từ trước đến nay, dự báo phụ tải dựa trên hệ số đàn hồi giữa nhu cầu điện và
GDP bằng phương pháp mô phỏng kịch bản trên cơ sở tham khảo các mô hình tương
tự từ một số nước đang phát triển của khu vực châu Á trong các thập kỷ 80-90 mà
không sử dụng kết quả trực tiếp từ nghiên cứu mối quan hệ giữa nhu cầu điện năng với
các yếu tố ảnh hưởng trực tiếp như tăng trưởng kinh tế, thu nhập, giá cả, giá các dạng
nhiên liệu thay thế trên cơ sở các số liệu thống kê trong quá khứ của nước ta là thiếu
chặt chẽ về mặt khoa học và sẽ không phản ảnh chính xác tốc độ tăng trưởng nhu cầu
điện trong giai đoạn phát triển sắp tới .
Việc áp dụng phương pháp chuyên gia (mô phỏng kịch bản phát triển) không phải
là sai mà chỉ thiếu chặt chẽ, bởi vì (ví dụ) tốc độ tăng trưởng kinh tế khoảng 7%/năm,
nếu xét đối với các nền kinh tế đã trải qua giai đoạn phát triển tương tự ta có thể nhận
Nguyễn Việt Hưng
Khóa học 2012A
-8-
Luận văn cao học
Dự báo nhu cầu điện năng
thấy tốc độ tăng nhu cầu điện năng sẽ rơi vào khoảng từ 11-19%/năm (không xét các
trường hợp đột biến có tính chất đặc thù đặc biệt), như vậy giải kinh nghiệm là quá
rộng, việc lựa chọn hệ số đàn hồi chính xác sẽ trở nên khó khăn và mang tính chủ
quan. Thông qua tính toán bằng phương pháp luận khoa học, chúng ta có thể thu hẹp
giải kinh nghiệm trên và qua đó việc lựa chọn sẽ chính xác hơn và độ sai lệch sẽ ít hơn.
Trong giai đoạn vừa qua, có một số năm tốc độ tăng trưởng phụ tải không phù
hợp với tỷ lệ tăng trưởng GDP. Việc không xác định nguyên nhân gây ra sự bất thường
trong tiêu thụ điện năng phụ tải sẽ làm cho công tác xây dựng kế hoạch năm và dự báo
phụ tải trung hạn, dài hạn thiếu độ tin cậy. Đặc biệt, nếu biết rõ nguyên nhân này có thể
sẽ cho các nhà làm chính sách ngành điện một công cụ điều tiết hữu hiệu vừa đảm bảo
phát triển kinh tế vừa điều tiết sự tăng trưởng điện năng.
Phân tích hồi quy là một công cụ mạnh mẽ và linh hoạt được sử dụng trong quá
trình nghiên cứu mối quan hệ giữa một biến phụ thuộc và nhiều biến độc lập nhằm
giúp ta hiểu tốt hơn và kiểm soát những sự kiện trong hiện tại cũng như có thể dự báo
tốt hơn về tương lai.
Đề tài sẽ tập trung vào phân tích và nghiên cứu phương pháp đa hồi quy và sử
dụng phần mềm Simple E để dự báo nhu cầu phụ tải của tỉnh Quảng Ninh đến năm
2025.
Nguyễn Việt Hưng
Khóa học 2012A
-9-
Luận văn cao học
Dự báo nhu cầu điện năng
CHƯƠNG I
TỔNG QUAN VỀ PHƯƠNG PHÁP KINH TẾ LƯỢNG
1.1. Giới thiệu về phương pháp kinh tế lượng
Phương pháp luận kinh tế lượng là phương pháp luận được hầu hết các nước trên
thế giới sử dụng trong dự báo phụ tải, đặc biệt đối với các nước chưa có hệ thống thống
kê và dự báo tốt về tương lai mức độ tiêu thụ, sử dụng và công nghệ của các thiết bị
tiêu thụ điện của các ngành. Đối với nước ta đến nay đã có cơ bản đầy đủ cơ sở dữ liệu
để nghiên cứu tính toán và triển khai áp dụng phương pháp luận này.
1.2. Phương pháp luận của kinh tế lượng
Phân tích kinh tế lượng được thực hiện theo các bước sau đây :
1. Nêu ra các gỉa thuyết về các mối quan hệ giữa các biến kinh tế. Chẳng hạn lý
thuyết kinh tế khảng định rằng mức tiêu dùng của các hộ gia đình về một loại hàng hoá
nào đó phụ thuộc theo quan hệ cùng chiều với thu nhập của họ, đồng thời phụ thuộc
theo quan hệ ngược chiều với giá của hàng hoá đó.
2. Thiết lập các mô hình toán học để mô tả mối quan hệ giũa các biến số này.
Chẳng hạn:
Q = 0 + 1 Y + 2 P + u
Trong đó:
Q: Lượng tiêu dùng về hàng hoá của một hộ gia đình,
Y: Thu nhập khả dụng của hộ gia đình,
P: Gía của hàng hoá,
0: Hệ số chặn,
1, 2: Hệ số góc,
u: Yếu tố ngẫu nhiên.
Sự tồn tại của yếu tố ngẫu nhiên bắt nguồn từ mối quan hệ giữa các biến kinh tế
nói chung là không chính xác.
Nguyễn Việt Hưng
Khóa học 2012A
- 10 -
Luận văn cao học
Dự báo nhu cầu điện năng
3. Thu thập số liệu: Để ước lượng các tham số của mô hình, cần phải thu thập số
liệu. Kinh tế lượng đòi hỏi kích thước mẫu khá lớn.
4. Ước lượng các tham số của mô hình nhằm nhận được số đo về mức ảnh hưởng
của các biến với các số liệu hiện có. Các ước lượng này là các kiểm định thực nghiệm
cho lý thuyết kinh tế.
5. Phân tích kết quả dựa trên lý thuyết kinh tế để phân tích và đánh giá kết quả
nhận được. Xét xem các kết qủa nhận được có phù hợp với lý thuyết kinh tế không,
kiểm định các giả thiết thống kê về các ước lượng nhận được.
Trong mô hình:
Q = 0 + 1 Y + 2 P + u
Nếu ước lượng của 1 là số dương thì ước lượng này là hợp lý về mặt kinh tế.
Trong trường hợp ngược lại (< 0) thì không phù hợp về mặt kinh tế.
Còn nếu ước lượng của 2 là số âm thì ước lượng này là hợp lý về mặt kinh tế.
Trong trường hợp ngược lại ước lượng của 2 > 0 thì không phù hợp về mặt kinh tế.
Trong các trường hợp không phù hợp này cần phải tìm ra một mô hình đúng.
6. Dự báo: Nếu như mô hình phù hợp với lý thuyết kinh tế thì có thể sử dụng mô
hình để dự báo. Thường khoảng dự báo trong tương lai bằng một phần ba kích thước
tập mẫu trong quá khứ thì kết quả dự báo có sai số tương đối nhỏ.
7. Sử dụng mô hình để đề ra các chính sách.
Các bước trên đây có nhiệm vụ khác nhau trong quá trình phân tích một vấn đề
kinh tế và chúng được thực hiện theo một trình tự nhất định. Tìm ra bản chất một vấn
đề kinh tế là một việc không đơn giản. Vì vậy, quá trình trên đây phải được thực hiện
nhiều lần như là các phép lặp cho đến khi chúng ta thu được một mô hình đúng. Có thể
minh hoạ quá trình phân tích kinh tế lượng một vấn đề kinh tế bằng sơ đồ sau:
Nguyễn Việt Hưng
Khóa học 2012A
- 11 -
Luận văn cao học
Dự báo nhu cầu điện năng
Thu thập số liệu
các biến kinh tế. Chỉ số
tiêu dùng, thu nhập, giá.
Nêu các giả thuyết về
các mối quan hệ
giữa các biến kinh tế.
Thiết lập các mô hình toán
học phản ánh mối
tương quan
giữa các biến kinh tế.
Ước lượng các tham số
của mô hình trên.
Phân tích kết quả?
Không phù hợp
Phù hợp
Dự báo mô phỏng
trong tương lai.
Thông tin về các biến
kinh tế độc lập
trong tương lai.
Hình 1.1: Sơ đồ phân tích và dự báo bằng phương pháp kinh tế lượng
1.3. Dự báo với phân tích hồi quy
Nguyễn Việt Hưng
Khóa học 2012A
- 12 -
Luận văn cao học
Dự báo nhu cầu điện năng
Phân tích hồi quy là một trong những kỹ thuật thống kê quan trọng và được sử
dụng rộng rãi với nhiều ứng dụng trong cách tiếp cận kinh tế lượng. Phân tích hồi quy
nghiên cứu mối liên hệ phụ thuộc của một biến (gọi là biến phụ thuộc hay biến được
giải thích) với một hay nhiều biến khác (được gọi là các biến độc lập hay biến giải
thích) nhằm ước lượng hoặc dự báo giá trị trung bình của biến phụ thuộc với các gía trị
đã biết của các biến độc lập.
1.3.1. Xây dựng các mô hình dự báo hồi quy
Các mô hình dự báo hồi quy tuyến tính đơn giản và hồi quy bội là các mô hình
thống kê nhằm mô tả các tình huống trong đời sống thực tế để từ đó có thể dự báo cho
tương lai.
Mô hình dự báo thống kê phân tích các số liệu theo hai phần:
(1) thành phần mang tính hệ thống, phi ngẫu nhiên được mô tả bằng một công
thức.
(2) thành phần hoàn toàn mang tính ngẫu nhiên (phần dư dự báo).
Mô hình dự báo mô tả toàn bộ thành phần mang tính hệ thống, phi ngẫu nhiên
trong các số liệu và để lại phần dư dự báo mang tính ngẫu nhiên.
Một mô hình dự báo được thực hiện theo các bước sau đây:
a. Đưa ra mô hình nhằm mô tả một tình huống đã cho. Thí dụ như đưa ra mô hình
hồi quy tuyến tính đơn để mô tả quan hệ giữa 2 biến số mức tiêu thụ điện ánh sáng sinh
hoạt và chi tiêu tiêu dùng tư nhân.
b. Ước lượng các tham số của mô hình từ các số liệu có được.
c. Xem xét các phần dư (sai số) dự báo của mô hình. Những phần dư dự báo này
(residuals) là phần thông tin mà mô hình không giải thích được. Nếu các phần dư dự
báo không hoàn toàn mang tính ngẫu nhiên mà có yếu tố mang tính hệ thống, ta cần
phải đánh giá lại mô hình đã đưa ra và nếu có thể cần điều chỉnh lại mô hình để loại bỏ
chúng khỏi các sai số dự báo, và đưa phần yếu tố hệ thống (phi ngẫu nhiên) này vào
mô hình dự báo. Nếu mô hình này là không phù hợp ta cần phải tìm một mô hình khác.
Nguyễn Việt Hưng
Khóa học 2012A
- 13 -
Luận văn cao học
Dự báo nhu cầu điện năng
d. Khi tìm được một mô hình mà trong đó phần dư dự báo của mô hình này chỉ
gồm các yếu tố ngẫu nhiên, ta có thể sử dụng mô hình này để dự báo, kiểm soát một
biến số, hay giải thích các mối quan hệ giữa các biến số
1.3.2. Mối tương quan giữa các biến số
Để kiểm tra giả thiết về sự có mặt của mối liên hệ giữa 2 biến số và mức độ chặt
chẽ của mối liên hệ này người ta dùng hệ số tương quan:
r(x,y) = ((xi-X)(yi-Y))/ nxy
Trong đó:
n – Số lần quan sát
X – Kỳ vọng hay giá trị trung bình của biến số x
Y – Kỳ vọng hay giá trị trung bình của biến số y
x, y – Độ lệch tiêu chuẩn của biến số x và y
Nếu r(x,y) = 1 thì giữa x và y có mối quan hệ hàm số;
Nếu r(x,y) = 0 thì giữa x và y không có mối quan hệ tương quan.
Khi r(x,y) có giá trị càng gần với 1 thì mối quan hệ tương quan giữa các biến x
và y càng chặt chẽ. Nếu r = 0 thì giữa x và y không có mối tương quan tuyến tính, lúc
này cần xét xem chúng có mối quan hệ phi tuyến không bằng cách xác định hệ số
tương quan phi tuyến (x,y).
Trường hợp sự liên hệ là phi tuyến thì hệ số tương quan r mất ý nghĩa, lúc này
đánh giá mức độ chặt chẽ của mối tương quan phi tuyến theo tỷ số tương quan:
2
1 xi X
x, y
2
yi Y
càng gần 1 thì mối quan hệ càng chặt chẽ, nếu cả r và đều bằng 0 hoặc gần 0 thì có
thể coi là giữa chúng không có mối tương quan.
1.3.3. Hồi quy tuyến tính đơn
Nguyễn Việt Hưng
Khóa học 2012A
- 14 -
Luận văn cao học
Dự báo nhu cầu điện năng
Khi biết được mối quan hệ tuyến tính giữa hai biến số Y và X, ta cần xây dựng
một mô hình để mô tả mối quan hệ này. Sử dụng phương pháp hồi quy tuyến tính đơn,
mô hình này có dạng đường thẳng được diễn tả bằng phương trình hồi quy tổng thể :
Y = 0 + 1X +
Với:
Y = biến phụ thuộc hay biến được giải thích
X = biến độc lập hay biến giải thích
0 = giao điểm với trục Y, là giá trị của Y khi X bằng 0
1 = độ nghiêng đường thẳng, cho thấy mức độ thay đổi trong Y khi X
tăng thêm 1 đơn vị
= sai số dự báo (yếu tố duy nhất mang tính ngẫu nhiên trong mô hình)
Để có ước lượng tốt nhất về các hệ số hồi quy tổng thể 0 và 1 ta sử dụng
phương pháp bình phương nhỏ nhất. Các tham số ước lượng bình phương nhỏ nhất là
b0 (ước lượng của 0) và b1 (ước lượng của 1).
Phương trình hồi quy dự báo có dạng:
Y = b0 + b1X + e
Với:
b0: ước lượng của 0
b1: ước lượng của 1
e: ước lượng sai số dự báo tổng thể
Sai số dự báo có thể là âm (nếu điểm số liệu nằm dưới đường thẳng phù hợp nhất)
hoặc dương (nếu điểm số liệu nằm trên đường thẳng phù hợp nhất). Để giảm thiểu tất
cả các sai số dự báo âm và dương, ta cần giảm thiểu tổng sai số dự báo bình phương
(SSE).
Công thức tính SSE:
SSE = ei2 = (yi – yi^)2
Nguyễn Việt Hưng
Khóa học 2012A
- 15 -
Luận văn cao học
Dự báo nhu cầu điện năng
Đường thẳng phù hợp nhất là đường hồi quy mẫu làm cực tiểu hoá SSE. Đường
hồi quy mẫu phù hợp nhất sử dụng biến độc lập X ứng với 1 giá trị đã cho để dự báo
biến phụ thuộc Y theo mô hình hồi quy:
Y^ = b0 + b1X
Để tìm các giá trị b0, b1 cho đường hồi quy mẫu phù hợp nhất, ta sử dụng phương
pháp bình phương nhỏ nhất. Kết quả nhận được từ phương pháp bình phương nhỏ nhất
tính b0, b1 như sau:
b1
b0
n XY X Y
n X 2 X
2
Y b X
1
n
n
Chúng ta lưu ý rằng đường thẳng hồi quy tuyến tính được gọi là đường thẳng hồi
quy mẫu vì nó là đường thẳng phù hợp nhất cho những điểm số liệu ngẫu nhiên được
chọn mẫu trong tất cả các số liệu với kích thước mẫu là n.
1.3.4. Kiểm tra sai số dự báo và mức độ phù hợp của mô hình dự báo
a) Kiểm tra sai số dự báo
Chúng ta cần kiểm tra các sai số dự báo để xác định mô hình dự báo đưa ra có
phù hợp không. Nói cách khác, mô hình dự báo có giúp ta đưa ra những dự báo chính
xác với sai số dự báo thấp không.
Phân tích sai số dự báo còn giúp ta kiểm tra các giả thiết đưa ra như:
Giả thiết các sai số dự báo tuân theo luật phân bố chuẩn: Để kiểm tra sai số dự
báo có dạng phân bố chuẩn hay không, ta vẽ đồ thị. Nếu các sai số dự báo này không
tạo thành một đường chéo trong hình chữ nhật, sai số dự báo không tuân theo luật phân
bố chuẩn.
Giả thiết các sai số dự báo là không tương quan với nhau.
Nguyễn Việt Hưng
Khóa học 2012A
- 16 -
Luận văn cao học
Dự báo nhu cầu điện năng
Phương sai (variance) là hằng số: Nếu phương sai là hằng số ta có thể sử dụng
phương pháp bình phương nhỏ nhất thường (ordinary least squares) để phân tích các số
liệu. Nếu phương sai tăng hay giảm khi X tăng (heteroscedasticity) ta cần phải sử dụng
phương pháp phân tích bình phương nhỏ nhất tổng quát (generalized least squares) để
phân tích các số liệu.
Chi tiết thành phần mô hình có bỏ sót một hay nhiều biến độc lập khác giúp
cho việc giải thích những thay đổi trong Y không?
Nếu các sai số dự báo cho thấy mô hình mang tính xu hướng khi vẽ đồ thị theo
thời gian, thì cần phải thêm biến số thời gian vào mô hình. Nếu các biến số bị bỏ sót là
các biến khác, ta cần phải đưa thêm những biến này vào mô hình. Trong những trường
hợp như vậy ta cần sử dụng mô hình hồi quy bội để phân tích số liệu.
Xem xét có mối quan hệ tuyến tính giữa các biến số không?
Nếu các sai số dự báo đầu tiên lớn và âm, sau đó giảm dần và trở nên dương
rồi lại giảm xuống âm, ta có thể cho rằng giữa các biến số có mối quan hệ theo đường
cong.
Sai số ước lượng chuẩn:
Để tính khoảng cách chuẩn của một điểm số liệu đến đường hồi quy theo hướng
trục Y trong phân tích hồi quy, ta phải tìm sai số ước lượng chuẩn (standard error of
estimate) ký hiệu sy.x theo công thức sau:
S y. x
Y Y
n2
2
với:
Y là giá trị thực tế,
Y^ là giá trị dự báo theo mô hình.
b) Kiểm định tính phù hợp của mô hình dự báo
Nguyễn Việt Hưng
Khóa học 2012A
- 17 -
Luận văn cao học
Dự báo nhu cầu điện năng
Kiểm định tính phù hợp của mô hình dự báo được tiến hành bằng phép kiểm tra
giả thuyết:
Khi giữa 2 biến số X và Y không có mối quan hệ tuyến tính, độ nghiêng hồi quy
tổng thể 1 bằng 0. Có thể xảy ra 3 trường hợp phi tuyến, hay 1 = 0 như dưới đây:
Khi Y là hằng số bất kể giá trị của X là bao nhiêu.
Khi Y và X không có tương quan lẫn nhau: khi X tăng, Y có thể tăng, giảm
hay là hằng số.
Khi mối quan hệ giữa Y xà X là mối quan hệ theo đường cong.
Do đó khi có mối quan hệ tuyến tính giữa 2 biến số X và Y, độ dốc của đường hồi
quy trong tất cả các trường hợp phải là âm, hay dương nhưng không thể bằng 0. Vì vậy
kiểm định giả thuyết thống kê quan trọng nhất trong hồi quy tuyến tính đơn là xem hệ
số độ dốc hay 1 có bằng 0 hay không. Nếu kiểm tra giả thiết cho thấy 1 = 0, ta có thể
kết luận không có mối quan hệ tuyến tính giữa 2 biến số.
Giả thuyết H0 : 1 = 0
Ta có thể kiểm tra giả thuyết này bằng cách tính giá trị t từ các số liệu và so sánh
với giá trị t/2 trong bảng phân phối Student với (n-2) bậc tự do và mức ý nghĩa a.
Miền bác bỏ giả thuyết H0 : t t n 2
2
Một cách tiếp cận khác sử dụng phân bố F cũng cho chúng ta kiểm định giả thiết:
H0 : 1 = 0
H1 : 1 0
Nếu F = b12 xi2 / ^2 > F (1,n-2) thì bác bỏ giả thiết H0, tức là bác bỏ giả thiết X
không ảnh hưởng đến Y. Với giá trị F tính từ các số liệu, còn F (1,n-2) tra từ bảng
phân phối F.
Ngoài ra để kiểm định tính phù hợp của mô hình hồi quy tuyến tính đơn chúng ta
có thể sử dụng hệ số xác định r2, hệ số này được tính bằng phương trình sau:
Nguyễn Việt Hưng
Khóa học 2012A
- 18 -
Luận văn cao học
Dự báo nhu cầu điện năng
2
Y Y
r2 1
2
Y Y
ở đây Y là giá trị trung bình của tập mẫu Y.
Gía trị r2 càng cao, càng cho thấy đường hồi quy mô tả tốt mối quan hệ giữa các
biến số. Dưới đây là các mức độ hệ số xác định:
r2 0,9: mối quan hệ giữa hai biến số có tương quan rất cao
0,8 r2 0,9: mối quan hệ giữa hai biến số có tương quan cao
0,7 r2 0,8: mối quan hệ giữa hai biến số có tương quan vừa phải
0,6 r2 0,7: mối quan hệ giữa hai biến số có tương quan thấp
Sau một vài phép biến đổi thống kê toán học thích hợp ta có công thức để xác
định thống kê F (nhằm kiểm định tính phù hợp của mô hình) qua hệ số xác định r2 như
sau:
F
r2
(n 2)
2
1
(1 r )
1.3.5. Dự báo khoảng và sai số chuẩn dự báo
Như ta đã biết rằng những điểm số liệu tạo ra đường hồi quy nằm phân tán xung
quanh đường hồi quy mẫu ước lượng và được đo lường bằng sai số ước lượng chuẩn
sy.x. Để tạo ra khoảng dự báo của Y khi X = X0, ta phải tính đến mức độ phân tán này.
Ngoài ra do từ một tổng thể các số liệu ta có nhiều chọn mẫu khác nhau và từ đó có
nhiều đường hồi quy mẫu khác nhau, nên để có được khoảng dự báo cho Y ta cũng cần
tính đến mức độ phân tán của những đường hồi quy mẫu này xung quanh đường hồi
quy tổng thể.
Nguyễn Việt Hưng
Khóa học 2012A
- 19 -
Luận văn cao học
Dự báo nhu cầu điện năng
Sai số chuẩn dự báo đo lường mức độ thay đổi của các giá trị dự báo
Y xung
quanh giá trị thực tế của Y với một giá trị X = X0 đã cho. Nó tính đến cả hai yếu tố nêu
trên. Sai số chuẩn dự báo được tính bằng công thức:
s f S y. x
2
X X
1 1
2
n
X X
Nếu kích cỡ mẫu chọn đủ lớn (n 30), vùng dự báo của Y sẽ nằm trong khoảng:
Y* Z sf
trong đó Z tra trong bảng phân bố chuẩn tương ứng.
Nếu kích cỡ mẫu chọn đủ lớn (n < 30), vùng dự báo của Y sẽ nằm trong khoảng:
Y* t sf
trong đó t tra trong bảng phân bố Student tương ứng.
1.4. Dự báo với phân tích hồi quy bội
Trong phân tích hồi quy để có được dự báo tốt nhất cho một biến phụ thuộc nào
đó, cần phải sử dụng nhiều biến độc lập, trong đó mỗi biến độc lập góp phần giải thích
một số phần trăm thay đổi trong biến phụ thuộc. Trong trường hợp này cần tạo ra một
mô hình nhằm mô tả mối quan hệ giữa biến phụ thuộc và các biến độc lập này. Một mô
hình sử dụng nhiều biến độc lập để dự báo một biến phụ thuộc được gọi là mô hình hồi
quy bội.
Để góp phần giải thích cho những thay đổi trong biến phụ thuộc, những biến độc
lập được đưa vào mô hình trước hết phải có tương quan với biến phụ thuộc.
Tuy nhiên giữa các biến độc lập lại không nên có tương quan với nhau. Trong
trường hợp có tương quan giữa các biến độc lập (multicollearity), kết quả dự báo sẽ
không chính xác.
Nguyễn Việt Hưng
Khóa học 2012A
- 20 -
Luận văn cao học
Dự báo nhu cầu điện năng
Do vậy trước khi sử dụng một mô hình nào đó để dự báo, cần phải kiểm tra mức
độ tương quan giữa các biến độc lập với nhau, cũng như mức độ tương quan giữa các
biến độc lập với biến phụ thuộc bằng cách sử dụng ma trận tương quan (Correlation
Matrix) để đánh giá.
1.4.1. Phương trình hồi quy bội
Phương trình hồi quy bội tổng thể có dạng:
Y = 0 + 2X2 + 3X3 +…….+ JXJ +
Trong đó:
0 là hệ số tự do (hệ số chặn)
2, 3, ……, J là các hệ số hồi quy riêng
là sai số dự báo tổng thể
Phương trình hồi quy bội mẫu có dạng:
Y = b0 + b2X2 + b3X3 +…….+ bJXJ
trong đó:
b0, b2, b3, ……, bJ là các ước lượng của các hệ số hồi quy riêng
Với các giả thiết như sau:
a) Các giá trị Y tuân theo phân bố chuẩn xung quanh mặt phẳng hồi quy bội.
b) Mức độ phân tán của các điểm xung quanh mặt phẳng hồi quy bội luôn là hằng
số tại mọi điểm trong mặt.
c) Các sai số dự báo () độc lập với nhau.
d) Có mối quan hệ tuyến tính giữa mỗi giá trị X và Y tổng thể.
Sau khi có được phương trình dự báo hồi quy bội, để tìm giá trị dự báo cho biến
phụ thuộc Y, ta thay thế giá trị của các biến độc lập vào phương trình và tính ra kết
quả.
Điều cần lưu ý là không nên sử dụng các giá trị biến độc lập ngoài vùng quan sát
được trong thực tế vì mối quan hệ giữa các biến số có thể không còn tồn tại như cũ khi
Nguyễn Việt Hưng
Khóa học 2012A
- 21 -
Luận văn cao học
Dự báo nhu cầu điện năng
vượt khỏi vùng giá trị quan sát này, và do vậy có thể đưa ra những dự báo không chính
xác.
1.4.2. Ước lượng các tham số bằng phương pháp bình phương cực tiểu (OLS)
Hàm hồi quy mẫu có dạng
Y1 = b0 + b2X21 + b3X31 +…….+ bJXJ1 + e1
Yk = b0 + b2X2k + b3X3k +…….+ bJXJk + ek
Hay Y = Xb + e
Trong đó e =
e1
e
2
.
Y Xb
.
.
en
Các ước lượng OLS được tìm bằng cách:
ei2 = (Yi - b1 - b2 X2i - … - bk Xki )2 min
ei2 là tổng bình phương của các phần dư.
ee = ei2 = (Y – Xb) (Y – Xb) = YY – 2bXY + bXXb
(ee) / b = -2 XY + 2 XXb
n
X 2i
....
X ki
X
X
X
ki
2i
2
2i
X
X X
X 2i
X
3i
2i
3i
ki
X 3i
....
....
X
X X
b1 1
X 21
2 i ki b2
. ...
X ki2 bk X k1
ki
Nguyễn Việt Hưng
1
X 22
...
...
X k2
...
1 Y1
X 2 n Y2
..
X kn Yn
Khóa học 2012A
- 22 -
Luận văn cao học
Dự báo nhu cầu điện năng
Với giả thiết các cột của ma trận X là độc lập tuyến tính, hay X không suy biến,
nên XX cũng không suy biến, do đó tồn tại (XX)-1. Từ đó véc tơ ước lượng b =
(XX)-1 XY.
Như vậy phương pháp OLS ước lượng được cho mô hình hồi quy bội dạng tuyến
tính. Trong trường hợp các đại lượng mà chúng ta nghiên cứu có mối liên hệ phi tuyến
thì bằng các phép chuyển đổi tuyến tính hoá chúng ta có thể đưa chúng về dạng tuyến
tính, chẳng hạn như phép chuyển đổi log – log (log hoá cả 2 vế) hay thường được gọi
là DL cũng áp dụng được phương pháp OLS.
Khi giả thiết về các sai số dự báo () độc lập với nhau trong mô hình hồi quy bội
bị vi phạm thì các hệ số hồi quy ước lượng bằng phương pháp OLS không cho ta ước
lượng tốt nhất, có nghĩa là mô hình được ước lượng này không có sai số dự báo nhỏ
nhất trong lớp tất cả các mô hình ước lượng có thể. Vậy trong trường hợp này không sử
dụng phương pháp bình phương cực tiểu thông thường OLS, mà áp dụng phương pháp
bình phương nhỏ nhất tổng quát (GLS) và sử dụng ước lượng theo lưới (GS) sẽ cho mô
hình dự báo kết quả có sai số chính xác hơn. Dưới đây trình bày một mục riêng về nội
dung phương pháp GS.
1.4.3. Phương pháp bình phương nhỏ nhất tổng quát và thủ tục ước lượng Grid
Search (GS)
Một trong các giả thiết của mô hình hồi quy tuyến tính cổ điển là không có tự
tương quan hay là tương quan chuỗi các sai số (Ut) trong hàm hồi quy tổng thể. Nhưng
trong thực tế hiện tượng đó có thể xảy ra do một trong những nguyên nhân sau:
Nguyên nhân quán tính: Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế
là quán tính. Chúng ta đều biết các chuỗi thời gian như tổng sản phẩm, chỉ số giá mang
tính chu kỳ. Chẳng hạn ở đầu của thời kỳ khôi phục kinh tế, tổng sản phẩm có xu
hướng đi lên. Trong quá trình biến động này, giá trị của chuỗi ở mỗi thời điểm sau lại
cao hơn giá trị của nó ở thời điểm trước. Như có một xung lượng tiến tăng lên và xung
Nguyễn Việt Hưng
Khóa học 2012A
- 23 -
Luận văn cao học
Dự báo nhu cầu điện năng
lượng đó tác động cho đến khi xảy ra. Vì vậy trong hồi quy chuỗi thời gian, các quan
sát kế tiếp đó có nhiều khả năng phụ thuộc lẫn nhau.
Nguyên nhân trễ: Trong phân tích hồi quy, chúng ta có thể gặp hiện tượng biến
phụ thuộc ở thời kỳ t, phụ thuộc vào chính biến đó ở thời kỳ t-1 và các biến độc lập
khác. Chẳng hạn khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập, chúng ta thấy
tiêu dùng ở thời kỳ hiện tại chẳng những phụ thuộc vào tiêu dùng ở thời kỳ trước đó
mà còn phụ thuộc vào biến thu nhập.
Vì khi có sự tương quan chuỗi các ước lượng OLS là không hiệu quả, làm thế nào
để có thể khắc phục các hiện tượng này? Có một số biện pháp khắc phục hiện tượng đó
nhưng các biện pháp lại phụ thuộc vào hiểu biết về bản chất của sự phụ thuộc qua lại
giữa các biến sai số.
Thông thường các sai số (Ut) không quan sát được nên tính chất của tương quan
chuỗi thường là vấn đề suy đoán hoặc là do những đòi hỏi cấp bách của thực tiễn.
Trong thực hành, người ta thường giả sử rằng t theo mô hình tự hồi quy bậc nhất nghĩa
là:
Ut = Ut-1 + t
(3.1)
Trong đó / / < 1 và t thoả mãn các giả thiết của phương pháp OLS nghĩa là:
Trung bình bằng 0, phương không đổi và không có tự tương quan.
Giả sử (3.1) đúng thì vấn đề tương quan chuỗi có thể được giải quyết thoả đáng
nếu hệ số tự tương quan là đã biết. Để làm sáng tỏ vấn đề đó ta quay về mô hình hai
biến:
Yt = b1 + b2 Xt + Ut
(3.2)
Nếu (3.2) đúng với t thì cũng đúng với t-1 nên:
Yt-1 = b1 + b2 Xt-1 + Ut-1
(3.3)
Nhân hai vế (3.3) với ta được:
Yt-1 = b1 + b2 Xt-1 + Ut-1 (3.4)
Nguyễn Việt Hưng
Khóa học 2012A
- 24 -