Tải bản đầy đủ (.pdf) (7 trang)

Ứng dụng mạng nơron SVM trong mô hình lai dự báo độ ẩm lớn nhất và nhỏ nhất trong ngày

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (541.04 KB, 7 trang )

NGHIÊN CỨU KHOA HỌC

ỨNG DỤNG MẠNG NƠRON SVM TRONG MÔ HÌNH LAI
DỰ BÁO ĐỘ ẨM LỚN NHẤT VÀ NHỎ NHẤT TRONG NGÀY
APPLICATIONS OF SVM NETWORKS IN HYBRID MODEL
FOR PREDICT THE MAXIMUM AND MINIMUM
HUMIDITY OF THE DAY
Đỗ Văn Đỉnh, Vũ Quang Ngọc
Email:
Trường Đại học Sao Đỏ
Ngày nhận bài: 17/11/2018
Ngày nhận bài sửa sau phản biện: 20/3/2018
Ngày chấp nhận đăng: 28/3/2018
Tóm tắt
Dự báo độ ẩm môi trường trong ngày là một trong những bài toán không chỉ ở Việt Nam mà các quốc
gia trên thế giới đang rất quan tâm tới. Bài toán dự báo trên có tính chất phụ thuộc nhiều vào điều kiện
địa lý và mang tính khu vực. Do đó, tại từng khu vực và vùng miền khác nhau cần xác lập bộ thông số
dữ liệu phù hợp cho quá trình dự báo. Trong bài báo này, đề xuất sử dụng mô hình lai, phối hợp máy
học vectơ hỗ trợ SVM (Support Vector Machine) và mô hình khai triển theo phương pháp tuyến tính
SVD (Singular Value Decomposition) để dự báo và ước lượng giá trị độ ẩm lớn nhất và nhỏ nhất trong
ngày tại thành phố Hải Dương, Việt Nam. Bộ số liệu đầu vào là giá trị lớn nhất, nhỏ nhất của nhiệt độ, độ
ẩm, tốc độ gió và giá trị trung bình của lượng mưa, số giờ nắng của các ngày trước đó. Chất lượng của
giải pháp đề xuất được kiểm nghiệm trên bộ số liệu quan trắc thực tế (2191 ngày, từ ngày 01/01/2010
đến ngày 31/12/2015) ở thành phố Hải Dương, Việt Nam. Kết quả thực nghiệm cho sai số tuyệt đối
trung bình MAE = 4,23%.
Từ khóa: Dự báo; mô hình lai; máy học vectơ hỗ trợ; độ ẩm lớn nhất, nhỏ nhất trong ngày.
Abstract
Forecasting the humidity of the day is one of the problems not only in Vietnam but also in other countries
in the world. The prediction problem is highly dependent on geographic and regional conditions.
Therefore, in different regions and regions, it is necessary to establish appropriate data sets for the
forecasting process. In this paper, we propose to use a hybrid model, support vector machine (SVM)


and a Singular Value Decomposition (SVD) model to predict and estimate maximum and minimum
daily humidity values ​​in Hai Duong city, Vietnam. The input data is the maximum, minimum value of
temperature, humidity, wind speed and mean value of precipitation, the number of hours of sunshine of
the previous day. The quality of the proposed solution was tested on the actual observation data (2191
days, 01/01/2010 to 31/12/2015) in Hai Duong city, Vietnam. Experimental results showed an average
error of MAE = 4.23%.
Keywords: Predict; hybrid model; support vector machines; maximum and minimum daily humidity.
1. ĐẶT VẤN ĐỀ
Việt Nam là một quốc gia nằm trong khu vực nhiệt
đới gió mùa, có lượng mưa và độ ẩm phức tạp trên
từng vùng miền có sự khác nhau rõ rệt. Dự báo độ
ẩm không khí là một trong những nội dung chính của
bản tin dự báo thời tiết, nó có ý nghĩa quan trọng
đối với ngành nông nghiệp, công nghiệp và dịch vụ,
nhằm phòng chống và hạn chế thiên tai, thiết lập kế
hoạch sản xuất, khai thác tiềm năng khí hậu.

Diễn biến của độ ẩm không khí rất phức tạp, nó
chịu ảnh hưởng của rất nhiều các yếu tố khác như
độ ẩm, áp suất khí quyển, lượng mưa, tốc độ gió,
bức xạ nhiệt, tốc độ phát triển các thành phần kinh
tế,… Hiện nay, các mô hình dự báo thông số thời
tiết sử dụng phổ biến nhất được chia thành hai
dạng là mô hình dự báo tất định (Deterministic
Model) và mô hình dự báo thống kê (Statistical
Model) [2]. Trong đó, mô hình dự báo tất định
được xây dựng dựa trên quá trình diễn biến thời
tiết, nó đòi hỏi một hệ thống cơ sở hạ tầng đủ

18 Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018



LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA
mạnh và người vận hành, khai thác mô hình phải
có trình độ về công nghệ thông tin. Ngược lại, các
mô hình dự báo thống kê đơn giản hơn, nó không
đòi hỏi quá cao về mặt cơ sở hạ tầng hay quá chi
tiết về các thông số ảnh hưởng đến thông số thời
tiết cần dự báo vì mô hình này có khả năng tự
động xây dựng mối quan hệ tuyến tính cũng như
phi tuyến giữa các thông số cần dự báo và các
thông số khác.
Đã có nhiều mô hình dự báo thống kê được
nghiên cứu và ứng dụng thành công trên thế
giới như phương pháp hồi quy phi tuyến tính, phi
tuyến; phương pháp giá trị cực trị (Extreme Value)
và mạng nơron nhân tạo (ANN - Artificial Neural
Network) [5-9], trong số đó, các mô hình ứng
dụng mạng nơron nhân tạo đã đạt được những
tiến bộ đáng kể và nghiên cứu ứng dụng rộng rãi
trong thời gian qua [1, 5, 6, 8]. Thuật toán máy
học vectơ hỗ trợ SVM được Vapnik giới thiệu năm
1995 [4], đã được nghiên cứu thử nghiệm trong
lĩnh vực dự báo thời tiết và thu được những kết
quả khả quan, trong hầu hết các nghiên cứu đã
được công bố, mô hình dự báo nhiệt độ không khí
dùng mạng SVM đều cho kết quả tốt hơn so với
các mô hình ANN kiểm chứng [7-10,13]. Mặt khác,
trong bài báo này đề xuất ứng dụng mạng nơron
SVM trong mô hình lai [2] để dự báo độ ẩm không

khí, kết quả nghiên cứu thực nghiệm cho thấy ứng
dụng mạng SVM trong mô hình lai dự báo độ ẩm
không khí cho kết quả khả quan hơn so với các
mô hình mạng nơron khác (như mạng RBF, MLP,
MLR, Elman, BRtree,…).
2. ỨNG DỤNG MẠNG SVM TRONG MÔ HÌNH
LAI DỰ BÁO ĐỘ ẨM MÔI TRƯỜNG
Bài toán dự báo là một trường hợp đặc biệt của
bài toán ước lượng và xây dựng mô hình ánh xạ
giữa đầu vào và đầu ra [1, 2]. Theo [2, 13], mô
hình lai đã được đề xuất để dự báo ngắn hạn phụ
tải điện, dự báo nhiệt độ lớn nhất, nhỏ nhất trong
ngày và cho kết quả khả quan; để ước lượng
thành phần tuyến tính, tác giả sử dụng thuật toán
khai triển theo các giá trị kỳ dị SVD, phần ước
lượng phi tuyến sử dụng mạng MLP [2] và SVM
[13]. Trong bài báo này, tác giả đề xuất ứng dụng
phối hợp SVD và SVM trong mô hình lai để dự
báo và ước lượng độ ẩm lớn nhất (RHmax) và độ
ẩm cao nhất (RHmin) trong ngày.
Như đã trình bày ở [1, 2, 13], bằng thực nghiệm
mô hình lai có nhiều ưu việt hơn các mô hình
mạng nơron khác. Khi sử dụng mô hình lai sẽ
giảm bớt mức độ phức tạp của mô hình phi tuyến,
trước hết cần ước lượng thành phần tuyến tính,
sau đó ta loại thành phần tuyến tính khỏi các số
liệu đầu vào để nhằm chỉ giữ lại thành phần phi
tuyến trong tín hiệu của đối tượng. Tín hiệu còn lại

này sẽ được dùng để huấn luyện khối phi tuyến

hay nói cách khác: sai số còn lại từ khối tuyến tính
trở thành đầu vào của khối phi tuyến.
Để kiểm nghiệm chất lượng các mô hình mạng
nơron ước lượng thành phần phi tuyến, trong bài
báo tác giả sử dụng các mô hình mạng MLP, MLR,
Elman, BRtree, SVM và các mạng Hybrid của các
mạng nơron trên như Hybrid-MLP, Hybrid-MLR,
Hybrid-Elman, Hybrid-BRTree. Từ đó, đánh giá
chất lượng các mô hình mạng nơron cho bài toán
dự báo thông số thời tiết. Các mô hình dự báo và
ước lượng thông số thời tiết sẽ được đánh giá chất
lượng thông qua các chỉ số Mean Absolute Error
(MAE); Mean Relative Error (MRE); Maximum
Absolute Error (MaxAE); Standard Deviation (SD).
2.1. Cấu trúc của mô hình dự báo
Giả thiết rằng ta có bộ số liệu đo quan trắc
môi trường tại điểm A. Ta xây dựng hàm
quan hệ giữa thông số cần dự báo với các
thông số môi khác thông qua phương trình:
Ti ( A, d + 1) = f (Ti ( A, d ), Ti ( A, d - 1) ,  , Ti ( A, d - K ))

(1)

Hoặc
é T ( A,d ),T ( A,d -1),T ( A,d -K ) ù
ê i
ú
i
i
ê

ú
Ti ( A,d +1) = f ê

ú
ê
ú
êT j ( A,d ),T j ( A,d -1),,T j ( A,d -K ú
ë
û

(2)

trong đó:

Ti ( A, d ) : thông số môi trường thứ i tại vị trí A ở
ngày d.
Cấu trúc mô hình dự báo độ ẩm lớn nhất, nhỏ nhất
trong ngày dựa vào các số liệu đo trong quá khứ
như hình 1.

Hình 1. Sơ đồ cấu trúc mô hình dự báo
thông số khí tượng
2.2. Các thuật toán xây dựng mô hình dự báo
2.2.1. Mô hình ước lượng tuyến tính
Từ phương trình (5), hàm quan hệ tuyến tính giữa
RHmax của ngày d với RHmax của các ngày quá khứ
và được xác định từ hệ phương trình ước lượng xấp
xỉ như trong công thức (3) và (4). Từ (4) ta cần xác
T
định vectơ a = [ a1 , a2 , , aK ] để đạt cực tiểu của

hàm sai số ước lượng. Trong thực tế áp dụng, ta
còn cần trả lời hai câu hỏi: 1. Cần sử dụng bao
nhiêu số liệu trong quá khứ?; 2. Đó là những số
liệu nào?

Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 19


NGHIÊN CỨU KHOA HỌC
a1 ⋅ RH max ( K ) + a2 ⋅ RH max ( K − 1) + ... + aK ⋅ RH max ( d − K ) ≈ RH max ( K + 1)
a ⋅ RH ( K − 1) + a ⋅ RH ( K − 2) + ... + a ⋅ RH ( d − K + 1) ≈ RH ( K + 2)
 1
max
2
max
K
max
max

...
...
...

a1 ⋅ RH max ( N max − 1) + a2 ⋅ RH max ( N max − 2) + ... + aK ⋅ RH max ( N max − K ) ≈ RH max ( N max )
RH max ( K − 1)
....
RH max (1)
 RH max ( K )
  a1   RH max ( K + 1) 
 RH ( K − 1)

  a   RH ( K + 2)
RH max ( K − 2)
RH max (2)
...
max
 .  2  ≈  max

⇔






    

 RH max ( N max − 1) RH max ( N max − 2) ... RH max ( N max − K ) aK   RH max ( N max ) 

(3)


(4)

Phương pháp xác định thích nghi được thực hiện
như sau:

K = K–1, và quay lại bước 2 nếu K > Kmin chọn

- Trước tiên ta sử dụng một số lượng lớn số liệu
quá khứ (trong nghiên cứu ta sử dụng K = 60 tương đương 2 tháng số liệu trước đó - là đủ lớn

để dự báo ngày tiếp theo).

giảm xuống một giá trị đủ nhỏ có thể chấp nhận

- Với K số liệu quá khứ, ta xác định vectơ
T
a = [ a1, a2 , , a K ] của hàm ước lượng tuyến tính
K
RH
( d ) ≈ ∑  a ⋅ RH
( d − i )  bằng phương
max

i =1



i

max



pháp SVD.
- Xác định thành phần có giá trị tuyệt đối nhỏ nhất
trong vectơ a. Thành phần này sẽ tương ứng với
ngày trong quá khứ ít ảnh hưởng tới ngày dự
báo. Ta loại bỏ khỏi bộ số liệu trong quá khứ, giảm

trước. Quá trình lặp các bước 2-3 cho đến khi K

được để mô hình không quá phức tạp. Cụ thể
trong bài báo ta chọn Kmin< 5.
Tương tự như vậy, ta xây dựng hàm quan hệ
tuyến tính giữa RHmax của ngày d với RHmax,RHmin’
Tmax, Tmin, Winmax, Winmin, RainAll và RhAll của các
quá khứ ta được phương trình (5). Khi xác định

được mối quan hệ tuyến tính giữa RHmax của ngày
d với các ngày trong quá khứ, ta tính sai số chênh
lệch giữa số liệu thực tế và số liệu ước lượng như
phương trình (6):

ai1 ⋅ RH max ( d − i ) + ai 2 ⋅ RH min ( d − i ) + ai3 ⋅ Tmax (d − i ) + 
K 

(5)
RH max ( d ) ≈ ∑ + ai 4 ⋅ Tmin ( d − i ) + ai 5 ⋅ Winmax ( d − i ) + ai 6 ⋅ Winmin ( d − i ) + 
i =1 

+ ai 7 ⋅ RainAll (d − i ) + ai8 ⋅ RhAll (d − i )


ai1RH max ( d − i ) + ai 2 ⋅ RH min ( d − i ) + ai 3 ⋅ Tmax ( d − i ) +

=
NL( d ) RH max ( d ) −

K






i =1 




∑ + ai 4 ⋅ Tmin (d − i) + ai5 ⋅Winmax (d − i) + ai 6 ⋅Winmin (d − i) + 
+ ai 7 ⋅ RainAll (d − i ) + ai8 ⋅ RhAll (d − i )

Phương trình (6): đây sẽ là phần phụ thuộc phi
tuyến còn lại giữa RHmax với các ngày trong quá
khứ. Hoàn toàn tương tự khi xây dựng các mô
hình ước lượng cho RHmin.

(6)

kế theo các bước sau: chuẩn bị dữ liệu, lựa chọn
đặc tính cho mô hình dự báo và mô hình ước
lượng, xây dựng kiến trúc mạng, lựa chọn phương
pháp và đào tạo mạng, đánh giá độ tin cậy.

2.2.2. Mô hình ước lượng phi tuyến

3.1. Kết quả ước lượng thành phần tuyến tính

Khi xác định được các thông số mô hình tuyến
tính, ta tiến hành xây dựng mạng nơron nhân tạo
để ước lượng thành phần phi tuyến. Giá trị chênh

lệnh (phương trình (6)) được sử dụng là đầu vào
cho mô hình ước lượng thành phần phi tuyến.

3.1.1. Ước lượng tuyến tính RHmax

3. KẾT QUẢ VÀ THẢO LUẬN
Mô hình nghiên cứu được xây dựng trên nền
phần mềm Matlab®2010b, với SVM sử dụng
LS-SVMlabv1.8_R2009b_R2011a và được thiết

Bằng phương pháp phân tích SVD kết hợp với
kinh nghiệm thực tế, ta xác định các yếu tố ảnh
hưởng lớn nhất đến giá trị độ ẩm lớn nhất (RHmax)
cần dự báo:
- Ảnh hưởng của RHmax trong quá khứ đến RHmax
dự báo, ta xác định được 4 ngày có hệ số phụ
thuộc lớn là: d-1, d-3, d-8 và d-11 loại ngày d-52 vì
ở xa ngày dự báo. Tiếp tục khảo sát sự phụ thuộc

20 Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018


LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA
của RHmax vào các số liệu RHmin, Tmax, Tmin, Winmax,
Winmin, RainAll và ShAll trong quá khứ bằng cách
làm hoàn toàn tương tự ta được:
- Ảnh hưởng của RHmin trong quá khứ đến RHmax
dự báo bao gồm các ngày là d-1, d-7 và d-19.
Ngày d-46 và d-56 xa ngày dự báo nên bỏ qua.
- Giá trị Tmax trong quá khứ ảnh hưởng đến RHmax

dự báo gồm d-1, d-4 và d-6, ngày d-55 và d-60 bỏ
qua vì ở xa ngày dự báo.
- Các giá trị Tmin trong quá khứ ảnh hưởng đến
RHmax dự báo d-1, d-6, d-9, d-58 và d-60. Ngày
d-58 và d-60 ở xa ngày dự báo nên bỏ qua.
- Ảnh hưởng của tốc độ gió max (Winmax) đến
RHmax là d-1, d-6, d-32, d-42 và d-48. Loại ngày
d-32, d-42 và d-48 do xa ngày dự báo.
- Ảnh hưởng của tốc độ gió min (Winmin) đến RHmax

là d-6, d-17, d-39, d-50 và d-60. Loại ngày d-39,
d-50 và d-60 do ở xa ngày dự báo.
- Lượng mưa trung bình ngày (RainAll) đến độ ẩm
lớn nhất (RHmax) là các ngày d-1, d-7, d-10, d-51 và
d-60. Loại ngày d-51 và d-60 do ở xa ngày dự báo.
- Số giờ nắng trong ngày (ShAll) ảnh hưởng đến
RHmax là d-1, d-5, d-40, d-56 và d-60. Loại các
ngày d-40, d-56 và d-60 do ở xa ngày dự báo.
Tổng hợp lại ta có mô hình được lựa chọn để dự
báo giá trị RHmax của ngày thứ d sẽ gồm 22 số liệu
quá khứ như công thức (7). Kiểm tra chất lượng
của mô hình sử dụng 710 ngày số liệu cuối trong
tập số liệu 2191 ngày. Bảng 1 là kết quả sai số khi
khai triển thành phần tuyến tính ước lượng RHmax,
kết quả tính toán sai số trung bình tuyệt đối khi
ước lượng RHmax tương đối nhỏ, sai số trung bình
tuyệt đối kiểm tra MAE(Etest) = 3,47%


RH max (d ) =

0, 484 ⋅ RH max (d − 1) + 0,121 ⋅ RH max (d − 3) + 0,133 ⋅ RH max (d − 8) +

+ 0,121 ⋅ RH max (d − 11) + 0,378 ⋅ RH min (d − 1) + 0,199 ⋅ RH max (d − 7) +
+ 0, 219 ⋅ RH max (d − 19) + 0,925 ⋅ Tmax (d − 1) + 0,389 ⋅ Tmax (d − 4) +
+ 0, 472 ⋅ Tmax (d − 6) + 1,132 ⋅ Tmin (d − 1) + 0,561 ⋅ Tmin (d − 6) +

(7)

+ 0, 454 ⋅ Tmin (d − 9) + 5,550 ⋅ Winmax (d − 16) + 14,869 ⋅ Winmin (d − 6) +
+ 14, 482 ⋅ Winmin (d − 17) + 1,346 ⋅ RainAll (d − 1) + 1,350 ⋅ RainAll (d − 7) +
+ 1,316 ⋅ RainAll (d − 10) + 3,964 ⋅ ShAll (d − 1) + 3,810 ⋅ ShAll (d − 5)



3.1.2. Ước lượng tuyến tính RHmin
Thực hiện ước lượng độ ẩm lớn nhất (RHmin)
tương tự Tmax, Tmin và RHmax, ta xác định các yếu
tố ảnh hưởng lớn nhất đến giá trị độ ẩm nhỏ nhất
(RHmin) cần dự báo:

Hình 2. Đồ thị sai số học và sai số kiểm tra khi khai
triển thành phần tuyến tính để ước lượng RHmax
Hình 2 biểu diễn đáp ứng của bộ số liệu gốc, kết
quả ước lượng RHmax bằng phương pháp khai
triển thành phần tuyến tính.
Bảng 1. Kết quả sai số khi khai triển thành phần
tuyến tính ước lượng RHmax
Quá trình

Học


Kiểm tra

MAE

3,69

3,47

MRE

4,30

3,93

MaxAE

10,60

19,79

SD

3,89

3,58

Sai số

- Ảnh hưởng của RHmin trong quá khứ đến RHmin

dự báo, ta xác định được 4 ngày có hệ số phụ
thuộc lớn là: d-1, d-4, d-6 và d-13, loại ngày d-56
vì ở xa ngày dự báo. Tiếp tục khảo sát sự phụ
thuộc của RHmin vào các số liệu RHmax, Tmax, Tmin,
Winmax, Winmin, RainAll và ShAll trong quá khứ
bằng cách làm hoàn toàn tương tự ta được:
- Ảnh hưởng của RHmax trong quá khứ đến RHmin dự
báo bao gồm các ngày là d-1, d-3 và d-8. Ngày d-43
và d-56 xa ngày dự báo nên bỏ qua.
- Giá trị Tmax trong quá khứ ảnh hưởng đến RHmin
dự báo gồm d-3, d-5 và d-9, ngày d-28 và d-60 bỏ
qua vì ở xa ngày dự báo.
- Các giá trị Tmin trong quá khứ ảnh hưởng đến RHmin
dự báo d-1, d-4, d-10, d-24 và d-60. Ngày d-24 và
d-60 ở xa ngày dự báo nên bỏ qua.
- Ảnh hưởng của tốc độ gió max (Winmax) đến RHmin
là d-5, d-21, d-44, d-53 và d-60. Loại ngày d-21,
d-44, d-53 và d-60 do xa ngày dự báo.

Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 21


NGHIÊN CỨU KHOA HỌC
- Ảnh hưởng của tốc độ gió min (Winmin) đến RHmin

- Số giờ nắng trong ngày (ShAll) ảnh hưởng đến

là d-1, d-11, d-22, d-42 và d-60. Loại ngày d-22,

RHmin là d-4, d-20, d-40, d-55 và d-60. Loại các


d-42 và d-60 do ở xa ngày dự báo.

ngày d-20, d-40, d-55 và d-60 do ở xa ngày dự báo.

- Lượng mưa trung bình ngày (RainAll) đến RHmin

- Tổng hợp lại ta có mô hình được lựa chọn để dự

là các ngày d-1, d-3, d-31, d-46 và d-56. Loại ngày

báo giá trị RHmin của ngày thứ d sẽ gồm 19 số liệu

d-31, d-46 và d-60 do ở xa ngày dự báo.

quá khứ:

RH min (d ) = 0, 640 × RH min (d - 1) + 0, 087 × RH min (d - 4) + 0, 093 × RH min (d - 6) +

+ 0, 088 × RH min (d - 13) + 0, 705 × RH max (d - 1) + 0, 204 × RH max (d - 3) +
+ 0,195 × RH max (d - 8) + 0, 740 × Tmax (d - 3) + 0, 520 × Tmax (d - 5) +
+ 0, 629 × Tmax (d - 9) + 1, 643 × Tmin (d - 1) + 0, 700 × Tmin (d - 4) +
+ 0, 403 × Tmin (d - 10) + 4,121 × Winmax (d - 5) + 11, 315 × Winmin (d - 1) +
+ 10, 680 × Winmin (d - 11) + 1,159 × RainAll(d - 1) +
+ 1, 001 × RainAll(d - 3) + 2, 772 × RainAll(d - 4)

Kiểm tra chất lượng của mô hình sử dụng 710
ngày số liệu cuối trong tập số liệu 2191 ngày.
Bảng 2 là kết quả sai số khi khai triển thành
phần tuyến tính ước lượng RHmax, kết quả tính

toán sai số trung bình tuyệt đối khi ước lượng
RHmin nhỏ, sai số trung bình tuyệt đối kiểm tra
MAE(Etest) = 8,23%, so với mô hình ước lượng
thông số môi trường RHmax thì mô hình ước lượng
RHmin sai số lớn hơn. Hình 3 biểu diễn đáp ứng
của bộ số liệu gốc, kết quả ước lượng RHmin bằng
phương pháp khai triển thành phần tuyến tính.

(8)



3.2. Kết quả ước lượng thành phần phi tuyến
3.2.1. Ước lượng phi tuyến RHmax
Khi thực hiện khai triển thành phần tuyến tính, khi
ước lượng RHmax ở phần 3.1.1a cho kết quả có
22 thông số môi trường trong quá khứ ảnh hưởng
tới ngày dự báo. Phần chênh lệch được xác định
theo công thức 6, hình 4 là sai số còn lại sau khi
ước lượng thành phần tuyến tính và cũng là bộ số
liệu đầu vào cho mô hình ước lượng thành phần
phi tuyến.

Bảng 2. Kết quả sai số khi khai triển thành phần
tuyến tính ước lượng RHmin
Quá trình

Học

Kiểm tra


MAE

8,15

8,23

MRE

12,63

12,39

MaxAE

18,17

17,07

STD

6,07

6,08

Sai số

Hình 4. Các sai số còn lại RHmax của mô hình tuyến
tính trở thành đầu vào của mô hình phi tuyến


Hình 3. Đồ thị sai số học và sai số kiểm tra khi khai
triển thành phần tuyến tính để ước lượng RHmin

Bảng 3 là kết quả sai số ước lượng thành phần
phi tuyến RHmax cho kết quả sai số trung bình tuyệt
đối khá tốt ( MAE ( Etest _ Hybrid -SVM ) = 3, 35%) . Hình
5 là đồ thị biểu diễn sai số học và sai số kiểm tra
kết quả ước lượng thành phần phi tuyến với RHmax
trong mô hình lai.

22 Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018


LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA
Bảng 3. Kết quả sai số khi ước lượng thành phần phi tuyến của RHmax
Mạng
ước lượng
MLP

MLR
RBF
BRTree
Elman
SVM
Hybrid-MLP
Hybrid-MLR
Hybrid-RBF
Hybrid-BRTree
Hybrid-Elman
Hybrid-SVM


Sai số học

Sai số kiểm tra

MAE

MRE (%)

MaxAE

SD

MAE

MRE (%)

MaxAE

SD

3,05
3,70
3,36
1,88
3,06
3,26
2,97
3,70
3,10

1,84
2,99

3,53
4,30
3,91
2,13
3,54
3,81
3,44
4,30
3,58
2,12
3,44

30,47
40,59
35,53
21,62
33,10
37,83
25,80
40,59
31,84
30,59
25,39

3,03
3,89
3,39

2,04
3,00
3,47
3,02
3,89
3,04
2,17
2,94

3,88
3,47
3,56
5,00
3,62
3,35
3,48
3,47
3,82
4,02
3,62

4,35
3,92
4,00
5,60
4,09
3,79
3,91
3,92
4,28

4,51
4,06

28,93
29,79
23,03
36,79
32,14
25,40
27,13
29,79
22,45
33,07
24,63

3,86
3,58
3,47
5,18
3,83
3,41
3,61
3,58
3,71
4,69
3,47

3,23

3,77


37,48

3,42

3,35

3,79

25,54

3,43

Hình 5. Sai số học và sai số kiểm tra kết quả
ước lượng thành phần phi tuyến với RHmax
trong mô hình lai
3.2.2. Ước lượng phi tuyến RHmin
Tương tự như khi ước lượng thành phần phi tuyến
với RHmax, ta có 19 thông số môi trường trong quá
khứ ảnh hưởng tới giá trị RHmin của ngày dự báo.
Phần chênh lệch còn lại sau khi ước lượng thành
phần tuyến tính và cũng là bộ số liệu đầu vào cho mô
hình ước lượng thành phần phi tuyến được xác định
theo công thức (6) và được biểu diễn trên hình 6.

Hình 6. Các sai số còn lại RHmin của mô hình
tuyến tính trở thành đầu vào của mô hình phi tuyến
Bảng 4 là kết quả sai số khi ước lượng thành
phần phi tuyến RHmin sử dụng mạng SVM trong
mô hình lai. Kết quả sai số cho thấy sai số trung

bình tuyệt đối tốt (MAE(Etest)=4,23%). Hình 7 là
đồ thị biểu diễn sai số học và sai số kiểm tra kết
quả ước lượng thành phần phi tuyến với RHmin
trong mô hình lai.

Bảng 4. Kết quả sai số khi ước lượng thành phần phi tuyến của RHmin
Sai số học

Sai số kiểm tra

Mạng
ước lượng

MAE

MRE (%)

MaxAE

SD

MAE

MRE (%)

MaxAE

SD

MLP

MLR
RBF
BRTree
Elman
SVM
Hybrid-MLP
Hybrid-MLR
Hybrid-RBF
Hybrid-BRTree
Hybrid-Elman
Hybrid-SVM

7,62
8,15
8,02
5,93
7,37
7,79
7,85
8,14
8,14
4,39
5,30
3,43

11,75
12,89
12,41
7,73
11,35

12,05
12,15
12,63
12,63
6,70
8,11
8,42

31,154
38,85
35,57
26,07
38,55
37,17
33,48
38,17
38,07
24,56
27,13
15,45

5,73
6,08
5,97
3,87
5,61
5,84
5,83
6,08
6,07

3,41
4,32
5,92

8,46
8,56
8,33
11,18
8,64
8,37
8,38
8,24
8,23
11,03
10,31
4,23

12,74
13,01
12,49
17,90
12,93
12,57
12,68
12,40
12,38
16,65
15,51
9,40


34,61
37,67
37,74
48,05
35,37
39,63
35,90
37,07
36,52
47,40
42,02
17,06

6,30
6,28
6,11
8,75
6,47
6,06
6,06
6,08
6,06
8,46
7,66
6,05

Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 23


NGHIÊN CỨU KHOA HỌC

[2]. Nguyễn Quân Nhu (2009). Nghiên cứu và ứng dụng
mạng nơron và logic mờ cho bài toán dự báo phụ tải
điện ngăn hạn. Luận án tiến sĩ.
[3]. Đỗ Văn Đỉnh, Đinh Văn Nhượng và Trần Hoài Linh
(2015). Ứng dụng mô hình hỗn hợp trong ước lượng
giá trị lớn nhất và nhỏ nhất của nhiệt độ môi trường
ngày, Tạp chí Khoa học và Công nghệ - Đại học Đà
Nẵng, số 11(96), quyển 2, trang 35-39.
[4]. V. Vapnil (1995). Support-Vector Networks. Machine
Learning, 20, 273-297.

Hình 7. Sai số học và sai số kiểm tra kết quả
ước lượng thành phần phi tuyến với RHmin
trong mô hình lai
4. KẾT LUẬN
Khi ước lượng các bài toán phi tuyến, để giảm bớt
mức độ phức tạp của giải pháp, mô hình hỗn hợp
tách riêng thành phần tuyến tính và thành phần
phi tuyến để xử lý.
Thành phần tuyến tính được xác định thông qua
việc sử dụng khai triển theo các giá trị kỳ dị (SVD).
Thuật toán này cho phép xác định được hàm quan
hệ tuyến tính giữa độ ẩm lớn nhất (hoặc thấp
nhất) của một ngày và các ngày trước đó từ hệ
các phương trình ước lượng xấp xỉ được viết dưới
dạng ma trận có số hàng nhiều hơn số cột.
Thành phần phi tuyến được xác định thông qua
việc sử dụng mô hình mạng nơron khác nhau;
Qua thực nghiệm cho thấy sai số học và sai số
kiểm tra khi dự báo độ ẩm lớn nhất (RHmax) và

thấp nhất (RHmin), kết quả thu được tốt nhất khi sử

dụng mạng SVM. Vì vậy, ta thấy rằng ứng dụng
mạng SVM trong mô hình hỗn hợp cho bài toán
dự báo một số thông số thời tiết là phù hợp, sai số
học và sai số kiểm tra ở mức trung bình, đặc biệt
là sai số kiểm tra sẽ có giá trị tương đối ổn định;
Kết quả sai số trung bình tuyệt đối khi dự báo là
3,35% (độ ẩm lớn nhất), 4,23% (độ ẩm nhỏ nhất).
TÀI LIỆU THAM KHẢO
[1]. Trần Hoài Linh (2009). Mạng nơron và ứng dụng
trong xử lý tín hiệu. NXB Bách khoa.

[5]. Parag P Kadu et al. Temperature Prediction System
Using Back propagation Neural Network an Approch.
International Journal of Computer Science &
Communication Networks, Vol 2(1), pp. 61-64.
[6]. Mohsen Hayati and Zahra Mohebi (2007).
Temperature forecating based on neural network
approach. World Applied Sciences Journal 2(6),
pp. 613-620.
[7]. H. Wang and D. Hu (2005). Comparison of SVM
and ls-SVM for regression, in Neural Networks and
Brain. ICNN&B’05. International Conference on,
vol. 1. IEEE, pp. 279-283.
[8]. Y.Radhika and M.Shashi (2009). Atmospheric
Temperature Prediction using Support Vector
Machines. International Journal of Computer Theory
and Engineering, Vol. 1, No. 1, April 2009, pp. 55-58.
[9]. Ani Shabri. Least Square Support Vector Machines

as an Alternative Method in Seasonal Time Series
Forecasting, Applied Mathematical Sciences, Vol. 9,
2015, no. 124, pp. 6207 - 6216.
[10].T. Joachims (1998). Making large-Scale Support
Vector Machine Learning Practical, in Advances
in Kernel Methods - Support Vector Learning.
B. Schölkopf and C. Burges and A. Smola (ed.), MITPress, Cambridge, MA.
[11].D.E. Rumelhart; G.E. Hinton and R.J. Williams
(1986). Learning internal representations by
error propagation, Rumelhart, D.E. et al. (eds.).
Parallel distributed processing: Explorations in the
microstructure of cognition (Cambridge MA.: MIT
Press), 318-362.
[12].R.A. Fisher (1936). The Use of Multiple Measurements
in Taxonomic Problems. Annals of Eugenics, No 7,
pp. 179-188.
[13].Dinh Do Van, Nhuong Dinh Van, Hoai Linh Tran
(2016). Applications of SVM networks in hybrid model
for environment parameters estimation. The 4th IEEE
International Conference on Sustainable Energy
Technologies (ICSET). November 14-16, Hanoi, Viet
Nam, pp. 190-195.

24 Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018



×