Tải bản đầy đủ (.pdf) (72 trang)

Mô hình dự báo nhiệt độ môi trường sử dụng mạng nơ rôn nhân tạo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.72 MB, 72 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

VŨ QUANG NGỌC

MƠ HÌNH DỰ BÁO NHIỆT ĐỘ MƠI TRƯỜNG
SỬ DỤNG MẠNG NƠ-RÔN NHÂN TẠO

LUẬN VĂN THẠC SĨ KHOA HỌC
CHUYÊN NGÀNH: KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

HÀ NỘI - 2016


1

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

VŨ QUANG NGỌC

MƠ HÌNH DỰ BÁO NHIỆT ĐỘ MƠI TRƯỜNG
SỬ DỤNG MẠNG NƠ-RÔN NHÂN TẠO

LUẬN VĂN THẠC SĨ KHOA HỌC
CHUYÊN NGÀNH: KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TSKH: TRẦN HOÀI LINH

HÀ NỘI - 2016




LỜI CẢM ƠN

Trƣớc tiên, tôi xin chân thành cảm ơn đến các Thầy, Cô trong Viện Điện và Viện
Sau Đại học - Trƣờng Đại học Bách khoa Hà Nội đã trang bị cho tôi nhiều kiến thức
quý báu trong thời gian qua.
Tôi xin chân thành cảm ơn PGS. TSKH. Trần Hoài Linh, ngƣời hƣớng dẫn khoa
học của luận văn đã tận tình giúp đỡ tơi hồn thành luận văn này.
Sau cùng, tôi xin cảm ơn bạn bè, đồng nghiệp và những ngƣời thân đã tận tình góp
ý và giúp đỡ tôi trong suốt thời gian nghiên cứu.
Hà Nội, ngày 8 tháng 8 năm 2016
TÁC GIẢ LUẬN VĂN

Vũ Quang Ngọc

i


LỜI CAM ĐOAN

Luận văn thạc sĩ khoa học chuyên ngành Đo lƣờng với đề tài “Mơ hình dự báo
nhiệt độ môi trường sử dụng mạng nơ-rôn nhân tạo” tác giả viết dƣới sự hƣớng dẫn
của PGS.TSKH. Trần Hoài Linh. Luận văn này đƣợc viết trên cơ sở nghiên cứu tổng
quan lý thuyết về việc ứng dụng mạng nơ-rôn nhân tạo để dự báo nhiệt độ của môi
trƣờng khu vực Thị xã Chí Linh, Hải Dƣơng.
Khi viết bản luận văn này, tác giả có tham khảo và kế thừa 1 số kết quả nghiên cứu
của các tác giả đi trƣớc và sử dụng những thông tin số liệu từ các tạp chí, sách, mạng
internet… theo danh mục tham khảo.
Tác giả cam đoan khơng có sự sao chép ngun văn từ bất kỳ luận văn nào hay

nhờ ngƣời khác viết. Tác giả xin hoàn toàn chịu trách nhiệm về cam đoan của mình và
chấp nhận mọi hình thức kỷ luật theo quy định của Trƣờng Đại học Bách khoa Hà Nội.
Hà Nội, ngày 8 tháng 8 năm 2016
TÁC GIẢ LUẬN VĂN

Vũ Quang Ngọc

ii


MỤC LỤC
LỜI CẢM ƠN.............................................................................................................................. i
LỜI CAM ĐOAN ....................................................................................................................... ii
MỤC LỤC .................................................................................................................................iii
DANH MỤC HÌNH VẼ ............................................................................................................. v
DANH MỤC BẢNG BIỂU ....................................................................................................... vi
CÁC TỪ VIẾT TẮT................................................................................................................. vii
MỞ ĐẦU .................................................................................................................................viii
CHƢƠNG I: TỔNG QUAN VỀ ĐO VÀ DỰ BÁO NHIỆT ĐỘ MÔI TRƢỜNG .................... 1
1.1. Giới thiệu chung .............................................................................................................. 1
1.2. Một số mơ hình dự báo nhiệt độ môi trƣờng ứng dụng mạng nơ-ron nhân tạo ............... 2
1.3 Kết luận chƣơng I ............................................................................................................. 5
CHƢƠNG II: MƠ HÌNH LAI VÀ ỨNG DỤNG TRONG ƢỚC LƢỢNG PHI TUYẾN ......... 6
2.1. Mơ hình lai [5, 6, 7] ......................................................................................................... 6
2.2. Chọn đặc tính đầu vào của mơ hình dự báo [8, 9, 10] ................................................... 14
2.2.1. Phƣơng pháp phân tích thành phần chính – PCA ................................................... 17
2.2.2. Phƣơng pháp phân tích sự khác biệt tuyến tính LDA ............................................. 18
2.2.3. Phƣơng pháp phân tích giá trị kỳ dị (SVD)............................................................. 18
2.3. Ứng dụng giải thuật SVD xây dựng khối tuyến tính [10].............................................. 19
2.4. Ứng dụng mạng MLP xây dựng khối phi tuyến [6, 11, 12, 13]..................................... 22

2.5 Kết luận chƣơng II .......................................................................................................... 30
CHƢƠNG III: LỰA CHỌN ĐẶC TÍNH ĐẦU VÀO VÀ ỨNG DỤNG MƠ HÌNH LAI CHO
DỰ BÁO NHIỆT ĐỘ NGÀY .................................................................................................. 31
3.1. Mơ hình dự báo nhiệt độ [6, 11, 12, 13] ........................................................................ 31
3.1.1. Các số liệu đầu vào.................................................................................................. 31
3.1.2. Mơ hình đề xuất của luận văn ................................................................................. 31
3.2. Quy trình xây dựng các mơ hình dự báo trong luận văn [13, 14] .................................. 31
3.2.1. Xây dựng mơ hình dự báo nhiệt độ Tmax ................................................................. 32
3.2.2. Xây dựng mơ hình dự báo nhiệt độ Tmin ................................................................. 36
3.3 Kết luận chƣơng III ......................................................................................................... 39
CHƢƠNG IV. CÁC KẾT QUẢ TÍNH TỐN, MƠ PHỎNG ................................................. 40
4.1. Bộ số liệu đầu vào sử dụng cho mơ hình dự báo ........................................................... 40
4.2. Kết quả mơ hình dự báo nhiệt độ Tmax ........................................................................... 40
4.3. Kết quả mơ hình dự báo nhiệt độ Tmin ........................................................................... 49
iii


4.4 So sánh và đánh giá kết quả ............................................................................................ 54
4.5 Kết luận chƣơng IV......................................................................................................... 55
KẾT LUẬN VÀ HƢỚNG NGHIÊN CỨU TIẾP THEO ......................................................... 57
1. Kết quả đạt đƣợc ............................................................................................................... 57
2. Hƣớng phát triển ............................................................................................................... 57
Tài liệu tham khảo .................................................................................................................... 59

iv


DANH MỤC HÌNH VẼ

Hình 1.1 Sơ đồ khối hệ dự báo thời tiết với ứng dụng của mạng nơ-rôn ................................... 3

Hình 1.2 Sơ đồ khối mơ hình dự báo nhiệt độ............................................................................ 4
Hình 2.1: Sơ đồ khối tổng thể của mơ hình lai ........................................................................... 6
Hình 2.2: Khối phi tuyến ở dạng tổng quát .............................................................................. 10
Hình 2.3: Khối phi tuyến kết hợp với sai số đầu ra của khối tuyến tính .................................. 10
Hình 2.4: Mơ hình mạng nơ-rơn truyền thẳng với hai lớp ẩn .................................................. 12
Hình 2.5: Mơ hình mạng nơ-rơn truyền thẳng với một lớp ẩn ................................................. 13
Hình 2.7: Cấu trúc khối trích chọn đặc tính ............................................................................. 15
Hình 2.8: Cấu trúc tổng quát các bƣớc thực hiện trích chọn đặc tính ...................................... 15
Hình 2.9: Cấu trúc mơ hình theo hƣớng Filter ......................................................................... 16
Hình 2.10: Cấu trúc mơ hình theo hƣớng Wrapper .................................................................. 16
Hình 2.11: Khơng gian mới đƣợc tạo ra qua phép biến đổi PCA............................................. 17
Hình 2.12: Xác định mạng MLP xấp xỉ hàm truyền của đối tƣợng ......................................... 23
Hình 4.1: Đồ thị thể hiện các thể hiện 4 ngày có ảnh hƣởng nhất đến giá trị Tmax của ngày dự
báo d. ........................................................................................................................................ 42
Hình 4.2: Kết quả ƣớc lƣợng khối tuyến tính của bộ số liệu học trong xác định Tmax ............. 44
Hình 4.3: Kết quả kiểm tra khối tuyến tính trong việc ƣớc lƣợng Tmax ................................... 45
Hình 4.4: Sai số của khối tuyến tính trong mơ hình ƣớc lƣơng Tmax đƣợc sử dụng làm đầu vào
của khối phi tuyến. ................................................................................................................... 47
Hình 4.5: Tín hiệu đầu ra của mạng MLP sau q trình học.................................................... 47
Hình 4.6: Tín hiệu đầu ra của mạng MLP qua quá trình kiểm tra ............................................ 48
Hình 4.7: Kết quả ƣớc lƣợng khối tuyến tính của bộ số liệu học trong xác định Tmin ............. 51
Hình 4.8: Kết quả kiểm tra khối tuyến tính trong việc ƣớc lƣợng Tmin .................................... 51
Hình 4.9: Sai số của khối tuyến tính trong mơ hình ƣớc lƣơng Tmin đƣợc sử dụng làm đầu vào
của khối phi tuyến. ................................................................................................................... 52
Hình 4.10: Tín hiệu đầu ra của mạng MLP sau quá trình học.................................................. 53
Hình 4.11: Tín hiệu đầu ra của mạng MLP qua quá trình kiểm tra .......................................... 53

v



DANH MỤC BẢNG BIỂU

Bảng 4.1. Kết quả các hệ số phụ thuộc tuyến tính ( có giá trị ảnh hƣởng lớn nhất của ngày d-1,
d-5,d-8, d-12 tới Tmax của ngày dự báo d .................................................................................. 41
Bảng 4.2. Sai số giữa mẫu gốc và tín hiệu tái tạo của mơ hình tuyến tính khi xác định Tmax .. 45
Bảng 4.4. Kết quả sai số tổng hợp mơ hình phi tuyến khi xác định Tmax ................................. 48
Bảng 4.5. Sai số giữa mẫu gốc và tín hiệu tái tạo của mơ hình tuyến tính khi xác định Tmin .. 52
Bảng 4.6. Sai số tổng hợp giữa mẫu gốc và tín hiệu tái tạo của mơ hình phi tuyến khi xác định
Tmin............................................................................................................................................ 53
Bảng 4.8. Một số kết quả theo bộ số liệu học của bài toán ƣớc lƣợng Tmax ............................. 54
Bảng 4.9. Một số kết quả trên bộ số liệu kiểm tra của bài toán ƣớc lƣợng Tmax ...................... 54
Bảng 4.10. Một số kết quả trên bộ số liệu học của bài toán ƣớc lƣợng Tmin ............................ 54
Bảng 4.11. Một số kết quả trên bộ số liệu kiểm tra của bài toán ƣớc lƣợng Tmin .................... 55

vi


CÁC TỪ VIẾT TẮT

Viết tắt

Tiếng Anh

Tiếng Việt

SST

Sea Surface Temperature

Nhiệt độ bề mặt biển


K-NN

K-Nearest Neighbors

K láng giềng gần nhất

MLP

Multi Layer Perceptron

Mạng nhiều lớp truyền thẳng

SVD

Singular Value Decomposition

Phƣơng pháp phân tích giá trị kỳ dị

LDA

Linear Discriminant Analysis

MDA

Multiple Discriminat Analysis

Phân tích đa đặc tính

PCA


Principal Component Analysis

Phƣơng pháp phân tích thành phần
chính

Phƣơng pháp phân tích sự khác
biệt tuyến tính

TMax

Nhiệt độ cao nhất trong ngày

Tmin

Nhiệt độ thấp nhất trong ngày

MRE

Mean Relative Error

Trung bình của sai số tƣơng đối

MAE

Mean Absolute Error

Trung bình của sai số tuyệt đối
Giá trị lớn nhất của sai số tuyệt đối


MaxAE Maximum Absolute Error

vii


MỞ ĐẦU
1. Lý do chọn đề tài
Môi trƣờng là một trong những vấn đề không chỉ ở Việt Nam mà các quốc gia trên
thế giới đang rất quan tâm tới. Hiện nay, mơi trƣờng đang bị ảnh hƣởng nghiêm trọng
vì sự phát triển nhanh của công nghiệp của tất cả các quốc gia trên thế giới và sự tàn
phá môi trƣờng của con ngƣời. Các nhà máy, cơng trình, xƣởng sản xuất đƣợc xây
dựng hàng ngày thải ra lƣợng khí thải, chất thải nguy hại dẫn đến môi trƣờng bị ô
nhiễm. Theo thống kê nhiệt độ trên toàn thế giới trong thế kỷ XIX đã tăng 0,8C . Thế
kỷ XX tăng 0,6  0, 2C . Theo các mơ hình nghiên cứu dự báo nhiệt độ Trái Đất trong
thế kỷ XXI sẽ tăng thêm 1,1  6, 4C [15]. Nhiệt độ môi trƣờng thay đổi sẽ dẫn tới các
hiện tƣợng thời tiết cực đoan nhƣ hạn hán, thiên tai, lũ lụt…
Dự báo thời tiết nói chung và nhiệt độ mơi trƣờng nói riêng có ý nghĩa rất lớn tới
sự sản xuất, đời sống sinh hoạt của con ngƣời. Trong luận văn này, tác giả sử dụng mơ
hình mạng lai gồm một khối tuyến tính và một mạng nơ-ron phi tuyến mắc song song
để thử nghiệm dự báo nhiệt độ tại khu vực Thị xã Chí Linh, Hải Dƣơng.
2. Mục đích nghiên cứu luận văn, đối tƣợng và phạm vi nghiên cứu
Nghiên cứu thực hiện hai vấn đề chính trong mơ hình thu thập, xử lý dự báo nhiệt
độ mơi trƣờng:
 Xây dựng mơ hình dự báo thơng số nhiệt độ dựa trên kết quả đo trong quá khứ
từ số liệu của các trạm khí tƣợng trong địa phƣơng đặt thiết bị đo.
 Nghiên cứu, áp dụng mạng nơ-ron trong xây dựng các mơ hình dự báo phi
tuyến.
 Đề xuất mơ hình dự báo nhiệt độ cho khu vực Thị xã Chí Linh, Hải Dƣơng.
3. Nhiệm vụ nghiên cứu
 Nghiên cứu và xây dựng mơ hình ƣớc lƣợng thơng số mơi trƣờng dựa trên các

kết quả đo trong quá khứ của các khu vực lân cân.
 Xây dựng mơ hình dự báo nhiệt độ môi trƣờng dựa trên kết quả đo trong q
khứ
 Nghiên cứu về một số mơ hình dự báo thơng số mơi trƣờng từ đó đề xuất mơ
hình dự báo thông số nhiệt độ.
viii


 Tính tốn mơ phỏng để thử nghiệm độ chính xác của mơ hình tốn học.
4. Nội dung trong luận văn
Nội dung của luận văn đƣợc chia thành bốn chƣơng có nội dung nhƣ sau:
 Chƣơng 1: Tổng quan về phƣơng pháp đo, dự báo và giới thiệu một số mơ hình
dự báo nhiệt độ mơi trƣờng đang đƣợc ứng dung trong nƣớc và quốc tế.
 Chƣơng 2: Giới thiệu về mơ hình lai, các phƣơng pháp trích chọn đặc tính đầu
vào của mơ hình, xây dựng khối tuyến tính và phi tuyến cho mơ hình dự báo.
 Chƣơng 3: Dựa vào những phân tích về ƣu và nhƣợc điểm của mơ hình lai
đƣợc phân tích và lựa chọn ở chƣơng 2 tác giả xây dựng mơ hình dự báo nhiệt
độ môi trƣờng với việc xác định thông số đầu vào, đầu ra. Luận văn sử dụng
thuật toán SVD để xây dựng hệ số của khối dự báo khối tuyến tính, mạng nơrơn nhân tạo để xây dựng khối phi tuyến trong mơ hình dự báo.
 Chƣơng 4: Từ những phân tích ở chƣơng 3, nội dung chƣơng 4 sẽ trình bày về
mơ hình lai trong dự báo nhiệt độ ngắn hạn cho khu vực Thị xã Chí Linh, Hải
Dƣơng. Bộ số liệu nghiên cứu đƣợc lấy trong thời gian từ 1/2010 đến tháng
12/2015. Kết quả đo này đƣợc dùng để làm mẫu tín hiệu của nhiệt độ cao nhất
và thấp nhất trong ngày. Từ đó so sánh với mơ hình dự báo đƣợc đề xuất.

 Kết luận: Trình bày kết quả của luận văn đạt đƣợc và hƣớng phát triển tiếp
theo của luận văn. Phần phụ lục diễn giải cụ thể các ví dụ đƣợc đƣa ra trong
luận văn.

ix



CHƢƠNG I: TỔNG QUAN VỀ ĐO VÀ DỰ BÁO NHIỆT ĐỘ MÔI TRƢỜNG
1.1 . Giới thiệu chung
Hiện nay, trên thế giới có rất nhiều mơ hình thu thập, xử lý và dự báo thơng số mơi
trƣờng nói chung và nhiệt độ nói riêng [1, 2, 3, 15, 16] đƣợc đƣa vào ứng dụng trong
dự báo nghiệp vụ tại nhiều trung tâm dự báo thời tiết. Các phƣơng pháp dự báo thời
tiết đƣợc chia làm bốn nhóm phƣơng pháp chính:
- Phương pháp Synôp là phƣơng pháp thu thập số liệu tại trạm khí tƣợng trên
diện rộng có thể ở cả một quốc gia hoặc trên nhiều quốc gia liền kề nhau. Từ các
phƣơng pháp thu thập và xây dựng thành bản đồ thời tiết, các chuyên gia thời tiết sẽ
kết hợp bản đồ này và các thông tin bổ trợ của các mơ hình dự báo nhƣ mơ hình số,
ảnh mây vệ tinh… để tham chiếu đƣợc các trạng thái thời tiết ở các thời điểm trong
tƣơng lai. Phƣơng pháp này khơng địi hỏi các điều kiện tốt về số liệu và cơng cụ tính
tốn, nhƣng lại có hạn chế là mang tính chủ quan cao, dựa nhiều vào kinh nghiệm của
các chuyên gia dự báo. Việc phân tích và dự báo một lƣợng dữ liệu thời tiết lớn và có
nhiều biến đổi sẽ gặp rất nhiều khó khăn. Hiện nay, phƣơng pháp này vẫn đang đƣợc
áp dụng chủ yếu tại Việt Nam.
- Phương pháp thống kê[2] là phƣơng pháp đơn giản nhất trong việc dự báo các
yếu tố bất thƣờng so với khí hậu trung bình. Quy mơ dự báo theo tháng hoặc theo mùa.
Phƣơng pháp này liên kết các đặc tính khí hậu ở hiện tại với các mơ hình thời tiết
trong tƣơng lai. Những yếu tố bất thƣờng ở đây là những yếu tố trong thời tiết biến đổi
chậm và có quy mơ lớn của khí hậu tồn tại trong nhiều tháng và làm thay đổi hình thế
hồn lƣu trung khí quyển. Từ đó các sai lệch đƣợc so sánh với trạng thái trung bình
của khí hậu tại nơi thống kê. Phƣơng pháp này có ƣu điểm là mang tính chất khách
quan, đơn giản, khơng địi hỏi các điều kiện về số liệu ban đầu cũng nhƣ công cụ tính
tốn và dễ xây dựng mơ hình cũng nhƣ sử dụng trong nghiệp vụ. Tuy nhiên, phƣơng
pháp này có đặc điểm là coi những quá trình xảy ra ở hiện tại và tƣơng lai đều tuân
theo các quy luật thu đƣợc từ tập số liệu trong quá khứ, dẫn tới kết quả của mơ hình dự
báo phụ thuộc nhiều vào độ dài tập mẫu. Phƣơng pháp này không thể dự báo tức thời

các yếu tố đột biến nhanh nhƣ việc chuyển dịch nhiệt độ tức thời từ nóng sang lạnh và
ngƣợc lại… Và một nhƣợc điểm cuối cùng là bộ số liệu sử dụng quá ngắn hoặc qua
dài cũng sẽ gây ra hiện tƣợng mất ổn định thống kê và dự báo không chuẩn xác.
1


- Phương pháp số trị (Phương pháp động lực học khí quyển): Hƣớng tiếp cận của
phƣơng pháp số trị trong dự báo là sử dụng các mơ hình hồn lƣu chung trong khí
quyển. Bƣớc đầu tiên là việc dự báo sự phát triển của nhiệt độ mặt biển SST (Sea
Surface Temperature) trong vùng nhiệt đới vùng thuộc vùng biển Thái Bình Dƣơng.
Hình thế dự báo đƣợc kết hợp với mơ hình hồn lƣu chung khí quyển để dự báo thời
tiết toàn cầu. Phƣơng pháp này dựa trên việc giải các phƣơng trình tốn học mơ tả
trạng thái của khí quyển để đƣa ra đƣợc các yếu tố thời tiết trong tƣơng lai, cho phép
dự báo các trƣờng khí tƣợng thơng qua việc tích phân các phƣơng trình mơ tả động lực
học khí quyển một cách khách quan, tính đƣợc các biến khí tƣợng một cách định
lƣợng. Phƣơng pháp dự báo này đƣợc áp dụng với dự báo thời tiết dài hạn theo tháng
hoặc theo mùa và có quy mơ khu vực và toàn cầu. Khu vực đƣợc phát triển và ứng
dụng mạnh mẽ trong dự báo thời tiết ở Mỹ, Úc, Nhật Bản, Liên bang Nga, các nƣớc
Châu Âu,...
- Phương pháp dự báo tổng hợp (Ensemble Forecast). Dự báo tổng hợp là một
hƣớng mới đang đƣợc phát triển rất mạnh tại các trung tâm dự báo khí tƣợng nghiệp
vụ trên thế giới. Với việc coi khí quyển có thể đƣợc cảm nhận và mô phỏng (bởi các
kết quả quan trắc và các mơ hình số trị) có bản chất là một hệ thống tập hợp thống kê
thay vì là một hệ xác định, do đó, đặc trƣng thống kê của tập hợp các dự báo khác
nhau sẽ cho kết quả tin cậy hơn của từng dự báo riêng biệt.
1.2. Một số mơ hình dự báo nhiệt độ mơi trƣờng ứng dụng mạng nơ-ron nhân tạo
Việc ứng dụng mạng nơ-rôn nhân tạo vào các bài toán dự báo là một trong những
hƣớng phát triển tƣơng đối mới. Hƣớng phát triển này đã và đang là những vấn đề
nghiên cứu của nhiều nhà khoa học trong nƣớc và quốc tế. Sau đây là một số mơ hình
tiêu biểu ứng dụng mạng nơ-rơn vào mơ hình dự báo:

1.2.1. Mơ hình dự báo thời tiết sử dụng mạng nơ-rôn truyền thẳng.
Theo bài bài báo “Hệ dự báo thời tiết với ứng dụng của mạng nơ-rơn nhân tạo” [4]
nhóm tác giả đã sử dụng mơ hình dự báo dựa trên mạng truyền thẳng nhiều lớp (Multi
Layer Perceptron) để xây dựng mơ hình dự báo
Bài tốn dự báo dựa trên 6 thông số thời tiết sau:
1 Nhiệt độ: đơn vị là °C.

2


2 Độ ẩm: tính theo %.
3 Mƣa: tính theo % (tùy theo mƣa to hay nhỏ).
4 Hƣớng gió: đơn vị là độ.
5 Tốc độ gió: đơn vị là km/h.
6 Mây: tính theo % (tùy theo nhiều mây hay ít).
Dữ liệu đầu vào là các thông số thời tiết của một ngày.
Dữ liệu đầu ra là các thông số thời tiết của ngày tiếp theo.
Dữ liệu đƣợc huấn luyện trong 3 tháng (6,7 và 8 năm 2008) tại trạm khí tƣợng thủy
văn Vĩnh Phúc.

Hình 1.1 Sơ đồ khối hệ dự báo thời tiết với ứng dụng của mạng nơ-rôn
Mạng nơ-rôn đƣợc sử dụng vơi 3 lớp ẩn: lớp đầu vào, lớp ẩn, và lớp đầu ra. Mục
tiêu hƣớng đến của mô hình là dự báo 6 thơng số thời tiết: Nhiệt độ, độ ẩm, lƣợng
mƣa, hƣớng gió, tốc độ gió và mây. Sử dụng thuật tốn lan truyền ngƣợc.
Nhóm tác giả đã đƣa ra 4 thử nghiệm để đƣa ra bộ thông số mạng ƣu việt nhất với
hằng số học 0,8, số nơ-rôn lớp ẩn là 18, khoảng khởi tạo trọng số 0,7  0,7 thời gian
huấn luyện trung bình là 9 tiếng.
1.2.2. Mơ hình dự báo nhiệt độ mơi trƣờng thủ đô Hà Nội sử dụng mạng nơ-rôn
truyền thẳng.
Tƣơng tự nhƣ mơ hình dự báo đƣợc tóm tắt ở mục 1.2.1, mơ hình dự báo nhiệt độ

mơi trƣờng thủ đơ Hà Nội cũng lựa chọn sử dụng mạng truyền thẳng nhiều lớp nhƣng
kết hơp thêm với phƣơng pháp hồi quy tuyến tính. Các thơng số chi tiết sau:
Bộ số liệu đầu vào gồm:
1 Số giờ nắng
3


2 Độ ẩm
3 Lƣợng mƣa
Dữ liệu đầu vào là các thông số nhiệt độ dữ liệu sử dụng trong luận văn đƣợc lấy từ
Website của Tổng cục Thống kê Dữ liệu thu thập đƣợc gồm dữ liệu về số giờ nắng, độ
ẩm, lƣợng mƣa, nhiệt độ của Lai Châu, Sơn La, Tuyên Quang, Hà Nội, Bãi Cháy, Nam
Định, Vinh, Huế, Đà Nẵng, Qui Nhơn, Pleiku, Đà Lạt, Nha Trang, Vũng Tàu và Cà
Mau. Dữ liệu thống kê qua 10 năm từ năm 2002 đến năm 2011. Dữ liệu ở đây là dữ
liệu trung bình đƣợc đo từ các trạm quan sát của các địa phƣơng .
Dữ liệu đầu ra là nhiệt độ trung bình của các tháng tại khu vực Hà Nội
Mạng nơ-rôn đƣợc xây dựng với 3 lớp, một lớp đầu vào, một lớp ẩn và một lớp đầu
ra. Số nơ-rôn trong lớp ẩn của mạng đƣợc xác định là 20 nơ-rơn. Hàm kích hoạt đƣợc
sử dụng là sigmoid đơn cực và đƣợc huấn luyện bằng thuật toán lan truyền ngƣợc

Hình 1.2 Sơ đồ khối mơ hình dự báo nhiệt độ
Tác giả sử dụng 3 phƣơng pháp kiểm tra sai số mơ hình dự báo là:
 Sai số thấp nhất MAE (Mean Square Error)
 Sai số căn quân phƣơng RMSE (Root Mean Square Error)
 Sai số tuyệt đối MAE (Mean Absolute Error)
Tác giả đã thử nghiệm trên nhiều phƣơng pháp khác nhau nhƣ:
 Mạng MLP độc lập
 Mạng MLP kết hợp phƣơng pháp hồi quy
 Phƣơng pháp K-NN (K-Nearest Neighbors)


4


Qua đó kết quả phƣơng pháp lai giữa mạng MLP và hồi quy tuyến tính cho kết quả
dự báo tốt nhất
1.3 Kết luận chƣơng I
Trong chƣơng I của luận văn tác giả đã tiến hành nghiên cứu tổng quan về các vấn
đề:
 Tổng quan về các phƣơng pháp dự báo dự báo thời tiết đã và đang đƣợc sử
dụng hiện nay.
 Khái quát các phƣơng pháp dự báo thời tiết ứng dụng mang nơ-ron nhân tạo
nêu ra các đặc điểm cơ bản, của các mơ hình dự báo.
Hiện nay, có rất nhiều phƣơng pháp dự báo thời tiết nói chung và nhiệt độ mơi
trƣờng nói riêng. Mỗi phƣơng pháp đều có ƣu điểm và nhƣợc điểm về mức độ chính
xác và phức tạp trong q trình tính tốn. Tác giả đề xuất sử dụng mơ hình lai gồm:
mạng nơ-rơn nhân tạo để ƣớc lƣợng khối phi tuyến, khối tuyến tính của mơ hình dự
báo với các hệ số đƣợc xác định từ phƣơng pháp phân tích giá trị kỳ dị (SVD –
Singular Values Decomposition). Các phân tích cụ thể về mơ hình này sẽ đƣợc tác giả
trình bày trong chƣơng II và III của luận văn.

5


CHƢƠNG II: MƠ HÌNH LAI VÀ ỨNG DỤNG TRONG ƢỚC LƢỢNG PHI
TUYẾN
Nhƣ đã giới thiệu trong chƣơng I, trong chƣơng II sẽ trình bày chi tiết về mơ hình
lai và làm rõ việc xây dựng khối ƣớc lƣợng khối tuyến tính và phi tuyến cũng nhƣ đề
xuất về việc lựa chọn các đặc tính đầu vào cho mơ hình.
2.1. Mơ hình lai [5, 6, 7]
Mơ hình lai hay mơ hình hỗn hợp là sự kết hợp giữa hai hay nhiều mơ hình, thuật

tốn riêng lẻ với nhau để tăng khả năng giải quyết một nội dung phức tạp một cách
chính xác và tốt hơn. Sự kết hợp các mơ hình phù hợp sẽ tích hợp và bổ trợ các đặc
tính ƣu việt của từng mơ hình và góp phần làm giảm thiểu đi các đặc tính xấu khơng
mong muốn xuất hiện ở từng mơ hình riêng lẻ. Trong luận văn này, tác giả sử dụng mơ
hình lai kết hợp đồng thời 2 khối là khối tuyến tính và khối phi tuyến nhƣ hình 2.1.

Hình 2.1: Sơ đồ khối tổng thể của mơ hình lai
Khi có tín hiệu đầu vào x thì tín hiệu đầu ra tổng hợp mơ hình sẽ đƣợc tính bằng:
d  y  f  x   Linear (x)  Nonlinear  x   f1 (x)  f 2 (x)

(2.1)

với f1 (x) là khối tuyến tính trong mơ hình

f 2 (x) là khối phi tuyến trong mơ hình
a) Khối tuyến tính
Khối tuyến tính trong mơ hình đƣợc giả sử có véc-tơ tín hiệu đầu vào (x), với

x  [x1 , x2 ,..., xn ] là các số liệu quá khứ, với các hệ số tuyến tính ai đƣợc xác định để
tính tốn tín hiệu đầu ra là d.

6


N

Ta có:

a0   xi  ai  d
i 1


Khi ta có tập mẫu (p  1) của khối tuyến tính sẽ có dạng:

x1   x11 , x12 ,..., x1n  , d1






x p   x p1 , x p 2 ,..., x pn  , d p

(2.2)

Đảm bảo điều kiện khi ta đƣa x1 với các hệ số ai ta thu đƣợc tín hiệu đầu ra của
khối tuyến tính xấp xỉ bằng tín hiệu d1. Tƣơng tự nhƣ với x2, x3 …, xp .Ta thể hiện tín
hiệu đầu ra (d) dƣới dạng hệ phƣơng trình tuyến tính tổng quát:

a0  x11a1  x12 x2  ...  x1n an  d1

a0  x21a1  x22 x2  ...  x2 n an  d 2

...
a0  x p1a1  x p 2 a2  ...  x pn an  d p


(2.3)

Chuyển hóa hệ phƣơng trình (2.3) về dạng ma trận ta sẽ có:
 x11


 x21


 xn1

 x11

x
Ta đặt: X   21

 xn1

x12
x22
xn 2

x12
x22
xn 2

x1 p   a   d1 
1
    
x2 p  a2
d
  2

    
    

xnp   ak   d p 

(2.4)

x1 p 
 d1 
 a1 

d 


x2 p 
a2 
 2

;
;
a

b


 
 

 
 
xnp 
 ak 
 d p 


Khi đó (2.4) sẽ tƣơng đƣơng với: X  a  d
Bài toán đặt ra phải xác định các hệ số ai sao cho giá trị xấp xỉ tốt nhất. Khi đó
nghiệm của hệ phƣơng trình này đƣợc xác định từ bài tốn tối ƣu hóa sai số.

d  X  aopt  min d  X  a
x

7

(2.5)


Luận văn này sẽ sử dụng phƣơng pháp bình phƣơng cực tiểu xác định giá trị sai số
tối thiểu.
Phƣơng pháp bình phƣơng cực tiểu là phƣơng pháp thƣờng đƣợc sử dụng để giải
xấp xỉ các hệ phƣơng trình mà trong đó số phƣơng trình nhiều hơn số ẩn. Cơ sở lý
thuyết của phƣơng pháp là xác định xấp xỉ nghiệm bằng cách tối thiểu hóa sai số
thƣờng đƣợc xác định bằng một hàm bậc 2.
Xét hệ phƣơng trình tuyến tính với n ẩn và m phƣơng trình ta có điều kiện để thực
hiện phƣơng pháp (m>n).
{x  R n X  a  d} , với X  R mn , d  R m

ở đây X là ma trận m  n , a và d các là véc-tơ.
Với bài tốn ở dạng này đƣợc xem là vơ nghiệm. Vậy để X  a  d thì véc-tơ d cần
phải là tổ hợp tuyến tính của các cột trong ma trận X, hay d  range(X) . Trong đó
véc-tơ b thuộc khơng gian m chiều, trong đó, số chiều lớn nhất của ma trận X chỉ là n.
Nên ta có, d  range(X) đƣợc coi là trƣờng hợp đặc biệt đƣợc gán giá trị.
Vì vậy trong trƣờng hợp tổng qt, ta sẽ khơng đi tìm nghiệm của hệ phƣơng trình,
thay vào đó ta cực tiểu hóa véc-tơ sai số. Véc-tơ sai số này đƣợc tổng quát hóa dƣới

dạng sau:
d  X  aopt

2

 r  min d  X  a

2

(2.6)

x

với r  R , véc-tơ r đƣợc lựa chọn sao cho có giá trị nhỏ nhất bằng cách chọn giá trị a
m

thích hợp.
Để giải bài tốn bình phƣơng cực tiểu ta có rất nhiều phƣơng pháp tác giả xin đƣa
ra một số phƣơng pháp thƣờng đƣợc áp dụng hiện nay nhƣ: giải bài bình phƣơng cực
tiểu theo phƣơng pháp Cholesky, theo phân tích QR và theo phân tích SVD.
 Thuật tốn phân tích Cholesky phân tích ma trận X xác định dƣơng thành tích
của hai ma trận.

X  X  R  R

8

(2.7)



với R là ma trận tam giác trên. Phƣơng pháp này có ƣu điểm tốc độ xử lý tính
tốn nhanh, có khối lƣợng tính tốn lớn, q trình thực hiện phức tạp, yêu cầu
điều kiện tích của hai ma trận XT .X phải đủ hạng và có tính ổn định. Sai số của
phƣơng pháp này sẽ cao hơn hai phƣơng pháp QR và SVD do sai số đƣợc làm
tròn.
 Phƣơng pháp QR: là dựa trên việc phân tích ma trận
X  QR

(2.8)

với Q là ma trận trực giao, R là ma trận tam giác trên. Phƣơng pháp QR có tốc
độ xử lý chậm hơn so với phƣơng pháp Cholesky, nhƣng phƣơng pháp này có
thể xử lý tốt các bài tốn có ma trận X khơng đủ hạng đồng thời tính ổn định
cao hơn so với phƣơng pháp Cholesky.
 Phƣơng pháp SVD (Singular Value Decomposition) đƣợc hiểu nhƣ sau: với mọi
ma trận X có phân tích SVD là:

X  U  S  V

(2.9)

thì ma trận X  U  S  V là ma trận nghịch đảo của mở rộng của X. Với S+ là
ma trận nghịch đảo của S. Phƣơng pháp là một công cụ rất mạnh để giải quyết
các bài tốn khi ma trận X có độ ổn định thấp. Việc sử dụng phƣơng pháp này
sẽ cho kết quả chính xác hơn và ổn định cao hơn.
Trong luận văn tác giả đề xuất sử dụng phƣơng pháp bình phƣơng cực tiểu để xây
dựng khối tuyến tính và sử dụng phƣơng pháp phân tích giá trị kì dị SVD để giải quyết
bài tốn bình phƣơng tối thiểu.
Khối tuyến tính f1 ( x) đƣợc đề xuất xác định đầu tiên. Các số liệu đầu vào có ảnh
hƣởng lớn, quyết định đến kết quả ƣớc lƣợng tuyến tính sẽ đƣợc sử dụng làm số liệu

đầu vào để của mơ hình phi tuyến f 2 ( x) .
b) Khối phi tuyến
Giải quyết bài toán phi tuyến là việc xác định giá trị gần đúng. Việc ƣớc lƣợng và
xác định các thông số của mơ hình phi tuyến: Q trình xác định các thơng số của mơ
hình phi tuyến là một q trình tối ƣu hóa sai số trên các số liệu mẫu cho trƣớc.
9


Khối phi tuyến trong mơ hình đề xuất đƣợc giả sử với tín hiệu đầu vào là (x), với

x  [x1 , x2 ,..., xn ] là các số liệu quá khứ và bằng tín hiệu đầu ra của khối tuyến tính là
(d) với d  [d1 , d2 ,..., d p ] vậy ta xây dựng khối phi tuyến f 2 ( x) với đầu ra tín hiệu là
y (t 1)  d (t 1)

f 2 (x)  d  f1 (x)

(2.10)

Hình 2.2: Khối phi tuyến ở dạng tổng quát
Khi xác định đƣợc giá trị f1(x) ta thực hiện loại thành phần này ra khỏi các số liệu
đầu vào để nhằm chỉ giữ lại khối phi tuyến trong tín hiệu của đối tƣợng đầu vào. Tín hiệu
cịn lại này sẽ đƣợc dùng để huấn luyện mơ hình phi tuyến.

Hình 2.3: Khối phi tuyến kết hợp với sai số đầu ra của khối tuyến tính
Sai số đầu ra của khối tuyến tính đƣợc xác định nhƣ sau:

E

2
1 p

f 2 (xi )   d  f1 (xi )   min

2 i 1

(2.11)

Hiện này, có rất nhiều phƣơng pháp ƣớc lƣợng khối phi tuyến đƣợc sử dụng nhƣng
mỗi phƣơng pháp đều có những ƣu việt và nhƣợc điểm về độ phức tạp trong tính tốn,
mức độ chính xác. Việc lựa chọn ứng dụng mạng nơ-rơn vào xử lý bài tốn khối phi
tuyến dựa trên các ƣu điểm sau: tính mềm dẻo trong tính tốn, dễ thích nghi… Ngồi
10


ra, mạng có tính ứng dụng đa dạng trong nhiều lĩnh vực. Đặc biệt là các bài toán nhận
dạng mẫu, xử lý, lọc dữ liệu, điều khiển và dự báo. Ứng dụng của mạng nơ-rôn đƣợc
chia thành các hƣớng sau:
 Xử lý ngôn ngữ nhƣ: Xử lý ngôn ngữ tự nhiên
 Nhận dạng mẫu
-

Nhận dạng đối tƣợng tuyến tính

-

Nhận dạng đối tƣợng phi tuyến

-




 Xử lý tín hiệu: Điều khiển tự động…
 Lọc và phân loại dữ liệu
-

Chẩn đốn bệnh

-

Tìm kiếm

 Dự báo:
-

Dự báo các yếu tố môi trƣờng

-

Dự báo phụ tải điện

Nhận thấy đƣợc những hƣớng và khả năng ứng dụng rộng rãi của mang nơ-rôn.
Tác giả đã sử dụng mạng nơ-rôn nhân tạo cụ thể là mạng nơ-rôn truyền thẳng nhiều
lớp làm công cụ xử lý khối phi tuyến của mơ hình đề xuất.
a) Mạng MLP
Mạng nơ-rơn nhân tạo ANN (Artificial Neural Network) đƣợc thiết kế dựa trên
một số tính chất của mạng nơ-rơn sinh học đƣợc ứng dụng rộng rãi trong nhiều vấn đề
kỹ thuật. Đây là một phƣơng pháp tốt để giải quyết các bài toán trong xử lý tín hiệu.
Mạng nơ-rơn nhân tạo có các đặc tính ƣu việt sau:
 Có khả năng tạo hàm truyền phi tuyến đa biến với độ chính xác cho trƣớc.
 Cấu trúc mạng nơ-rôn dạng truyền thẳng và cấu trúc có phản hồi dễ dàng lựa
chọn cho các đối tƣợng có đặc tính có nhớ hoặc khơng có nhớ.

 Trang bị nhiều thuật toán học cho mạng giúp tăng khả năng điều chỉnh thích
nghi các thơng số để thích nghi với các bộ số liệu tĩnh hoặc động phù hợp hơn
với u cầu bài tốn.
 Có khả năng tổng qt hóa để hoạt động hiệu quả với các tín hiệu đầu vào mới,
chƣa xuất hiện trong quá trình xây dựng mơ hình.
11


Bên cạnh những ƣu điểm trên mạng còn tồn tại một số những nhƣợc điểm sau:
 Đối với mơ hình mạng lớn nhiều lớp độ phức tạp lớn dẫn tới thời gian xử lý lâu.
 Bộ trọng số thu đƣợc thƣờng chƣa tối ƣu tồn cục
 Q trình học thu đƣợc có thể xảy ra trƣờng hợp khơng hoặc hội tụ chậm do
vậy cần kết hợp thêm các thuật toán hỗ trợ để tăng khả năng hội tụ cho mơ
hình.
Mạng nơ-rơn với ƣu điểm có khả năng học dƣới nhiều hình thức, tổng qt hóa dữ
liệu thơng qua mẫu học và cấu trúc tính tốn dựa trên liên kết nhiều lớp xử lý đa dạng
đƣợc liên kết chặt chẽ với nhau tạo nên tính mềm dẻo cho mơ hình. Bộ số liệu học
mẫu của mạng nơ-rôn là những số liệu cụ thể.
Mạng nơ-rôn MLP là một mạng truyền thẳng với các khối cơ bản là các nơ-rôn
MCCulloch-Pitts. Một số yêu cầu về cấu trúc một mạng MLP:
 Một mạng MLP có n lớp với ( n  2 ).Trong đó gồm có một lớp các tín hiệu đầu
vào (Input layer). Một lớp các tín hiệu đầu ra (Output layer) và một hoặc nhiều
lớp ẩn trung giang giữa đầu vào và đầu ra (Hidden layers)
 Trên cùng một lớp sẽ không có sự liên kết giữa các nơ-rơn. Các ghép nối liên
kết sẽ đƣợc tạo sao cho tín hiệu truyền thẳng từ đầu vào đến đầu ra.
 Các nơ-rôn trên cùng một lớp có cùng chung một hàm truyền đạt.

Hình 2.4: Mơ hình mạng nơ-rơn truyền thẳng với hai lớp ẩn
Hoạt động cơ bản của mạng MLP: Lớp đầu vào nhận tín hiệu đƣợc khuếch đại,
xác định tổng trọng số kết nối Wi và gửi tới hàm kích hoạt f (activation function). Kết

quả của hàm truyền đƣợc truyền tới các nơ-rôn của lớp đầu tiên. Tại đây các nơ-rôn sẽ
12


nhận tín hiệu, xử lý và tiếp tục gửi kết quả đến lớp nơ-rôn tiếp theo cho đến lớp cho tín
hiệu đầu ra.
Qua các báo cáo và nghiên cứu đã chứng minh đƣợc thông thƣờng chỉ cần sử dụng
đa số 1 lớp ẩn hoặc tối đa 2 lớp ẩn để mơ hình hóa một hàm phi tuyến với độ chính xác
tùy chọn. Viêc sử dụng quá nhiều lớp ấn sẽ phức tạp mơ hình. Trong khn khổ đề tài
tác giả đề suất sử dụng mạng MLP với một lớp ẩn.
Một đặc điểm cơ bản của mạng MLP một lớp ẩn:
 Mạng MLP 1 lớp ẩn gồm có: N đầu vào tín hiệu, M số nơ-rơn thuộc lớp ẩn và
K số nơ-rôn lớp đầu ra.
 Trọng số ghép nối lớp đầu vào lớp ẩn đƣợc quy ƣớc là Wij với i=1,2,…,M và
j=1,2,…,N. Trọng số ghép nối lớp ẩn với lớp đầu ra là Vij với i=1,2, …,K và
j=1,2, …M. Từ đó ta xác định đƣợc ma trận trọng số các ghép nối đầu vào lớp
ẩn là W  R M ( N 1) và ma trận ghép nối lớp ẩn và lớp đầu ra là V  R K ( M 1) .

 Hàm kích hoạt lớp ẩn f1 , hàm kích hoạt lớp đầu ra f 2 .

Hình 2.5: Mơ hình mạng nơ-rơn truyền thẳng với một lớp ẩn
Ta có véc-tơ đầu vào x  [x1 , x1 ,..., xn ] R N với đầu vào phân cực cố định x0=1.
Đầu ra của tín hiệu đƣợc xác định tuần tự theo chiều lan truyền thuận nhƣ sau:
1. Tổng các kích thích đầu vào của nơ-rơn ẩn thứ i (với i=1,2,…,M):
M

ui   x jWij
j 0

13


(2.11)


2. Tổng đầu ra của nơ-rôn lớp ẩn thứ i (với i=1,2,…,M):
vi  f1  ui 

(2.12)

Ta coi đầu vào phân cực cho các nơ-rôn lớp ra là v0  1 để thuận cho việc biểu
diễn cơng thức.
3. Tổng kích thích đầu vào của nơ-rơn đầu ra thứ i (với i=1,2,…,K):
M

gi   v jVij
j 0

(2.13)

4. Tính tốn đầu ra thứ i của mạng (với i=1,2,…,K)
Ta xác định đƣợc hàm truyền đạt của mạng MLP là một hàm phi tuyến:
 N   N
M

M

 
yi  f 2  gi   f 2   v jVij   f 2   f1 u j Vij   f 2    f1   xkW jk Vij  
 j 0


 j 0

 j 0   k 0
   (2.14)




 

 

2.2. Chọn đặc tính đầu vào của mơ hình dự báo [8, 9, 10]
Trích chọn đặc tính đầu vào là một bƣớc rất quan trọng trong q trình nhận
dạng, điều khiển tín hiệu hay dự báo… sau khi đƣợc thu thập bằng cách loại bỏ những
thơng tin đặc trƣng có rất ít hoặc khơng có thơng tin dự đốn. Các giá trị đƣợc chọn
lọc hỗ trợ rất lớn cho quá trình xử lý, nhận dạng tín hiệu. Trích chọn tín hiệu đầu vào
giúp làm giảm kích cỡ của khơng gian đặc trƣng, loại bỏ các tín hiệu nhiễu, thừa từ
q trình đo mang lại. Trong đa số các phƣơng pháp chọn đặc tính đầu vào tín hiệu để
đảm bảo tăng độ chính xác và làm giảm tính phức tạp của các thuật tốn phải đảm bảo
yêu cầu sau:
 Các véc-tơ đặc trƣng của đối tƣợng đƣợc chọn cần phải đảm bảo nhỏ và gọn
hơn nhiều so với đối tƣợng gốc nhƣng vẫn đảm bảo đƣợc thơng tin.
 Thời gian tính tốn các đặc trƣng phải phù hợp với thực tế áp dụng, không quá
phức tạp để giảm hiệu quả hoạt động và tăng thời gian đáp ứng của hệ thống.

14



×