Tải bản đầy đủ (.pdf) (69 trang)

Nghiên cứu ứng dụng thuật toán di truyền (genetic algorithm) trong dự

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.67 MB, 69 trang )

MỤC LỤC
DANH MỤC CHỮ VIẾT TẮT................................................................................. iii
DANH MỤC BẢNG .................................................................................................. iv
DANH MỤC HÌNH ................................................................................................v
MỞ ĐẦU ..................................................................................................................... 1
CHƢƠNG 1: TỔNG QUAN ....................................................................................... 3
1.1. Mạng thần kinh nhân tạo (ANN) ...................................................................4
1.1.1.

Giới thiệu về mạng thần kinh nhân tạo ...............................................4

1.1.2.

Mô hình mạng thần kinh nhân tạo .......................................................8

1.1.2.1. Huấn luyện và xây dựng mạng ........................................................8
1.1.2.2. Các vấn đề khi xây dựng kiến trúc mạng ........................................9
1.1.3.

Mạng nơ-ron truyền thuận (FFNN) ...................................................11

1.2. Thuật toán di truyền (GA) ...........................................................................12
1.2.1.

Cơ chế của GA ..................................................................................12

1.2.2.

Quy trình GA đơn giản ......................................................................16

1.3. Ứng dụng GA trong ANN ...........................................................................16


CHƢƠNG 2: PHƢƠNG PHÁP NGHIÊN CỨU ...................................................... 23
2.1. Chuẩn bị dữ liệu nghiên cứu........................................................................24
2.2. Thiết kế và chạy mô hình ............................................................................27
2.2.1.
2.2.1.1

Thiết kế và chạy mô hình FFNN .......................................................27
Cấu trúc mạng ................................................................................27

2.2.1.2. Thiết kế mạng trên chƣơng trình Matlab .......................................28
2.2.1.3. Đào tạo mạng .................................................................................29
2.2.2.

Thiết kế và chạy mô hình FFNN có kết hợp GA ..............................29

2.2.2.1. Tham số của GA ............................................................................31
2.2.2.2. Thiết kế mạng trên chƣơng trình Matlab .......................................31
2.3. Đánh giá độ tin cậy của mô hình .................................................................33
CHƢƠNG 3: KẾT QUẢ VÀ THẢO LUẬN ............................................................ 36
3.1. Dự báo chất lƣợng không khí sử dụng FFNN ................................................36
3.1.1. Dự báo đối với SO2 .................................................................................36
3.1.1.1. Mối tƣơng quan về xu hƣớng diễn biến của SO2 ..........................36
i


3.1.1.2. Độ tin cậy của mô hình đối với SO2 ..............................................38
3.1.2.

Dự báo đối với PM10 .........................................................................39


3.1.2.1. Mối tƣơng quan về xu hƣớng diễn biến của PM10.........................39
3.1.2.2. Độ tin cậy của mô hình đối với PM10 ............................................42
3.2. Dự báo chất lƣợng không khí sử dụng FFNN kết hợp với GA ...................43
3.2.1.

Dự báo đối với SO2 ...........................................................................43

3.2.2.

Dự báo đối với PM10 .........................................................................45

3.3. Bù dữ liệu nồng độ chất ô nhiễm khuyết thiếu ............................................47
KẾT LUẬN ............................................................................................................... 50
TÀI LIỆU THAM KHẢO ......................................................................................... 51
PHỤ LỤC .................................................................................................................. 55

ii


DANH MỤC CHỮ VIẾT TẮT

ANN:

Mạng thần kinh nhân tạo (Artificial Neural Network)

GA:

Thuật toán di truyền (Genetic Algorithm)

FFNN:


Mạng thần kinh truyền thuận (FeedForward Neural Network)

PCA

Phân tích thành phần chính (Principal Component Analysis)

MLP

Mạng thần kinh nhân tạo đa lớp (Multi Layer Peceptron)

SPSS

Chƣơng trình chuyên dụng phục vụ cho xử lý và phân tích số
liệu thống kê (Statistical Package for Social Sciences)

ARIMA

Mô hình tự hồi quy tích hợp trung bình trƣợt (AutoRegressive
Intergrated Moving Average)

FL

Logic mờ (Fuzzy Logic)

iii


DANH MỤC BẢNG
Bảng 1.1. Một số dạng hàm truyền thƣờng dùng ........................................................7

Bảng 2.1. Tổng hợp dữ liệu quan trắc tại trạm Láng ................................................25
Bảng 2.2. Tỷ lệ dữ liệu quan trắc khuyết thiếu theo tháng của SO2 và PM10 đo tại
trạm quan trắc chất lƣợng không khí cố định Láng, Hà Nội từ 2003 đến 2007 (%) 26
Bảng 2.3. Cấu trúc mạng cho các chất ô nhiễm ........................................................28
Bảng 3.1. Độ tin cậy của FFNN với SO2 ..................................................................39
Bảng 3.2. Độ tin cậy của FFNN cho PM10................................................................42
Bảng 3.3. Số nơ-ron trong lớp ẩn của FFNN xác định bằng GA đối với SO2 khi kích
thƣớc quần thể là 20 ..................................................................................................43
Bảng 3.4. Số nơ-ron trong lớp ẩn của FFNN xác định bằng GA đối với SO2 khi kích
thƣớc quần thể là 30 ..................................................................................................43
Bảng 3.5. Độ tin cậy của mô hình GA-FFNN dự báo SO2 .......................................44
Bảng 3.6. So sánh độ tin cậy của FFNN(1-10-1) và GA-FFNN(1-68-1) .................44
Bảng 3.7. Số nơ-ron trong lớp ẩn của FFNN xác định bằng GA đối với PM10 khi
kích thƣớc quần thể là 20 ..........................................................................................45
Bảng 3.8. Số nơ-ron trong lớp ẩn của FFNN xác định bằng GA đối với PM10 khi
kích thƣớc quần thể là 30 ..........................................................................................46
Bảng 3.9. Độ tin cậy của mô hình GA-FFNN dự báo PM10 .....................................46
Bảng 3.10. So sánh độ tin cậy của FFNN(1-05-1) và GA-FFNN(1- 254-1) ............47

iv


DANH MỤC HÌNH

Hình 1.1. Cấu tạo của tế bào nơ-ron ............................................................................. 6
Hình1.2. Mô hình nơ-ron nhân tạo ................................................................................ 6
Hình 1.3. Minh họa cơ chế GA ................................................................................... 13
Hình 3.1. Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN(1-2-1)
đối với SO2 .................................................................................................................. 36
Hình 3.2. Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN(1-5-1)

đối với SO2 .................................................................................................................. 37
Hình 3.3. Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN(1-10-1)
đối với SO2 .................................................................................................................. 37
Hình 3.4. Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN(1-20-1)
đối với SO2 .................................................................................................................. 38
Hình 3.5. Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN (1-2-1)
đối với PM10 ................................................................................................................ 40
Hình 3.6. Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN (1-5-1)
đối với PM10 ................................................................................................................ 40
Hình 3.7. Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN (1-10-1)
đối với PM10 ................................................................................................................ 41
Hình 3.8. Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN (1-20-1)
đối với PM10 ................................................................................................................ 41

v


MỞ ĐẦU
1. Đặt vấn đề
Ô nhiễm không khí đã và đang ảnh hƣởng tiêu cực đến cuộc sống của con ngƣời.
Do đó dự báo chất lƣợng không khí là cần thiết để phòng ngừa và hạn chế các tác
động xấu có thể xảy ra. Hiện nay, hai loại mô hình đƣợc sử dụng phổ biến để dự
báo chất lƣợng không khí là: mô hình tham số (parametric/statistical model) và mô
hình số trị (numerical model) [18]. Trong đó, mô hình dự báo số trị dựa trên động
lực học khí quyển có thể dự báo đƣợc sự đóng góp của nồng độ các chất ô nhiễm
nhờ mô phỏng sự di chuyển và biến đổi hóa học của chúng trong không khí. Chính
vì vậy, loại mô hình này cung cấp thông tin một cách chi tiết về tình trạng chất
lƣợng không khí trên diện rộng, ngay cả những nơi không có trạm quan trắc. Tuy
nhiên, để xây dựng và vận hành các mô hình này yêu cầu cao về cơ sở hạ tầng, cũng
nhƣ chuyên môn của ngƣời sử dụng do lƣợng dữ liệu đầu vào của mô hình rất lớn

và phức tạp. Trong khi đó, mô hình tham số hay còn gọi là mô hình thống kê khá
đơn giản và không đòi hỏi quá cao về cơ sở hạ tầng do nó dựa trên sự phân tích
thống kê dữ liệu chất lƣợng không khí trong quá khứ (đƣợc lƣu lại trên các trạm
quan trắc chất lƣợng không khí). Hiện nay, rất nhiều mô hình dự báo thống kê chất
lƣợng không khí đã đƣợc nghiên cứu và ứng dụng thành công tại nhiều quốc gia cho
thấy tiềm năng rất lớn của chúng trong lĩnh vực này.
Mạng thần kinh nhân tạo (ANN-Artificial Neural Network) là một trong những
công cụ dự báo thống kê đƣợc ứng dụng rộng rãi nhất để xây dựng mô hình dự báo
chất lƣợng không khí, nó đã và đang thể hiện đƣợc ƣu thế vƣợt trội của mình so với
các công cụ truyền thống nhƣ hồi quy tuyến tính/phi tuyến, mô hình tự hồi quy tích
hợp trung bình trƣợt- ARIMA (AutoRegressive Intergrated Moving Average),
Logic mờ-FL (Fuzzy Logic),…trong dự báo chất lƣợng không khí, do ANN đƣợc
xây dựng dựa trên sự mô phỏng lại quá trình xử lý thông tin của một hệ thần kinh
sinh học, chính vì thế, nó có khả năng học tập và khái quát dữ liệu một cách mềm
dẻo để đƣa ra các hành vi thích nghi với điều kiện hiện tại mà không cần đến một

1


phƣơng trình toán học cụ thể. Tuy nhiên, nó cũng tồn tại một số nhƣợc điểm nhƣ:
bộ dữ liệu đào tạo phải đủ lớn và phản ánh đầy đủ tính chất và diễn biến của đối
tƣợng cần dự báo; việc xác định kiến trúc ANN tối ƣu là không đơn giản và chủ yếu
phụ thuộc vào kinh nghiệm của ngƣời xây dựng, mà kiến trúc này có ảnh hƣởng rất
lớn đến hiệu suất dự báo của mô hình. Để tối ƣu hóa cấu trúc của ANN, rất nhiều
phƣơng pháp đã đƣợc nghiên cứu và áp dụng, trong đó, thuật toán di truyền (GAGenetic Algorithm) đã thu đƣợc nhiều thành tựu đáng kể.
Mặt khác, trong lĩnh vực dự báo chất lƣợng không khí ứng dụng của ANN nói
chung và kết hợp ANN với GA nói riêng tại Việt Nam vẫn còn khá mới mẻ và chƣa
có nhiều nghiên cứu công bố chính thức. Chính vì thế, việc ứng dụng ANN cũng
nhƣ sự kết hợp ANN với GA để dự báo chất lƣợng không khí đã đƣợc chọn làm nội
dung nghiên cứu của luận văn.

2. Mục đích nghiên cứu:
- Đánh giá khả năng ứng dụng mạng thần kinh nhân tạo (ANN) trong dự báo
chất lƣợng không khí
- Đánh khả năng kết hợp thuật toán di truyền vào mạng thần kinh nhân tạo trong
dự báo chất lƣợng không khí.
3. Đối tƣợng nghiên cứu:
- Mô hình mạng nơ-ron truyền thuận-FFNN
- Mô hình FFNN kết hợp GA

2


CHƢƠNG 1: TỔNG QUAN
Để dự báo chất lƣợng không khí có thể sử dụng nhiều loại mô hình nhƣ: mô hình
hực nghiệm hay mô hình tham số (thống kê). Có thể khái quát ƣu nhƣợc điểm một
số mô hình dự báo cơ bản nhƣ sau [3-30]:
Mô hình dự báo

Ƣu điểm

Nhƣợc điểm

Phƣơng pháp dự báo thực nghiệm đơn giản:

Mô hình chuẩn tắc

Thời gian tính toán nhỏ; Độ
chính xác cao trong trƣờng
hợp môi trƣờng tĩnh; đơn
giản, dễ sử dụng; Chi phí vận

hành nhỏ.

Không xử lý đƣợc trong
trƣờng hợp có biến động lớn
về khí tƣợng và nồng độ chất
ô nhiễm; Độ chính xác thấp;
Không thể sử dụng một cách
độc lập

Không xử lý đƣợc trong
trƣờng hợp có biến động lớn
Thời gian tính toán nhỏ; Đơn
về khí tƣợng và nồng độ chất
Mô hình khí tƣợng giản, dễ sử dụng; Chi phí vận
ô nhiễm; Độ chính xác thấp;
hành thấp.
Không thể sử dụng một cách
độc lập.

Mô hình kinh
nghiệm

Thời gian tính toán nhỏ; Là
một trong những phƣơng pháp
mạnh để dự báo các trƣờng
hợp ô nhiễm cao; Đơn giản,
dễ sử dụng; Chí phí vận hành
thấp.

Không thể dự báo chính xác

đƣợc nồng độ chất cần dự
báo; Không thể dự báo đƣợc
với các chất ít phụ thuộc vào
các yếu tố khí tƣợng; Độ
chính xác trung bình.

Mô hình tham số (thống kê)
Không thể dự báo đƣợc các
trƣờng hợp có sự cố; Độ
chính xác bị giới hạn bởi số
lƣợng và chất lƣợng dữ liệu
đầu vào; Không thích hợp với
trƣờng hợp dự báo khu vực
lớn.

Mô hình phân lớp
và cây hồi quy
(CART)

Thời gian tính toán nhỏ; Dự
báo tốt đối với phạm vị hẹp;
Tự động phân biệt nồng độ
chất ô nhiễm theo ngày; Vận
hành không đòi hỏi chuyên
môn cao; Độ chính xác khá.

Phƣơng pháp hồi
quy tuyến tính

Tính toán nhanh; Dự báo tốt Không thể dự báo đƣợc các

trong khu vực nhỏ; Chất trƣờng hợp xảy ra sự cố;
lƣợng dự báo tốt; Vận hành Không thể xử lý đƣợc đối với

3


không đòi hỏi chuyên môn mối quan hệ phi tuyến của hệ
cao; Độ chính xác khá; Chi thống hóa học các chất ô
phí vận hành trung bình
nhiễm; Độ chính xác bị giới
hạn bởi số lƣợng và chất
lƣợng dữ liệu đầu vào; Không
thích hợp với trƣờng hợp dự
báo khu vực lớn.

Mạng thần kinh
nhan tạo (ANNs)

Có khả năng học từ dữ liệu;
Dự báo tốt đối với khu vực
nhỏ; Có thể xử lý tốt đối với
mối quan hệ hóa học phi
tuyến phức tạp của chất ô
nhiễm; Chi phí vận hành
trung bình; độ chính xác cao;
thời gian tính toán thấp;

Độ chính xác khi dự báo sự
cố không cao; Độ chính xác bị
giới hạn bởi số lƣợng và chất

lƣợng dữ liệu đầu vào; Không
thích hợp với trƣờng hợp dự
báo khu vực lớn.

Fuzzy Logic (FL)

Xử lý tốt đối với mối quan hệ
hóa học phi tuyến phức tạp
của chất ô nhiễm; Độ chính
xác tốt; Chi phí vận hành
trung bình.

Cần bộ dữ liệu lớn; Hạn chế
trong việc dự báo quy mô lớn;
khối lƣợng tính toán lớn, phức
tạp.

Qua đây nhận thấy tiềm năng lớn của mô hình ANN trong dự báo chất lƣợng
không khí tại Việt Nam vì bộ dữ liệu của Việt Nam còn bị hạn chế về số lƣợng và
chất lƣợng.
1.1. Mạng thần kinh nhân tạo (ANN)
1.1.1.

Giới thiệu về mạng thần kinh nhân tạo

Mạng thần kinh nhân tạo (ANN – Artificial Neural Network) đƣợc giới thiệu lần
đầu bởi McCulloch và Pitt (1943), là một thuật toán đƣợc xây dựng trên quá trình
xử lý thông tin của một hệ thần kinh sinh học bao gồm 03 hoặc nhiều lớp đƣợc cấu
tạo từ các nơron còn đƣợc gọi là các phần tử xử lý (unit). Trong đó lớp đầu tiên
đƣợc gọi là lớp đầu vào, lớp cuối cùng chứa kết quả đƣợc gọi là lớp đầu ra và lớp

còn lại đƣợc gọi là lớp ẩn. Mỗi nơ-ron trong ANN nhận tín hiệu đầu vào và xử lý để
đƣa ra tín hiệu đầu ra. Mỗi một nơ-ron đƣợc kết nối với ít nhất một nơ-ron khác, và
mỗi kết nối này đƣợc thể hiện dƣới dạng một số thực đƣợc gọi là trọng số, nó phản

4


ánh mức độ quan trọng của liên kết. Tập hợp các trọng số này tạo thành một ma trận
đƣợc gọi là ma trận trọng số Wi,j mã hóa kiến thức (kinh nghiệm) tích lũy đƣợc của
ANN từ tập dữ liệu đầu vào [33]. Ƣu điểm chính của một ANN chính là việc nó có
thể sử dụng một số thông tin ẩn trong bộ dữ liệu về mối liên hệ giữa các thông số
đầu vào và đầu ra (các thông tin này không thể mô tả cụ thể bằng một hàm số toán
học). Quá trình “nắm bắt” thông tin này đƣợc gọi là quá trình đào tạo ANN (quá
trình học tập của một ANN). Về mặt nguyên tắc, học tập chính là quá trình hiệu
chỉnh trọng số liên kết giữa các nơ-ron.
Cho đến nay, mạng thần kinh nhân tạo đã đƣợc ứng dụng để giải quyết các vấn
đề phức tạp trong nhiều lĩnh vực nhƣ công nghệ thông tin, khoa học điều khiển, dự
báo kinh tế, khai thác dữ liệu… Trong lĩnh vực khai thác dữ liệu và quản lý chất
lƣợng không khí, ANN cũng đã đƣợc nghiên cứu và ứng dụng thành công tại nhiều
quốc gia. Điều này cho thấy tiềm năng ứng dụng của công cụ này trong lĩnh vực
khai thác dữ liệu phục vụ cho công tác quản lý chất lƣợng không khí là rất đáng
quan tâm.
Theo các nhà nghiên cứu sinh học về bộ não, hệ thống thần kinh của con ngƣời
bao gồm khoảng 100 tỷ tế bào thần kinh, thƣờng gọi là các nơ-ron. Mỗi tế bào nơron gồm ba phần [1]:
+ Thân nơ-ron với nhân bên trong (gọi là soma) là nơi tiếp nhận hay phát ra các
xung động thần kinh
+ Một hệ thống dạng cây các dây thần kinh vào (gọi là dendrite) để đƣa tín hiệu tới
các nơ-ron. Các dây thần kinh vào tạo thành một lƣới dày đặc xung quanh thân nơron.
+ Đầu dây thần kinh ra (gọi là sợi trục axon) phân nhánh dạng hình cây. Chúng nối
với các dây thần kinh vào hoặc trực tiếp với nhân tế bào của các nơ-ron khác thông

qua khớp nối (gọi là synapse). Thông thƣờng mỗi nơ-ron có thể có từ vài chục tới
vài trăm ngàn khớp nối để nối với các nơ-ron khác. Có hai loại khớp nối, khớp nối

5


kích thích (excitatory) sẽ cho tín hiệu qua nó để tới nơ-ron và khớp nối ức chế
(inhibitory) có tác dụng là cản tín hiệu tới nơ-ron.

Hình 1.1. Cấu tạo của tế bào nơ-ron
Với mục đích tạo ra một mô hình tính toán phỏng theo cách làm việc của nơ-ron
trong bộ não con ngƣời, vào năm 1943 tác giả McCulloch và Pitts đã đề xuất một
mô hình toán cho một nơ-ron nhƣ sau:

Hình1.2. Mô hình nơ-ron nhân tạo
Nó đƣợc cấu tạo từ các thành phần sau:
+ Tập tín hiệu đầu vào (input signals): tập hợp các tín hiệu đầu vào của một nơ-ron
thƣờng đƣợc thiết lập dƣới dạng một vectơ N chiều.

6


+ Tập trọng số liên kết (synapstic weight): đƣợc thể hiện dƣới dạng một ma trận
chứa các giá trị (số thực). Mỗi một phần tử của ma trận biểu thị cho mức độ hoạt
động của một liên kết (synapse).
+ Hàm tổng (summing function): là hàm xử lý các tín hiệu đầu vào để đƣa ra tín
hiệu đầu ra tƣơng ứng – là tổng tất cả các tích giữa tín hiệu đầu vào và trọng số liên
kết của nó.
+Ngƣỡng (threshold): còn gọi là độ lệch bias.
+Hàm truyền (transfer function): dùng để giải mã tín hiệu đầu vào và chuyển chúng

thành tín hiệu đầu ra. Do đó, nó ảnh hƣởng đến hành vi của ANN. Hàm truyền
tƣơng đối đa dạng, tuy nhiên, bốn dạng hàm truyền phổ biến thƣờng nhất bao gồm:
hàm ngƣỡng (threshold), tuyến tính (piecewise linear), sigmoid và Gaussian (Bảng
1.1). Việc lựa chọn hàm truyền sao cho phù hợp phụ thuộc vào từng bài toán cụ thể
và kinh nghiệm của ngƣời thiết kế mạng.
+ Đầu ra (output): là tín hiệu đầu ra của mỗi nơron.
Quá trình xử lý thông tin của nơ-ron thứ i đƣợc mô tả vắn tắt nhƣ sau: đầu tiên,
nơron thứ j sẽ nhận tín hiệu đầu vào xi có trọng số liên kết là wij tƣơng ứng. Tất cả
các tín hiệu này với trọng số liên kết tƣơng ứng sẽ đƣợc tổng hợp thông qua hàm
tổng (summing function) đƣợc mô tả thông qua phƣơng trình:
n

x

wij xi

j

i 1

Tiếp theo, thông tin đã đƣợc tổng hợp này sẽ đƣợc đƣa vào hàm truyền (transfer
function) để tính toán và đƣa ra tín hiệu đầu ra, đƣợc mô tả thông qua phƣơng trình:
n

output

f

wij xi


j

i 1

Bảng 1.1. Một số dạng hàm truyền thƣờng dùng
Hàm truyền

Công thức

7


Hàm ngƣỡng

Hàm tuyến tính
Piecewise

1 if
0 if

f x

f x

1 if
x if

x 0,5
0,5 x
0,5


0 if

Hàm sigmoid

f x

Hàm Gauss
f x

1
2

x 0
x 0

x

1
1 e
exp

0,5

x

x
2

2

2
j

Về mặt cơ bản, mỗi một nơ-ron đơn lẻ có thể thực hiện một chức năng thông tin
nhất định nào đó. Tuy nhiên, sự kết hợp các nơ-ron trong một kiến trúc thống nhất
đƣợc gọi là mạng thần kinh nhân tạo (ANN) tăng đáng kể sức mạnh của mỗi nơ-ron
trong nó. Một ANN đơn giản nhất đƣợc gọi là perceptron có thể đƣợc huấn luyện để
giải quyết các bài toán phân lớp tuyến tính đơn giản sử dụng hàm sigmoid nhƣ là
hàm đầu ra. Tuy nhiên, hiện nay trong thực tế, mạng ANN đã đƣợc ứng dụng để
giải quyết nhiều vấn đề phức tạp trong nhiều lĩnh vực nhƣ truyền dữ liệu không dây
giữa các thiết bị lƣu trữ, nhận dạng ký tự quang học, điều khiển rôbốt, dự báo kinh
tế, dự báo môi trƣờng… Vì vậy, rất nhiều dạng (biến thể) của ANN đã đƣợc nghiên
cứu, phát triển và ứng dụng thành công nhƣ mạng thần kinh đa lớp (MLP-Multi
Layers Peceptron), các mạng nơron hồi quy (RNN - Recurent Neural Network),
mạng nơron truyền thuận (FFNN – Feedforward Neural Network)…
1.1.2.

Mô hình mạng thần kinh nhân tạo

1.1.2.1. Huấn luyện và xây dựng mạng
Học tập là một chức năng quan trọng của mạng thần kinh nhân tạo. Trong quá
trình học tập bộ véctơ đầu vào X (training set) và tập giá trị kết quả mong muốn Y
(target set) sẽ đƣợc đƣa vào huấn luyện. Dựa vào các thông tin đầu vào xi ANN sẽ

8


tự thay đổi các trọng số liên kết wij giữa các nơron trong cấu trúc của mình để cho ra
kết quả giống nhất với tập đích Y mong muốn. Trong đó các phần tử


xi

X đƣợc

gọi là mẫu huấn luyện (training sample). Vì vậy có thể nói, đối với một ANN thì
học tập là một quá trình tự thay đổi trọng số kết nối wij, trong quá trình này, các
trọng số liên kết giữa các nơron của ANN sẽ thay đổi và hội tụ dần đến các giá trị
sao cho tƣơng ứng với mỗi véctơ đầu vào xi từ tập huấn luyện (training set), ANN
sẽ cho ra véctơ đầu ra Y tƣơng ứng.
Có ba phƣơng pháp huấn luyện mạng phổ biến đƣợc sử dụng hiện nay bao gồm:
học có giám sát (supervised learning), học không có giám sát (unsupervised
learning) và học tăng cƣờng (Reinforcement learning).
1.1.2.2. Các vấn đề khi xây dựng kiến trúc mạng
a. Ảnh hƣởng của dữ liệu đầu vào đến hiệu suất mạng
+ Kích thƣớc mẫu huấn luyện: có hai tham số quan trọng của một ANN phụ thuộc
vào kích thƣớc của mẫu huấn luyện, bao gồm: dạng hàm đích (target function) –
kích thƣớc mẫu huấn luyện càng lớn thì độ phức tạp của hàm đích càng tăng; nhiễu
(xảy ra khi thông tin bị khuyết thiếu hoặc thông tin sai lệch) sẽ giảm khi kích thƣớc
của mẫu huấn luyện tăng.
+ Tổ chức và lựa chọn tập dữ liệu: dữ liệu đƣợc tổ chức sao cho mỗi một mẫu huấn
luyện có đƣợc cơ hội đƣợc ANN học tập là nhƣ nhau. Điều này sẽ làm giảm tình
trạng học không đủ (underfitting) – là một vấn đề quan trọng cần kiểm soát của
ANN.
+ Lựa chọn biến đầu vào: Cần biến đổi các thông số đầu vào về dạng thích hợp
nhất. Ngoài ra, việc lựa chọn biến đầu vào cũng là một yêu cầu quan trọng, vì
không phải bất cứ thông tin nào cũng cần thiết, điều này giúp giảm nhiễu.

9



+ Lựa chọn bộ dữ liệu đào tạo và kiểm tra: thông thƣờng 2/3 dữ liệu sẽ đƣợc sử
dụng cho đào tạo (training set) còn 1/3 sử dụng cho kiểm tra (testing set). Điều này
sẽ tránh đƣợc tình trạng học quá khớp (overfitting) của mạng.
b. Ảnh hƣởng của các tham số tự do của mạng đến hiệu suất
+) Số nơron trong lớp ẩn: đƣợc lựa chọn sao cho phù hợp với bài toán cụ thể trong
thực tế và phụ thuộc vào kinh nghiệm của ngƣời thiết kế mạng. Quá lớn hoặc quá
nhỏ đều không tốt, vì vậy, xác định đƣợc số nơron trong lớp ẩn tối ƣu là rất khó
khăn. Tuy nhiên, hiện nay một số phƣơng pháp tối ƣu hóa đã đƣợc ứng dụng để giải
quyết vấn đề này thành công nhƣ thuật toán di truyền (GA – genetic algorithm).
+) Dạng hàm truyền (transfer function): không phải hàm truyền nào cũng cho kết
quả nhƣ mong muốn. Vì vậy, việc lựa chọn hàm truyền thế nào phụ thuộc rất lớn
vào kinh nghiệm của ngƣời thiết kế mạng đối với từng bài toán cụ thể. Tuy nhiên,
cũng có một số quy tắc chọn hàm truyền nhƣ sau: 1) Không dùng hàm truyền dạng
tuyến tính cho lớp ẩn bởi hàm truyền tuyến tính sẽ làm mất vai trò của lớp ẩn; 2)
Chọn hàm truyền phân bố đối xứng với kiến trúc mạng đã xây dựng.
+) Vấn đề học quá khớp (overfitting): đây là một vấn đề thƣờng xuyên gặp phải
không chỉ của ANN mà còn của các mô hình thống kê dữ liệu. Học quá khớp xảy ra
khi mạng đƣợc đào tạo quá phù hợp với dữ liệu huấn luyện, có nghĩa là, nó chỉ trả
lời chính xác khi những câu hỏi nằm trong bộ dữ liệu huấn luyện, còn ngoài ra thì
không. Vì vậy, học quá khớp là một vấn đề không mong muốn đối với bất kỳ một
mô hình thống kê nào, trong đó có ANN do nó không khái quát đƣợc kiến thức
(thông tin) cho các trƣờng hợp khác. Để giải quyết vấn đề này, một số phƣơng pháp
thƣờng đƣợc áp dụng nhƣ: hạn chế số nơron trong lớp ẩn, không cho mạng sử dụng
các trọng số liên kết có giá trị quá lớn, giới hạn số bƣớc huấn luyện.
Tóm lại, các chức năng của ANN gồm phân loại, hồi quy, kết hợp, dựng bản đồ.
Chúng đƣợc ứng dụng rộng rãi trong điều khiển thích nghi, tối ƣu hóa, chuẩn đoán,
ra quyết định cũng nhƣ trong các quá trình thông tin, tín hiệu, truyền đạt. ANN

10



đƣợc đặc trƣng bởi: (1) một tập hợp các tế bảo thần kinh xử lý, (2) một mô hình kết
nối giữa các tế bào thần kinh, (3) một hàm kích hoạt cho mỗi tế bào thần kinh và (4)
một quy tắc học. Các tế bào thần kinh xử lý đƣợc phân phối trong các lớp: (1) lớp
đầu vào, (2) lớp ra và (3) các lớp ẩn (ở giữa lớp đầu vào và lớp đầu ra). Các tế bào
thần kinh trong các lớp khác nhau đƣợc liên kết bởi các khớp thần kinh (mỗi khớp
lƣu trữ một giá trị trọng lƣợng) và các mối liên kết sẽ xác định cấu trúc của mạng
(truyền thẳng không phản hồi và truyền thẳng có phản hồi).
1.1.3.

Mạng nơ-ron truyền thuận (FFNN)

FFNN là mạng thần kinh truyền chiều thuận (không có phản hồi). FFNN có hàm
truyền sigmoid.
Thiết kế mạng (khi các biến đầu vào đã đƣợc chọn) gồm các bƣớc [1]:
- Chọn cấu hình ban đầu (1 lớp ẩn gồm nhiều nơ ron)
- Thực hiện lặp đi lặp lại số thí nghiệm của mỗi cấu hình, giữ lại mạng tốt nhất
(thƣờng dựa trên sai số xác minh). Thí nghiệm nhiều lần trên mỗi cấu hình
mạng để tránh rơi vào sai số cục bộ.
- Trong mỗi lần thí nghiệm, nếu xảy ra việc học chƣa đủ (mạng không đạt đƣợc
mức hiệu suất chấp nhận) thì thử tăng số nơ-ron trong lớp ẩn. Nếu xảy ra học
quá mức (sai số xác minh bắt đầu tăng lên) thử bỏ bớt một vài nơ-ron ẩn.
Hàm sai số: tổng bình phƣơng các lỗi (SSE-sum of squared error), mỗi trọng số
và ngƣỡng trong tổng số N trọng số và ngƣỡng đƣợc xem là một chiều trong không
gian. Chiều (N+1) là sai số mạng. Đối với bất kỳ cấu hình trọng số nào, lỗi cũng có
thể vẽ ở chiều thứ (N+1), tạo thành mặt phẳng lỗi. Đối tƣợng của việc huấn luyện
mạng là tìm điểm thấp nhất trong mặt phẳng nhiều chiều này. Từ cấu hình ngẫu
nhiên của trọng số và ngƣỡng ban đầu (nghĩa là điểm ngẫu nhiên trên mặt phẳng sai
số) các thuật toán huấn luyện tìm kiếm đến giá trị nhỏ nhất. Thông thƣờng, việc tìm
kiếm dựa trên gradient (độ dốc) trên mặt phẳng sai số tại điểm hiện tại và sau đó sẽ

di chuyển xuống giá trị nhỏ hơn. Do đó có nhiều khả năng thuật toán dừng ở điểm

11


thấp là điểm giá trị cực tiểu cục bộ. Đây là điểm cần khắc phục của ANN nói chung
và FFNN nói riêng để có kết quả dự báo tốt hơn. Và thuật toán di truyền (Genetic
Algorithm-GA) đƣợc coi là rất mạnh trong việc tìm ra cực tiểu toàn bộ. Do đó việc
kết hợp giữa FFNN và GA là một giải pháp khả thi.
1.2. Thuật toán di truyền (GA)
Thuật toán di truyền (GA – Genetic Algorithm) là một phƣơng pháp tối ƣu hóa
dựa trên việc mô phỏng lại thuyết tiến hóa của Darwin. Cũng giống nhƣ quá trình
chọn lọc tự nhiên, thuật toán di truyền (GA) xuất phát từ một quần thể, là tập hợp
bởi nhiều cá thể (còn đƣợc gọi là nhiễm sắc thể) đƣợc sinh ra một cách ngẫu nhiên,
chúng mã hóa thông tin các biến số cần tối ƣu của bài toán. Mỗi biến số tƣơng ứng
với một gen, tập hợp nhiều gen tạo thành một nhiễm sắc thể (một cá thể) [2]. Mục
tiêu của phƣơng pháp này là tìm kiếm/lựa chọn đƣợc một quần thể ƣu thế nhất
thông qua tiến trình tiến hóa. Trong tiến trình này, các thế hệ con đƣợc tạo ra thông
qua các toán tử bao gồm: chọn lọc tự nhiên (selection), lai chéo (crossover) và đột
biến (mutation) các cá thể cha mẹ đƣợc thể hiện trên Hình 1.3. Trong mỗi thế hệ,
các cá thể đƣợc đánh giá thông qua tính thích nghi của nó trong quần thể qua một
hàm số đƣợc gọi là hàm thích nghi (fitness function) – là tiêu chí để xác định cá thể
nào ƣu thế hơn. Về mặt bản chất, dựa vào độ thích nghi đã đƣợc xác định GA có thể
lựa chọn đƣợc những cá thể ƣu thế nhất của quần thể cho thế hệ tiến hóa tiếp theo.
1.2.1.

Cơ chế của GA

Nhƣ đã trình bày ở trên, mỗi cá thể của thuật toán di truyền đƣợc mã hóa dƣới
dạng một bản đồ (cây dữ liệu). Xét một GA đơn giản, mà trong đó các cá thể đƣợc

mã hóa dƣới dạng một dãy số nhị phân (0 và 1), trong đó, mỗi biến (thành phần) cần
tối ƣu hóa là một đoạn mã tƣơng ứng đƣợc gọi là gen. Quá trình tiến hóa quần thể
đã cho đƣợc thể hiện theo Hình 1.3.

12


Hình 1.3. Minh họa cơ chế GA
a. Quá trình chọn lọc tự nhiên (tái tạo quần thể)
Là một quá trình tối ƣu quần thể. Về cơ bản, quá trình này giữ lại các cá thể phù
hợp với độ thích nghi cao (fitness fuction) và loại bỏ các cá thể có tính thích nghi
thấp. Một phƣơng pháp chọn lọc phổ biến đƣợc sử dụng là chọn lọc cạnh tranh nhị
phân (binary tournament selection) [31]. Cơ sở của phƣơng pháp này là phân chia
quần thể thành 02 phần, sau đó cho chúng cạnh tranh lẫn nhau tiến tới một cấu trúc
dân số thích nghi của quần thể, sau đó chuyển sang giai đoạn lai chéo để bù đắp lại
lƣợng cá thể thích nghi thấp, sao cho số cá thể trong quần thể luôn ổn định [32].
b. Quá trình lai chéo (crossover)
Khi quá trình chọn lọc tự nhiên kết thúc, phần các cá thể thích nghi cao thông
qua quá trình cạnh tranh ngẫu nhiên đƣợc lai chéo ngẫu nhiên để hình thành một
quần thể mới có tính thích nghi cao hơn so với quần thể ban đầu. Nhƣ vậy, mỗi cặp
bố mẹ sẽ có 02 cấu trúc con để đƣa sang giai đoạn đột biến (Mutation). Các cá thể
con là kết quả của việc cắt hoặc kết hợp các cá thể bố mẹ tại các điểm lai chéo ngẫu
nhiên đã đƣợc lựa chọn [32]. Quá trình lai chéo đƣợc tiến hành theo các bƣớc sau:

13


Bƣớc 1: Các thành viên của quần thể bố mẹ đƣợc ghép đôi với nhau một cách
ngẫu nhiên.
Bƣớc 2: Mỗi cặp bố mẹ (chuỗi mã hóa tƣơng ứng) đƣợc chọn sẽ trải qua việc lai

chéo nhƣ sau: đầu tiên, xác định vị trí lai tƣơng ứng là một số nguyên k chỉ vị trí các
mã dọc theo chuỗi đƣợc lựa chọn ngẫu nhiên trong khoảng từ 1 đến L-1 ([1, L-1]),
trong đó L là chiều dài của chuỗi mã hóa. Tiếp theo, hai cá thể con mới sẽ đƣợc tạo
ra bằng cách hoán đổi tƣơng ứng các chuỗi ký tự từ vị trí 1 đến k và từ k+1 đến L
của hai chuỗi cha-mẹ cho nhau. Ví dụ: xét 2 chuỗi cha và mẹ đƣợc mã hóa dƣới
dạng nhị phân (8 bit) nhƣ sau:
Cha:
0 1 1 0 0 1 1 1
Mẹ:
1 0 1 0 0 0 1 0

Giả sử, vị trí lai đƣợc chọn là 5 (k = 5). Kết quả của việc ghép chéo làm sinh ra
thế hệ con nhƣ sau:
Con 1:
0 1 1 0 0 0 1 0
Bố

Mẹ

Con 2:
1 0 1 0 0 1 1 1
Mẹ

Bố

Tóm lại, quá trình lai chéo là việc sao chép và trao đổi mã di truyền từ thế hệ cha
mẹ. Điểm cần nhấn mạnh ở đây là quá trình trao đổi thông tin có cấu trúc (dù là một

14



cách ngẫu nhiên) của cả quá trình ghép chéo làm cho các giải thuật di truyền tăng
thêm sức mạnh.
c. Quá trình đột biến (mutation)
Trong khi quá trình lai chéo (tái tổ hợp) đƣợc thực hiện trên hai hay nhiều nhiễm
sắc thể của cha mẹ, thì đột biến là sự “tự” thay đổi một số tính trạng của cá thể một
cách ngẫu nhiên. Quá trình này là cần thiết bởi vì: cho dù sự sinh sản và ghép chéo
đã tìm kiếm hiệu quả và tái kết hợp lại các gen với nhau, nhƣng đôi khi chúng có
thể làm mất một vài gen hữu ích nào đó. Vì vậy, đột biến sẽ có nhiệm vụ khôi phục
chúng. Trong giải thuật di truyền, đột biến là sự thay đổi ngẫu nhiên và không
thƣờng xuyên (với xác xuất nhỏ) một hoặc nhiều đặc điểm/tính trạng của cá thể bị
đột biến, sự kết hợp với quá trình lai ghép chéo sẽ là một chính sách bảo hiểm
chống lại nguy cơ mất mát những gen quan trọng.
Ví dụ: với hai cá thể con đã đƣợc tạo ra ở bƣớc trên đƣợc lựa chọn vào quá trình
đột biến (lƣu ý, sự lựa chọn này là ngẫu nhiên). Vị trí xảy ra đột biến cũng đƣợc xác
định một cách ngẫu nhiên (các vị trí màu đậm).

Trƣớc đột biến:
0 1 1 0 0 0 1 0

1 0 1 0 0 1 1 1

15


Sau đột biến:

0 0 1 0 1 1 1 0

0 1 1 1 0 1 0 1

Qua mỗi thế hệ, các toán tử chọn lọc tự nhiên, lai ghép và đột biến lại đƣợc thực
hiện để tạo ra thế hệ mới mang những ƣu thế cơ bản của quần thể cha mẹ. Về mặt
cơ bản, chu trình này đƣợc thực hiện cho đến khi toàn bộ các cá thể trong quần thể
giống hệt hoặc gần giống nhau. Tuy nhiên, trong thực tế đối với các bài toán phức
tạp, quá trình này đƣợc dừng khi tìm đƣợc cá thể phù hợp với độ thích nghi đã đƣợc
xác định trƣớc hoặc vƣợt quá giới hạn về số thế hệ tiến hóa.
1.2.2.

Quy trình GA đơn giản

GA bao gồm các bƣớc sau:
1. Khởi tạo quần thể ban đầu của các chuỗi nhiễm sắc thể.
2. Xác định giá trị hàm mục tiêu cho mỗi một chuỗi nhiễm sắc thể.
3. Tạo các chuỗi nhiễm sắc thể mới bằng sinh sản từ các chuỗi nhiễm sắc thể hiện
tại, có tính đến ghép chéo và đột biến xảy ra (nếu có).
4. Xác định hàm mục tiêu cho các chuỗi nhiễm sắc thể mới và đƣa nó vào trong
một quần thể mới.
5. Nếu điều kiện dừng đã thỏa mãn thì dừng lại và trả về chuỗi nhiễm sắc thể tốt
nhất cùng với giá trị hàm mục tiêu của nó, nếu không thì quay về bƣớc 3.
1.3. Ứng dụng của ANN và GA trong dự báo chất lƣợng không khí
a. Tổng quan tình hình nghiên cứu ứng dụng ANN và GA trong dự báo chất
lƣợng không khí

16


Hiện nay để dự báo số liệu theo chuỗi thời gian với các biến ngẫu nhiên, rất
nhiều dạng mô hình đã đƣợc sử dụng trong đó ANN đƣợc sử dụng rộng rãi vì nó
dựa trên các số liệu từ quá khứ và làm việc tốt với các dữ liệu phi tuyến [22]. ANN
bao gồm nhiều loại nhƣ: mạng perceptron nhiều lớp (MLP), mạng thần kinh truyền

thuận (FFNN), mạng thần kinh truyền thẳng có phản hồi. Tuy nhiên, nhƣ đã phân
tích ở trên, nhƣợc điểm lớn nhất của ANN chính là việc xác định các tham số cấu
trúc của mạng (tốc độ học, số lớp ẩn/ số nơ-ron ẩn…) là tƣơng đối khó khăn và có
ảnh hƣởng lớn đến độ tin cậy của mô hình. Thông thƣờng, các tham số này đƣợc
thiết lập dựa vào kinh nghiệm của ngƣời xây dựng mạng. Chính vì thế, việc ứng
dụng GA cùng ANN trong dự báo chuỗi thời gian cũng đƣợc nghiên cứu và đã đƣợc
chúng minh là một phƣơng pháp tối ƣu hóa cấu trúc ANN đầy tiềm năng vì lý do
sau: Các thuật toán tiến hóa và di truyền đã đƣợc chứng minh là một kỹ thuật mạnh
do khả năng giải quyết vấn đề tuyến tính và phi tuyến tính của nó bằng cách khám
phá tất cả các vùng của không gian tìm kiếm và khai thác các khu vực tiềm năng
thông qua các toán tử di truyền. GA đã chứng minh đƣợc năng lực mạnh mẽ của nó
trong việc tìm kiếm cực tiểu toàn cục trong khi đây là một điểm yếu của ANN [
3,7,11]. Ngoài ra, GA làm việc tốt với số lƣợng dữ liệu rất lớn và đƣa ra một tập
hợp các lời giải sau đó tìm đƣợc lời giải tối ƣu [16].
Việc kết hợp GA và ANN đã đƣợc ứng dụng trong rất nhiều lĩnh vực nhƣ: dự báo
phát thải khí bãi rác [5]; tối ƣu quá trình phát thải NOx trong động cơ xăng [27], dự
báo mực lũ trên sông [18]. Đặc biệt việc sử dung ANN nói chung và kết hợp GAANN nói riêng trong dự báo chất lƣợng không khí đã rất phổ biến và đạt đƣợc nhiều
kết quả khả quan. Các thông số chủ yếu đƣợc dự báo trong chất lƣợng không khí là
SO2 [28], NOx [25], O3 [20-26], PM10 [19] và các thông số khí tƣợng thủy văn [11],
nhiệt độ không khí [8]. Độ chính xác của các mô hình đều đạt đƣợc trên 85%.

17


GA đƣợc kết hợp trong ANN chủ yếu là để tối ƣu các tham số đầu vào của ANN [6,
17,20] và tối ƣu cấu trúc của ANN gồm số nơ-ron trong lớp ẩn [4] hay số lớp ẩn
[11].
Dữ liệu sử dụng cho GA có thể đƣợc mã hóa dạng nhị phân là chủ yếu, nhƣng
hiện nay việc sử dụng dữ liệu thực cũng đang đƣợc nghiên cứu [14]. Các tham số
quan trọng quyết định khả năng làm việc của GA bao gồm: kích thƣớc quần thể

(Pop_size, tỉ lệ chọn lọc-Pc, tỉ lệ đột biến-Pm). Theo đó, nếu kích thƣớc quần thể
quá lớn thì sẽ tốn dung lƣợng bộ nhớ của máy và tốn thời gian, nếu tỉ lệ chọn lọc
quá nhỏ thì sẽ làm suy giảm tính đa dạng của quần thể các lời giải. Mặt khác, nếu tỉ
lệ đột biến quá lớn thì GA trở thành một công cụ tìm kiếm ngẫu nhiên với độ chính
xác không cao đồng thời tốn dung lƣợng bộ nhớ cho máy. Các giá trị này thƣờng
đƣợc lựa chọn trong các khoảng: kích thƣớc quần thể <100, tỉ lệ lai ghép 0,25÷0,75,
tỉ lệ đột biến: 0,01÷0,2 [14, 15].
Với việc nghiên cứu tổng quan về ANN và GA cũng nhƣ khả năng áp dụng vào
việc dự báo chất lƣợng không khí, luận văn sẽ nghiên cứu về khả năng dự báo của
mạng nơ-ron truyền thuận FFNN và áp dụng GA trong việc tìm ra số nơ ron tối ƣu
cho FFNN. Sau đó, sử dụng kết quả mô hình mạng tối ƣu để ứng dụng vào việc bù
số liệu khuyết thiếu cho bộ dữ liệu chất lƣợng không khí. Khoảng thời gian giữa kết
quả dự báo với giá trị đo đạc có sẵn là 1h.
b. Đánh giá các mô hình dự báo chất lƣợng không khí sử dụng ANN và GA
Các nghiên cứu trên thế giới đã chứng tỏ đƣợc tính khả thi trong việc ứng dụng
ANN và GA trong dự báo chất lƣợng không khí cụ thể:
- Mô hình dự báo nồng độ ô zôn cho thành phố Dallas, Texas, Mỹ:
Trong nghiên cứu, tác giả đã lựa chọn và sử dụng mô hình ANN cho dự báo nồng
độ ô zôn mặt đất cho Dallas sau khi so sánh và kiểm chứng đồng thời với mô hình
ARIMA và AR cổ điển. Theo báo cáo, 85% nồng độ ô zôn mặt đất đƣợc sinh ra do

18


các hoạt động giao thông tại thành phố. Chính vì vây, nghiên cứu đã sử dụng 09
biến đầu vào bao gồm: các yếu tố do hoạt động giao thông là NO, NO2, CO2; nồng
độ O3 trung bình; mức độ hoạt động của nguồn thải (thời gian); Các yếu tố khí
tƣợng gồm tốc độ gió, nhiệt độ lớn nhất trong ngày, hƣớng gió. Với bộ dữ liệu đào
tạo và kiểm chứng đƣợc nghiên cứu từ năm 1993 đến 1994. Kết quả so sánh và
kiểm chứng các mô hình đối với bộ dữ liệu test trong khoảng thời gian từ

01/10/1993 đến 10/10/1993 cho thấy độ lệch trung bình tuyệt đối của mô hình ANN
đƣợc lựa chọn là 0,0064 ppm nhỏ hơn rất nhiều so với phƣơng pháp hồi quy (AR) là
0,0129 ppm và ARIMA là 0,0263 ppm. Khi đƣa vào thử nghiệm trong thực tế trong
khoảng thời gian từ cuối tháng 6 năm 1993 đến đầu tháng 10 năm 1993, độ lệch
trung bình tuyệt đối của ANN và AR trong trƣờng hợp dự báo các ngày có nồng độ
ô zôn cao (>0.100 ppm) lần lƣợt là 0,004 ppm và 0,009 ppm. Điều này cho thấy
trong tất cả các trƣờng hợp mô hình ANN cho kết quả dự báo chính xác hơn. Thêm
nữa, trong báo cáo cũng chỉ ra rằng xu hƣớng (trens) biến động của nồng độ ô zôn
dự báo so với biến động thực tại Dallas bằng mô hình ANN là phù hợp hơn so với
mô hình hồi quy và ARIMA cổ điển [9]. Mặc dù kết quả của mô hình là rất khả
quan, tuy nhiên, vẫn còn có một số những tồn tại cần giải quyết: Tác giả chỉ mới
quan tâm đến nồng độ ô zôn trong khoảng thời gian từ 6h00 đến 9h00 sáng, mà theo
phân tích đây là thời gian nguồn ô nhiễm (giao thông) hoạt động mạnh nhất. Nhƣ
vậy là chƣa mang tính đại diện. Kết quả của mô hình là nồng độ ô zôn trung bình
trong thời gian từ 6h00 đến 9h00, không mang ý nghĩa nhiều trong công tác cảnh
báo. Chƣa xem xét đến yếu tố ảnh hƣởng của bức xạ mặt trời (UV), trong khi đó
đây là yếu tố vô cùng quan trọng trong chu trình O3 – NO – NO2 [80]
- Mô hình dự báo chất lƣợng không khí cho thành phố Palermo, Italy: Trong
nghiên cứu, tác giả ứng dụng Elman - ANN để phát triển một mô hình dự báo nồng
độ một số chất ô nhiễm điển hình trong không khí cho 02 ngày kế tiếp bao gồm
SO2, O3, PM10, NO2 và CO cho thành phố Palermo, Italy. Trong nghiên cứu, tác giả
nghiên cứu kiểm chứng giữa 02 mô hình ANN (MLP và Elman-NN). Theo bài báo,
độ tin cậy của kết quả dự báo phụ thuộc phần lớn vào chất lƣợng của dữ liệu đầu

19


vào, để giải quyết vấn đề này tác giả đã sử dụng thuật toán di truyền (GA) để tối ƣu
hóa bộ dữ liệu đào tạo lấy từ 08 trạm quan trắc chất lƣợng không khí tại Palermo từ
tháng 1/2003 đến tháng 12 năm 2004. Mô hình dự báo đƣợc xây dựng dựa trên

mạng thần kinh nhân tạo Elman (1990). Để đánh giá độ tin cậy của mô hình nghiên
cứu, tác giả đã ứng dụng thử nghiệm trên đối tƣợng khí ô nhiễm SO2 và so sánh một
số chỉ số thống kê (độ lệch trung bình tuyệt đối – MAE; chỉ số tƣơng quan – r; bình
phƣơng lỗi – RMSE và MSE) 8đối với kết quả dự báo của MLP và Elman – NN.
Kết quả so sánh cho thấy, hiệu năng của MLP kém ổn định hơn so với Elman, cá
biệt tại một số trạm nhƣ Dibsali chỉ số RMSE lên đến 329,43 μg/m3 và hệ số tƣơng
quan r chỉ đạt 0,28 trong khi đó mô hình Elman là 17,14 μg/m3 và 0,94 tƣơng ứng.
Đối với 07 trạm còn lại, kết quả dự báo của mô hình Elman là tƣơng đƣơng hoặc tốt
hơn. Chính vì vậy, tác giả đã lựa chọn mạng thần kinh Elman với cấu trúc gồm 09
nơ ron đầu vào bao gồm 05 thông số cần dự báo và 04 thông số có ảnh hƣơng đến
biến động nồng độ các chất ô nhiễm cần dự báo nhƣ VOC, và một số thông số khí
tƣợng để xây dựng mô hình dự báo chất lƣợng không khí cho thành phố Palermo,
Italy. Kết quả thử nghiệm đối với bộ dữ liệu nghiên cứu cho thấy hệ số tƣơng quan
của tất cả các thông số dự báo (SO2, O3, NO2, CO, PM10) tại các trạm là khá tốt,
nằm trong khoảng từ 0,72 đến 0,97. Độ lệch chuẩn của kết quả dự báo MAE tƣơng
đối nhỏ, nằm trong khoảng 0,09 đến 5,58 [76]. Mô hình một lần nữa đã chứng minh
đƣợc điểm mạnh của việc ứng dụng ANNs trong dự báo thống kê chất lƣợng không
khí. Tuy nhiên, việc xây dựng mô hình này cũng vẫn còn tồn tại một số nhƣợc điểm
cần khắc phục: Xem xét quá ít thông số ảnh hƣởng đến sự biến động các chất ô
nhiễm cần dự báo, đặc biệt là O3, NO2 và CO, chính vì vậy, các chỉ sô kiểm tra
thống kê nhƣ MAE, RMSE, MSE và r của các thông số này thƣờng kém hơn. Chƣa
đánh giá một cách sâu sắc chu trình NO2 – NO – O3, và chu trình CO – CO2.
- Mô hình dự báo nồng độ ô zôn cho thành phố Athens, Hi Lạp.
Trong nghiên cứu, tác giả phát triển đồng thời 02 mô hình (Mô hình hồi quy đa
tuyến tính MLR và mạng thần kinh nhân tạo ANN) để dự báo nồng độ ô zôn mặt
đất tại thành phố Athens. Mô hình sử dụng 03 biến đầu vào tƣơng ứng gồm: nồng

20



×