Tải bản đầy đủ (.pdf) (186 trang)

Nghiên cứu xây dựng mô hình dự báo chất lượng không khí tại tp hcm bằng phương pháp mạng nơron

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.53 MB, 186 trang )

ỦY BAN NHÂN DÂN THÀNH PHỐ HỒ CHÍ MINH

SỞ KHOA HỌC VÀ CÔNG NGHỆ

ĐỀ TÀI CẤP THÀNH PHỐ 2004 - 2005

BÁO CÁO TỔNG HỢP KẾT QUẢ NGHIÊN CỨU

CHỦ NHIỆM : TSKH. BÙI TÁ LONG

TP. HCM 09/2006


/>Kính mong sự đóng góp ý kiến của các chun gia và người sử dụng. Những đóng
góp q báu của chuyên gia và người sử dụng sẽ giúp các tác giả nâng cao chất
lượng sản phẩm.

Các tác giả:
Bùi Tá Long, TSKH, Chủ nhiệm
Lê Thị Quỳnh Hà, TS,
Dương Ngọc Hiếu, Th.s.,
Lưu Minh Tùng, KS,
Cao Duy Trường, KS,
Lê Văn Khoa, Th.s
Võ Thanh Đạm, KS
Tài liệu này trình bày các kết quả chính của đề tài khoa học và công
nghệ cấp thành phố Hồ Chí Minh. Cơ sở lý luận và thực tiễn, các kết quả
chính cùng đề xuất nghiên cứu được trình bày trong báo cáo này. Bên
cạnh đó trong báo cáo cũng trình bày thuận lợi cùng khó khăn trong q
trình thực hiện đề tài.
Trong tài liệu cũng trình bày tài liệu tham khảo liên quan tới đề tài.



Bản quyền @ 2006 - Sở Khoa học và Công nghệ Tp. Hồ Chí Minh và tác giả

ii


ỦY BAN NHÂN DÂN THÀNH PHỐ HỒ CHÍ MINH

SỞ KHOA HỌC VÀ CÔNG NGHỆ
ĐỀ TÀI CẤP THÀNH PHỐ 2004 - 2005

BÁO CÁO KẾT QUẢ NGHIÊN CỨU
Cơ quan chủ trì
Viện Cơ học Ứng dụng

Chủ nhiệm

TSKH. Bùi Tá Long

TP. HCM 09/2006

iii


Con người ln muốn biết tương lai. Thậm chí ngay cả khi phải trả giá
đắt cho điều này hay khi câu trả lời khơng làm vừa lịng mọi người và
cịn hơn thế nữa, chúng ta vẫn thường nghe người ta nói rằng hơn một
nửa dự đốn được đưa ra là những dự báo là sai. www.ng.ru

MỞ ĐẦU

Trong những năm qua Sở Khoa học và Cơng nghệ Tp. Hồ Chí Minh với tư cách là
cơ quan quản lý khoa học của Tp. Hồ Chí Minh đã thể hiện sự quan tâm sâu sắc tới ứng
dụng các công nghệ mới nhằm nâng cao hiệu quả công tác quản lý môi trường đô thị của
thành phố. Thơng qua chương trình nghiên cứu khoa học công nghệ về Bảo vệ môi trường
chúng tôi đã tham gia sơ tuyển từ tháng 6/2003.
Trong thời gian từ tháng 6/2003 tới tháng 8/2004, nhóm tác giả thực hiện đề tài này
đã tìm hiểu cơ sở lý luận và thực tiễn xây dựng mơ hình dự báo mơi trường dựa trên kỹ
thuật mạng neuron – một trong những kỹ thuật khai thác số liệu đang được ứng dụng
mạnh mẽ vào nhiều lĩnh vực khoa học cơng nghệ. Đây chính là giai đoạn nhóm tác giả
hồn thành Đề cương chi tiết cho đề tài nghiên cứu.
Ngày 8/9/2004 nhóm tác giả đã bảo vệ Đề cương nghiên cứu tại Hội đồng khoa học
cấp Tp. Hồ Chí Minh. Kết quả của Báo cáo này là căn cứ cho Hợp đồng nghiên cứu khoa
học số 183/HĐ-SKHCN ngày 1 tháng 10 năm 2004 giữa Sở Khoa học Công nghệ Tp.
HCM và Viện Cơ học Ứng dụng. Hợp đồng này đã tạo điều kiện pháp lý thuận lợi cho
việc triển khai công việc.
Trong Bản báo cáo này trình bày tổng hợp các kết quả nghiên cứu của đề tài
“Nghiên cứu xây dựng mơ hình dự báo chất lượng khơng khí tại Tp. HCM bằng phương
pháp mạng nơ ron”. Dù có nhiều cố gắng những chắc chắn khơng tránh khỏi sai sót và hạn
chế. Kính mong sự đóng góp ý kiến của các chuyên gia, thành viên hội đồng và người sử
dụng. Những đóng góp q báu này sẽ giúp các tác giả nâng cao chất lượng sản phẩm đề
tài. Mọi góp ý xin gửi theo địa chỉ: TSKH. Bùi Tá Long,

iv


DANH MỤC CÁC CHỮ VIẾT TẮT
Viết tắt của cụm từ Contaminants in the Air Prediction
model for SAi GOn, phiên bản 1.0 ký hiệu mơ hình tin
SAGOCAP1


sử dụng kỹ thuật mạng neuron (mạng thần kinh) dự báo
ơ nhiễm khơng khí) tại các trạm quan trắc tự động về
khơng khí cho Tp. Hồ Chí Minh

SAGOCAP2

Viết tắt của cụm từ Contaminants in the Air Prediction
model for SAi GOn, phiên bản 1.0 ký hiệu mơ hình
thủy động lực học tính tốn sự phát tán ô nhiễm không
khí do giao thông cho một số trục giao thông trên địa
bàn Tp. HCM.

SAGOCAP

Viết tắt của cụm từ Contaminants in the Air Prediction
model for SAi GOn, phiên bản 1.0 – tích hợp
SAGOCAP 1 và SAGOCAP2

GIS

Geographic Information System – Hệ thống thông tin
địa lý

ANN

Artificial Neuron Network – mạng neuron nhân tạo

NN

Neuron Network – mạng neuron (mạng thần kinh)


FFNN

Phương pháp xây dựng mơ hình mạng neuron dự báo
theo giải thuật lan truyền ngược – viết tắt của cụm từ
tiếng Anh: Feedforward Backpropagation, FFNN là sự
kết hợp của kiến trúc Feedforward và thuật giải
Backpropagation.

BB

Backpropagation – Lan truyền ngược

v


DANH MỤC THUẬT NGỮ ANH VIỆT
Activation function,
hay threshold function
Adjustment
Algorithm
Artificial intelligence

Hàm hoạt tính
Chỉnh lý
Giải thuật
Trí tuệ nhân tạo

Artificial Neuron
Network (ANN)

Backforward

Truyền ngược (truyền lui)

Backpropagation

Lan truyền ngược

Bias
Connection link

Mạng neuron nhân tạo

Sự xê dịch (chênh lệch)
Kết nối

Connection weight

Trọng số nối

Cross validation

Kiểm tra chéo

Feedforward
Fuzzy logic
Generalization
Generalized delta rule
Gradient descent method


Hướng tới (có sách dịch là truyền tới)
Logic mờ
Khả năng tổng quát hoá
Luật tổng quát delta
Phương pháp giảm gradient

Hidden layer

Tầng ẩn

Highlight

Làm nổi bật, nổi rõ

Hybrid

Lai (pha trộn)

vi


Input function

Hàm nhập

Input layer

Tầng nhập

Layer

Learning rate
LMS (Least mean
squared error)
Momentum
Multi Layer Perceptron
(MLP)
Network training
Neuron
Neuron, unit, node
NN

Tầng
Hệ số nhận biết
Bình phương sai số nhỏ nhất
Mơ men
Mơ hình giác quan nhiều tầng
(Perceptron – xem />Perceptron)
Huấn luyện mạng
Thần kinh
Nút
Mạng neuron (mạng thần kinh)

Output layer

Tầng xuất

Overfitting

Quá mức


Personal Digital
Assistant
Prediction
Preprocessing data
Radial Basis Function
(RBF)
Recurrent Neuron
Network
Sum squared error
Supervised learning,
learning with a teacher

Máy trợ lý cá nhân dùng kỹ thuật số
Dự báo
Tiền xử lý dữ liệu
Mơ hình dạng hàm radial
Mạng neuron hồi qui.
Tổng sai số bình phương
Học có giám sát

vii


Testing

Bước kiểm chứng.

Training

Huấn luyện


Training set

Tập dữ liệu huấn luyện

Unsupervised learmning

Học khơng có giám sát

Validation set

Tập dữ liệu để kiểm tra

viii


NỘI DUNG
1
CƠ SỞ PHÁP LÝ, TÍNH CẤP THIẾT, MỤC TIÊU, NỘI DUNG VÀ GIỚI HẠN
CỦA ĐỀ TÀI............................................................................................................................1
1.1
Cơ sở pháp lý của đề tài..............................................................................................1
1.2
Tính cấp thiết của đề tài..............................................................................................2
1.3
Mục tiêu của đề tài .....................................................................................................5
1.4
Nội dung nghiên cứu ..................................................................................................5
1.5
Phương pháp nghiên cứu ............................................................................................6

2
NHỮNG TIỀN ĐỀ CƠ BẢN CỦA ĐỀ TÀI ....................................................................7
2.1
Khoa học trí tuệ nhân tạo và ứng dụng của nó trong thực tiễn .....................................8
2.2
Một số nghiên cứu gần với hướng nghiên cứu của đề tài...........................................12
2.3
Công nghệ GIS và kỹ thuật mạng neuron..................................................................14
2.4
Một số lĩnh vực ứng dụng của GIS neuron................................................................19
3
XÂY DỰNG MƠ HÌNH DỰ BÁO Ơ NHIỄM BẰNG KỸ THUẬT MẠNG NEURON
21
3.1
Kỹ thuật mạng neuron ..............................................................................................22
3.2
Xây dựng mơ hình mạng neuron dự báo ơ nhiễm khơng khí .....................................29
3.2.1
Đặt vấn đề ........................................................................................................29
3.2.2
Thiết kế hệ thống mơ hình mạng neuron dự báo ơ nhiễm khơng khí ..................31
3.2.3
Áp dụng kỹ thuật lan truyền ngược vào bài tốn dự báo ơ nhiễm khơng khí .....35
3.3
Cơng cụ SAGOCAP1 tự động hóa tính tốn dự báo ơ nhiễm khơng khí theo mơ hình
kỹ thuật mạng neuron...........................................................................................................40
3.4
Kết quả dự báo ơ nhiễm khơng khí theo mơ hình mạng neuron.................................44
3.4.1
Tại trạm Bệnh viện Thống Nhất, Tp. HCM .......................................................44

3.4.2
Tại trạm Sở Khoa học và Cơng nghệ Tp. Hồ Chí Minh .....................................48
3.4.3
Tại trạm Phịng giáo dục quận Bình Chánh .......................................................52
3.4.4
Tại trạm Thảo cầm viên Tp. Hồ Chí Minh.........................................................55
3.4.5
Tại trạm Ủy ban nhân dân quận 2......................................................................58
3.5
Một số chức năng khác của phần mềm SAGOCAP1 phục vụ cho công tác quản lý số
liệu quan trắc .......................................................................................................................63
3.5.1
Cấu trúc của SAGOCAP1 phiên bản 1.0 .........................................................63
3.5.2
Một số chức năng chính trong SAGOCAP1 .....................................................68
4
THÍCH NGHI MƠ HÌNH PHÁT TÁN Ô NHIỄM CHO NGUỒN ĐƯỜNG
BERILAND CHO TP. HỒ CHÍ MINH ................................................................................70
4.1
Một số cơ sở lí luận của mơ hình mơ phỏng ơ nhiễm khơng khí Berliand cho nguồn
đường 71
4.1.1
Mơ hình ơ nhiễm khơng khí Berliand cho nguồn đường ....................................71
4.1.2
Hệ số khuếch tán rối đứng.................................................................................77
4.2
Phương pháp tính tải lượng ô nhiễm cho nguồn đường .............................................78
4.3
Phần mềm SAGOCAP2............................................................................................79
4.3.1

Mục tiêu của SAGOCAP2 ................................................................................79
4.3.2
Cấu trúc của phần mềm SAGOCAP2................................................................80
4.3.3
Tự động hóa tính tốn trong SAGOCAP2 .........................................................80
4.4
Tính tốn mơ phỏng ơ nhiễm khơng khí tại Tp. Hồ Chí Minh bằng SAGOCAP2 ......87
5
KẾT LUẬN VÀ KIẾN NGHỊ ........................................................................................95

ix


5.1
Khối lượng công việc và kết quả đạt được ................................................................95
5.2
Kết quả nổi bật của đề tài..........................................................................................98
5.3
Một số kết quả khác..................................................................................................98
5.4
Những nội dung đã đăng ký nhưng không được đề cập tới trong Báo cáo .................98
5.5
Hạn chế của đề tài ....................................................................................................99
5.6
Một số thuận lợi trong quá trình thực hiện đề tài.......................................................99
5.7
Một số khó khăn trong q trình thực hiện đề tài ....................................................100
5.8
Kiến nghị................................................................................................................101
6

TÀI LIỆU THAM KHẢO............................................................................................102
7
PHỤ LỤC A: CƠ SỞ TOÁN – TIN CỦA ĐỀ TÀI .....................................................104
7.1
Mơ hình lan truyền ngược.......................................................................................104
7.1.1
Kiến trúc mạng hướng tới ...............................................................................105
7.1.2
Giải thuật lan truyền ngược.............................................................................107
7.2
Một số vấn đề khi xây dựng FFNN .........................................................................116
7.2.1
Lựa chọn cấu trúc ...........................................................................................116
7.2.2
Lựa chọn hệ số nhận biết ................................................................................117
7.2.3
Tiêu chuẩn dừng huấn luyện ...........................................................................117
7.3
Cơ sở lý luận tính hệ số khuếch tán rối ngang trong mơ hình Berliand ....................119
8
PHỤ LỤC B. KẾT QUẢ SO SÁNH GIỮA TÍNH TỐN DỰ BÁO VÀ SỐ LIỆU
THỰC ĐO ............................................................................................................................125
8.1
Trạm Bệnh viện Thống nhất ...................................................................................125
8.2
Trạm Sở Khoa học và Cơng nghệ Tp. Hồ Chí Minh................................................130
8.3
Trạm Phịng giáo dục huyện Bình Chánh................................................................133
8.4
Trạm Thảo Cầm viên..............................................................................................136

8.5
Trạm Ủy ban nhân dân quận 2 ................................................................................139
9
PHỤ LỤC C: MỘT SỐ MÃ NGUỒN CHÍNH CỦA PHẦN MỀM SAGOCAP.......145
9.1
Giải thuật lan truyền ngược trong kỹ thuật mạng neuron.........................................145
9.2
Chương trình tính tốn phát tán ơ nhiễm từ nguồn đường .......................................153
10
MỘT SỐ VĂN BẢN PHÁP LÝ LIÊN QUAN.........................................................162
11
MỤC LỤC BẢNG VÀ HÌNH...................................................................................166
11.1 Danh mục Bảng......................................................................................................166
11.2 Danh mục Hình ......................................................................................................167
12
MỘT SỐ HÌNH ẢNH LIÊN QUAN TỚI Q TRÌNH THỰC HIỆN ĐỀ TÀI....170

x


1

CƠ SỞ PHÁP LÝ, TÍNH CẤP THIẾT, MỤC TIÊU, NỘI DUNG VÀ
GIỚI HẠN CỦA ĐỀ TÀI

1.1 Cơ sở pháp lý của đề tài
Cơ sở pháp lý để thực hiện đề tài này là:

- Luật Khoa học và Công nghệ được Quốc hội thơng qua ngày 9/6/2000, trong đó điều
17 có nêu rõ: Cá nhân hoạt động khoa học và công nghệ có quyền:... ký kết hợp đồng

khoa học và cơng nghệ ... bình đẳng, tự do sáng tạo trong hoạt động khoa học và cơng
nghệ...

Hình 1.1. Hội đồng xét duyệt đề tài “ Nghiên cứu xây dựng mơ hình dự báo chất lượng khơng
khí tại Tp. HCM bằng phương pháp mạng nơ ron “ ngày 9/8/2004 tại Sở KHCN Tp.HCM.

- Thông báo kết quả chấm điểm các đề tài khoa học đăng ký năm 2004 ngày 24 tháng 9
năm 2003 của Sở Khoa học và Cơng nghệ Tp. Hồ Chí Minh.
- Quyết định số 0320/QĐ-SKHCN ngày 4/8/2004 về việc thành lập hội đồng xét duyệt
đề tài nghiên cứu khoa học xét duyệt đề tài.

1


- Biên bản xét duyệt đề tài nghiên cứu khoa học xét duyệt đề tài do TSKH. Bùi Tá
Long làm chủ nhiệm ngày 9/8/2004.
- Hợp đồng nghiên cứu khoa học số: 183/HĐ-SKHCN ngày 1 tháng 10 năm 2004 giữa
Sở Khoa học Công nghệ Tp. HCM và Viện Cơ học Ứng dụng đã ký.
- Quyết định số 71/QĐ – SKHCN của Sở Khoa học và Cơng nghệ Tp. Hồ Chí Minh
ngày 18/03/2005 về việc thành lập Hội đồng khoa học nghiệm thu giai đoạn 1
- Kết luận của Biên bản nghiệm thu giai đoạn 1 ngày 25/3/2005.

Hình 1.2. Nghiệm thu giai đoạn 1 của đề tài ngày 25/3/2005.

1.2 Tính cấp thiết của đề tài
Trong tiến trình cơng nghiệp hố, hiện đại hố đất nước, các cấp chính quyền của
Tp. Hồ Chí Minh như Sở Khoa học và Công nghệ, Sở Tài ngun và Mơi trường Tp. Hồ
Chí Minh đã chú trọng tới công tác bảo vệ môi trường. Ngay từ năm 1995 - 1996, Sở
Khoa học, Công nghệ và Môi trường (cũ) đã thực hiện nhiều đề tài, dự án hướng tới bảo


2


vệ mơi trường, điển hình là dự án bảo vệ sơng Sài Gịn - Đồng Nai được thực hiện từ
1995 – 1996 dưới sự tài trợ của Sở Khoa học – Cơng nghệ và Mơi trường lúc đó, ….
Khách quan mà nói cơng tác bảo vệ mơi trường ở Tp. Hồ Chí Minh trong thời gian qua
đã có những chuyển biến tích cực. Nhận thức về bảo vệ mơi trường trong các cấp, các
ngành và nhân dân trong thành phố đã được nâng lên; mức độ gia tăng ô nhiễm, suy
thối và sự cố mơi trường đã từng bước được hạn chế. Những kết quả đó đã tạo tiền đề
tốt cho công tác bảo vệ môi trường của thành phố Hồ Chí Minh trong thời gian tới.
Tuy nhiên, như đánh giá của Bộ chính trị trong nghị quyết 41-NQ/TW ngày
15/11/2004 về Bảo vệ môi trường trong thời kỳ đẩy mạnh cơng nghiệp hóa, hiện đại hóa
đất nước: mơi trường nước ta vẫn tiếp tục bị xuống cấp nhanh, có nơi, có lúc đã đến mức
báo động: đất đai bị xói mịn, thối hóa; chất lượng các nguồn nước suy giảm mạnh;
khơng khí ở nhiều đơ thị, khu dân cư bị ô nhiễm nặng; khối lượng phát sinh và mức độ
độc hại của chất thải ngày càng tăng; tài nguyên thiên nhiên trong nhiều trường hợp bị
khai thác quá mức, không có quy hoạch; đa dạng sinh học bị đe doạ nghiêm trọng; điều
kiện vệ sinh môi trường, cung cấp nước sạch ở nhiều nơi không bảo đảm. Việc đẩy mạnh
phát triển cơng nghiệp, dịch vụ, q trình đơ thị hố, sự gia tăng dân số trong khi mật độ
dân số đã q cao, tình trạng đói nghèo chưa được khắc phục tại một số vùng nông thôn,
miền núi, các thảm hoạ do thiên tai và những diễn biến xấu về khí hậu tồn cầu đang
tăng, gây áp lực lớn lên tài nguyên và môi trường, đặt công tác bảo vệ môi trường trước
những thách thức gay gắt.
Những hạn chế trong công tác bảo vệ môi trường trong thời gian qua không chỉ đơn
thuần là thiếu các phương tiện kỹ thuật hiện đại, mà ở mức độ đáng kể là do đã bỏ qua các
phương pháp quản lý hiện đại, cụ thể là việc ứng dụng công nghệ thông tin trong cơng tác
quản lý mơi trường cịn ở mức rất khiêm tốn. Hiện nay để thông qua một quyết định về
môi trường, cần thiết phải tập hợp nhiều loại số liệu khác nhau. Mặt khác các số liệu này
lại nằm rải rác trong nhiều đề tài, dự án cũng như thuộc nhiều cơ quan quản lý khác nhau.
Hàng năm một khối lượng rất lớn các dữ liệu liên quan tới môi trường được thu thập tại

nhiếu trạm quan trắc trong toàn thành phố. Tuy nhiên hầu hết các số liệu này chưa được

3


quản lí theo cơng nghệ hiện đại để có thể khai thác chúng một cách có hiệu quả, phục vụ
tốt cho cơng tác quản lí cũng như nghiên cứu khoa học.
Trong bối cảnh đó vào tháng 11.2004, Thủ tướng Chính phủ vừa phê duyệt Chiến
lược ứng dụng và phát triển công nghệ thông tin tài nguyên và môi trường đến năm 2015
và định hướng đến năm 2020 với mục tiêu tin học hóa hệ thống quản lý hành chính
nhà nước về tài nguyên và môi trường phù hợp với tiêu chuẩn Chính phủ điện tử,
tạo điều kiện để các tổ chức, người dân tiếp cận thuận lợi các thông tin về tài nguyên và
môi trường. Theo quyết định này, đến năm 2010, từ 50% đến 100% thiết bị điều tra,
khảo sát, quan trắc, đo đạc được chuyển sang công nghệ số; hồn thành việc xây dựng,
tích hợp cơ sở dữ liệu của từng lĩnh vực thuộc ngành tài nguyên và mơi trường với dữ
liệu được chuẩn hóa theo chuẩn quốc gia và cập nhật thường xuyên; đến năm 2015, hoàn
thiện mạng nội bộ tài nguyên và môi trường quốc gia trên cơ sở kết nối các mạng nội bộ
chuyên ngành của từng lĩnh vực.
Trong thời gian qua, nghiên cứu ứng dụng công nghệ thông tin vào công tác quản
lý môi trường đã được nhiều Sở ban ngành của Tp. Hồ Chí Minh quan tâm. Trong khn
khổ đề tài nghiên cứu triển khai theo hướng tin học môi trường cho Tp. Hồ Chí Minh
bài tốn phân tích ơ nhiễm khơng khí đóng vai trị quan trọng hàng đầu. Để giải
quyết bài toán này cần thiết phải ứng dụng các kết quả mới nhất từ nhiều hướng nghiên
cứu khoa học công nghệ, trong đó có cơng nghệ thơng tin. Đây cũng chính là lý do của
sự ra đời đề tài này. Lần đầu tiên Sở Khoa học và Công nghệ hỗ trợ cho nghiên cứu xây
dựng phương pháp dự báo ô nhiễm khơng khí dựa trên kỹ thuật mạng nơron. Tính cấp
thiết phải ứng dụng phương pháp mạng nơ ron cho bài tốn phân tích dự báo ơ nhiễm
khơng khí được luận chứng từ khía cạnh lí luận cũng như từ khía cạnh thực tiễn, thể
hiện ở các luận điểm sau đây:
-


Bài tốn phân tích thơng tin, dự báo ơ nhiễm khơng khí cho Tp. Hồ Chí Minh
hiện nay là bài tốn mang tính cấp thiết hàng đầu. Để giải quyết tốt bài toán này

4


cần thiết phải ứng dụng các phương pháp mới, những công cụ mạnh như GIS, kỹ
thuật mạng neuron.
Để quản lý mơi trường khơng khí hiện nay tại Tp. Hồ Chí Minh cần thiết phải

-

xây dựng các công cụ tin học hỗ trợ quản lí, khai thác số liệu.

1.3 Mục tiêu của đề tài
Mục tiêu lâu dài :
Đề tài này hướng tới mục tiêu lâu dài là xây dựng hệ thống thông tin môi trường
trợ giúp quản lý tổng hợp và thống nhất mơi trường khơng khí do q trình phát triển
kinh tế - xã hội, phục vụ cho công tác quản lý môi trường và phát triển bền vững tại Tp.
Hồ Chí Minh.
Mục tiêu trước mắt:
· Tin học và Việt hóa q trình nhập, xuất dữ liệu quan trắc chất lượng mơi trường
khơng khí - hỗ trợ cho cơng tác giám sát môi trường tại các Sở ban ngành chức
năng của Tp. Hồ Chí Minh.
· Nghiên cứu các phương pháp toán tin như mạng neuron, khám phá số liệu (data
mining), … nhằm xây dựng mơ hình dự báo ơ nhiễm khơng khí tại Tp. Hồ Chí
Minh dựa trên số liệu quan trắc chất lượng mơi trường khơng khí từ các trạm quan
trắc liên tục.
· Nghiên cứu đề xuất các mẫu thơng tin mơi trường giúp cho cơng tác quản lí môi

trường cũng như cho người dân.

1.4 Nội dung nghiên cứu
-

Khai thác tối đa các kết quả nghiên cứu trước đây có liên quan tới vấn đề ơ nhiễm
khơng khí do giao thông tại Tp. HCM để lấy ra được những thơng tin có ích cho
đề tài.

5


-

Nghiên cứu ứng dụng kỹ thuật mạng neuron để dự báo ơ nhiễm khơng khí tại các
trạm quan trắc tự động.

-

Xây dựng mơ hình mạng neuron nhân tạo dự báo ô nhiễm ngắn hạn (trong phạm
vi 5 ngày) tại các vị trí đặt các trạm quan trắc ơ nhiễm khơng khí do giao thơng.
(tiếp sau đây mơ hình này sẽ được gọi là SAGOCAP1 - Contaminants in the Air
Prediction model for SAi GOn, phiên bản 1.0)

-

Dựa trên CSDL về khí tượng nhiều năm qua của Tp. HCM để tính tốn các hệ số
khuếch tán rối ngang k0 và đứng k1 cho Tp. HCM.

-


Trên cơ sở các hệ số khuếch tán rối k0 và k1 được tính tốn ở trên, áp dụng mơ
hình thủy động lực học để tính tốn sự phát tán ơ nhiễm cho một số trục giao
thơng chính của Tp. HCM.

-

Xây dựng các kịch bản tính tốn khác nhau cho SAGOCAP2 phiên bản 1.0 (tiếp
sau đây mơ hình thủy động lực học với các hệ số rối thích nghi cho Tp. HCM
được gọi là SAGOCAP2) có lưu ý tới những trường hợp khơng thuận lợi của khí
tượng cũng như khi mật độ xe cộ đạt giá trị cực đại.

-

So sánh kết quả tính tốn theo mơ hình mạng neuron với số liệu đo đạc để kiểm
chứng mơ hình.

-

Xây dựng một số kịch bản cho tính tốn theo mơ hình SAGOCAP2 phiên bản 1.0
có lưu ý tới những trường hợp khơng thuận lợi của khí tượng cũng như khi mật độ
xe cộ đạt giá trị cực đại.

-

Tiến hành so sánh các kết quả của SAGOCAP1 và SAGOCAP2 để rút ra những
kết luận cần thiết.

-


Đề xuất một số ý kiến và giải pháp giảm thiểu ơ nhiễm khơng khí do giao thơng
tại Tp.HCM.

1.5 Phương pháp nghiên cứu
Trong q trình thực hiện đề tài này, các phương pháp sau đây được áp dụng:

6


-

Phương pháp thu thập tài liệu : thu thập các tài liệu về lí luận cũng như thực tiễn
liên quan tới đề tài đã có để lấy ra những thơng tin cần thiết phục vụ cho đề tài.
Phối hợp với các Ban ngành chức năng liên quan tới đề tài để thu thập số liệu.

-

Phương pháp khảo sát thực địa : tiến hành đo đạc thực địa để xây dựng mơ hình.

-

Phương pháp phân tích phịng thí nghiệm: dựa trên mảng số liệu đo đạc để tính
tốn ra các hệ số khuếch tán thích nghi với điều kiện thành phố HCM.

-

Phương pháp thống kê trong nghiên cứu khoa học: dựa trên số liệu quan trắc lâu
năm về khí tượng tại Tp.HCM để tính tốn ra các hệ số khuếch tán rối ngang k0 và
đứng k1 được tính tốn riêng cho Tp. HCM.


-

Phương pháp mơ hình hóa trong nghiên cứu mơi trường: xây dựng mơ hình phát
tán (lan truyền chất) từ phương trình vi phân đạo hàm riêng với các điều kiện ban
đầu và điều kiện biên. Tìm nghiệm xấp xỉ giải tích. Đưa các khuếch tán rối ngang
k0 và đứng k1 được tính tốn riêng cho Tp. HCM để làm cơ sở cho SAGOCAP2
phiên bản 1.0.

-

Phương pháp tự động trong nghiên cứu khoa học: dựa trên cơ sở dữ liệu và mơ
hình tốn xây dựng các mơ đun tính tốn các tham số phục vụ cho đề tài.

-

Phương pháp tin học mơi trường: các thuật tốn trong bài tốn quản lí số liệu quan
trắc mơi trường cũng như số liệu về khí tượng. Các phương pháp tích hợp thơng
tin liên quan tới bài tốn mơi trường. Cơng nghệ hệ thống thơng tin địa lí GIS.

2

NHỮNG TIỀN ĐỀ CƠ BẢN CỦA ĐỀ TÀI
Trong mục này trình bày một số cơ sở lý luận và thực tiễn của đề tài. Các đề mục

theo thứ tự được trình bày gồm: khái quát về khoa học trí tuệ nhân tạo và ứng dụng của
nó trong thực tiễn, tiền đề về mặt thực tiễn của đề tài, một số hướng nghiên cứu gần với
đề tài này, về kỹ thuật mạng neuron. Đây là một đề tài ứng dụng GIS kết hợp với mạng
neuron, vì vậy trong báo cáo này trình bày khái quát về sự kết hợp giữa hai công nghệ

7



này và một số ứng dụng đi kèm. Mục đích của phần trình bày này là giúp cho người đọc
cảm nhận được tính khoa học và thực tiễn của đề tài này.

2.1 Khoa học trí tuệ nhân tạo và ứng dụng của nó trong thực tiễn
Khoa học trí tuệ nhân tạo hướng tới việc xây dựng các máy tính thơng minh, các
chương trình thơng minh giúp cho con người khám phá ra các quy luật hoạt động sáng
tạo.
Năm 1960 được coi là cái mốc quan trọng cho nghiên cứu về trí tuệ nhân tạo khi
McCathy ở Học viện cơng nghệ Massachussets đưa ra ngơn ngữ lập trình đầu tiên :LISP
(list processing). Thuật ngữ artificial intelligence do Marvin Minsky, cũng là một
chuyên gia nổi tiếng của Học viện công nghệ Massachussets, đưa ra vào năm 1961.
Những năm 60 của thế kỷ trước được xem là giai đoạn tích cực trong quá trình xây dựng
các máy có khả năng suy nghĩ. Một số kết quả của giai đoạn này được trình bày trong
Bảng 2.1.
Bảng 2.1. Một số chương trình sử dụng nguyên lý trí tuệ nhân tạo giai đoạn đầu phát triển

STT

THÀNH TỰU

NĂM

1

Chương trình tính tích phân bất định

1961


2

Chương trình chứng minh các định lý hình học khơng 1963
gian, chương trình chơi cờ của Samuel

3

Chương trình giải phương trình đại số sơ cấp

1964

4

Chương trình phân tích và tổng hợp tiếng nói

1966

Trí tuệ nhân tạo (artificial intelligence) được hiểu là tính chất của các hệ tự động
có được một số chức năng suy nghĩ của con người, lựa chọn và thông qua một số quyết
định tối ưu trên cơ sở kinh nghiệm đã nhận được trước đó cũng như dựa trên cơ sở phân
tích một cách hợp lý các tác động bên ngồi. Đó là các hệ dựa trên nguyên lý tự học và

8


tự tổ chức và tiến hóa với sự tham gia tối thiểu của con người và vai trò của con người ở
đây là người thầy và người cộng sự, một đối tác bình đẳng trong mối quan hệ người –
máy.
Những nỗ lực xây dựng các hệ trí tuệ nhân tạo dựa trên cơ sở máy tính đã bắt đầu
vào kỷ nguyên phát triển của các kỹ thuật máy tính. Tuy nhiên vào thời điểm đó vẫn cịn

ngự trị luận điểm khẳng định máy Turing là mơ hình lý thuyết của não, cịn máy tính là
sự thể hiện một cái máy đa năng và một q trình thơng tin bất kỳ có thể tái hiện trên
máy tính. Luận điểm như vậy đã ngự trị trong một thời gian dài và đã mang lại nhiều kết
quả tốt nhưng bài toán chủ yếu là xây dựng trí tuệ nhân tạo đã khơng thể thực hiện được.
Bộ não của con người làm việc với thông tin trên thực tế phức tạp hơn máy Turing
nhiều. Mỗi suy nghĩ của con người có một ngữ cảnh xác định mà ngồi ngữ cảnh đó suy
nghĩ đó khơng có nghĩa, tri thức được lưu trữ dưới dạng hình ảnh được đặc trưng bởi
tính mờ khơng đóng.
Xử lý thơng tin trong những hệ trí tuệ nhân tạo dựa trên sử dụng quá trình cơ bản
– quá trình tự học. Hình ảnh có những tính chất khách quan đặc trưng theo nghĩa các hệ
nhận dạng được học trên những chuỗi dữ liệu quan trắc giống nhau sẽ cho kết quả tương
đối giống nhau và cho phép biệt các đối tượng một cách độc lập. Chính tính khách quan
này đã làm cho con người trên tồn thế giới hiểu nhau (ví dụ như tiếng Anh được dạy tại
nhiều nơi trên thế giới đã giúp con người hiểu nhau). Quá trình học là q trình xử lí
phản ứng riêng rẽ lên nhóm các tín hiệu riêng từ bên ngồi được diễn ra trong một hệ
thống nào đó. Q trình học được thực hiện bằng con đường tác động nhiều lần lên hệ
nhận dạng tín hiệu hiệu chỉnh từ phía bên ngồi. Cơ chế sinh ra hiệu chỉnh này thường
có ý nghĩa khuyến khích và trừng phạt. Cơ chế này hồn tồn xác định thuật tốn tự học.
Q trình tự học khác với q trình học ở chỗ thơng tin bổ sung về tính đúng đắn của
phản ứng khơng được thơng báo cho hệ.
Cuối những năm 80, đầu những năm 90 của thế kỷ trước, trên thị trường dân dụng
đã có nhiều sản phẩm đạt trình độ cao như máy giặt, máy ảnh, … sử dụng trí tuệ nhân
tạo. Các hệ thống nhận dạng và xử lý ảnh, tiếng nói ngày càng làm thúc đẩy sự phát triển

9


kỹ thuật mạng neuron. Những nghiên cứu theo hướng này được quan tâm và phát triển
đặc biệt tại nước Nhật. Sự xuất hiện ngày càng nhiều các sản phẩm ứng dụng trí tuệ nhân
tạo trong cuộc sống và trong cơng nghiệp đã tạo ra những tiền đề cơ bản cho các dự án

xây dựng các hệ thống thơng minh. Có thể phân chia các lĩnh vực nghiên cứu và ứng
dụng quan trọng của trí tuệ nhân tạo theo bốn hướng cơ bản sau đây:
Hướng thứ nhất: Mơ hình hóa trên máy tính những chức năng khác nhau trong
q trình sáng tạo: các trò chơi, chứng minh tự động các định lý, tổng hợp tự động các
chương trình, …
Hướng thứ hai: Nâng cao khả năng trí tuệ “bên ngồi” của máy tính, bao gồm các
nghiên cứu cơ bản và ứng dụng, gắn liền với các giao tiếp, hộp thoại phù hợp sử dụng
các kỹ thuật suy diễn và tìm kiếm.
Hướng thứ ba: Nâng cao khả năng trí tuệ “bên trong” của máy tính trên cơ sở chế
tạo các máy tính thế hệ mới, với kiến trúc vật lý mới, dựa trên nguyên lý của trí tuệ nhân
tạo.
Hướng thứ tư: Chế tạo người máy thơng minh, có khả năng thực hiện những thao
tác phức tạp và có thể “suy nghĩ” và “hành động” để đạt tới các mục đích đã đặt ra.
Theo tác giả Nguyễn Thanh Thủy [5], những ứng dụng cơ bản của các kỹ thuật trí
tuệ nhân tạo gồm:
Kỹ thuật người máy
Cuối những năm 1960, kỹ thuật và công nghệ chế tạo người máy có những bước
phát triển mới, trên cơ sở kết hợp những thành tựu nghiên cứu của lý thuyết trí tuệ nhân
tạo và điều khiển học. Năm 1960 người máy được chế tạo thành công tại trường đại học
Stanford. Tiếp theo đó, các nghiên cứu và ứng dụng phương pháp nhận dạng, hình ảnh
và tiếng nói là những tiền đề quan trọng để chế tạo người máy thơng minh có khả năng
xử lý các thơng tin hiển thị, hình ảnh ba chiều, hiểu được lời nói liên tục.
Các chương trình trị chơi
Trị chơi ln là lĩnh vực thu hút rất nhiều sự quan tâm của các chuyên gia tin
học. Các chương trình điển hình như:
10


-


Chương trình chơi cờ

-

Chương trình chơi bài

-

Các chương trình trị chơi điện tử
Xử lý ngôn ngữ tự nhiên
Cùng với sự phát triển của máy tính, nhu cầu tạo ra các giao diện thân thiện giữa

người sử dụng với máy tính, sử dụng ngôn ngữ tự nhiên càng cấp bách. Phạm vi xử lý
ngôn ngữ tự nhiên bao gồm:
-

Giao tiếp bằng ngôn ngữ tự nhiên với các máy tự động

-

Các hệ thơng thu thập tin tự động

-

Người máy có khả năng nghe hiểu

-

Giao tiếp với các hệ chuyên gia


-

Hiểu văn bản

-

Hiều tiếng nói liên tục
Các hệ thống xử lý tri thức và dữ liệu tích hợp
Thực tiễn xây dựng các hệ CSDL lớn và hệ chuyên gia dựa trên tri thức chứng tỏ

rằng để thành công trong các ứng dụng thực tế, đặc biệt trong sản xuất công nghiệp,
quản lý, cần phải đưa ra các cách tiếp cận hợp lý cho phép xử lý cùng một lúc cả dữ liệu
và tri thức. Một số cách tiếp cận được sử dụng là:
-

Cơ sở dữ liệu suy diễn (deductive data base)

-

Biểu diễn luật – đối tượng (rule – object representation)

-

Biểu diễn hướng đối tượng (object-oriented representation)
Các hệ hỗ trợ quyết định dựa trên tri thức (knowledge – based decision support

system) được xem như kết quả kết hợp xử lý tri thức – dữ liệu cùng với việc sử dụng các
mơ hình tốn .

11



Các giao diện người – máy thông minh, các thiết bị điện tử “thơng minh” sử
dụng logic mờ.
Ngồi khía cạnh hội thoại người – máy bằng ngôn ngữ tự nhiên, giao diện người
– máy thông minh và thân thiện gắn chặt với các nghiên cứu và ứng dụng kỹ thuật
multimedia, nói riêng là kỹ thuật hypertext.
Trong những năm gần đây, các nghiên cứu về trí tuệ nhân tạo tập trung vào các
lĩnh vực sau đây:
-

Lập trình logic

-

Các phương pháp học, thu nạp tri thức

-

Thuật toán di truyền

-

Mạng neuron, mạng neuron mờ

-

Các hệ hỗ trợ quyết định dựa trên tri thức

2.2 Một số nghiên cứu gần với hướng nghiên cứu của đề tài

Các phương pháp trí tuệ nhân tạo đã được ứng dụng rộng rãi trong nhiều lĩnh vực
khoa học và cuộc sống. Trong khn khổ có giới hạn về thời gian của một đề tài cấp
thành phố thật khó có thể trình bày đầy đủ những ứng dụng rất đa dạng của trí tuệ nhân
tạo. Phần dưới đây trình bày một số kết quả được công bố gần đây trên một số tạp chi
chuyên ngành về Trí tuệ nhân tạo cũng như về mơ hình hóa mơi trường có ứng dụng trí
tuệ nhân tạo.
Ramesh Sharda /[16]/, một nhà khoa học của Mỹ đã cơng bố một chương trình
máy tính cho phép dự đoán bộ phim sẽ ăn khách hay thất bại trước cả khi nó được khởi
quay.
Tác giả Sharda đã nghiên cứu phần mềm này ròng rã suốt 7 năm qua, phân tích tỉ
mẩn hơn 800 bộ phim các loại. Tiêu chí để Sharda đánh giá, nhận định và mổ xẻ một bộ

12


phim bao gồm 7 hạng mục: chấm điểm của giới phê bình, sự cạnh tranh từ các phim
khác chiếu cùng thời điểm, giá trị của dàn diễn viên, giới tính, kỹ xảo hình ảnh, có phải
là phần tiếp theo hay không, cuối cùng là số lượng rạp mà bộ phim dự kiến công chiếu.
Kết quả chấm điểm từ từng hạng mục sẽ được một hệ thống mạng thông minh
tổng hợp lại, xử lý và phân tích. Bộ phim sẽ được sắp xếp vào một trong 9 thứ hạng khác
nhau, bắt đầu từ "Chìm nghỉm" (nghĩa là doanh thu chưa đầy 1 triệu USD) tăng dần lên
đến "bom tấn" (tương đương với doanh thu trên 200 triệu USD).
Theo /[16]/, tỷ lệ phân tích trùng khít với dự đốn (doanh số bán vé của bộ phim
tương ứng với thứ hạng dự đoán) là 37%. 75% số lần dự đốn có dao động xê dịch trong
hai thứ hạng liên tiếp nhau. Theo ý kiến của chuyên gia Ramesh Sharda, điều này cho
phép ứng dụng mạng neuron như một hệ chuyên gia trong kinh doanh điện ảnh.
Cơng trình [14] trình bày cách tiếp cận ứng dụng kỹ thuật trí tuệ nhân tạo trong
bài tốn xây dựng hệ hỗ trợ ra quyết định trong lĩnh vực môi trường. Phần mềm được đặt
tên là OntoWEDSS ứng dụng trong bài toán quản lý nước thải. OntoWEDSS thực hiện
các chức năng sau đây: 1/mơ hình hóa thơng tin liên quan tới các quá trình xử lý nước

thải, 2/ gạn lọc phần cịn chưa hồn thiện của cơng nghệ đang được sử dụng, 3/ kết hợp
tri thức từ các mơ hình dùng vi sinh vật trong q trình xử lý thành một quá trình hợp lý,
4/ xây dựng hệ hỗ trợ ra quyết định cho phép kết hợp thông tin thơng qua sự tích hợp
giữa các hệ tri thức và bản thể học (ontology).
Cơng trình [15] trình bày một số cách tiếp cận giải quyết bài toán hỗ trợ ra quyết
định trong lĩnh vực môi trường sử dụng phương pháp mơ hình hóa và khai thác dữ liệu.
Điểm mới nổi bật của cơng trình này là tích hợp mơ hình pha trộn (hybrid) với máy học.
Các kết quả nghiên cứu được đưa vào ứng dụng phân tích thảm học môi trường tại nhà
máy điện hạt nhân Chernobyl. Kết quả mô phỏng được so sánh với số liệu cho thấy tính
hiệu quả của phương pháp tiếp cận.

13


Cơng trình [19] của các nhà khoa học Nga được công bố rộng rãi trên Internet
xem xét ứng dụng kỹ thuật mạng neuron dự báo ơ nhiễm khơng khí từ một nguồn thải
điểm tại một điểm bất kỳ theo giá trị đo đạc được tại hai điểm giám sát chất lượng khơng
khí cho trước. Các kết quả dự báo sử dụng kỹ thuật mạng neuron được so sánh với giá trị
đo đạc được cho phép khẳng định tính ổn định cao của phương pháp theo kỹ thuật mạng
neuron. Hơn thế nữa trong [19] còn chỉ ra một cách phân loại mơ hình dự báo ơ nhiễm
khơng khí theo 3 dạng chính: tốn, thống kê và kỹ thuật mạng neuron /Hình 2.1/.

Tính tốn
Phương trình
khuếch tán
Điều kiện ban
đầu và biên
Đơn giản hóa phương
trình và nhận được
nghiệm giải tích


Sử dụng mạng
nơron

Thống kê

Tuyến tính

Phi tuyến

Giải xấp xỉ theo
khơng gian và
thời gian

Hình 2.1. Phân loại các phương pháp dự báo ơ nhiễm khơng khí theo tác giả Egorov

Sự phân loại trên khẳng định vai trò và vị trí của phương pháp trí tuệ nhân tạo
trong bài tốn bảo vệ mơi trường. Có thể giải thích rằng, với kỹ thuật và công nghệ hiện
nay các máy đo ngày càng nhiều dẫn tới số liệu gia tăng. Đây là yếu tố thuận lợi để ứng
dụng các phương pháp trí tuệ nhân tạo nói chung và kỹ thuật mạng neuron nói riêng.

2.3 Cơng nghệ GIS và kỹ thuật mạng neuron
GIS là môi trường rất tốt và là phương tiện để ứng dụng các phương pháp trí tuệ
nhân tạo. Phương pháp mơ hình hóa trong lý thuyết tốn về bản đồ học là một trong
những cơ sở của công nghệ GIS được ứng dụng để hỗ trợ ra quyết định, quản lý, tiến
hành thẩm định và xây dựng các dự báo … Cơ sở của phương pháp xử lý toán học là

14



phương pháp phân chia các đối tượng thành những lớp thuần nhất theo nghĩa nào đó.
Các bài tốn này giải quyết các thủ tục phân loại, phân vùng, sắp xếp, phân chia các tiêu
chí. Do vậy các kỹ thuật trí tuệ nhân tạo có được một mảnh đất mầu mỡ để phát triển.
Đây chính là lý do giải thích có nhiều cơng trình nghiên cứu về sự kết hợp giữa hai công
nghệ GIS và kỹ thuật mạng neuron.
Các tác giả trong cơng trình [20] đã trình bày một bản báo cáo đầy ấn tượng về sự
kết hợp giữa 2 công nghệ mạng Neuron và GIS với nhan đề: kỹ thuật mạng neuron và
GIS. Theo các tác giả này chính kỹ thuật mạng neuron là thước đo mới trong GIS.
Một trong những bài tốn chính của GIS được đặt ra cho các nhà nghiên cứu là
nhận được tri thức mới về bản chất các dữ liệu không gian. Tuy nhiên phần đông các nhà
nghiên cứu GIS thường chú ý nhiều tới khả năng biểu diễn dữ liệu của GIS mà chưa
đánh giá đúng khả năng của GIS trong lĩnh vực hỗ trợ ra quyết định (mà các hệ GIS này
có thể). Theo [20], giá trị của thông tin địa lý trong các hệ hỗ trợ ra quyết định trở nên
rõ ràng hơn khi GIS kết nối với các phần mềm dựa trên cơng nghệ và các phương pháp
trí tuệ nhân tạo. Tầm quan trọng của các phương tiện trí tuệ nhân tạo như các hệ chuyên
gia và mạng neuron ở chỗ chúng mở rộng đáng kể phạm vi ứng dụng vào thực tế. Bên
cạnh đó các phương pháp này dễ dàng chuyển qua máy tính và các giải pháp dựa trên
phân tích này mang lại hiệu quả kinh tế rõ rệt.
Kết quả ứng dụng cơng nghệ trí tuệ nhân tạo là các phần mềm ứng dụng hướng
tới người sử dụng. Tích hợp các hệ trí tuệ nhân tạo với GIS đặc biệt hiệu quả trong các
bài toán đánh giá, giám sát và thơng qua quyết định. Trong bài tốn này, sự phát triển
các mạng neuron, tính tốn tiến hóa, logic mờ, các hệ quản trị CSDL tự tạo, xử lý ảnh,
các hệ chun gia và một số cơng nghệ trí tuệ nhân tạo khác liên quan chặt chẽ với khả
năng mở rộng các chức năng trong bài tốn thơng qua quyết định. Trong cơng trình này
các nhà khoa học Nga đã lưu ý những điểm sau đây:

15



×