Tải bản đầy đủ (.pdf) (85 trang)

Xây dựng mô hình dự báo chất lượng không khí

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.45 MB, 85 trang )

ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA KHOA HỌC & KỸ THUẬT MÁY TÍNH

LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC

XÂY DỰNG MƠ HÌNH DỰ BÁO
CHẤT LƯỢNG KHƠNG KHÍ

Ngành: KHOA HỌC MÁY TÍNH

HỘI ĐỒNG:
GVHD:
GVPB:
SVTH:

Khoa học máy tính 11
Ts. Lê Thanh Vân
Ts. Lê Trọng Nhân
Lê Hiếu Thiện - 1613318

TP. HỒ CHÍ MINH, THÁNG 12/2022


ĐẠI HỌC QUỐC GIA TP.HCM
---------TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA:KH & KT Máy tính ____
BỘ MƠN:KHMT ____________

CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc



NHIỆM VỤ LUẬN ÁN TỐT NGHIỆP
Chú ý: Sinh viên phải dán tờ này vào trang nhất của bản thuyết trình

HỌ VÀ TÊN: LÊ HIẾU THIỆN
NGÀNH: KHOA HỌC MÁY TÍNH

MSSV: 1613318
LỚP: MT16KH01

1. Đầu đề luận án:
Xây dựng mơ hình dự báo chất lượng khơng khí
Building an air quality prediction model
2. Nhiệm vụ (yêu cầu về nội dung và số liệu ban đầu):
- Tìm hiểu về đặc điểm của bài tốn dự báo chất lượng khơng khí.
- Tìm hiểu các nghiên cứu và mơ hình dự báo chất lượng khơng khí đã được thực hiện.
- Nghiên cứu và đề xuất một số mô hình dự báo chất lượng khơng khí.
- Thu thập dữ liệu, huấn luyện và đánh giá mơ hình.
- Xây dựng một ứng dụng theo dõi và quản lý chất lượng khơng khí.
3. Ngày giao nhiệm vụ luận án: 03/08/2022
4. Ngày hoàn thành nhiệm vụ: 11/12/2022
5. Họ tên giảng viên hướng dẫn:

Phần hướng dẫn: 100%

1) TS. Lê Thanh Vân
Nội dung và yêu cầu LVTN đã được thông qua Bộ môn.
Ngày ........ tháng ......... năm ..........
CHỦ NHIỆM BỘ MÔN


GIẢNG VIÊN HƯỚNG DẪN CHÍNH

(Ký và ghi rõ họ tên)

(Ký và ghi rõ họ tên)

PHẦN DÀNH CHO KHOA, BỘ MÔN:
Người duyệt (chấm sơ bộ):________________________
Đơn vị: _______________________________________
Ngày bảo vệ: __________________________________
Điểm tổng kết: _________________________________
Nơi lưu trữ luận án: _____________________________


TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA KH & KT MÁY TÍNH

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
---------------------------Ngày 26 tháng 12 năm 2022

PHIẾU CHẤM BẢO VỆ LVTN
(Dành cho người hướng dẫn)
1. Họ và tên SV: Lê Hiếu Thiện
MSSV: 1613318
Ngành (chuyên ngành): Khoa học Máy tính
2. Đề tài: Xây dựng mơ hình dự báo chất lượng khơng khí
3. Họ tên người phản biện: Lê Thanh Vân
4. Tổng quát về bản thuyết minh:
Số trang: 83

Số chương: 6
Số bảng số liệu: 47
Số hình vẽ: 51
Số tài liệu tham khảo:
Phần mềm tính tốn:
Hiện vật (sản phẩm)
5. Tổng qt về các bản vẽ:
- Số bản vẽ:
Bản A1:
Bản A2:
Khổ khác:
- Số bản vẽ vẽ tay
Số bản vẽ trên máy tính:
6. Những ưu điểm chính của LVTN:
Luận văn hướng tới việc đề xuất các mơ hình dự báo chất lượng khơng khí trong khoảng thời gian
ngắn hạn. Sinh viên đã thực hiện tốt các nội dung sau để thực hiện các mục tiêu đã đặt ra của đề tài:
- Tìm hiểu các yếu tố trong đánh giá chất lượng khơng khí như PM2.5, TSP, CO,…
- Tìm hiểu các cơng trình nghiên cứu liên quan, các phương pháp được sử dụng có hiệu quả
trong bài tốn dự báo chất lượng khơng khí.
- Tập dữ liệu được sử dụng trong đề tài được thu thập thực tế tại 6 trạm quan trắc đặt tại các
khu vực có tính chất khác nhau tại TP Hồ Chí Minh: khu vực dân sinh, khu vực cơng
nghiệp, khu vực có mật độ cao về giao thơng. Sinh viên đánh giá dữ liệu sơ bộ bằng thống
kê để tìm hiểu các vấn đề về tương quan giữa các biến, nhiễu, histogram phân bố của dữ
liệu.
- Xây dựng các mơ hình dự báo ANN, RNN, ESN, CFNN, LSTM, CNN-LSTM, 2LSTM và
mơ hình hybrid. Thực hiện các thực nghiệm với các kịch bản khác nhau trên 6 trạm nhằm
đánh giá các mơ hình và thu được mơ hình cho kết quả dự báo tốt nhất phù hợp với các đặt
trưng dữ liệu hiện có.
- Xây dựng ứng dụng mobile để dự báo chất lượng khơng khí lần lượt trong khoảng thời gian
4 giờ kế tiếp.

7. Những thiếu sót chính của LVTN:
- Cần cung cấp đầy đủ thông tin của các tài liệu tham khảo.
8. Đề nghị: Được bảo vệ 
Bổ sung thêm để bảo vệ 
Không được bảo vệ 
9. 3 câu hỏi SV phải trả lời trước Hội đồng:
10. Đánh giá chung (bằng chữ: giỏi, khá, TB): Giỏi
Điểm :
9.5/10
Ký tên (ghi rõ họ tên)

TS. Lê Thanh Vân


TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA KH & KT MÁY TÍNH

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
---------------------------Ngày 09 tháng 01 năm 2023

PHIẾU CHẤM BẢO VỆ LVTN
(Dành cho người phản biện)
1. Họ và tên SV: Lê Hiếu Thiện
MSSV: 1613318
Ngành (chuyên ngành): Khoa học Máy tính
2. Đề tài: Xây dựng mơ hình dự báo chất lượng khơng khí
3. Họ tên người phản biện: Lê Trọng Nhân
4. Tổng quát về bản thuyết minh:
Số trang: 83

Số chương: 6
Số bảng số liệu: 47
Số hình vẽ: 51
Số tài liệu tham khảo:
Phần mềm tính tốn:
Hiện vật (sản phẩm)
5. Tổng qt về các bản vẽ:
- Số bản vẽ:
Bản A1:
Bản A2:
Khổ khác:
- Số bản vẽ vẽ tay
Số bản vẽ trên máy tính:
6. Những ưu điểm chính của LVTN:
• Sinh viên xây dựng được mơ hình dự báo chất lượng khơng khí hợp lý.
• Sinh viên thử nghiệm trên nhiều mơ hình dự báo khơng khí khác nhau.
• Sinh viên phân tích dữ liệu và đề xuất hướng tiếp cận mới trong việc dự báo. Trong đề tài
luận văn là việc sử dụng dữ liệu của trạm 5 và 6 để dự báo qua lại
7. Những thiếu sót chính của LVTN:
• Việc trình bày các kết quả thực nghiệm là chưa ấn tượng, khi đa phần là kết quả dưới dạng
số. Kết quả nên được biểu diễn dưới dạng đồ thị sẽ ấn tượng hơn.
• Chưa làm nổi bật được những đặc trung của từng mơ hình dự đốn.
8. Đề nghị: Được bảo vệ 
Bổ sung thêm để bảo vệ 
Không được bảo vệ 
9. 3 câu hỏi SV phải trả lời trước Hội đồng:
a. Sinh viên hãy sử dụng 1 bảng liệu, chẳng hạn như bảng 4.16 trong báo cáo (sai số của các mơ
hình cho chỉ số PM2.5 của trạm 6) để giải thích tại sao B-LSTM lại có sai số tốt nhất.
b. Sinh viên hãy trình bày một vài đặc điểm thống kê của dữ liệu O3, nó có tính chất tuần hồn hay
khơng, O3 sẽ thường cao nhất vào lúc nào và thấp nhất vào lúc nào?

10. Đánh giá chung (bằng chữ: giỏi, khá, TB): Giỏi

Điểm :

9/10

Ký tên (ghi rõ họ tên)

TS. Lê Trọng Nhân


LỜI CAM ĐOAN
Em xin cam kết luận văn "Xây dựng mơ hình dự báo chất lượng khơng khí" này là do
chính bản thân em thực hiện, dưới sự hướng dẫn của cô Lê Thanh Vân. Tất cả các nguồn
dữ liệu thu thập, tài liệu tham khảo đều được ghi rõ trong phần tài liệu tham khảo. Các
công việc, kết quả đã được thực hiện trong luận văn này đều do em tự thực hiện. Nếu có
bất cứ sự gian lận nào bị phát hiện, em xin chịu mọi hình phạt từ Ban chủ nhiệm Khoa
và Ban giám hiệu nhà trường.


LỜI CẢM ƠN
Em xin gửi lời làm cảm ơn đến cô Lê Thanh Vân, người đã trực tiếp hướng dẫn và chỉ
bảo em trong suốt quá trình nghiên cứu và thực hiện luận văn. Sự hướng dẫn tận tình
của cơ là yếu tố quan trọng để em có thể thực hiện thành công đề tài luận văn này.
Em xin cảm ơn đến các thầy cô công tác giảng dạy tại Khoa Khoa Học và Kỹ Thuật
Máy Tính - Trường Đại học Bách Khoa thành phố Hồ Chí Minh. Các thầy cơ đã tận tình
dạy bảo, truyền đạt các kiến thức, kỹ năng cần thiết và hữu ích đến bao thế hệ sinh viên.
Góp phần tạo ra nguồn nhân lực dồi dào, có kỹ năng, đóng góp vào sự phát triển của nhà
trường và xã hội.



TĨM TẮT ĐỀ TÀI
Ơ nhiễm khơng khí là mối đe dọa lớn đối với môi trường, xã hội và sức khỏe con người.
Theo thống kê của Tổ chức Y tế thế giới (WHO), mỗi năm, trên thế giới có khoảng 7 triệu
người tử vong do các bệnh liên quan tới ô nhiễm không khí. Ở Việt Nam, trong những
năm gần đây, tình trạng mơi trường khơng khí bị ơ nhiễm đang ngày càng trở nên nghiêm
trọng. Trước thực trạng các chỉ số chất lượng khơng khí ngày càng đáng lo ngại, việc xây
dựng một hệ thống thông tin về việc thống kê và dự báo các chỉ số chất lượng khơng khí
là một u cầu cấp thiết. Thơng qua đó giúp người dân và doanh nghiệp nắm bắt được
thông tin về chất lượng khơng khí, từ đó chủ động trong việc lên kế hoạch cho các hoạt
động sinh hoạt và sản xuất, đồng thời có các biện pháp bảo vệ khi ra ngồi trong điều
kiện chất lượng khơng khí xấu.
Các mơ hình dự báo sẽ được thực hiện trên các mơ hình mạng neural như CFNN,
ESN, ANN, RNN, LSTM, CNN-LSTM, LSTM-LSTM, Hybrid. Với mỗi chỉ số chất lượng
khơng khí, ta sẽ phân tích đặc tính dữ liệu, hệ số tương quan giữa các chỉ số và lựa chọn
các input features khác nhau để huấn luyện mơ hình. Kết quả cho thấy hai mơ hình mạng
LSTM-LSTM và ESN cho ra sai số thấp nhất ở hầu hết các thí nghiệm. Mơ hình hybrid
kết hợp kết quả từ các mơ hình mạng neural khác cũng cho ra kết quả tương đối tốt, giúp
cải thiện sai số so với một số mơ hình mạng. Bên cạnh đó, ta cũng phát triển được một
ứng dụng giúp quản lý và theo dõi các chỉ số ơ nhiễm khơng khí. Các mơ hình dự báo tốt
nhất được sử dụng để xây dựng một api server cho dự báo phục vụ cho ứng dụng.


Mục lục
1 GIỚI THIỆU ĐỀ TÀI

2

1.1


Đặt vấn đề . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2

1.2

Mục tiêu, đối tượng và phạm vi nghiên cứu . . . . . . . . . . . . . . . . . .

4

1.3

Cấu trúc luận văn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5

2 CƠ SỞ LÝ THUYẾT

6

2.1

Bài toán dự báo chất lượng khơng khí . . . . . . . . . . . . . . . . . . . . .

6

2.2

Các chỉ số chất lượng khơng khí và phương thức tính . . . . . . . . . . . .


7

2.3

Xây dựng mơ hình dự báo chất lượng khơng khí bằng học sâu . . . . . . . 12

3 CÁC NGHIÊN CỨU LIÊN QUAN

21

3.1

Xây dựng mơ hình dự báo chất lượng khơng khí bằng học sâu . . . . . . . 21

3.2

Xây dựng mơ hình dự báo chất lượng khơng khí bằng học máy . . . . . . . 26

4 XÂY DỰNG MƠ HÌNH DỰ BÁO CHẤT LƯỢNG KHƠNG KHÍ

29

4.1

Lược đồ nghiên cứu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4.2

Thu thập dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31


4.3

Tiền xử lý và chuẩn hóa dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . 31

4.4

Xây dựng các mô hình dự báo . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.5

Tạo tập huấn luyện và đánh giá mơ hình . . . . . . . . . . . . . . . . . . . 39

4.6

Các thí nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4.7

Kết quả thực nghiệm và thảo luận . . . . . . . . . . . . . . . . . . . . . . . 42

5 ỨNG DỤNG QUẢN LÝ VÀ THEO DÕI CHẤT LƯỢNG KHƠNG KHÍ 66
5.1

Xây dựng api server . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.2

Ứng dụng quản lý và theo dõi chất lượng khơng khí . . . . . . . . . . . . . 67

6 TỔNG KẾT


69

6.1

Đánh giá kết quả đạt được . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

6.2

Các hạn chế . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70


Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính

6.3

Hướng phát triển tương lai . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

Luận văn tốt nghiệp

Trang 8/72


Danh sách bảng
4.1

Thông tin các trạm thu thập dữ liệu . . . . . . . . . . . . . . . . . . . . . 31

4.2


Thống kê số lượng records thu thập ở mỗi trạm . . . . . . . . . . . . . . . 32

4.3

Ma trận khoảng cách giữa các trạm . . . . . . . . . . . . . . . . . . . . . . 32

4.4

Mơ hình mạng CFNN

4.5

Mơ hình mạng ANN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.6

Mơ hình mạng ANN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.7

Mơ hình mạng ESN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.8

Mơ hình mạng LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.9

Mơ hình mạng LSTM-LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . 37


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.10 Mơ hình mạng CNN-LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.11 Mơ hình mạng hybrid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.12 Số lượng dữ liệu huấn luyện và đánh giá mơ hình . . . . . . . . . . . . . . 39
4.13 Kích thước tập train và tập test của các mạng neural . . . . . . . . . . . . 39
4.14 Bảng các input features cho mỗi chỉ số ở mỗi trạm . . . . . . . . . . . . . . 40
4.15 Bảng các input features cho các chỉ số ơ nhiễm khơng khí ở trạm 6 kết hợp
với các chỉ số khí tượng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.16 Sai số dự báo của các mơ hình cho chỉ số PM2.5 của trạm 6 . . . . . . . . 43
4.17 Sai số dự báo của các mô hình cho chỉ số O3 của trạm 6 . . . . . . . . . . 44
4.18 Sai số dự báo của các mơ hình cho chỉ số NO2 của trạm 6 . . . . . . . . . 45
4.19 Sai số dự báo của các mơ hình cho chỉ số TSP của trạm 6 . . . . . . . . . 46
4.20 Sai số dự báo của các mơ hình cho chỉ số PM2.5 của trạm 5 . . . . . . . . 47
4.21 Sai số dự báo của các mô hình cho chỉ số TSP của trạm 5 . . . . . . . . . 48
4.22 Sai số dự báo của các mơ hình cho chỉ số NO2 của trạm 5 . . . . . . . . . 48
4.23 Sai số dự báo của các mô hình cho chỉ số CO của trạm 5 . . . . . . . . . . 49
4.24 Sai số dự báo của các mơ hình cho chỉ số PM2.5 của trạm 4 . . . . . . . . 50
4.25 Sai số dự báo của các mô hình cho chỉ số TSP của trạm 4 . . . . . . . . . 50
4.26 Sai số dự báo của các mơ hình cho chỉ số O3 của trạm 5 . . . . . . . . . . 51
4.27 Sai số dự báo của các mơ hình cho chỉ số NO2 của trạm 4 . . . . . . . . . 52
4.28 Sai số dự báo của các mơ hình cho chỉ số PM2.5 của trạm 3 . . . . . . . . 53


4.29 Sai số dự báo của các mơ hình cho chỉ số O3 của trạm 3 . . . . . . . . . . 53
4.30 Sai số dự báo của các mơ hình cho chỉ số NO2 của trạm 3 . . . . . . . . . 54
4.31 Sai số dự báo của các mơ hình cho chỉ số PM2.5 của trạm 2 . . . . . . . . 55
4.32 Sai số dự báo của các mơ hình cho chỉ số NO2 của trạm 4 . . . . . . . . . 56
4.33 Sai số dự báo của các mơ hình cho chỉ số O3 của trạm 3 . . . . . . . . . . 57

4.34 Sai số dự báo của các mơ hình cho chỉ số TSP của trạm 5 . . . . . . . . . 57
4.35 Sai số dự báo của các mơ hình cho chỉ số PM2.5 của trạm 3 . . . . . . . . 58
4.36 Sai số dự báo của các mơ hình cho chỉ số TSP của trạm 5 . . . . . . . . . 59
4.37 Sai số dự báo của các mơ hình cho chỉ số CO của trạm 4 . . . . . . . . . . 59
4.38 Sai số dự báo của các mơ hình cho chỉ số PM2.5 của trạm 6 . . . . . . . . 61
4.39 Sai số dự báo của các mơ hình cho chỉ số PM2.5 của trạm 5 . . . . . . . . 61
4.40 Sai số dự báo của các mơ hình cho chỉ số NO2 của trạm 6 . . . . . . . . . 62
4.41 Sai số dự báo của các mơ hình cho chỉ số NO2 của trạm 5 . . . . . . . . . 62
4.42 Sai số dự báo của các mơ hình cho chỉ số TSP của trạm 6 . . . . . . . . . 62
4.43 Sai số dự báo của các mơ hình cho chỉ số TSP của trạm 5 . . . . . . . . . 63
4.44 Sai số dự báo của các mơ hình cho chỉ số PM2.5 của trạm 6 . . . . . . . . 63
4.45 Sai số dự báo của các mơ hình cho chỉ số TSP của trạm 6 . . . . . . . . . 64
4.46 Sai số dự báo của các mơ hình cho chỉ số NO2 của trạm 6 . . . . . . . . . 64
4.47 Sai số dự báo của các mơ hình cho chỉ số O3 của trạm 6 . . . . . . . . . . 65
5.1

Các mơ hình mạng được chọn cho các chỉ số . . . . . . . . . . . . . . . . . 66


Danh sách hình vẽ
1.1

Giá trị trung bình PM2.5 trong 24 giờ tại một số đô thị 2 tháng đầu năm
2021 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

2.1

Bảng giá trị giới hạn các thông số cơ bản trong không khí (µg/m3 ) . . . .


9

2.2

Bảng các khoảng giá trị VN AQI và đánh giá chất lượng khơng khí . . . .

9

2.3

Bảng các giá trị BPi và Ii của các thông số . . . . . . . . . . . . . . . . . . 11

2.4

Mạng neural truyền thẳng 3 lớp . . . . . . . . . . . . . . . . . . . . . . . . 13

2.5

Tính tốn giá trị các perceptron . . . . . . . . . . . . . . . . . . . . . . . . 13

2.6

Bảng mơ tả một số hàm kích hoạt phi tuyến . . . . . . . . . . . . . . . . . 14

2.7

Mô hình mạng RNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.8


Mơ hình mạng Bidirectional RNN . . . . . . . . . . . . . . . . . . . . . . . 15

2.9

Mơ hình mạng Deep Bidirectional RNN . . . . . . . . . . . . . . . . . . . . 16

2.10 Mơ hình mạng LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.11 Mạng CFNN 3 lớp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.12 Mạng ESN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.13 Mạng LSTM-LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.14 Mạng CNN-LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1

Kiến trúc mạng ANN sử dụng cho mơ hình . . . . . . . . . . . . . . . . . . 22

3.2

Giải thuật sliding window . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.3

Hybrid model phase 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.4

Hybrid model phase 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.5


Sai số MAPE của chỉ số PM 2.5 với các window size khác nhau . . . . . . 25

3.6

Lưu đồ thực hiện mơ hình SVM . . . . . . . . . . . . . . . . . . . . . . . . 27

3.7

Mơ hình dự báo AQI kết hợp giữa ANN và SVM

4.1

Lược đồ nghiên cứu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.2

Hệ số tương quan giữa các chỉ số của trạm 5 và trạm 6 . . . . . . . . . . . 33

4.3

Biểu đồ Box plot các giá trị chỉ số chất lượng khơng khí ở trạm 6 . . . . . 34

4.4

Biểu đồ Box plot giá trị các chỉ số chất lượng khơng khí sau khi chuẩn hóa

. . . . . . . . . . . . . . 28

34



Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính

4.5

Hệ số tương quan giữa các chỉ số ở trạm 6 . . . . . . . . . . . . . . . . . . 40

4.6

Hệ số tương quan của các chỉ số giữa trạm 5 và trạm 6 . . . . . . . . . . . 41

4.7

Hệ số tương quan giữa các chỉ số ở trạm 6 . . . . . . . . . . . . . . . . . . 42

4.8

Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số PM2.5
ở trạm 6 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.9

Biểu đồ giá trị dự đoán và thực tế của mạng ESN của chỉ số PM2.5 ở trạm
6 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.10 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số O3
(time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.11 Biểu đồ giá trị dự đoán và thực tế của mạng ANN của chỉ số NO2 (time
step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.12 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số TSP
(time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.13 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số PM2.5
ở trạm 5 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.14 Biểu đồ giá trị dự đoán và thực tế của mạng ESN của chỉ số TSP ở trạm
5 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.15 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số CO
ở trạm 5 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.16 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số PM2.5
ở trạm 4 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.17 Biểu đồ giá trị dự đoán và thực tế của mạng ESN của chỉ số TSP ở trạm
4 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.18 Biểu đồ giá trị dự đoán và thực tế của mạng CNN-LSTM của chỉ số O3 ở
trạm 4 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.19 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số NO2
(time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.20 Biểu đồ giá trị dự đoán và thực tế của mạng ESN của chỉ số PM2.5 ở trạm
3 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.21 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số O3
ở trạm 3 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.22 Biểu đồ giá trị dự đoán và thực tế của mạng ESN của chỉ số NO2 ở trạm
3 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.23 Biểu đồ giá trị dự đoán và thực tế của mạng ESN của chỉ số PM2.5 ở trạm
2 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.24 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số PM2.5
ở trạm 2 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

Luận văn tốt nghiệp

Trang 12/72



4.25 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số NO2
ở trạm 2 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.26 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số O3
ở trạm 2 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.27 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số TSP
(time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.28 Biểu đồ giá trị dự đoán và thực tế của mạng RNN của chỉ số PM2.5 ở trạm
1 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.29 Biểu đồ giá trị dự đoán và thực tế của mạng LSTM-LSTM của chỉ số TSP
ở trạm 1 (time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.30 Biểu đồ giá trị dự đoán và thực tế của mạng ESN của chỉ số CO ở trạm 1
(time step = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.1

Thiết kế của ứng dựng quản lý và theo dõi chất lượng không khí . . . . . . 68


Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính

Chương 1
GIỚI THIỆU ĐỀ TÀI
1.1

Đặt vấn đề

Ơ nhiễm khơng khí là mối đe dọa lớn đối với mơi trường, xã hội và sức khỏe con người.
Theo thống kê của Tổ chức Y tế thế giới (WHO), mỗi năm, trên thế giới có khoảng 7 triệu

người tử vong do các bệnh liên quan tới ơ nhiễm khơng khí. Ơ nhiễm khơng khí làm tăng
nguy cơ nhiễm trùng đường hơ hấp, bệnh tim, đột quỵ và ung thư phổi. Cả phơi nhiễm
ngắn hạn và dài hạn với các chất ô nhiễm khơng khí đều gây tác động đến sức khỏe. Trẻ
em, phụ nữ, phụ nữ mang thai, người già, người có thể trạng yếu, người đang mang bệnh
là những người phải chịu ảnh hưởng nặng nề nhất từ ô nhiễm không khí.
Ở Việt Nam, trong những năm gần đây, tình trạng mơi trường khơng khí bị ơ nhiễm
đang ngày càng trở nên nghiêm trọng. Theo thống kê của Tổ chức Thông tin về Chất lượng
Khơng khí Tồn cầu IQAir AirVisual dựa trên mức đo về lượng bụi siêu mịn PM2.5/m3.
Việt Nam đứng thứ 17 trong đó riêng Hà Nội và TP.HCM nằm trong top 10 thành phố ơ
nhiễm khơng khí nhất thế giới. Ở nước ta, trong 10 bệnh có tỷ lệ tử vong cao nhất thì có
6 bệnh liên quan đến đường hơ hấp có ngun nhân từ ơ nhiễm khơng khí và chất lượng
khơng khí [1]. Trong cơ cấu bệnh tật, các bệnh về đường hô hấp cũng là 1 trong 5 nhóm
bệnh bị mắc phải cao nhất. Theo số liệu từ các trạm quan trắc chất lượng không khí ở
một số khu vực trong 2 tháng đầu năm 2021 [2] (Hình 1.1), dữ liệu cho thấy phần lớn các
trạm có chỉ số bụi mịn (PM 2.5) cao hơn quy chuẩn an tồn cho phép ở mỗi ngày. Nhìn
chung, các tỉnh khu vực phía Bắc có chất lượng khơng khí xấu hơn các khu vực cịn lại.
Theo báo cáo của Ngân hàng Thế giới (WB), thiệt hại kinh tế tồn cầu do ơ nhiễm
khơng khí là khoảng 225 tỷ USD. Đối với Việt Nam, ơ nhiễm khơng khí gây thiệt hại về
kinh tế khoảng 10 tỷ đô la mỗi năm (chiếm từ 5 – 7% GDP).

Luận văn tốt nghiệp

Trang 2/72


Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính

Hình 1.1: Giá trị trung bình PM2.5 trong 24 giờ tại một số đô thị 2 tháng đầu năm 2021
Tại Việt Nam, tình trạng ơ nhiễm khơng khí chủ yếu do các ngun nhân [3] sau:

• Phát triển cơng nghiệp và sức ép lên môi trường: Nước ta đang trong giai đoạn cơng
nghiệp hóa. Tính đến cuối năm 2020 trên phạm vi tồn quốc có 369 KCN, với tổng
diện tích chiếm khoảng 114 nghìn ha, trong đó có 284 KCN đã đi vào hoạt động,
tăng 72 KCN so với năm 2015; Có 698 cụm cơng nghiệp (CCN) đã đi vào hoạt động
với tổng diện tích chiếm khoảng 22 nghìn ha. Việc số lượng các khu công nghiệp,
cụm công nghiệp ngày càng gia tăng đã tác động không nhỏ đến chất lượng mơi
trường khơng khí.
• Ơ nhiễm mơi trường làng nghề: Theo báo cáo công tác BVMT năm 2020 của Bộ
NN&PTNT, cả nước hiện có 4.575 làng nghề, trong đó có 1.951 làng nghề được
cơng nhận. Có tới 47 làng nghề bị ô nhiễm môi trường rất nghiêm trọng, trong đó ở
miền Bắc có 34 làng nghề, miền trung có 11 làng nghề và miền Nam có 2 làng nghề
bị ơ nhiễm mơi trường nghiêm trọng.
• Tình trạng đơ thị hóa nhanh: Năm 1990, nước ta mới có 500 đơ thị lớn nhỏ; năm
2000 đã có 649 đơ thị, đến năm 2016 có 802 đơ thị và đến năm 2020 đã tăng lên là
862 đơ thị, trong đó có 2 đô thị loại đặc biệt (Hà Nội và TP. Hồ Chí Minh), 22 đơ
thị loại 1, 31 đơ thị loại II, 48 đô thị III, 87 đô thị loại IV (thị xã) và trên 672 đô thị
loại V (thị trấn). Việc gia tăng nhanh chóng tốc độ đơ thị hóa nhanh chóng nhưng
chưa đánh giá đúng mức đến tác động với môi trường, dẫn đến các hoạt động như
chặt phá cây xanh, phá rừng, vứt rác bừa bãi gây tác động khơng nhỏ đến chất
lượng mơi trường khơng khí.
• Phát triển giao thơng vận tải: Cùng với cơng nghiệp hóa và đơ thị hóa, ngành giao
thơng vận tải ở nước cũng đã phát triển rất nhanh chóng, gây ra nguồn thải ơ nhiễm
nhiễm khơng khí rất lớn, đặc biệt là ô nhiễm môi trường không khí đô thị. Đến cuối
năm 2020 tồn quốc có tới 4.180.478 xe ơ tơ các loại và hơn 30 triệu xe mô tô, xe
Luận văn tốt nghiệp

Trang 3/72


Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa

Khoa Khoa Học và Kỹ Thuật Máy Tính

máy đang lưu hành. Cơng tác kiểm sốt nguồn thải ơ nhiễm từ GTVT cịn rất hạn
chế. Cho đến nay chỉ mới kiểm định khí thải đối với 1.736.188 xe ôtô động cơ xăng
và 1.749.387 xe ôtô động cơ diesel đang lưu hành.
Trước thực trạng các chỉ số chất lượng khơng khí ngày càng đáng lo ngại, việc xây
dựng một hệ thống thông tin về việc thống kê và dự báo các chỉ số chất lượng khơng khí
là một u cầu cấp thiết. Thơng qua đó giúp người dân và doanh nghiệp nắm bắt được
thông tin về chất lượng khơng khí, từ đó chủ động trong việc lên kế hoạch cho các hoạt
động sinh hoạt và sản xuất, đồng thời có các biện pháp bảo vệ khi ra ngồi trong điều
kiện chất lượng khơng khí xấu.

1.2
1.2.1

Mục tiêu, đối tượng và phạm vi nghiên cứu
Mục tiêu đề tài

Mục tiêu của đề tài là xây dựng thành cơng các mơ hình dự báo chất lượng khơng
khí dựa trên các phương pháp học sâu. Mơ hình phải hoạt động tốt cho dựa trên dữ liệu
được thu thập, có khả năng thích ứng tốt với sự biến động của dữ liệu trong tương lai.
Bên cạnh đó, mơ hình được xây dựng phải có khả năng mở rộng, phát triển thêm khi
lượng dữ liệu yêu cầu cho dự báo tăng cao.

1.2.2

Đối tượng và phạm vi nghiên cứu

Các chỉ số chất lượng khơng khí như bụi mịn PM2.5, bụi TSP, CO, O3, NO2 là các
chỉ số chính được dự báo trong luận văn này.

Đề tài sẽ tập trung nghiên cứu chính là xây dựng mơ hình dự báo các chỉ số chất lượng
khơng khí cho các trạm trên địa bản Hồ Chí Minh, do đây là thành phố có mật độ dân
cư cao, nhiều phương tiện giao thông và tập trung nhiều khu công nghiệp nhất cả nước
nên chất lượng khơng khí thường xun đáng báo động. Nghiên cứu ở hai khu vực này sẽ
giúp góp phần vào việc cải thiện chất lượng mơi trường khơng khí, nâng cao chất lượng
cuộc sống.

Luận văn tốt nghiệp

Trang 4/72


Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính

1.3

Cấu trúc luận văn

Cấu trúng của luận văn này bao gồm:
• Chương 1. Giới thiệu tổng quan về đề tài, mục tiêu, đối tượng và phạm vi nghiên
cứu.
• Chương 2. Trình bày cơ sở lý thuyết về các chỉ số chất lượng khơng khí, các mơ
hình học máy và học sâu sẽ được áp dụng
• Chương 3. Nêu các nghiên cứu liên quan về dự báo chất lượng không khí.
• Chương 4. Xây dựng mơ hình dự báo chất lượng khơng khí, thực nghiệm các mơ
hình dự báo chất lượng khơng khí, đánh giá kết quả và thảo luận.
• Chương 5. Ứng dụng quản lý và theo dõi chất lượng khơng khí
• Chương 6. Đánh giá các kết quả đã đạt được và hướng phát triển trong tương lai.


Luận văn tốt nghiệp

Trang 5/72


Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính

Chương 2
CƠ SỞ LÝ THUYẾT
2.1

Bài tốn dự báo chất lượng khơng khí

Bài tốn dự báo chất lượng khơng khí là một lớp bài toán dự báo, dùng dữ liệu trong
q khứ để xây dựng mơ hình dự báo các giá trị trong tương lai. Mục tiêu mơ hình là tối
ưu giá trị sai số dự đốn từ mơ hình và giá trị thực tế. Tập dữ liệu thường dùng là các
chỉ số chất lượng khơng khí như AQI, PM2.5, O3, TSP, CO, SO2, NO2...dữ liệu sẽ được
thu thập trong một khoảng thời gian liên tục trong quá khứ, càng có nhiều dữ liệu thì
mơ hình sẽ có hiệu quả cao hơn. Các phương pháp tiếp cận thường được dùng trong việc
xây dựng mơ hình dự báo chất lượng khơng khí là các phương pháp sử dụng thống kê,
các phương pháp học máy và học sâu:
• Sử dụng các phương pháp thống kê truyền thống: Sử dụng các phân tích
thơng kê để tìm ra các đặc trưng của dữ liệu như tính xu hướng, tính mùa, tính
chu kì, tính ổn định của dữ liệu... Sau đó dựa vào đặc tính của dữ liệu mà sử dụng
các phương pháp phù hợp để xây dựng mơ hình dự báo. Ví dụ như mơ hìn trung
bình trượt (Moving average) và mơ hình làm mượt lũy thừa (Exponential smoothing
method) thích hợp cho dữ liệu khơng có tính mùa và xu hướng. Mơ hình tự hồi quy
(Autoregressive model) phù hợp cho các chuỗi dữ liệu có tự tương quan giữa các
điểm thời gian. Đặc biệt mơ hình ARIMA có thể áp dụng với mọi loại dữ liệu.

• Sử dụng các phương pháp học máy (Machine learning), học sâu (Deep
learning): Trong những năm gần đây, với sự phát triển tốc độ tính tốn và lưu trữ
của máy tính thì việc xử lý các tập dữ liệu lớn trở nên nhanh chóng và dễ dàng hơn.
Vì vậy các phương pháp học máy và học sâu đã được nghiên cứu áp dụng rất nhiều
trong việc xây dựng mô hình dự báo chất lượng khơng khí. Các mơ hình này thường
khơng địi hỏi các đặc tính cụ thể của dữ liệu, thích hợp cho việc xử lý các loại dữ
liệu lớn và độ chính xác trong tính tồn thường cao hơn so với các mơ hình thống

Luận văn tốt nghiệp

Trang 6/72


Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính

kê truyền thống. Một số các mơ hình học máy và học sâu thường dùng trong dự
báo chất lượng khơng khí là Regression, Support Vector machine, Random forest...
và đặc biệt là các mơ hình mạng Neurol network như ANN, CNN, RNN, LSTM...

2.2

Các chỉ số chất lượng khơng khí và phương thức
tính

2.2.1

Các chỉ số chất lượng khơng khí

Tại Việt Nam, căn cứ vào quy chuẩn quốc gia hiện đang có hiệu lực (QCVN

05:2013/BTNMT), các thông số được quy định để đánh giá chất lượng khơng khí xung
quanh bao gồm:
• Sulfur dioxide (SO2): Sulfur dioxide là một loại khí độc hại phát sinh chủ yếu
do tiêu thụ nhiên liệu hóa thạch hoặc bởi các hoạt động công nghiệp. Bệnh nhân
với các vấn đề về phổi, người già và trẻ nhỏ có nguy cơ bị tổn thương cao hơn khi
tiếp xúc với loại khí này. Các tác hại về sức khỏe khi tiếp xúc có thể kể đến bao
gồm viêm phổi, gây kích ứng đường hơ hấp, tăng tiết dịch nhầy, co thắt phế quản.
Ngoài ra các trường hợp bỏng rát da, tổn thương mắt cũng được ghi nhận. Các hiện
tượng thiên nhiên bất lợi như mưa axít, giảm độ pH của đất cũng có mối liên hệ
với loại khí này.
• Carbon monoxide (CO): Carbon monoxide là loại khí khơng màu, khơng vị phát
sinh do sự đốt cháy khơng hồn tồn các nhiên liệu hóa thạch. Các triệu chứng
khi bị nhiễm độc do hít phải carbon monoxide thường gặp là đau đầu, chóng mặt,
buồn nơn và nặng hơn là mất ý thức, hôn mê. Ái lực của hemoglobin trong máu với
carbon monoxide cao hơn so với ái lực với oxygen, dẫn đến việc thiếu oxygen trong
máu. Tình trạng nhiễm độc có thể diễn tiến nặng khi tiếp xúc với khí này ở nồng
độ cao trong thời gian dài. Carbon monoxide cũng là loại khí góp phần gây hiệu
ứng nhà kính, hiện tượng nóng lên của trái đất và biến đổi khí hậu.
• Nitrogen dioxide (NO2): Nitrogen oxide là loại khí phát sinh do việc đốt cháy
các nhiên liệu hóa thạch và thường có mối liên hệ với các hoạt động giao thơng.
Chúng gây kích ứng đường hơ hấp, ho, khó thở và đau rát mắt. Nitrogen oxide cũng
gây ảnh hưởng đến khướu giác và và thậm chí gây các bệnh lý cấp tính ở phổi nếu
tiếp xúc ở thời gian dài. Năng suất và sản lượng cây trồng cũng được ghi nhận giảm
sút khi nitrogen oxide hiện diện ờ nồng độ cao trong khơng khí.
• Ozone (O3): Khí ozone được tạo thành từ các khí oxygen dưới xúc tác của sự
phóng điện trong bầu khí quyển trái đất. Nó là một chất oxy hóa cực mạnh và do
Luận văn tốt nghiệp

Trang 7/72



Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính

đó có khả năng kích thích q trình oxy hóa gây tổn thương tế bào. Tiếp xúc với
khí ozone có thể gây khó thở, viêm đường hơ hấp, làm tình trạng của bệnh nhân
hen suyễn thêm trầm trọng . Vì ozone ít tan trong nước nên chúng có thể đi sâu
vào trong phổi và gây hại cho sức khỏe. Khí ozone cũng là một trong những khí gây
hiệu ứng nhà kính và góp phần vào sự ấm lên tồn cầu của trái đất.
• Tổng bụi lơ lửng TSP, bụi PM 10, bụi PM 2.5:, Bụi lơ lửng là hỗn hợp các
hạt lỏng hoặc rắn có kích thước nhỏ có nguồn phát sinh tự nhiên (cháy rừng, núi
lửa, ...) hoặc các hoạt động của con người (tiêu thụ nguyên liệu hóa thạch, các
hoạt động cơng nghiệp và nơng nghiệp ...). Chúng cũng có thể hình thành do các
phản ứng hóa học của các chất ơ nhiễm dạng khí. Một số loại bụi lơ lửng có thể kể
đến như: khói nhà máy, khói thuốc, bụi xi măng, bụi đường, vi khuẩn, bào tử nấm
mốc,... Các hạt có đường kính 10 µm hoặc nhỏ hơn được gọi là PM 10, trong khi
các hạt có đường kính 5 µm hoặc nhỏ hơn được gọi là PM 5. Các hạt bụi lơ lửng
có kích thước càng nhỏ càng dễ đi sâu vào đường hô hấp thậm chí hệ tuần hồn và
gây các ảnh hưởng lâu dài đến sức khỏe.
• Chì (Pb) – Khơng dùng để tính AQI trong 1459/QĐ-TCMT: Chì là một
loại kim loại nặng có sẵn trong tự nhiên. Chúng được sử dụng trong pin, xăng động
cơ, mỹ phẩm hay trong nhiều vật dụng khác như bột màu, sơn, men gốm... Nguồn
gây ô nhiễm chì trong khơng khí chủ yếu đến từ sử dụng các nhiên liệu đốt cháy có
pha chì. Phơi nhiễm với chì có thể xảy ra do hít, nuốt phải hoặc hấp thu qua da,
với trẻ em là đối tượng rất dễ bị tổn thương sức khỏe bởi chất này. Ngộ độc chì gây
ảnh hưởng đến hệ thần kinh, giảm thơng minh, trí nhớ giảm sút, thậm chí gây hơn
mê, co giật.

Luận văn tốt nghiệp


Trang 8/72


Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính

Hình 2.1: Bảng giá trị giới hạn các thơng số cơ bản trong khơng khí (µg/m3 )

2.2.2

Tiêu chí đánh giá chất lượng khơng khí

Chỉ số chất lượng khơng khí Việt Nam (VN_AQI – Vietnam Air quality index) là chỉ
số được tính tốn từ các thơng số quan trắc các chất ơ nhiễm trong khơng khí ở Việt
Nam. Chúng cho biết tình trạng chất lượng khơng khí, mức độ ảnh hưởng dến sức khỏe
con người và được tính theo thang điểm tương ứng dựa theo Quyết định 1459 của Tổng
cục môi trường Việt Nam [4]. Chỉ số VN_AQI được biểu diễn với các màu sắc để cảnh
báo chất lượng không khí như trình bày ở Hình 2.2.

Hình 2.2: Bảng các khoảng giá trị VN AQI và đánh giá chất lượng khơng khí

2.2.2.1

Giá trị AQI h - với thơng số PM 2.5 và PM 10

AQI h là giá trị AQI đại diện cho chất lượng khơng khí trong 1 giờ. Giá trị Nowcast
là giá trị trung bình có trọng số được tính tốn từ 12 giá trị trung bình 1 giờ gần nhất so
Luận văn tốt nghiệp

Trang 9/72



Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính

với thời điểm tính tốn, dùng cho thơng số PM 2.5 và PM 10.
Gọi ci là giá trị quan trắc trung bình một giờ tại thời điểm cách i - 1 giờ so với hiện
tại, cmin = min(c1 , c2 , ..., c12 ) và cmax = max(c1 , c2 , ..., c12 )
Ta tính giá trị các trọng số:
max(
Với w =
Với w >

1
2
1
2

2

cmin 1
, )
cmax 2
12

thì N owcast = 21 c1 + 12 c2 + ... + 21 c12
P
P
i−1
i−1

thì N owcast = ( 12
ci )/( 12
)
i=1 w
i=1 w

Nếu chỉ có một trong ba giá trị (c1 , c2 , c3 )) có dữ liệu thì xem như khơng có dữ liệu
và khơng tính được giá trị Nowcast. Nếu ci khơng có giá trị thì lấy wi−1 = 0
2.2.2.2

Giá trị AQIxh - với các thông số quan trắc khác

Với các thơng số SO2, CO, NO2, O3 thì được tính như sau:
AQIxh =

Ii+1 − I1
(Cx − BPi ) + Ii
BPi+1 − BPi

Với các thơng số PM 2.5, PM 10 thì được tính như sau:
AQIxh =

Ii+1 − I1
(N owcastx − BPi ) + Ii
BPi+1 − BPi

Với giá trị AQI h tổng hợp (là giá trị lớn nhất của các AQI trung bình theo giờ của
các thơng số, được làm trịn thành số ngun) thì được tính như sau:
AQI h = max(AQIxh )
Trong đó:

• AQIxh : Giá trị AQI đại diện cho chất lượng khơng khí của thơng số x trong 1 giờ.
• BPi : Nồng độ giới hạn dưới của giá trị thơng số quan trắc được quy định tại Hình
2.3 tương ứng với mức i.
• Ii : Giá trị AQI ở mức i đã cho trong bảng tương ứng với giá trị BPi .
• Ii+1 : Giá trị AQI ở mức i đã cho trong bảng tương ứng với giá trị BPi+1 .
• Cx : Giá trị quan trắc trung bình 1 giờ của thơng số x.
• N owcastx : Giá trị Nowcast.

Luận văn tốt nghiệp

Trang 10/72


Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính

Hình 2.3: Bảng các giá trị BPi và Ii của các thông số
2.2.2.3

Giá trị AQI d ngày

1. Một số khái niệm:
AQI d là giá trị AQI đại diện cho chất lượng khơng khí trong 1 ngày. Giá trị AQI
lớn nhất của các thông số được sử dụng làm giá trị AQI ngày tổng hợp. Giá trị AQI
ngày được tính tốn dựa trên các giá trị như sau:
• Thơng số PM 2.5 và PM 10: giá trị trung bình 24 giờ.
• Thơng số SO2, NO2 và CO: giá trị trung bình 1 giờ lớn nhất trong ngày.
• Thơng số O3: giá trị trung bình 1 giờ lớn nhất trong ngày và giá trị trung bình
8 giờ lớn nhất trong ngày.
Trong đó:

• Giá trị trung bình 1 giờ lớn nhất trong ngày: là giá trị lớn nhất trong số các
giá trị quan trắc trung bình 1 giờ.
• Giá trị quan trắc trung bình 8 giờ lớn nhất trong ngày: là giá trị lớn nhất trong
số các giá trị trung bình 8 giờ.
• Giá trị trung bình 8 giờ là trung bình cộng các giá trị trung bình 1 giờ trong
8 giờ liên tiếp.
• Giá trị trung bình 24 giờ: trung bình cộng các giá trị quan trắc trung bình 1
giờ trong 1 ngày (từ 01:00 giờ đến 00:00 hơm sau).
2. Tính giá trị AQIxd (giá trị AQI theo ngày cho từng thông số quan trắc):
Với các thông số SO2, CO, NO2, O3, PM 10, PM 2.5 thì được tính như sau:
AQIxh =

Luận văn tốt nghiệp

Ii+1 − I1
(Cx − BPi ) + Ii
BPi+1 − BPi
Trang 11/72


Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa
Khoa Khoa Học và Kỹ Thuật Máy Tính
Với giá trị AQI d tổng hợp (là giá trị lớn nhất của các AQI trung bình theo ngày
của các thơng số, được làm trịn thành số ngun) thì được tính như sau:
AQI d = max(AQIxd )
Trong đó:
• AQIxd : Giá trị AQI đại diện cho chất lượng không khí của thơng số x theo ngày.
• BPi : Nồng độ giới hạn dưới của giá trị thông số quan trắc được quy định tại
Hình 4 tương ứng với mức i.
• BPi+1 : Nồng độ giới hạn trên của giá trị thơng số quan trắc được quy định tại

Hình 4 tương ứng với mức i+1.
• Ii : Giá trị AQI ở mức i đã cho trong bảng tương ứng với giá trị BPi .
• Cx Được quy định theo từng loại thông số quan trắc như sau:
– PM 2.5, PM 10 : Cx là giá trị trung bình 24 giờ.
– SO2, NO2, CO : Cx là giá trị trung bình 1 giờ lớn nhất trong ngày.
– O3: Cx là giá trị lớn nhất trong giá trị trung bình 1 giờ lớn nhất trong
ngày và giá trị trung bình 8 giờ lớn nhất trong ngày.
Ghi chú: : Khơng tính tốn AQI thơng số O3 khi giá trị trung bình 8 giờ lớn nhất
trong ngày cao hơn 400 µg/m3 (lúc này chỉ tính tốn AQI đối với trung bình 1 giờ
lớn nhất trong ngày).

2.3

Xây dựng mơ hình dự báo chất lượng khơng khí
bằng học sâu

2.3.1

Mạng neural truyền thẳng (Feedforward Neural Network)

Mạng neural truyền thẳng là một lớp mạng nơ ron nhân tạo, trong đó các perceptron
ở mỗi lớp sẽ kết nối với nhau mà không tạo thành một chu kỳ. Giá trị của các perceptron
ở mỗi lớp sẽ được tính tốn trực tiếp từ các perceptron ở các lớp trước đó. Hình 2.4 mô
tả mộ mạng neural truyền thẳng 3 lớp, lớp input nhận dữ liệu đầu vào với kích thước là
(3,), lớp hidden có 4 perceptrons và lớp output có kích thước là (2,).

Luận văn tốt nghiệp

Trang 12/72



×