❖ KHOA HỌC CÔNG NGHỆ ❖
ỨNG DỤNG MƠ HÌNH HỌC SÂU TRONG Dự BÁO
CHÁT LƯỢNG NƯỚC MẬT HỆ THỐNG THỦY LỢI BẢC HƯNG HẢI
NGUYỄN ĐỨC PHONG, HÀ HẢI DƯƠNG
Viện Nước, tưới tiêu và Môi trường
Tóm tắt: Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở Trung tâm đồng bằng Bắc Bộ thuộc vùng châu
thố sông Hồng và là hệ thống lớn nhất miền Bắc. Nguồn nước của hệ thống rất quan trọng đối với
phát triến kinh tế - xã hội của các địa phương trong vùng nghiên cứu. Tuy nhiên, ô nhiễm nguồn
nước có xu hướng gia tăng cả về phạm vi và mức độ, các chỉ tiêu COD, NHf, PO43' và Coliform có
mức tăng cao hơn so với các chỉ tiêu khác. Hàm lượng COD tăng 8,6 lần, NH4 tăng 2,48 lần;
PO43' tăng 4,15 lần và Coliform tăng 91,6 lần. Hằng năm, chất lượng nước mặt được giám sát (chủ
yếu vào vụ Đông — Xuân) để phục vụ đổ ải. Phương pháp giám sát chất lượng nước chủ yếu là
phương pháp truyền thong tổn nhiều thời gian, công sức và thường cung cấp thông tin hạn chế về
chất lượng nước. Trong nghiên cứu này sẽ đảnh giả tiềm năng của các thuật tốn học sâu trong dự
bảo các thơng sổ chất lượng nước của hệ thống thủy lợi Bắc Hưng Hải dựa vào các thông số đo
hiện trường (nhiệt độ, pH, DO và độ đục). Kết quả nghiên cứu cho thấy các thuật tốn học sâu có
thê đưa ra các dự báo chính xác và nhanh chóng đối với các thơng số BOD5, NH4+, PO43' và COD.
Các mơ hình có độ chính xác cao (từ 75% đến 85%), đồng thời cung cấp các kết quả có ý nghĩa.
Nghiên cứu cũng đã chứng minh được tiềm năng của các thuật toán học sâu để cải thiện việc dự
báo chất lượng nước và nhấn mạnh tầm quan trọng của việc lựa chọn các thuật tốn học sâu phù
hợp cho các thơng số chất lượng nước khác nhau.
Từ khóa: Hệ thống thuỷ lợi Bắc Hưng Hải, mơ hình học sâu, mạng nơ-ron hồi quy (RNN), chất
lượng nước mặt.
Abstract: Bac Hung Hai Irrigation System is located in the center of the Northern Delta in the
Red River Delta and is the largest system in the North. The water source of the system is very
important for the socio-economic development of the localities in the study area. However, water
pollution tends to increase in both scope and extent, indicators of COD, NH4+, PO43' and Coliform
have a higher increase than other indicators. COD content increased 8.6 times, NH4 increased
2.48 times; PO43- increased 4.15 times and Coliform increased 91.6 times. Every year, surface
water quality is monitored (mainly in the Winter-Spring crop) to serve the drainage. Water quality
monitoring methods are mainly traditional methods that are time consuming and labor intensive
and often provide limited information on water quality. In this study, we will evaluate the potential
of deep learning algorithms in predicting water quality parameters of Bac Hung Hai irrigation
system based on field measurements (temperature, pH, DO and turbidity). Research results show
that deep learning algorithms can make accurate andfast predictions for parameters BOD5, NH4+,
PO4 and COD. The models are highly accurate (from 75% to 85%), and provide meaningful
results. The study also demonstrated the potential of deep learning algorithms to improve water
quality forecasting and highlighted the importance of selecting suitable deep learning algorithms
for different water quality parameters.
Keywords: Bac Hung Hai irrigation system, Deep learning model, Recurrent neural network
(RNN), Surface water quality.
TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 61
❖ KHOA HỌC CÔNG NGHỆ ❖
1. ĐẶT VẤN ĐỀ Quan để cấp nước cho cả vùng. Sông Cửu An là
Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở trục chính phía Nam chạy từ Nghi Xuyên đến
Trung tâm đồng bằng Bắc Bộ thuộc vùng châu Cự Lộc dài 50 km. Hệ thống sông nội địa có thế
thổ sơng Hồng và là hệ thống lớn nhất miền dốc lịng sơng và hướng chuyển nước đều theo
Bắc. Ranh giới hệ thống được bao bọc bởi 4 hướng Tây Bắc xuống Đơng Nam. Vì vậy nước
sơng lớn: phía Bắc là sông Đuống dài 67 km từ ngọt lấy từ sông Hồng qua cổng Xuân Quan vào
Xuân Canh đến Phả Lại; phía Nam là sông Luộc sơng Kim Son đã có điều kiện thuận lợi dẫn
dài 72 km từ Hà Lão đến Quý Cao; phía Tây là nước cho tồn khu vực. Hướng tiêu thốt nước
sơng Hồng dài 57 km từ Xuân Quan đến Hà chính tập trung vào 2 cửa cầu Xe và An Thổ.
Lão; phía Đơng là sơng Thái Bình dài 73 km từ Do địa hình thấp nên thuỷ triều từ sơng Thái
Phả Lại đến Quý Cao [3]. Bình, sơng Luộc đều có ảnh hưởng mạnh và khá
Bắc Hưng Hải có hệ thống sông nội địa khá sâu đến các sông trong nội địa. Nhờ xây dựng 2
dày đặc, chúng nối thông với nhau tạo thành cơng trình ở 2 cửa sơng này (Cầu Xe - An Thổ)
mạng lưới dẫn và tiêu nước khá thuận lợi. Có 2 đã phát huy cao tác dụng chuyển - giữ nước
sơng chính là Sơng Kim Son (phía Bắc) chạy từ phục vụ cho tưới và ngăn triều, tăng khả năng
Xuân Quan đến thành phố Hải Dưong (60 km), tiêu thoát nước trong mùa mưa của hệ thống
đây là tuyến tải nước chính của hệ thống Bắc sông nội địa cho toàn khu vực Bắc Hưng Hải
Hưng Hải lấy từ sông Hồng qua cống Xuân [3], [6].'
Hình 1.1: Vị trí địa lý hệ thống thủy lợi Bắc Hưng Hải
Chất lượng nước trong HTTL Bắc Hưng Hải 7-9). Trong những năm trở lại đây, có ứng dụng
được quan trắc từ năm 2005 đến nay với tần suất mô hình tốn chất lượng nước để mơ phỏng 3
quan trắc từ 2-6 lần trong năm, bổ trí vào các thời thơng số DO, BODs và NH/ nhưng độ chính xác
gian cung cấp nước tưới cho vụ xuân (tháng 2-5) còn hạn chế do số liệu đầu vào chưa đầy đủ, nhất
và thời gian cấp nước tưới trong vụ mùa (tháng là số liệu về lưu lượng nguồn thải (khó điều tra).
62 TẠP CHÍ TÀI NGUN NƯỚC SỐ 1 -2023
❖ KHOA HỌC CÔNG NGHỆ ❖
Kết quả đã đánh giá được mức độ gia tăng ô mạng nơ-ron nhân tạo (ANN), mạng nơ-ron tích
nhiễm, các chỉ tiêu ơ nhiễm và ngun nhân gây chập (CNN) và mạng nơ-ron hồi quy (RNN).
ô nhiễm làm cơ sở đề xuất các giải pháp giảm Mỗi loại thuật tốn học sâu đều có điểm mạnh
thiểu ơ nhiễm và giảm thiểu tác hại của ô nhiễm và điểm yếu riêng và việc lựa chọn thuật toán sẽ
nước đến SXNN và NTTS [3], phụ thuộc vào ứng dụng giám sát chất lượng
nước cụ thể.
Có thể thấy phương pháp giám sát chất lượng
nước trong HTTL Bắc Hưng Hải là phương Trong những năm gần đây, việc ứng dụng
pháp truyền thống (thu thập các mẫu nước, sau các thuật tốn mạng lưới nơ-ron nhân tạo
đó được phân tích trong phịng thí nghiệm bằng (ANN) để dự báo chất lượng nước đã có những
các xét nghiệm hóa học và sinh học khác nhau) kết quả nổi bật. Các mơ hình ANN có khả năng
với các thơng số lý, hóa, vi sinh... Các phương giải quyết các vấn đề mơ hình hóa khác nhau ở
pháp này thường tốn nhiều thời gian, công sức sông, hồ, hồ chứa, nhà máy xử lý nước thải
và có thể tổn kém, đặc biệt khi một số lượng lớn (WWTP)... [2], Đã có một số nghiên cứu sử
mẫu nước được thu thập từ các địa điểm khác dụng mơ hình học sâu để dự báo chất lượng
nhau. Ngồi ra, phương pháp này chỉ có thể nước, chủ yếu tập trung vào dự báo các thông số
cung cấp số liệu chất lượng nước tại các thời chất lượng nước (pH, nhiệt độ, DO, COD...) và
điểm nhất thời, gây khó khăn cho việc đánh giá tính tốn chỉ số chất lượng nước (WQI).
những thay đổi theo thời gian và không gian.
về dự báo các thông số chất lượng nước
Trong những năm gần đây, trên Thế giới, trí như DO, nhiệt độ, pH và độ mặn, Hu và các
tuệ nhân tạo (AI) ngày càng được ứng dụng cộng sự [5] đã dự báo chất lượng nước mới
nhiều trong dự báo chất lượng nước nhờ khả dựa trên mạng học sâu bộ nhớ ngắn - dài hạn
năng xử lý lượng lớn dữ liệu và đưa ra dự đoán (LSTM) được đề xuất để dự báo pH và nhiệt
chính xác. Các thuật tốn AI, chẳng hạn như độ. Kết quả cho thấy, độ chính xác đạt của mô
học máy và học sâu, đã được áp dụng để dự báo hình rất cao lần lượt là 95,76% và 96,88%.
các thông số chất lượng nước, bao gồm pH, DO, Haq [9] sử dụng các mơ hình (lai) học sâu như
BOD5, COD... cũng như để phát hiện các bất mạng thuật tốn mạng nơ-ron tích chập
thường về chất lượng nước và dự đoán xu (CNN), LSTM và đơn vị tái phát có kiểm sốt
hướng chất lượng nước. Các thuật tốn học sâu (GRU) để dự báo. Kết quả cho thấy mơ hình
có thể xử lý các mối quan hệ phi tuyến tính giữa (lai) CNN-LSTM vượt trội so với tất cả các
các thông số chất lượng nước, cũng như xử lý mơ hình khác về độ chính xác dự đoán và thời
dữ liệu bị thiếu và xử lý dữ liệu nhiều chiều một gian tính tốn. Một kiến trúc với mơ hình dự
cách hiệu quả. Ngồi ra, các thuật tốn AI có thể báo cho các hệ thống loT để giám sát chất
học hỏi từ dữ liệu trong thời gian thực và liên lượng nước trong nuôi trồng thủy sản được
tục cải thiện các dự đốn của chúng khi có dữ thực hiện bằng cách sử dụng thuật toán học
liệu mới. Điều này cho phép các hệ thống giám sâu (LSTM) để dự báo các chỉ sổ trên cho
sát chất lượng nước dựa trên AI thích ứng với thấy hoạt động tốt và có thể áp dụng cho các
những thay đổi về điều kiện chất lượng nước hệ thống thực tế. Đối với dự báo tổng nitơ
theo thời gian và đưa ra các dự đốn chính xác (TN), tổng phốt pho (TP) và chỉ số kali
và đáng tin cậy hơn. permanganat (COD-Mn), nghiên cứu của Yan
[10] đã sử dụng mơ hình mạng lưới nơ-ron kết
Có một số loại thuật tốn học sâu có thể được họp 1-DRCNN và BiGRU để dự báo. Kết quả
sử dụng để giám sát chất lượng nước, bao gồm
TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023 63
❖ KHOA HỌC CƠNG NGHỆ ❖
thực nghiệm cho thấy mơ hình đề xuất có độ nơ-ron Bộ nhớ ngắn - dài hạn (LSTM) [11].
chính xác dự đốn và tính tổng qt cao hơn Trong đó, xem xét mối tương quan đa biến của
so với các mơ hình LSTM, GRU và BiGRU thông số chất lượng nước, IGRA, xét về mức độ
(hệ số xác định (R2) có thể đạt tới 0,9431). tương đồng và gần gũi, được đề xuất đế lựa
chọn thông số đặc trưng. Bên cạnh đó cũng xem
Các thuật tốn trí tuệ nhân tạo (AI) cũng xét trình tự thời gian của thơng tin chất lượng
được phát triển để dự báo chỉ số chất lượng nước, mơ hình dự báo chất lượng nước dựa trên
nước (WQI) và phân loại chất lượng nước LSTM, có đầu vào là các tính năng thu được từ
(WQC). Để dự báo WQI, các mơ hình mạng nơ- IGRA, được thiết lập. Kết quả cho thấy phương
ron nhân tạo như mạng nơ-ron tự hồi quy phi pháp được đề xuất có thể tận dụng tối đa các
tuyến tính (NARNET) và thuật toán học sâu bộ mối tương quan đa biến và chuồi thời gian của
nhớ ngắn - dài hạn (LSTM) đã được ứng dụng thông tin chất lượng nước để đạt được hiệu quả
dựa trên 7 thông số đầu vào. Ket quả dự báo cho dự đoán chất lượng nước tốt hơn so với các
thấy mơ hình NARNET hoạt động tốt hơn so phương pháp dự đốn tính năng đơn lẻ hoặc
với LSTM để dự báo các giá trị WQI [1]. khơng theo trình tự. Để cảnh báo cho người
dùng trước khi nguồn nước bị ô nhiễm (Hệ
Trong quá trình xây dựng và vận hành các hệ thống được đề xuất sẽ cảnh báo người dùng khi
thống quan trắc chất lượng nước thông minh bất kỳ thông số nào vượt tiêu chuẩn cho phép),
trên nền tảng Internet vạn vật (loT), ngày càng một giải pháp dựa trên loT để dự báo chất lượng
nhiều dữ liệu lớn được tạo ra. Nhằm tận dụng nước [4], Hệ thống được đề xuất sử dụng loT và
hiệu suất tốt của mạng lưới nơ-ron sâu bộ nhớ mạng lưới nơ-ron được tối ưu hóa để dự đoán.
ngắn - dài hạn (LSTM) trong dự đoán chuỗi thời Thuật toán mạng nơ-ron dựa trên tối ưu hóa bầy
gian, mơ hình chất lượng nước uống đã được đàn Cat (CSO) được sử dụng để dự báo. Hệ
thiết kế và thiết lập để dự đoán dừ liệu lớn về thống được đề xuất sẽ cảnh báo người dùng khi
chất lượng nước với sự trợ giúp của công nghệ bất kỳ tham số đo được nào nhỏ hơn ngường cố
học sâu nâng cao. Kết quả nghiên cứu cho thấy định. Kỹ thuật này cũng có thể được thực hiện
giá trị dự báo của mơ hình và giá trị thực tế rất trong các nhà máy nước, sông và các ngành
phù hợp và cho thấy chính xác xu hướng phát công nghiệp.
triển chất lượng nước trong tương lai, cho thấy
tính khả thi và hiệu quả của việc sử dụng mạng Các thuật toán học sâu đã cải thiện đáng kể
lưới nơ-ron sâu LSTM để dự báo chất lượng của độ chính xác và hiệu quả của dự báo chất lượng
nước uống [8]. nước. Im và các cộng sự [7] đã sử dụng các
thuật toán học sâu (LSTM, GRU, SCINet) để dự
Đối với khu vực số liệu đo đạc còn hạn chế, báo chất lượng nước máy theo chuồi thời gian ở
thiếu số liệu, thuật toán học sâu đã được ứng Hàn Quốc. Mơ hình học sâu được tối ưu hóa đạt
dụng để dự báo các thơng số chất lượng nước được độ chính xác dự đốn trung bình và tối đa
(thời gian thực). Một mạng lưới nơ-ron nhân tạo lần lượt là 98,78 và 99,98%. Mô hình đề xuất có
học sâu (ANN) cộng với một kỹ thuật xử lý hậu thể cung cấp thông tin chất lượng nước nhanh
kỳ được gọi là Bộ xử lý Bayesian đa biến bất chóng và chính xác cho các cơ sở cấp nước quy
định (MBUP) được ứng dụng để dự báo. Kết mỏ lớn trên toàn quốc và cải thiện sức khỏe
quả cho thấy đã cải thiện đáng kể độ chính xác cộng đồng thơng qua chẩn đoán sớm các bất
của các dự báo chất lượng nước [12]. Việc dự thường về chất lượng nước.
báo chất lượng nước dựa trên thuật tốn Phân
tích quan hệ xám cải tiến (IGRA) và mạng lưới
64 TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023
❖ KHOA HỌC CƠNG NGHỆ ❖
Tóm lại, các nghiên cứu trước đây về sử trình thủy lợi Bắc Hưng Hải từ các báo cáo
dụng phương pháp học sâu trong dự báo chất quan trắc chất lượng nước và dữ liệu từ các
lượng nước chủ yếu tập trung vào vào dự báo nghiên cứu trước đây. Các dữ liệu sẽ được thu
các thông số chất lượng nước (thông số vật lý là thập và phân tích để phục vụ xây dựng mơ
chủ yếu) và tính tốn chỉ số chất lượng nước hình học sâu.
(WQI). Một số nghiên cứu cũng đã kết hợp
thuật toán học sâu với mạng lưới quan trắc thời Tham vấn các bên liên quan: Các cuộc tham
gian thực và cho kết quả rất khả quan. Tuy vấn các bên liên quan sẽ được tiến hành để thu
nhiên, những nghiên cứu trên chủ yếu là trên thập thêm thông tin về các nguồn gây ơ nhiễm
Thế giới, ở Việt Nam có rất ít nghiên cứu đánh và các yếu tố khác có thể ảnh hưởng đến chất
giá tiềm năng của các thuật toán học sâu trong lượng nước ở cơng trình thủy lợi Bắc Hưng Hải.
dự báo các thơng số chất lượng nước, nhất là về
hóa học và vi sinh (BOD5, NH4+, PO43' và 2.2.2. Phương pháp xử lý số liệu
Coliform) dựa vào các thông số đo hiện trường
(nhiệt độ, pH, DO và độ đục). Chuẩn bị và xử lý trước dữ liệu là một bước
quan trọng trong nghiên cứu này để đảm bảo dữ
Do vậy, việc nghiên cứu ứng dụng trí tuệ liệu, số liệu phù hợp nhằm loại bỏ mọi yếu tố
nhân tạo (mơ hình học sâu) để dự báo chỉ số nhiễu hoặc giá trị ngoại lai có thể ảnh hưởng
chất lượng nước mặt dựa vào số liệu đo hiện đến độ chính xác của các mơ hình. Bao gồm các
trường của hệ thống Bắc Hưng Hải là quan bước sau đây:
trọng và cần thiết. Nghiên cứu sẽ góp phần cung
cấp thêm phương pháp dự báo các thông số chất - Làm sạch dữ liệu: Dừ liệu được thu thập sẽ
lượng nước mặt khoa học, hiệu quả, tốn ít chi được làm sạch để xử lý mọi giá trị bị thiếu hoặc
phí nhằm thích hợp với điều kiện thực tế của các không đồng nhất.
địa phương trong vùng nghiên cứu.
- Chuẩn hóa dữ liệu: số liệu sẽ được chuẩn
2. PHƯƠNG PHÁP THỰC HIỆN hóa để đảm bảo rằng tất cả các biến (thông số)
2.1. Mục tiêu đều ở cùng một tỷ lệ (không thứ nguyên), điều
- Xây dựng được cơ sở khoa học tính tốn này rất quan trọng đối với độ chính xác của các
các thơng số chất lượng nước mặt bằng phương thuật toán học sâu.
pháp học sâu;
- Đe xuất được phương pháp tính tốn các - Chia dữ liệu: Dừ liệu sẽ được chia thành
thông chất lượng nước mặt bằng phương pháp các bộ dữ liệu huấn luyện và bộ dữ liệu thử
học sâu dựa vào số liệu đo hiện trường. nghiệm. Tập dữ liệu huấn luyện sẽ được sử
2.2. Phưong pháp thực hiện dụng đế huấn luyện các thuật toán, trong khi tập
Để đạt được các mục tiêu đề ra, các phương dữ liệu thử nghiệm sẽ được sử dụng để đánh giá
pháp nghiên cứu được sử dụng như sau: độ chính xác của kết quả dự báo.
2.2.1. Phươngpháp thu thập tài liệu, số liệu
Việc thu thập dữ liệu cho nghiên cứu này sẽ 2.2.3. Phương pháp xây dựng mơ hình
chủ yếu tập trung vào việc thu thập dữ liệu chất học sâu
lượng nước (quan trắc hiện trường) và các thơng
số chất lượng nước về hóa học và vi sinh 2.2.3.1. Lựa chọn thuật toán học sâu
(BOD5, NH4+, PO43" và Coliform) của công Việc lựa chọn các thuật toán học sâu để dự
báo các thông số chất lượng nước cho hệ
thống thủy lợi Bắc Hưng Hải sẽ dựa trên khả
năng nắm bắt các mối quan hệ phi tuyến tính
phức tạp trong dữ liệu và xử lý lượng dữ liệu
lớn. Một số thuật toán thường được ứng dụng
để dự báo như sau:
TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 65
❖ KHOA HỌC CÔNG NGHỆ ❖
- Mạng nơ-ron nhân tạo (ANN): là một loại Recurrent Neural Network
thuật toán học sâu thường được sử dụng cho các
nhiệm vụ dự báo. ANN bao gồm nhiều lớp nút Hình 2.1: Sơ đồ chuyển đổi mạng nơ-ron lan
được kết nối với nhau và được đào tạo bằng truyền thang thành mạng nơ-ron hồi quy
cách sử dụng lan truyền ngược.
Theo Hình 2.1, các nút trong các lóp khác
- Mạng nơ-ron tích chập (CNN): là một loại nhau của mạng nơ-ron được nén để tạo thành
thuật toán học sâu thường được sử dụng để một lớp mạng nơ-ron hồi quy. A, B, c là các
nhận dạng và xử lý hình ảnh. CNN rất phù tham số của mạng. Trogn đó, “x” là lớp đầu
hợp với dữ liệu chuỗi thời gian và đã được vào, “h” là lóp ẩn và “y” là lớp đầu ra. A, B và
chứng minh là hoạt động tốt để theo dõi chất c là các tham số mạng được sử dụng để cải
lượng nước. thiện đầu ra của mơ hình. Tại bất kỳ thời điểm t
nào, đầu vào hiện tại là sự kết họp của đầu vào
- Mạng nơ-ron hồi quy (RNNs): RNNs là tại x(t) và x(t-l). Đầu ra tại bất kỳ thời điểm nào
một loại thuật toán học sâu rất phù hợp với dữ được tìm nạp trở lại mạng để cải thiện đầu ra.
liệu liên tục và đa biến. RNN được thiết kế để
xử lý dữ liệu tuần tự và đã được chứng minh là Hình 2.2: Sơ đồ mạng nơ-ron hồi quy (RNN)
hoạt động tốt để dự báo chất lượng nước. được kết nổi đầy đủ
- Mạng bộ nhớ ngắn - dài hạn (LSTM): Trong các mạng nơ-ron hồi quy, thông tin
Mạng LSTM là một loại RNN được thiết kế để tuần hồn qua một vịng lặp đến lóp ẩn ở giữa.
xử lý các chuỗi dữ liệu theo thời gian. LSTM đã Lóp đầu vào 'x' nhận đầu vào của mạng nơ-ron
được chứng minh là rất hiệu quả trong việc dự và xử lý nó rồi chuyển nó lên lóp giữa. Lóp giữa
báo chất lượng nước thời gian thực. 'h' có thể bao gồm nhiều lóp ẩn, mồi lóp có các
chức năng kích hoạt và trọng số cũng như độ
Qua phân tích ở trên, thấy rằng Mạng nơ-ron lệch riêng. Neu có một mạng nơ-ron trong đó
hồi quy (RNNs) phù hợp với nghiên cứu này. các tham số khác nhau của các lớp ẩn khác nhau
Do vậy nghiên cứu sẽ sử dụng thuật toán này để không bị ảnh hưởng bởi lớp trước đó, tức là:
xây dựng mơ hình dự báo các thông số chất
lượng nước về hữu cơ (BOD5, NH/, PO43’ và
COD) của cơng trình thủy lợi Bắc Hưng Hải.
2.2.3.2. Cơ sở lý thuyết mạng nơ-ron hồi quy
(RNN)
Mạng RNN như là một mạng nơ-ron (Neural
Network) xử lý thông tin ở dạng chuỗi
(sequence/time-series) với việc tiền xử lý các
data theo thứ tự. RNN được gọi là hồi quy
(Recurrent) bởi lẽ chúng thực hiện cùng một tác
vụ cho tất cả các phần tử của một chuồi với đầu
ra phụ thuộc vào cả các phép tính trước đó. Nói
cách khác, RNN có khả năng nhớ các thơng tin
được tính tốn trước đó. RNN hoạt động theo
nguyên tắc lưu đầu ra của một lớp cụ thể và đưa
dữ liệu này trở lại đầu vào để dự đốn đầu ra
của lớp.
66 TẠP CHÍ TÀI NGUN NƯỚC SỐ 1-2023
❖ KHOA HỌC CƠNG NGHỆ ❖
mạng nơ-ron khơng có bộ nhớ, thì có thể sử chọn dựa trên kết quả hiệu chỉnh. Thuật toán
dụng mạng nơ-ron hồi quy. Mạng nơ-ron hồi
quy sẽ chuẩn hóa các chức năng kích hoạt khác này sẽ được sử dụng cho mô hình dự báo các
nhau, trọng số và độ lệch để mồi lớp ẩn có cùng thơng số chất lượng nước của hệ thống thủy lợi
tham số. Sau đó, thay vì tạo nhiều lớp ẩn, nó sẽ
tạo một lớp và lặp lại nhiều lần theo yêu cầu. Bắc Hưng Hải. Ngôn ngữ sử dụng để viết mã là
Hình 2.3: Sơ đồ hoạt động của mạng nơ-ron hồi quy R với các gói Keras, đây là API mạng nơ-ron
cấp cao, chạy trên TensorFlow. Nó được phát
Có 4 loại mạng nơ-ron hồi quy: 1 đầu vào
cho kết quả 1 đầu ra; 1 đầu vào - nhiều đầu ra; triển với trọng tâm là cho phép thiết kế dễ dàng
nhiều đầu vào - 1 đầu ra; và nhiều đầu vào -
nhiều đầu ra. Trong nghiên cứu này ứng dụng và nhanh chóng các mơ hình học sâu phức tạp,
loại mạng RNN với nhiều đầu vào - 1 đầu ra.
cũng như giúp đào tạo chúng dễ dàng hơn.
2.2.3.3. Đào tạo và kiếm định mơ hình Keras cung cấp các phương pháp thuận tiện để
Quá trình đào tạo là sử dụng tập dữ liệu đào
tạo sẽ được sử dụng để đào tạo các thuật toán tải và chuẩn bị dừ liệu, cũng như các công cụ để
nhận dạng các thông số và mối quan hệ của
chúng trong tập dữ liệu. Quá trình kiểm định trực quan hóa và giải thích kết quả đào tạo.
bao gồm sử dụng bộ dữ liệu kiểm tra để đánh
giá độ chính xác của thuật tốn. 2.2.3.4. Đánh giá độ chỉnh xác của mơ hình
Các bước sau đây sẽ được thực hiện để đào Các chỉ số đánh giá độ chính xác của mơ
tạo và kiểm định mơ hình:
- Đào tạo mơ hình: thuật tốn học sâu (RNN) hình sau đây sẽ được sử dụng để đánh giá mô
sẽ được đào tạo bằng tập dữ liệu đào tạo, đồng
thời để giảm thiểu sai số dự đoán giữa thơng số hình học sâu trong việc dự báo các thông số chất
chất lượng nước thực tế và thơng số chất lượng
nước dự đốn. lượng nước ở thủy lợi Bắc Hưng Hải. Các tiêu
- Điều chỉnh siêu tham số: các tham số của
thuật toán học sâu sẽ được điều chỉnh để cải chí đánh giá (hiệu chỉnh) các mơ hình học sâu
thiện hơn nữa độ chính xác.
- Kiểm định mơ hình: được xác thực bằng bộ được trình bày trong các cơng thức (1) đến (4):
dữ liệu kiểm tra.
- Lựa chọn mơ hình: Thuật tốn hoạt động tốt - Sai số tuyệt đối trung bình (MAE): chênh
nhất (theo các tham số đã hiệu chỉnh) sẽ được
lệch trung bình giữa giá trị thực và giá trị dự
đoán. MAE là 1 chỉ số phổ biến để tính sai số
nhằm đánh giá (kiểm định) mơ hình đối với các
biến liên tục, được xác định theo công thức (1).
Trong đó, Pi là giá trị dự báo và Mi là giá trị
thực đo. Giá trị MAE càng thấp thì kết quả tính
tốn càng chính xác.
1 ", (!)
MAE = - Y |Pi - Àfi|.
- Sai số tồn phương trung bình (MSE) của
một phép ước lượng là trung bình của bình
phương các sai số, tức là sự khác biệt giữa các
giá trị dự đoán và giá trị thực đo và được tính
tốn theo theo cơng thức (2). Giá trị MSE càng
thấp thì kết quả tính tốn càng chính xác.
MSE = è Ẻ< Y' - *)! (2)
71 Í=1
- RMSE là căn bậc hai của trung bình của các
sai số bình phương. RMSE là thước đo mức độ
dàn trải của những phần dư này, nói cách khác,
TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 67
❖ KHOA HỌC CƠNG NGHỆ ❖
nó cho bạn biết mức độ tập trung của dữ liệu R2 = 1 - (ESS/TSS) (4)
xung quanh đường phù hợp nhất. RMSE là độ
lệch chuẩn của các phần dư (sai số dự đoán) và 3. KẾT QUẢ VÀ THẢO LUẬN
được tính tốn theo theo cơng thức (3). Giá trị
RMSE càng thấp thì kết quả tính tốn càng 3.1. Kết quả thu thập số liệu quan trắc
chính xác.
chất lượng nước mặt
- Hệ số xác định (R2): phản ánh phần trăm
phương sai của y có thể giải thích bởi mơ hình Số liệu quan trắc chất lượng nước mặt năm
được xác định theo theo cơng thức (4). Trong
đó, ESS là tổng các độ lệch bình phương của 2021-2022 tại các vị trí lấy mẫu vùng nghiên
phần dư; TSS là tổng các độ lệch bình phương.
Giá trị R2 dao động từ 0 đến 1, giá trị R2 càng cứu được tổng họp trong Bảng 3.1 và các biểu
gần 1 thì kết quả tính tốn càng chính xác.
đồ một số thông số chất lượng nước chính từ
Hình 3.1 - Hình 3.6.
Có thể thấy nước mặt vùng nghiên cứu chủ
yếu bị ô nhiễm hữu cơ, chất dinh dưỡng, vi sinh
vật nhất là tại các vị trí Xuân Thụy, Ngọc Đà,
Binh Lâu. Các thông số vượt nhiều lần TCCP là
DO, BOD5, COD, NH4 và tổng Coliform (đây
cũng là những thơng số ơ nhiễm điển hình của
vùng nghiên cứu).
Bảng 3.1: Tổng hợp các giá trị đặc trưng các chất lượng nước mặt hệ thống Bắc Hưng Hải
Thông số Đặc trưng Năm 2021 Năm 2022 Tổng
(N=108) (N=75) (N=183)
Nhiệt độ Trung bình (SD) 26.0 (3.63) 20.1 (4.25) 23.6 (4.85)
Trung vị [Min, Max]
pH Trung bình (SD) 25.6 [19.6,33.4] 21.1 [12.6,26.5] 24.5 [12.6, 33.4]
DO Trung vị [Min, Max]
Trung bình (SD) 7.41 (0.397) 7.34 (0.264) 7.38 (0.350)
bod5 Trung vị [Min, Max]
Trung bình (SD) 7.33 [6.78, 8.68] 7.37 [6.77, 7.94] 7.34 [6.77, 8.68]
COD Trung vị [Min, Max]
NH4 Trung bình (SD) 2.64(1.24) 3.21 (1.32) 2.87 (1.30)
NO2 Trung vị [Min, Max]
Trung bình (SD) 2.45 [0.800, 6.10] 3.40 [0.820, 6.40] 2.90 [0.800, 6.40]
Trung vị [Min, Max]
Trung bình (SD) 22.4 (12.6) 30.5 (24.1) 25.7(18.6)
20.8 [4.10, 69.7] 23.8 [4.60, 183] 22.5 [4.10, 183]
58.1 (32.6) 69.4 (57.5) 62.7 (44.7)
55.3 [9.50, 176] 55.5 [10.3,451] 55.4 [9.50, 451]
7.65 (7.83) 7.72 (6.92) 7.68 (7.45)
5.32 [0.450,41.7] 6.16 [0.110, 35.3] 5.82 [0.110,41.7]
0.0529 (0.0974) 0.0237(0.0167) 0.0409 (0.0768)
0.0200 [0.0100, 0.0200 [0.0100,
Trung vị [Min, Max] 0.800] 0.0800] 0.0200 [0.0100, 0.800]
Trung bình (SD)
PO4 Trung vị [Min, Max] 0.911 (1.04) 0.783 (1.04) 0.859(1.04)
Trung bình (SD)
Coliform 0.420 [0.0100, 3.90] 0.300 [0.0100, 4.40] 0.360 [0.0100, 4.40]
1050000 (3660000) 1080000 (3600000) 1060000 (3630000)
43000 [610, 29000 [1400, 39000 [610,
Trung vị [Min, Max] 16000000] 16000000] 16000000]
68 TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023
❖ KHOA HỌC CÔNG NGHỆ ❖
• An Tho • Binh Lau • Cong Neo ạ Ngoc Da • Phan Ha
• Ba Thụy ạ Cau Cat * Kenh Cau * Ngoc Lam • Xuan Quan
• Bang Ngang * Cau Xe • Luc Dien * Nhu Quynh • Xuan Thuy
Hình 3.1: Biếu đồ biểu diễn nhiệt độ theo các Hình 3.2: Biếu đồ biểu diễn pH theo các vị trí
vị trí quan trắc của hệ thống BHH quan trắc của hệ thống BHH
• An Tho • Binh Lau ỊỊ Cong Neo • Ngoc Da * Phan Ha •An Tho • Bánh Lau • Cong Neo • Ngoe Da • Phan Ha
5 Ba Thuy • Cau Cat 5» Kenh ệãu * NgocLam 5 Xuan Quan
• Ba Thuy • Cau Gat • Kenh Cau • Npoc Lam • Xuan Quan
ã Bang Ngang ã Cau Xe đ Luc Dien • Nhu Quynh * Xuan Thuy
• Bang Ngang • Cau Xe * Luc Dion * Nhu Quynh • Xuan Thuy
1 JI ,
Hình 3.3: Biểu đồ hàm lượng DO theo các Hình 3.4: Biêu đơ hàm lượng BODỊ theo các
Hình 3.5: Biếu đồ hàm lượng NHf theo các Hình 3.6: Biếu đồ Coliform theo các vị trí
vị trí quan trắc của hệ thong BHH quan trắc của hệ thống BHH
3.2. Phân tích tương quan các thơng số BOD5 có tương quan với nhau cao nhất (0,98);
phục vụ xây dựng mơ hình học sâu tiếp đến tương quan giữa NH/ với PO43‘ là 0,64;
Theo kết quả phân tích tương quan giữa các tương quan giữa NHT với DO là 0,62; tương quan
thông số chất lượng nước mặt cho thấy COD và giữa DO với PO43 là 0,52 (Hình 3.7). Như vậy
TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 69
❖ KHOA HỌC CƠNG NGHỆ ❖
mối tương quan giữa các thơng số đầu vào (nhiệt đây cũng là cơ sở để chọn thuật toán học sâu
độ, pH, DO) với các thông số dự báo là phi tuyến, (RNN) để dự báo các thông số chất lượng nước.
15 25 1 35 0 200 400 0.0 0.4 0.8 0.0e+00 1.5e+07
Hình 3.7: Biểu đồ tương quan của các thơng sổ chất lượng nước
3.3. Nghiên cứu tính tốn các thơng số pH và DO). Nghiên cứu đã xây dựng mơ hình
chất lượng nước mặt bằng phưong pháp học học sâu từ các thông số trên để dự báo các thông
sâu cho hệ thống thủy lợi Bắc Hưng Hải số BODs, NH/, PO43' và COD. Kết quả dự báo
và các biểu đồ so sánh giữa giá trị dự báo và
3.3.1. Ket quả đánh gùi các mơ hình học sâu thực đo đối với tập số liệu thử nghiệm được
Căn cứ vào kết quả lựa chọn các thơng số trình bày trong Hình 3.8.
phục vụ xây dựng mơ hình học sâu (Nhiệt độ,
- j
Hình 3.8: Biểu đồ so sánh giữa giá trị dự báo Hình 3.9: Biểu đồ so sảnh giữa giá trị dự báo
và thực đo của thông số BODs và thực đo của thơng số COD
70 TẠP CHÍ TÀI NGUN NƯỚC SỐ 1 -2023
❖ KHOA HỌC CÔNG NGHỆ ❖
o*» ♦ Ma ♦ Hình 3.11: Biểu đồ so sánh giữa giá trị dự bảo
và thực đo của thơng số PO43'
Hình 3.10: Biếu đồ so sảnh giữa giả trị dự bảo
và thực đo của thông số NH4+
Kêt quả đánh giá (dựa vào 4 tiêu chí) của là 0,77; giá trị các sai số MAE, MSE và RMSE
mơ hình học sâu dự báo các thông số chất lần lượt là 28,28; 1637,5 và 40,46.
lượng nước mặt được trình bày trong - Mơ hình dự báo NH4+ có hệ số xác định R2
Bảng 3.2. là 0,75; giá trị các sai số MAE, MSE và RMSE
- Mô hình dự báo BOD5 có hệ số xác định R2 lần lượt là 4,30; 46,2 và 6,79.
là 0,79; giá trị các sai số MAE, MSE và RMSE - Mơ hình dự báo PO43" có hệ số xác định R2
lần lượt là 11,54; 297,8 và 17,2. là 0,85; giá trị các sai số MAE, MSE và RMSE
- Mô hình dự báo COD có hệ số xác định R2 lần lượt là 0,51; 0,68 và 0,82.
Bảng 3.2: Bảng thống kê kết quả đánh giá kết quả dự báo chỉ số chất lượng nước mặt
bằng mơ hình học sâu cho HTTL Bắc Hưng Hải
Các thông số đầu vào Thông số số lớp Số lần Tiêu chí đánh giá
đầu ra ẩn lặp MAE MSE RMSE R2
Nhiệt độ, pH, DO và Độ đục BOD5 10 200 11,54 297,80 17,20 0,79
Nhiệt độ, pH, DO và Độ đục COD 10 200 28,28 1637,50 40,46 0,77
Nhiệt độ, pH, DO và Độ đục nh4+ 10 200 4,30 46,2 6,79 0,75
Nhiệt độ, pH, DO và Độ đục PO43’ 10 200 0,51 0,68 0,82 0,85
Có thể thấy, mơ hình học sâu được áp dụng 4. KẾT LUẬN
trong nghiên cứu này đều có thể dự đoán tốt các Ket quả nghiên cứu đã xây dựng được cơ sở
thông số chất lượng nước cho khu vực nghiên khoa học dự báo các thông số chất lượng nước
cứu với hệ số xác định khá cao, lớn hơn 0,75. mặt bằng phương pháp học sâu (mạng nơ ron
Đây là cơ sở khoa học vững chắc và cũng là kết hồi quy - RNN) và đề xuất được phương pháp
quả quan trọng để có thể ứng dụng mơ hình học dự báo các thông số chất lượng nước mặt bằng
sâu để dự đốn các thơng số chất lượng nước cho phương pháp học sâu thích họp với điều kiện
các vùng khác có điều kiện tương tự, nhất là thực tế của các địa phương trong vùng hệ thống
trong điều kiện khó khăn trong công tác quan Bắc Hưng Hải.
trắc đầy đủ các thông số chất lượng nước theo Theo kết quả tính tốn (dự báo) các thơng số
phương pháp truyền thống để phục vụ công tác BOD5, NH4+, PO43’ và COD cho thấy rằng kết
đánh giá và quản lý nước trong hệ thống thủy lợi. quả dự báo PO43’ có độ chính xác cao nhất
TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1-2023 71
❖ KHOA HỌC CÔNG NGHỆ ❖
(85%), tiếp đến là BOD5 (79%), COD (77%) và Deep LSTM Network Considering Correlation
NH4+ (75%). in Smart Mariculture", Sensors. 19(6), tr. 1420.
Như vậy, việc ứng dụng mơ hình học sâu có 6. Vũ Thị Thanh Hương (2018), Nghiên cứu
thể tính tốn (dự báo) các thơng số chất lượng đề xuất các giải pháp giảm thiểu ô nhiễm nước
nước cho khu vực nghiên cứu với độ chính xác trong hệ thống công trình thủy lợi Bắc Hưng
cao, và có thể áp dụng cho các hệ thống thủy lợi Hải, Viện Nước, Tưới tiêu và Môi trường.
khác với điều kiện tương tự. Điều này sẽ giúp
các cơng ty khai thác cơng trình thủy lợi và các 7. Yunjeong Im và các cộng sự. (2022),
địa phương cải thiện hơn trong công tác đánh "Deep Learning Methods for Predicting Tap-
giá và quản lý chất lượng nước mặt. Water Quality Time Series in South Korea",
Water. 14(22), tr. 3766.
Lời cảm on: Tác giả xin chân thành cảm ơn
Ban chủ nhiệm Đe tài “Nghiên cứu tác động của 8. Ping Liu và các cộng sự. (2019),
nguồn cấp nước đến ô nhiễm nước trong các hệ "Analysis and Prediction of Water Quality
thong thủy lợi vùng Đồng bằng sông Hồng và Using LSTM Deep Neural Networks in loT
đề xuất các giải pháp khắc phục”Mẵ số: Envữonment", Sustainability. 11(7), tr. 2058.
ĐTĐL.CN-02/21 đã cung cấp số liệu về chất
lượng nước của Hệ thống thủy lợi Bắc Hưng 9. K. p. Rasheed Abdul Haq và V. p.
Hải cho nghiên cứu này. Harigovindan (2022), "Water Quality Prediction
for Smart Aquaculture Using Hybrid Deep
TÀI LIỆU THAM KHẢO Learning Models", IEEE Access. 10, tr.
60078-60098.
1. Theyazn H. H Aldhyani và các cộng sự.
(2020), "Water Quality Prediction Using 10. Jianzhuo Yan và các cộng sự. (2021),
Artificial Intelligence Algorithms", Applied "Water Quality Prediction in the Luan River
Bionics and Biomechanics. 2020, tr. 1-12. Based on 1-DRCNN and BiGRU Hybrid Neural
Network Model", Water. 13(9), tr. 1273.
2. Yingyi Chen và các cộng sự. (2020), "A
Review of the Artificial Neural Network 11. Jian Zhou và các cộng sự. (2018),
Models for Water Quality Prediction", Applied "Water Quality Prediction Method Based on
Sciences. 10(17), tr. 5776. IGRA and LSTM ", Water. 10(9), tr. 1148.
3. Vũ Quốc Chính (2022), Giám sát, dự báo 12. Yanlai Zhou (2020), "Real-time
chất lượng nước trong hệ thống cơng trình thuỷ probabilistic forecasting of river water quality
lợi Bắc Hưng Hải phục vụ lấy nước sản xuất under data missing situation: Deep learning plus
nông nghiệp năm 2022, Viện Nước, Tưới tiêu post-processing techniques", Journal of
và Môi trường, Hà Nội. Hydrology. 589, tr. 125164.
4. Mrs. G. Mariammal Et al. (2021), Người phản biện: PGS.TS. Hoàng Thái Đại
"Efficient IOT based Water Quality Prediction Phản biện xong: 02/2023
Using Cat Swarm Optimized Neural Network
classification", Psychology and Education
Journal. 58(1), tr. 4279-4282.
5. Zhuhua Hu và các cộng sự. (2019), "A
Water Quality Prediction Method Based on the
72 TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023