Tải bản đầy đủ (.pdf) (78 trang)

Mô phỏng và dự báo độ mặn tại tỉnh sóc trăng bằng phương pháp học máy

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.35 MB, 78 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA MƠI TRƯỜNG

KHĨA LUẬN TỐT NGHIỆP

XÂY DỰNG MƠ HÌNH HỌC MÁY
MƠ PHỎNG DỰ BÁO ĐỘ MẶN Ở TỈNH SĨC TRĂNG

NGÀNH: KHOA HỌC MƠI TRƯỜNG
CHUN NGÀNH: TIN HỌC MƠI TRƯỜNG

SVTH: ĐẶNG VĂN TRÍ
GVHD: ThS. ĐẶNG THỊ THANH LÊ
KHĨA HỌC: 2017 - 2021

Thành phố Hồ Chí Minh – 2021


ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA MƠI TRƯỜNG

KHĨA LUẬN TỐT NGHIỆP

XÂY DỰNG MƠ HÌNH HỌC MÁY
ĐỂ MƠ PHỎNG DỰ BÁO ĐỘ MẶN Ở TỈNH SĨC TRĂNG

Ngành: Khoa học Mơi trường
Chun ngành: Tin học Môi trường


Xác nhận của GVHD

Sinh viên thực hiện: Đặng Văn Trí
Giáo viên hướng dẫn: Ths. Đặng Thị Thanh Lê
Khóa học: 2017 - 2021

ThS. Đặng Thị Thanh Lê

Thành phố Hồ Chí Minh – 2021


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

LỜI CẢM ƠN
Để đề tài tiểu luận được hoàn thành một cách tốt nhất, em xin chân thành cảm ơn
đến quý thầy cô, anh chị và bạn bè khoa Môi trường trường ĐH Khoa học Tự nhiên –
ĐHQG thành phố Hồ Chí Minh đã nhiệt tình hỗ trợ và giúp đỡ em trong việc thực hiện
đề tài thời gian vừa qua.
Đặc biệt, em xin gửi lời biết ơn sâu sắc nhất đến với ThS. Đặng Thị Thanh Lê khoa Môi Trường, trường Đại học Khoa học Tự nhiên Tp. Hồ Chí Minh. Là giáo viên
hướng dẫn đã nhiệt tình giúp đỡ, quan tâm, hỗ trợ và chia sẻ cho em trong quá trình
thực hiện đề tài để em có thể hồn thành nó mơt cách tốt nhất trong thời gian quy định.
Do có hạn chế về thời gian thực hiện đề tài cũng như khó khăn về số liệu thu
thập. Đây là cũng là đề tài tốt nghiệp lần đầu sinh viên thực hiện nên sẽ khơng tránh
khỏi các sai sót trong lúc thực hiện đề tài. Em rất mong nhận được sự đóng góp ý kiến
của thầy, cơ để em có thể bổ sung, hoàn thiện và nâng cao kiến thức về đề tài này.
Em xin chân thành cảm ơn!
TP.HCM, tháng 7 năm 2021
Sinh viên thực hiện


Đặng Văn Trí

i


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

TÓM TẮT
Nghiên cứu sử dụng các thuật toán học máy gồm LR, SVR, ANN để mô phỏng
dự báo độ mặn tại trạm Đại Ngãi tỉnh Sóc Trăng vào năm 2017 với dữ liệu đầu vào
gồm: Mặn, Mực nước, lượng mưa tại 3 trạm Đại Ngãi, Trần Đề và Trà Kha vào năm
2015 và 2016. Kết quả mô phỏng cho thấy cả 3 mơ hình đều có thể mơ phỏng dự báo
độ mặn tại khu vực nghiên cứu với các đầu vào nói trên một cách khá tốt. Hiệu quả mô
phỏng của mô hình được đánh giá dựa trên các thơng số: R2, RMSE, NSE. Các thơng
số này hình khá cao ở cả 2 giai đoạn hiệu chỉnh và kiểm định với 2 mơ hình SVR và
ANN với R2 từ 0.6-0.85, RMSE thấp và NSE ở mức tốt, riêng với mơ hình LR các
thông số này chỉ thể hiện ở mức thấp với R2 từ 0.5-0.6, RMSE ở mức trung bình và
NSE ở mức thỏa mãn u cầu. Mơ hình ANN cũng thể hiện khả năng mô phỏng dự báo
ở mức cao với các đầu vào tương ứng nhất là đầu vào 2. Cả 3 mơ hình đều có điểm
mạnh và điểm yếu riêng tuy nhiên mơ hình SVR thể hiện khả năng mô phỏng dự báo
vượt trội và ổn định hơn 2 mơ hình cịn lại.
Từ khóa: Support Vector Regression, Artificial Neural Network, Linear
Regression, Độ mặn, Sóc Trăng

ii



GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

ABSTRACT
The thesis is using machine learning algorithms included LR, SVR, ANN to
simulate salinity prediction at Dai Ngai station, Soc Trang province in 2017 with the
input are: Salinity, Water level, rainfall from three weather stations Dai Ngai, Tran De
and Tra Kha in 2015 – 2016. The result clearly indicated that all three models could be
simulated the salinity in the study area with the available data pretty good. The efficiency
of the model is evaluated base on these parameters: R2, RMSE, NSE. The parameters are
high within both the calibration and testing phases for 2 models are SVR and ANN with
R2 from 0.6-0.85, low RMSE high good NSE, especially with LR model, these
parameters can only be current is low with R2 from 0.5-0.6, RMSE is medium and NSE
is at satisfactory level. The ANN model also represented to high predictive capability
with the most corresponding inputs being the input 2. All three models have their own
strengths and weaknesses, but the SVR model shows superior simulation and is more
stable than the other two models.
Keywords: Salinity, Support Vector Regression, Artificial Neural network,
Linear Regression, Soc Trang

iii


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

MỤC LỤC
LỜI CẢM ƠN ..................................................................................................................i

TÓM TẮT .......................................................................................................................ii
ABSTRACT .................................................................................................................. iii
MỤC LỤC ......................................................................................................................iv
DANH MỤC HÌNH ẢNH .......................................................................................... viii
DANH MỤC BẢNG BIỂU ............................................................................................ x
DANH MỤC CÁC KIỂU KÍ TỰ, CHỮ VIẾT TẮT ..................................................xi
MỞ ĐẦU ......................................................................................................................... 1
1. Tính cấp thiết của đề tài ............................................................................................ 1
2. Mục tiêu nghiên cứu ................................................................................................. 2
3. Đối tượng và phạm vi nghiên cứu ............................................................................ 3
4. Ý nghĩa khoa học và thực tiễn .................................................................................. 3
4.1 Ý nghĩa khoa học ................................................................................................. 3
4.2 Ý nghĩa thực tiễn ................................................................................................. 3
CHƯƠNG 1: TỔNG QUAN NGHIÊN CỨU .............................................................. 4
1.1.

Tổng quan về xâm nhập mặn.............................................................................. 4

1.1.1

Khái niệm ..................................................................................................... 4

1.1.2. Cơ chế của quá trình xâm nhập mặn ............................................................... 5
1.1.3. Những yếu tố ảnh hưởng đến xâm nhập mặn: ................................................ 5
1.2.

Trí tuệ nhân tạo (Artificial Intelligence) ............................................................ 7

iv



GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

1.2.1.
1.3.

Khái niệm ..................................................................................................... 7

Học Máy (Machine Learning) ............................................................................ 7

1.3.1. Học có giám sát (Supervised Learning): ......................................................... 9
1.3.2. Học không giám sát (Unsupervised Learning):............................................... 9
1.3.3. Học tập tăng cường (Reinforcement Learning) ............................................ 10
1.4. Các thuật toán học máy........................................................................................ 10
1.4.1 Artificial Neural Network (ANN) .................................................................. 10
1.4.1.1. Khái niệm ................................................................................................ 10
1.4.1.2. Kiến trúc của mạng nơ-ron nhân tạo (ANN) .......................................... 11
1.4.2. Support Vector Regression (SVR) ................................................................ 12
1.4.2.1 . Khái niệm SVM.................................................................................... 12
1.4.2.2. Khái niệm về SVR .................................................................................. 13
1.4.3. Linear Regression .......................................................................................... 16
1.5. Tổng quan khu vực nghiên cứu ........................................................................... 17
1.5.1. Vị trí địa lý .................................................................................................... 17
1.5.2. Khí hậu .......................................................................................................... 18
1.5.3. Đất đai, thổ nhưỡng ....................................................................................... 18
1.5.4. Đặc điểm địa hình.......................................................................................... 19
1.5.5. Thủy hệ .......................................................................................................... 20
1.5.6. Tài nguyên rừng và biển ................................................................................ 21

1.5.7. Tình hình xâm nhập mặn ở tỉnh Sóc Trăng ................................................... 21

v


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

1.6. Tổng quan các nghiên cứu trong và ngoài nước .................................................. 23
1.6.1. Nghiên cứu ngoài nước ................................................................................. 23
1.6.2. Tổng quan nghiên cứu trong nước ................................................................ 25
CHƯƠNG 2: NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ........................... 28
2.1. Khung phương pháp nghiên cứu.......................................................................... 28
2.2 Phương pháp nghiên cứu ...................................................................................... 29
2.2.1. Phương pháp thu thập và tổng hợp số liệu .................................................... 29
2.2.2. Phương pháp thống kê ................................................................................... 29
2.2.3. Phương pháp học máy ................................................................................... 31
2.2.3.1. Hồi quy tuyến tính (Linear Regression) ................................................. 31
2.3.3.2 Hồi quy vector hỗ trợ (Support Vector Regression) ................................ 33
2.3.3.3. Quy trình xây dựng mơ hình SVR và LR ............................................... 36
2.3.3.4. Mơ hình ANN ......................................................................................... 39
2.3.3.5. Quy trình xây dựng mơ hình ANN ......................................................... 43
CHƯƠNG 3: KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN................................... 47
3.1. Dữ liệu đầu vào của mơ hình ............................................................................... 47
3.2. Đánh giá hiệu quả mơ hình LR ............................................................................ 47
3.3. Đánh giá hiệu quả mơ hình SVR ......................................................................... 50
3.4. Đánh giá hiệu quả Mơ hình ANN ........................................................................ 53
3.4.1 Kết quả lựa chọn cấu trúc ANN ..................................................................... 53
3.4.2. Đánh giá hiệu quả mơ phỏng mơ hình ANN ................................................. 54


vi


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

3.5. So sánh hiệu quả mơ phỏng của 3 mơ hình ......................................................... 56
CHƯƠNG IV: KẾT LUẬN VÀ KIẾN NGHỊ ........................................................... 59
4.1.Kết luận ................................................................................................................. 59
4.2. Kiến nghị.............................................................................................................. 60
TÀI LIỆU THAM KHẢO ........................................................................................... 62

vii


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

DANH MỤC HÌNH ẢNH
Hình 1.1: Sự dịch chuyển của khối nước mặn vào tầng nước ngọt ................................ 4
Hình 1.2: Hiện tượng xâm nhập mặn từ biển vào lịng sơng vùng cửa sơng .................. 6
Hình 1.3: Phân loại các thuật tốn học máy .................................................................... 8
Hình 1.4: Sơ đồ khối của mạng nơ-ron nhân tạo ........................................................... 11
Hình 1.5: Thuật tốn SVM tìm siêu phẳng tối đa hóa khoảng cách tối thiểu nhất giữa
các vectơ hỗ trợ ............................................................................................................. 13
Hình 1.6 Các thành phần của SVR ............................................................................... 14
Hình 1.7: SVR tuyến tính một chiều ............................................................................. 15

Hình 1.8: Bản đồ hành chính tỉnh Sóc Trăng ………………………………………....18
Hình 1.9: Hệ thống thủy văn tỉnh Sóc Trăng………………………………………….20
Hình 2.1: Khung phương pháp nghiên cứu……………………………………………28
Hình 2.2: Sự sai lệch do độ nhiễu của Linear Regression……………………………..32
Hình 2.3: Trình tự xây dựng mơ hình SVR và LR......................................................... 37
Hình 2.4 Nguyên lý hoạt động của ANN ...................................................................... 40
Hình 2.5: Đồ thị của hàm kích hoạt Sigmoid ................................................................. 42
Hình 3.1: Đồ thị nồng độ mặn mơ phỏng và thực đo với đầu vào 1 của mô hình LR…49
Hình 3.2: Đồ thị nồng độ mặn mơ phỏng và thực đo với đầu vào 2 của mơ hình LR ... 49
Hình 3.3: Đồ thị nồng độ mặn mơ phỏng và thực đo với đầu vào 3 của mô hình LR ... 50
Hình 3.4: Đồ thị nồng độ mặn mô phỏng và thực đo với đầu vào 1 của mơ hình SVR 52
Hình 3.5: Đồ thị nồng độ mặn mô phỏng và thực đo với đầu vào 2 của mơ hình SVR 52
Hình 3.6: Đồ thị nồng độ mặn mô phỏng và thực đo với đầu vào 3 của mơ hình LR ... 53
viii


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

Hình 3.7: Đồ thị so sánh nồng độ mặn mô phỏng và thực đo với mơ hình ANN với đầu
vào 1 ............................................................................................................................... 55
Hình 3.8: Đồ thị so sánh nồng độ mặn mơ phỏng và thực đo với mơ hình ANN với đầu
vào 2 ............................................................................................................................... 55
Hình 3.9: Đồ thị so sánh nồng độ mặn mơ phỏng và thực đo với mơ hình ANN với đầu
vào 3 ............................................................................................................................... 56

ix



GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

DANH MỤC BẢNG BIỂU
Bảng 2.1: Thông kê số liệu tại các trạm ......................................................................... 29
Bảng 2.2: Thang đánh giá hiệu quả mô phỏng .............................................................. 31
Bảng 2.3: Cấu trúc ANN ............................................................................................... 45
Bảng 3.1: Các thơng số đầu vào của mơ hình………………………………………… 47
Bảng 3.2: Bảng kết quả các thông số dự báo mô phỏng của mơ hình LR với 3 đầu
vào .................................................................................................................................. 48
Bảng 3.3: Bảng kết quả các thông số dự báo mô phỏng của mơ hình SVR với 3 đầu vào
........................................................................................................................................ 51
Bảng 3.4: Kết quả thực hiện mơ hình ANN với các neutron khác nhau trong lớp ẩn tại
trạm Đại Ngãi ................................................................................................................. 53
Bảng 3.5: Các thơng số mơ phỏng của mơ hình ANN ................................................... 54
Bảng 3.6: Thơng số mơ phỏng của 3 mơ hình với đầu vào 1 ........................................ 56
Bảng 3.7: Thông số mô phỏng của 3 mơ hình với đầu vào 2 ........................................ 57
Bảng 3.8: Thơng số mơ phỏng của 3 mơ hình với đầu vào 3 ........................................ 57

x


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

DANH MỤC CÁC KIỂU KÍ TỰ, CHỮ VIẾT TẮT
ANN:


Artificial Neural Network

SVR:

Support Vector Regression

LR:

Linear Regression

ELM:

Elaboration Likehood Model

MLP:

Multi-layer Perceptron

ELM:

Elaboration Likehood Model

SVM:

Support Vector Machine

ML:

Machine Learing


AI:

Artificial Intelligence

BĐKH:

Biến đổi khí hậu

XNM:

Xâm nhập mặn

ĐBSCL:

Đồng bằng sơng cửu long

ĐBSH:

Đồng bằng sông Hồng

ĐN:

Đại Ngãi

TĐ:

Trần Đề

TK:


Trà Kha

xi


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

MỞ ĐẦU
1. Tính cấp thiết của đề tài
Những năm gần đây, biến đổi khí hậu (BĐKH) tồn cầu đang diễn ra ngày càng
nghiêm trọng. Biểu hiện rõ nhất là sự nóng lên của trái đất chính là băng tan, nước biển
dâng cao; là các hiện tượng thời tiết bất thường, bão lũ, sóng thần, động đất, hạn hán
và giá rét kéo dài, … dẫn đến thiếu lương thực, thực phẩm và xuất hiện hàng loạt dịch
bệnh trên người, gia súc, gia cầm, …
Ở nước ta, BĐKH cũng gây ra các thiệt hại nặng nề về công nghiệp, nông nghiệp
ở một số khu vực trọng yếu như đồng bằng sông Cửu Long (ĐBSCL), đồng bằng sông
Hồng (ĐBSH) nhất là vấn đề xâm nhập mặn. Sóc Trăng một trong những tỉnh thuộc
ĐBSCL đã và đang phải chịu những thiệt hại khá nặng nề do tác hại của xâm nhập mặn.
Nghiêm trọng nhất là vào mùa khô năm 2019 – 2020, trên địa bàn tỉnh mặn xâm nhập
sớm, sâu và độ mặn cao hơn so với trung bình nhiều năm. Từ giữa tháng 11/2019 mặn
đã xâm nhập theo cửa sông Hậu và sông Mỹ Thanh, ranh mặn đã lên đến 4g/l và xâm
nhập sâu vào từ 40 – 55 km tính từ cửa sơng (sâu hơn trung bình nhiều năm từ 10 – 15
km), độ mặn cao nhất quan trắc tại trạm Trần Đề là 26g/l (gần tương đương mức lịch
sử mùa khô năm 2015 - 2016). Tình hình này đã có nhiều ảnh hưởng đến sản xuất và
dân sinh. Ước tính tổng thiệt hại do xâm nhập mặn gần 21 tỷ đồng, trong đó: tổng diện
tích lúa mất trắng trên 4.000 ha, diện tích rau màu bị giảm năng suất 23 ha, diện tích
cây ăn trái bị thiệt hại trên 70% là 04 ha, tổng số hộ bị thiếu nước sinh hoạt thời điểm
cao nhất mùa khô năm 2019 - 2020 là 24.394 hộ. (Báo cáo kinh tế xã hội tỉnh Sóc Trăng,

2020)
Ảnh hưởng của xâm nhập mặt ở khu vực Sóc Trăng ngày càng nghiêm trọng. Vì
thế Có khá nhiều nghiên cứu về lĩnh vực xâm nhập mặn tại khu vực này. Các nhà nghiên
cứu sử dụng các mơ hình tốn số như HEC-RAS, MIKE-11, MIKE-21, …với mục đích
nhằm mơ phỏng dự báo xâm nhập mặn tại khu vực nghiên cứu nhằm giảm thiểu thiệt
1


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

hại của xâm nhập mặn gây ra. Ưu điểm của các mô hình này là kết quả tính tốn khá
chính xác và diễn tả đầy đủ các hiện tượng vật lý. Tuy nhiên, việc áp dụng các mơ hình
này trong thực tế đang gặp một số hạn chế do yêu cầu về dữ liệu đầu vào khá phức tạp.
Các số liệu đầu vào của mơ hình tính tốn như: Địa hình, địa chất, độ nhám lòng dẫn,
mặt cắt, … và số liệu dùng để hiệu chỉnh như: mưa, mực nước, lưu lượng, nồng độ
mặn, … không phải lúc nào cũng được quan trắc đầy đủ và chính xác, đặc biệt là trong
hệ thống sông phức tạp tại ĐBSCL. Trong trường hợp này, các mơ hình được dựa trên
các thuật tốn học máy với khả năng mô phỏng tốt các quan hệ phi tuyến bậc cao giải
quyết được vấn đề dự báo xâm nhập mặn một cách dễ dàng tiện lợi hơn.
Từ các phân tích trên, đề tài “Xây dựng mơ hình học máy mơ phỏng dự báo độ
mặn ở tỉnh Sóc Trăng” được thực hiện nhằm ứng dụng các thuật toán học máy để mô
phỏng dự báo độ mặn tại khu vực nghiên cứu. Kết quả dự kiến của đề tài sẽ cho thấy
được thế mạnh của mơ hình dựa trên các thuật tốn học máy (MC) trong mơ phỏng xâm
nhập mặn, cung cấp thông tin cho việc để xuất các giải pháp ứng phó với tình hình xâm
nhập mặn đang diễn ra phức tạp tại khu vực nghiên cứu.
2. Mục tiêu nghiên cứu
➢ Mục tiêu tổng quát
Mục tiêu nghiên cứu của đề tài này nhằm xây dựng các mơ hình học máy để mô

phỏng dự báo xâm nhập mặn ở tỉnh Sóc Trăng. So sánh hiệu quả và chọn ra mơ hình
có khả năng mơ phỏng tốt nhất.
➢ Mục tiêu chi tiết
Tổng quan vấn đề nghiên cứu
Mô phỏng dự báo độ mặn tại khu vực nghiên cứu bằng 3 thuật toán học máy:
SVR, LR, ANN
So sánh hiệu quả của các mô hình.

2


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

3. Đối tượng và phạm vi nghiên cứu
-

Đối tượng nghiên cứu: Nồng độ mặn tại các trạm nghiên cứu ở tỉnh Sóc Trăng

-

Phạm vi nghiên cứu: Khu vực phía nam sơng Hậu thuộc tỉnh Sóc Trăng

4. Ý nghĩa khoa học và thực tiễn
4.1 Ý nghĩa khoa học
Đề tài “Xây dựng mơ hình học máy mô phỏng dự báo độ mặn ở tỉnh Sóc Trăng”
sẽ đóng góp phương pháp tiếp cân mới trong việc nghiên cứu về xâm nhập mặn. Bên
cạnh đó, đề tài góp phần làm giàu dữ liệu đầu vào cho các nghiên cứu tiếp theo về việc
ứng dụng các thuật toán học máy và các nghiên cứu về xâm nhập mặn.

4.2 Ý nghĩa thực tiễn
Các kết quả đạt đươc giúp đưa ra cơng cụ mơ hình phục vục đánh giá về tình
hình xâm nhập mặn ở khu vực nghiên cứu, cung cấp thông tin cho việc đề xuất các giải
pháp. Nhằm giảm thiểu thiệt hại mà xâm nhập mặn gây ra, là tài liệu tham khảo có cở
sở khoa học và tính ứng dụng thực tiễn để các nhà quản lý môi trường căn cứ để đưa ra
các giải pháp hợp lý để phát triển kinh tế, xã hội cho người dẫn trong khu vực.

3


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

CHƯƠNG 1: TỔNG QUAN NGHIÊN CỨU
1.1.

Tổng quan về xâm nhập mặn

1.1.1 Khái niệm
Xâm nhập mặn là hiện tượng nước biển xâm nhập vào vùng nước ngọt của lịng
sơng hoặc các tầng nước ngọt dưới đất. Hiện tượng này diễn ra phổ biến tại các cửa
sơng tiếp giáp với biển (Hình 1.1). Xâm nhập mặn làm giảm nguồn nước ngọt dưới
lòng đất ở các tầng chứa nước ven biển do cả hai quá trình tự nhiên và nhân tạo. (USGS,
2021)

Hình 1.1. Sự dịch chuyển của khối nước mặn vào tầng nước ngọt
(Modified form Cooper,1964)
Theo Trung tâm phòng tránh và giảm nhẹ thiên tai, Bộ Nông nghiệp và Phát
triển Nông thôn: Xâm nhập mặn là hiện tượng nước mặn với nồng độ mặn bằng 4‰

xâm nhập sâu vào nội đồng khi xảy ra triều cường, nước biển dâng hoặc cạn kiệt nguồn
nước ngọt.
Xâm nhập mặn là vấn đề nghiêm trọng đối với nhiều chính quyền địa phương,
vấn đề này đã được nỗ lực giải quyết trong bối cảnh đang diễn ra biến đổi khí hậu như
4


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

nước biển dâng, tăng nhiệt độ, khai thác nước ngầm quá mức để đáp ứng nhu cầu nước
cho phát triển, những nguyên nhân này đang làm tăng nguy cơ xâm nhập mặn. (Nawapi,
2018)
1.1.2. Cơ chế của quá trình xâm nhập mặn
Trong điều kiện tự nhiên, sự di chuyển ra biển của nước ngọt ngăn không cho
nước mặn xâm lấn vào các tầng chứa nước ngọt ven biển. Bề mặt phân cách này giữa
nước ngọt và nước mặn được duy trì gần bờ biển hoặc xa dưới bề mặt đất liền. Bề mặt
phân cách thực sự là một vùng khuếch tán, nơi nước ngọt và nước mặn trộn lẫn. Vùng
này được gọi là vùng phân tán hoặc vùng chuyển tiếp.
Quá trình xâm nhập của nước mặn được thể hiện ở hình 1.1 minh họa quá trình
nước mặn xâm nhập vào hệ thống tầng chứa nước có thể xảy ra như thế nào. Ranh giới
giữa nước ngầm và nước mặn được gọi là mặt phân cách nước ngọt - nước mặn. Nước
ngọt chảy ra bờ biển ngăn chặn sự xâm thực của nước mặn vào đất liền. Nếu quá nhiều
nước ngọt được bơm từ hệ thống tầng chứa nước, thì nước mặn có thể di chuyển vào
đất liền bằng một quá trình được gọi là “Xâm nhập mặn”. Nếu một giếng bơm gần với
bề mặt phân cách nước ngọt - nước mặn di chuyển vào đất liền, nước mặn cũng có thể
xâm nhập vào giếng và làm ô nhiễm nguồn cung cấp nước (USGS, 2021).
1.1.3. Những yếu tố ảnh hưởng đến xâm nhập mặn:
Trong tự nhiên, bề mặt phân cách giữa nước ngọt và nước mặn hiếm khi ổn định

(Hình 1.1). Quá trình bổ sung nước hoặc khai thác nguồn nước ngầm đều dẫn đến sự
dịch chuyển bề mặt phân cách giữa nước ngọt và nước mặn từ vị trí này sang vị trí khác.
Sự dịch chuyển đó có thể làm mực nước dâng lên hoặc hạ xuống tùy thuộc vào việc
nước ngọt đổ vào tầng ngậm nước tăng hay giảm. Do đó, sự thay đổi lượng nước ngầm
gây ảnh hưởng trực tiếp đến xâm nhập mặn. Tình trạng này sẽ tăng nhanh hơn nếu giảm
bổ sung nước ngầm.

5


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

Ảnh hưởng của biến đổi khí hậu: Biến đổi khí hậu có thể ảnh hưởng sâu sắc
đến chu trình thủy văn thơng qua thay đổi mơ hình lượng mưa, lượng nước bốc hơi và
độ ẩm của đất. Lượng mưa có thể tăng hoặc giảm và phân bố khơng đồng đều trên tồn
cầu. Hiện tượng này sẽ làm thay đổi lượng nước ngầm được bổ sung, đồng thời thay
đổi tốc độ xâm nhập mặn vào tầng ngậm nước ven biển. Vì vậy, thơng tin về các tác
động của biến đổi khí hậu ở địa phương hoặc khu vực, các quá trình thủy văn và tài
nguyên nước ven biển trở nên rất quan trọng.
Ảnh hưởng của q trình thay đổi mục đích sử dụng đất: Các hoạt động thay
đổi mục đích sử dụng đất và quản lý đất cũng có thể làm thay đổi trực tiếp đến hệ thống
thủy văn, chế độ bốc hơi nước và dịng chảy. Do đó, sử dụng đất cũng đóng vai trị quan
trọng trong việc đánh giá nguồn nước ngầm.
Đối với các cửa sông tiếp giáp với biển, hiện tượng xâm nhập mặn từ biển vào
các sông xảy ra khá phổ biến, đặc biệt vào mùa khơ. Khi đó lượng nước từ sông đổ ra
biển giảm, thủy triều từ biển sẽ mang nước mặn lấn sâu vào lịng sơng làm cho nước
sơng bị nhiễm mặn (Hình 1.2). Nồng độ mặn sẽ giảm dần khi càng tiến sâu vào đồng
bằng


Hình 1.2. Hiện tượng xâm nhập mặn từ biển vào lòng sông vùng cửa sông
(Nguồn: Lê Anh Tuấn, 2008)

6


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

1.2.

Trí tuệ nhân tạo (Artificial Intelligence)

1.2.1. Khái niệm
Trí tuệ nhân tạo (AI: Artificial Intelligence) có thể được định nghĩa như một
ngành của khoa học máy tính liên quan đến việc tự động hóa các hành vi thơng minh.
AI là một bộ phận của khoa học máy tính và do đó nó phải được đặt trên những nguyên
lý lý thuyết vững chắc, có khả năng ứng dụng được lĩnh vực này. Những nguyên lý này
bao gồm các cấu trúc dữ liệu dùng cho biểu diễn tri thức, các thuật toán cần thiết để áp
dụng những tri thức đó, cùng các ngơn ngữ và kỹ thuật lập trình dùng cho việc cài đặt
chúng.
Trí tuệ nhân tạo khác với việc lập trình logic trong các ngơn ngữ lập trình ở việc
ứng dụng các hệ thống học máy (machine learning) để mơ phỏng trí tuệ của con người
trong các xử lý mà con người làm tốt hơn máy tính. Cụ thể, trí tuệ nhân tạo giúp máy
tính có được những trí tuệ của con người như: biết suy nghĩ và lập luận để giải quyết
vấn đề, biết giao tiếp do hiểu ngơn ngữ, tiếng nói, biết học và tự thích nghi, …
Tóm lại, AI là cơng nghệ mơ phỏng những suy nghĩ và q trình tiếp thu kiến
thức của con người cho máy móc, đặc biệt là các hệ thống máy tính.

1.3.

Học Máy (Machine Learning)
Học máy (Machine Learning – ML) là một nhánh của trí tuệ nhân tạo, là “Lĩnh

vực nghiên cứu cung cấp cho máy tính khả năng học mà khơng cần được lập trình rõ
ràng” (Arthur Samuel, 2018). Một phần lớn sự phát triển của AI trong các ứng dụng đã
có được nhờ việc phát minh ra các thuật toán mới trong lĩnh vực học máy. Học máy
liên quan đến việc xây dựng các hệ thống cải thiện hiệu suất của chúng trong một nhiệm
vụ khi được cung cấp các ví dụ về hiệu suất lý tưởng trong nhiệm vụ hoặc cải thiện hiệu
suất của chúng với kinh nghiệm lặp lại trong nhiệm vụ. Các thuật toán từ học máy đã
được sử dụng trong các hệ thống nhận dạng giọng nói, bộ lọc thư rác, hệ thống phát
hiện gian lận trực tuyến, hệ thống đề xuất sản phẩm, dự báo thời tiết, … Theo cách hiểu
7


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

rất đơn giản, học máy có thể được giải thích là tự động hóa và cải thiện q trình học
tập của máy tính dựa trên trải nghiệm của chúng mà khơng được lập trình thực sự, tức
là khơng có bất kỳ sự trợ giúp nào của con người. Quá trình bắt đầu với việc cung cấp
dữ liệu chất lượng tốt và sau đó đào tạo máy (máy tính) bằng cách xây dựng các mơ
hình học máy sử dụng dữ liệu và các thuật toán khác nhau. Việc lựa chọn thuật toán
phụ thuộc vào loại dữ liệu và loại tác vụ đang cố gắng tự động hóa. Việc triển khai học
máy được phân loại thành các loại chính, tùy thuộc vào bản chất của “tín hiệu” hoặc
“phản hồi” có sẵn cho hệ thống học tập như sau: Học có giám sát, khơng giám sát, học
tập tăng cường, … Hình 1.3 mơ tả phân loại các thuật toán của học máy hiện đại


Hồi quy

1. Hồi quy tuyến
tính đơn giản
2. Hồi quy đa thức
3. Hồi quy logistic

Thuật tốn học máy

Học có giám sát

Phân loại

Học khơng giám
sát
Học tập tăng
cường

1. Rừng ngẫu
nhiên.
2. Máy hỗ trợ
vector

Phân cụm

1. Phương pháp
phân vùng

1. Q-Learning


2. Phương pháp
phân cấp

2. ARSA
3. Mơ hình
Markov

Hình 1.3. Phân loại các thuật toán học máy (Nguồn: IEEEAccess, 2020)

8


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

1.3.1. Học có giám sát (Supervised Learning):
Khi một thuật tốn học từ dữ liệu mẫu và các phản hồi mục tiêu được liên kết có
thể bao gồm các giá trị số hoặc chuỗi, chẳng hạn như các lớp hoặc thẻ, để dự đốn sau
này phản hồi chính xác khi đặt ra các ví dụ mới thuộc danh mục học có giám sát. Cách
tiếp cận này thực sự tương tự như cách học của con người dưới sự giám sát của giáo
viên. Giáo viên đưa ra các ví dụ điển hình để học sinh ghi nhớ và học sinh sau đó rút ra
các quy tắc chung từ các ví dụ cụ thể này.
Phương pháp học có giám sát thường là xây dựng các mơ hình dựa trên các thuật
tốn hồi quy và thường được sử dụng trong các bài toán hồi quy và phân loại (Classfit).
Một số thuật toán hồi quy thường dùng có thể kể như: Linear Regression, Support
Vector Regression, Random Forest, BaggingRegressor, Multi-Layer Perceptron
Regression, …
1.3.2. Học không giám sát (Unsupervised Learning):
Một thuật tốn học máy từ các ví dụ đơn giản mà khơng có bất kỳ phản hồi liên

quan nào, hãy để thuật toán tự xác định các mẫu dữ liệu. Loại thuật tốn này có xu
hướng tái cấu trúc dữ liệu thành một thứ khác, chẳng hạn như các tính năng mới có thể
đại diện cho một lớp hoặc một loạt giá trị không tương quan mới. Chúng khá hữu ích
trong việc cung cấp cho con người những hiểu biết sâu sắc về ý nghĩa của dữ liệu và
các đầu vào hữu ích mới cho các thuật tốn học máy được giám sát. Là một loại học
tập, nó giống với các phương pháp con người sử dụng để tìm ra rằng các đối tượng hoặc
sự kiện nhất định thuộc cùng một lớp, chẳng hạn như cách quan sát mức độ giống nhau
giữa các đối tượng. Một số hệ thống đề xuất tìm thấy trên web dưới dạng tự động hóa
tiếp thị dựa trên loại hình học tập này.

9


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

1.3.3. Học tập tăng cường (Reinforcement Learning)
Khi trình bày thuật tốn với các ví dụ thiếu nhãn, như trong học khơng giám sát,
ta có thể kèm theo một ví dụ về phản hồi tích cực hoặc tiêu cực tùy theo giải pháp mà
thuật toán đề xuất, được kết nối với các ứng dụng mà thuật toán phải đưa ra quyết định
và các quyết định mang lại hậu quả. Trong thực tế, nó giống như học bằng cách thử và
sai.
1.4. Các thuật toán học máy
1.4.1 Artificial Neural Network (ANN)
1.4.1.1. Khái niệm
Mạng nơ-ron nhân tạo là một dạng của học có giảm sát (Supervised Learning)
được xây dựng giống như bộ não con người, với các nút nơ-ron kết nối với nhau giống
như một trang web. Bộ não con người có hàng trăm tỷ tế bào được gọi là tế bào thần
kinh. Mỗi tế bào thần kinh được tạo thành từ một cơ thể tế bào có nhiệm vụ xử lý thơng

tin bằng cách mang thông tin đến (đầu vào) và đi (đầu ra) từ não.
Một ANN có hàng trăm hoặc hàng nghìn tế bào thần kinh nhân tạo được gọi là
đơn vị xử lý, được kết nối với nhau bằng các nút (node). Các đơn vị xử lý này được tạo
thành từ các đơn vị đầu vào (Input) và đầu ra (Output). Các đơn vị đầu vào nhận được
nhiều dạng và cấu trúc thông tin khác nhau, dựa trên hệ thống trọng số nội bộ và mạng
nơ-ron cố gắng tìm hiểu về thơng tin được trình bày để tạo ra một báo cáo đầu ra. Giống
như con người, cần các quy tắc va hướng dẫn để đưa ra một kết quả hoặc đầu ra, ANN
cũng sử dụng một tập hợp các quy tắc học tập được gọi là backpropagation, một từ viết
tắt của sự lan truyền ngược của lỗi, để hoàn thiện kết quả đầu ra của chúng.
ANN đầu tiên trải qua giai đoạn đào tạo, nơi nó học cách nhận ra các mẫu trong
dữ liệu, dù là trực quan, âm thanh hay văn bản. Trong giai đoạn được giám sát này,
mạng so sánh sản lượng thực tế của nó được tạo ra với những gì nó dự kiến tạo ra - đầu
10


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

ra mong muốn. Sự khác biệt giữa cả hai kết quả được điều chỉnh bằng cách sử dụng
nhân giống ngược. Điều này có nghĩa là mạng hoạt động ngược, đi từ đơn vị đầu ra đến
các đơn vị đầu vào để điều chỉnh trọng lượng của các kết nối giữa các đơn vị cho đến
khi sự khác biệt giữa kết quả thực tế và mong muốn tạo ra sai số thấp nhất có thể.
Trong giai đoạn đào tạo và giám sát, ANN được dạy những gì cần tìm và kết quả
đầu ra của nó, sử dụng các loại câu hỏi có / khơng với số nhị phân

Hình 1.4. Sơ đồ khối của mạng nơ-ron nhân tạo
1.4.1.2. Kiến trúc của mạng nơ-ron nhân tạo (ANN)
Kiến trúc cở bản của một ANN gồm 3 lớp:
Lớp đầu vào: Các lớp Đầu vào chứa các tế bào thần kinh nhân tạo đó (được gọi

là đơn vị) để nhận đầu vào từ thế giới bên ngoài. Đây là nơi mà quá trình học thực tế
trên mạng diễn ra, hoặc việc nhận dạng xảy ra nếu khơng nó sẽ xử lý.
Lớp đầu ra: Các lớp đầu ra chứa các đơn vị phản hồi thông tin được đưa vào hệ
thống và cả việc nó có học được bất kỳ nhiệm vụ nào hay không.
Lớp ẩn: Các lớp ẩn nằm giữa các lớp đầu vào và các lớp đầu ra. Công việc duy
nhất của lớp ẩn là biến đổi đầu vào thành một thứ có ý nghĩa mà lớp / đơn vị đầu ra có
thể sử dụng theo một cách nào đó. Hầu hết các mạng nơ-ron nhân tạo đều được kết nối
11


GVHD: ThS. ĐẶNG THỊ THANH LÊ

TIỂU LUẬN TỐT NGHIỆP

với nhau, có nghĩa là mỗi lớp ẩn được kết nối riêng lẻ với các nơ-ron trong lớp đầu vào
của nó và cả với lớp đầu ra của nó. Điều này giúp cho q trình học tập hồn chỉnh và
việc học tập cũng diễn ra ở mức tối đa khi các trọng số bên trong mạng nơ-ron nhân tạo
được cập nhật sau mỗi lần lặp. (Jake Frankenfield, 2020)
1.4.2. Support Vector Regression (SVR)
SVR (Support Vector Regression) là một mơ hình hồi quy sử dụng thuật toán Support
Vector Machine (SVM, một thuật toán phân loại) để dự đoán giá trị của một biến liên
tục. Vì thế để dễ hiểu hơn về SVR thì nên tìm hiểu về SVM trước.
1.4.2.1 . Khái niệm SVM
Máy vectơ hỗ trợ (SVM) là phương pháp học có giám sát để phân tích dữ liệu và
nhận dạng các mẫu. SVM chủ yếu được sử dụng để phân loại, phân tích hồi quy và phát
hiện các thuộc tính mới. Đưa ra một tập dữ liệu huấn luyện trong một nhiệm vụ học tập
hai lớp, thuật toán huấn luyện SVM xây dựng một mơ hình hoặc hàm phân loại chỉ định
các quan sát mới cho một trong hai lớp ở hai bên của siêu phẳng, làm cho nó trở thành
bộ phân loại tuyến tính nhị phân khơng mang tính ngun tử (Hình 1-3). Mơ hình SVM
ánh xạ các quan sát dưới dạng các điểm trong không gian, sao cho chúng được phân loại

thành một phân vùng riêng biệt được chia theo khoảng cách lớn nhất đến điểm dữ liệu
quan sát gần nhất của bất kỳ lớp nào (lề chức năng). Các quan sát mới sau đó được dự
đốn thuộc về một lớp dựa trên phía nào của phân vùng mà chúng rơi vào. Các vectơ hỗ
trợ là các điểm dữ liệu gần nhất với siêu phẳng phân chia các lớp. (Mariette Awad và
cộng sự, 2015)

12


×