Tải bản đầy đủ (.pdf) (10 trang)

Nghiên cứu ứng dụng kỹ thuật trí tuệ nhân tạo dự báo áp lực tiền cố kết của đất yếu tại một số khu vực ở đồng bằng Bắc Bộ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.22 MB, 10 trang )

NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT TRÍ TUỆ NHÂN TẠO
DỰ BÁO ÁP LỰC TIỀN CỐ KẾT CỦA ĐẤT YẾU TẠI MỘT SỐ
KHU VỰC Ở ĐỒNG BẰNG BẮC BỘ
NGUYỄN ĐỨC MẠNH*, HỒ SỸ AN*
NGUYỄN HẢI HÀ*, PHẠM BÁ KHẢI*
NGUYỄN ĐÌNH TRUNG*, NGUYỄN ĐÌNH DŨNG*

Prediction of pre-consolidation pressure of soft soil using artificial
intelligence in some areas of northern delta Vietnam
Abstract: Pre-consolidation pressure (Pc) of soft soil in some areas Northern
Delta Vietnam has been predicted by using Artificial Intelligence - Machine
Learning through 3 models: Support Vector Regression (SVR), Artificial
Neural Network Mutilayer Perceptron (ANN MLP), Ridge Regression (RR).
Those models were built by Python programming language and Scikit-learn
software machine learning library. The data for this study is 159 soft soil
samples which were collected from the construction site and full of physicomechanical properties were achieved from experiments in laboratory at
provinces Quang Ninh, Hai Phong, Thai Binh, Nam Dinh, Ninh Binh and Hai
Duong. We use 15 physical properties of soil as inputs to analyze correlation
with Pc. After removing parameters which have a weak correlation with Pc, we
have 6 parameters which is strongly correlated with Pc: upper sampling depth
(m), lower sampling depth (m), clay content (%), liquidity index, specific
gravity (g/cm3), void ratio. For predicting Pc, the models were built with 70%
training set and 30% testing set. Performance of the models were validated by
using various statistical measures: Mean Absolute Error (MAE), Root Mean
Square Error (RMSE) Correlation coefficient (R) and Coefficient of
determination (R2). Results of predicting Pc models show that the performance
of the models using different methods is much different where R2-value varies
from 0.728 to 0.843. The present study suggested that the ANN-MLP model has
the highest predictive capability in 3 models: R2 = 0.843, MAE = 0.143, RMSE
= 0.187 and R=0.923.
Keywords: artificial neural network mutilayer perceptron (ANN MLP),


Artificial Intelligencemachine learning, ridge regression (RR), Preconsolidation pressure, soft soil, support vector regression (SVR).
1. ĐẶT VẤN ĐỀ *
Áp lực tiền cố kết (Pc) là áp lực hữu hiệu lớn
nhất trong quá khứ của lớp đất phủ mà mẫu đất
*

Tr ng Đ i học Giao thông vận tải
Số 3 phố Cầu Giấy, P.Láng Thượng, Q.Đống Đa, Hà N i.
Email: /


26

ở độ sâu nào đó phải chịu [1,2,21]. Đây là một
trong những thông số không thể thiếu khi dự
báo lún nền đất yếu cũng nhƣ phục vụ tính tốn
thiết kế giải pháp xử lý nền đất yếu dƣới tác
dụng tải trọng đắp, đặc biệt trong xây dựng
đƣờng giao thơng [1,2,21,24]. Để có chỉ tiêu
này, phổ biến hiện nay là tiến hành bằng thí
ĐỊA KỸ THUẬT SỐ 3 - 2021


nghiệm mẫu đất trong phòng đƣợc lấy từ các l
khoan khảo sát địa kỹ thuật. Tuy nhiên, phƣơng
pháp truyền thống này có một hạn chế nhƣ chi
phí cao hay kết quả thƣờng có sai số lớn khi
mẫu đất đƣợc lấy ở độ sâu lớn. Ngoài ra, chất
lƣợng bảo quản mẫu đất nguyên trạng, tay nghề
của những ngƣời thực hiện và độ tin cậy của

thiết bị thí nghiệm cũng ảnh hƣởng không nhỏ
đến kết quả xác định Pc.
Để thay thế cho các thí nghiệm trong phịng
truyền thống này, một vài mơ hình thuật tốn dựa
trên kinh nghiệm đã đƣợc phát triển nhằm dự
đốn Pc hay các thơng số đất nền khác [2].
Những mơ hình này cơ bản dựa trên việc cải tiến
phân tích hồi quy. Tuy nhiên, phƣơng pháp hồi
quy này thƣờng bị giới hạn bởi số lƣợng hạn chế
nhất định phƣơng trình tuyến tính hoặc phi tuyến.
Ngày nay, trí tuệ nhân tạo (Artificial
intelligent) hay máy học (Machine learning) đã
đƣợc áp dụng rộng rãi trong nhiều l nh vực bao
gồm cả địa k thuật nhƣ là nhận diện hay dự báo
trƣợt lở đất [3-7], dự đoán lũ lụt [8], đánh giá
tiềm năng nƣớc ngầm [9, 10] và dự đốn tính
chất vật liệu [11-20]. Trong nghiên cứu này, các
mơ hình thuật tốn SVR, ANN MLP và RR sử
dụng kết quả thí nghiệm gồm các chỉ tiêu vật lý
cơ bản của đất làm các biến đầu vào (X) để dự
báo áp lực tiền cố kết Pc của đất yếu (biến đầu
ra, Y) khu vực đồng bằng Bắc Bộ. Kết quả của
các mơ hình dự báo đƣợc kiểm tra, đánh giá
hiệu suất bằng các phƣơng pháp thống kê tiêu
chuẩn nhƣ giá trị trung bình của tổng các trị
tuyệt đối của sai số - Mean Absolute Error
(MAE); độ lệch tiêu chuẩn các sai số - Root
Mean Square Error (RMSE); hệ số tƣơng quan
R - Correlation coefficient (R); và hệ số xác
định - Coefficient of detemination (R2). Kết quả

nghiên cứu cho phép đề xuất một phƣơng pháp

mới có thể dự đốn P c với độ tin cậy cao từ các
thơng số vật lý có đƣợc từ những thí nghiệm của
các cơng trình thực tế, tiến tới xây dựng bộ dự
liệu lớn trong tƣơng lai về l nh vực này.
2. DỮ LIỆU VÀ THUẬT TOÁN SỬ
DỤNG DỰ BÁO
2.1. Dữ liệu sử dụng
Nghiên cứu này, bộ số liệu với đầy đủ các
chỉ tiêu cơ lý xác định trong phịng thí nghiệm
sử dụng làm dữ liệu xây dựng mơ hình dự báo
từ 159 mẫu đất yếu là bùn sét pha hay sét pha
trạng thái chảy đƣợc thu thập từ các cơng trình
thực tế tin cậy thực hiện bởi các đơn vị uy tín
nhƣ TEDI-HECO, TEDI-GIC, CIENCO1… kết
hợp một số mẫu thí nghiệm kiểm chứng bổ sung
đƣợc lấy tại một số khu vực trung vùng nghiên
cứu. Các thông số này đƣợc coi là các biến đầu
vào độc lập cho máy học, tƣơng ứng X1, X2,
X3, X4, X5, X6, X7, X8, X9, X10, X11, X12,
X13, X14, X15 nhằm xác định biến đầu ra phụ
thuộc Pc (Y) (kPa) (Bảng 1). Các thông số của
đất đƣợc xem xét sử dụng phân tích trong bài
báo này bao gồm: độ sâu lấy mẫu trên và dƣới
(X1, X2, m), hàm lƣợng hạt sét (X3, %), hàm
lƣợng hạt bụi (X4, %), giới hạn chảy (X5, %),
giới hạn dẻo (X6, %), chỉ số dẻo (X7, %), độ sệt
(X8), độ ẩm (X9, %), khối lƣợng thể tích tự
nhiên (X10, g/cm3), khối lƣợng thể tích khơ

(X11, g/cm3), khối lƣợng riêng hạt (X12,
g/cm3), độ r ng (X13, %), độ bão hòa (X14, %),
hệ số r ng (X15). Thông số dự báo là áp lực tiền
cố kết (Y, kPa). Bộ dữ liệu này đƣợc chia ngẫu
nhiên thành hai phần là tập dữ liệu học lấy 70%,
dùng để tập luyện cho máy và tập dữ liệu kiểm
tra sử dụng 30% còn lại nhằm đánh giá hiệu suất
mơ hình. Các mơ hình này đƣợc xây dựng trên
ngơn ngữ lập trình Python và thƣ viện h trợ
Scikit-learn.

Bảng 1: Dữ liệu đầu vào và đầu ra sử dụng trong nghi n cứu nà
STT
1
2

Thông số
X1
X2

Giá trị lớn nhất Giá trị nhỏ nhất
35,4
0,5
36
1,5

ĐỊA KỸ THUẬT SỐ 3 - 2021

Trung bình
10,76

11,31465

Độ lệch ti u chuẩn
7,129003
7,090925

27


STT
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Thơng số
X3
X4
X5
X6

X7
X8
X9
X10
X11
X12
X13
X14
X15
Y

Giá trị lớn nhất Giá trị nhỏ nhất
69
4,5
84,9
18
77
21,71
39,96
13,08
47,15
6,11
1,94
0,16
70,65
22,12
2,04
1,52
1,67
0,91

2,76
2,65
66,3
37,23
99,97
84,11
1,967
0,593
282,24
20,58

Phân tích phân phối 159 mẫu cho 15 thông số
là các biến đầu vào (X1-X15) và biến đầu ra (Y)
cho thấy, các thông số cơ lý của các mẫu đất biến
thiên trong khoảng giá trị rất khác nhau (bảng 1 và

Độ lệch ti u chuẩn
11,17561
13,59445
12,17120
5,296375
8,561346
0,280667
11,48550
0,113142
0,175484
0,022413
6,479979
2,758104
0,315885

0,549973

hình tiêu biểu 1, 2, 3, 4). Độ lệch tiêu chuẩn lớn
nhất thuộc về thông số hàm lƣợng hạt bụi (X4, độ
lệch tiêu chuẩn 13,59445), nhỏ nhất là khối lƣợng
riêng hạt (X12, độ lệch tiêu chuẩn 0,022413).

Hình 1: Biểu đồ biến thiên giá trị
của độ sâu lấy mẫu trên

Hình 2: Biểu đồ biến thiên giá trị của
hàm l ng h t sét

Hình 3: Biểu đồ biến thiên giá trị của độ sệt

Hình 4: Biểu đồ biến thiên của giá trị Pc
t kết quả thí nghiệm mẫu đất

2.2. Cơng cụ và thuật tốn sử dụng
Ngơn ngữ lập trình Python và th viện mở
Scikit-learn:
28

Trung bình
26,96541
53,05535
51,09472
26,06862
25,02673
0,857799

46,78126
1,735094
1,194969
2,698176
55,71277
96,79566
1,303403
90,12923

Python là một ngơn ngữ lập trình thơng dịch
(interpreted), hƣớng đối tƣợng (object-oriented),
và là một ngơn ngữ bậc cao (high-level) ngữ
ĐỊA KỸ THUẬT SỐ 3 - 2021


ngh a động (dynamic semantics).. Trình thơng
dịch Python và thƣ viện chuẩn mở rộng có sẵn
dƣới dạng mã nguồn hoặc dạng nhị phân miễn
phí cho tất cả các nền tảng chính và có thể đƣợc
phân phối tự do [18, 23, 25, 27, 29]. Cùng với
đó, Scikit-learn là một thƣ viện tài nguyên mở
dùng cho máy học, cung cấp nhiều công cụ
dùng cho làm khớp mơ hình (model fitting), tiền
xử lý dữ liệu (data preprocessing), lựa chọn mơ
hình và nhiều tiện ích khác [23,25].
Thuật toán hỗ tr hồi qui V c tơ (Support
Vector Regression - SVR):
H trợ hồi qui Véc tơ (Support Vector
Regression - SVR) dựa trên lý thuyết học thống
kê lần đầu tiên đƣợc giới thiệu bởi Vapnik vào

năm 1995 [13, 28, 30]. Nguyên tắc của SVR là
xây dựng một mặt siêu phẳng (hyper plane) để

phân loại tập dữ liệu thành các lớp riêng biệt
[25]. Bằng cách sử dụng “kernal” phi tuyến
SVR ánh xạ không gian đầu vào sang không
gian nhiều chiều hơn [26]. Sau đó, siêu phẳng
tối ƣu đƣợc xác định trong không gian đặc trƣng
(feature space) bằng cách tối đa hóa biên của
ranh giới các lớp (margins of class boundaries)
[28]. Các điểm đƣợc huấn luyện (trained points)
gần nhất với mặt siêu phẳng tối ƣu đƣợc gọi là
các véc tơ h trợ (support vectors). SVR đƣợc
coi là một trong những kỹ thuật lập mơ hình
chính xác nhất và cũng đƣợc sử dụng rộng rãi
trong dự báo sụt trƣợt đất đá. Nghiên cứu này sử
dụng SVR nhƣ một kỹ thuật hồi quy bằng cách
đề xuất một hàm mất mát (loss function) εkhơng nhạy cảm (ε-insensitive) đƣợc thể hiện
trong phƣơng trình sau:

Dữ liệu học đƣợc đƣa vào dạng (xi, yi), x ∈
rN, y ∈ r, trong đó x biến đầu vào, y biến đầu
ra; rN = N là chiều không gian véc tơ (N dimensional vector space); r - một chiều không
gian véc tơ (r - one dimensional vector space)
và ε = vùng l i nhạy cảm (error insensitive
zone) (hình 5). Thuật tốn SVR cho phép xác
định một hàm có thể ƣớc tính các giá trị trong
tƣơng lai một cách chính xác [28,30]. Thuật
toán hồi quy h trợ véc tơ cho phép hồi quy hàm
tuyến tính đƣợc thể hiện trong phƣơng trình sau:


Trong đó w ∈ rN và b ∈ r; w = véc tơ trọng
số có thể hiệu chỉnh (adjustable weight vector); và
b = ngƣỡng vô hƣớng (scalar threshold). Để độ
dốc (slope) của hàm gần đến 0, giá trị của w phải
đƣợc tối thiểu hóa. Điều này có thể đạt đƣợc bằng
cách tối thiểu hóa norm ‖w‖2 = 〈w,w〉. Đây là
một bài toán tối ƣu lồi (convex optimization) đƣợc
thể hiện trong phƣơng trình sau:
(3)
Với:

(2)

Hình 5: Sơ đồ nguyên lý thuật toán SVR
giải quyết bài toán hồi quy [26]
ĐỊA KỸ THUẬT SỐ 3 - 2021

Mạng nơ ron nh n tạo đa lớp (Artificial N ural
Network Mutilayer Perceptron - ANN MLP):
Mạng nơ ron nhân tạo (ANN) là một tập hợp
của các nút đƣợc liên kết với nhau nhằm giải
thích và giải quyết các vấn đề có mối quan hệ
phức tạp giữa các biến độc lập đầu vào và biến
phụ thuộc đầu ra [25]. Mạng perceptron đa lớp
(Mutilayer Perceptron - MLP) là một trong
những mạng nơ ron nhân tạo, hay một trong
những kỹ thuật mạng nơ ron nhân tạo hiệu quả
29



nhất trong mơ hình và dự đốn đối tƣợng. Do đó
nó đƣợc sử dụng nhƣ một mơ hình chuẩn của
nhiều nhà nghiên cứu [25,27]. ANN MLP có
khả năng mơ phỏng các quá trình phi tuyến và
phức tạp của thế giới thực. Về cơ bản, có thể nói
ANN MLP là một mơ hình chuyển tiếp bao gồm
một lớp đầu vào, một hay nhiều lớp ẩn và một
lớp đầu ra nhƣ trên hình 6.

Mơ hình Ridge Regression (RR) là phƣơng
pháp áp dụng khi bộ dữ liệu gặp vấn đề về đa
cộng tuyến các biến độc lập x có mối liên hệ với
nhau, và ảnh hƣởng lên kết quả dự báo của y,
hay giải quyết các vấn đề về Overfifting (mơ
hình áp dụng tốt cho dữ liệu học (training)
nhƣng không hoạt động tốt trên dữ liệu kiểm tra
(test) mà mơ hình hồi quy tuyến tính thơng
thƣờng gặp phải [26,28].

Hình 7: Mối qua hệ đánh đổi giữa bias
và variance [27]
Hình 6: Minh họa một mơ hình ANN MLP
với 2 lớp ẩn [25]
Số lƣợng của các nút đầu vào phụ thuộc và
các thông số đƣợc lựa chọn trong nguồn dữ liệu
sử dụng để dự báo, và số lƣợng của số nơ ron ẩn
đƣợc xác định dựa trên tập dữ liệu dùng cho
máy học trong từng trƣờng hợp cụ thể. Số lƣợng
lớp ẩn đƣợc sử dụng cho tính tốn và lớp đầu ra

đại diện cho mục đích của mơ hình. M i nút của
lớp ẩn phải kết nối với tất cả các nút của lớp đầu
vào, và m i nút của lớp đầu ra phải đƣợc kết nối
với tồn bộ nút trong các lớp ẩn. Thơng qua các
liên kết này, quá trình hoạt động của ANN MLP
có thể chia ra hai bƣớc: truyền thẳng và truyền
ngƣợc sử dụng thuật toán truyền ngƣợc [25].
Trong nghiên cứu này, để dự báo Pc sử dụng
thuật tốn ANN MLP có 2 lớp ẩn với số nút lần
lƣợt trong m i lớp ẩn là 8, 10 và sử dụng hàm
kích hoạt Sigmoid.
Thuật toán hồi quy s n b n Ridge
Regression - RR):
30

RR là mơ hình hồi quy phân tích mối quan hệ
giữa các biến độc lập và biến phụ thuộc sử dụng
phƣơng pháp Regularization, điều chỉnh mơ
hình sao cho giảm thiểu các vấn đề Overfitting,
tối ƣu hay kiểm soát mức độ phức tạp của mơ
hình để cân đối giữa Thiên vị (Biased) và
Phƣơng sai (Variance), qua đó giảm sai số của
mơ hình. Do vậy, trong nghiên cứu này nhóm
tác giả sử dụng mơ hình hồi quy sƣờn bên
(Ridge Regression) vào việc dự báo áp lực tiền
cố kết Pc của đất yếu khu vực nghiên cứu.
3. LỰA CHỌN THÔNG SỐ ĐẦU VÀO
ĐỂ DỰ BÁO PC
Tổng cộng 15 thông số đầu vào là các chỉ
tiêu vật lý của 159 mẫu đất yếu xác định từ thí

nghiệm trong phịng đƣợc lựa chọn (X1-X15).
Tuy nhiên chỉ có một số biến đầu vào có mối
quan hệ chặt chẽ với thông số cần dự báo Pc (kết
quả đầu ra, hay biến đầu ra Y). Thơng qua q
trình xác định mức độ tƣơng quan giữa 15 chỉ
tiêu vật lý của đất với áp lực tiền cố kết bằng
ĐỊA KỸ THUẬT SỐ 3 - 2021


thống kê toán học, cho phép loại bỏ những biến
(chỉ tiêu vật lý) ít hoặc khơng có quan hệ chặt
với kết quả đầu ra – biến đầu ra (Pc). Các làm
này cho phép rút ngắn thời gian xử lý của mơ
hình và đồng thời hiệu suất của mơ hình dự báo
cũng sẽ đƣợc cải thiện.
Sử dụng công cụ “cây hồi qui bổ sung”
(Extra Trees Regressor) của thƣ viện Scikitlearn nhằm tạo ra biểu đồ thể hiện trực quan
mức độ quan trọng của các biến độc lập X đối
với biến phụ thuộc Y (Pc) trong mơ hình dự báo
(hình 8).

nhiễu (159 mẫu đất có các chỉ tiêu thí nghiệm
trong phịng tạo ra 15 thông số đầu vào từ X1
đến X15 là các chỉ tiêu vật lý của đất và biến
đầu ra phụ thuộc Y (Pc)); (2) Loại bỏ các biến
độc lập có mối quan hệ khơng chặt với biến phụ
thuộc Y (từ 15 biến X ban đầu, sau xử lý rút
xuống cịn 6 biến X) (hình 8); (3) Tiến hành
máy học bằng các thuật tốn trí tuệ nhân tạo lựa
chọn nghiên cứ để dự đốn Pc, đánh giá hiệu

suất các mơ hình dựa vào các thơng số RMSE,
MAE, R và R2.

Hình 9: Sơ đồ xây dựng mơ hình máy học để
dự báo Pc
4.2. Đánh giá hiệu suất mơ hình
Hình 8: Mức độ t ơng quan của biến độc lập
(Xi đối với biến ph thuộc (Y - Pc) sử d ng
công c Extra Trees Regressor
Hình 8 cho thấy, kết quả máy học chỉ ra đƣợc
6 biến độc lập có mối quan hệ chặt chẽ nhất với
Pc gồm: X1, X2, X8, X3, X15 và X12, tƣơng
ứng là độ sâu lấy mẫu đất trên (m), độ sâu lấy
mẫu đất dƣới (m), và các chỉ tiêu vật lý của đất
thí nghiệm trong phịng nhƣ độ sệt, hàm lƣợng
hạt sét (%), khối lƣợng riêng hạt (g/cm3) và hệ
số r ng của đất.
4. THIẾT LẬP MƠ HÌNH VÀ ĐÁNH
GIÁ HIỆU SUẤT MƠ HÌNH
4.1. Thiết lập mơ hình
Trong nghiên cứu này, nhóm nghiên cứu
thực hiện 3 bƣớc cho mơ hình máy học với các
thuật tốn trí tuệ nhân tạo lựa chọn để dự báo P c
của đất yếu khu vực nghiên cứu nhu hình 9,
gồm: (1) Chuẩn bị và tiền xử lý số liệu, loại bỏ
ĐỊA KỸ THUẬT SỐ 3 - 2021

Một mơ hình đƣợc đánh giá tốt khi sử dụng
các biến đầu vào X i cho ra các giá trị dự báo
Ypred sát với giá trị của thực tế đã xác định

Ytest [27,28,30]. Để đánh giá hiệu suất của các
mơ hình máy học, ở đây sử dụng các thông số
(1) Root Mean Square Error (RMSE), (2)
Mean Absolute Error (MAE), (3) Coefficient
of

Determine

(R2 )



(4)

Correlation

Coefficient (R).
RMSE thể hiện độ lệch tiêu chuẩn các sai số
của mơ hình dự đốn. Nó đƣợc xác định thơng
qua cơng thức [11]:
;
trong đó m là số lƣợng mẫu kiểm tra, ytest là
giá trị đúng đã xác định của y, ypred là giá trị do
mơ hình dự đốn.
MAE là giá trị trung bình của tổng các trị
31


tuyệt đối của sai số mà mơ hình dự đốn, đƣợc
xác định thơng qua cơng thức [29,30]:

; trong đó m
là số lƣợng mẫu kiểm tra, ytest là giá trị đúng
đã xác định của y, ypred là giá trị do mô hình
dự đốn.
Hệ số xác định R2 là một thơng số biến đổi từ
0 đến 1 nhằm thể hiện hiệu suất của mơ hình dự
đốn [28]. Nó đƣợc xác định thơng qua cơng
thức:

; trong đó m

;
trong đó m là số lƣợng mẫu kiểm tra, ytest là giá
trị đúng của y, ypred là giá trị do mơ hình dự
đốn,
là giá trị trung bình của các mẫu
kiểm tra,
là giá trị trung bình của các mẫu
dự đoán.
5. KẾT QUẢ DỰ BÁO ÁP LỰC TIỀN CỐ
KẾT VÀ PHÂN TÍCH
Sử dụng 3 mơ hình thuật tốn SVR, ANN
MLP và RR nhƣ đã giới thiệu trên, với bộ số

là số lƣợng mẫu kiểm tra, ytest là giá trị đúng đã

liệu sau chuẩn hóa gồm 6 biến độc lập (X1,

xác định của y, ypred là giá trị do mơ hình dự
đốn,

là giá trị trung bình của các mẫu

X2, X3, X8, X12, X15) có tƣơng quan chặt

kiểm tra.

máy học đã xây dựng nhƣ trình bày trên hình

với P c và tiến hành dự báo theo sơ đồ mơ hình

Hệ số tƣơng quan R đánh giá tƣơng quan

9, cho phép dự báo đƣợc P c. Kết quả dự báo

giữa hai biến số trong quan hệ [30]. R đƣợc thể

áp lực tiền cố kết P c của đất yếu khu vực

hiện thông qua công thức sau:

nghiên cứu đƣợc so sánh với giá trị thực tế thí
nghiệm (hình 10, 11 và 12).

Hình 10: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mơ hình thuật tốn SVR

Hình 11: So sánh giá trị dự đốn với giá trị thật của Pc khi sử d ng mô hình thuật tốn ANN MLP

32

ĐỊA KỸ THUẬT SỐ 3 - 2021



Hình 12: So sánh giá trị dự đốn với giá trị thật của Pc khi sử d ng mơ hình thuật toán RR
Biểu đồ biến thiên kết quả dự báo Pc so với
giá trị thực thí nghiệm khá tƣơng đồng về hình
thái, về trị số thậm chí trùng khớp nhau (hình 10,
11, 12). Kết quả đánh giá hiệu suất các mơ hình
sử dụng trong nghiên cứu này thu đƣợc giá trị tốt
với tất cả các mơ hình thuật tốn trí tuệ nhân tạo

dự báo đã sử dụng, cụ thể: Khi dự báo Pc bằng
mơ hình SVR thì MAE=0,171, RMSE=0,231,
R=0,873, R2=0,760; với mơ hình ANN MLP thì
MAE=0,143, RMSE=0,186, R=0,923, R2=0,843;
cịn mơ hình RR có MAE=0,193, RMSE=0,246,
R=0,856, R2=0,728 (bảng 2).

Bảng 2: So sánh hiệu suất các mơ hình thuật tốn AI sử dụng dự báo Pc.
STT
1
2
3

Mơ hình
SVR
ANN MLP
RR

RMSE
0,171

0,143
0,193

Bảng 2 cho thấy, kết quả đánh giá hiệu suất
dự báo của các mơ hình trí tuệ nhân tạo sử
dụng trong nghiên cứu này RMSE, MAE, R
hay R2 đều có giá trị rất tích cực, chứng tỏ
đƣợc độ tin cậy cao khi dự báo P c thông qua
một số chỉ tiêu vật lý dễ xác định khác đã có
nhƣ: độ sâu lấy mẫu đất; hàm lƣợng hạt sét
trong đất; độ sệt của đất; khối lƣợng riêng và
hệ số r ng của đất.
Phân tích hệ số xác định R2, kết quả của các
mẫu kiểm tra thay đổi từ 0,728 đến 0,843. Kết
quả này cho thấy rằng, độ chính xác của cả 3
mơ hình thuật tốn AI đã sử dụng trong dự đoán
Pc của đất yếu một số khu vực đồng bằng Bắc
Bộ ở mức khá tốt, và mơ hình RR có độ chính
xác thấp nhất trong nghiên cứu này (R2=0,728),
trong khi đó mơ hình ANN-MLP đạt hiệu suất
cao nhất trong dự đoán Pc (R2=0,843).
6. KẾT LUẬN
Áp lực tiền cố kết (Pc) của đất yếu là thông
số đất nền không thể thiếu, đƣợc sử dụng để lựa
chọn cơng thức khi phân tích lún cố kết nền đất
yếu dƣới tác dụng tải trọng đắp. Nó thƣờng
đƣợc xác định bằng đồ giải theo Casagrande từ
ĐỊA KỸ THUẬT SỐ 3 - 2021

MAE

0, 31
0,186
0,246

R
0,873
0,923
0,856

R2
0,760
0,843
0,728

thí nghiệm nén cố kết mẫu đất trong phịng với
chi phí khá tốn kém và phức tạp. Để thay thế
việc thí nghiệm này, một trong 3 mơ hình thuật
tốn trí tuệ nhân tạo SVR, ANN-MLP và RR
hồn tồn có thể sử dụng để dự báo tốt đƣợc P c
của đất yếu.
Kết quả nghiên cứu chỉ ra rằng, mô hình
ANN-MLP có khả năng dự đốn áp lực tiền cố
kết Pc của đất yếu tại một số khu vực ở đồng
bằng Bắc Bộ là tốt nhất (R2=0,843), trong khi
các mô hình cịn lại cũng thể hiện khả năng dự
đốn khá tốt.
Với việc khai thác các nguồn số liệu khảo sát
đất nền từ các cơng trình thực tế nhiều năm qua,
việc ứng dụng kỹ thuật trí tuệ nhân tạo để dự
báo áp lực tiền cố kết của đất yếu nói riêng, các

thơng số đất nền quan trọng nói chung có thể
xem nhƣ một công cụ thay thế hiệu quả và đầy
triển vọng nhằm giảm thời gian, chi phí và sai
số do phải thí nghiệm xác định chúng trên từng
mẫu đất. Dựa trên kết quả của nghiên cứu này,
có thể đề xuất rằng, cả 3 mơ hình thuật tốn
SVR, ANN-MLP và RR đều có thể sử dụng là
cơng cụ hữu dụng trong dự đoán Pc của đất yếu,
33


tƣơng ứng các thông số vật lý quan trọng để dự
đoán Pc gồm: độ sâu lấy mẫu, hàm lƣợng hạt sét,
độ sệt, khối lƣợng riêng và hệ số r ng.
LỜI CẢM ƠN
Nghiên cứu này đƣợc thực hiện với nguồn
kinh phí đƣợc cấp từ Bộ Giáo dục và Đào tạo
thông qua đề tài mã số B2020-GHA-03 do
trƣờng Đại học Giao thông vận tải chủ trì. Các
tác giả xin trân trọng cảm ơn sự h trợ của Vụ
Khoa học công nghệ và Môi trƣờng (Bộ Giáo
dục và Đào tạo), trƣờng Đại học Giao thông vận
tải và các đơn vị đã h trợ số liệu phục vụ cho
nghiên cứu.
TÀI LIỆU THAM KHẢO
[1]. A. Casagrande (1936), “The determination
of the pre-consolidation load and its practical
significance”, Proceedings of the 1st International
Conference on Soil Mechanics, Harvard, Vol. 3.
[2]. B. M. Das and K. Sobhan (2013),

“Principles of Geotechnical Engineering”,
Cengage Learning, 726p.
[3]. B.T. Pham (2018), “A novel classifier
based on composite hyper-cubes on iterated
random projections for assessment of landslide
susceptibility”, Journal of the Geological Society
of
India,
Volume
91,
pp.355-362.
/>[4]. B.T. Pham, I. Prakash, K. Khosravi, K.
Chapi, P.T. Trinh, and T.Q. Ngo (2018), “A
comparison of Support Vector Machines and
Bayesian algorithms for landslide susceptibility
modelling”, Journal Geocarto International. 34,
pp.
1385-1407.
/>10106049.2018.1489422.
[5]. P.T. Nguyen, T.T. Tuyen, A. Shirzadi,
B.T. Pham, H. Shahabi, and E. Omidvar (2019),
“Development of a Novel Hybrid Intelligence
Approach for Landslide Spatial Prediction”,
Applied Sciences (Basel), vol. 9, p. 2824.
/>[6]. Q. He, Z. Xu, S. Li, R. Li, S. Zhang, and
N. Wang (2019), “Novel Entropy and Rotation
Forest-Based Credal Decision Tree Classifier for
Landslide Susceptibility Modeling”, Entropy
(Basel), vol. 21, p. 106. />10.3390/e21020106.
34


[7]. Jie Dou, Ali P. Yunus, Yueren Xu,
Zhongfan Zhu, Chi-Wen Chen, Mehebub Sahana,
Khabat Khosravi, Yong Yang & Binh Thai Pham
(2019), “Torrential rainfall-triggered shallow
landslide characteristics and susceptibility
assessment using ensemble data-driven models in
the Dongjiang Reservoir Watershed, China”,
Natural Hazards, volume 97, pp.579–609.
/s11069-019-03659-4.
[8]. K. Khosravi, B.T. Pham, K. Chapi, A.
Shirzadi, H. Shahabi, I. Revhaug, I. Prakash,
and D. Tien Bui (2018), “A comparative
assessment of decision trees algorithms for
flash flood susceptibility modeling at Haraz
watershed, northern Iran”, Sci. Total Environ.,
vol. 627, pp.744-755. [PMID: 29426199]
j.scitotenv.2018.01.266.
[9]. B.T. Pham, A. Jaafari, I. Prakash, S.K.
Singh, N.K. Quoc, and D.T. Bui (2019), “Hybrid
computational
intelligence
models
for
groundwater potential mapping”, Catena, vol.182,
.104101.
/>.catena.
2019.104101.
[10]. S. Miraki, S.H. Zanganeh, K. Chapi, V.P.
Singh, A. Shirzadi, and H. Shahabi (2019),

“Mapping groundwater potential using a novel
hybrid intelligence approach”, Water Resour.
Manage.,
vol.
33,
pp.
281-302.
/>[11]. D.C. Camilo, L. Lombardo, P.M. Mai, J.
Dou, and R. Huser (2017), “Handling high
predictor dimensionality in slope-unit-based
landslide susceptibility models through LASSOpenalized Generalized Linear Model”, Environ.
Model. Softw., vol. 97, pp. 145-156.
/>[12]. J. Dou, K-T. Chang, S. Chen, A.P.
Yunus, J-K. Liu, and H. Xia (2015), “Automatic
case-based reasoning approach for landslide
detection: integration of object-oriented image
analysis and a genetic algorithm”, Remote Sens.,
vol. 7, pp. 4318-4342. />10.3390/rs70404318.
[13]. B.T. Pham, T-A. Hoang, D-M. Nguyen,
and D.T. Bui (2018), “Prediction of shear strength
of soft soil using machine learning methods”,
Catena,
vol.
166,
pp.
181-191.
catena. 2018.04.004.
ĐỊA KỸ THUẬT SỐ 3 - 2021



[14]. P.G. Asteris, K.G. Kolovos, A.
Athanasopoulou,
V.
Plevris,
and
G.
Konstantakatos (2019), “Investigation of the
mechanical behaviour of metakaolin-based
sandcrete mixtures”, Eur. J. Environ. Civ. Eng.,
vol. 23, pp. 300-324. />19648189.2016.1277373.
[15]. P.G. Asteris, and K.G. Kolovos (2019),
“Self-compacting concrete strength prediction
using surrogate models”, Neural Comput. Appl.,
vol. 24, No. 2, pp. 137-150. />10.1007/s00521-017-3007-7.
[16]. P.G. Asteris, A. Moropoulou, A.D.
Skentou, M. Apostolopoulou, A. Mohebkhah, and
L. Cavaleri (2019), “Stochastic Vulnerability
Assessment of Masonry Structures: Concepts,
Modeling and Restoration Aspects”, Appl. Sci.
(Basel), vol. 9, p. 243. />10.3390/app9020243.
[17]. H. Chen, P.G. Asteris, D. Jahed
Armaghani, B. Gordan, and B.T. Pham (2019),
“Assessing dynamic conditions of the retaining
wall: Developing two hybrid intelligent
models”, Appl. Sci. (Basel), vol. 9, p. 1042.
10.3390/ app9061042.
[18]. P. Sarir, J. Chen, P.G. Asteris, D.J.
Armaghani, and M. Tahir (2019), "Developing
GEP tree-based, neuro-swarm, and whale
optimization models for evaluation of bearing

capacity of concrete-filled steel tube columns",
Eng. Comput., pp. 1-19. />10.1007/s00366-019-00808-y.
[19]. V. Rodriguez-Galiano, M. SanchezCastillo, M. Chica-Olmo, and M. Chica-Rivas
(2015), “Machine learning predictive models for
mineral prospectivity: An evaluation of neural
networks, random forest, regression trees and
support vector machines”, Ore Geol. Rev., vol. 71,
pp.
804-818.
/>10.1016/j.oregeorev.2015.01.001.
[20]. A. Trigila, C. Iadanza, C. Esposito, and
G. Scarascia-Mugnozza (2015), “Comparison of
Logistic Regression and Random Forests
techniques for shallow landslide susceptibility
assessment in Giampilieri (NE Sicily, Italy)”,
Ng

Geomorphology, vol. 249, pp. 119-136.
/>[21]. B.M. Das (2007), “Principles of
geotechnical engineering”, Thomson, 666p.
[22]. B. Sharma, and P.K. Bora (2003),
“Plastic limit, liquid limit and undrained shear
strength of soil – reappraisal”, J. Geotech.
Geoenviron. Eng., vol. 129, pp. 774-777.
/>[23]. Manh Duc Nguyen, Binh Thai Pham, Tran
Thi Tuyen, Hoang Phan Hai Yen, Indra Prakash,
Thanh Tien Vu, Kamran Chapi, Ataollah Shirzadi,
Himan Shahabi, Jie Dou, Nguyen Kim Quoc and
Dieu Tien Bui (2019), “Development of an Artificial
Intelligence

Approach
for
Prediction
of
Consolidation Coefficient of Soft Soil: A Sensitivity
Analysis”, The Open Construction and Building
Technology Journal, Volume 13, pp.178-188.
10.2174/ 1874836801913010178.
[24]. J. A. Knappett and R. F. Craig (2012),
“Craig’s Soil Mechanics”, CRC Press, 584p.
[25]. />[26]. Debasish Basak, Srimanta Pal and Dipak
Chandra Patranabis (2007), “Support vector
regression”, Neural Information Processing –
Letters and Reviews, Vol. 11, No. 10, pp.203.
[27]. Binh Thai Pham, Manh Duc Nguyen,
Kien-Trinh Thi Bui, Indra Prakashd, Kamran
Chapie, Dieu Tien Bui (2019), “A novel artificial
intelligence approach based on Multi-layer
Perceptron Neural Network and Biogeographybased Optimization for predicting coefficient of
consolidation
of
soil”,
CATENA, Vol. 166. pp.181-191, />10.1016/j.catena.2018.04.004.
[28]. />[29]. Michael Bowles (2015), “Machine Learning
in Python”, John Wiley & Sons, Inc, 360p.
[30]. Sebastian Raschka and Vahid Mirjalili
(2017), “Machine Learning and Deep Learning
with Python, scikit-learn, and TensorFlow”, Packt
Publishing, 622p.


i phản biện: TS. NGUYỄN HIẾU CƢỜNG

ĐỊA KỸ THUẬT SỐ 3 - 2021

35



×