BỘ GIÁO DỤC VÀ ĐÀO TẠO
PHÂN HIỆU TRƯỜNG ĐẠI HỌC GIAO THƠNG VẬN TẢI
TẠI THÀNH PHỐ HỒ CHÍ MINH
KHOA CƠNG TRÌNH - BỘ MƠN CẦU HẦM
TIỂU LUẬN
CẦU HIỆN ĐẠI
GVHD : TS. NGUYỄN THẠC QUANG
THỰC HIỆN: NHÓM 6
LỚP: KTXDCTGT K27.2
TP. HỒ CHÍ MINH – 08/2020
CẦU HIỆN ĐẠI
DANH SÁCH NHÓM
1. Lê Đăng Khoa
2. Phan Ngọc Anh Khoa
3. Trần Văn Giáp
4. Lê Sỹ Cường
5. Võ Phú Tồn
6. Phan Đình Phùng
CẦU HIỆN ĐẠI
PHƯƠNG PHÁP TIẾP CẬN DỮ LIỆU LỚN ĐỂ RA QUYẾT ĐỊNH
TRONG BẢO TRÌ CƠNG TRÌNH CẦU
Tóm tắt. Hệ thống quản lý cầu Đài Loan (TBMS) bắt đầu trực tuyến từ năm 2000 và tổng
số lượng hàng tồn kho là 33.275 bao gồm tất cả các loại cầu và cống . Hiện tại , số lượng
trường trong tất cả các bảng trong cơ sở dữ liệu của TBMS là khoảng 6.500 với hơn 3,4
triệu bảng ghi dữ liệu trong cơ sở dữ liệu của nó . Có hơn 11.200 cây cầu đã hơn 20 năm
tuổi và 9.300 cây cầu khác chưa rõ năm xây dựng trong TBMS. Các cây cầu ở Đài Loan đã
bước vào giai đoạn cần bảo dưỡng thường xuyên . Do đó nghiên cứu này nhằm mục đích
phân tích cơ sở dữ liệu trong TBMS bằng cách sử dụng phân tích nhân tố khám phá để xác
định chiến lươc bảo trì cho những cây cầu này . Bài báo này mô tả kết quả của những nổ
lực nghiên cứu của năm đầu tiên . Các tài liệu liên quan về bảo trì cầu . Các khái niệm , lý
thuyết và phần mềm có sẵn để phân tích “ Dữ liệu lớn “ cũng được giới thiệu .
1.1. GIỚI THIỆU
Hệ thống Quản lý Cầu Đài Loan (TBMS) đã trực tuyến từ năm 2000 [1]. Khoảng không
quảng cáo của nó bao gồm 28.365 cây cầu với 6.524 thuộc tính trong tất cả các bảng và
tổng lượng bản ghi dữ liệu là 3.457.274, tăng 15.000 bản ghi hàng năm. Trong số các thuộc
tính này, có 475 thuộc tính chứa thông tin quản lý hạt nhân của một cầu nối như dữ liệu
kiểm kê, kết quả kiểm tra và hồ sơ sửa chữa. Do đó, các cơ sở dữ liệu trong TBMS đã đáp
ứng định nghĩa của “Dữ liệu lớn”.
Bảng 1.1. Cơ quan quản lý tuổi của mổi cơ quan quản lý.
Bản thảo nhận được ngày 11 tháng 7 năm 2015; sửa đổi ngày 12 tháng 1 năm 2016
Phân bố tuổi của các cây cầu trong TBMS được thể hiện trong Bảng 1. Có 11.263 cây cầu
trên 20 năm tuổi và Hình 1 cho thấy số lượng các bộ phận của cầu được cho là cần thiết
cho các hoạt động bảo trì. Số lượng các thành phần bị hư hỏng nghiêm trọng vẫn tăng dần,
NGƯỜI DỊCH: LÊ ĐĂNG KHOA - KTXDCTGT K27.2
1
CẦU HIỆN ĐẠI
mặc dù các hoạt động bảo trì đã được các cơ quan có trách nhiệm xúc tiến đối với nhiều
thành phần như vậy.
Hình 1.1. Số lượng các thành phần cầu cần hành động bảo trì.
Do ngân sách hạn hẹp, đặc biệt là đối với chính quyền địa phương, việc ưu tiên bảo trì cầu
ln là nhiệm vụ khó khăn đối với các cơ quan quản lý cầu, bên cạnh việc xác định phương
án nào tốt hơn giữa bảo trì và xây dựng lại cầu. Phân tích chi phí vòng đời là một giải pháp
khả thi cho vấn đề này; tuy nhiên, kỹ thuật này địi hỏi một mơ hình dự báo hư hỏng phù
hợp chưa được triển khai trong TBMS.
Để đánh giá hiệu quả chi phí hiệu quả của công việc sửa chữa và xây dựng lại cầu, nghiên
cứu này nhằm mục đích phân tích cơ sở dữ liệu TBMS để có được các đặc điểm về tình
trạng xuống cấp của cầu ở Đài Loan hữu ích cho việc xác định chiến lược bảo trì. Dự án
nghiên cứu kéo dài hai năm này có hai giai đoạn. Trong năm đầu tiên, ngoài việc xem xét
tài liệu về bảo trì cầu, thuật tốn và phần mềm có sẵn liên quan đến dữ liệu lớn cũng được
điều tra kỹ lưỡng; và việc áp dụng các kỹ thuật và phần mềm này vào cơ sở dữ liệu TBMS
dự kiến sẽ được thực hiện trong năm thứ hai.
Đối với nghiên cứu này, kết quả dự đốn là thu được thơng tin bảo trì như chi phí sửa chữa
và thời gian của các bộ phận, tiến độ của các điều kiện hư hỏng và các yếu tố kích hoạt các
hành động sửa chữa. Cuối cùng, một mơ hình hỗ trợ và đánh giá quyết định cho việc tái
xây dựng những hư hỏng của cầu sẽ được thực hiện thông qua nghiên cứu này.
NGƯỜI DỊCH: LÊ ĐĂNG KHOA - KTXDCTGT K27.2
2
CẦU HIỆN ĐẠI
1.2. ĐÁNH GIÁ TÌNH HÌNH
1.2.1. CÁC YẾU TỐ PHÁ HỦY CẦU Ở ĐÀI LOAN
Lin [2] đã thiết lập thành cơng mơ hình dự đốn tuổi thọ sử dụng cho khe nối mở rộng, thu
được mức chênh lệch 9% giữa năm dịch vụ dự đốn và thực tế. Ơng cũng phát hiện ra rằng
gia tốc ngang, số nhịp và lưu lượng giao thông là những yếu tố quan trọng nhất trong việc
xác định tuổi thọ của khe co giãn. Ngoài ra, Su [3] đã thu thập 935 dữ liệu kiểm tra cầu ở
Đài Trung để phân tích mối liên quan giữa sự xuống cấp của cầu và môi trường của nó
bằng phương pháp hồi quy logistic. Nghiên cứu này đã phát hiện ra rằng tuổi của cầu,
khoảng cách ra biển và việc sử dụng dầm kiểu chữ I là những yếu tố chính gây ra hư hỏng.
1.2.2. ƯU TIÊN BẢO TRÌ CẦU
Đối với cả chính quyền trung ương và địa phương, việc phân phối ngân sách bảo trì cầu
ln là một nhiệm vụ khó khăn. Chen [4] đã thiết lập một mơ hình để tính Hệ số nguy hiểm
(DF) cho một cây cầu bằng cách ấn định trọng số cho các thành phần chính của nó dựa trên
xếp hạng hư hỏng của chúng nhân với hệ số của khách du lịch được xác định theo cấp
đường mà cây cầu đó đi qua; thì thành phần có giá trị cao nhất đã được chuẩn hóa để đại
diện cho DF của cầu. DF có thể được sử dụng cho cả việc ưu tiên bảo trì cầu và phân phối
ngân sách bảo trì. Mơ hình ưu tiên này hiện được kết hợp bởi TBMS.
1.2.3. HIỆU QUẢ CỦA NGÂN SÁCH BẢO TRÌ
Ngân sách chi cho bảo trì cầu cần phải hiệu quả. Cách khả thi để kiểm tra tính hiệu quả là
điều tra kết quả bảo trì trong một khoảng thời gian hoặc trong điều kiện ngân sách hạn chế.
Weng [5] đã so sánh cùng một khoản chi phí đã bỏ ra trong một khoảng thời gian để sửa
chữa hoặc thay thế các thành phần nhất định để tìm ra cách nào hiệu quả hơn. Huang [6] đã
đề xuất một khái niệm bảo dưỡng đồng thời nhiều bộ phận trên cầu để giảm thời gian tổng
thể cho việc sửa chữa các bộ phận khác nhau của cầu. Lay [7] đã phát triển một mơ hình
phân tích chi phí bảo trì cho phép người dùng nhập số lượng ngân sách trong một số năm
nhất định và mơ hình sẽ phân bổ ngân sách cho các cầu để đạt được kết quả hiệu quả nhất.
1.2.4. QUẢN LÝ VÒNG ĐỜI CẦU
Nhiều nhà nghiên cứu đã thúc đẩy khái niệm chi phí vịng đời cho quản lý cầu trong nhiều
năm. Tuy nhiên, thực tế hiện nay hầu hết các hồ sơ thầu xây dựng cầu ở Đài Loan vẫn chưa
tính đến chi phí bảo trì. Zhu [8] đã thiết lập một mơ hình tối ưu để tính tổng chi phí vịng
đời của cầu cho cầu dầm BTCT, xem xét chi phí của người đi lại và chi phí xã hội. Safi [9]
đã phân tích
NGƯỜI DỊCH: PHAN NGỌC ANH KHOA - KTXDCTGT K27.2
3
CẦU HIỆN ĐẠI
Hệ thống quản lý cầu của Thụy Điển để tìm tổng chi phí bảo trì cho các bộ phận của cầu.
Kết quả nghiên cứu cho thấy tổng chi phí bảo trì bằng 15% đến 25% chi phí vịng đời của
một cây cầu, trong khi các loại cầu khác nhau có thể chênh lệch hơn 50% chi phí xây dựng.
1.2.5. TÓM TẮT
Một số nghiên cứu về các yếu tố xuống cấp của cầu và ưu tiên bảo trì đã thiết lập một số
mơ hình phân tích cho các cây cầu ở Đài Loan. Tuy nhiên, tần suất, chi phí và phương
pháp bảo trì thực tế của các thành phần cầu khác nhau có thể được sử dụng để tạo ra một
mơ hình chi phí vịng đời vốn rất quan trọng để có được chiến lược bảo trì hiệu quả hơn.
Ngoài ra, việc đưa ra quyết định giữa việc tiếp tục bảo trì và xây dựng lại một cây cầu mới
vẫn chưa được làm rõ. Vì vậy, câu trả lời cho những nghi ngờ này bằng cách đào sâu vào
các kết quả kiểm tra thực tế và hồ sơ bảo trì trong TBMS đã trở thành mục tiêu chính của
nghiên cứu này.
1.3. HỆ THỐNG QUẢN LÝ CẦU ĐÀI LOAN (TBMS)
Được hỗ trợ bởi Viện giao thông vận tải, Bộ Giao thông vận tải và Truyền thông, TBMS
được phát triển bởi Đại học Trung ương Quốc gia vào năm 1999 tại Đài Loan. TBMS được
sử dụng bởi tất cả các cơ quan chính phủ chịu trách nhiệm quản lý cầu. Trong TBMS, cơ
sở dữ liệu quan hệ được kết hợp trong đó quan hệ của hai hoặc nhiều bản ghi dữ liệu được
xây dựng bởi cùng một thuộc tính. Ví dụ: nếu cần hai cơ sở dữ liệu, được gọi là “khoảng
khơng quảng cáo” và “đại lý”, một thuộc tính có tên “id của đại lý” có thể được thêm vào
cả hai cơ sở dữ liệu để tạo mối quan hệ giữa chúng, như thể hiện trong Hình 1.2.
Hình 1.2. Thiết lập quan hệ dữ liệu.
Hình 1.3 minh họa cấu trúc dữ liệu của TBMS. Có 30 bảng dữ liệu và 9 mô-đun trong
TBMS, chẳng hạn như Kiểm kê, Dữ liệu Kiểm tra, Hồ sơ Bảo trì, Thống kê, Hỗ trợ Quyết
định, v.v., như được thể hiện trong Hình 4. Các Bộ luật Bảo trì ở Đài Loan quy định rằng
mọi cây cầu cần phải được kiểm tra ít nhất một lần mỗi hai năm. Do đó, nghiên cứu này
NGƯỜI DỊCH: PHAN NGỌC ANH KHOA - KTXDCTGT K27.2
4
CẦU HIỆN ĐẠI
tập trung vào dữ liệu trong ba trong số các mô-đun này; chúng là các mô-đun Kiểm kê, Dữ
liệu Kiểm tra và Hồ sơ Bảo trì, như được mơ tả bên dưới.
1.3.1. MƠ-ĐUN KHOẢNG KHƠNG QUẢNG CÁO
Có 33.275 bản ghi dữ liệu trong phân hệ kiểm kê; trong đó chỉ có 28.000 cây cầu cịn đang
sử dụng hoặc đang được bảo trì, số cịn lại đã bị thiên tai tàn phá, phải đóng cửa hoặc phá
dỡ do xuống cấp nghiêm trọng. Trong mơ-đun này, có bốn bảng mơ tả dữ liệu cơ bản của
một cây cầu. Bảng kiểm kê chính của Bridge là lớp trên cùng của cấu trúc dữ liệu trong
mô-đun này; bên dưới là mố, trụ và bảng nhịp. Bảng kiểm kê chính bao gồm sáu loại dữ
liệu như quản lý, hình học, cấu trúc, cấu trúc cụ thể, sông và thiết kế; tổng số trường là 147
trường với khoảng 33.000 bản ghi được tích lũy kể từ năm 2000.
NGƯỜI DỊCH: PHAN NGỌC ANH KHOA - KTXDCTGT K27.2
5
CẦU HIỆN ĐẠI
Hình 1.3. Sơ đồ cấu trúc cơ sở dữ liệu
Hình 1.4. Các mơ-đun chức năng chính của TBMS
1.3.2. MÔ-ĐUN DỮ LIỆU KIỂM TRA
Phương pháp kiểm tra cầu thường xuyên được sử dụng bởi TBMS được gọi là DER & U
[10]. Trong phương pháp luận này, bốn chỉ số được sử dụng để đánh giá tình trạng của một
cây cầu thành phần: “D” thể hiện mức độ hư hỏng; “E” thể hiện mức độ hư hỏng; “R” thể
hiện mức độ liên quan của sự xuống cấp đối với an toàn của cầu; và “U” thể hiện mức độ
khẩn cấp sửa chữa giảm giá trị. Tất cả các chỉ số này đều được đánh giá bằng số trên thang
số nguyên từ 0 đến 4 để mô tả trạng thái của sự hư hỏng, như được trình bày trong Bảng 2.
NGƯỜI DỊCH: TRẦN VĂN GIÁP - KTXDCTGT K27.2
6
CẦU HIỆN ĐẠI
Đối với một bê tông cầu, 21 thành phần cần được kiểm tra, đối với các các loại cầu số
lượng thành phần có thể lên đến 25. Mơ-đun dữ liệu kiểm tra này lưu trữ kiểm tra trực
quan kết quả của tất cả các cầu. Nó có ba lớp cấu trúc dữ liệu; chúng là phiếu kiểm tra
chính, tổng thể, nhịp và trụ. Các phiếu kiểm tra này có 21, 69 và 51 trường để ghi lại kết
quả kiểm tra và hiện tại họ có khoảng 276.000, 277.000 và 2.000.000 bản ghi, tương ứng.
Vì quy định hiện hành yêu cầu ít nhất kiểm tra cầu hai năm một lần, những hồ sơ này tăng
khoảng 15.000 mỗi năm.
NGƯỜI DỊCH: TRẦN VĂN GIÁP - KTXDCTGT K27.2
7
CẦU HIỆN ĐẠI
Đáng chú ý, nếu sự hư hỏng được tìm thấy trong q trình kiểm tra, nó được u cầu nhập
một phương pháp sửa chữa được đề xuất bởi người kiểm tra. Vì vậy,ở cuối cấu trúc dữ
liệu, phương pháp sửa chữa cũng được ghi theo 34 lĩnh vực; nó có 521.000 bản ghi trong
TBMS hiện nay.
Bảng 1.2. Tiêu chí đánh giá của DER & U.
D
E
R
0
Thành phần khơng phải hiện có
Khơng có khả năng quan sát
Liên quan khơng chắc chắn
U
Khẩn cấp khơng chắc chắn
1
Tốt
Ít hơn10%
Nhỏ
Kiểm tra định
kỳ
2
Khá
10~30 %
Giới hạn -d
Trong 3
năm
3
Xấu
30~60 %
Chính
Trong 1
năm
4
Nghiệm trọng
Trên 60%
Lớn
Ngay lập tức
1.3.3. MƠ-ĐUN HỒ SƠ BẢO TRÌ
Trong mơ-đun này, có bảy bảng được sử dụng để ghi lại một cơng việc bảo trì như hợp
đồng bảo trì,nhà thầu, và hồ sơ chi tiết về các hoạt động bảo trì. Hiện tại, 54.000 hồ sơ bảo
trì được lưu trữ trong mơ-đun này. Thời gian bảo trì, phương pháp được sử dụng, chi phí
và số lượng các thành phần sửa chữa của một cây cầu là được coi là thông tin quan trọng
trong nghiên cứu này.
1.4. PHƯƠNG PHÁP NGHIÊN CỨU
Quy trình của nghiên cứu này cùng với các thuật tốn và phần mềm được mơ tả bên dưới.
Thuộc tính và các bộ giá trị sẽ được phân tích cũng được mơ tả.
1.4.1. QUY TRÌNH NGHIÊN CỨU
Hình 1.2 cho thấy các quy trình của nghiên cứu này. Đáng chú ý, dữ liệu của 9 bảng sẽ
được xuất trước tiên từ các mô-đun của hàng tồn kho, dữ liệu kiểm tra và hồ sơ bảo trì
trong TBMS. Các thuộc tính được sử dụng để thiết lập mối quan hệ của dữ liệu sẽ bị xóa
và các thuộc tính lặp lại sẽ cũng bị loại trừ. Sau khi nhập những dữ liệu này vào phần mềm
phân tích đã chọn, kết quả sau đây là dự kiến sẽ đạt được: (1) bảo trì lớn thành phần, (2)
thời gian bảo trì thực tế của thành phần, (3) chi phí bảo trì thực tế của và (4) mối quan hệ
giữa khoảng không quảng cáo và Chỉ số điều kiện (CI). Hệ số các yếu tố trong số các thuộc
tính sẽ được kiểm tra để làm cho phù hợp sửa đổi trong quá trình này.
NGƯỜI DỊCH: LÊ SỸ CƯỜNG - KTXDCTGT K27.2
8
CẦU HIỆN ĐẠI
Hình 1.5. Sơ đồ các quy trình nghiên cứu
1.4.1.1. Xóa các thuộc tính quan hệ
TBMS bao gồm các cơ sở dữ liệu quan hệ; do đó có nhiều thuộc tính khơng hợp lệ trong
dữ liệu phân tích. Hình 3 là một phần của bảng hồ sơ sửa chữa trong đó hàng trên cùng
hiển thị tên của các thuộc tính. Cột C được đặt tên Repair_id và cột D có tên là kho_id.
Những hai trường cho thấy rằng bảng này có liên quan đến khoảng khơng quảng cáo và
sửa chữa bảng hợp đồng. Những loại thuộc tính này khơng cần thiết trong q trình phân
tích dữ liệu và cần được xóa giảm số lượng dữ liệu.
1.4.1.2. Loại trừ các bộ giá trị thiếu tính tồn vẹn
Có khoảng 3 triệu bộ giá trị trong kho, kiểm tra dữ liệu và cơng việc sửa chữa. Một số bộ
giá trị có thể có giá trị rỗng trong các thuộc tính. Hình 4 thể hiện một phần dữ liệu bến tàu.
Các thuộc tính có tên pylon_type, vật liệu pylon và anchor_type là giá trị rỗng ở hàng 5, 6
và 7. Giá trị rỗng sẽ làm cho kết quả khơng chính xác và chúng ảnh hưởng đến kết quả của
phân tích nhân tố. Vì vậy, các bộ giá trị với null giá trị sẽ bị loại trừ trong nghiên cứu này.
NGƯỜI DỊCH: LÊ SỸ CƯỜNG - KTXDCTGT K27.2
9
CẦU HIỆN ĐẠI
Hình 1.6. Bảng ghi nhận giá trị sửa chữa
Hình 1.7. Dữ liệu trụ cầu
NGƯỜI DỊCH: VÕ PHÚ TỒN - KTXDCTGT K27.2
10
CẦU HIỆN ĐẠI
1.4.2. PHƯƠNG PHÁP NGHIÊN CỨU
Phân tích nhân tố là một thuật tốn trích xuất các biến trong số các biến quan sát phổ biến
để phân tích mối tương quan giữa các yếu tố. Nghiên cứu này nhằm mục đích thăm dị mối
quan hệ của các thuộc tính do đó yếu tố khám phá phân tích được kết hợp. Phương pháp
này bao gồm 4 bước: trích xuất các yếu tố chung, quyết định số lượng của các yếu tố, xoay
trục, và đặt tên các yếu tố; trong đó trích xuất và xoay là những công việc quan trọng nhất
và được được mơ tả dưới đây.
1.4.2.1. Trích xuất
Phương pháp này bao gồm hình ảnh được tính tốn điểm ảnh của các biến thơng qua hồi
quy nhiều lần và nó thực hiện phân tích thành phần bằng ma trận điểm ảnh. Sau khi tính
tốn, nó đưa ra hệ số ma trận tải trọng có thể được chuyển đổi thành một ma trận giá trị
riêng L. Cơng thức tính tốn như (1) và (2).
Trong đó:
- L: ma trận giá trị riêng.
- V: vector riêng.
- Λ: hệ số ma trận tải trọng
1.4.2.2. Xoay trục
Mục đích của xoay trục là để làm rõ mối quan hệ của các yếu tố để phản ánh một cấu trúc
yếu tố đơn giản. Vì định nghĩa của mơ hình dữ liệu quan hệ là độc lập với các thuộc tính,
phương pháp xoay trực giao được coi là cách thích hợp để xử lý. Phương pháp này làm cho
phương sai của bình phương hệ số tải trọng trở thành cực đại để đơn giản hóa việc giải
thích các nhân tố.
NGƯỜI DỊCH: VÕ PHÚ TOÀN - KTXDCTGT K27.2
11
CẦU HIỆN ĐẠI
1.4.3. PHẦN MỀM PHÂN TÍCH DỮ LIỆU LỚN
Phân tích dữ liệu lớn đã trở thành một vấn đề phổ biến gần đây. Sau khi xem xét kỹ
lưỡng các phần mềm hiện có, 11 loại gói phần mềm phổ biến được tìm thấy. Đó là
Matlab, SAS, R, Python, Julia, Java, Hadoop và Hive, Scala, Kafka và Storm, Octave
và GO. Trong đó, Matlab và SAS được giới học thuật sử dụng rộng rãi, trong khi R
được kết hợp bởi nhiều cổng thơng tin nổi tiếng. Do đó, nghiên cứu này có kế hoạch
sử dụng ba loại gói phần mềm này để thực hiện phân tích dữ liệu lớn. Đặc điểm của
chúng được mô tả dưới đây.
1.4.3.1. R
R được phát triển bởi Giáo sư Ihaka và Gentleman tại Đại học Auckland ở New
Zealand. R được viết để thống kê, vẽ và khai thác dữ liệu. R có khả năng thực hiện 25
loại chức năng phân tích thống kê và số như thu được giá trị trung bình, độ lệch
chuẩn, vẽ biểu đồ và thực hiện quá trình hồi quy. Quan trọng nhất, mã nguồn của R có
sẵn miễn phí. Những người dùng nổi tiếng của nó bao gồm Google, Facebook, Bank
of America và New York Times. Ngoài các chức năng trên, R có thể được sử dụng để
tính tốn ma trận; hiệu suất hiệu quả của nó có thể được so sánh với GNU Octave và
Matlab. Hàng nghìn cơng cụ phần mềm bổ sung dựa trên các kỹ thuật phân tích khác
nhau về kinh tế và tài chính đã được thiết lập trên R bằng cách nhiều ngôn ngữ khác
nhau như LaTeX, JAVA, C và FORTRAN.
1.4.3.2. Matlab
Đây là phần mềm thương mại được phát triển bởi MathWorks. Nó có thể được sử
dụng để tạo thuật tốn, trực quan hóa dữ liệu, khai thác dữ liệu, phân tích và tính tốn
dữ liệu. Phiên bản mới nhất của nó là R204b cho phép người dùng thiết lập bề mặt
người dùng bằng ngôn ngữ lập trình của nó hoặc bằng cách gọi các chương trình khác
được viết bởi C, C ++, JAVA, Python hoặc FORTRAN. Matlab cũng cung cấp một
hộp công cụ dễ sử dụng được thiết lập dựa trên các kỹ thuật khác nhau như phân tích
nhân tố, thuật tốn chung, mạng nơron và ANN, cho phép sử dụng để thực hiện các
chức năng như phân tích tối ưu, thống kê, xử lý tín hiệu, xử lý hình ảnh, vector phân
tích và tính toán ma trận. Đáng chú ý, việc chuẩn bị dữ liệu thơ là rất quan trọng đối
với Matlab vì điều đó có thể ảnh hưởng đến hiệu quả tính tốn.
1.4.3.3. Hệ thống phân tích thống kê (SAS)
Được phát triển bởi SAS Institute Inc., SAS đã được sử dụng phổ biến trong các lĩnh
vực thương mại trong nhiều thập kỷ (Wikipedia, 2014). Phiên bản đầu tiên của SAS
NGƯỜI DỊCH: PHAN ĐÌNH PHÙNG - KTXDCTGT K27.2
12
CẦU HIỆN ĐẠI
được viết bằng ngôn ngữ C, và bây giờ JAVA và C ++ cũng được bao gồm. Phiên bản
mới nhất của nó là 9.4, bao gồm 10 mơ-đun chính để khai thác dữ liệu, đồ họa và trình
bày, kinh tế lượng và phân tích chuỗi thời gian, phân tích thử nghiệm lâm sàng, phân
tích thống kê, ngơn ngữ ma trận tương tác, kiểm soát chất lượng và truyền cơ sở dữ
liệu, v.v.
1.4.4. KẾT QUẢ DỰ ĐOÁN
Bước tiếp theo của nghiên cứu này là xây dựng các hồ sơ dữ liệu đơn lẻ bao gồm dữ
liệu của các trường từ bảng kiểm kê cầu, nhịp, trụ, mố, kiểm tra chính, kiểm tra chi
tiết, đề xuất bảo dưỡng phương pháp và hồ sơ bảo trì. Bản ghi dữ liệu có dữ liệu bị
thiếu trong bất kỳ trường nào hoặc có sự mâu thuẫn logic sẽ bị loại bỏ. Các bản ghi
này sẽ được nhập vào ba gói phần mềm; Matlab, SAS và R như đã đề cập ở trên. Các
kết quả dự đốn sẽ là (1) tần suất bảo trì cho tất cả các bộ phận của cầu, (2) các bộ
phận cầu được bảo dưỡng nhiều nhất, (3) chi phí bảo trì thực tế cho các bộ phận cầu,
và (4) mối quan hệ giữa CI và dữ liệu kiểm kê cầu. Cuối cùng, một mơ hình đánh giá
sẽ được thiết lập để xác định việc tiếp tục bảo trì hoặc xây dựng lại một cây cầu dựa
trên những phát hiện này.
NGƯỜI DỊCH: PHAN ĐÌNH PHÙNG - KTXDCTGT K27.2
13
BÀI BÁO GỐC
International Journal of Structural and Civil Engineering Research Vol. 5, No. 3, August 2016
A Big Data Approach for Decision Making in
Bridge Maintenance
Yu-Han Chuang and Nie-Jia Yau
Graduate Institute of Construction Engineering and Management, National Central University, Taoyuan, Taiwan
Email: ,
Abstract—The Taiwan Bridge Management System (TBMS)
has been online since 2000 and the total amount of inventory
is 33,275, including all kinds of bridges and culverts.
Currently, the number of fields in all tables in the databases
of TBMS is around 6,500 with more than 3.4 million data
records in its databases. There are more than 11,200 bridges
that are over 20 years old with another 9,300 bridge having
unknown built years in the TBMS. The bridges in Taiwan
have stepped into the stage where maintenance is crucial
and frequently required. Therefore, this research aims at
analyzing the database in the TBMS using Exploratory
Factor Analysis for determining maintenance strategies for
these bridges. This paper describes results of the first year’s
research efforts. Relevant literature in bridge maintenance,
prioritization, and life-cycle bridge management were firstly
reviewed. Concepts, theories, and available software for
analyzing “Big Data” were also introduced.
Age distribution of bridges in the TBMS is shown in
Table I. There are 11,263 bridges over 20 years old, and
Fig. 1 shows the amount of bridge components which are
deemed necessary for maintenance actions. The number
of seriously deteriorated components still increases
gradually, even though maintenance activities have been
expedited by responsible agencies for many of such
components.
1,300
1,200
1,100
1,000
Index Terms—bridge maintenance, bridge management, big
data, decision making
900
800
Railways
700
600
500
City/ County
Freeway/ Highway
400
I.
INTRODUCTION
2010
The Taiwan Bridge Management System (TBMS) has
been online since 2000 [1]. Its inventory includes 28,365
bridges with 6,524 attributes in all tables, and the total
amount of data records is 3,457,274 which increase
15,000 records annually. Among these attributes, there
are 475 attributes containing kernel management
information of a bridge such as inventory data, inspection
results, and repair records. Thus, the databases in the
TBMS have met the definition of “Big Data.”
TABLE I.
726
54
1,235
2,015
2,262
262
3,198
5,722
20~30
1,004
332
4,037
5,373
30~40
971
359
2,752
4,082
40~50
252
408
606
1,266
50~60
61
104
199
364
60~70
18
65
41
124
70~80
9
9
9
27
80~90
6
-
15
21
90~100
-
-
5
5
100~110
-
-
1
1
unknown
16
135
9,214
9,365
Manuscript received July 11, 2015; revised January 12, 2016.
© 2016 Int. J. Struct. Civ. Eng. Res.
doi: 10.18178/ijscer.5.3.216-222
2013
2014
Due to limited budgets, especially for local
governments, prioritization of bridge maintenance is
always a tough task for the bridge management agencies,
in addition to determining which option is better between
maintaining and rebuilding of the bridge. Life-cycle cost
analysis is a feasible solution for such problem; however,
such technique requires an appropriate deterioration
prediction model which does not yet implemented in the
TBMS.
In order to effectively evaluate cost efficiency of
repairing work and rebuilding of bridge, this research
aims to analyze the TBMS databases to obtain
characteristics of bridge deterioration in Taiwan that are
useful for determining maintenance strategies. This twoyear research project has two stages. For the first year, in
addition to literature review in bridge maintenance,
algorithm and available software related to big data are
thoroughly investigated; and application of these
techniques and software to the TBMS databases is
planned to be performed in the second year.
For this research, the anticipated result is to obtain
maintenance information such as repairing cost and
period of components, progressive of deterioration
conditions, and factors that trigger the repairing actions.
Finally, a decision support and evaluation model for
Bridge’s age Freeway/Highway Railway City/ County Total
~10
2012
Figure 1. Amount of bridge components need maintenance actions
BRIDGE’S AGE OF E ACH MANAGEMENT AGENCY
10~20
2011
216
International Journal of Structural and Civil Engineering Research Vol. 5, No. 3, August 2016
bridges may have more than 50% difference in
construction cost.
rebuilding of deteriorated bridges will be established
from this research.
II.
E. Summary
Several studies in bridge deterioration factors and
maintenance prioritization have established some analysis
model for the bridges in Taiwan. However, actual
maintenance frequency, costs, and methods of various
bridge components could be used to generate a life cycle
cost model which is crucial to obtain a more effective
maintenance strategy. In addition, decision making
between continuing maintenance actions and rebuilding
of a new bridge still not clarified yet. Thus, answers to
these doubts by digging into the actual inspection results
and maintenance records in the TBMS have become the
major objectives of this research.
LITERATURE REVIEW
A. Bridge Deterirarion Factors in Taiwan
Lin [2] successfully established a service life
prediction model for expansion joint that obtained a 9%
difference between the predicted and the actual service
year. He also discovered that horizontal acceleration,
number of spans and traffic flow are the most significant
factors in determining the service life of an expansion
joint. In addition, Su [3] collected 935 bridge inspection
data in Taichung to analyze the relevancy between bridge
deterioration and its environment by a logistic regression
approach. This study discovered that the age of bridge,
the distance to sea, and using of I-type girders are the
major factors that caused deterioration.
III.
Supported by the Institute of transportation, Ministry
of Transportations and Communications, the TBMS was
developed by National Central University in 1999 in
Taiwan. The TBMS is used by all the governmental
agencies which are responsible for bridge management.
In the TBMS, relational databases are incorporated in
which relations of two or more data records are built by
the same attribute. For example, if two databases, termed
as “inventory” and “agency” are needed, an attribute
named “agency’s id” can be added into both databases to
create a relation between them, as show in Fig. 2.
B. Prioritization of Bridge Maintenance
For both the central and local governments,
distribution of bridge maintenance budgets is always a
difficult task. Chen [4] established a model to calculate a
Danger Factor (DF) for a bridge by assigning weights to
its major components based on their deterioration ratings
multiplied by a traveler’s factor determined by level of
road that bridge was on; then the component having the
highest value was normalized to represent the DF of the
bridge. The DF can be used for both prioritization of
bridge maintenance and distribution of maintenance
budgets. This prioritization model is currently
incorporated by the TBMS.
Inventory
Bridge
id
C. Effectiveness of Maintenance Budget
Budget spent for bridge maintenance needs to be
effective. Feasible ways to check the effectiveness is to
investigate results of maintenance within a time period or
under limited budgets. Weng [5] compared the same
amount of cost spent within a time period for fixing or
replacing certain components to find which way is more
effective. Huang [6] proposed a concept of concurrently
maintaining multiple components on a bridge to reduce
the overall time spent for repairing various components
of the bridge. Lay [7] developed a maintenance cost
analysis model that allowed the user to input the amount
of budget for a given number of years, and the model
would allocate the budget to the bridges to achieve the
most effective result.
Bridge
Name
Total
Length
Structure Angency
Type
id
Agency
Agency id Department Address Phone Number
Figure 2. Data relation establishment
D. Bridge Life-Cycle Management
Many researchers have promoted life cycle cost
concept for bridge management for many years. However,
current practice in most bridge construction bids in
Taiwan still not yet consider the maintenance costs. Zhu
[8] established an optimal model for calculating bridge
total life cycle cost for RC beam bridges, considering
travelers’ cost and social cost. Safi [9] analyzed the
Sweden bridge management system to find a total
maintenance cost for bridge components. The research
results showed that the total maintenance cost is 15% to
25% of life cycle cost of a bridge, while different types of
© 2016 Int. J. Struct. Civ. Eng. Res.
TAIWAN BRIDGE MANAGEMENT SYSTEM (TBMS)
217
Fig. 3 illustrates the data structure of the TBMS. There
are 30 data tables and 9 modules in the TBMS, such as
Inventory, Inspection Data, Maintenance Records,
Statistic, Decision Support, etc., as shown in Fig. 4. The
Maintenance Codes in Taiwan regulates that every bridge
needs to be inspected at least once per two years. Hence,
this research focuses on data in three of these modules;
they are Inventory, Inspection Data, and Maintenance
Records modules, as described below.
A. Inventory Module
There are 33,275 data records in the inventory module;
among which only 28,000 bridges are still in use or under
maintenance, the rest were destroyed by natural disasters,
closed or demolished due to serious deterioration. In this
module, there are four tables that describe the basic data
of a bridge. Bridge main inventory table is the top layer
of data structure in this module; below which are
abutment, pier, and span tables. The main inventory table
consists of six kinds of data such as management,
International Journal of Structural and Civil Engineering Research Vol. 5, No. 3, August 2016
geometry, structure, particular structure, river, and design;
the total number of fields is 147 with roughly 33,000
records accumulated since year 2000.
The abutment, pier, and span tables have data fields
describing detailed geometry and design information with
42, 58, and 39 fields and around 9,700, 24,000, and
90,000 records, respectively.
Figure 3. The diagram of database structure
Figure 4. Major functional modules of the TBMS
the deterioration, as exhibited in Table II. For a concrete
bridge, 21 components need to be inspected, for other
types of bridges the number of components may up to 25.
This inspection data module stores visual inspection
results of all bridges. It has three layers of data structure;
they are main, overall, spans and piers inspection sheets.
These inspection sheets have 21, 69, and 51 fields to
record the inspection results and currently they have
around 276,000, 277,000, and 2,000,000 records,
respectively. Since current regulation requires at least
inspecting bridge once per two years, these records
B. Inspection Data Module
The methodology of regular bridge inspections used by
the TBMS is called DER&U [10]. In this methodology,
four indices are used to evaluate the condition of a bridge
component: “D” represents the degree of deterioration;
“E” represents the extent of the deterioration; “R”
represents the deterioration’s relevancy to bridge safety;
and “U” represents the urgency for repairing the
deterioration. All of these indices are numerically rated
on an integer scale from 0 to 4 to describe the status of
© 2016 Int. J. Struct. Civ. Eng. Res.
218
International Journal of Structural and Civil Engineering Research Vol. 5, No. 3, August 2016
this module. The maintenance time, method used, costs
and quantity of repaired components of a bridge are
deemed as crucial information in this research.
increase roughly 15,000 annually. Notably, if
deterioration is found during inspection, it is required to
input a suggested repairing method by the inspector. Thus,
at the bottom of the data structure, the suggested
repairing method is also recorded by 34 fields; it has
521,000 records in the TBMS now.
TABLE II.
IV.
Processes of this research along with related
algorithms and software are described below. Attributes
and tuples which will be analyzed are also depicted.
THE DER&U EVALUATION CRITERIA
0
1
2
3
4
D
Component
not
existing
Good
Fair
Bad
Serious
E
Unable to
inspect
Less
than
10%
10~30
%
30~60
%
Over 60%
R
Relevancy
uncertain
Minor
Limite
d
Major
Large
U
Urgency
uncertain
Routine
In 3
years
In 1
year
RESEARCH METHOD
A. Research Processes
Fig. 2 shows the processes of this research. Notably,
data of 9 tables will be firstly exported from the modules
of inventory, inspection data, and maintenance records in
the TBMS. The attributes used to establish relation of
data will be deleted, and the repeated attributes will be
excluded as well. After importing these data into a
selected analysis software, the following results are
expected to be obtained: (1) the major maintenance
components, (2) the actual maintenance period of
components, (3) the actual maintenance cost of
components, and (4) the relation between inventory and
Condition Index (CI). Coefficient of factors among
attributes will be examined to make appropriate
modifications during these processes.
Immediately
C. Maintenance Records Module
In this module, there are seven tables used to record a
maintenance work such as maintenance contract,
contractor, and detail records of maintenance activities,
etc. Currently, 54,000 maintenance records are stored in
Exporting data
sheet
Data processing
Analyzing the major
component of
maintenance of
every structure type
Analyzing the actual
repair period of
components of every
structure type
Calculating the
actual cost of
components of every
structure type
Analyzing the
correlation between
inventory and
Condition Index
Programming the
analyzing code of software
Analyzing the coefficient
of factors
Establishing the model of
repair and reconstruction
effectiveness analysis
Modifying the model
Figure 5. Diagram of research processes
1) Deleting the relational attributes
The TBMS is composed of relational databases;
therefore there are many invalid attributes during data
analysis. Fig. 3 is a part of repair record table where the
top row shows the name of attributes. Column C is named
repair_id, and column D is named inventory_id. These
two fields show that this table is related to inventory and
repair contract tables. These kinds of attribute are not
necessary during data analysis and need to be deleted to
decrease the amount of data.
© 2016 Int. J. Struct. Civ. Eng. Res.
2) Excluding lack of integrity tuples
There are about 3 million tuples in inventory, inspect
data, and repair work. Some tuples might have null values
in attributes. Fig. 4 demonstrates part of the pier data. The
attributes named pylon_type, pylon material, and
anchor_type are null in row 5, 6, and 7. Null values
would make the result inaccurate, and they affects the
result of factor analysis as well. So, the tuples with null
values would be excluded in this research.
219
International Journal of Structural and Civil Engineering Research Vol. 5, No. 3, August 2016
Figure 6. Repair record table
Figure 7. Pier data table
matrix which can be transformed into an eigenvalue
matrix L. the mathematic model is shown in Eq. (1) and
Eq. (2).
B. Research Methodology
Factor analysis is an algorithm that extracts latent
variables among common observed variables to analyze
the correlation between factors. This research aims to
probe relation of attributes thus the exploratory factor
analysis is incorporated. This methodology consists of 4
steps: extracting common factors, deciding the amounts
of factors, rotating the axis, and naming factors; in which
extraction and rotation are the most important ones as
described below.
1) Extraction
Image factoring method calculates the image scores of
variables through multiple regression, and it do principal
component analysis by the covariance matrix of image
scores. After calculation, it brings out a factor loading
© 2016 Int. J. Struct. Civ. Eng. Res.
L = VR𝑉 ′
(1)
R = VL𝑉 ′ = 𝑉√𝐿√𝐿𝑉 ′ = (𝑉√𝐿)(√𝐿𝑉 ′ ) = ΛΛ′
(2)
Where, L is eigenvalue matrix.
V is eigenvector.
Λ is factor loading matrix.
2) Rotation
The purpose of rotating factor axis is to clarify the
relation of factors to reflect a simple factor structure.
Since the definition of relational data model is
independent of attributes, the orthogonal rotation method
is deemed to be the appropriate way to process. This
method makes the variance of factor loading square
220
International Journal of Structural and Civil Engineering Research Vol. 5, No. 3, August 2016
become maximum in order to simplify explanation of
factors.
C. Big Data Analysis Software
Big data analysis has become a popular issue recently.
After a thorough review of current available software, 11
kinds of popular software packages are found. They are
Matlab, SAS, R, Python, Julia, Java, Hadoop and Hive,
Scala, Kafka and Storm, Octave, and GO. Among which,
Matlab and SAS are widely used by the academia, while
R is incorporated by many famous portals. Thus, this
research plans to utilize these three kinds of software
packages to perform the big data analysis. Their
characteristics are depicted below.
1) R
R was developed by Professors Ihaka and Gentleman
at the University of Auckland in New Zealand. R is
written for statistic, drawing, and data mining. R is
capable of performing 25 kinds of statistic and numerical
analysis functions such as obtaining mean value, standard
deviation, plotting of histogram, and executing regression
process. Most importantly, the source code of R is
available freely. Its famous users include Google,
Facebook, Bank of America, and New York Times.
In addition to the above functions, R can be used for
matrix calculation; its efficient performance can be
comparable to GNU Octave and Matlab. Thousands of
added software tools based on various analysis techniques
for economics and finance have been established on R by
various languages such as LaTeX, JAVA, C, and
FORTRAN.
3) Tatistics Analysis System (SAS)
Developed by SAS Institute Inc., SAS has been
commonly used in commercial areas for decades
(Wikipedia, 2014). The initial version of SAS was written
in language C, and now JAVA and C++ are also included.
Its latest version is 9.4, including 10 main modules for
data mining, graphics and presentation, econometrics and
time series analysis, clinical trial analysis, statistics
analysis, interactive matrix language, quality control, and
database transfer, etc.
2) Matlab
It is commercially available software developed by
MathWorks. It can be used for algorithm generation, data
visualization, data mining, data analysis and calculation.
Its latest version is R204b which allows the user to
establish user surfaces by its programing language or by
calling other programs written by C, C++, JAVA, Python
or FORTRAN.
Matlab also provides an easy-to-use tool box
established based on various techniques such as factor
analysis, generic algorithm, neural networks and ANN,
allowing the use to perform functions such as optimal
analysis, statistics, signal processing, image-processing,
vector analysis, and matrix calculation. Notably, raw data
preparation is crucial for Matlab since that may affect
calculation efficiency.
D. Anticipated Result
The next step of this research taken is to formulate
single data records which consists of data of fields from
© 2016 Int. J. Struct. Civ. Eng. Res.
tables of bridge inventory, span, pier, abutment, main
inspection, detail inspection, suggested maintenance
method, and maintenance record. Data records have
missing data in any field or have logic inconsistence will
be eliminated. These records will be input to the three
software packages; Matlab, SAS, and R as mentioned
above. The anticipated results will be (1) a maintenance
frequency for all the bridge components, (2) most
maintained bridge components, (3) actual maintenance
costs for bridge components, and (4) the relationship
between CI and bridge inventory data. Finally, an
evaluation model will be established for determining
continuation of maintenance or rebuilding of a bridge
based on these findings.
V.
This research collected relevant literature in bridge
maintenance and life-cycle costs analysis in Taiwan. It
was found that models for calculating bridge life cycle
costs still not yet established, nor the effectiveness
comparison between maintenance and rebuilding of a
deteriorated bridge. These have become goals of this
research and are intended to be solved by digging into the
big databases of the TBMS which has already been used
for 15 years. This research depicts the preliminary steps
in data processing to decrease the amount of data and
increase the accuracy, and selects an appropriate
algorithm and three available software packages for big
data analysis. The data in the TBMS would be soon
applied to find relevant maintenance information for
decision making in bridge maintenance in Taiwan.
ACKNOWLEDGMENT
The authors appreciate the financial support provided
by Ministry of Science and Technology, under project
number MOST 104-2221-E-008-102-MY2.
REFERENCES
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
221
CONCLUSION
Institute of Transportation, MOTC, 2014. Taiwan Bridge
Management
System.
[Online].
Available:
/>J. J. Lin, “Modeling prediction of service lives of bridge expansion
joints,” Master's thesis, National Yunlin University of Science and
Technology, 2007.
H. J. Su, “A correlation study of the existing bridges for failure
analysis-case study of Taichung County,” Master's thesis, Feng
Chia University, 2003.
J. J. Chen, “Developing a maintenance decision support module
for Taiwan bridge management system– An example for
directorate general of highways,” Master's thesis, National Central
University, 2007.
K. H. Weng, “Comparison of economic efficiency of rehabilitation
and replacement in bridge maintenance,” Master's thesis, National
Central University, 2009.
H. Y. Huang, “Establishment of bridge elements concurrent
maintenance model,” Master's thesis, National Yunlin University
of Science and Technology, 2007.
Y. C. Lay, “A maintenance strategy evaluation model for network
level bridges,” Master's thesis, National Central University, 2001.
J. Zhu and B. Liu, “Performance life cost-based maintenance
strategy optimization for reinforced concrete girder bridges,”
Journal of Bridge Engineering, vol. 18, no. 2, pp. 172-178, 2013.
M. Safi, H. Sundquist, and R. Karoumi, “Cost-efficient
procurement of bridge infrastructures by incorporating life-cycle
International Journal of Structural and Civil Engineering Research Vol. 5, No. 3, August 2016
Nie-Jia Yau was born in Taiwan, 1958. He
obtained his Ph.D. degree from Department of
Civil and Environmental Engineering,
University of Illinois at Urbana-Champaign in
1992. He is now Professor of Graduate
Institute of Construction Engineering and
Management and also Director of Research
Center for Hazard Mitigation and Prevention,
National Central University, Taiwan.
cost analysis with bridge management systems,” Journal of Bridge
Engineering., vol. 20, no. 6, p. 04014083, 2014.
[10] Institute of Transportation, MOTC, Establishment of Bridge
Visual Inspection and Evaluation Manual (Draft), 2011.
Yu-Han Chuang was born in Taiwan, 1986.
She is a Ph.D. student of Graduate Institute of
Construction Engineering and Management,
National Central University, Taiwan.
© 2016 Int. J. Struct. Civ. Eng. Res.
222