Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0
XÂY DỰNG HỆ THỐNG NHẬN DẠNG LỖI TỰ ĐỘNG
CỦA TẤM PIN NĂNG LƯỢNG MẶT TRỜI
Lê Thị Hương
Trường Đại học Thủy lợi
1. GIỚI THIỆU CHUNG
Các mơ hình nhận dạng lỗi của tấm pin
hiện nay chỉ phù hợp cho một hệ thống PV
nhất định và chưa chỉ rõ vị trí bị lỗi trong hệ
thống. Để khắc phụ được nhược điểm đó, bài
báo này sẽ trình bày về kỹ thuật xử lý ảnh [1]
và ứng dụng trong bài toán nhận dạng lỗi cho
các tấm pin mặt trời, cụ thể sử dụng mang
Yolov3 để nhận dạng lỗi.
Thuật ngữ:
(1)
: Lớp tích chập; (2): Lớp kết nối; (3): Hình
chữ nhật bao quanh đối tượng; (4): Điểm phân
loại, (5): Điểm địa phương; (6): Điểm tin cậy;
(7): Độ đo chính xác trung bình; (8): Độ chính
xác; (9): Độ phủ; (10): Dương tính thật; (11):
Dương tính giả; FN: Âm tính giả; TN: Âm
tính thật.
Nguyên lý hoạt động của mạng yolo: Đầu
vào của mơ hình là một ảnh, mơ hình sẽ nhận
dạng ảnh đó có đối tượng nào hay khơng, sau
đó sẽ xác định tọa độ của đối tượng trong
ảnh. Ảnh chia thành các ma trận ô vuông SxS
(S là tham số do người huấn luyện chỉ định
và S có thể là 3, 5, 7…), mỗi ơ vng bao
gồm một tập các thơng tin mơ hình phải dự
đốn.
Như Hình 1, mạng yolo gồm có 24 lớp tích
chập và 2 lớp fully connected (FC).
2. PHƯƠNG PHÁP NGHIÊN CỨU
Nhận dạng đối tượng là một kỹ thuật trong
thị giác máy tính có chức năng nhận diện các
đối tượng có trong ảnh hoặc trong video.
Yolo là một mơ hình mạng nơron CNN cho
việc phát hiện, nhận dạng, phân loại đối
tượng, tạo ra từ việc kết hợp giữa
convolutional layers (1) và connected layers(2).
Trong đó các convolutional layers sẽ trích
xuất ra các đặc trưng của ảnh, cịn full
connected layers sẽ dự đốn ra xác suất đó và
tọa độ của đối tượng. Mạng yolo so với mạng
R-CNN thì tốc độ nhanh hơn rất nhiều. Bài
tốn nhận dạng đối tượng gồm 2 bài toán
nhỏ: (1) Xác định các bounding box(3). (2)
Với mỗi bounding box thì cần phân loại xem
đấy là đối tượng gì.
Hình 1. Kiến trúc mạng Yolo
Một vài lớp tích chập có kích thước 11
giảm độ phức tạp của các đặc trưng, giúp mơ
hình huấn luyện nhanh hơn. Đầu ra của mạng
là một tensor có kích thước 7730 qua lớp
fully connected để phân loại.
Hàm mất mát có chức năng kiểm tra chất
lượng đầu ra của mơ hình so với nhãn đúng
để từ đó điều chỉnh các hệ số trong quá trình
huấn luyện. Yolo sử dụng hàm độ lỗi bình
phương giữa dự đốn và nhãn để tính độ lỗi
cho mơ hình. Cụ thể, độ lỗi tổng sẽ là tổng
của 3 độ lỗi con sau: Độ lỗi của việc dự đoán
loại nhãn của vật thể - Classification loss. Độ
lỗi của dự đoán tạo độ cũng như chiều dài,
chiều rộng của boundary box - localization
279
Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0
loss. Độ lỗi của ơ vng có chứa vật thể nào
hay khơng - Confidence loss. Trong q trình
huấn luyện, mơ hình sẽ nhìn vào những ơ
vng có chứa vật thể. Tăng classification
score(4) lớp đúng của vật thể đó lên. Sau đó,
cũng nhìn vào ơ vng đó, tìm boundary box
tốt nhất trong 2 boxes được dự đoán. Tăng
localization score(5) của boundary box đó lên,
thay đổi thơng tin boundary box để gần đúng
với nhãn. Đối với những ô vuông không chứa
vật thể, giảm confidence score(6) và chúng ta
sẽ không quan tâm đến classification score và
localization score của những ô vuông này:
Công thức của hàm mất mát:
S2
B
J(W,b,X,Y) = coord 1ijabj [( xi xµi )2 ( yi µ
yi )2 ]
i 0 j 0
S2
B
yi )2 ]
+ coord 1ijabj [( w i xµi ) 2 ( y i µ
i 0 j 0
S
2
B
+
µ) 2 +
(Ci C
i
i 0 j 0
S2
1i obj
i 0
S2
B
µ)2
noord (Ci C
i
với ngưỡng t để xác định ra các chỉ số TP
(True Positive(10) – IoU >t), và FP (False
Positive(11) –IoU
Precision =
Recall =
TP
TP FP
TP
TP FN
(3)
Dữ liệu: dùng để nhận dạng lỗi là ảnh
nhiệt chụp được từ drone như Hình 2. Khi có
vùng bị lỗi (lỗi về diode, hot-pot…) thì vùng
đó sẽ phát nhiệt nhiều hơn các vùng cịn lại.
Dữ liệu gồm 120 ảnh, trong đó chia ra 100
ảnh dùng để huấn luyện mơ hình cịn lại 20
ảnh dùng để kiểm tra mơ hình. Các bước tiến
hành với dữ liệu: Thu thập dữ liệu từ internet,
đưa ảnh thu về cùng kích thước 124x124,
dùng phần mềm labellimage để gắn nhãn cho
ảnh như hình 3 => Tạo một.txt file ứng với
mỗi ảnh.jpg cùng tên và đặt trong cùng 1
thư mục.
i 0 j 0
( pi (c) µ
pi (c)) 2
(2)
(1)
cclasses
Trong đó: 1ijobj 1ijobj bằng 1 nếu ơ vng
đang xét có object ngược lại bằng 0.
XY tọa độ của tâm.
w, h là chiều rộng và chiều dài của
bounding box.
B là số lượng bounding box.
Ci là điểm số tự tin của box j trong ô
vuông i
pi(c) là xác suất của lớp c trong ô vuông i
coord , noobj : là các hệ số điều chỉnh.
Phương pháp đánh giá kết quả theo [2] sử
dụng chỉ số mAP (mean average precision (7))
đánh giá kết quả mơ hình, chỉ số này xây dựng
từ 11 điểm của đồ thị precision(8) - recall (9).
Trong đó: IoU(Intersection over Union) để
đánh giá xem bounding box dự đoán đối
tượng khớp với ground truth thật của đối
tượng. Chỉ số IoU được tính bằng tỉ số diện
tích của vùng giao nhau (area of overlap) và
tổng diện tích của 2 box (area of union). Hai
box là box thật của đối tượng (ground-truth
bounding box) và box do mơ hình dự đốn
(predicted bounding box). So sánh chỉ số IoU
280
Hình 2. Ảnh nhiệt của pin mặt trời
Hình 3. Phần mềm LabelIimg
Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0
Thơng tin trong mỗi file.txt gồm có số
lượng vật thể và tọa độ của vật thể ở trong
ảnh, ứng với mỗi vật thể là một dòng:
<object-class><x><y><width><height> với:
<object-class>: là số thứ tự của class xuất
phát từ o đến (số class -1)
<xcenter><ycenter><width><height>: là các
số thực chỉ vị trí tương ứng của object so với
ảnh, nằm trong khoảng từ 0 đến 1.
Các đặt thơng số cho q trình huấn luyện:
Do có ít dữ liệu (120 ảnh) sử dụng yolov3
để huấn luyện dữ liệu thay vì xây dựng mơ
hình lại từ đầu. Chọn số lượng classes = 1 do
mơ hình chỉ cần phân biệt giữa có lỗi và
khơng có lỗi. Chọn số lượng epoch: 2000
epochs. Chọn số lượng filter trong layer cuối
cùng theo công thức: (n classes 5) 3 18 .
Chọn learning rate = 0,001, thay đổi learning
rate sau 1600 và 1800 epoch. Lập trình
python để cho kết quả dự đốn lỗi.
Từ Hình 4, nhận thấy hàm mất mát giảm
dần trong q trình huấn luyện mơ hình và về
giá trị 0,5, kết quả có thể tốt hơn nếu tăng thời
gian huấn luyện mơ hình, nhưng thời gina
huấn luyện phụ thuốc rất lớn vào phần cứng.
(a)
3. KẾT QUẢ
(c)
Chỉ số mAP đạt được 91,91%
(b)
(d)
Hình 5. Kết quả dự đốn lỗi của mơ hình
Từ kết quả Hình 5 cho thấy mơ hình đã
phát hiện các vùng lỗi tốt, tuy còn một số
vùng phát hiện chưa hết các vùng lỗi như trên
hình (a) hay trên hình (d) nhưng mơ hình cho
thấy khả năng nhận dạng lỗi tự động và hồn
tồn có thể ứng dụng vào thực tế.
4. KẾT LUẬN
Tác giả đã xây dựng được mơ hình với kết
quả có độ chính xác cao. Tuy nhiên vẫn còn
một số hướng phát triển của đề tài cho tương
lại để cải thiện độ chính xác của mơ hình
bằng cách: Thu thập thêm dữ liệu để đánh giá
thuật tốn tốt hơn, tìm hiểu về dữ liệu thực tế,
và xây dựng phần mềm nhận dạng lỗi tự
động cho người vận hành sử dụng.
Hình 4. Đồ thị loss trong quá trình
huấn luyện
5. TÀI LIỆU THAM KHẢO
Nhận xét: Chỉ số mAP đạt được khá cao,
chứng tỏ mơ hình hoạt động tốt cũng như
việc lựa chọn thơng số cho q trình huấn
luyện là phù hợp.
[1] V.M.Tiệp, 2016, machine learning cơ bản,
nhà xuất bản khoa học kỹ thuật.
[2] R.Khandelwal, 2017, Evaluating performance
of an object detection model, towards datascience.com.
281