ỦY BAN NHÂN DÂN TỈNH TRÀ VINH
TRƯỜNG ĐẠI HỌC TRÀ VINH
BÀI THAM LUẬN:
NHẬN DẠNG VÀ DỊCH BẢNG CHỈ DẪN
TIẾNG ANH SANG TIẾNG VIỆT
TRÀ VINH – 06/2020
1
NỘI DUNG
1
GIỚI THIỆU
2
NGHIÊN CỨU LIÊN QUAN
3
PHƯƠNG PHÁP ĐỀ XUẤT
4
KẾT QUẢ THỰC NGHIỆM
5
KẾT LUẬN
2
1. GIỚI THIỆU
Giai đoạn 1: Phát hiện bảng chỉ dẫn.
Giai đoạn 2: Nhận dạng các ký tự tiếng Anh
có trong bảng chỉ dẫn.
Giai đoạn 3: Dịch các ký tự tiếng Anh sang
tiếng Việt.
3
2. NGHIÊN CỨU LIÊN QUAN
• Phương pháp phân lớp SVM [6] được sử
dụng rộng rãi trong nhiều lĩnh vực như y
tế, sinh học, đặc biệt là trong tin học như
[1-4].
• Việc tạo ra thư viện LIBSVM giúp cho các
thử nghiệm liên quan SVM được dễ dàng
hơn
4
2. NGHIÊN CỨU LIÊN QUAN
• Trong nghiên cứu [5] tác giả so sánh hai
kịch bản phân loại văn bản bằng SVM và
cây quyết định.
• Kết quả cho thấy với máy học SVM kết
hợp với phân tích giá trị đơn để rút ngắn
số chiều của không gian đặc trưng sẽ cho
kết quả phân loại văn bản tốt hơn là
phương pháp cây quyết định.
5
2. NGHIÊN CỨU LIÊN QUAN
Các giai đoạn xử lý ảnh
6
2. NGHIÊN CỨU LIÊN QUAN
Một số mẫu bảng chỉ dẫn lối đi (Bảng chỉ dẫn đường)
Một số mẫu bảng chỉ dẫn cổng vào tòa nhà
Một số mẫu bảng chỉ dẫn phòng
7
3. PHƯƠNG PHÁP ĐỀ XUẤT
Ảnh màu
Thu thập dữ
liệu mẫu
Phát hiện vùng
chứa ký tự
Huấn luyện
Tách ký tự
Nhận dạng
Dịch
Tham số SVM
sau khi huấn
luyện
Kết quả
8
3. PHƯƠNG PHÁP ĐỀ XUẤT
Thuật toán: Phát hiện vùng chứa ký tự
Bước 1: Tìm vùng chứa ký tự trong bảng chỉ dẫn
- Với ảnh xám đầu vào thực hiện phân ngưỡng
(dò biên sobel) và tìm đối tượng.
- Tách các đối tượng có tỉ lệ rộng/dài trong phạm
vi bảng chỉ dẫn để làm nguồn cho bước 2.
Bước 2: Tách riêng từng ký tự trên bảng chỉ dẫn
- Tiến hành tìm đối tượng trên nguồn do bước 1
cung cấp sau đó so sánh số đối tượng nhận được có
trùng với các ký tự trong bảng chỉ dẫn.
- Tách riêng từng ký tự để nhận dạng.
9
3. PHƯƠNG PHÁP ĐỀ XUẤT
Trích xuất đặc trưng
10
3. PHƯƠNG PHÁP ĐỀ XUẤT
𝐶 + 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤12 𝑥12 = 0
11
3. PHƯƠNG PHÁP ĐỀ XUẤT
Phân lớp: 26 lớp từ ký tự A-Z
A a B b C c D d E e F
H h I
i
J
j
K k L l
O o P
p Q q R r S
s
f
G g
M m N n
T t
U u
V v W w X x Y y Z z
12
3. PHƯƠNG PHÁP ĐỀ XUẤT
Thuộc tính
Khóa
id
Loại Dữ liệu
Primary key
Độ dài
INT
5
Source
VARCHAR
100
Target
VARCHAR
100
13
4. KẾT QUẢ THỰC NGHIỆM
Kết quả nhận dạng với 26 ký tự
14
4. KẾT QUẢ THỰC NGHIỆM
Màn hình thực nghiệm
15
4. KẾT QUẢ THỰC NGHIỆM
Tìm vùng chứa ký tự
Tách các ký tự
Tách ký tự ra khỏi nền
16
4. KẾT QUẢ THỰC NGHIỆM
Màn hình kết quả
17
5. KẾT LUẬN
Ưu điểm chính của giải pháp đề xuất là phát hiện và
nhận dạng được một từ tiếng Anh có trong bảng chỉ
dẫn và dịch sang tiếng Việt
Trong phạm vi đề tài, chúng tôi đã áp dụng xử lý ảnh
để tiền xử lý được ảnh đầu vào, phát hiện ký tự trong
ảnh tìm ra các đặc trưng sử dụng phương pháp học
máy SVM để nhận dạng và dịch sang tiếng Việt trên
máy tính
18
TÀI LIỆU THAM KHẢO
[1] Giang, Nguyễn Linh, and Nguyễn Mạnh Hiển.
"Phân loại văn bản tiếng Việt với bộ phân loại vectơ
hỗ trợ SVM." Tạp chí CNTT&TT, Tháng 6.
[2] Đoàn Phước, Miền. "Nghiên cứu nhận dạng chữ
số và ứng dụng giải Sudoku." (2016).
[3] Nam, Phạm Văn, Nguyễn Thị Lan Hương, and
Trần Hoài Linh. "ứng dụng cây quyết định cho giải
pháp nâng cao chất lượng nhận dạng tín hiệu điện
tim." Tạp chí Khoa học và Công nghệ-Đại học Thái
Nguyên 169.09 (2017): 81-87.
[4] Thị Thảo, Nguyễn, et al. "Phương pháp phân lớp
SVM ứng dụng trong tin sinh học." Tạp chí Khoa học
và Phát triển 9.6 (2015): 1021-1031.
19
TÀI LIỆU THAM KHẢO
[5] Đệ, T. C., & Khang, P. N. (2012). Phân loại văn bản với
Máy học vector hỗ trợ và Cây quyết định. Tạp chí Khoa
học Trường Đại học Cần Thơ, 52-63.
[6] Chang, C. C., & Lin, C. J. (2011). LIBSVM: A library for
support vector machines. ACM transactions on intelligent
systems and technology (TIST), 2(3), 1-27.
[7] Ayyaz, M. N., Javed, I., & Mahmood, W. (2016).
Handwritten character recognition using multiclass svm
classification with hybrid feature extraction. Pakistan
Journal of Engineering and Applied Sciences.
[8] Bo, G., & Xianwu, H. (2006). SVM multi-class
classification. Journal of Data Acquisition &
Processing, 21(3), 334-339.
20
21