Tải bản đầy đủ (.pdf) (21 trang)

NHẬN DẠNG VÀ DỊCH BẢNG CHỈ DẪN TIẾNG ANH SANG TIẾNG VIỆT

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.92 MB, 21 trang )

ỦY BAN NHÂN DÂN TỈNH TRÀ VINH
TRƯỜNG ĐẠI HỌC TRÀ VINH

BÀI THAM LUẬN:

NHẬN DẠNG VÀ DỊCH BẢNG CHỈ DẪN
TIẾNG ANH SANG TIẾNG VIỆT

TRÀ VINH – 06/2020

1


NỘI DUNG

1

GIỚI THIỆU

2

NGHIÊN CỨU LIÊN QUAN

3

PHƯƠNG PHÁP ĐỀ XUẤT

4

KẾT QUẢ THỰC NGHIỆM


5

KẾT LUẬN

2


1. GIỚI THIỆU
 Giai đoạn 1: Phát hiện bảng chỉ dẫn.

 Giai đoạn 2: Nhận dạng các ký tự tiếng Anh
có trong bảng chỉ dẫn.
 Giai đoạn 3: Dịch các ký tự tiếng Anh sang
tiếng Việt.

3


2. NGHIÊN CỨU LIÊN QUAN

• Phương pháp phân lớp SVM [6] được sử
dụng rộng rãi trong nhiều lĩnh vực như y
tế, sinh học, đặc biệt là trong tin học như
[1-4].
• Việc tạo ra thư viện LIBSVM giúp cho các
thử nghiệm liên quan SVM được dễ dàng
hơn

4



2. NGHIÊN CỨU LIÊN QUAN

• Trong nghiên cứu [5] tác giả so sánh hai
kịch bản phân loại văn bản bằng SVM và
cây quyết định.
• Kết quả cho thấy với máy học SVM kết
hợp với phân tích giá trị đơn để rút ngắn
số chiều của không gian đặc trưng sẽ cho
kết quả phân loại văn bản tốt hơn là
phương pháp cây quyết định.
5


2. NGHIÊN CỨU LIÊN QUAN
Các giai đoạn xử lý ảnh

6


2. NGHIÊN CỨU LIÊN QUAN
 Một số mẫu bảng chỉ dẫn lối đi (Bảng chỉ dẫn đường)

 Một số mẫu bảng chỉ dẫn cổng vào tòa nhà

 Một số mẫu bảng chỉ dẫn phòng

7



3. PHƯƠNG PHÁP ĐỀ XUẤT

Ảnh màu

Thu thập dữ
liệu mẫu

Phát hiện vùng
chứa ký tự

Huấn luyện

Tách ký tự

Nhận dạng

Dịch

Tham số SVM
sau khi huấn
luyện

Kết quả

8


3. PHƯƠNG PHÁP ĐỀ XUẤT

Thuật toán: Phát hiện vùng chứa ký tự

 Bước 1: Tìm vùng chứa ký tự trong bảng chỉ dẫn
- Với ảnh xám đầu vào thực hiện phân ngưỡng
(dò biên sobel) và tìm đối tượng.

- Tách các đối tượng có tỉ lệ rộng/dài trong phạm
vi bảng chỉ dẫn để làm nguồn cho bước 2.
 Bước 2: Tách riêng từng ký tự trên bảng chỉ dẫn
- Tiến hành tìm đối tượng trên nguồn do bước 1
cung cấp sau đó so sánh số đối tượng nhận được có
trùng với các ký tự trong bảng chỉ dẫn.
- Tách riêng từng ký tự để nhận dạng.
9


3. PHƯƠNG PHÁP ĐỀ XUẤT
Trích xuất đặc trưng

10


3. PHƯƠNG PHÁP ĐỀ XUẤT
𝐶 + 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤12 𝑥12 = 0

11


3. PHƯƠNG PHÁP ĐỀ XUẤT
 Phân lớp: 26 lớp từ ký tự A-Z

A a B b C c D d E e F

H h I

i

J

j

K k L l

O o P

p Q q R r S

s

f

G g

M m N n
T t

U u

V v W w X x Y y Z z
12


3. PHƯƠNG PHÁP ĐỀ XUẤT

Thuộc tính

Khóa

id

Loại Dữ liệu

Primary key

Độ dài

INT

5

Source

VARCHAR

100

Target

VARCHAR

100

13



4. KẾT QUẢ THỰC NGHIỆM

Kết quả nhận dạng với 26 ký tự

14


4. KẾT QUẢ THỰC NGHIỆM
Màn hình thực nghiệm

15


4. KẾT QUẢ THỰC NGHIỆM

Tìm vùng chứa ký tự

Tách các ký tự

Tách ký tự ra khỏi nền

16


4. KẾT QUẢ THỰC NGHIỆM
Màn hình kết quả

17



5. KẾT LUẬN
 Ưu điểm chính của giải pháp đề xuất là phát hiện và
nhận dạng được một từ tiếng Anh có trong bảng chỉ
dẫn và dịch sang tiếng Việt
 Trong phạm vi đề tài, chúng tôi đã áp dụng xử lý ảnh
để tiền xử lý được ảnh đầu vào, phát hiện ký tự trong
ảnh tìm ra các đặc trưng sử dụng phương pháp học
máy SVM để nhận dạng và dịch sang tiếng Việt trên
máy tính

18


TÀI LIỆU THAM KHẢO
[1] Giang, Nguyễn Linh, and Nguyễn Mạnh Hiển.
"Phân loại văn bản tiếng Việt với bộ phân loại vectơ
hỗ trợ SVM." Tạp chí CNTT&TT, Tháng 6.
[2] Đoàn Phước, Miền. "Nghiên cứu nhận dạng chữ
số và ứng dụng giải Sudoku." (2016).
[3] Nam, Phạm Văn, Nguyễn Thị Lan Hương, and
Trần Hoài Linh. "ứng dụng cây quyết định cho giải
pháp nâng cao chất lượng nhận dạng tín hiệu điện
tim." Tạp chí Khoa học và Công nghệ-Đại học Thái
Nguyên 169.09 (2017): 81-87.
[4] Thị Thảo, Nguyễn, et al. "Phương pháp phân lớp
SVM ứng dụng trong tin sinh học." Tạp chí Khoa học
và Phát triển 9.6 (2015): 1021-1031.
19



TÀI LIỆU THAM KHẢO
[5] Đệ, T. C., & Khang, P. N. (2012). Phân loại văn bản với
Máy học vector hỗ trợ và Cây quyết định. Tạp chí Khoa
học Trường Đại học Cần Thơ, 52-63.
[6] Chang, C. C., & Lin, C. J. (2011). LIBSVM: A library for
support vector machines. ACM transactions on intelligent
systems and technology (TIST), 2(3), 1-27.
[7] Ayyaz, M. N., Javed, I., & Mahmood, W. (2016).
Handwritten character recognition using multiclass svm
classification with hybrid feature extraction. Pakistan
Journal of Engineering and Applied Sciences.
[8] Bo, G., & Xianwu, H. (2006). SVM multi-class
classification. Journal of Data Acquisition &
Processing, 21(3), 334-339.
20


21



×