Huỳnh Hữu Hưng, Nguyễn Trọng Nguyên
NHẬN DẠNG DẤU THANH VÀ MŨ TRONG KÝ TỰ TIẾNG VIỆT VIẾT TAY
RECOGNIZING ACCENT IN VIETNAMESE HANDWRITING
CHARACTERS
TẠP CHÍ
KHOA HỌC VÀ CƠNG NGHỆ, ĐẠI HỌ
Huỳnh Hữu Hưng, Nguyễn Trọng Nguyên
Trường Đại học Bách khoa, Đại học Đà Nẵng; Email: ,
hướng đ
trên: nhậ
tốn thấp
Tóm tắt – Nhận dạng ký tự viết tay là chủ đề đang được nghiên cứu
rộng rãi hiện nay. Nhiều giải pháp được áp dụng cho ký tự tiếng Anh
và mang lại hiệu quả cao. Tuy nhiên, bài toán tiếng Việt đang đối
mặt với nhiều thách thức, phần lớn vấn đề đến từ dấu mũ và dấu
thanh (gọi chung là dấu). Bài báo này đề xuất một giải pháp nhận
dạng dấu, kể cả trong trường hợp mũ và thanh trong ký tự dính liền
nhau – một vấn đề rất phổ biến và ảnh hưởng đáng kể đến kết quả
nhận dạng. Chúng tôi bắt đầu với việc tách riêng dấu và chữ cái
bằng kĩ thuật gán nhãn vùng liên thông. Tiếp theo, dấu được phân
vào hai lớp: dấu đơn (một dấu mũ hoặc dấu thanh) hoặc dấu kép
(mũ và thanh dính liền nhau). Dấu kép (nếu có) tiếp tục được tách
ra thành các dấu đơn để chuẩn bị cho bước xử lý cuối cùng. Q
trình nhận dạng được thực hiện bằng phương pháp mơ hình Markov
ẩn. Giải pháp đề xuất đã được thử nghiệm và thu được kết quả khả
quan.
3. Phươ
Abstract – Handwriting character recognition is one of the most
common research topics. Many approaches have applied to English
N
characters and achieve high accuracy. However, the complexities
bước xử
in the language of each country are not same. Recognizing
Vietnamese handwriting character is facing many problems, most
Việt. Mô
of them come from the accent. This paper focuses on accent
được thể
recognition, especially when there is a connection between two
accents - a common problem which affects the identification result.
Hình 1. Các
dấu
được
nghiên cứu
và một
ví dụ về using
Our approach
starts
with
separating
accent
fromsốcharacter
the connected-component
method.
The obtained accent
ký tự có sựlabeling
xuất hiện
nhiều dấu
then is checked if it is single or multiple (the combination of many
accents).
In the
second
case,
accent is extracted for the last
2. Các
nghiên
cứu
liêneach
quan
processing step. The recognition is performed using hidden Markov n = 1
Hiệnsingle
nay, accent.
nhiều Proposed
hướng tiếp
cận has
chobeen
vấn tested
models with each
solution
and obtained
accuracy.
đề nhậnhigh
dạng
ký tự viết tay bằng kĩ thuật xử lý
Từ khóa – ký tự viết tay tiếng việt; dấu mũ; dấu thanh; bộ phát hiện
góc; tách nhánh; mơ hình Markov ẩn.
Key words
vietnamese
character;
ảnh đã –được
đưa ra. handwriting
Mục tiêu chung
đượcaccent;
đặt racorner
detector; branch separating; hidden Markov models.
1. Đặt vấn đề
Chủ đề nhận dạng ký tự viết tay đã được nghiên cứu
trong suốt hơn 40 năm qua. Ngôn ngữ được hướng đến nhiều
nhất là tiếng Anh, trong đó mỗi ký tự chỉ gồm một chữ cái,
do đó kết quả thường cao hơn các ngơn ngữ khác. Phần lớn
các nghiên cứu đều tập trung vào bảng chữ cái Latinh hơn
là ký tự có dấu, nguyên nhân là bởi độ phức tạp trong cách
biểu diễn và nhận dạng dấu. Tiếng Việt là một ngôn ngữ
phức tạp với mỗi ký tự có thể chứa một hoặc hai dấu. Do
đó, kết quả nghiên cứu trên tiếng Việt khá hạn chế, độ chính
xác chỉ cao khi ký tự được viết một cách lý tưởng, nghĩa
là các dấu trong một ký tự được tách bạch rõ ràng. Phương
pháp do chúng tôi đề xuất hướng đến việc giải quyết vấn đề
tồn tại sự liên kết của các dấu trong một ký tự, được thực
hiện bởi sự kết hợp của nhiều kĩ thuật xử lý ảnh trên miền
không gian.
Dấu trong tiếng Việt được chia thành hai nhóm (mũ và
thanh) như trong Hình 1, trong đó dấu nặng khơng được đề
cập vì nó xuất hiện bên dưới chữ cái chính trong ký tự, nên
khơng có sự liên kết với bất kỳ dấu khác.
là làm cho máy tính thu nhận và hiểu được ký tự
viết tay đầu vào. Mơ hình tổng quan của một hệ
được ký tự viết tay đầu vào. Mơ hình tổng quan của một hệ
thống nhận dạng ký tự viết tay được trình bày
thống nhận dạng ký tự viết tay được trình bày trong Hình 2.
trong hình 2.
Ký tự
viết tay
Tiền xử lý
Nh
d
K
Phân đoạn
H
Phân lớp
Trích
đặc trưng
Hậu xử lý
Đầu ra
Đ
dấu và
nhãn vùn
dưới dấu
ký tự tiế
dấu. Mộ
‘o’, ‘ó’,
2. Các nghiên cứu liên quan
Tr
gồm 1 v
Hai cứu
nghiên
đây dạng
về nhận
ký đượcnhư một
Hai nghiên
gần cứu
đây gần
về nhận
ký tựdạng
có dấu
trìnhtự
bàycótrong
Sau khi
hiện
phânkhi
đoạn đểdụng ch
dấu [1][2].
được trình
bàythực
trong
[1,bước
2]. Sau
thu được
tác phân
giả sửđoạn
dụngđể
45thu
đặcđược
trưngdấu,
và nhận
thựcdấu,
hiệncác
bước
các dạngdùng để
bằngtác
máy
tựa. Kết
quảtrưng
thử nghiệm
cho
thấybằng
giải phápgồm 3 th
giảvectơ
sử dụng
45 đặc
và nhận
dạng
này đạt
hiệu
quả
khá
cao
và
ổn
định.
Tuy
nhiên,
cách viếtcái cần n
máy vectơ tựa. Kết quả thử nghiệm cho thấy giải
ký tự được đề cập trong 2 bài báo này quá lý tưởng, cụ thể làđược th
pháp này đạt hiệu quả khá cao và ổn định. Tuy
các dấu được viết tách biệt, điều này không phải luôn đúngMarkov
nhiên, cách viết ký tự được đề cập trong 2 bài
trong các văn bản viết tay. Ngoài ra, hệ thống cần nhiều thời
này toán
quá lýbởi
tưởng,
cụ thểđặc
là các
dấu
viết đối
Tr
gian báo
để tính
số lượng
trưng
lớnđược
và tương
tách
biệt,
điều
này
khơng
phải
ln
đúng
trong
gồm
hai
phức tạp.
các văn bản viết tay. Ngồi ra, hệ thống cần
vùng dấ
Giải pháp được đề xuất trong bài báo này hướng đến khả
nhiều thời gian để tính tốn bởi số lượng đặc
hai dấu đ
năng giải quyết cả hai vấn đề trên: nhận dạng dấu kép và yêu
trưng
lớn
và
tương
đối
phức
tạp.
này, chú
cầu chi phí tính tốn thấp hơn.
thành cá
Giải pháp được đề xuất trong bài báo này
3. Phương2pháp đề xuất
Hiện nay, nhiều hướng tiếp cận cho vấn đề nhận dạng ký
tự viết tay bằng kĩ thuật xử lý ảnh đã được đưa ra. Mục tiêu
chung được đặt ra là làm cho máy tính thu nhận và hiểu
Nội dung phần này trình bày cụ thể từng bước xử lý để
nhận dạng dấu trong ký tự tiếng Việt. Mơ hình tổng quan
của giải pháp đề xuất được thể hiện trong Hình 3.
Hình 1: Các dấu được nghiên cứu và một số ví dụ
về ký tự có sự xuất hiện nhiều dấu
Hình 2: Tổng quan hệ thống nhận dạng ký tự viết tay
Hình 2. Tổng quan hệ thống nhận dạng ký tự viết tay
21
Việt. Mơ hình tổng quan của giải pháp đề xuất
TẠP CHÍ
KHOA
CƠNG
được
thể HỌC
hiện VÀ
trong
hìnhNGHỆ,
3. ĐẠI HỌC ĐÀ NẴNG - SỐ 1(74).2014.QUYỂN II
ví dụ về
cho vấn
ật xử lý
ợc đặt ra
ợc ký tự
a một hệ
rình bày
n đoạn
n=1
n=3
Nhận dạng
dấu đơn
Phân đoạn
n=
số vùng liên thơng
Nhận dạng
chữ cái
n=2
dấu đơn
Hình 4: Ký tự ‘ỗ’ với chữ cái ‘o’, dấu ‘∧’ và ‘∼’
Kiểm tra dấu
đơn hay kép
dấu kép
Kết luận
dấu đơn
Phân tách dấu
kép
Hình 3: Tổng quan giải pháp đề xuất
Hình 3. Tổng quan giải pháp đề xuất
3.3. Nhận dạng chữ cái
Các chữ cái riêng biệt trong bảng chữ tiếng Việt có thể
được nhận dạng hiệu quả thơng qua các giải pháp được áp
dụng cho bảng chữ tiếng Anh. Bước này không nằm trong
nội dung trọng tâm mà bài báo muốn đề cập nên phần này
khơng được trình bày chi tiết.
3.4. Kiểm tra dấu “đơn” hay “kép”
MộtĐẠI
số trường
phổ- biến
của dấu kép được thể hiện
TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ,
HỌC ĐÀhợp
NẴNG
SỐ …………..
Đầu tiên,
ký tiên,
tự đầukývào
được
tách
riêngHỌC
dấu VÀ
và
chữ
cái trong ĐẠI
Đầu
tự
đầuCHÍ
vào
được
tách
riêng
HìnhHỌC
5. ĐÀ NẴNG - SỐ …………..
TẠP
KHOA
CƠNG NGHỆ,
Sau
các
dấu
đơn
được
nhận
dạng
bằng
chínhdấu
bằngvàphương
gánbằng
nhãnnày
vùng
liên
thơng,
trong
chữ đó,
cáipháp
chính
phương
pháp
gán
Sau
đó,
các
dấu
đơn
này
được
nhận
dạng
bằng
phương
pháp
mơ
hình
Markov
ẩn
như
đã
đề
đó chữ
cái
nằm
bên
dưới
dấu.
Số
lượng
vùng
lớn
nhất
có
thể
nhãn vùng liên thơng, trong đó chữ cái nằm bên cập.
rích
trongphương
ký tự tiếng Việt
là hình
3, baoMarkov
gồm
chữ
cái
và 2hình
dấu.
mơ
ẩn
như
đề cập.
bước
lý 1cụ
thểcó
trong
3Một
được
dưới dấu.pháp
Số Các
lượng
vùngxửlớn
nhất
thểđãtrong
trưng
(a)
(b)
(c)
(d)
(e)
(f)
số ví dụ cụ thể
cho
từng
trường
hợp
là:
‘o’,
‘ó’,
và
‘ố’
tương
trìnhViệt
bày trong
theo.
ký tự tiếng
là 3, nội
baodung
gồm tiếp
1 chữ
cái và 2
ứng với 1, 2,Các
và 3bước
vùng. xử lý cụ thể trong hình 3 được
Hình 5.(b)
Một số ví
liên kết giữa(e)
các dấu gồm
(a)
(c)dụ về sự (d)
(f)
dấu. Một
số
ví dụnội
cụ dung
thể cho
từng trường hợp là:
trình
bày
trong
3.1.
Tiền
xử
lý
‘^ˀ’, ‘^~’ và ‘^`’
Trường
hợp
đơn
giản
nhất
là tiếp
ký tựtheo.
chỉ bao gồm 1 vùng.
Hình
5:
Một
số
ví
dụ
về
liên
kết
giữa
các
dấu
gồm
Hình
5.
Một
số
ví
dụ
về
sự
liên
kết
giữa
các
dấu
gồm
‘o’, ‘ó’, và ‘ố’ tương ứng với 1, 2, và 3 vùng.
ầu ra
Khi đó,
tự được
mặc nhiên
xem
như
mộtkhi
chữ
Các
Nhiễu
thường
xuất
hiện
sửcái.
dụng
thiết
‘ mỗi
’, ‘ ’dấu
và ‘ kép
’
Ta thấy rằng
ở
hình
5
tồn
tại
3.1.kýTiền
xử
lý
‘^ˀ’, ‘^~’ và ‘^`’
hợp
đơn
giảncho
nhấtchữ
là ký
tựtay
chỉ
bao xác
phương phápTrường
nhận
dạng
áp dụng
viếtđộ
tiếng
Anhkhi
bị
qt
quang
học
làm
giảm
chính
một
góc
vớimỗi
3 (a,dấu
b, kép
d) hoặc
4 (e,5 tồn
f) nhánh
tương
Ta
thấy
rằng
ởdấu
Hình
tại một
góc tại
với 3
thường
hiện
khi
sửcódụng
thiết
ự viết taycó thểgồm
1 Nhiễu
vùng.
Khi
đó,
kýxuất
tự
mặc
nhiên
xem
Ta
thấy
rằng
mỗi
kép
ở 2hình
5 tồn
được
dùng
xác
định
ký
tự.
Với
trường
hợp
ký
tự
nhận để
dạng.
Ngồi
ra,được
nhiễu
cũng
thể
xuất
hiện(a, b,ứng,
hoặc
hai
góc
với
mỗi
góc
gồm
nhánh
(c),
d)
hoặc
4
(e,
f)
nhánh
tương
ứng,
hoặc
hai
góc
với
mỗi
như
mộttrên
chữảnh
cái.
Các
phương
pháp
dạng
áp
qt
quang
làm
giảm
độ
chính
3 thành
phần,
tahọc
có hai
dấu
đơn
vànhận
một
chữ
cái khi
cần
góc
vớimỗi
3(c),
(a,
b,đơn
d)khi
hoặc
(e,xuất
f)
nhánh
tương
dạng kýgồm bị
trong
q
trình
thu
nhận
và xác
truyền
dẫn.gócmột
trong
dấutrong
chỉ
có 4thể
đa xuất
gồm
2 khi
nhánh
mỗi
dấu
đơnhiện
chỉ tối
có thể
dạng.dạng.
Quá
nhận
dạng
dấu
đơn được
thực
hiện
bởikhi ứng, hoặc hai góc với mỗi góc gồm 2 nhánh (c),
dụng
cho
chữ
viết
tay
tiếng
Anh
có
thể
được
Ngồi
nhiễu
có
xuất
hiện
Sau khinhậnnhận
Dotrình
đó,
khửra,
nhiễu
là cũng
bước
cầnthể
thiết
trước
góc
vớigóc
2 nhánh
(dấu ‘^’).
Do‘∧’).
đó, một
dấumột
là dấu
hiện một
tối đa
một
với 2 nhánh
(dấu
Do đó,
phương
pháp
mơ
hình
Markov
ẩn,
sẽ
được
trình
bày
trong
dùngảnh
đểthực
xác
định
kýtrình
tự. Với
trường
hợp
ký Chúng
tự dẫn. tơilà “đơn”
dấu, các
trên
trong
q
thu
nhận
truyền
hiện
các
cơng
đoạn
xử lývà
chính.
trong
khihay
mỗi
dấu
đơnthể
chỉ
có thể
tối điểm
đa
hay
“kép”
có thể
được
xác
địnhxuất
dựa hiện
trên trên
đặc
“đơn”
“kép”
có
được
xác
định
dựa
phần gồm
sau. 3 thành phần, ta có hai dấu đơn và một chữ
ng bằng
Q
trình
tươngtrình
ứng xử
được
bày
chiđược
tiết
sửkhử
dụng
bộ lọc
có thiết
mặt nạ
kích khi
thướcnày.
Do đó,
nhiễu
là trung
bước vịcần
trước
đặcgóc
điểm
này.
Q
lý trình
tương
ứng
một
vớixử
2 lýnhánh
(dấu
‘^’).
Do
đó,
một
dấutrong
là
cịndạng.
lại,hợp
tương
ứng
với
kýdạng
tự gồm
hai
cái cầnhợp
nhận
Q
trình
nhận
dấu
đơnthành
hấy giải Trường
Hình
6.
33
kết
với
các
phép
biến
đổi
hình
thái
là
trình
bày
chi
tiết
trong
hình
6.
thực
hiện
các
đoạnbởixửvùng
lý chính.
tơi
“đơn” hay “kép” có thể được xác định dựa trên
có độ
phức
tạpcơng
cao
nhất
dấumơ
cóChúng
thể
là một
thực
hiện
bởi
pháp
hình
nh. Tuyphần,được
đóng
và
mởtrung
ảnhphương
[3].
sử
dụng
bộ
lọc
vị
có
mặt
nạ
kích
thước
đặc điểm này. Q trình
lý tương ứng được
dấu đơn
duy nhất
hoặc
haitrình
dấubày
đơntrong
dính phần
liền nhau.
Làmxử
mảnh
Markov
ẩn, sẽ
được
sau. Để giải
ng 2 bài
quyết33
vấn đề
này,
chúng
tơi
hiện
kiểm
và tách
kết3.2.
hợp
vớiđoạn
cácthực
phép
biến
đổitrahình
tháidấu
là
Phân
trình
bày
chi
tiết
trong
hình
6.
ược viết
Trưởng hợp cịn lại, tương ứng với ký tự
thànhđóng
các dấu
đơn ảnh
nếu
dấu
đang
xét
dấu kép.trọng
Sau đó,
các
và thành
mở
[3].có
Đây
bướcphức
xửlàlý
ký tự
ng trongdấu đơn
gồmnày
hai được
phần,là
tạpquan
caopháp
nhất mơ
bởivìhình
Làm mảnh
nhận
dạngđộbằng
phương
n=0
tiếng
Việt
thường
bao
gồm
một
chữ
cái
cùng
với
n = số góc
Định vị góc
ống cầnMarkov
vùng
dấu
thểcập.
là một dấu đơn duy nhất hoặc
3.2.
đoạn
ẩnPhân
như có
đã
đề
một
hoặc
hai dấu,
víĐể
dụgiải
nhưquyết
‘á’, ‘â’,
‘ă’,
‘ấ’ với
ợng đặc
hai
dấu
đơn
dính
liền
nhau.
vấn
đề
Các bướcĐây
xử lýcái
thể trong
3 Đầu
được
trìnhphương
bàyký
trong
làcụbước
xử Hình
lý
quan
trọng
vì
tự
n>0
chữ
ứng
là ‘a’.
này,tiếp
chúng
tơi tương
thực hiện
kiểm
tra vàtiên,
tách dấu pháp
nội dung
theo.
n=0
tiếng
thường
baodấu
gồmđang
mộtxét
chữ
cái
với để
gándấu
nhãn
liên
thông
[4]làđược
sử dụng
n = số góc
Định vị góc
thành Việt
các
đơnvùng
nếu
dấu cùng
kép.
báo này
bi = số nhánh
Xét n max(bi)=2 Đếm số nhánh
3.1. Tiền
xử tách
lý hairiêng
phần
ký tự.
một hoặc
dấu,từng
ví dụ
nhưtrong
‘á’, ‘â’,
‘ă’,Sau
‘ấ’đó,
vớicác
tại góc thứ i
tại mỗi góc
phần
này
được
phân
vàotiên,
2thiết
lớp,
ứng với
n>0
chữ cái
tương
ứng
làkhi
‘a’.
phương
pháp
Nhiễu
thường
xuất
hiện
sửĐầu
dụng
bịtương
qt quang
n>1
dấu
và
chữ
cái,khi
dựa
trên
vịđược
tríNgồi
của
gángiảm
nhãn
liên
thơng
[4]dạng.
sửmỗi
dụng
đểvới
học làm
độvùng
chính
xác
nhận
ra, phần
nhiễu
n=1
bi = số
nhánh
max(b
)=2
Đếm số nhánh max(b
Xét
n
đối
tượng
nằm
dưới
cùng
là
chữ
cái.
Một
ví
dụ
i
cũngtách
có thểriêng
xuất hiện
ảnhtrong
trong ký
q tự.
trìnhSau
thu đó,
nhậncác
và
i)>2
từngtrên
phần
tại
góc
thứ i
tại
mỗi
góc
minh
họa
được
trình
bày
trong
hình
4.
truyền dẫn. Do đó, khử nhiễu là bước cần thiết trước khi
Dấu đơn
Dấu kép
phần này được phân vào 2 lớp, tương ứng với
thực hiện các công đoạn xử lý chính. Chúng tơi sử dụng bộ
n>1
dấu vị
vàcóchữ
dựathước
trên vị
củahợp
mỗi
với
lọc trung
mặtcái,
nạ kích
3×trí
3 kết
vớiphần
các phép
Hình 6: Quá trình kiểm tra dấu
n=1
Hình 6. Quá trình kiểm tra dấu max(bi)>2
tượng
dướivàcùng
là [3].
chữ cái. Một ví dụ
biến đối
đổi hình
tháinằm
là đóng
mở ảnh
Bộ phátBộ
hiện
(định
góc được
xâyđược
dựngxây
dựadựng
trên tốn
minh họa được trình bày trong hình 4.
phát
hiệnvị)(định
vị) kép
góc
Dấu đơn
Dấu
3.2. Phân đoạn
tử Plessey
được
mơtửtảPlessey
trong [6].
Số mơ
lượng
nhánh[6].
tại mỗi
dựa trên
tốn
được
tả trong
Số góc
tính bằng
một
phương
pháp
đơn
giản.
Chúng
tơi định
Đây là bước xử lý quan trọng vì ký tự tiếng Việt thường đượclượng
nhánh tại mỗi góc được tính bằng một
một đường
trịn
có
bán
kính
3
điểm
ảnh
và
tâm đặt
bao gồm một chữ cái cùng với một hoặc hai dấu, ví dụ như nghĩaphương
Hình đơn
6. Q
trình
kiểm tra
pháp
giản.
Chúng
tơi dấu
định nghĩa
Hình
tự ‘ỗ’ứng
với chữ
cáiĐầu
‘o’, tiên,
dấu ‘^’
và ‘~’ tại góc. Tiếp theo
ta xác định các điểm ảnh của đối tượng
‘á’, ‘â’, ‘ă’, ‘ấ’ với
chữ4.cáiKýtương
là ‘a’.
phương
một đường
trịn
có (định
bán kính 3góc
điểm
ảnh xây
và tâm
phát
hiện
được
dựngnên
trên Bộ
đường
trịn.
Lúc này, vị)
dấu đã được
làm mảnh
pháp gán nhãn
liên
thơng
3.3.vùng
Nhận
dạng
chữ[4]
cáiđược sử dụng để tách nằm đặt
tại
góc.
Tiếp
theo
ta
xác
định
các
điểm
ảnh
Plessey
đượcứng
mơvới
tả số
trong
[6].tạiSốgóc
điểmtrên
ảnhtốn
đượctử
xác
định tương
nhánh
riêng từng phần trong ký tự. Sau đó, các phần này được số dựa
Các chữ cái riêng biệt trong bảng chữ
của
tượng nằm trên đường tròn. Lúc này, dấu
xét.đối
phân vào 2 lớp, tương ứng với dấu và chữ cái, dựa trên vị trí đang
lượng
nhánh tại mỗi góc được tính bằng một
Việttượng
có thể
được
nhận
dạng
hiệucái.
quảMột
thơng
đã được làm mảnh nên số điểm ảnh được xác
của mỗi phầntiếng
với đối
nằm
dưới
cùng
là chữ
Nếu
dấu pháp
được xác
là dấu
đơn, việc
được
phương
đơnđịnh
giản.
Chúng
tơi nhận
địnhdạng
nghĩa
Hình
4.
Ký
tự
‘ỗ’
với
chữ
cái
‘o’,
dấu
‘^’
và
‘~’
qua
các
giải
pháp
được
áp
dụng
cho
bảng
chữ
định
tương
ứngđó
vớivới
sốcác
nhánh
tại
gócMarkov
đang xét.
ví dụ minh họa được trình bày trong Hình 4.
thực
hiện
ngay
sau
mơ
hình
ẩn.
Ngược
trịn có bán kính 3 điểm ảnh và tâm
tiếng Anh. Bước này không nằm trong nội dung một đường
Nếu dấu được xác định là dấu đơn, việc
3.3.
Nhận
dạng
chữ
cái
tại góc. Tiếp theo ta xác định các điểm ảnh
22
trọng tâm mà bài báo muốn đề cập nên phần này đặtnhận
dạng được thực hiện ngay sau đó với các
3.5.2. Phân nhóm các nhánh
Việc phân chia các nhánh vào hai nhóm
lại, dấu kép được phân tách thành các dấu đơn trước khi
được thực hiện bằng cách chọn 2 nhánh đưa vào
nhận dạng.
nhóm 1 và các nhánh cịn lại được đưa vào nhóm
3.5. Phân tách dấu kép 2
2. Do đó, ta có Cn cách phân nhóm.
Bước này được thực hiện dựa trên cả ảnh ban đầu và
Cáccủa
nhánh
mỗi
nhóm
biểu
ảnh làm mảnh
dấu. ởCác
điểm
ảnhmang
tại vị ýtrínghĩa
góc trong
ảnh ban
được
bỏtrong
dựa trên
độđang
góc (và
diễnđầu
một
dấuloại
đơn
dấutọa
kép
xét.vùng
Nếulân
ta
cận của
được liên
từ ảnh
làm
mảnh
nhằmdựa
mụctrên
đíchvịtách
chỉgóc)
đơnthu
thuần
kết
các
nhánh
trí
riêng từng nhánh tương ứng với góc đang xét. Tiếp theo, các
của chúng trong ảnh ban đầu, dấu đơn thu được
nhánh được gom vào 2 nhóm, tương ứng với 2 dấu đơn cần
nên khơng đầy đủ do các điểm ảnh tại góc đã
nhận trở
dạng.
bị loại bỏ. Vì vậy, chúng tơi sử dụng phép trừ
ảnh để xác định dấu đơn tương ứng với mỗi
Tọa độ điểm góc đã xác định ở q trình kiểm tra dấu
nhóm. Cụ thể, với mỗi nhóm, chúng tơi tiến
được sử dụng để tách riêng các nhánh như sau:
hành trừ đi các nhánh trong nhóm đó trên ảnh
• Loại bỏ điểm góc hiện tại
ảnh lân
đơncận)
tương ứng với các
• gốc
Đặt rđể= 1thu
(bánđược
kính vùng
nhánh
trong
nhóm
cịn
lại.
Một
ví dụ cụ thể được
• Đặt n = số vùng liên thơng
4. Kết quả thử nghiệm
Huỳnh
Nguyễn
Trọngvề
Ngun
Hiện nay chưa
cóHữu
bộHưng,
dữ liệu
chuẩn
ký
viếtsánh
taykết
tiếng
đềđểxuất
được
có tự
sự so
quả Việt
nhận nên
dạnggiải
các pháp
cặp dấu
chọn
ra kết
quảthử
chính
xác nhất.
dấu,bộ.
6 xác
ứng
nghiệm
vớiVới
dữtừng
liệucặpcục
Cácsuất
ký(tương
tự này
vớiđược
6 lớp)lấy
củatừ
mỗi
dấu
đơn
được
tính
tốn
và
dấu
này
được
nguồn dữ liệu mở của các sinh viên
gán vào lớp cho xác suất đầu ra cao nhất.
trường Đại học Bách khoa Hà Nội [8] và một
Sau khi thu được các giá trị xác suất cao nhất tương ứng
phần do nhóm tác giả tự thu thập. Mỗi ảnh trong
với mỗi cặp dấu, chúng tơi tính tổng xác suất từng cặp và so
bộđểdữchọn
liệurachứa
một
tựtổng
tiếngcao
Việt
cóKết
dấu.
sánh
cặp có
xácký
suất
nhất.
quảQ
nhận
trình
tách
dấu
được
thực
hiện
thủ
cơng
để
dạng của cặp dấu đơn này được xem là kết quả cuối phục
cùng.
vụ cho việc huấn luyện. Một số ký tự được trình
4. Kết quả thử nghiệm
bày trong hình 8.
3.5.1. Tách các nhánh
• Lặp lại4 các bước sau đến khi n > 1
– r=r+1
– Xóa điểm ảnh thuộc vùng lân cận r×r
– n = số vùng liên thơng hiện tại
• Lấy tất cả nhánh đã tách
Sau khi thực hiện q trình tách nhánh cho các góc trong
mỗi dấu, ta thu được một tập hợp các nhánh riêng lẻ. Lưu
ý rằng với dấu kép có góc nối 3 nhánh (hình 5a) thì chỉ góc
này được tách nhánh; ngược lại, với dấu kép có hai góc 2
nhánh (Hình 5c), bước tách nhánh được thực hiện với cả
hai góc.
3.5.2. Phân nhóm các nhánh
Việc phân chia các nhánh vào hai nhóm được thực hiện
bằng cách chọn 2 nhánh đưa vào nhóm 1 và các nhánh cịn
lại được đưa vào nhóm 2. Do đó, ta có cách phân nhóm.
Các nhánh ở mỗi nhóm mang ý nghĩa biểu diễn một dấu
đơn trong dấu kép đang xét. Nếu ta chỉ đơn thuần liên kết
các nhánh dựa trên vị trí của chúng trong ảnh ban đầu, dấu
đơn thu được trở nên không đầy đủ do các điểm ảnh tại góc
đã bị loại bỏ. Vì vậy, chúng tôi sử dụng phép trừ ảnh để
xác định dấu đơn tương ứng với mỗi nhóm. Cụ thể, với mỗi
nhóm, chúng tơi tiến hành trừ đi các nhánh trong nhóm đó
trên ảnh gốc để thu được ảnh đơn tương ứng với các nhánh
trong nhóm cịn lại. Một ví dụ cụ thể được trình bày trong
Hình 7.
Hình 7: 3 cách chia nhóm cho 1 dấu kép (‘∧’và ‘∼’)
3.5.3. Nhận dạng từng cặp dấu đơn
Q trình này được thực hiện dựa trên mơ hình Markov
ẩn [7] và đặc trưng mã xích [5] (chain code). Phương pháp
học máy này được chọn vì mức độ hiệu quả cao và cần thiết
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI
Việc huấn luyện được thực hiện với 120
xác th
mẫu
ứng
với VÀ
số (Ỗ)
lượng NGHỆ,
thể ĐẠ
là g
(Â) cho
(Â)mỗi
(Ã)dấu đơn,
(Ă)
(Ấ)KHOA
(Ể)
TẠP tương
CHÍ
HỌC
CƠNG
Hình
Một
số
ký
tự
có
dấu
trong
tập
dữ
liệu
mẫuHình
huấn8.8:luyện
là
720.
Tập
mẫu
thử
nghiệm
ký tự có
dấu thực
tronghiện
tập dữ
5. Kết
Việc Một
huấnsốluyện
được
vớiliệu
120
được
chia
thành
2
nhóm,
nhóm
đầu
tiên
chứa
các
Hiện
bộđơn,
dữ liệu
chuẩnứng
về ký
viếtlượng
tay tiếng
mẫu nay
cho chưa
mỗi có
dấu
tương
vớitựsố
với tổng
số mẫu
300
chia với
đềudữ
cho
Việtdấu
nênđơn
giải
đề xuất
đượclà
thử
nghiệm
liệu6 cục
mẫu
huấnpháp
luyện
là 720.
Tập
mẫu thử
nghiệm
mới để
nhóm
cịnđược
lại gồm
mẫudữtương
ứng
bộ. lớp,
Các ký
tự này
lấy từ320
nguồn
liệu mở
củavới
các8sinh
được chia thành 2 nhóm, nhóm đầu tiên chứa các
viêndấu
trường
Hà với
Nội nhóm
[8] và dấu
một đơn
phần do tự viết
kép.Đại
Kếthọc
quảBách
thử khoa
nghiệm
dấu
đơn
vớithu
tổng
sốMỗi
mẫuảnh
là trong
300 chia
đều
cho
6một bằng
thấp nv
nhóm
tác
giả
tự
thập.
bộ
dữ
liệu
chứa
được trình bày ở bảng 1.
lớp,
nhóm
lại gồm
ứng thực
với 8hiện thuật
xác thg
ký tự
tiếng
Việtcịn
có dấu.
Q320
trìnhmẫu
táchtương
dấu được
Kết quả
nhận
dạngvới
dấunhóm
đơn dấu đơn
dấu kép.
Kết1.vụ
quả
nghiệm
thủ cơng
đểBảng
phục
chothử
việc
huấn
luyện.
Một
số ký tự được đang
thể làx
trìnhđược
bàyDấu
trong
Hìnhở8.bảng 1.
trình bày
đơn
và
5. Kết
Bảng
1:
Một
số
ký
tự
có
dấu
trong
tập
dữ
liệu
Bảng 1. Kết quả nhận dạng dấu đơn
xích k
Mẫu thử
50 50 50 50 50 50
dụng c
Dấu
mới đ
Nhận dạng 48 49 46 42 43 41
Ưu điể
tự viế
Mẫu thử
50 50 50 50 50 50
có thể
Tỉ lệ
96% 98% 92% 84% 86% 82%
bằng v
cặp dấ
Nhận dạng 48 49 46 42 43 41
thuật
Trung bình
89.7%
tính to
đang x
Tỉ lệ
96% 98% 92% 84% 86% 82%
theo th
Với nhóm dấu kép, kết quả tách dấu khá
đơn v
Trung
bình
khả
quan
khi độ chính xác89.7%
trung bình lên đến
xích k
hơn 94%.
dụng
Với nhóm dấu kép, kết quả tách dấu khá
Bảng
2: Kết
quả
phân
tách
dấukép
kép
Bảng
2.
Kết
quả
phân
tách
dấu
Ưu đi
khả quan khi độ chính xác trung bình lên đến
có thể
hơn
94%.
Dấu Số mẫu thử Tách chính xác
Tỉ lệ
cặp dấ
Bảng 2. Kết quả phân tách dấu kép
40
38
95.0%
tính to
Dấu Số mẫu thử Tách chính xác
Tỉ lệ
theo th
40
40
100%
40
38
95.0%
40
39
97.5%
này sẽ
40
40
100%
40
38
95.0%
áp dụn
40
39
97.5%
khơng
40
36
90.0%
chính
40
38
95.0%
40
40
100%
hiệu q
40
36
90.0%
40
35
87.5%
này sẽ
40
40
100%
40
37
92.5%
áp dụn
40
35
87.5%
khơng
Độ chính xác trung bình: 94.7%
chính
Trong bảng 1, hai dấu có tỉ lệ nhận dạng
hiệu q
TÀIcho
LIỆU
Việc huấn luyện được thực hiện với 120 mẫu
mỗiTHAM
thấp nhất là ‘^’ và ‘~’. Các kết quả khơng chính
dấu [1]
đơn, De
tương
ứngTran
với số
lượng mẫu
luyện method
là 720. for o
Cao
(2012),
“An huấn
efficient
recognition”, Proceedings of the Third Symposiu
23
TÀI LIỆU
THAM
TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 1(74).2014.QUYỂN II
Tập mẫu thử nghiệm được chia thành 2 nhóm, nhóm đầu
tiên chứa các dấu đơn với tổng số mẫu là 300 chia đều cho
6 lớp, nhóm còn lại gồm 320 mẫu tương ứng với 8 dấu kép.
Kết quả thử nghiệm với nhóm dấu đơn được trình bày ở
Bảng 1.
Với nhóm dấu kép, kết quả tách dấu khá khả quan khi
độ chính xác trung bình lên đến hơn 94% (Bảng 2).
5. Kết luận
Bài báo này trình bày một cách tiếp cận mới để giải
quyết vấn đề nhận dạng dấu trong ký tự viết tay tiếng Việt.
Giải pháp đề xuất bắt đầu bằng việc xác định dấu trong ký
tự dựa trên kĩ thuật gán nhãn vùng liên thông. Tiếp theo, dấu
đang xét được kiểm tra và phân vào 2 lớp: dấu đơn và dấu
kép. Quá trình nhận dạng bằng mã xích kết hợp với mơ hình
Markov ẩn được áp dụng cho dấu đơn hoặc dấu kép đã phân
tách. Ưu điểm lớn nhất ở cách tiếp cận này là các dấu có thể
được nhận dạng cả khi có sự liên kết tại cặp dấu trong cùng
một ký tự. Ngoài ra, chi phí tính tốn cũng đáp ứng được
u cầu nhận dạng theo thời gian thực.
Trong các nghiên cứu tiếp theo, giải pháp này sẽ được
cải tiến để tăng khả năng nhận dạng, áp dụng được cho một
số trường hợp cách viết khơng chính xác. Bên cạnh đó, một
số luật về chính tả cũng có thể được kết hợp để nâng cao
hiệu quả nhận dạng.
Tài liệu tham khảo
[1] De Cao Tran (2012), “An efficient method for on-line Vietnamese
handwritten character recognition”, Proceedings of the Third
Symposium on Information and Communication Technology, pp.
135-141.
[2] De Cao Tran, Patrick Franco, Jean-Marc Ogier (2010), “Accented
Handwritten Character Recognition Using SVM – Application to
French”, International Conference on Frontiers in Handwriting
Recognition (ICFHR), Kolkata, pp. 65-71.
[3] Gary Bradski, Adrian Kaehler (2008), Learning OpenCV, pp.
115-120.
[4] Sivaramakrishnan Rajaraman, Arun Chokkalingam (2013),
“Connected Components Labeling and Extraction Based Interphase
Removal from Chromosome Images”, International Journal of
Bio-Science and Bio-Technology, vol. 5, no. 1, pp. 81-90.
[5] Mark Nixon, Alberto Aguado (2008), Feature Extraction & Image
Processing 2nd, Academic Press, UK.
[6] D.Parks, J.P.Gravel (2004), “Corner Detection”, International
Journal of Computer Vision.
[7] Sung-Jung Cho (2005), “Introduction to Hidden Markov Model
and Its Application”, Samsung Advanced Institute of Technology
(SAIT).
[8] Sapphire-ocr
data,
/files/samples-full.zip.
(BBT nhận bài: 21/12/2013, phản biện xong: 27/12/2013)
24