1
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Nguyễn Triệu Tuấn
PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG CHO BÀI TOÁN
NHẬN DẠNG CHỮ NÔM
60 48 10
LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN NGỌC BÌNH
Hà Nội - 2013
2
Mục lục
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT 5
DANH MỤC CÁC BẢNG 6
DANH MỤC CÁC HÌNH VẼ 7
DANH MỤC CÁC KÝ PHÁP 9
NHỮNG ĐÓNG GÓP CỦA LUẬN VĂN 10
MỞ ĐẦU 12
CHƯƠNG 1 TỔNG QUAN 15
1.1 GIỚI THIỆU VỀ CHỮ NÔM 15
15
15
1.2 VẤN ĐỀ NHẬN DẠNG CHỮ NÔM 18
18
18
19
1) Tiền xử lý 19
2) Trích chọn đặc trưng 20
3) Huấn luyện 20
4) Tách ảnh chữ 20
5) Dữ liệu mẫu 20
6) Nhận dạng 20
3
CHƯƠNG 2 MỘT SỐ KỸ THUẬT NHẬN DẠNG CHỮ TƯỢNG HÌNH . 22
2.1 NHẬN DẠNG THEO PHƯƠNG PHÁP CỰC ĐẠI HÓA ENTROPY 22
2.2 NHẬN DẠNG THEO MẠNG NƠ-RON 22
2.3 NHẬN DẠNG SỬ DỤNG THƯ VIỆN TESSERACT 24
CHƯƠNG 3 GIỚI THIỆU MỘT SỐ PHƯƠNG PHÁP TRÍCH CHỌN
ĐẶC TRƯNG 27
27
32
33
CHƯƠNG 4 NHẬN DẠNG CHỮ NÔM THEO KHOẢNG CÁCH SOẠN
THẢO DỰA TRÊN KHUNG XƯƠNG VÀ GIẢ KHUNG 38
38
38
4.2.1 38
39
-RON
XUNG KÉP 40
. 46
46
47
KHUNG 51
59
4
59
60
62
CHƯƠNG 5 THỰC NGHIỆM 64
64
67
68
KẾT LUẬN 72
TÀI LIỆU THAM KHẢO 74
5
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT
Ký hiệu
Diễn giải
Ý nghĩa
BMP
Bitmap
CNTT-TT
thông
CSDL
k-NN
K nearest neighbor
MEM
Maximum Entropy Model
Mô ác s
OCR
Optical character recognition
PCNN
Pulse-Couple Neuron Netword
-ron xung kép
JPEG
Joint Photographic Experts
Group
6
DANH MỤC CÁC BẢNG
Bảng 3.1.
36
Bảng3.2.
37
Bảng 4.1. 55
Bảng 4.2. 58
Bảng 4.3. 58
Bảng 4.4. 59
Bảng 4.5. 59
Bảng 4.6. 61
Bảng 4.7. 61
Bảng 4.8. 61
Bảng 4.9. 62
Bảng 4.10. 62
Bảng 5.1. 69
Bảng 5.2. 70
7
DANH MỤC CÁC HÌNH VẼ
Hình 1.1. 16
Hình 1.2. 16
Hình 1.3. 17
Hình 1.4. 19
Hình 2.1. -
Nôm
23
Hình 2.2. Ki 25
Hình 3.1. 27
Hình 3.2.
Nôm
28
Hình 3.3.
Nôm
29
Hình 3.4. - 30
Hình 3.5.
Nôm
30
Hình 3.6. 31
Hình 3.7. 31
Hình 3.8. 31
Hình 3.9. 32
Hình 3.10.
Nôm
32
Hình 3.11.
Nôm
33
Hình 3.12.
Nôm
34
Hình 4.4. 43
Hình 4.5. 43
Hình 4.6. 44
Hình 4.7. 44
Hình 4.8. - 44
Hình 4.9. 46
Hình 4.10. 46
Hình 4.11. 47
Hình 4.12. 47
Hình 4.13. 48
Hình 4.14. 49
Hình 4.15. 50
Hình 4.16.
Nôm
50
Hình 4.17.
Nôm
51
Hình 4.18. 51
Hình 4.19. 52
Hình 4.20. 52
Hình 4.21. 57
Hình 4.22. 57
Hình 5.1.
65
Hình 5.2.
Gi,
66
8
Hình 5.3.
,
67
Hình 5.4.
68
Hình 5.5. 71
9
DANH MỤC CÁC KÝ PHÁP
Ký pháp
Diễn giải
i
j
F
T_H
L
U
-ron trong PCNN
Y
-ron trong PCNN
Ypre
-ron trong PCNN
Tr
T_Ah
-
ron trong PCNN
T_Bh
-
ron trong PCNN
Beta
-ron
trong PCNN
I
h
I
w
H
v
Các bin trong V-Histogram
H
h
Các bin trong H-Histogram
10
NHỮNG ĐÓNG GÓP CỦA LUẬN VĂN
t
.
ron xung kép (Pulse Coupled Neural Network [15]); Trình
; Trình bày
Nôm;
; String edit-distance [11]
String edit-distance
Trung , tác
ánh các nét
pháp th
háp String edit-distance
string edit-
distance
-
tring edit-distance.
11
12
MỞ ĐẦU
dài qua
. Nôm
Nôm hoàn
Nôm
NômNôm
Nôm n
Nôm
ta Nôm
công , máy
tí,
c
,
13
Nôm
7].
Nôm trong m
chung. v
.
Trong l chúng tôi trình bày
Nôm
Nôm
Nôm
Nôm Nôm
14
trong nó.
Phần mở đầu:
nêu khái quát quá trình phát
Nôm
Nôm. c
Nôm
Nôm.
Chương 1. Tổng quan:
Nôm Nôm
Nôm và các khái
, ,
Chương 2. Một số kỹ thuật nhận dạng chữ tượng hình:
n
th .
Chương 3. Giới thiệu một số phương pháp trích chọn đặc trưng:
.
Chương 4. Nhận dạng chữ Nôm theo khoảng cách soạn thảo dựa
trên khung xương và giả khung:
thông qua tính chi phí (string
edit-distance)
string edit-distance
, rõ ràng.
Chương 5. Thực nghiệm.
th
.
Phần
kết luận:
theo.
15
Chương 1
TỔNG QUAN
1.1 GIỚI THIỆU VỀ CHỮ NÔM
1.1.1 LỊCH SỬ HÌNH THÀNH VÀ PHÁT TRIỂN
Nôm ,
Nôm
11
14 Nôm Nôm
Nôm
Nôm c
s ghi
.
L
Nôm.
Nôm, nh
1.1.2 CẤU TRÚC CHỮ NÔM
Nôm ra trên Hán -
Nôm Nôm
16
Nôm
Nôm
-
[1]
Hình 1.1
-
[1]
Hình 1.2
17
Xét theo Nôm 17
20 [2]
Hình 1.3. hình Nôm
hình hình
Chình 2
C
hình 3
hình t C
hình 4
hình
hình
hình . hình
hình
-
hình
hình
18
1.2 VẤN ĐỀ NHẬN DẠNG CHỮ NÔM
1.2.1 TẦM QUAN TRỌNG CỦA BÀI TOÁN NHẬN DẠNG CHỮ NÔM
Nôm
NômNôm,
các
Nôm T
Nôm
Nôm
Nôm
hàng
Do cNôm
Nôm
Nôm
l
ú
1.2.2 MÔ HÌNH NHẬN DẠNG CHỮ NÔM TỔNG THỂ
.1.
19
Hình 1.4. Mô hình
CSDL)
quá
mô- p
Trong khuô ô-un
1.2.3 MỘT SỐ KHÁI NIỆM CƠ BẢN TRONG NHẬN DẠNG CHỮ NÔM
1) Tiền xử lý
-
20
2) Trích chọn đặc trưng
-1
hung c
--and-
3) Huấn luyện
4) Tách ảnh chữ
5) Dữ liệu mẫu
n
6) Nhận dạng
Tổng kết chương 1
21
theo
22
Chương 2
MỘT SỐ KỸ THUẬT NHẬN DẠNG CHỮ TƯỢNG HÌNH
2.1 NHẬN DẠNG THEO PHƯƠNG PHÁP CỰC ĐẠI HÓA ENTROPY
ng rõ ràng mô hình cho
i hóa entropy
hình maximum entropy [8]
entropy [8]
xác s
,
hình
. V í c
xác s
có xác s
.
2.2 NHẬN DẠNG THEO MẠNG NƠ-RON
n-ron
n-
.
23
-
theo cá
-ron
-ron
-
ron
Trong nghiên cu [3] nhóm nghiên cu nhn dng ch Nôm ca
i hc Công nghi hc Quc gia Hà Ni
nhn dng ch Nôm bng mng -ron vi mô hình mng có 24x24 -
ron tng vào biu din nh 24x24 pixel, 16 -ron tng ra
Nôm, tng n có th u chnh s lp
và s ng -ron ci tin t và chính xác khi nhn dng
(hình 2.1). Mô hình mng này s dng hàm chuyn (2.1)
Hình 2.1. -
Nôm
.
{(X
s
,Y
s
, X
s
(2.1)
24
Nôm, Y
s
Outs= f(X
s
,W
s
) =Y
s
.
s
s
;
K
.
theo string-edit distance
2.3 NHẬN DẠNG SỬ DỤNG THƯ VIỆN TESSERACT
Tesseract
,
(
2.2.
25
Phân tích thành
phần kết nối
Tiền xử lý
Ảnh đầu
vào
Tìm ra các dòng
văn bản và từ
Đường viền
các ký tự
Tìm ra các dòng
văn bản và từ
Các đường bao ký
tự được tổ chức
thành các từ
Nhận dạng từ 1Nhận dạng từ 2
Bộ tách ký tự Bộ kết hợp ký tự
Bộ phân lớp ký tự
tĩnh
Từ điển
Bộ phân lớp
thích nghi
Bộ phân tích
số
Từ thích hợp
Hình 2.2. .
Tesseract dùng -NN)
có n A
1
(x), A
2
(x), …, A
n
(x)). Thì
x y
D(x, y) =
n
i
ii
yAxA
1
2
))()((
(2.2)
Tesse