Tải bản đầy đủ (.pdf) (53 trang)

Tìm hiểu một số phương pháp trích chọn đặc trưng cho nhận dạng chữ viết (Khóa luận tốt nghiệp)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (8.94 MB, 53 trang )

B GIÁO D

O

I H C DÂN L P H I PHÒNG
-------o0o-------

ÁN T T NGHI P
NGÀNH CÔNG NGH THÔNG TIN

H I PHÒNG 2013


I H C DÂN L P H I PHÒNG
-------o0o-------

TÌM HI U M T S
CH
CH

N D NG
VI T

H I PHÒNG - 2013


I H C DÂN L P H I PHÒNG
-------o0o-------

TÌM HI U M T S
CH


CH

N D NG
VI T

ng d n:PGS TS Ngô Qu c T o
Sinh viên th c hi n: Nguy
Mã s sinh viên:
1351010034

H I PHÒNG - 2013


B GIÁO D

C NG HÒA XA H I CH

O

T NAM

c l p - T do - H nh phúc

I H C DÂN L P H I PHÒNG

-------o0o-------

NHI M V THI T K T T NGHI P

Sinh viên: Nguy

L p:

Mã SV: 1351010034

CT1301

Ngành: Công ngh Thông tin

tài:Tìm hi u m t s

n d ng
ch vi t.


NHI M V

TÀI

1. N i dung và các yêu c u c n gi i quy t trong nhi m v

tài t t nghi p

a. N i dung
- Gi i thi u v trích ch
t bi n,kh
c.
- Trích ch
p xám i sánh m u,m u bi n
d ng,bi
i nh Unitar,b t bi n hình h c,b t bi n Zenite.

- Trích ch
nh nh phân
i sánh m u,m u bi n d ng,bi n
i nh Unitar,b t bi n hình h c.
- Trích ch
biên nh:Chi u nghiêng,tách vùng,x p x
ng
cong,mô t Fourier.
- Trích ch
bi u di
:
i sánh m u,m u bi n
d
i r c,bi u di
th ,bi u di n Fourier.
b. Các yêu c u c n gi i quy t
- Hi u n i dung trích ch
- Vi
án
t th nghi

i sánh


CÁN B

NG D

TÀI T T NGHI P


ng d n th nh t:
H và tên: Ngô Qu c T o
H c hàm, h c v :
Vi n Công ngh thông tin,Vi n Hàn Lâm Khoa h c và
Công ngh Viêt Nam.
N
ng d n: ..............................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
ng d n th hai:
H và tên: ...............................................................................................................
H c hàm, h c v : ....................................................................................................
...................................................................................................
N
ng d n: ..............................................................................................
.................................................................................................................................
.................................................................................................................................
tài t t nghi
Yêu c u ph
h n nhi m v

n nhi m v

Sinh viên

Cán b

Nguy


ng d

PGS TS Ngô Qu c T o

H
HI

NG

n H u Ngh


án t t nghi p

p H i Phòng

PH N NH N XÉT TÓM T T C A CÁN B

Tinh th

NG D N

c

tài t t nghi p:

.........................................................................................................................................................
.........................................................................................................................................................
........................................................................................................................................................
.........................................................................................................................................................

.........................................................................................................................................................

ng c
tài t t nghi p (so v i n i dung yêu c
ra trong nhi m v
tài t t nghi p)
........................................................................................................................
........................................................................................................................
........................................................................................................................
........................................................................................................................
........................................................................................................................
........................................................................................................................
........................................................................................................................
3.

m c a cán b

ng d n:

m ghi b ng s và ch )
........................................................................................................................
........................................................................................................................

Cán b

ng d n chính

(Ký, ghi rõ h tên)

Nguy


- CT1301


án t t nghi p

PH N NH

p H i Phòng

A CÁN B CH M PH N BI N
TÀI T T NGHI P
tài t t nghi p (v các m
th c t ).

thuy

lý lu n,

m c a cán b ph n bi n
(

m ghi b ng s và ch )

........................................................................................................................
........................................................................................................................

Cán b ch m ph n bi n
(Ký, ghi rõ h tên)


Nguy

- CT1301


L IC

c bày t s trân tr ng và lòng bi
i v i th y giáo
PGS.TS. Ngô Qu c T ong phòng Nh n d ng và Công ngh tri th c,Vi n
Công ngh thông tin,Vi n Hàn Lâm Khoa H c và Công ngh Vi t Nam. Trong su t
th i gian
án t t nghi p, th
t nhi u th
t n tình
ch b
ng d
ng cho em th c hi
án.
cc
i h c Dân l p H
gi ng d y trong quá trình h c t p, th c hành, làm bài t p, giúp em hi u th
i dung h c t p và nh ng h n ch c n kh c ph c trong vi c h c t p,
nghiên c u và th c hi n b
án này.
Em xin c
m
u ki n t t nh
nghi p.


n bè và nh
ng viên, c

t quá trình h c t

o
án t t

Do th i gian và ki n th c có h n nên không tránh kh i nh ng thi u sót nh t
nh. Em r t mong nh
cs
a th y cô!
Em xin chân thành c

H
Sinh viên
Nguy


án t t nghi p

p H i Phòng

M CL C
L I CÁM
DANH M C HÌNH
DANH M C CÁC KÝ HI U, C M T VI T T T
PH N M
U........................................................................................................5
TÓM T

TÀI ...................................................................................................7
CH
NG 1. T NG QUAN V CH VI T VÀ LÝ THUY T NH N D NG 8
1.1. GI I THI U ....................................................................................................8
1.2. MÔ HÌNH T NG QUÁT C A M T H NH N D NG CH VI T TAY 8
1.2.1. Ti n x lý ................................................................................................8
1.2.2. Kh i tách ch : ......................................................................................13
1.2.3. Trích ch
c tr ng: ............................................................................14
1.2.4. Hu n luy n và nh n d ng : ....................................................................14
1.2.5. H u x lý : .............................................................................................14
1.3. CÁC PH
1.3.1.
1.3.2. Ph

NG PHÁP NH N D NG CH

VI T TAY ........................ 15

i sánh m u: ................................................................................. 15
ng pháp ti p c n c u trúc: ........................................................ 16

1.3.3. M ng n ron ................................................................................... 17
1.3.4. Mô hình Markov n (HMM - Hidden Markov Model) : .................... 20
1.3.5. Máy véc t t a (SVM) :................................................................... 21
1.3.6. K t h p các k thu t nh n d ng : ..................................................... 23
1.3.7. K t lu n .......................................................................................... 24
CH
NG 2: T NG QUAN V TRÍCH CH
C TR NG VÀ M T S

PH
NG PHÁP TRÍCH CH
C TR NG TRONG NH N D NG CH
VI T .........................................................................................................................25
2.1. Trích ch
c tr ng......................................................................................25
2.1.1. Bi
i toàn c c và khai tri n chu i .....................................................25
c tr ng th ng kê .................................................................................26
c tr ng hình h c và hình thái .............................................................27
2.2. c tr ng b t bi n ..........................................................................................28
2.3. Kh
c .......................................................................................29
2.4. Trích ch
c tr ng t
p xám........................................................29
2.4.1. Gi i thi u...............................................................................................29
2.4.2.
i sánh m u.........................................................................................30
2.4.3. M u bi n d ng .......................................................................................30

Nguy

- CT1301

1


án t t nghi p


p H i Phòng

2.4.4. Bi
i nh Unitar ...............................................................................30
2.4.5. B t bi n Zenite ......................................................................................31
2.5. Trích ch
c tr ng t nh nh phân: ...........................................................31
2.5.1. Gi i thi u...............................................................................................31
2.5.2. Bi
i nh Unitar ...............................................................................32
2.5.3. B t bi n hình h c...................................................................................32
2.6. Trích ch
c tr ng t biên nh: ..................................................................32
2.6.1. Gi i thi u...............................................................................................32
2.6.2. Tách vùng ..............................................................................................32
2.6.3. X p x
ng cong: ...............................................................................33
2.6.4. Mô t Fourier:........................................................................................33
2.7. Trích ch
c tr ng t bi u di n véc t : ......................................................33
2.7.1. Gi i thi u...............................................................................................33
2.7.2.
i sánh m u.........................................................................................34
2.7.3. M u bi n d ng .......................................................................................34
2.7.4.
c tr ng r i r c....................................................................................34
2.7.5. Bi u di n Fourier...................................................................................34
CH
NG 3: CH
NG TRÌNH TH NGHI M .............................................36

3.1. Gi i thi u .......................................................................................................36
3.2. Xây d ng giao di n v ...................................................................................36
3.3. X lý d li u (phân tích nh).........................................................................37
3.4. K t qu nh n d ng .........................................................................................39
n xét .........................................................................................39
K T LU N..............................................................................................................43
TÀI LI U THAM KH O ......................................................................................44

Nguy

- CT1301

2


án t t nghi p

p H i Phòng

DANH M C CÁC HÌNH

t ng quát c a m t h nh n d ng ch vi t tay .................................9
Hình 1.2. . Nh phân hóa nh ....................................................................................10
Hình 1.3. Nhi

m và nhi u v t ............................................................................10

Hình 1.4. Chu
Hình 1.5. (a) nh g c, (b)


c nh các ký t

......................................11
.....................................11

Hình 1.6. Làm m nh ch . .........................................................................................12
Hình 1.7. Hi u ch
nghiêng c
n .........................................................12
Hình 1.8. Tách dòng ch d a trên histogram theo chi u ngang c a kh i ch ........13
Hình 1.9. X
nh kho ng cách gi a hai kí t và gi a hai t d a trên histogram
theo chi u th
ng c a dòng ch .........................................................................14
Hình 2.1. Mô hình nh n d ng ch vi t tay r i r c ....................................................22
Hình 2.2 Quá trình tìm gi i h n ký t .......................................................................37
Hình 2.3 Quá trình l y m u xu ng............................................................................38
Hình 2.4. Quá trình ánh x t ma tr
m sang ma tr n giá tr ..............................41
Hình 2.5.Giao di n chính c
.............................................................41
Hình 2.6.Giao di n c
n d ng ch vi t xong ..................41
Hình 2.7.Giao di n c a ô thêm ch vi t....................................................................42
Hình 2.8. Giá tr c
c nh n d ng ..............................................42

Nguy

- CT1301


3


án t t nghi p

p H i Phòng

DANH M C CÁC KÝ HI U, C M T
HMM
off-line
on-line
OCR
SVM
SOM
USPS
MNIST

SV
working set
k-NN

Nguy

VI T T T

Markov Model (Mô hình Markov n)
ngo i tuy n
tr c tuy n
Optical Character Recognition (nh n d ng ch quang h c)

a)
Self Origanizing Map
United States Postal service
b m u ch s vi t tay NIST - Vi n Công ngh và Tiêu chu n Qu c
gia Hoa K (National Institute of Standard and Technology of the
United States)
a)
t p làm vi c
k láng gi ng g n nh t

- CT1301

4


án t t nghi p

p H i Phòng

Công ngh thông tin ngày càng phát tri n và có vai trò h t s c quan tr ng
không th thi u trong cu c s ng hi
i ngày càng t o ra nh ng c
máy thông minh có kh
ng, ph c v cho l i ích c
nh ng bài toán nh
v c công ngh

nh n bi t và x
c các công vi c m t cách t
i. Trong nh

t trong

c nhi u s quan tâm và t n nhi u công s c nh t c
bài toán nh n d ng. Tuy m i xu t hi
c quan tâm vì tính ng d ng th c t c

s ph c t p c a nó.
Nh n d ng ch vi t là m

c quan tâm nghiên c u và ng

d ng t nhi
ng chính:
-Nh n d ng ch in: ph c v cho công vi c t
c tài li
c
và hi u qu nh p thông tin vào máy tính tr c ti p t các ngu n tài li u.
-Nh n d ng ch vi t tay: v i nh ng m
ràng bu c khác nhau v cách
vi t, ki u ch ... ph c v cho các ng d
c và x lý ch ng t
u
ghi, b n th o vi t tay... Nh n d ng ch vi t tay
ng phát
tri n: nh n d ng ch vi t tay tr c tuy n (on-line) và nh n d ng ch vi t tay ngo i
tuy n (off-line).
n th
m này, bài toán nh n d ng ch
c gi i quy t g
tr n v n .Tuy nhiên trên th gi

Vi t Nam, bài toán nh n d ng ch vi t
tay v n còn là v
thách th c l
i v i các nhà nghiên c
th gi i quy t tr n v n vì nó ph thu c quá nhi
i vi t và s bi
i quá
ng trong cách vi t và tr ng thái tinh th n c a t
i vi
c bi
iv i
vi c nghiên c u nh n d ng ch vi t ti ng Vi t l i càng g p nhi
b ký t ti ng Vi t có thêm ph n d u, r t d nh m l m v i các nhi u.
Trích ch
n d ng ch vi t là vi c tìm và ch
c
c thù c a m i ch vi
u vào cho quá trình nh n d ng.Bên canh
vi c l a ch n m t thu t toán nh n d ng phù h p thì vi
trích
ch
ps
chính xác và gi m th i gian nh n d ng cho
toàn b h th ng,
V i s h p d n c a bài toán và nh ng thách th
c, v i
ni
hi
i và nh ng ng d ng th c t tuy t v i c a nó, v i
khát khao khám phá và chinh ph c nh ng tri th c m i m


Nguy

- CT1301

5


án t t nghi p

p H i Phòng

nghiên c u: Tìm hi u m t s
vi
tài nghiên c u và b o v lu

n d ng ch
t nghi p c a mình.

V lý thuy t :
- Tìm hi u khái quát v ch vi t và lý thuy t nh n d ng.
- Tìm hi u v trích ch

n d ng ch vi t.

V th c ti n :
-

t th nghi


c.
c trình bày trong 3

-

ng quan v ch vi t và lý thuy t nh n d ng.
2: T ng quan v trích ch
t s

trích ch

n d ng ch vi t.

nghi m.
- K t lu n: Tóm t t nh ng v
tìm hi
ng phát tri

Nguy

- CT1301

c trong bài, các v

liên

6


án t t nghi p


án t t nghi p c a em, nghiên c u v
ts
n d ng ch vi
i dung nghiên c u g m 3

trích ch
-

: T ng quan v ch vi t và lý thuy t nh n d ng
u t ng quan v ch vi t và lý thuy t nh n d ng.
c nhi u nhà nghiên c

Nh n d ng ch
v
th c t

p H i Phòng

c nhi u thành t u l n lao c v m t lý thuy t l n ng d ng
ng th i nêu mô hình t ng quát c a m t h nh n d ng ch vi t..

trích ch

: T ng quan v trích ch
n d ng ch vi t.

ts

u t ng quan v trích ch

ts
n d ng ch vi t.Gi i thi u v trích ch n
t bi n,kh
c ; trích ch
c
i sánh m u,m u bi n d ng,bi
i nh Unitar,b t bi n hình h c,b t
bi nZenite );trích ch
nh nh phân (
i sánh m u,m u bi n
d ng,bi
i nh Unitar,b t bi n hình h c ); trích ch
biên nh(
Chi u nghiêng,tách vùng,x p x
ng cong,mô t Fourier);trích ch
bi u di
i sánh m u,m u bi n d ng, c
r i r c,bi u di n
th ,
bi u di n Fourier ).
-

Nguy

nghi m.

- CT1301

7



án t t nghi p

p H i Phòng

1

T VÀ LÝ

1.1.
Nh n d ng ch

c nhi u nhà nghiên c

c
ng d ng th c t

n

c nhi u thành t u l n lao c v m t lý thuy t l n
c nh n d ng ch
c chia làm hai lo i: Nh n d ng ch

in và nh n d ng ch vi t tay.
n th

m này, nh n d ng ch

Tuy nhiên, nh n d ng ch vi t tay v
nghiên c u. Nh n d ng ch vi


c gi i quy t g

n v n.

thách th c l
i v i các nhà
c phân ra làm hai lo i: nh n d ng ch vi t

tay on-line (tr c tuy n) và nh n d ng ch vi t tay off-line (ngo i tuy n).
Nh n d ng ch vi t tay onc th c hi
i các thông
tin v nét ch
t nét vi
ng và t
c a nét vi t trong quá trình nó
máy tính nh n di
c các ch
c
nh n d ng không g p quá nhi u khó
cl
i v i nh n d ng ch vi t tay
off-line, d li
u vào là
c quét vào nên vi c nh n d
u so v i nh n d ng ch vi t tay on-line. Do d li
u vào là nh
n nên nh n d ng ch vi t tay off-line và nh n d ng ch
c g i
chung là nh n d ng ch quang h c (OCR - Optical Character Recognition).

n nh t khi nghiên c u bài toán nh n d ng ch vi t tay là s bi n
ng trong cách vi t c a t
i. Cùng m
i vi
u s khác bi t trong cách vi t tu thu c vào t ng ng c nh, ki u
vi t c a m
i theo th i gian ho
u
này gây ra nhi u tr ng i trong vi c trích ch
a ch n mô
hình nh n d ng.

1.2.
T TAY
1.2.1.
n này góp ph
d
tùy thu c vào ch

chính xác phân l p c a h th ng nh n
nh n d ng c a h th ng ch m l i. Vì v y,
ng nh quét vào c a t
n c th
ch n m t ho c

m t vài ch
Nguy

i này. N u c
- CT1301


x lý và ch

ng c a

8


án t t nghi p
máy quét t t thì có th b

p H i Phòng
n này. Kh i ti n x lý bao g m m t s ch c

Nh phân hóa nh, l c nhi u, chu n hóa kíc
y ch , làm m nh ch
n.

1.2.1.1.

c

,

nh

Nh phân hóa nh là m t k thu t chuy n
Trong b t k bài toán phân tích ho c nâng cao ch

p xám sang nh nh phân.

ng n
n thi t

ng quan tr ng. Nh phân hóa nh phân chia nh thành 2
ph n: ph n n n và ph n ch . H u h
phân hóa nh hi n nay
Nguy

- CT1301

9


án t t nghi p
u l a ch n m
t t c các giá tr

p H i Phòng
ng thích h
sáng l

t c các giá tr

sáng c a
t giá tr

n
sáng (ví d

ng thành m t giá tr


Hình 1.2. Nh phân hóa nh.
1.2.1.2.
Nhi u là m t t
m sáng th a trên nh. Kh nhi u là m t v
ng g p trong nh n d ng, nhi u có nhi u lo i (nhi
m, nhi u v t, nhi
nét...).

Hình 1.3. Nhi

t

m và nhi u v t.

kh các nhi
m (các nhi u v
c nh ), có th s d ng các
c (l c trung bình, l c trung v ...). Tuy nhiên, v i các nhi u v t (ho c
các nhi
cl
c t ra kém hi u qu , trong
ng h p này s d ng
các vùng liên thông nh t ra có hi u qu
.

Nguy

- CT1301


10


án t t nghi p

p H i Phòng

1.2.1.3.

Hình 1.4. Chu

c nh các ký t

Vi c chu
c nh d a trên vi c
nh tr ng tâm
nh kho ng cách l n nh t t tâm
n các c
i, trái, ph i c a
hình ch nh t bao quanh nh. Thông qua kho ng cách l n nh
nh
c m t t l co, giãn c a nh g c so v
nh, t
u ch nh
c nh theo t l
y, thu t toán chu
c
mb
c tính cân b ng khi co giãn nh, nh s không b bi n
d ng ho c b l ch.

1.2.1.4.

:
ng quét nh quá x

gi
ng h p này, ph i dùng các thu

(a)

ng biên c a ch không còn
t o.
kh c ph c.

(b)

Hình 1.5. (a) nh g c, (b)

Nguy

- CT1301

11


án t t nghi p

p H i Phòng

1.2.1.5.

Ch

c áp d ng v i các ký t b

t nét m t cách ng u nhiên.

c tách ch , d b nh m hai ph n liên thông c a ký
t thành hai ký t riêng bi t, t o nên sai l m trong quá trình nh n d ng.
1.2.1.6.
c quan tr ng nh m phát hi

a ký t b ng

cách lo i b d
m biên ngoài c a các nét. Tuy nhiên, quá trình làm m nh
ch r t nh y c m v i vi c kh nhi u.

Hình 1.6. Làm m nh ch .

1.2.1.7.
Do trang tài li u quét vào không c n th n ho c do s c in n, các hàng ch
b l ch so v i l chu n m
n tách ch ,
c. Trong nh
ng h
y, ph i tính l i t
m nh c a các ch b sai l ch.
Có nhi u k thu
u ch
nghiêng, k thu t ph bi n nh t d a trên

bi
chi u (projection profile) c a nh tài li u; m t s k thu t d
s các phép bi
i Hough và Fourier.

Hình 1.7. Hi u ch

Nguy

- CT1301

nghiêng c

n

12


án t t nghi p

p H i Phòng

1.2.2.

:

Kh i này có nhi m v tách t ng ký t ra kh
c tách và cô l
có th nh n d


ng ký t

n. Ch

i t ng th
ts

n

n thì h th ng m i
thông

d ng:

1.2.2.1.
ng áp d ng cho ch in. Khác v i ch vi t tay, kích
c và ki u ch c

nh, ph i tuân theo m t s

g n trong m t khung nên vi c cô l p m t ký t
khung bao c a ch
i v trí c

nh in n, các ch ph i n m
ng nh t v i vi c tìm ra
n. Tách ch theo chi u n m

ngang và th
ng là tìm m t hình ch nh t có c nh th

ch a tr n m t ký t
bên trong.

1.2.2.2.

ng và n m ngang

sáng

Hình 1.8. Tách dòng ch d a trên histogram theo chi u ngang c a kh i ch

i v i ch vi t tay thì vi
ng r
c t hai dòng là ít nh
n th p nh

Nguy

- CT1301

ng phân cách gi a các dòng và các ký t
ng h p này, không th
ng
ng mà ph i hi
ng phân cách v i s
m
i xây d
sáng c a các dòng ch , t
ng phân cách c n tìm (hình 1.8 và 1.9).


13


án t t nghi p

Hình 1.9.

p H i Phòng

nh kho ng cách gi a hai kí t và gi a hai t d a trên histogram
theo chi u th
ng c a dòng ch .

1.2.3.
nh
gi
b
ch

Trích ch
c k quan tr ng trong m t h th ng
nd
ng h
n nh t,
p xám ho c nh nh phân
c s d ng cho vi c nh n d ng. Tuy nhiên, trong h u h t các h nh n d
ph c t
chính xác c a các thu t toán phân l
i các
c trích ch n ph i rút g n l i càng nh càng t

n ph
m
c thông tin c a ký t . V i m c tiêu này, m t t
c trích
n cho m i l p sao cho có th phân bi
c v i các l p khác.
1.2.4. Hu

:

n quan tr ng nh
h th ng nh n d ng. Có nhi
các h th ng nh n d ng ch vi t tay.
1.2.5.

n này quy

chính xác c a
c áp d ng cho

:

n cu i cùng c

c ghép n i các kí t
nd
tái hi n l
ng th i phát hi
chính t d a trên c u trúc và ng
phát hi n ra các l i, các sai sót trong

vi c nâng cao ch
ng nh n d ng.

a quá trình nh n d ng. Có th hi u h u x lý
ng thành các t
m
n ra các l i nh n d ng sai b ng cách ki m tra
a các t , các câu ho
c
nh n d ng
c này góp ph
vào

n nh
k t n i các thông tin ng c nh là t n d ng m t t
u ch nh các l i c a h th ng nh n d ng.

Nguy

- CT1301

n

14


án t t nghi p

p H i Phòng


1.3.

Có nhi
n d ng m
c áp d ng r ng rãi
trong các h th ng nh n d ng ch vi
c tích
h
ng ti p c
i sánh m u, th ng kê, c u trúc, m
SVM.

1.3.1.

u:

K thu t nh n d ng ch
n nh t d
i sánh các nguyên
m u (prototype) v
nh n d ng ký t ho c t . Nói chung, toán t
i sánh
nh m
trong m

gi ng nhau gi
thu

m, hình d
cong...)

i sánh có th nghiên c u theo ba

ng sau:
i sánh tr c ti p: M t ký t
u vào là
c so sánh tr c ti p v i m t t p m u chu
theo m t
s
ng h
d ng. Các k thu
i sánh này có th
ph c t
nh . M
n và có m
toán h c v ng ch
r t nh y c m v i nhi u.
Các m u bi n d
d ng các m u bi n d
m t
tv im

p xám ho c nh nh phân
. Vi c so sánh d a
nh n
c so sánh m t m t ho c
i sánh tr c ti p
t qu nh n d ng c

i sánh m m: M
t phép bi n d ng

d li u
t.

i sánh khác là s
i sánh

nc
i sánh m
i sánh m t cách t
t
v i t t c các m u có th mà các m u này có th kéo giãn ra ho c co l i. Ch m t
c thành l
i sánh b ng cách
s d ng quy ho
ng và m t hàm bi n d ng .
i sánh gi m nh
t k thu
i sánh nh m
k thu t này s d
n c a nh ký t . Th nh t, các vùng
c nh n bi
m ts v
t t, các ph n t c a
c so sánh v
i sánh này. Công vi
h i m t k thu t tìm ki m trong m
tìm c
i toàn c c
c a m t s hàm .


Nguy

- CT1301

15


án t t nghi p

p H i Phòng

Các k thu
i sánh m u ch áp d ng t
i v i nh n d ng ch
v i ch vi t tay thì các k thu t này t ra kém hi u qu .

1.3.2.

i

u trúc:

Cách ti p c n c

a vào vi c mô t

khái ni m bi u di
trong ngôn ng t
i ta dùng m t s d ng nguyên thu
n th

c mô t

ng nh m t s
mô t

ng
ng

t s k t h p c a các d ng nguyên thu .

Các quy t c k t h p các d ng nguyên thu
nghiên c
m trong m t ngôn ng ,
quá trình phân tích cú pháp

c xây d ng gi
c
nh nh n d ng là
tv

gi i quy t bài toán

nh n d ng ch t ng quát. Tuy v
n nay còn nhi u v
nh
nh n d
c gi i quy
cl
ây d
c các thu t

toán ph d ng. Hi n nay, nh n d ng theo c u trúc ph bi n là trích tr
c
a m u h c, phân ho ch b ng ký t d
nh
c n nh n d ng s
c trích ch
ng phân ho
tìm ra ký t
p.
i v i nh n d ng ch vi t tay r i r c d a theo c
ng
biên, công vi
i ph i xây d
a ch
c bi
c
mu
mg
a các nét. Sau khi ti n hành
n ti n x lý, công vi
c ti
m
ch
a ch , m
ic p
ch s
u và cu
ng v i th t c
m ch
m ch c cu i. Cu i

cùng là xây d ng cây tìm ki m, d
c
u trúc
phân t p m u h c thành các l p. Quá trình tìm ki
phân l
c ti n
hành qua
nh l
ng v i m u vào và tìm ki m trong l
m u nào g n gi ng v i m u vào nh t .
u trúc áp d ng cho các bài toán nh n d ng ch
ng sau:

phát tri

c

1.3.2.1.
Gi a th p niên 1960, các nhà nghiên c u b
h
phân tích ti ng nói và ch vi
v ng và ngôn ng h
c áp d ng cho các chi
pháp ng pháp kh i t o m t s lu

Nguy

- CT1301

u xét các lu t c a ngôn ng

ng c a chính t , t
c nh n d

hình thành các ký t t m t t p các công

16


×