B GIÁO D
O
I H C DÂN L P H I PHÒNG
-------o0o-------
ÁN T T NGHI P
NGÀNH CÔNG NGH THÔNG TIN
H I PHÒNG 2013
I H C DÂN L P H I PHÒNG
-------o0o-------
TÌM HI U M T S
CH
CH
N D NG
VI T
H I PHÒNG - 2013
I H C DÂN L P H I PHÒNG
-------o0o-------
TÌM HI U M T S
CH
CH
N D NG
VI T
ng d n:PGS TS Ngô Qu c T o
Sinh viên th c hi n: Nguy
Mã s sinh viên:
1351010034
H I PHÒNG - 2013
B GIÁO D
C NG HÒA XA H I CH
O
T NAM
c l p - T do - H nh phúc
I H C DÂN L P H I PHÒNG
-------o0o-------
NHI M V THI T K T T NGHI P
Sinh viên: Nguy
L p:
Mã SV: 1351010034
CT1301
Ngành: Công ngh Thông tin
tài:Tìm hi u m t s
n d ng
ch vi t.
NHI M V
TÀI
1. N i dung và các yêu c u c n gi i quy t trong nhi m v
tài t t nghi p
a. N i dung
- Gi i thi u v trích ch
t bi n,kh
c.
- Trích ch
p xám i sánh m u,m u bi n
d ng,bi
i nh Unitar,b t bi n hình h c,b t bi n Zenite.
- Trích ch
nh nh phân
i sánh m u,m u bi n d ng,bi n
i nh Unitar,b t bi n hình h c.
- Trích ch
biên nh:Chi u nghiêng,tách vùng,x p x
ng
cong,mô t Fourier.
- Trích ch
bi u di
:
i sánh m u,m u bi n
d
i r c,bi u di
th ,bi u di n Fourier.
b. Các yêu c u c n gi i quy t
- Hi u n i dung trích ch
- Vi
án
t th nghi
i sánh
CÁN B
NG D
TÀI T T NGHI P
ng d n th nh t:
H và tên: Ngô Qu c T o
H c hàm, h c v :
Vi n Công ngh thông tin,Vi n Hàn Lâm Khoa h c và
Công ngh Viêt Nam.
N
ng d n: ..............................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
ng d n th hai:
H và tên: ...............................................................................................................
H c hàm, h c v : ....................................................................................................
...................................................................................................
N
ng d n: ..............................................................................................
.................................................................................................................................
.................................................................................................................................
tài t t nghi
Yêu c u ph
h n nhi m v
n nhi m v
Sinh viên
Cán b
Nguy
ng d
PGS TS Ngô Qu c T o
H
HI
NG
n H u Ngh
án t t nghi p
p H i Phòng
PH N NH N XÉT TÓM T T C A CÁN B
Tinh th
NG D N
c
tài t t nghi p:
.........................................................................................................................................................
.........................................................................................................................................................
........................................................................................................................................................
.........................................................................................................................................................
.........................................................................................................................................................
ng c
tài t t nghi p (so v i n i dung yêu c
ra trong nhi m v
tài t t nghi p)
........................................................................................................................
........................................................................................................................
........................................................................................................................
........................................................................................................................
........................................................................................................................
........................................................................................................................
........................................................................................................................
3.
m c a cán b
ng d n:
m ghi b ng s và ch )
........................................................................................................................
........................................................................................................................
Cán b
ng d n chính
(Ký, ghi rõ h tên)
Nguy
- CT1301
án t t nghi p
PH N NH
p H i Phòng
A CÁN B CH M PH N BI N
TÀI T T NGHI P
tài t t nghi p (v các m
th c t ).
thuy
lý lu n,
m c a cán b ph n bi n
(
m ghi b ng s và ch )
........................................................................................................................
........................................................................................................................
Cán b ch m ph n bi n
(Ký, ghi rõ h tên)
Nguy
- CT1301
L IC
c bày t s trân tr ng và lòng bi
i v i th y giáo
PGS.TS. Ngô Qu c T ong phòng Nh n d ng và Công ngh tri th c,Vi n
Công ngh thông tin,Vi n Hàn Lâm Khoa H c và Công ngh Vi t Nam. Trong su t
th i gian
án t t nghi p, th
t nhi u th
t n tình
ch b
ng d
ng cho em th c hi
án.
cc
i h c Dân l p H
gi ng d y trong quá trình h c t p, th c hành, làm bài t p, giúp em hi u th
i dung h c t p và nh ng h n ch c n kh c ph c trong vi c h c t p,
nghiên c u và th c hi n b
án này.
Em xin c
m
u ki n t t nh
nghi p.
n bè và nh
ng viên, c
t quá trình h c t
o
án t t
Do th i gian và ki n th c có h n nên không tránh kh i nh ng thi u sót nh t
nh. Em r t mong nh
cs
a th y cô!
Em xin chân thành c
H
Sinh viên
Nguy
án t t nghi p
p H i Phòng
M CL C
L I CÁM
DANH M C HÌNH
DANH M C CÁC KÝ HI U, C M T VI T T T
PH N M
U........................................................................................................5
TÓM T
TÀI ...................................................................................................7
CH
NG 1. T NG QUAN V CH VI T VÀ LÝ THUY T NH N D NG 8
1.1. GI I THI U ....................................................................................................8
1.2. MÔ HÌNH T NG QUÁT C A M T H NH N D NG CH VI T TAY 8
1.2.1. Ti n x lý ................................................................................................8
1.2.2. Kh i tách ch : ......................................................................................13
1.2.3. Trích ch
c tr ng: ............................................................................14
1.2.4. Hu n luy n và nh n d ng : ....................................................................14
1.2.5. H u x lý : .............................................................................................14
1.3. CÁC PH
1.3.1.
1.3.2. Ph
NG PHÁP NH N D NG CH
VI T TAY ........................ 15
i sánh m u: ................................................................................. 15
ng pháp ti p c n c u trúc: ........................................................ 16
1.3.3. M ng n ron ................................................................................... 17
1.3.4. Mô hình Markov n (HMM - Hidden Markov Model) : .................... 20
1.3.5. Máy véc t t a (SVM) :................................................................... 21
1.3.6. K t h p các k thu t nh n d ng : ..................................................... 23
1.3.7. K t lu n .......................................................................................... 24
CH
NG 2: T NG QUAN V TRÍCH CH
C TR NG VÀ M T S
PH
NG PHÁP TRÍCH CH
C TR NG TRONG NH N D NG CH
VI T .........................................................................................................................25
2.1. Trích ch
c tr ng......................................................................................25
2.1.1. Bi
i toàn c c và khai tri n chu i .....................................................25
c tr ng th ng kê .................................................................................26
c tr ng hình h c và hình thái .............................................................27
2.2. c tr ng b t bi n ..........................................................................................28
2.3. Kh
c .......................................................................................29
2.4. Trích ch
c tr ng t
p xám........................................................29
2.4.1. Gi i thi u...............................................................................................29
2.4.2.
i sánh m u.........................................................................................30
2.4.3. M u bi n d ng .......................................................................................30
Nguy
- CT1301
1
án t t nghi p
p H i Phòng
2.4.4. Bi
i nh Unitar ...............................................................................30
2.4.5. B t bi n Zenite ......................................................................................31
2.5. Trích ch
c tr ng t nh nh phân: ...........................................................31
2.5.1. Gi i thi u...............................................................................................31
2.5.2. Bi
i nh Unitar ...............................................................................32
2.5.3. B t bi n hình h c...................................................................................32
2.6. Trích ch
c tr ng t biên nh: ..................................................................32
2.6.1. Gi i thi u...............................................................................................32
2.6.2. Tách vùng ..............................................................................................32
2.6.3. X p x
ng cong: ...............................................................................33
2.6.4. Mô t Fourier:........................................................................................33
2.7. Trích ch
c tr ng t bi u di n véc t : ......................................................33
2.7.1. Gi i thi u...............................................................................................33
2.7.2.
i sánh m u.........................................................................................34
2.7.3. M u bi n d ng .......................................................................................34
2.7.4.
c tr ng r i r c....................................................................................34
2.7.5. Bi u di n Fourier...................................................................................34
CH
NG 3: CH
NG TRÌNH TH NGHI M .............................................36
3.1. Gi i thi u .......................................................................................................36
3.2. Xây d ng giao di n v ...................................................................................36
3.3. X lý d li u (phân tích nh).........................................................................37
3.4. K t qu nh n d ng .........................................................................................39
n xét .........................................................................................39
K T LU N..............................................................................................................43
TÀI LI U THAM KH O ......................................................................................44
Nguy
- CT1301
2
án t t nghi p
p H i Phòng
DANH M C CÁC HÌNH
t ng quát c a m t h nh n d ng ch vi t tay .................................9
Hình 1.2. . Nh phân hóa nh ....................................................................................10
Hình 1.3. Nhi
m và nhi u v t ............................................................................10
Hình 1.4. Chu
Hình 1.5. (a) nh g c, (b)
c nh các ký t
......................................11
.....................................11
Hình 1.6. Làm m nh ch . .........................................................................................12
Hình 1.7. Hi u ch
nghiêng c
n .........................................................12
Hình 1.8. Tách dòng ch d a trên histogram theo chi u ngang c a kh i ch ........13
Hình 1.9. X
nh kho ng cách gi a hai kí t và gi a hai t d a trên histogram
theo chi u th
ng c a dòng ch .........................................................................14
Hình 2.1. Mô hình nh n d ng ch vi t tay r i r c ....................................................22
Hình 2.2 Quá trình tìm gi i h n ký t .......................................................................37
Hình 2.3 Quá trình l y m u xu ng............................................................................38
Hình 2.4. Quá trình ánh x t ma tr
m sang ma tr n giá tr ..............................41
Hình 2.5.Giao di n chính c
.............................................................41
Hình 2.6.Giao di n c
n d ng ch vi t xong ..................41
Hình 2.7.Giao di n c a ô thêm ch vi t....................................................................42
Hình 2.8. Giá tr c
c nh n d ng ..............................................42
Nguy
- CT1301
3
án t t nghi p
p H i Phòng
DANH M C CÁC KÝ HI U, C M T
HMM
off-line
on-line
OCR
SVM
SOM
USPS
MNIST
SV
working set
k-NN
Nguy
VI T T T
Markov Model (Mô hình Markov n)
ngo i tuy n
tr c tuy n
Optical Character Recognition (nh n d ng ch quang h c)
a)
Self Origanizing Map
United States Postal service
b m u ch s vi t tay NIST - Vi n Công ngh và Tiêu chu n Qu c
gia Hoa K (National Institute of Standard and Technology of the
United States)
a)
t p làm vi c
k láng gi ng g n nh t
- CT1301
4
án t t nghi p
p H i Phòng
Công ngh thông tin ngày càng phát tri n và có vai trò h t s c quan tr ng
không th thi u trong cu c s ng hi
i ngày càng t o ra nh ng c
máy thông minh có kh
ng, ph c v cho l i ích c
nh ng bài toán nh
v c công ngh
nh n bi t và x
c các công vi c m t cách t
i. Trong nh
t trong
c nhi u s quan tâm và t n nhi u công s c nh t c
bài toán nh n d ng. Tuy m i xu t hi
c quan tâm vì tính ng d ng th c t c
s ph c t p c a nó.
Nh n d ng ch vi t là m
c quan tâm nghiên c u và ng
d ng t nhi
ng chính:
-Nh n d ng ch in: ph c v cho công vi c t
c tài li
c
và hi u qu nh p thông tin vào máy tính tr c ti p t các ngu n tài li u.
-Nh n d ng ch vi t tay: v i nh ng m
ràng bu c khác nhau v cách
vi t, ki u ch ... ph c v cho các ng d
c và x lý ch ng t
u
ghi, b n th o vi t tay... Nh n d ng ch vi t tay
ng phát
tri n: nh n d ng ch vi t tay tr c tuy n (on-line) và nh n d ng ch vi t tay ngo i
tuy n (off-line).
n th
m này, bài toán nh n d ng ch
c gi i quy t g
tr n v n .Tuy nhiên trên th gi
Vi t Nam, bài toán nh n d ng ch vi t
tay v n còn là v
thách th c l
i v i các nhà nghiên c
th gi i quy t tr n v n vì nó ph thu c quá nhi
i vi t và s bi
i quá
ng trong cách vi t và tr ng thái tinh th n c a t
i vi
c bi
iv i
vi c nghiên c u nh n d ng ch vi t ti ng Vi t l i càng g p nhi
b ký t ti ng Vi t có thêm ph n d u, r t d nh m l m v i các nhi u.
Trích ch
n d ng ch vi t là vi c tìm và ch
c
c thù c a m i ch vi
u vào cho quá trình nh n d ng.Bên canh
vi c l a ch n m t thu t toán nh n d ng phù h p thì vi
trích
ch
ps
chính xác và gi m th i gian nh n d ng cho
toàn b h th ng,
V i s h p d n c a bài toán và nh ng thách th
c, v i
ni
hi
i và nh ng ng d ng th c t tuy t v i c a nó, v i
khát khao khám phá và chinh ph c nh ng tri th c m i m
Nguy
- CT1301
5
án t t nghi p
p H i Phòng
nghiên c u: Tìm hi u m t s
vi
tài nghiên c u và b o v lu
n d ng ch
t nghi p c a mình.
V lý thuy t :
- Tìm hi u khái quát v ch vi t và lý thuy t nh n d ng.
- Tìm hi u v trích ch
n d ng ch vi t.
V th c ti n :
-
t th nghi
c.
c trình bày trong 3
-
ng quan v ch vi t và lý thuy t nh n d ng.
2: T ng quan v trích ch
t s
trích ch
n d ng ch vi t.
nghi m.
- K t lu n: Tóm t t nh ng v
tìm hi
ng phát tri
Nguy
- CT1301
c trong bài, các v
liên
6
án t t nghi p
án t t nghi p c a em, nghiên c u v
ts
n d ng ch vi
i dung nghiên c u g m 3
trích ch
-
: T ng quan v ch vi t và lý thuy t nh n d ng
u t ng quan v ch vi t và lý thuy t nh n d ng.
c nhi u nhà nghiên c
Nh n d ng ch
v
th c t
p H i Phòng
c nhi u thành t u l n lao c v m t lý thuy t l n ng d ng
ng th i nêu mô hình t ng quát c a m t h nh n d ng ch vi t..
trích ch
: T ng quan v trích ch
n d ng ch vi t.
ts
u t ng quan v trích ch
ts
n d ng ch vi t.Gi i thi u v trích ch n
t bi n,kh
c ; trích ch
c
i sánh m u,m u bi n d ng,bi
i nh Unitar,b t bi n hình h c,b t
bi nZenite );trích ch
nh nh phân (
i sánh m u,m u bi n
d ng,bi
i nh Unitar,b t bi n hình h c ); trích ch
biên nh(
Chi u nghiêng,tách vùng,x p x
ng cong,mô t Fourier);trích ch
bi u di
i sánh m u,m u bi n d ng, c
r i r c,bi u di n
th ,
bi u di n Fourier ).
-
Nguy
nghi m.
- CT1301
7
án t t nghi p
p H i Phòng
1
T VÀ LÝ
1.1.
Nh n d ng ch
c nhi u nhà nghiên c
c
ng d ng th c t
n
c nhi u thành t u l n lao c v m t lý thuy t l n
c nh n d ng ch
c chia làm hai lo i: Nh n d ng ch
in và nh n d ng ch vi t tay.
n th
m này, nh n d ng ch
Tuy nhiên, nh n d ng ch vi t tay v
nghiên c u. Nh n d ng ch vi
c gi i quy t g
n v n.
thách th c l
i v i các nhà
c phân ra làm hai lo i: nh n d ng ch vi t
tay on-line (tr c tuy n) và nh n d ng ch vi t tay off-line (ngo i tuy n).
Nh n d ng ch vi t tay onc th c hi
i các thông
tin v nét ch
t nét vi
ng và t
c a nét vi t trong quá trình nó
máy tính nh n di
c các ch
c
nh n d ng không g p quá nhi u khó
cl
i v i nh n d ng ch vi t tay
off-line, d li
u vào là
c quét vào nên vi c nh n d
u so v i nh n d ng ch vi t tay on-line. Do d li
u vào là nh
n nên nh n d ng ch vi t tay off-line và nh n d ng ch
c g i
chung là nh n d ng ch quang h c (OCR - Optical Character Recognition).
n nh t khi nghiên c u bài toán nh n d ng ch vi t tay là s bi n
ng trong cách vi t c a t
i. Cùng m
i vi
u s khác bi t trong cách vi t tu thu c vào t ng ng c nh, ki u
vi t c a m
i theo th i gian ho
u
này gây ra nhi u tr ng i trong vi c trích ch
a ch n mô
hình nh n d ng.
1.2.
T TAY
1.2.1.
n này góp ph
d
tùy thu c vào ch
chính xác phân l p c a h th ng nh n
nh n d ng c a h th ng ch m l i. Vì v y,
ng nh quét vào c a t
n c th
ch n m t ho c
m t vài ch
Nguy
i này. N u c
- CT1301
x lý và ch
ng c a
8
án t t nghi p
máy quét t t thì có th b
p H i Phòng
n này. Kh i ti n x lý bao g m m t s ch c
Nh phân hóa nh, l c nhi u, chu n hóa kíc
y ch , làm m nh ch
n.
1.2.1.1.
c
,
nh
Nh phân hóa nh là m t k thu t chuy n
Trong b t k bài toán phân tích ho c nâng cao ch
p xám sang nh nh phân.
ng n
n thi t
ng quan tr ng. Nh phân hóa nh phân chia nh thành 2
ph n: ph n n n và ph n ch . H u h
phân hóa nh hi n nay
Nguy
- CT1301
9
án t t nghi p
u l a ch n m
t t c các giá tr
p H i Phòng
ng thích h
sáng l
t c các giá tr
sáng c a
t giá tr
n
sáng (ví d
ng thành m t giá tr
Hình 1.2. Nh phân hóa nh.
1.2.1.2.
Nhi u là m t t
m sáng th a trên nh. Kh nhi u là m t v
ng g p trong nh n d ng, nhi u có nhi u lo i (nhi
m, nhi u v t, nhi
nét...).
Hình 1.3. Nhi
t
m và nhi u v t.
kh các nhi
m (các nhi u v
c nh ), có th s d ng các
c (l c trung bình, l c trung v ...). Tuy nhiên, v i các nhi u v t (ho c
các nhi
cl
c t ra kém hi u qu , trong
ng h p này s d ng
các vùng liên thông nh t ra có hi u qu
.
Nguy
- CT1301
10
án t t nghi p
p H i Phòng
1.2.1.3.
Hình 1.4. Chu
c nh các ký t
Vi c chu
c nh d a trên vi c
nh tr ng tâm
nh kho ng cách l n nh t t tâm
n các c
i, trái, ph i c a
hình ch nh t bao quanh nh. Thông qua kho ng cách l n nh
nh
c m t t l co, giãn c a nh g c so v
nh, t
u ch nh
c nh theo t l
y, thu t toán chu
c
mb
c tính cân b ng khi co giãn nh, nh s không b bi n
d ng ho c b l ch.
1.2.1.4.
:
ng quét nh quá x
gi
ng h p này, ph i dùng các thu
(a)
ng biên c a ch không còn
t o.
kh c ph c.
(b)
Hình 1.5. (a) nh g c, (b)
Nguy
- CT1301
11
án t t nghi p
p H i Phòng
1.2.1.5.
Ch
c áp d ng v i các ký t b
t nét m t cách ng u nhiên.
c tách ch , d b nh m hai ph n liên thông c a ký
t thành hai ký t riêng bi t, t o nên sai l m trong quá trình nh n d ng.
1.2.1.6.
c quan tr ng nh m phát hi
a ký t b ng
cách lo i b d
m biên ngoài c a các nét. Tuy nhiên, quá trình làm m nh
ch r t nh y c m v i vi c kh nhi u.
Hình 1.6. Làm m nh ch .
1.2.1.7.
Do trang tài li u quét vào không c n th n ho c do s c in n, các hàng ch
b l ch so v i l chu n m
n tách ch ,
c. Trong nh
ng h
y, ph i tính l i t
m nh c a các ch b sai l ch.
Có nhi u k thu
u ch
nghiêng, k thu t ph bi n nh t d a trên
bi
chi u (projection profile) c a nh tài li u; m t s k thu t d
s các phép bi
i Hough và Fourier.
Hình 1.7. Hi u ch
Nguy
- CT1301
nghiêng c
n
12
án t t nghi p
p H i Phòng
1.2.2.
:
Kh i này có nhi m v tách t ng ký t ra kh
c tách và cô l
có th nh n d
ng ký t
n. Ch
i t ng th
ts
n
n thì h th ng m i
thông
d ng:
1.2.2.1.
ng áp d ng cho ch in. Khác v i ch vi t tay, kích
c và ki u ch c
nh, ph i tuân theo m t s
g n trong m t khung nên vi c cô l p m t ký t
khung bao c a ch
i v trí c
nh in n, các ch ph i n m
ng nh t v i vi c tìm ra
n. Tách ch theo chi u n m
ngang và th
ng là tìm m t hình ch nh t có c nh th
ch a tr n m t ký t
bên trong.
1.2.2.2.
ng và n m ngang
sáng
Hình 1.8. Tách dòng ch d a trên histogram theo chi u ngang c a kh i ch
i v i ch vi t tay thì vi
ng r
c t hai dòng là ít nh
n th p nh
Nguy
- CT1301
ng phân cách gi a các dòng và các ký t
ng h p này, không th
ng
ng mà ph i hi
ng phân cách v i s
m
i xây d
sáng c a các dòng ch , t
ng phân cách c n tìm (hình 1.8 và 1.9).
13
án t t nghi p
Hình 1.9.
p H i Phòng
nh kho ng cách gi a hai kí t và gi a hai t d a trên histogram
theo chi u th
ng c a dòng ch .
1.2.3.
nh
gi
b
ch
Trích ch
c k quan tr ng trong m t h th ng
nd
ng h
n nh t,
p xám ho c nh nh phân
c s d ng cho vi c nh n d ng. Tuy nhiên, trong h u h t các h nh n d
ph c t
chính xác c a các thu t toán phân l
i các
c trích ch n ph i rút g n l i càng nh càng t
n ph
m
c thông tin c a ký t . V i m c tiêu này, m t t
c trích
n cho m i l p sao cho có th phân bi
c v i các l p khác.
1.2.4. Hu
:
n quan tr ng nh
h th ng nh n d ng. Có nhi
các h th ng nh n d ng ch vi t tay.
1.2.5.
n này quy
chính xác c a
c áp d ng cho
:
n cu i cùng c
là
c ghép n i các kí t
nd
tái hi n l
ng th i phát hi
chính t d a trên c u trúc và ng
phát hi n ra các l i, các sai sót trong
vi c nâng cao ch
ng nh n d ng.
a quá trình nh n d ng. Có th hi u h u x lý
ng thành các t
m
n ra các l i nh n d ng sai b ng cách ki m tra
a các t , các câu ho
c
nh n d ng
c này góp ph
vào
n nh
k t n i các thông tin ng c nh là t n d ng m t t
u ch nh các l i c a h th ng nh n d ng.
Nguy
- CT1301
n
14
án t t nghi p
p H i Phòng
1.3.
Có nhi
n d ng m
c áp d ng r ng rãi
trong các h th ng nh n d ng ch vi
c tích
h
ng ti p c
i sánh m u, th ng kê, c u trúc, m
SVM.
1.3.1.
u:
K thu t nh n d ng ch
n nh t d
i sánh các nguyên
m u (prototype) v
nh n d ng ký t ho c t . Nói chung, toán t
i sánh
nh m
trong m
gi ng nhau gi
thu
m, hình d
cong...)
i sánh có th nghiên c u theo ba
ng sau:
i sánh tr c ti p: M t ký t
u vào là
c so sánh tr c ti p v i m t t p m u chu
theo m t
s
ng h
d ng. Các k thu
i sánh này có th
ph c t
nh . M
n và có m
toán h c v ng ch
r t nh y c m v i nhi u.
Các m u bi n d
d ng các m u bi n d
m t
tv im
p xám ho c nh nh phân
. Vi c so sánh d a
nh n
c so sánh m t m t ho c
i sánh tr c ti p
t qu nh n d ng c
i sánh m m: M
t phép bi n d ng
d li u
t.
i sánh khác là s
i sánh
nc
i sánh m
i sánh m t cách t
t
v i t t c các m u có th mà các m u này có th kéo giãn ra ho c co l i. Ch m t
c thành l
i sánh b ng cách
s d ng quy ho
ng và m t hàm bi n d ng .
i sánh gi m nh
t k thu
i sánh nh m
k thu t này s d
n c a nh ký t . Th nh t, các vùng
c nh n bi
m ts v
t t, các ph n t c a
c so sánh v
i sánh này. Công vi
h i m t k thu t tìm ki m trong m
tìm c
i toàn c c
c a m t s hàm .
Nguy
- CT1301
15
án t t nghi p
p H i Phòng
Các k thu
i sánh m u ch áp d ng t
i v i nh n d ng ch
v i ch vi t tay thì các k thu t này t ra kém hi u qu .
1.3.2.
i
u trúc:
Cách ti p c n c
a vào vi c mô t
khái ni m bi u di
trong ngôn ng t
i ta dùng m t s d ng nguyên thu
n th
c mô t
ng nh m t s
mô t
ng
ng
t s k t h p c a các d ng nguyên thu .
Các quy t c k t h p các d ng nguyên thu
nghiên c
m trong m t ngôn ng ,
quá trình phân tích cú pháp
c xây d ng gi
c
nh nh n d ng là
tv
gi i quy t bài toán
nh n d ng ch t ng quát. Tuy v
n nay còn nhi u v
nh
nh n d
c gi i quy
cl
ây d
c các thu t
toán ph d ng. Hi n nay, nh n d ng theo c u trúc ph bi n là trích tr
c
a m u h c, phân ho ch b ng ký t d
nh
c n nh n d ng s
c trích ch
ng phân ho
tìm ra ký t
p.
i v i nh n d ng ch vi t tay r i r c d a theo c
ng
biên, công vi
i ph i xây d
a ch
c bi
c
mu
mg
a các nét. Sau khi ti n hành
n ti n x lý, công vi
c ti
m
ch
a ch , m
ic p
ch s
u và cu
ng v i th t c
m ch
m ch c cu i. Cu i
cùng là xây d ng cây tìm ki m, d
c
u trúc
phân t p m u h c thành các l p. Quá trình tìm ki
phân l
c ti n
hành qua
nh l
ng v i m u vào và tìm ki m trong l
m u nào g n gi ng v i m u vào nh t .
u trúc áp d ng cho các bài toán nh n d ng ch
ng sau:
phát tri
c
1.3.2.1.
Gi a th p niên 1960, các nhà nghiên c u b
h
phân tích ti ng nói và ch vi
v ng và ngôn ng h
c áp d ng cho các chi
pháp ng pháp kh i t o m t s lu
Nguy
- CT1301
u xét các lu t c a ngôn ng
ng c a chính t , t
c nh n d
hình thành các ký t t m t t p các công
16