HӐC VIӊN CÔNG NGHӊ BѬU CHÍNH VIӈN THÔNG
NGUYӈN BÁ THӎNH
NGHIÊN CӬU VÀ XÂY DӴNG
Hӊ THӔNG XÁC THӴC CHӲ KÝ VIӂT TAY
Chuyên ngành:
Truy
Ӆn dӳ liӋu v
à M
ҥng máy tính
Mã s
ӕ:
60.48.15
TÓM T
ҲT LUҰN VĂN THҤC SƬ
Hà N
ӝi
-
2012
Lu
ұn văn ÿ
ѭ
ӧc ho
àn thành t
ҥi:
H
ӐC VIӊN CÔNG NGHӊ B
ѬU CHÍNH VI
ӈN THÔNG
Ngѭ
ӡi h
ѭ
ӟng dүn khoa hӑc:
PGS.TS. Tr
ӏnh Nhұt TiӃn
Ph
ҧn biӋn 1:
PGS.TS. Ngô Qu
ӕc Tҥo
Ph
ҧn biӋn 2
: TS. Tr
ҫn Nguy
ên Ng
ӑc
Lu
ұn văn sӁ ÿ
ѭ
ӧc bҧo vӋ tr
ѭ
ӟc Hӝi ÿӗng chҩm luұn văn thҥc sƭ tҥi Hӑc viӋn Công nghӋ Bѭu chính
Vi
Ӊn thông
Vào lúc:
16
gi
ӡ
00
ngày
20 tháng 01
năm
2013.
Có th
Ӈ t
ìm hi
Ӈu luұn văn tҥi:
-
Thѭ vi
Ӌn
c
ӫa
H
ӑc viӋn Công nghӋ B
ѭu chính Vi
Ӊn thông
MӢ ĈҪU
Ngày nay có rҩt nhiӅu cách ÿӇ xác ÿӏnh danh tính cӫa mӝt ngѭӡi và viӋc xác
ÿӏnh danh tính cӫa mӝt ng
ѭ
ӡi là rҩt quan trӑng và cҫn thiӃt. Chúng ta có thӇ xác ÿӏnh
danh tính cӫa mӝt ngѭӡi thông qua dҩu vân tay, chӭng minh thѭ, chӳ ký, tên và m
ұt
kh
ҭu, ÿһc ÿiӇm nhұn dҥng«
Trong các giao dӏch thѭѫng mҥi, các hӧp ÿӗng kinh doanh, các giao kèo, công
cө chính ÿӇ xác minh ng
ѭ
ӡi có trách nhiӋm trong các biên bҧn giao dӏch chính là chӳ
ký cӫa ngѭӡi ÿó. CNJng nhѭ trong giao dӏch tҥi các ÿiӇm giao dӏch cӫa ViӉn thông H
à
Nӝi, ÿӇ uӹ quyӅn cho ngѭӡi khác th
ì ch
ӳ ký cNJng có ý nghƭa rҩt quan trӑng. Chӳ ký sӁ
xác minh, xác thӵc ÿѭӧc ngѭӡi ký l
à ai và
hӑ có quyӅn hay không.
V
ӟi tҫm quan trӑng cӫa chӳ ký nhѭ vұy, nên viӋc giҧ mҥo chӳ ký ngày mӝt trӣ
nên nhiӅu hѫn, viӋc xác thӵc chӳ ký bҵng mҳt thѭӡng sӁ có rҩt nhiӅu sai sót ÿӕi vӟi
nhӳng chӳ ký mà ngѭӡi ký cӕ tình giҧ mҥo. Vӟi nhӳng quan chӭc cҩp cao, nhӳng
giám ÿӕc các doanh nghiӋp, thӫ tr
ѭ
ӣng các cѫ quan« viӋc ký các văn bҧn giҩy tӡ là
rҩt nhiӅu, hӑ sӁ không thӇ ký hӃt ÿѭӧc, khi ÿó thì cҫn có sӵ uӹ hoһc là chӳ ký cӫa hӑ
ÿѭӧc lѭu ӣ dҥng ҧnh. Chính vì vұy chúng ta cNJng cҫn xây dӵng nên nhӳng thѭ vi
Ӌn
chӳ ký dùng ÿӇ xác minh, xác thӵc chӳ ký khi cҫn thiӃt.
Luұn văn sӁ ÿi nghiên cӭu phѭѫng pháp ÿӇ xác thӵc chӳ ký viӃt tay, chӭng
minh sӵ giҧ mҥo chӳ ký.
Các nӝi dung chính tr
ình bày:
Ch˱˯ng 1
: T
ӘNG QUAN Vӄ CHӲ KÝ V
À S
Ӵ GIҦ MҤO
Ӣ chѭѫng này luұn văn sӁ ÿi tìm hiӇu vӅ khái niӋm chӳ ký và sӵ giҧ mҥo chӳ
ký vi
Ӄt tay.
Ch˱˯ng 2
: Hӊ THӔNG XÁC THӴC CHӲ KÝ VIӂT TAY
Ӣ chѭѫng này luұn văn sӁ tìm hiӇu và nghiên cӭu hӋ thӕng xác thӵc chӳ ký
viӃt tay, phân tích quá trình xây dӵng hӋ thӕng xác thӕng chӳ ký vi
Ӄt tay.
Ch˱˯ng 3
: THӰ NGHIӊM CHѬѪNG TRÌNH XÁC THӴC CHӲ KÝ VIӂT
TAY
Trong chѭѫng này sӁ giӟi thiӋu mӝt sӕ hӋ thӕng xác thӵc chӳ ký viӃt tay và áp
dөng lý thuyӃt ÿã tìm hiӇu ӣ các chѭѫng trѭӟc ÿӇ xây dӵng hӋ thӕng xác thӵc chӳ ký
viӃt tay.
KӂT LUҰN VÀ KI
ӂN NGHӎ
Tәng kӃt các kӃt quҧ ÿã ÿ
ҥt ÿ
ѭӧc và các mong muӕn, kiӃn nghӏ ÿӇ phát triӇn hӋ
thӕng.
Ch˱˯ng 1.
T
ӘNG QUAN Vӄ CHӲ KÝ V
À S
Ӵ GIҦ MҤO
1.1.
KHÁI NIӊM CHӲ KÝ
Mӝt sӕ loҥi chӳ ký nhѭ: chӳ ký viӃt tay, chӳ ký ÿiӋn tӱ, chӳ ký sӕ.
9
Chӳ ký viӃt tay (handwritten signature): là chӳ ký ÿѭӧc ký bҵng bút ӣ tr
ên
giҩy.
9
Chӳ ký sӕ (digital signature): là thông tin ÿã ÿѭӧc mã hoá ÿi kèm theo dӳ liӋu
(văn bҧn, hình ҧnh, video«) nhҵm mөc ÿích xác ÿӏnh ng
ѭ
ӡi chӫ cӫa dӳ liӋu
ÿó.
9
Chӳ ký ÿiӋn tӱ: là thông tin ÿi kèm theo dӳ liӋu (văn bҧn, hình ҧnh, video«)
nhҵm mөc ÿích xác ÿӏnh ngѭӡi chӫ cӫa dӳ liӋu.
Chúng ta sӁ ÿi nghiên cӭu vӅ chӳ ký viӃt tay. Chӳ ký viӃt tay là mӝt phҫn không
thӇ thiӃu trong các giao dӏch thѭѫng mҥi, trong các hӧp ÿӗng và các giao kèo. Ĉ
һc
biӋt chӳ ký giúp xác minh, nhұn dҥng ÿѭӧc ngѭӡi ký. Khi ÿã ký vào mӝt tài li
Ӌu
ngѭӡi ký ÿã chҩp thuұn ÿiӅu khoҧn ÿiӅu lӋ nӝi dung cӫa tài liӋu, lúc này ngѭӡi ký cҫn
có trách nhiӋm vӟi nhӳng gì trong tài li
Ӌu ÿó.
Bӕn thuӝc tính pháp lý cӫa mӝt chӳ ký viӃt tay nhѭ sau:
9
Tính xác thӵc (Authentication): mӝt chӳ ký cho phép xác minh, xác thӵc
ngѭ
ӡi ký.
9
S
ӵ công nhұn (Acceptance): chӳ ký truyӅn ý ÿӏnh chӫ tâm và sӵ chҩp thuұn
nӝi dung t
ài li
Ӌu mà ngѭӡi ký ÿã ký.
9
Tính toàn vҽn (integrity): chӳ ký thiӃt lұp xác minh tài liӋu ÿѭӧc ký, cho biӃt
tài liӋu ÿó không bӏ thay ÿәi theo bҩt kǤ cách nào.
9
Không thӇ tӯ chӕi trách nhiӋm (Non-repudiation): tác dөng cӫa ba ÿiӅu tr
ên
nhѭ là lӡi hӭa cӫa ngѭӡi ký, m
à h
ӑ không thӇ phӫ nhұn nhӳng g
ì
ÿ
ã ký.
Chӳ ký viӃt tay có rҩt nhiӅu hình dҥng và kích thѭӟc khác nhau. Sӵ thay ÿәi ӣ
trong chúng cNJng rҩt nhiӅu, nó trӣ nên khó khăn cho ngѭӡi muӕn phân biӋt chӳ ký
ÿúng và chӳ ký giҧ mҥo khi quan sát bҵng mҳt thѭ
ӡng.
Chúng ta có thӇ chia chӳ ký viӃt tay nhѭ là: chӳ ký ÿѫn giҧn, chӳ ký ҭu và chӳ ký
ÿӗ hoҥ (h
ình 1.1):
-
Chӳ ký ÿѫn giҧn (simple): l
à ch
ӳ ký mà
ӣ ÿó ng
ѭӡi ký viӃt t
ên c
ӫa hӑ.
-
Chӳ ký viӃt ҭu (cursive): l
à ch
ӳ ký ÿѭӧc viӃt ҭu thҧ.
-
Chӳ ký ÿӗ hoҥ (graphical): là chӳ ký ÿѭӧc phân loҥi nhѭ là ÿӗ hoҥ khi
miêu tҧ kiӇu dáng h
ình h
ӑc cӫa chӳ viӃt ҭu.
Hình 1.1: Các ki
Ӈu chӳ ký viӃt tay
HӋ thӕng xác thӵc chӳ ký tӵ ÿӝng ÿã trӣ nên rҩt cҫn thiӃt khi mà viӋc phân biӋt
giӳa chӳ ký thұt và chӳ ký giҧ mҥo trӣ nên khó khăn bҵng mҳt th
ѭ
ӡng. ViӋc d
ùng
máy tính ÿ
Ӈ
xác th
ӵc
ch
ӳ ký viӃt
tay tr
ӣ nên ÿáng tin c
ұy v
à có hiӋu quҧ cao h
ѫn.
Xác th
ӵc chӳ ký là mӝt mҧng nghi
ên c
ӭu quan trӑng trong viӋc xác thӵc thông tin
cá nhân, vӟi rҩt nhiӅu các ӭng dөng khác nhau nhѭ: kiӇm tra séc, truy cұp ATM, truy
cұp máy tính«vӅ cѫ bҧn có thӇ chia x
ác th
ӵc chӳ ký thành 2 phҫn chính:
-
Online: chӳ ký ÿѭӧc nhұn vào hӋ thӕng bҵng thiӃt bӏ ngay trong quá trình vi
Ӄt
vì vұy dӳ liӋu ÿ
ѭ
ӧc xӱ lý ÿӝng.
-
Offline: chӳ ký ÿ
ѭ
ӧc nhұn vào hӋ thӕng sau khi viӋc ký ÿã hoàn tҩt v
à d
ӳ liӋu
ӣ ÿây l
à ҧnh tƭnh.
1.2. VҨN Ĉӄ GIҦ MҤO CHӲ KÝ
Trong thӵc tӃ vӟi vai trò cӫa chӳ ký, thì viӋc giҧ mҥo chӳ ký diӉn ra khá nhiӅu
và trong nhiӅu lƭnh vӵc, viӋc phát hiӋn sӵ giҧ mҥo l
à r
ҩt cҫn thiӃt v
à quan tr
ӑng.
Mӝt sӕ loҥi chӳ ký giҧ mҥo nhѭ (h
ình 1.2):
-
Giҧ mҥo ngүu nhiên (Random forgery): ngѭӡi ký không biӃt chӳ ký cӫa ng
ѭ
ӡi
hӑ giҧ mҥo, hӑ chӍ biӃt tên cӫa ngѭӡi hӑ ÿӏnh giҧ mҥo chӳ ký. ViӋc ký diӉn ra
ngүu nhi
ên theo ý c
ӫa hӑ. KiӇu giҧ mҥo n
ày r
ҩt dӉ phát hiӋn bҵng mҳt th
ѭ
ӡng.
-
Giҧ mҥo không tұp luyӋn (Unskilled signature): ngѭӡi ký bҳt
chѭ
ӟc chӳ ký
cӫa ngѭӡi khác không cùng bҩt cӭ mӝt sӵ hiӇu nào, hӑ chӍ ÿѭӧc quan sát qua
chӳ ký cӫa ng
ѭ
ӡi ÿó sau mӝt ít thӡi gian mà thôi. KiӇu giҧ mҥo này cNJng
không khó phát hi
Ӌn.
-
Giҧ mҥo có tұp luyӋn (Skilled signature): ÿây là kiӇu giҧ mҥo khó phát hiӋ
n
nhҩt bӣi viӋc ký ÿѭӧc thӵc hiӋn bӣi nhӳng ngѭӡi có kinh nghiӋm trong viӋc
sao chép, giҧ mҥo chӳ ký, nói cách khác chúng ÿѭӧc ký bӣi các chuyên gia
trong vi
Ӌc giҧ mҥo.
Hình 1.2: M
ӝt sӕ kiӇu chӳ ký giҧ mҥo.
Trong các phҫn tiӃp theo chúng ta sӁ mô tҧ chi tiӃt các thành phҫn cӫa mӝt hӋ
thӕng xác thӵc chӳ ký viӃt tay.
Mӝt hӋ thӕng xác thӵc chӳ ký viӃt tay có thӇ ÿѭӧc mô tҧ nhѭ hình sau:
Hình 1.3: Mô hình xác th
ӵc chӳ ký viӃt tay
Mӝt sӕ phѭѫng pháp dùng ÿӇ xác thӵc và phát hiӋn sӵ giҧ mҥo chӳ ký:
-
Xác thӵc và phát hiӋn chӳ ký viӃt tay off-line sӱ dөng mô hình mӡ (Off-line
signature verification and forgery detection using fuzzy modeling).
-
Xác thӵc và nhұn dҥng chӳ ký viӃt tay off-line bӣi sӵ hӛ trӧ cӫa véc tѫ máy
(Off
-line signature verification and recognition by support vector machine).
-
Nhұn dҥng và xác thӵc chӳ ký viӃt tay of
f
-line sӱ dөng mҥng Neural (
Off
-
Line Signature Recognition and Verification Using Neural Network).
Luұn văn sӁ nghi
ên c
ӭu hӋ thӕng tӵ ÿӝng xác thӵc và phát hiӋn sӵ giҧ mҥo chӳ
ký
viӃt tay Offline dӵa trên mô hình mӡ. HӋ thӕng này sӱ dөng mô hình Takagi-sugeno
kӃt hӧp cùng vӟi cҩu trúc tham sӕ ÿӇ tính toán sӵ thay ÿәi ӣ trong nhӳng nét ÿһc tr
ѭng
cӫa chӳ ký viӃt tay.
Ӣ giai ÿoҥn khӣi tҥo chӳ ký cҫn xác thӵc
ÿѭ
ӧc tiӅn xӱ lý bҵng cách: chuҭn hoá
kích thѭӟc, biӃn ÿәi nhӏ phân (màu thành ÿen trҳng) và ÿѭӧc làm mҧnh tr
ѭ
ӟc khi trích
chӑn ÿһc trѭng tӯ ҧnh chӳ ký ÿó. Các ÿһc trѭng này tҥo ra kiӃn thӭc cѫ sӣ, dùng làm
căn cӭ ÿӇ chӳ ký cҫn
xác th
ӵc
so sánh v
ӟi nó.
TiӃp ÿó là chúng ta thӵc hiӋn viӋc xác thӵc, chúng ta sӁ so sánh các ÿһc trѭng cӫa
chӳ ký cӫa chӳ ký vӯa ÿ
ѭ
ӧc trích chӑn này vӟi các ÿһc trѭng cӫa chӳ ký gӕc cҫn so
sánh. Vì không có hai chӳ ký nào giӕng nhau hoàn toàn, nên chúng ta sӱ dөng logic
mӡ ÿӇ làm mӡ các ÿһc trѭng chӳ ký
c
ӫa tӯng ngѭӡi, sau ÿó so sánh chӳ ký cҫn xác
thӵc vӟi các ÿһc trѭng mӡ ÿӇ khҷng ÿӏnh chӳ ký mӟi này có phҧi là cӫa ngѭӡi nào ÿó
trong cѫ sӣ dӳ liӋu không.
Ch˱˯ng 2
. H
ӊ THӔNG XÁC THӴC CHӲ KÝ VIӂT TAY
M
ӝt hӋ thӕng xác thӵc chӳ ký viӃt tay bao gӗm các giai ÿo
ҥn sau:
-
Thu nhұn dӳ liӋu
.
-
TiӅn xӱ lý dӳ liӋu
.
-
Trích chӑn các ÿһc trѭng
.
-
Xác thӵc chӳ ký.
2.1. THU NHҰN DӲ LIӊU
Ch
ӳ ký cҫn kiӇm tra ÿ
ѭ
ӧc ký bҵng tay, bҵng bút ÿen trên giҩy trҳng, sau ÿó ÿ
ѭ
ӧc
quét vӟi ÿӝ phân giҧi 200 dpi (hình 2.1). Chӳ ký sau khi ÿѭӧc quét gӑi là chӳ ký ban
ÿҫu sӁ trҧi qua các thao tác tiӅn xӱ lý: chuҭn lҥi kích th
ѭ
ӟc, nhӏ phân ҧnh, và làm
mҧnh trѭӟc khi các ÿһc ÿiӇm cӫa nó ÿ
ѭ
ӧc trích xuҩt. Các ÿһc ÿiӇm này tҥo nên cѫ s
ӣ
tri thӭc ÿӇ sau n
ày s
ӱ dөng trong viӋc xác thӵc v
à
phát hiӋn sӵ giҧ mҥo.
Hình 2.1: Quét
ҧnh
Hình 2.2: L
ҩy chӳ ký ra
2.2. TIӄN XӰ LÝ DӲ LIӊU
Vi
Ӌc xӱ lý dӳ liӋu ÿҫu vào rҩt quan trӑng trѭӟc khi trích xuҩt các ÿһc ÿiӇm chӳ ký
sau khi quét vào. Trong hӋ thӕng n
ày các
ҧnh ÿѭӧc quét vào ÿ
ѭ
ӧc chӍnh lҥi kích thӭѫc
vӅ 120 x 60 ÿiӇm ҧnh, sau ÿó ÿ
ѭ
ӧc nhӏ phân hóa và làm mҧnh. Các ÿһc ÿiӇm sӁ ÿ
ѭ
ӧc
trích xuҩt tӯ ҧnh sau khi xӱ lý n
ày.
2.3. TRÍCH CHӐN ĈҺC TR
ѬNG
Ҧnh tiӅn xӱ lý ÿѭӧc chia làm 8 phҫn sӱ dөng phѭѫng pháp cân bҵng mұt ÿӝ
ngang. Ӣ phѭѫng pháp này ҧnh ÿã nhӏ phân hoá (ҧnh ÿen trҳng) ÿѭӧc quét theo chiӅu
ngang tӯ trái sang phҧi, sau ÿó là tӯ phҧi sang trái và tәng sӕ ÿiӇm ҧnh màu ÿen trên
toàn bӝ ҧnh (ÿiӇm tӕi) ÿѭӧc nhұn biӃt hӃt. Các ÿiӇm ҧnh ÿó ÿѭӧc chia làm 8 vùng sao
cho sӕ l
ѭ
ӧng ÿiӇm ҧnh tӕi phân bӕ tr
ên m
ӛi vùng xҩp xӍ bҵng nhau.
Vi
Ӌc chia n
ày ÿѭ
ӧc minh hoҥ nhѭ (h
ình 2.3) d
ѭӟi ÿây:
Hình 2.3: Mô hình trích chӑn ÿһc tr
ѭng
ҧnh
Hình 2.4: (a) Phân chia
ҧnh theo ph
ѭѫng m
ұt ÿӝ ngang
(b) Ti
Ӆn xӱ lý ҧnh v
à rút trích ÿ
һc tr
ѭng
Các bѭӟc trích chӑn ÿһc tr
ѭng:
Bѭ
ӟc 1:
Tính tәng sӕ ÿiӇm ҧnh màu ÿen có trên ҧnh ÿã ÿѭӧc tiӅn xӱ lý gӑi sӕ ÿó là S. Ta
muӕn chia ҧnh làm 8 vùng nên ta tính sӕ l
ѭ
ӧng ÿiӇm ҧnh tr
ên m
ӛi vùng = S/8 (tәng sӕ
ÿiӇm ҧnh tӕi trên toàn bӝ ҧnh chia cho sӕ vùng cҫn chia).
Ví dө: có 800 ÿiӇm ҧnh chia cho 8 vùng => sӕ ÿiӇm ҧnh trên mӛi vùng xҩp xӍ là 100
ÿi
Ӈm.
Bѭ
ӟc 2:
Vì không thӇ lҩy chính xác 100 ÿiӇm tr
ên m
ӛi vùng => ta lҩy xҩp xӍ là 100 ÿi
Ӈm.
-
Quét ҧnh tӯ trái sang phҧi cho tӟi khi gһp cӝt nào ÿó mà
s
ӕ lѭӧng ÿiӇm
ҧnh màu ÿen có trong phҫn ÿang xét tính ÿӃn cӝt nào ÿó là bҵng hoһc lӟn h
ѫn
100, hoһc là ÿ
Ӄn cӝt cuӕi c
ùng cӫa ҧnh chӳ ký.
Lһp lҥi viӋc quét tӯ trái sang phҧi này cho 8 phҫn ta muӕn chia, ta nhұn ÿѭӧc 8
cӝt, lҩy sӕ thӭ tӵ cӫa các cӝt ÿó. Gӑi lҫn l
ѭ
ӧt các cӝt (sӕ thӭ tӵ cӫa cӝt) ÿó l
à:
t1, t2, «, t8.
-
Tѭѫng tӵ ta quét ҧnh chӳ ký tӯ phҧi qua trái ta cNJng tính sӕ ÿiӇm ҧnh nh
ѭ
trên ta ÿѭӧc 8 cӝt khác là: p1, p2, «, p8 (chú ý khi ta quét tӯ phҧi sang,
nhѭng khi ta ÿánh sӕ thӭ tӵ thì ta ÿánh p8 là ÿiӇm ÿҫu tiên còn p1 là ÿi
Ӈm
cuӕi cùng).
-
Lҩy trung bình 2 cӝt cӫa các phҫn tѭѫng ӭng ӣ hai chiӅu quét tӯ trái sang
phҧi và tӯ phҧi sang trái, ta ÿ
ѭ
ӧc cӝt mӕc cho tӯng phҫn ta lҩy xҩp xӍ trên c
ӫa
trung bình ÿó. Gӑi xҩp xӍ ÿó lҫn lѭӧt là: tb1, tb2,«, tb8.
tb1 = (t1 +p1)/2,
tb2 = (t2 +p2)/2,
«««««««
tb8 = ( t8 +p8)/2.
Bѭ
ӟc 3:
-
V
ӟi mӛi mӝt vùng trong 8 vùng vӯa tính ÿѭӧc ӣ trên (phân ranh gi
ӟi
vùng bҵng các tb1,tb2,«,tb8), ta gӑi các vùng này là v1, v2,«, v8 ta ÿi
Ӆu
chӍnh lҥi kích th
ѭ
ӟc cӫa toàn vùng thành mӝt ô có kích thѭӟc l
à
39 x 60 pixels
và làm m
ҧnh lҫn nӳa.
-
Mӛi ô (mӝt vùng) ta lҥi chia nó thành 4 hàng và 3 cӝt, tӭc là mӛi vùng
bây giӡ gӗm 12 phҫn con. ChiӅu ngang cӫa mӛi phҫn con là 39/3 = 13, chi
Ӆu
dӑc cӫa mӛi phҫn con là 60/4 =15. Vұy mӛi phҫn con có kích thѭӟc là 13x15
pixels. Nhѭ vұy mӝt chӳ ký ta ÿã chia ra thành 8 vùng x 12 phҫn, tәng cӝng l
à
96 phҫn cho mӝt chӳ ký.
-
Ta tính góc cӫa các ÿiӇm ҧnh tӕi trong mӛi phҫn vӟi ÿiӇm gӕc cӫa tӯng
phҫn ÿӇ ta tính góc là ÿiӇm trái bên dѭӟi cӫa phҫn. Mӝt phҫn có chiӅu rӝng l
à
13 pixels, chiӅu ngang là 15pixels.
Ví dө: vӟi mӝt phҫn lҩ
y ra t
ӯ 96 phҫn con nhѭ h
ình d
ѭӟi ÿây (hình 2.7)
Hình 2.7: M
ӝt phҫn con cӫa chӳ ký
Giҧ sӱ có 30 ÿiӇm ҧnh tӕi (màu ÿen) trong phҫn này. Ta xét các ÿiӇm ҧnh lҫn l
ѭ
ӧt
tӯ trái sang phҧi, tӯ trên xuӕng dѭӟi cӫa phҫn, ÿiӇm nào màu ÿen thì ta tính góc, màu
trҳng bӓ qua.
Giҧ sӱ có ÿiӇm (2,3) màu ÿen, tӑa ÿӝ 2 tính theo chiӅu ngang (chiӅu x), tӑa ÿӝ 3
tính theo chiӅu dӑc (chiӅu y), khi ÿó góc cӫa ÿiӇm này ÿѭӧc tính dӵa v
ào c
ông th
ӭc:
Tan(goc2
,
3) = cҥnh ÿӕi/ cҥnh kӅ
;
Tan(goc2
,
3) = (chi
Ӆ
u cao phҫn - toҥ ÿӝ y)/toҥ ÿӝ x
.
tính goc2
,
3 này theo công thӭc
: goc2
,3 = arctan(tan(goc2
,
3)).
Lһp lҥi viӋc tính góc này cӫa tҩt cҧ ÿiӇm ҧnh màu ÿen cӫa phҫn, rӗi lҩy trung
bình cӝng cӫa các góc này làm dӳ liӋu ÿһc trѭng cӫa phҫn n
ày.
Ĉһc trѭng góc cӫa phҫn = (goc1
,
1 + goc2
,
3 +«+ goc13
,
15) / 30.
Tính trung bình cӝng góc tӯng phҫn cӫa 12 phҫn cӫa mӝt vùng chӳ ký, lҫn lѭӧt tӯ
trái sang phҧi, tӯ tr
ên xu
ӕng dѭӟi. Cӭ thӃ tính hӃt 8 vùn
g c
ӫa chӳ ký tӯ trái sang phҧi.
Bѭ
ӟc 4:
Sau khi ta thu ÿѭӧc trung bình cӝng cӫa 96 góc cӫa chӳ ký ta lѭu lҥi chúng v
ào
trong mҧng 2 chiӅu: chiӅu ngang là 96 lѭu trung bình cӝng góc cӫa 96 phҫn cho mӝt
chӳ ký, chiӅu dӑc tѭѫng ӭng l
à s
ӕ lѭ
ӧng các c
hӳ ký thu ÿ
ѭ
ӧc.
Bҧng 2.1: Các ÿһc trѭng góc cӫa chӳ ký.
2.4. XÁC THӴC
Chúng ta sӁ sӱ dөng mô hình mӡ cӫa các ÿһc trѭng góc cho viӋc xác thӵc chӳ
ký và phát hiӋn sӵ giҧ mҥo chӳ ký. Chúng ta có thӇ dӵa vào mô hình mӡ cӫa Takagi-
sugeno.
Ĉӕi vӟi viӋc xác thӵc chӳ ký dӵa trên nhiӅu ÿһc trѭng cӫa chӳ ký nhѭ ÿ
һc
trѭng vӅ góc, ÿһc trѭng vӅ khoҧng cách «thì chúng ta có thӇ ÿѭa vӅ mô hình m
ӡ
tѭѫng tӵ mô h
ình Takagi
-sugeno.
2.4.1. Mô hình Takagi
-
sugeno
2.4.1.1. Công th
ͱc
V
ӟi x
k
là ÿһc trѭng thӭ k
th
cӫa tұp mӡ A
k
, khi ÿó luұt IF THEN thӭ k
th
trong mô
hình Takagi-sugeno ÿѭӧc mô tҧ nhѭ sau:
Rule k: IF x
k
is A
k
THEN y
k
= c
k0
+ c
k1
x
k
(1)
Mӛi chӳ ký có mӝt quy luұt riêng, do vұy chúng ta có sӕ l
ѭ
ӧng luұt bҵng vӟi sӕ lѭ
ӧng
các ÿ
һc tr
ѭng (96 lu
ұt).
T
ұp mӡ A
k
ÿѭӧc diӉn tҧ bӣi hàm liên thuӝc dѭӟi dҥng h
àm m
NJ sau:
Trong ÿó là giá trӏ trung bình và là sai sӕ cӫa ÿһc trѭng thӭ k trong thiӃt lұp
mӡ. Vӟi hai tham sӕ s
k
và t
k
, sӵ thêm hai tham sӕ này vào sӁ giúp chúng ta theo d
õi
các sӵ thay ÿәi khi viӃt cӫa chӳ ký. Khi s
k
= 1 và t
k
= -
1, hàm liên thuӝc không có các
tham sӕ cҩu trúc và do ÿó nó chӍ bӏ ҧnh hѭӣng bӣi giá trӏ trung bình và ÿӝ lӋch trong
tұp hӧp.
Vi
Ӌc chӭng minh sӵ thay ÿәi hàm liên thuӝc dӉ dàng kiӇm tra nhӳng sӵ thay
ÿәi qua giá trӏ trung bình và sai sӕ, không cҫn kӻ thuұt hӑc tinh vi. Sӵ ÿҫy ÿӫ trong
công thӭc (1) ÿѭӧc diӉn tҧ nhѭ sau:
Hàm ÿҫu ra trӣ th
ành:
Trong ÿó L là sӕ lѭӧng luұt (96 luұt)
Chúng ta ÿӏnh nghƭa hàm ÿánh giá hi
Ӌu suҩt nh
ѭ sau:
V
ӟi Y và Y
r
lҫn lѭӧt biӇu diӉn giá trӏ ÿҫu ra cӫa hӋ thӕng thӵc và giá trӏ ÿҫu ra cӫa mô
hình mӡ ÿang xây dӵng. NӃu Y
r
không xác ÿ
ӏnh nó sӁ ÿ
ѭӧc quy vӅ mӝt giá trӏ ÿѫn v
ӏ.
2.4.1.2. H͕c các tham s͙
2.4.1.3.
C
̵p nh̵p các tham s͙
2.4.1.4. Áp dͭng bài toán
Ta xây d
ӵng mӝt tұp chӳ ký mүu vӟi mӛi chӳ ký sӁ ÿ
ѭ
ӧc ký 10 lҫn.
Trong mô hình Takagi-sugeno v
ӟi hӋ sӕ chӑn tr
ѭӟc cӕ ÿӏnh: c
k0
= 1/L; c
k1
= 0
Tӯ công thӭc (5) ta chӑn Y
r
= 1.
Tӯ công thӭc (1), (4), (5) vӟi các tham sӕ ӣ trên ta có: J = ( 1
-
)
V
ӟi hàm ÿánh giá hiӋu suҩt này, ta tính toán các ÿҥo hàm theo s
k
và t
k
sau ÿó
thӵc hiӋn cұp nhұp các tham sӕ này ta tính giá trӏ các h
àm liên thu
ӝc cho tҩt cҧ các ÿһc
trѭng. Lһp lҥi thao tác này cho tҩt cҧ các chӳ ký cӫa tӯng ngѭ
ӡi.
V
ӟi mӛi ng
ѭ
ӡi ta có I lҫn ký (I = 10) và mӛi chӳ ký có j ÿһc trѭng (j=96). Trong
tұp 10 giá trӏ hàm liên thuӝc thӭ j (MF
i,j
(i=1,2, ,10)) ta xác ÿӏnh giá trӏ MF
j
max ,
MF
j
min tѭѫng ӭng là các giá trӏ lӟn nhҩt và nhӓ nhҩt cӫa hàm liên thuӝc. Nhѭ vұy ta
có 96 cһp min, max ÿ
ѭ
ӧc xác ÿӏnh.
Ĉ
ӕi vӟi mӛi chӳ ký cҫn xác thӵc, ta kiӇm tra ӭng vӟi mӛi giá trӏ hàm liên thuӝc
nҵm trong khoҧng min, max tѭѫng ӭng thì ta tính là true, ngѭӧc lҥi l
à false.
N = tәng sӕ lҫn tính là true, ta so sánh N/96 vӟi C là mӕc phҫn trăm quy ÿӏnh tính xác
thӵc (ví dө 90%), nӃu N/96 > C thì ta nói chӳ ký cҫn xác thӵc ÿúng là cӫa ngѭӡi ÿó,
và ngѭӧc lҥi ta kӃt luұn ÿó l
à ch
ӳ ký giҧ mҥo.
Ch˱˯ng 3.
TH
Ӱ NGHIӊM
CHѬѪNG TR
ÌNH XÁC THӴC CHӲ
KÝ VI
ӂT TAY
3.1. GIӞI THIӊU MӜT SӔ CHѬѪNG TRÌNH XÁC THӴC CHӲ KÝ
VI
ӂT TAY
3.1.1. Chѭѫng trình xác thӵc chӳ ký viӃt tay cӫa Ingvald Straume
3.1.2. Chѭѫng trình xác thӵc chӳ ký viӃt tay cӫa Ajay R, Keshav Kumar
HK và Sachin Sudhendra
.
3.2. XÂY DӴNG CHѬѪNG TRÌNH XÁC THӴC CHӲ KÝ VIӂT TAY
3.2.1. Giӟi thiӋu chѭѫng trình xác thӵc chӳ ký viӃt tay
Dӵa trên mô hình mӡ Takagi-sugeno kӃt hӧp vӟi cҩu trúc tham sӕ chúng ta ÿi
xây dӵng chѭѫng trình xác thӵc chӳ ký.
Mөc ÿích chính xây dӵng chѭѫng trình ÿӇ tiӃn hành viӋc hӑc và xác thӵc chӳ
ký. ĈӇ hӑc ÿѭӧc chúng ta cҫn rút trích ra ÿһc trѭng cӫa chӳ ký và lѭu vào cѫ sӣ dӳ
liӋu, chúng ta sӁ dùng nhӳng thông tin này ÿӇ xác thӵc mӝt chӳ ký xem chӳ ký ÿó có
ÿúng là chӳ ký cӫa mӝt ngѭӡi nào ÿó trong cѫ sӣ dӳ liӋu hay không.
Chѭѫng tr
ình s
ӱ dөng c
ѫ s
ӣ dӳ liӋu Access. Dӳ liӋu gӗm có hai bҧng:
-
Bҧng tblMinMaxMean: bҧng này lѭu sӕ min, max, mean, ondinh cӫa 96 phҫn
cӫa chӳ ký cӫa mӝt ngѭ
ӡi
-
Bҧng tblsignature: bҧng này lѭu thông tin các ÿһc trѭng góc cӫa 96 phҫn c
ӫa
tӯng chӳ ký.
3.2.2. Cҩu hình hӋ thӕng
1/ Ph
ҫn cӭng:
+ Bӝ vi xӱ lý Pentium 300 Megahertz hoһc cao h
ѫn.
+ Bӝ nhӟ Ram tӕi thiӇu 512MB (ÿӅ xuҩt 1G).
+ Dung lѭӧng ә ÿƭa cӭng tӕi thiӇu 20GB.
2/ Ph
ҫn mӅm:
+ HӋ ÿiӅu hành windows xp hoһc win7.
+ H
Ӌ thӕ
ng cѫ sӣ dӳ liӋu Microsoft Access.
3.2.3. Các chӭc năng chính cӫa chѭѫng trình
-
Ĉăng ký ngѭ
ӡi d
ùng: dùng cho vi
Ӌc hӑc.
-
Nhұp chӳ ký: nhұp chӳ ký vào ÿӇ hӑc hoһc xác thӵc.
-
Sang ÿiӇm ҧnh: chuҭn hóa kích thѭӟc, nhӏ phân hóa ҧnh, làm m
ҧnh ҧnh.
-
Trích chӑn các ÿ
һc tr
ѭng: rút ra ÿ
һc tr
ѭng c
ӫa ҧnh.
-
Hӑc: lѭu thông tin các ÿ
һc tr
ѭng cӫa ҧnh.
-
Xác thӵc:
xác th
ӵc
ch
ӳ ký ng
ѭ
ӡi dùng.
3.2.4. Chѭѫng trình
Mӝt sӕ h
àm ch
ӭc năng cӫa chѭѫng tr
ình:
-
Hàm phân chia ҧnh:
-
Hàm tính trung bình góc:
-
Hàm
xác th
ӵc
3.2.5. Hѭӟng dүn
s
ӱ dөng chѭѫng tr
ình
Chѭѫng trình có giao di
Ӌn nh
ѭ sau:
Hình 3.7: Giao di
Ӌn chính
Chúng ta sӱ dөng 30 chӳ ký cӫa ba ngѭӡi, mӛi ngѭӡi ký 10 lҫn. Chӳ ký ÿ
ѭ
ӧc
ký và sau ÿó ÿѭӧc quét vӟi ÿӝ phân giҧi 200dpi. Sau ÿó chúng ta chӍnh lҥi kích th
ѭ
ӟc
cӫa chӳ ký vӅ kích thѭӟc 120 x 60 pixels.
Khi chҥy chѭѫng trình, mӝt giao diӋn nhѭ hình 3.7 ÿѭӧc hiӋn ra vӟi mӝt biӇu
ÿӗ ÿѭӧc tҥo sҹn.
Chúng ta cҫn ÿăng nhұp ÿӇ tiӃn hành viӋc hӑc và xác thӵc mӝt chӳ ký, thông
tin ÿăng nh
ұp sӁ ÿ
ѭӧc lѭu vào cѫ sӣ dӳ liӋu, ÿӇ phөc vө cho viӋc hӑc và xác thӵc.
Form ÿăng nhұp nhѭ sau (hình 3.8):
Hình 3.8: Form
ÿăng nh
ұp
Khi ta kích vào nút ÿăng ký thì nó sӁ gӑi ÿӃn form ÿăng nhұp.
Sau khi ÿăng nhұp vào hӋ thӕng, chúng ta có quyӅn hӑc chӳ ký mà chúng ta
nhұp vào, tiӃp theo chúng ta cҫn nhұp mӝt chӳ ký vào chѭѫng trình. Trong cӱa sә
nhұp chӳ ký vào ta chӍ cho phép chӑn nhӳng ҧnh chӳ ký dҥng bitmap.
Bӭc ҧnh ÿѭ
ӧc nhұp v
ào sӁ hiӇn thӏ nhѭ h
ình d
ѭӟi ÿây (h
ình 3.9):
Hình 3.9: Ch
ӳ ký ÿ
ã ÿѭ
ӧc nhұp v
ào
Chúng ta ҩn nút ³Sang ÿiӇm ҧnh´ ÿӇ
th
ӵc hiӋn viӋc nhӏ phân hoá chӳ ký ÿó
(hình 3.10)
Hình 3.10
Sau nhӳng b
ѭ
ӟc trên chúng ta sӁ ÿ
ѭ
ӧc ҧnh cӫa chӳ ký ÿã ÿѭӧc nhӏ phân hoá
vӟi kích th
ѭ
ӟc 120 x 60 pixels. Chúng ta tiӃn hành viӋc trích chӑn các ÿһc tr
ѭng.
Chúng ta chia ҧnh này ra làm 8 phҫn theo phѭѫng pháp cân bҵng mұt ÿӝ ngang nh
ѭ
trên. Khi ÿó ta ÿѭӧc 8 vùng cӫa mӝt chӳ ký, chúng ta lҥi chӍnh lҥi kích thѭӟc cӫa mӛi
vùng ÿó ÿѭa chúng vӅ kích th
ѭ
ӟc 39 x 60 pixels. Mӛi vùng trong 8 vùng ÿó chúng ta
lҥi chia chúng thành 4 hàng và 3 cӝt, chúng ta sӁ ÿѭӧc 12 phҫn trong mӛi vùng nhѭ
vұy chúng ta có 96 phҫn cho mӝt chӳ ký. Chúng ta sӁ tính góc cӫa tҩt cҧ các ÿiӇm ҧnh
(pixel tӕi) trong mӛi phҫn rӗi ta lҩy trung bình cӝng cӫa tҩt cҧ các góc ÿó ÿӇ làm ÿ
ҥi
lѭӧng ÿһc trѭng góc cho ph
ҫn ÿó.
Dӵa vào các ÿ
ҥi l
ѭӧng ÿһc trѭng cӫa các phҫn ÿó chúng ta vӁ ÿѭӧc biӇu ÿӗ ÿһc
trѭng góc cӫa chӳ ký ÿó. Chúng ta ҩn nút trích chӑn ÿһc trѭng ÿӇ thu ÿѭӧc kӃt quҧ
nhѭ sau (hình 3.11):
Hình 3.11
Lúc này ta có thӇ tiӃn hành viӋc hӑc ÿӇ lѭu các ÿһc trѭng góc vào cѫ sӣ dӳ liӋu hoһc
tiӃn hành vi
Ӌc
xác th
ӵc
xem ÿây
có phҧi
là ch
ӳ ký cӫa ngѭӡi cҫn xác thӵc không.
K
ӂT LUҰN V
À KI
ӂN NGHӎ
Sau mӝt thӡi gian làm viӋc, vӟi sӵ nӛ lӵc cӫa bҧn thân và sӵ tұn tình chӍ bҧo
cӫa thҫy giáo PGS.TS.Trӏnh Nhұt TiӃn tôi ÿã hoàn thành luұn văn cӫa mình. Luұn văn
ÿã nghiên cӭu mô hình xác thӵc chӳ ký viӃt tay và phát hiӋn sӵ giҧ mҥo dӵa trên mô
hình mӡ cӫa Takagi - sugeno có sӱ dөng các tham sӕ cҩu trúc trong hàm mNJ li
ên
thuӝc.
Luұn văn gӗm 2 kӃt quҧ chính:
1/ Nghiên cӭu vӅ chӳ ký vi
Ӄt tay
và hӋ thӕng xác thӵc chӳ ký viӃt tay.
2/ Thӱ nghiӋm chѭѫng trình xác th
ӵc
và phát hiӋn sӵ giҧ mҥo chӳ ký vi
Ӄt tay
.
Ĉӝ tin cұy (hay sӵ chính xác) cӫa quá trình xác thӵc các chӳ ký tӕi thiӇu bҵng
hoһc xҩp xӍ vӟi các chuyên gia phân tích chӳ ký giҧ mҥo, có khҧ năng xác thӵc mӝt sӕ
lѭӧng lӟn các chӳ ký trong thӡi gian ngҳn, hӋ thӕng có thӇ triӇn khai và hoҥt ÿӝng tӕt
trong ViӉn Thông Hà Nӝi và trong mӑi ÿѫn vӏ có nhu cҫu, giúp giҧm thiӇu ÿáng kӇ
nhӳng sai sót do quá trình xác thӵc chӳ ký thӫ công gây ra. HӋ thӕng xác thӵc n
ày
không chӍ có khҧ năng xác thӵc nhӳng chӳ ký ÿúng mà còn xác ÿӏnh ÿѭӧc sӵ giҧ mҥo
chӳ ký. HӋ thӕng ÿã ÿѭӧc áp dөng ÿӇ kiӇm tra hӝ chiӃu Australian vӟi ÿӝ chính xác
cao.
V
ӟi kӃt quҧ ÿã ÿҥt ÿѭӧc tôi mong muӕn ÿ
ѭ
ӧc ӭng dөng chѭѫng tr
ì
nh vào th
ӵc
tӃ tҥi ViӉn thông Hà Nӝi, và triӇn khai nhân rӝng trong quy mô lӟn hѫn trong ngành
và các ngành khác.