Tải bản đầy đủ (.docx) (140 trang)

Nghiên cứu nâng cao các kỹ thuật đối sánh vân tay dựa trên đặc trưng điểm chạc luận văn ths máy tính 624801

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.69 MB, 140 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ

LÊ HỒNG HẢI

NGHIÊN CỨU NÂNG CAO CÁC KỸ THUẬT ĐỐI
SÁNH VÂN TAY DỰA TRÊN ĐẶC TRƢNG ĐIỂM
CHẠC

LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN

HÀ NỘI - 2018


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ

LÊ HỒNG HẢI

NGHIÊN CỨU NÂNG CAO CÁC KỸ THUẬT
ĐỐI SÁNH VÂN TAY DỰA TRÊN ĐẶC TRƢNG
ĐIỂM CHẠC

Chuyên ngành: Các hệ thống thông tin
Mã số: 62 48 05 01

LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1.
PGS.TS. Nguyễn Ngọc Hóa
2.


PGS.TS Nguyễn Hà Nam


LỜI CẢM ƠN

Luận án được thực hiện tại Trường Đại học Công nghệ - ĐHGQ Hà Nội, dưới sự
hướng dẫn của PGS.TS. Nguyễn Ngọc Hóa và PGS.TS. Nguyễn Hà Nam.
Trước hết, tác giả xin được bày tỏ lòng cảm ơn sâu sắc tới thầy Nguyễn Ngọc
Hóa, thầy Nguyễn Hà Nam, những người đã hướng dẫn, đưa ra những định hướng
giúp tác giả hoàn thành bản luận án này. Tác giả cũng cám ơn thầy Hà Quang Thụy,
thầy Nguyễn Trí Thành, thầy Nguyễn Hải Châu đã cho tác giả nhiều lời khuyên quý
báu để hoàn thiện các nội dung khoa học của luận án.
Tác giả xin g i lời cám ơn tới công ty Sea-Solutions đã h
chu n quốc tế

VC 2002

trợ CS L vân tay

trong quá tr nh thực hiện dự án xây dựng hệ thống nhận

dạng vân tay Kokle. Tác giả cũng xin g i lời cảm ơn tới NCS Vũ Tiến Thành đã h trợ
nhiều tài liệu quốc tế cập nhật.
Tác giả xin chân thành cảm ơn Khoa Công Nghệ Thông Tin, Trường Đại Học
Công Nghệ đã tạo điều kiện thuận lợi cho tác giả trong quá tr nh học tập và nghiên
cứu.
Sau cùng, tác giả xin chân thành cảm ơn gia đ nh, những người thân và bạn bè đã
giúp đỡ, động viên tác giả trong suốt thời gian thực hiện luận án.

1



LỜI CAM ĐOAN

Tôi xin cam đoan đây là công tr nh nghiên cứu của riêng tôi. Các nội dung viết
chung với các tác giả khác đều được sự đồng ý của đồng tác giả trước khi đưa vào luận
án. Các kết quả nêu trong luận án là trung thực và chưa từng được ai công bố trong các
công tr nh nào khác.
Tác giả

Lê Hồng Hải

2


MỤC LỤC
DANH MỤC CÁC K HIỆU VÀ CH VIẾT TẮT............................................ 6
DANH MỤC BẢNG SỐ LIỆU............................................................................. 7
DANH MỤC HÌNH ẢNH.................................................................................... 8
DANH MỤC THUẬT TOÁN............................................................................. 12
GIỚI THIỆU CHUNG...................................................................................... 13
Động lực nghiên cứu........................................................................................ 13
Thực trạng nghiên cứu về đối sánh vân tay...................................................... 15
Mục tiêu và các nội dung chính....................................................................... 18
Các đóng góp của luận án................................................................................ 19
T chức của luận án.......................................................................................... 20
Chƣơng 1: KHÁI QUÁT VỀ ĐỐI SÁNH VÂN TAY DỰA TRÊN ĐIỂM
CHẠC......................................................................................................................... 22
1.1. Hệ thống nhận dạng vân tay tự động......................................................... 22
1.2. Đặc trưng trích xuất từ ảnh vân tay........................................................... 24

1.2.1. Thu ảnh vân tay từ bộ cảm biến........................................................... 26
1.2.2. Nâng cao chất lượng ảnh vân tay......................................................... 27
1.2.3. Tách đặc trưng điểm chạc.................................................................... 29
1.3. Bài toán đối sánh vân tay dựa trên điểm chạc........................................... 33
1.3.1. Phát biểu bài toán................................................................................ 33
1.3.2. Một số khó khăn trong quá tr nh đối sánh........................................... 36
1.3.3. Giá trị tương đồng giữa hai ảnh vân tay.............................................. 38
1.3.4. Đánh giá kết quả hệ thống nhận dạng vân tay..................................... 38

3


1.4.Một số nghiên
1.4.1. Đối sánh toàn cục ..................................................................................
1.4.2. Đối sánh cục bộ .....................................................................................
1.4.2.1. Một số cấu trúc cục bộ biểu diễn điểm chạc ...................................
1.4.2.2. Hạn chế của một số biểu diễn truyền thống ....................................
1.4.2.3. Biểu diễn cục bộ dựa trên mã trụ MCC Minutia Cylinder-Code) . 50
1.4.3. Giai đoạn gia cố trong thuật toán đối sánh vân tay dựa trên cấu trúc cục
bộ .............................................................................................................................

1.5.Kết chương .....
Chƣơng 2: CẢI TIẾN GIAI ĐOẠN GIA CỐ CỦA THUẬT TOÁN ĐỐI
SÁNH DỰA TRÊN ĐIỂM CHẠC .............................................................................

2.1.Các phương ph

2.2.Giải thuật gia c
2.2.1. Đề xuất cải tiến cho phương pháp gia cố dựa trên ph p biến h nh .......
2.2.2. Đề xuất cải tiến cho phương pháp gia cố gia tăng ................................


2.3.Đánh giá giải th

2.4.Kết chương .....
Chƣơng 3: PHÁT HIỆN ĐIỂM ĐƠN NHẤT TỪ ẢNH VÂN TAY ..............
3.1.Điểm đơn nhất
3.2.Phát hiện điểm

3.3.Đề xuất phát hi
3.3.1. Học máy sâu ..........................................................................................
3.3.2. Mạng nơ ron tích chập ..........................................................................
3.3.3. Kỹ thuật phát hiện điểm đơn nhất vân tay s dụng mạng CNN ...........
3.3.3.1. Xây dựng mô h nh mạng CNN .......................................................
4


3.3.3.2. Đánh giá kết quả............................................................................ 81
3.4. Kết chương................................................................................................ 85
Chƣơng 4: CẢI TIẾN HIỆU N

NG Đ NH DANH VÂN TAY QUY MÔ

LỚN SỬ DỤNG GPU................................................................................................ 87
4.1. Đối sánh vân tay trên môi trường tính toán hiệu năng cao........................87
4.2. Kiến trúc bộ x lý đồ họa GPU................................................................. 89
4.3. Đối sánh vân tay s dụng GPU................................................................. 91
4.3.1. Đối sánh s dụng mô tả ingerCode.................................................... 91
4.3.2. Đối sánh s dụng mô tả MCC............................................................. 91
4.4. Đề xuất đối sánh vân tay trên GPU của luận án........................................ 93
4.4.1. Phương pháp đề xuất........................................................................... 93

4.4.2. Kết quả thực nghiệm........................................................................... 98
4.4.3. Đề xuất gia cố toàn cục trên GPU....................................................... 99
4.4.4. Kết quả thực nghiệm gia cố toàn cục trên GPU.................................102
4.5. Mô h nh định danh CS L vân tay lớn trên nền dịch vụ Web...................103
4.6. Kết chương.............................................................................................. 105
KẾT UẬN CHUNG VÀ HƢỚNG PHÁT TRIỂN.....................................106
Các đóng góp của luận án.............................................................................. 106
Hạn chế của luận án....................................................................................... 108
Hướng phát triển tiếp theo.............................................................................. 108
NH MỤC CÁC CÔNG TRÌNH KHO

HỌC CỦ

TÁC GIẢ LIÊN QU N

ĐẾN LUẬN ÁN........................................................................................................ 110
TÀI LIỆU THAM KHẢO................................................................................. 111

5


DANH MỤC CÁC K HIỆU VÀ CHỮ VIẾT TẮT
Kí hiệu
AFIS
CNN
CUDA
DB
EER
GPU
FMR

FNMR
FPGA

FVC

LSS
MCC
MLP

SIMD

6


DANH MỤC BẢNG SỐ IỆU
Bảng 2.1: Kết quả s dụng phương pháp gia cố đề xuất.......................................... 66
Bảng 3.1: Kết quả đánh giá trên tập dữ liệu đánh giá VC 2002 b-b.......................83
Bảng 3.2: Kết quả đánh giá trên VC 2002

1 củaZhou và Chikkerur................83

Bảng 3.3: Kết quả đánh giá trên VC 2002

2 củaZhou và Chikkerur................84

Bảng 4.1: So sánh độ chính xác khi thay đ i thuật toán trên CS L VC 2002

1...98

Bảng 4.2: Thời gian thi hành của 10 truy vấn với kích thước CS L khác nhau........99

Bảng 4.3: Thời gian thi hành truy vấn 10 kích thước CS

L khác nhau s dụng ph p

gia cố toàn cục s dụng GPU GTX680...................................................................... 102
Bảng 4.4: Thời gian thi hành truy vấn 10 kích thước CS

L khác nhau s dụng ph p

gia cố toàn cục s dụng GPU Nvidia K40................................................................. 103

7


DANH MỤC HÌNH ẢNH
Hình 1.1: Quá tr nh th m định vân tay ................................................................
Hình 1.2: Tác vụ định danh vân tay .....................................................................
Hình 1.3: Thuộc tính mức 1: gồm thông tin về các hướng đường vân a
tin về các điểm đơn nhất

Hình 1.4: Thuộc tính mức 2: gồm thông tin về các điểm kết thúc của đường vâ
a

và các điểm đó đường vân r nhánh
Hình 1.5: H nh ảnh một số thiết bị lấy mẫu vân tay ............................................
Hình 1.6: Từ trái sang phải, chất lượng ảnh vân tay giảm dần ............................
Hình 1.7: ộ lọc Gabor [24 ................................................................................
Hình 1.8: Nâng cao chất lượng ảnh vân tay, từ trái qua phải: ảnh gốc, s

lọc Gabor, bộ lọc ST T và mạng nơ ron C

Hình 1.9: Kết quả quá tr nh nhị phân hóa và làm mảnh ảnh vân tay ...................

Hình 1.10: Giá trị cn, a. Điểm trung gian, b. Điểm kết thúc đường vân, c. Điểm
r

nhánh [49 ..................................................................................................................

Hình 1.11: Kết quả phát hiện điểm chạc từ ảnh vân tay s dụng phương pháp n
phân và làm mảnh ..........................................................................................................

Hình 1.12: Phát hiện điểm chạc trực tiếp trên ảnh đa mức xám ..........................

Hình 1.13: Mô h nh mạng nơ ron sâu phát hiện điểm chạc trực tiếp từ ảnh vân
tay [86] ...........................................................................................................................

Hình 1.14: Các loại điểm chạc và thông tin về điểm chạc. H nh a: điểm kết thú
đường vân. H nh b: điểm
Hình 1.15: Minh hoạ đối sánh giữa 2 tập điểm chạc ...........................................
Hình 1.16: Các cặp điểm được coi là phù hợp sau quá tr nh căn ch nh nếu thỏa
mãn các ngưỡng về khoảng cách và góc. Các cặp điểm được khoanh tròn là phù hợp
với ngưỡng khoảng cách ts và ngưỡng góc tθ


Hình 1.17: Một số thu nhận khác nhau của cùng một vân tay. ............................
Hình 1.18: Ảnh bên trái với lực ấn đều. Ảnh bên phải bị m o do lực bấm khác
nhau. ..............................................................................................................................
Hình 1.19: Các loại thông số dùng trong đánh giá hệ thống đối sánh sinh trắc học
.......................................................................................................................................
Hình 1.20: Lựa chọn t lệ MR và NMR giữa các ứng dụng. ..........................
Hình 1.21: Một số cấu trúc cục bộ được s dụng để biểu diễn cho điểm chạc

[49]. ................................................................................................................................
Hình 1.22: Biểu diễn k-plet b
giềng được lựa chọn phân phối đều vào 4 vùng xung quanh điểm chạc
Hình 1.23: Biểu diễn điểm chạc dựa trên các điểm trên các đường vân hướng
xung quanh điểm chạc Tico và cộng sự [67]. ................................................................
Hình 1.24: Các thông tin về tam tam giác t được tạo từ 3 điểm chạc p1, p2, p3
[48]. ................................................................................................................................
Hình 1.25: Tam giác hóa 1-order Delaunay [38] .................................................
Hình 1.26: Sai khác về cấu trúc biểu diễn do phát hiện điểm chạc thiếu hoặc sai
.......................................................................................................................................
Hình 1.27: Cấu trúc cục bộ không phù hợp do vấn đề biên.................................
Hình 1.28: Cấu trúc biểu diễn cục bộ Minutia Cylinder Code MCC [8 ..........
Hình 1.29: Các đóng góp của các điểm chạc vào ô
khoảng cách và sự khác nhau về hướng ........................................................................
Hình 1.30: So sánh sai số
khác[8 ...........................................................................................................................
Hình 2.1: ước gia cố liên quan đến việc căn ch nh biến đ
chuyển ............................................................................................................................
Hình 2.2: Một cặp điểm đối sánh sai có giá trị tương đồng lớn nhất [47] ...........

9


Hình 2.3: Từ trái sang: căn ch nh không dùng nắn ch nh, s dụng nắn ch nh
TPS,
s dụng nắn ch nh cục bộ dựa trên tam giác [35 ..........................................................
Hình 2.4: Quá tr nh xây dựng cây đối sánh trong K-plet [6] ...............................
Hình 2.5: Đối sánh không chính xác khi s dụng gia cố truyền thống ................
Hình 2.6: Kết quả đối sánh khi s dụng gia cố đề xuất. ......................................
Hình 2.7: Quá tr nh xây dựng cây đối sánh trong k-plet .....................................

Hình 2.8: Đối sánh khi s dụng gia cố truyền thống trên K-plet .........................
Hình 2.9: Đối sánh chính xác hơn khi s dụng gia cố đề xuất cho K-plet ..........
Hình 3.10: Các loại điểm đơn nhất của ảnh vân tay: điểm core và điểm delta ...
Hình 3.11: Phân loại kiểu vân tay [49 ................................................................
Hình 3.12: Hướng của đường vân được tính dựa trên t ng vector đạo hàm trong
khối ................................................................................................................................
Hình 3.13: Ảnh vân tay gốc và ảnh hướng được tính từ ảnh gốc ........................
Hình 3.14: Phát hiện điểm đơn nhất dựa trên phương pháp Pointcare index ......
Hình 3.15: Phát hiện điểm đơn nhất dựa trên ch số PI bị ảnh hư ng b i nhiễu . 72

Hình 3.16: Hàng trên: áp dụng các bộ lọc trên ảnh hướng. Hàng dưới: kết quả
sau khi áp dụng các bộ lọc. [51] ....................................................................................
Hình 3.17: Xu hướng quan tâm đến học máy sâu thống kê từ Google Trends . 74
Hình 3.18: Phát hiện đặc trưng đa tầng dựa trên kiến trúc CNN [78 .................
Hình 3.19: Mạng nơ ron truyền thống với 3 tầng n với kết nối đầy đủ .............
Hình 3.20: Kiến trúc mạng CNN với 2 tầng đặc trưng [19 ................................
Hình 3.21: Lấy mẫu MaxPooling cho các cùng 2x2. ...........................................
Hình 3.22: Kiến trúc mạng CNN đa tầng Multi-Stage features (MS) [61]. ........
Hình 3.23: Một số ảnh core s dụng trong huấn luyện mạng CNN ....................
Hình 3.24: Một số ảnh delta s dụng cho huấn luyện mạng CNN ......................
Hình 3.25: Các bước xây dựng mô h nh mạng CNN...........................................
10


Hình 3.26: Đánh giá kết quả mạng CNN được huấn luyện................................81
Hình 3.27: Một số điểm core phát hiện đúng..................................................... 82
Hình 3.28: Một số điểm core phát hiện sai......................................................... 82
Hình 3.29: Một số điểm delta phát hiện đúng.................................................... 82
Hình 3.30: Một số điểm delta phát hiện sai........................................................ 82
Hình 3.31: Phân chia tập dữ liệu huấn luyện và dữ liệu kiểm tra.......................84

Hình 4.1: Kiến trúc cluster s

dụng các máy tính gồm nhiều bộvi x lý kết nối

với nhau qua mạng [59]............................................................................................... 88
Hình 4.2: Mô h nh phân tán Master nhận yêu cầu và g i tới các Slave x

lý,

Master t ng hợp kết quả từ các Slave [59]................................................................... 88
Hình 4.3: Card đồ họa GPU h trợ hàng ngh n core tính toán........................89
Hình 4.4: Mô h nh phân bố các lõi trong các khối tính toán của GPU...............90
Hình 4.5: Đặc trưng ingerCode của vân tay 1 , tính dựa điểm core vân tay
2.
Các đặc trưng được chia thành 8 vùng 3 , và các giá trị trong m i vùng được tính s
dụng bộ lọc Gabor (4) [32].......................................................................................... 91
Hình 4.6: Quá tr nh thực thi thuật toán đối sánh trên GPU................................. 92
Hình 4.7: S dụng m i khối cho đối sánh giữa vân tay
tay

của CSDL với vân

truy vấn........................................................................................................................ 95
Hình 4.8: M i khối gồm 32 luồng, m i luồng s
trận

tính toán trên 1 cột của ma

tương đồng.................................................................................................................. 95
Hình 4.9: Mô h nh đề xuất hệ thống


IS trên CS L vân tay lớn..................104


11


DANH MỤC THUẬT TOÁN
Thuật toán 1.1: Thuật toán đối sánh toàn cục dựa trên biến đ i Hough [60].....41
Thuật toán 2.2: T m các cặp điểm phù hợp với nhau từ tập các cặp điểm phù hợp
với cặp điểm căn ch nh................................................................................................ 60
Thuật toán 2.3: Thuật toán K-plet [6]................................................................ 63
Thuật toán 2.4: S a đ i bước 9 của thuật toán K-plet....................................... 64
Thuật toán 4.5: Thuật toán định danh vân tay s
trên

dụng biểu diễn MCC gốc

CPU............................................................................................................................. 92
Thuật toán 4.6: Chi tiết thuật toán đối sánh đề xuất trên GPU..........................96
Thuật toán 4.7: Đối sánh s dụng bước gia cố trên GPU..............................100

12


GIỚI THIỆU CHUNG
Động lực nghiên cứu
Nhận dạng sinh trắc học hay đơn giản còn được gọi là sinh trắc học-biometric) đề
cập tới việc s dụng các đặc điểm có tính chất phân biệt của con người để tự động
nhận dạng các cá nhân. Các đặc điểm sinh trắc thường được chia làm 2 nhóm: i dựa

trên đặc trưng cơ thể như đặc trưng vân tay, bàn tay, võng mạc, khuôn mặt, N ; và
(ii) dựa trên đặc trưng hành vi của cá nhân như chữ ký, giọng nói. Nhận dạng sinh trắc
học được s dụng rộng rãi trong các ứng dụng của chính phủ và dân sự [49].
Hiện nay, trong lĩnh vực sinh trắc học, tuy một số đặc điểm sinh trắc như N ,
võng mạc, mống mắt cho độ chính xác cao, tuy nhiên việc thu thập các đặc điểm sinh
trắc này còn tương đối phức tạp, chi phí lớn. Vân tay có tính bất biến và đảm bảo được
t lệ khác biệt giữa hai người khác nhau, ngoài ra các thiết bị thu vân tay hiện đã rất ph
biến, chi phí mức hợp lý và có thể tích hợp vào rất nhiều thiết bị khác chẳng hạn như
điện thoại thông minh, khoá c a, … . Chính v thế, hiện nay vân tay vẫn là
đặc điểm sinh trắc học có tính ph dụng nhất.
Sinh trắc học dựa trên vân tay được s dụng ph biến trong các ứng dụng như kiểm
soát truy cập, định danh khách hàng thực hiện giao dịch: ví dụ tại các máy TM, định
danh người dùng trong các giao dịch trực tuyến, quản lý thời gian có mặt của các nhân
viên tại các t chức. Sinh trắc học dựa trên vân tay được s dụng trong các ứng dụng liên
quan đến chính phủ như định danh công dân hộ chiếu), quản lý xuất nhập cảnh, định
danh trong pháp y.
Hệ thống sinh trắc học dựa trên vân tay thường được chia làm hai loại tiến tr nh
đó là kiểm tra đối tượng verification và tiến tr nh định danh đối tượng (identification).
Tiến tr nh kiểm tra nh m mục đích kiểm tra xem vân tay đưa vào kiểm tra có đúng là
của người dùng đã đăng ký. Trong khi đó tiến tr nh định danh vân tay nh m mục đích t
m ra ai là người s hữu vân tay được đưa vào t m kiếm trong tập người dùng đã đăng ký
vân tay.

13


Hai tiến tr nh kiểm tra và định danh thường s dụng chung các mô đun chức năng
của hệ thống như: (i) mô đun trích xuất các đặc trưng từ ảnh vân tay thu nhận từ các bộ
cảm biến. Các hệ thống sinh trắc học dựa trên vân tay thường không s dụng trực tiếp
ảnh vân tay mà thường s dụng các đặc trưng có tính chất gọn nhẹ được trích xuất từ

ảnh vân tay (ii) s dụng các đặc trưng này trong giai đoạn đối sánh vân tay (matching).
Đầu vào của mô đun đối sánh là tập đặc trưng của một vân tay trong CS L vân tay và
tập đặc trưng của vân tay cần nhận dạng, kết quả đầu ra của mô đun đối sánh ch độ
tương đồng giữa hai vân tay similarity score). Giá trị tương đồng này
s được so sánh với giá trị ngưỡng xác định trước trong hệ thống để đưa ra quyết định
cuối cùng. Nếu giá trị tương đồng lớn hơn ngưỡng, cá nhân đó được nhận dạng.
Nh n chung, quá tr nh định danh vân tay thường đòi hỏi nhiều tài nguyên tính
toán, đặc biệt khi phải làm việc với tập dữ liệu vân tay người dùng có quy mô lớn hàng
trăm triệu đặc trưng vân tay trong cơ s dữ liệu, chẳng hạn như tập dữ liệu vân tay trong
dự án định danh cá nhân của Ấn độ [68]. Tại Việt Nam, hệ thống C RIS do Bộ Công
an phát triển với mục đích quản lý tàng thư căn cước công dân, căn cước căn phạm và t
m kiếm dấu tay hiện trường phục vụ công các quản lý và điều tra tội phạm cung cấp
khả năng nhận dạng 2.5 triệu vân tay trong 5 phút, s dụng hệ thống cluster gồm 10
máy tính1. Như vậy tốc độ đối sánh của C RIS đạt khoảng 1000 vân tay/giây trên một
máy tính. Với các ứng dụng truy vấn vân tay đòi hỏi thời gian thực trên quy mô rất
lớn, định danh tức thời từ mẫu vân tay đầu vào cần phải có được hệ thống thi hành có
khả năng đối sánh hàng triệu vân tay trong thời gian đơn vị giây. Các thuật toán đối
sánh vân tay khi thực thi trên môi trường một máy tính với bộ vi x lý (Central
Processing Unit – CPU) thường không thỏa mãn tính chất thời gian thực với cơ s dữ
liệu (CSDL) vân tay lớn.
Nâng cao chất lượng của quá tr nh trích chọn đặc trưng từ ảnh vân tay và nâng
cao độ chính xác và tốc độ của quá tr nh đối sánh vân tay là lĩnh vực nhận được nhiều
quan tâm nghiên cứu trong nhận dạng vân tay. Nội dung luận án s hướng tới các kỹ
thuật đối sánh vân tay.

1

14



Thuật toán đối sánh vân tay thường s dụng dữ liệu đầu vào là các thuộc tính được
trích chọn từ các ảnh vân tay. Đầu ra của quá tr nh đối sánh s đánh giá xem liệu hai ảnh
vân tay có thuộc cùng một vân tay hay không. Một số khó khăn cho quá tr nh đối sánh
vân tay như, cùng một vân tay có thể hiện khác nhau do đặt lệnh vị trí, xoay vân tay,
lực lấy vân tay khác nhau dẫn đến các biến đ i vân tay khác nhau hoặc do nhiễu trong
quá tr nh lấy mẫu vân tay với nguyên nhân như da khô, da có mô hồi, chất lượng của
thiết bị lấy mẫu.

Thực trạng nghiên cứu về đối sánh vân tay
Mặc dù các nghiên cứu trong lĩnh vực đối sánh vân tay cho kết quả tốt, đối sánh
vân tay vẫn là lĩnh vực nhận được nhiều quan tâm nghiên cứu hiện nay [33]. Một số
lĩnh vực nghiên cứu trong đối sánh vân tay được quan tâm như: tăng tốc quá tr nh đối
sánh, đối sánh vân tay với dữ liệu truy vấn là các ảnh vân tay chất lượng thấp, không
đầy đủ (ảnh vân tay thu thập từ hiện trường), đối sánh vân tay trên các thiết bị như thẻ
thông minh, đối sánh vân tay kết hợp các đặc trưng khác nhau, đối sánh trong đó bảo
vệ tính bí mật, riêng tư của vân tay. Các phương pháp đối sánh vân tay thường được
phân loại dựa trên 3 cách tiếp cận [49]:
- Dựa trên độ tương quan ảnh (Correlation-based matching): hai ảnh vân tay
được so sánh mức điểm ảnh thông qua việc s dụng các ph p căn ch nh khác nhau. Đối
sánh vân tay s dụng điểm ảnh thường gặp khó khăn do sự thay đ i về cấu trúc ảnh khi
lấy mẫu khác nhau, sự thay đ i về độ sáng và tương phản của ảnh và các điều kiện của
da khi lấy mẫu. Thêm vào đó quá tr nh đối sánh điểm ảnh đòi hỏi nhiều tài nguyên tính
toán.
o đó các cách tiếp cận trong đối sánh vân tay thường dựa trên các đặc trưng
được trích chọn từ ảnh vân tay thay v dựa trên đối sánh dựa trên các điểm ảnh vân tay.
Ví dụ Jain và cộng sự đề xuất biểu diễn ingerCode cho vân tay [32], s dụng các biến
đ i lọc Gabor theo các hướng khác nhau dựa trên hướng đường vân để trích xuất các
thông tin ảnh xung quanh điểm trung tâm của vân tay. Độ tương đồng giữa 2 vân tay là
khoảng cách giữa 2 vector FingerCode. Phương pháp đối sánh s dụng ingerCode cần
biết điểm core của vân tay. Thuật toán s khó áp dụng nếu vân tay không tồn tại

15


điểm core hoặc gặp khó trong quá tr nh xác định điểm core. Gần đây Zanganeh và
cộng sự [76 đề xuất phương pháp chia ảnh vân tay thành các vùng nhỏ khác nhau và
tiến hành đối sánh giữa các vùng ảnh này. Phương pháp này giúp nhanh chóng t m ra
các vùng ảnh phù hợp, sau đó tác giả tiến hành t ng hợp kết quả dựa trên các vùng ảnh
phù hợp.
- Dựa trên các đặc trưng không là điểm chạc: việc trích chọn các điểm chạc

thể khó khăn đối với các ảnh vân tay có chất lượng chất thấp. Các đặc trưng khác từ
ảnh vân tay như mẫu đường vân, thông tin về h nh dạng đường vân, tần số của đường
vân, kết cấu của đường vân có thể được trích chọn [67], [23], [70], [92], [93].
- Dựa trên điểm chạc: đây là cách tiếp cận ph biến nhất và là kỹ thuật được s
dụng rộng rãi nhất. Các thuật toán đối sánh vân tay dựa trên điểm chạc có ưu điểm về
việc dễ tách điểm chạc từ ảnh vân tay, thuận tiện cho việc lưu trữ mẫu với kích thước
gọn nhẹ và cho kết quả đối sánh có độ chính xác cao và tốc độ x lý nhanh [49]. Trong
các thuật toán đối sánh vân tay, thường ph biến dựa trên thông tin là các điểm chạc từ
ảnh vân tay như trong báo cáo khảo sát [56]. Khá nhiều đề xuất liên quan nâng cao độ
chính xác của thuật toán đối sánh vân tay dựa trên thông tin điểm chạc được đề xuất
như [8], [17], [48], [2].
Một số khó khăn ảnh hư ng đến độ chính xác của các thuật toán đối sánh vân tay
như: việc t m thiếu hoặc sai các đặc trưng trong quá tr nh trích chọn đặc trưng là ph
biến do chất lượng ảnh lấy mẫu, điều này dẫn đến thêm khó khăn cho quá tr nh đối
sánh vân tay. Chất lượng vân tay đặc biệt thấp đối với ảnh vân tay hiện trường (latent)
[31], [54], [83]. o đó một số thuật toán đối sánh vân tay bên cạnh s dụng thông tin là
điểm chạc, có kết hợp với các thông tin không là điểm chạc điểm chạc như thông tin
về số đường vân giữa các điểm chạc [7], thông tin về hướng các đường vân bao quanh
điểm chạc [47].
Ngoài thuật toán đối sánh vân tay được x lý trên môi trường s dụng máy tính, đối

sánh vân tay trên các thiết bị nhúng, smart cards cũng nhận được nhiều quan tâm [3].
Đặc điểm đối sánh vân tay trên các thiết bị nhúng thường không h trợ các ph p tính
phức tạp như dấu ph y động [1].

16


i sánh v n tay trên CSDL v n tay lớn
Thuật toán đối sánh vân tay tiên tiến hiện nay dựa trên biểu diễn mã trụ MCC cho
các điểm chạc cho hiệu năng cao về tốc độ và độ chính xác cũng cần 3 mili giây để
thực hiện đối sánh giữa hai vân tay [56]. o đó thuật toán cần 3 giây để xác định một
vân tay trong một CS L 1000 vân tay. Với các CS L lớn hàng triệu vân tay như CS L
dân sự quá tr nh định danh s tốn nhiều thời gian. Đối với quá tr nh định danh vân tay
trên CS L vân tay lớn một số phương pháp như lọc trước vân tay, đối sánh trên môi
trường tính toán có hiệu năng cao thường được s dụng.
Lọc trước vân tay cho ph p lọc nhanh các vân tay là ứng viên cho quá tr nh đối
sánh. Một phương pháp thường được s dụng trong lọc trước vân tay là phân ảnh vân
tay thành các lớp [12], [71], [80], [58]. Việc chia vân tay thành các lớp giúp t m nhanh
ra tập ứng viên vân tay s dụng cho quá tr nh đối sánh.
Đối sánh vân tay s dụng môi trường tính toán hiệu năng cao thường s dụng cụm
máy tính hoặc thiết kế phần cứng chuyên dụng cho quá tr nh đối sánh hay s dụng bộ x
lý đồ họa GPU.
Jiang và Crookes [30], xây dựng đối sánh vân tay dựa trên thiết kế phần ứng
chuyên dụng FPGA (Field-Programmable Gate Array) đạt 1.2 triệuđối sánh vân tay
trên giây. Xu và cộng sự [73 xây dựng FPGA dựa trên bộ x lý Virtex VII XC7VX485T
đạt tốc độ đối sánh 9.6 triệu đối sánh trên giây.
Peralta và cộng sự [56], triển khai hệ thống đối sánh vân tay dựa trên CPU, hệ
thống chạy trên cluster gồm 12 nút. M i nút gồm 2 bộ x lý Intel Xeon E5-2620, kết quả
hệ thống đạt 812,700 đối sánh trên giây.
Lastra và cộng sự [39 , triển khai hệ thống gồm 4 bộ x lý GPU GTX 680 cho kết

quả 1.5 triệu ph p đối sánh trên giây, thuật toán dựa trên mô tả biểu diễn điểm chạc của
Jiang.
Gutierrez và cộng sự [27], triển khai hệ thống đối sánh vân tay trên dựa trên
GPU, đạt kết quả 55.700 đối sánh trên giây, hệ thống s dụng card đồ họa GeForce
GTX 680 GPU, thuật toán đối sánh dựa trên biểu diễn MCC.

17


Cappelli và cộng sự [9 đạt kết quả cao nhất được công bố đến nay, thuật toán đối
sánh trên GPU s dụng biểu diễn MCC cho kết quả 8.6 triệu đối sánh trên giây.

Mục tiêu và các nội dung chính
Động lực nghiên cứu đã phân tích trên cho ph p chúng tôi xác lập luận án với tên
“Nghiên cứu n ng cao các kỹ thuật đ i sánh v n tay dựa trên đặc trưng điểm chạc”.
Luận án đặt ra mục tiêu chính là nâng cao cả tốc độ lẫn độ chính xác của các thuật toán
đối sánh vân tay dựa trên đặc trưng điểm chạc. Để nâng cao độ chính xác quá tr nh đối
sánh vân tay, các bước trong quá tr nh so khớp s được chú trọng nghiên cứu để đề xuất
những cải tiến. Đối với mục tiêu cải thiện tốc độ đối sánh, một số phương pháp, kỹ
thuật song song hoá quá tr nh đối sánh s được chúng tôi nghiên cứu để có thể đề xuất
được kỹ thuật cải thiện tốc đô. Ngoài ra, việc s dụng thêm đặc trưng
ngoài điểm chạc, cụ thể là điểm đơn nhất, cũng được chúng tôi quan tâm nghiên cứu
với định hướng có thể góp phần cải thiện cả hiệu năng về tốc độ lẫn thời gian so khớp
vân tay.
Trong luận án này, các ảnh vân tay được s dụng là các CS L vân tay được thu
nhận từ các bộ cảm biến vân tay (chẳng hạn FVC2002 [45],FVC2004 [46] . Các ảnh
vân tay thu từ hiện trường trong các trường hợp h nh sự, pháp lý không thuộc đối
tượng nghiên cứu của luận án.
Luận án quan tâm đến những phương pháp, kỹ thuật đối sánh vân tay dựa trên
thông tin lưu trữ cho vân tay s dụng chu n ISO/IEC 19794-2 [28], [85]. Chu n lưu trữ

ISO/IEC 19794-2 giúp trao đ i dữ liệu giữa các hệ thống nhận dạng vân tay khác nhau.
Với một hệ thống nhận dạng vân tay s dụng s dụng định dạng dữ liệu đóng, khi chuyển
sang thuật toán đối sánh của hãng khác s không thực hiện được.
Trong chu n ISO/IEC 19794-2, đặc trưng từ ảnh vân tay được lưu trữ bao gồm
các đặc trưng điểm chạc của ảnh vân tay và tùy chọn m rộng lưu thông tin về các điểm
đơn nhất và số đường vân giữa các điểm đơn nhất. Dựa trên đối tượng nghiên cứu và
thông tin đặc trưng dựa trên chu n ISO/IEC 19794-2, luận án có mục tiêu nâng độ
chính xác lẫn tốc độ dựa trên thông tin là điểm chạc.

18


Đối với hướng nâng cao tốc độ trong quá tr nh đối sánh khi định danh vân tay
trên tập vân tay lớn, môi trường tính toán hiệu năng cao như cụm máy tính hoặc s dụng
bộ x lý đồ họa GPU là hai giải pháp chính để thực hiện. Theo những nghiên cứu gần
đây, giải pháp tận dụng tốc độ bộ x lý đồ họa GPU được quan tâm s dụng hiện
nay nhờ hiệu năng tính toán cao và chi phí hợp lý [27], [9]. Chính v thế, luận án tập
trung nghiên cứu nâng cao hiệu năng đối sánh về tốc độ theo cách tiếp cận s dụng bộ x
lý đồ họa GPU.
Từ đó, mục tiêu của luận án được tiến hành thông qua những nội dung nghiên
cứu sau:
i. Khái quát về quá tr nh đối sánh vân tay dựa trên thông tin điểm chạc.
ii. Nghiên cứu, đề xuất phương thức nâng cao độ chính xác của các thuật toán
đối sánh vân tay dựa trên điểm chạc.
iii.

Nghiên cứu, cài đặt kỹ thuật cải tiến tốc đối sánh vân tay thông qua

việc s dụng và khai thác thế mạnh toán hiệu năng năng cao của bộ x lý đồ hoạ
GPU.

iv.Tiến hành thực nghiệm, đánh giá và so sánh kết quả những phương thức, kỹ
thuật đã đưa ra trong luận án.

Các đóng góp của luận án
Với mục tiêu và các nội dung chính đã đặt ra, luận án đã tiến hành thực hiện và
hoàn thành. Những đóng góp chính thu được trong luận án này bao gồm:
1. Đề xuất phương thức nâng cao độ chính xác của các thuật toán đối sánh
vân
tay dựa trên điểm chạc b ng cách cải tiến giai đoạn gia cố, trong đó tiến hành đánh giá
chi tiết hơn các bước kiểm tra mà không ảnh hư ng đến thời gian thực thi của các thuật
toán. Thực nghiệm đã được tiến hành trên nhiều thuật toán đối sánh vân tay khác nhau
như K-plet, MCC, m-Triplets và cho kết quả nâng cao độ chính xác của các thuật toán
mà không ảnh hư ng đến thời gian thi hành của các thuật toán gốc. Kết quả nghiên cứu
này đã được công bố trong hai công tr nh [LHHai1], [LHHai4].


19


2. Các điểm đơn nhất thường được s dụng làm điểm căn ch nh giúp tăng tốc
các
thuật toán đối sánh vân tay, ngoài ra các điểm đơn nhất cũng là đặc trưng quan trọng được
s dụng trong quá tr nh phân lớp vân tay. Luận án đề xuất kỹ thuật phát hiện

điểm đơn nhất dựa trên phương pháp học máy s dụng mạng nơ ron tích chập
(Convolution Neural Networks -CNN . Kết quả th nghiệm phát hiện điểm đơn nhất
trên CS L vân tay VC 2002 s dụng mô h nh mạng CNN đã thể hiện được kết quả tốt
hơn so với một số phương pháp truyền thống. Đóng góp này đã được công bố trong
công tr nh [LHHai5].
3. Đối với quá tr nh đối sánh vân tay trên CS L vân tay lớn, luận án đề xuất

phương pháp đối sánh trên bộ x lý đồ hoạ GPU s dụng biểu diễn MCC. Thuật toán đối
sánh được tuỳ biến lại để phù hợp và tận dụng được thế mạnh tính toán hiệu năng cao
của kiến trúc x lý song song trong GPU. Kết quả đánh giá trên hệ thống tính toán
s dụng bộ x lý đồ họa Nvdia GTX 680 cho thấy thuật toán có khả năng đối sánh 8.5
triệu vân tay trên giây khi s dụng ph p đối sánh nhanh, tương đồng với kết quả tốt nhất
được công bố hiện nay. Khi s dụng quá tr nh đối sánh chi tiết, tốc độ đối sánh đạt được
1.8 triệu ph p đối sánh vân tay trên giây. Các kết quả nghiên cứu này đã được thể hiện
qua các công bố [LHHai2], [LHHai3], [LHHai6].

T chức của luận án
Dựa vào mục tiêu và những nội dung chính đã đặt ra, bản thảo luận án được t
chức như sau:
- Chương 1: giới thiệu khái quát về bài toán đối sánh vân tay dựa trên điểm
chạc.
Nội dung chương s đề cập tới quá tr nh tiền x lý bao gồm quá tr nh trích chọn đặc
trưng điểm chạc. Các phương pháp tiếp cận và khảo sát một số thuật toán tiêu
biểu trong đối sánh dựa trên đặc trưng điểm chạc.
- Chương 2: đặc tả đề xuất cải tiến giai đoạn gia cố cho các thuật toán đối sánh
vân tay dựa trên điểm chạc, giúp tăng độ chính xác của các thuật toán mà không
ảnh hư ng đến tốc độ thi hành của các thuật toán gốc. Th nghiệm đánh giá kết quả
của đề xuất cũng được đề cập chi tiết trong nội dung chương.


20


×