Tải bản đầy đủ (.pdf) (52 trang)

Xây dựng chương trình nhận dạng vân tay

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.31 MB, 52 trang )

MỤC LỤC
MỤC LỤC ...................................................................................................................... 1
LỜI MỞ ĐẦU ................................................................................................................. 3
Chương 1: ....................................................................................................................... 5
GIỚI THIỆU HỆ THỐNG NHẬN DẠNG VÂN TAY .................................................... 5
1.1. Tổng quan.......................................................................................................... 5
1.2. Giới thiệu ảnh vân tay ........................................................................................ 7
1.3. Cơ sở dữ liệu vân tay ......................................................................................... 8
Chương 2: ..................................................................................................................... 10
NÂNG CAO CHẤT LƯỢNG ẢNH VÂN TAY............................................................ 10
2.1. Giới thiệu......................................................................................................... 10
2.2. Nâng cấp ảnh vân tay....................................................................................... 13
2.2.1. Các kí hiệu ..................................................................................................... 13
2.2.2. Thuật toán ...................................................................................................... 15
2.2.3. Bình thường hoá ảnh (Normalization) ............................................................ 15
2.2.4. Ảnh định hướng (Orientation Image).............................................................. 16
2.2.5. Ảnh tần số (Ridge Frequency Image).............................................................. 18
2.2.6. Mặt nạ vùng (Region Mask)............................................................................ 20
2.2.7. Lọc ảnh (Filtering) ......................................................................................... 21
Chương 3: ..................................................................................................................... 23
TRÍCH RÚT ĐIỂM KÌ DỊ............................................................................................. 23
3.1. Giới thiệu......................................................................................................... 23
3.2. Kĩ thuật bám theo đường vân ........................................................................... 25
3.2.1. Xác định vết cắt và xác định cực đại............................................................... 26
3.2.2. Tính hướng tiếp tuyến với đường vân ............................................................. 30
3.2.3. Điều kiện dừng ............................................................................................... 31
3.3. Dò tìm các điểm kì dị....................................................................................... 32
Chương 4: ..................................................................................................................... 37
KHỚP VÂN TAY DỰA TRÊN BẢN ĐỒ CÁC ĐIỂM KÌ DỊ ....................................... 37

1




4.1. Giới thiệu......................................................................................................... 37
4.2. Kĩ thuật khớp dựa trên cơ sở tương quan.......................................................... 40
4.3. Kĩ thuật khớp dựa trên cơ sở các điểm kì dị ..................................................... 41
4.4. Kĩ thuật khớp dựa trên cơ sở đặc trưng của đường vân..................................... 43
4.5. Phương pháp định vị Hough – transform.......................................................... 43
Chương 5: ..................................................................................................................... 46
CHƯƠNG TRÌNH MÔ PHỎNG MỘT SỐ KỸ THUẬT NÂNG CAO CHẤT
LƯỢNG ẢNH VÂN TAY............................................................................................. 46
5.1.

Lựa chọn ngôn ngữ lập trình ............................................................................... 46

5.2.

Các thuật toán được mô phỏng............................................................................ 46

5.2.1. Thuật toán tách ngưỡng............................................................................... 46
5.2.2. Thuật toán làm trơn..................................................................................... 47
5.2.3. Thuật toán làm mảnh:.................................................................................. 49
KẾT LUẬN................................................................................................................... 51
TÀI LIỆU THAM KHẢO ............................................................................................. 52

2


LỜI MỞ ĐẦU
Dấu vân tay đã là một công cụ vô giá đối với việc thi hành luật pháp và
pháp lý trong suốt hơn một thế kỉ qua. Sự thúc đẩy nghiên cứu trong lĩnh vực

nhận dạng vân tay có từ trước năm 1960. Sau đó không lâu, dấu vân tay đã có
một số ứng dụng trong các hệ thống sinh trắc học. Nó nổi lên như là một đặc
điểm phổ biến và tin cậy nhất trong lĩnh vực nhận dạng con người. Một số lượng
lớn các nghiên cứu đã được thực hiện đối với vấn đề tự động khớp vân tay, tiêu
điểm vẫn là các thuật toán dựa trên điểm kì dị. Các đặc trưng dựa trên điểm kì dị
chứa đựng hầu hết các đặc điểm riêng biệt của vân tay và vì thế nó được các nhà
vân tay học xem là đặc trưng quan trọng nhất dùng trong hệ thống xác minh vân
tay. Các thuật toán trích rút các điểm kì dị, thuật toán khớp vân tay và hiệu suất
xác minh vân tay đã và đang được đưa ra với nhiều vấn đề còn mở cho các
phương hướng tiếp cận trong tương lai.
Động lực chủ yếu đằng sau sự tiến bộ của các công nghệ về nhận dạng bằng
dấu vân tay là áp lực của luật pháp và các nhà nghiên cứu pháp lý. Sử dụng dấu
vân tay để nhận dạng những kẻ bị tình nghi trong một vụ án là một bước rất quan
trọng trong điều tra tội phạm. Bởi vậy, các cơ sở dữ liệu vân tay đồ sộ đã được
sưu tập trên khắp thế giới. Ví dụ: FBI lưu giữ bộ dữ liệu vân tay lớn nhất thế giới
với khoảng hơn 200 triệu dấu vân tay. Sự quản trị và truy vấn các cơ sở dữ liệu
lớn phụ thuộc nhiều vào các hệ thống tự động, do đó nảy sinh nhu cầu về các
nghiên cứu trong lĩnh vực này.
Một ứng dụng khác của việc nhận dạng dựa trên dấu vân tay nổi lên gần đây
là các hệ thống sinh trắc học. Hệ thống sinh trắc học là hệ thống tự động nhận
dạng một con người dựa trên các đặc điểm sinh lý học và hành vi học của con
người. Nó có một số thuận lợi hơn các phương pháp xác minh truyền thống như:
xác minh dựa trên cơ sở biết trước (ví dụ: password) hoặc xác minh dựa trên cơ
sở dấu hiệu (ví dụ: key).
Một số đặc trưng sinh học của con người như: mặt, võng mạc mắt hoặc
giọng nói đều có thể được sử dụng trong các hệ thống sinh trắc học để nhận dạng
con người với độ chính xác cao. Tuy nhiên, sử dụng dấu vân tay có một số lợi thế

3



hơn. Tính độc nhất của dấu vân tay đã được xác định và đứng vững trong suốt
một thời gian dài, xác suất để có hai dấu vân tay giống nhau là một điều rất hiếm
khi xảy ra. Hơn thế nữa, so với khuôn mặt và giọng nói, dấu vân tay rất bền đối
với tuổi tác và không thể dễ dàng làm giả. Do những yêu cầu liên tục của luật
pháp và sự quan tâm của các nhà phát triển các hệ thống sinh trắc học, các hệ
thống tự động nhận dạng vân tay có hiệu suất cao ngày càng được phát triển rộng
rãi và là lĩnh vực nghiên cứu nóng.
Đưa hai ảnh vân tay làm đầu vào, một thuật toán khớp vân tay cố gắng xác
định xem có phải chúng được chụp ra từ một ngón tay hay không. Hầu hết các
thuật toán này đều dựa trên cơ sở khớp các chi tiết nhỏ, đặc trưng của vân tay
như các điểm kì dị. Đây là một vấn đề khó, tuy nhiên triển vọng và ứng dụng của
nó trong các lĩnh vực tương lai sẽ trở nên rất phổ biến. Chính vì vậy em đã lựa
chọn đề tài: “Tìm hiểu một số kỹ thuật nhận dạng vân tay” làm đồ án tốt nghiệp
của mình. Đồ án được chia làm 5 chương:
 Chương 1: Giới thiệu hệ thống nhận dạng vân tay.
 Chương 2: Nâng cao chất lượng ảnh vân tay. Chương này giới thiệu một
số kỹ thuật nhằm nâng cao chất lượng ảnh vân tay.
 Chương 3: Trích rút điểm kì dị. Chương này cung cấp các kỹ thuật nhằm
trích rút các điểm kì dị từ ảnh vân tay đầu vào sau khi đã được nâng cấp.
 Chương 4: Khớp vân tay dựa trên bản đồ các điểm kì dị. Chương này giới
thiệu cách khớp vân tay dựa trên bản đồ các điểm kì dị đã được trích rút.
 Chương 5: Chương trình mô phỏng một số kỹ thuật nâng cao chất lượng
ảnh vân tay.

4


Chương 1:
GIỚI THIỆU HỆ THỐNG NHẬN DẠNG VÂN TAY

1.1. Tổng quan
Một hệ thống sinh trắc học dựa trên cơ sở dấu vân tay về cơ bản là một hệ
thống nhận dạng mẫu, trong đó nhận dạng một con người bằng cách xác định
tính chất xác thực của dấu vân tay của họ. Tùy thuộc vào hoàn cảnh áp dụng, một
hệ thống sinh trắc học dựa trên cơ sở dấu vân tay có thể được gọi là hệ thống xác
nhận vân tay (verification system) hoặc hệ thống nhận dạng vân tay
(identification system).
 Hệ thống xác nhận vân tay sẽ chứng minh chính xác sự đồng nhất của
một người bằng cách lấy dấu vân tay của người đó so sánh với mẫu dấu
vân tay của chính họ đã được lưu trữ trong hệ thống. Nó thể hiện phép
so sánh một với một để xác định tính đồng nhất của một người là đúng
hay không đúng.
 Hệ thống nhận dạng vân tay sẽ nhận ra một con người bằng cách tìm
kiếm một mẫu trong cơ sở dữ liệu để khớp. Nó thể hiện phép so sánh
một với nhiều để xác minh nhận dạng của con người.
Sơ đồ của của hệ thống xác nhận vân tay và hệ thống nhận dạng vân tay
được mô tả trên hình 1.1. Quan sát ở đây ta có thể thấy kết nạp thêm người (user
enrollment) là công việc thông thường của cả hai hệ thống. Module kết nạp chịu
trách nhiệm ghi thêm một người dùng vào hệ thống cơ sở dữ liệu sinh trắc học
(System Database). Trong quy trình kết nạp, dấu vân tay được chuyển sang dạng
dữ liệu thô. Một quá trình kiểm tra chất lượng dữ liệu được thực hiện để đảm bảo
mẫu thu được có thể được xử lý bởi các giai đoạn tiếp theo. Để thuận tiện cho
việc khớp vân tay, dữ liệu thô này được xử lý tiếp bằng cách trích rút các đặc
trưng để có thể vừa nhỏ gọn lại không mất tính chất điển hình duy nhất của nó,
đó gọi là mẫu.
Công việc xác nhận vân tay chịu trách nhiệm xác nhận một cá nhân tại một
điểm truy cập nào đó. Trong quá trình thực hiện, tên người hoặc PIN (Personal

5



Identification Number) được đưa vào. Máy quét sẽ chụp dấu vân tay của người
được nhận dạng và chuyển nó thành dạng dữ liệu số và sau đó trích rút các đặc
trưng. Cuối cùng nó được chuyển đến bộ phận khớp đặc trưng để so sánh với
mẫu vân tay của một người (đã được lưu trong cơ sở dữ liệu, có tên hay PIN đã
nhập).

Hình 1.1. Các sơ đồ khối của enrollment, verification và identification
Trong quá trình xác định vân tay nếu số PIN không được cung cấp, hệ thống
sẽ phải thực hiện so sánh dấu vân tay đầu vào với tất cả các mẫu trong cơ sở dữ
liệu. Kết quả đầu ra sẽ là nhận dạng được sự đồng nhất của vân tay đầu vào với
mẫu của một người đã được lưu trong cơ sở dữ liệu hoặc là không nhận dạng
được. Do phải tính toán nhiều khi nhận dạng trong một cơ sở dữ liệu lớn, các kĩ
thuật phân lớp và kĩ thuật đánh chỉ số vân tay được sử dụng để giới hạn số lượng
mẫu phải thực hiện khớp với vân tay đầu vào.
Trong đề tài này em chỉ tập trung vào nghiên cứu bài toán xác nhận dấu vân
tay, vì bài toán này chứa đựng hầu hết các vấn đề chủ chốt của bài toán nhận

6


dạng vân tay. Đã có rất nhiều nghiên cứu trong vài thập kỉ qua nhằm tìm ra một
lời giải tối ưu cho bài toán nhưng trên thực tế đây là một bài toán rất phức tạp,
chưa thực sự có một đáp án chuẩn và hoàn chỉnh.

1.2. Giới thiệu ảnh vân tay
Các thông số chính mô tả một ảnh vân tay:
 Độ phân giải (Resolution): biểu thị số điểm hoặc số pixels trên một
inch(dpi). 500dpi là độ phân giải nhỏ nhất của các loại máy quét theo
chuẩn của FBI và nó được sử dụng trong nhiều mục đích thương mại;

250 tới 300 dpi là độ phân giải nhỏ nhất cho phép các thuật toán trích rút
có thể trích rút ra các điểm kì dị trên mẫu vân tay một cách hiệu quả.
 Kích thước của vùng do máy quét chụp được là thông số chủ yếu. Nếu
vùng này rộng sẽ có nhiều đường vân và rãnh vân được chụp và ảnh vân
tay dễ phân biệt hơn. Nếu vùng lớn hơn hoặc bằng 1×1 inch(theo chuẩn
của FBI) cho phép thu được một ảnh vân tay đầy đủ và rõ ràng. Nếu các
máy quét có vùng quét nhỏ sẽ không thể chụp được đầy đủ dấu vân tay,
điều này có thể dẫn tới việc chỉ thu được ảnh vân tay có một vùng nhỏ
trùng nhau khi chụp hai ảnh khác nhau của cùng một ngón tay.
 Số pixels (Number of pixels): số pixels trong một ảnh vân tay có thể dễ
dàng tính được từ độ phân giải và kích thước ảnh (vùng hình chữ nhật
do máy quét chụp được). Một máy quét hoạt động ở độ phân giải r dpi
trên một vùng có kích thước h  w inch2 có rh  rw pixels.
 Số bít trên một pixels (Dynamic range or depth): biểu thị số bít mã hoá
cường độ mức xám của một pixel. Theo chuẩn FBI, số bít trên một pixel
là 8 bít - ảnh có 256 mức xám.
 Độ chính xác hình học (Geometric accuracy): chỉ ra độ biến dạng hình
học lớn nhất của hình ảnh thu được, biểu thị bởi tỷ lệ phần trăm theo hai
hướng x và y.
 Chất lượng ảnh (Image quality): sẽ không thể định nghĩa chính xác được
chất lượng của một ảnh vân tay, và càng khó khăn để phân biệt được
chất lượng ảnh vân tay khi trạng thái của ngón tay khác nhau. Các

7


đường vân nhô rất thấp (ngón tay của những người công nhân hoặc
người già), ngón tay quá ẩm và quá khô, hoặc lấy mẫu vân tay không
đúng cách thì hầu hết các máy quét đều đưa ra ảnh có chất lượng thấp
(hình 1.2).


Hình 1.2. Hình ảnh của dấu vân tay thu được từ máy quét quang: a) Ảnh
vân tay chất lượng cao; b) Ảnh từ ngón tay khô; c) Ảnh từ ngón tay ẩm ướt;
d) Ảnh vân tay chất lượng kém.

1.3. Cơ sở dữ liệu vân tay
Nhận dạng vân tay đúng và chính xác là một bài toán nhận dạng mẫu đầy
thử thách. Nhiều thuật toán mạnh đã được đưa ra nhưng mỗi thuật toán chỉ mạnh
ở trên một khía cạnh nào đó. Chính sự ganh đua này đã thúc đẩy việc cần thiết
phải thiết lập nên một chuẩn chung, từ tiêu chuẩn này sẽ cho phép dễ dàng đánh
giá hiệu suất của các thuật toán nhận dạng vân tay và dễ dàng nâng cấp các thuật
toán đó. Hiện nay chỉ có một vài cơ sở dữ liệu vân tay chuẩn được sử dụng như
là một chuẩn chung như: NIST( National Institute of Standards and Technology)
và FVC( Fingerprints Verification Competition).
Bộ cơ sở dữ liệu FVC2000 gồm 4 cơ sở dữ liệu con được tạo ra bởi các
công nghệ sensor khác nhau và đã có 11 thuật toán được thử nghiệm trên chúng.
Đây là bộ cơ sở dữ liệu đáng tin cậy và rất hữu ích cho việc thử nghiệm, đánh giá
và nâng cấp các thuật toán. Trong cơ sở dữ liệu FVC2000, các dấu vân tay được
tạo ra bởi 4 loại sensor khác nhau, thể hiện cho 4 kĩ thuật quét vân tay tiến bộ gần
đây. Cụ thể: cơ sở dữ liệu 1 và 2 thu thập được bằng cách sử dụng 2 loại sensor

8


kích cỡ nhỏ và giá thành thấp (như là sensor quang và sensor điện). Cơ sở dữ liệu
3 thu thập được bằng cách sử dụng sensor quang chất lượng cao hơn (có kích cỡ
lớn). Cuối cùng là cơ sở dữ liệu 4, được tạo ra theo phương pháp nhân tạo. Mỗi
cơ sở dữ liệu chứa 880 ảnh vân tay được thu từ 110 ngón tay khác nhau (có 8 bản
in cho một ngón tay). Các ngón tay được đánh số từ 101 đến 110 (tập hợp B)
dùng cho những người tham gia hiệu chỉnh các tham số trước khi đề xuất các

thuật toán của họ; các ngón tay có số từ 1 đến 100 được dùng làm chuẩn (tập A).

Hình 1.3. Bốn cơ sở dữ liệu con của FVC2000

Hình 1.4. Các ảnh vân tay lấy từ DB1, DB2, DB3 và DB4(bốn ảnh này
được thể hiện tương ứng theo kích thước của chúng)
Trong đề tài này em đã chọn cơ sở dữ liệu FVC và tiến hành thử nghiệm
trên các bộ cơ sở dữ liệu FVC2000, FVC2002 và FVC2004 vì đây là các cơ sở
dữ liệu chuẩn, lớn và rất đáng tin cậy đồng thời cũng do yêu cầu thực tế là chúng
không đòi hỏi bất kì một yêu cầu tài chính nào.

9


Chương 2:
NÂNG CAO CHẤT LƯỢNG ẢNH VÂN TAY
2.1. Giới thiệu
Một bước quan trọng trong hệ thống tự động khớp vân tay là việc tự động
và chính xác trong trích rút các điểm kì dị từ ảnh vân tay đầu vào. Tuy nhiên hiệu
suất của một thuật toán trích rút các điểm kì dị phụ thuộc nhiều vào chất lượng
ảnh. Vì thế để hiệu suất của một hệ thống tự động xác nhận và nhận dạng vân tay
được tốt thì điều thiết yếu là phải kết hợp thuật toán nâng cấp ảnh trong module
trích rút các điểm kì dị. Chúng ta giới thiệu một thuật toán nâng cấp ảnh nhanh,
có khả năng cải thiện rõ nét cấu trúc của đường vân và rãnh trong ảnh vân tay
dựa trên cơ sở ước lượng hướng và tần số cục bộ của đường vân.
Hai đặc trưng nổi bật nhất của đường vân được gọi là điểm kì dị:
-

Điểm kết thúc (Ridge ending): là điểm mà tại đó đường vân kết


thúc đột ngột.
-

Điểm rẽ nhánh (Ridge bifurcation): là điểm mà tại đó đường vân

phân nhánh hoặc rẽ ra thành các nhánh vân.
Một ảnh vân tay chất lượng tốt chứa khoảng 40 -100 điểm kì dị. Ví dụ điểm
kì dị như hình 2.1. Một ảnh vân tay lý tưởng là ảnh mà các đường vân và đường
rãnh luân phiên nhau chạy theo một hướng cục bộ nhất định. Trong tình huống
này, các điểm kì dị của đường vân như điểm kết thúc và điểm rẽ nhánh sẽ dễ
dàng được tìm thấy.
Hình 2.1b thể hiện ví dụ của một ảnh vân tay có chất lượng tốt. Cấu trúc
đường vân trong ảnh vân tay có chất lượng thấp là luôn không tốt và vì thế chúng
ta không thể dò tìm được chính xác, điều này dẫn đến các vấn đề sau:
 Một số lượng đáng kể các điểm kì dị giả được tạo ra.
 Tỷ lệ phần trăm lớn các điểm kì dị thật bị bỏ qua.
 Các lỗi định vị (vị trí và hướng) có thể được đưa vào.

10


Hình 2.1. Các ví dụ của điểm kì dị. a) Một điểm kì dị được xác định bởi vị
trí và hướng của nó. b) Các điểm kì dị trên một ảnh vân tay.

Hình 2.2. Các ảnh vân tay chất lượng rất kém

11


Hình 2.3. Các vùng vân tay. a) Vùng chất lượng tốt( Well – defined region).

b) Vùng chất lượng kém có thể khôi phục được( Recoverable – corrupted
region). c) Vùng chất lượng kém không thể khôi phục được( Unrecoverable
– corrupted region).
Với các ảnh vân tay chất lượng xấu, các cấu trúc đường vân bị sai lệch hoàn
toàn (Hình 2.2). Để đảm bảo hiệu suất cao của thuật toán trích rút điểm kì dị,
việc sử dụng các thuật toán nâng cấp ảnh vân tay để làm các cấu trúc đường vân
được rõ ràng là một điều thiết yếu. Một nhà vân tay học thường có thể nhận dạng
chính xác các điểm kì dị bằng các manh mối trực quan khác nhau như là sự định
hướng đường vân, đường vân liên tục, chiều hướng đường vân .vv…. vì các cấu
trúc đường vân và rãnh không bị sai lạc hoàn toàn. Có thể phát triển thuật toán
nâng cấp ảnh vân tay dựa vào các manh mối trực quan này để nâng cấp các cấu
trúc đường vân được rõ ràng trên các ảnh vân tay xấu. Thông thường, đối với ảnh
vân tay số các vùng quan tâm có thể được chia thành 3 loại sau:
 Vùng chất lượng tốt (Well – defined region): là vùng mà các đường vân
và rãnh rõ ràng, thuật toán trích rút minutiae có thể hoạt động được.
 Vùng chất lượng kém có thể phục hồi được (Recoverable corrupted
region): là vùng mà đường vân và rãnh bị phá huỷ bởi một số lượng nhỏ
các vết xước, vết ố nhòe .vv… nhưng vẫn nhìn thấy và các vùng lân cận
cung cấp đủ thông tin về các đường vân và rãnh đúng.
 Vùng chất lượng kém không thể phục hồi được (Unrecoverable
corrupted region): là vùng mà các đường vân và rãnh bị phá huỷ bởi
một số lượng lớn nhiễu và sự sai lệch làm cho không một đường vân nào

12


được nhìn thấy và các vùng lân cận không cung cấp đủ thông tin về các
đường vân hay rãnh thật.
Chúng ta sẽ xem xét hai vùng có thể phục hồi (recoverable) và không thể
phục hồi (unrecoverable). Mục tiêu của thuật toán nâng cấp ảnh vân tay là làm rõ

ràng các cấu trúc đường vân trong các vùng có thể phục hồi và loại bỏ các vùng
không thể phục hồi để thuận tiện trích rút đường vân và các điểm kì dị. Một thuật
toán nâng cấp ảnh vân tay không nên tạo ra bất kì một cấu trúc đường vân giả
nào. Vấn đề này rất quan trọng bởi vì cấu trúc đường vân giả có thể làm thay đổi
tính riêng biệt của vân tay. Các phương pháp nâng cấp ảnh vân tay thường được
phân loại theo hai hướng:
- Nhị phân hoá ảnh
- Nâng cấp ảnh mức xám
Trong đề tài này em chọn phương pháp nâng cấp ảnh mức xám vì nó có
nhiều điểm mạnh hơn phương pháp nhị phân hoá ảnh như: không bị mất thông
tin, tốc độ nhanh, hiệu quả với ảnh có chất lượng thấp và đặc biệt là sau khi nâng
cấp ảnh có thể áp dụng hiệu quả một phương pháp trích rút các điểm kì dị mới
nhất(trích rút các điểm kì dị trực tiếp từ ảnh vân tay mức xám).

2.2. Nâng cấp ảnh vân tay
Thuật toán nâng cấp ảnh vân tay thu nhận một ảnh vân tay đầu vào, áp dụng
trực tiếp một số bước trên ảnh đầu vào đó và cuối cùng đưa ra một ảnh đã được
nâng cấp. Để giới thiệu thuật toán, chúng ta đưa ra một số kí hiệu và định nghĩa
như sau:

2.2.1. Các kí hiệu
Một ảnh vân tay xám I, được định nghĩa là một ma trận N  N , trong đó
I(i,j) là cường độ của điểm ảnh tại dòng thứ i và cột thứ j. Ta giả sử rằng tất cả
các ảnh đều được quét ở độ phân giải 500dpi (dots per inch). Giá trị trung bình và
giá trị độ chênh lệch mức xám được định nghĩa lần lượt như sau:
M (I ) 

1
N2


N 1

N 1

  I (i , j )
i 0



VAR(I) 

j 0

13

1
N2

N 1

N 1

  ( I (i, j)  M ( I ))
i 0

j 0

2



Một ảnh định hướng O được định nghĩa là một ảnh N  N , trong đó O(i,j) là
hướng cục bộ của đường vân tại điểm ảnh (i,j). Hướng cục bộ của đường vân
thường được chỉ ra cho mỗi một block hơn là cho mỗi một điểm ảnh. Một ảnh
được chia thành một tập hợp w  w block không chồng lên nhau và một hướng
đường vân cục bộ được định nghĩa cho mỗi block này. Nhận thấy rằng trong ảnh
vân tay, không có sự khác biệt giữa hướng 900 và 2700.
Một ảnh tần số F là một ảnh N  N trong đó F(i,j) là tần số đường vân cục
bộ, được định nghĩa là tần số của đường vân và rãnh trong một lân cận dọc theo
hướng pháp tuyến với hướng của đường vân. Cấu trúc đường vân và rãnh trong
một lân cận mà ở đó các điểm kì dị hoặc các điểm đặc biệt xuất hiện sẽ không tạo
thành một dạng sóng hình sin tốt. Trong trường hợp đó tần số được định nghĩa là
tần số trung bình trong lân cận của block (i,j). Cũng giống như ảnh định hướng,
ảnh tần số cũng được tính theo lối chia thành các block.
Mặt nạ vùng (Region Mask) R là một ảnh N  N với R(i,j) biểu thị loại của
điểm ảnh. Một điểm ảnh có thể là một trong hai loại sau:
1) Không là điểm thuộc đường vân và rãnh (là điểm không thể khôi phục),
có giá trị là 0.
2) Là điểm thuộc đường vân hoặc rãnh (là điểm có thể khôi phục), có giá trị
là 1.
Mặt nạ vùng cũng được chỉ ra theo lối chia thành các block.

Hình 2.4. Cấu trúc của đường vân và rãnh trong một lân cận của điểm kì dị

14


Hình 2.5. Biểu đồ thể hiện thuật toán nâng cấp ảnh vân tay

2.2.2. Thuật toán
Sơ đồ của thuật toán nâng cấp ảnh vân tay được thể hiện trên hình 2.5. Các

bước chính của thuật toán bao gồm:
1) Bình thường hoá ảnh (Normalization): Một ảnh vân tay đầu vào được làm
bình thường hoá.
2) Ước lượng hướng cục bộ (Local orientation estimation): Ảnh định hướng
được ước lượng từ ảnh đã được bình thường hoá.
3) Ước lượng tần số cục bộ (Local frequency estimation): Ảnh tần số được
tính từ ảnh đầu vào đã được bình thường hoá và ảnh định hướng.
4) Ước lượng mặt nạ vùng (Region mask estimation): Mặt nạ vùng thu được
bằng cách phân mỗi block trên ảnh đã được bình thường hoá thành các
block có thể và không thể phục hồi.
5) Lọc ảnh (Filtering): Có nhiều các bộ lọc Garbor thích hợp với hướng và
tấn số đường vân cục bộ được áp dụng đối với các điểm ảnh trên ảnh đã
được bình thường hoá để thu được một ảnh vân tay được nâng cấp.

2.2.3. Bình thường hoá ảnh (Normalization)
Gọi G(i,j) là giá trị mức xám đã được bình thường hoá tại điểm ảnh (i,j).
Ảnh được bình thường hoá được định nghĩa như sau:

15



VAR 0 ( I (i, j )  M ) 2
M 0 
VAR

G (i, j )  
VAR 0 ( I (i, j )  M ) 2

M


0

VAR


( I (i, j )  M )
( I (i , j )  M )

Trong đó M0 và VAR0 là giá trị trung bình và giá trị chênh lệch mức xám lý
tưởng

Hình 2.6. Kết quả Bình thường hoá. a) Ảnh đầu vào. b) Ảnh đã được bình
thường hoá (M0=100, VAR0=100)

2.2.4. Ảnh định hướng (Orientation Image)
Sự định hướng ảnh thể hiện thuộc tính bản chất của ảnh vân tay và định
nghĩa một hệ bất biến cho đường vân và rãnh trong một lân cận. Một số phương
pháp đã được đưa ra để ước lượng trường định hướng của ảnh vân tay. Trong đồ
án này em dùng thuật toán ước lượng hướng bình phương tối thiểu. Gọi G là
ảnh đã được làm bình thường hoá, các bước chính của thuật toán như sau:
1) Chia G thành các block có kích thước w  w (16  16)
2) Tính Gradient  x (i, j ),  y (i, j ) tại mỗi điểm ảnh (i,j). Tuỳ thuộc vào yêu
cầu của bài toán mà có thể sử dụng các toán tử khác nhau, Sobel hoặc MarrHildreth.
3) Ước lượng hướng cục bộ cho mỗi block có điểm giữa là (i,j) sử dụng các
đẳng thức sau:

16



Trong đó  (i, j ) là ước lượng bình phương tối thiểu của hướng đường vân
cục bộ của block có điểm giữa là (i,j). Theo quan điểm toán học, nó thể hiện
hướng trực giao với hướng trội của phổ Fourier tại cửa sổ w  w .
4) Do sự có mặt của nhiễu mà đường vân, rãnh và điểm kì dị.vv… trong ảnh
đầu vào bị sai lệch dẫn đến ước lượng hướng cục bộ  (i, j ) có thể sẽ không chính
xác. Vì hướng đường vân cục bộ thay đổi chậm trong các lân cận mà không có
các điểm dị thường, một bộ lọc thông thấp có thể được sử dụng để hiệu chỉnh
chính xác hướng. Để thực hiện lọc thông thấp, ảnh định hướng cần phải chuyển
thành trường vector liên tục, được định nghĩa như sau:

Fx (i, j)  cos(2 (i, j))

and

Fy (i, j)  sin(2 (i, j))

Trong đó Fx và Fy là thành phần x và y của trường vector, với kết quả của
trường vector, lọc thông thấp được thực hiện như sau:



Trong đó W là bộ lọc thông thấp 2 chiều với đơn vị nguyên và w  w là
kích thước của bộ lọc. Chú ý rằng, toán tử làm trơn được thực hiện ở đơn vị
block. Giá trị mặc định của kích thước bộ lọc là 5  5 .
5) Tính hướng đường vân cục bộ tại điểm (i,j) sử dụng:

17


Với thuật toán này, có thể thu được ước lượng trường hướng khá trơn. Hình

2.7 thể hiện ví dụ của ước lượng định hướng ảnh với thuật toán này

Hình 2.7. So sánh các trường định hướng sử dụng một phương pháp khác
(a) và phương pháp giới thiệu trên[16]; w=16 kich thước bộ lọc w&=5
2.2.5. Ảnh tần số (Ridge Frequency Image)
Trong một lân cận cục bộ không có các điểm kì dị và điểm đặc biệt xuất
hiện, các mức xám dọc theo các đường vân và các rãnh có thể được mô tả dưới
dạng sóng hình sin theo hướng của đường vân cục bộ (hình 2.8). Do vậy tần số
đường vân cục bộ cũng là một thuộc tính xác định của ảnh vân tay. Gọi G là ảnh
đã được bình thường hoá và O là ảnh đã được định hướng, các bước phải làm
trong việc ước lượng tần số đường vân cục bộ như sau:
1) Chia G thành các khối có kích thước w  w (16x16)
2) Đối với mỗi khối có điểm giữa tại (i,j), tính cửa sổ định hướng có kích
thước l  w (32x16) được định nghĩa trong hệ toạ độ đường vân (hình 2.8).
3) Đối với mỗi khối có điểm giữa tại điểm (i,j), tính tín hiệu x (x-signature)
X[0], X[1],…X[l-1] của đường vân và rãnh trong cửa sổ định hướng, trong đó:
X [k ] 

1 w1
 G (u , v )
w d 0

u  i  (d 

k=0,1,2,…,l-1

w
l
) cos O(i, j )  (k  ) sin O(i, j )
2

2

18


v  j  (d 

w
l
) sin O(i, j )  ( k  ) cos O(i, j )
2
2

Hình 2.8. Cửa sổ định hướng và tín hiệu x
Nếu không có điểm kì dị và điểm đặc biệt xuất hiện trong cửa sổ định
hướng, tín hiệu x tạo thành một dạng sóng hình sin có tần số bằng tần số đường
vân và rãnh trong cửa sổ định hướng. Vì thế, tần số của đường vân và rãnh có thể
được ước lượng từ tín hiệu x. Gọi T(i,j) là số điểm ảnh trung bình giữa hai đỉnh
liên tiếp của tín hiệu x thì tần số được tính như sau:
W(I,j)= 1/ T(I,j)
(i, j )  1 /  (i, j )

Nếu không có các đỉnh liền kề nhau trong x thì tần số được gán cho giá trị 1 để cho khác biệt với các giá trị tần số hợp lệ.
4) Mỗi ảnh vân tay được quét ở một độ phân giải cố định nên giá trị tần số
của đường vân và rãnh trong một lân cận nào đó là nằm trong một dải cố định.
Đối với ảnh 500dpi, dải này là [1/3,1/25]. Vì thế nếu ước lượng giá trị tần số nằm
ngoài khoảng này thì giá trị tấn số được gán là -1 để chỉ ra rằng không thu được
một tần số hợp lệ.
5) Các block mà trong đó có các điểm kì dị và( hoặc) các điểm đặc biệt xuất
hiện và( hoặc) các đường vân và các rãnh bị sai lệch sẽ không tạo nên dạng sóng

hình sin tốt. Giá trị tần số cho các block này cần được nội suy từ tần số của các

19


khối lân cận mà có dạng sóng hình sin tốt. Quá trình nội suy được thực hiện như
sau:
i) Đối với mỗi khối có điểm giữa là (i,j)
W’(i,j)= …..
Trong đó:
0
x

x0
x0

0
 ( x)  
1

x0
x0

Ux=…..  ( x)  

Wg là một hàm Gaussian với giá trị trung bình và độ lệch lần lượt là 0 và 9,
và w  =7 là kích thước của hàm.
ii) Nếu tồn tại ít nhất một khối có tần số là -1 thì đảo  thành  ' và trở lại
bước i.
6) Khoảng cách giữa các đường vân thay đổi chậm trong một lân cận. Vì

thê, một bộ lọc thông thấp có thể được sử dụng để hiệu chỉnh chính xác tần số.
wl / 2

F (i , j ) 

wl / 2
'

 W (u, v) (i  uw, j  vw)
l

u   w / 2 v   w

Trong đó, Wl là mảng hai chiều của bộ lọc thông thấp với wl=7 là kích
thước của bộ lọc.

2.2.6. Mặt nạ vùng (Region Mask)
Như đã đề cập, một điểm ảnh (hoặc một block) trong ảnh vân tay đầu vào
có thể nằm trong vùng có thể khôi phục lại hoặc không thể khôi phục lại được.
Sự phân loại điểm ảnh thành hai dạng này có thể được thực hiện dựa trên cơ sở
đánh giá hình dạng sóng tạo bởi đường vân và rãnh. Có 3 thuộc tính được sử
dụng để mô tả dạng sóng hình sin: biên độ ( ) , tần số (  ) , và sai số ( ) . Gọi
X[1],X[2],…,X[l] là tín hiệu x của một block có điểm giữa là (i,j). Ba thuộc tính
tương ứng với điểm (block) được tính như sau:
1)  =(độ cao trung bình của đỉnh - độ sâu trung bình của rãnh)
2)   1 / T (i, j ) trong đó T (i, j ) là số điểm ảnh trung bình giữa hai đỉnh liền
kề.

20



1l
1l
2
3)   (X[i] ( X[ j]))
l i1
l j1
Nếu một block có điểm giữa là (i,j) là có thể khôi phục thì R(i, j )  1 hoặc
R(i, j )  0 . Sau khi thu được ảnh R, phần trăm của các vùng có thể khôi phục sẽ

được tính. Nếu tỷ lệ phần trăm này bé hơn giá trị ngưỡng

recoverable  40 thì

ảnh bị từ chối. Một ảnh được chấp nhận sau đó sẽ chuyển sang quá trình lọc.

2.2.7. Lọc ảnh (Filtering)
Hình dạng của các đường vân và các rãnh trong các vùng có tần số và định
hướng tốt của ảnh vân tay cung cấp các thông tin rất hữu ích để giúp cho việc
loại bỏ nhiễu. Dạng sóng hình sin của của các đường vân và rãnh thay đổi chậm
theo một hướng cục bộ cố định. Vì thế, một bộ lọc dải thông mà được kết hợp
bởi tần số và hướng, có thể hiệu quả trong việc loại bỏ nhiễu và bảo toàn các cấu
trúc thật của đường vân và rãnh. Các bộ lọc Gabor có cả hai thuộc tính lựa chọn
là tần số và hướng, và tối ưu trong cả hai lĩnh vực không gian và tần số. Vì thế,
sử dụng riêng bộ lọc Gabor như là bộ lọc dải thông để loại bỏ nhiễu và bảo tồn
cấu trúc thật của đường vân và rãnh.
Bộ lọc Gabor có dạng như sau:
 1  x2 y2  
h( x, y :  , f )  exp   2  2   cos(2fx )
 2   x  y  

x  x cos   y sin 
y   x sin   y cos 

Trong đó  là hướng của bộ lọc Gabor, f là tần số của mặt sóng hình sin,

x và y là khoảng trống không đổi của đường bao Gaussian dọc theo hướng x
và y. Hàm đáp ứng xung (modulation transfer function MTF) của bộ lọc Gabor
có thể được thể hiện như sau:

21


H(u, v : , f ) 
 1  (u  u0 )2 (v  v0 )2 
 1 (u  u0 )2 (v  v0 )2 
2x y  exp


  2x y  exp

2
2
 v2 
v2 
 2  u
 2  u
u  u cos  v sin
v  u sin  v cos
2 cos
f

2 sin
v0 
f
u0 

Trong đó:

u 

1
1


v
2 y
2x và

Hình 2.9. a) Bộ lọc Gabor với f=10 và   0 . b) MTF tương ứng
Để áp dụng bộ lọc Gabor vào ảnh vân tay, có 3 tham số phải được chỉ ra:
1. Tần số của mặt sóng hình sin f
2. Hướng của bộ lọc
3. Độ lệch chuẩn của hình bao Gaussian

22

x và y


Chương 3:
TRÍCH RÚT ĐIỂM KÌ DỊ

3.1. Giới thiệu
Hầu hết các hệ thống đối sánh vân tay đều được dựa trên phương pháp khớp
điểm kì dị. Các điểm kì dị là các điểm gián đoạn cục bộ trên mẫu vân tay. Học
viện quốc gia Mĩ đã đưa ra một phân loại các điểm kì dị dựa trên 4 lớp: điểm kết
thúc, điểm rẽ thành hai nhánh, điểm rẽ thành ba nhánh và điểm chưa xác định.
Trong đề tài này em dùng mô hình nhận dạng đã được sử dụng bởi Cục Điều Tra
Liên Bang Hoa Kì. Mô hình này được chấp nhận trong hầu hết các hệ thống tự
động, nó được dựa trên một sự phân loại các điểm kì dị thành hai lớp: điểm kết
thúc và điểm rẽ thành hai nhánh. Với mỗi điểm kì dị chúng ta lưu lại các thành
phần của lớp, toạ độ và góc mà tiếp tuyến đi qua điểm kì dị tạo thành với phương
ngang (hình 3.1). Vấn đề trích rút điểm kì dị đã được nghiên cứu rất kĩ lưỡng
nhưng vẫn chưa được giải quyết triệt để. Khó khăn nhất chính là chất lượng ảnh
vân tay thường quá thấp; nhiễu và độ tương phản kém có thể tạo ra các điểm kì dị
giả và làm mất đi các điểm kì dị thật.
Quy trình lấy vân tay có vai trò quyết định. Hầu hết các kĩ thuật nổi tiếng
được biết đến như là “kĩ thuật điểm chỉ bằng mực”, thường tạo ra các ảnh có
nhiều vùng bị thiếu thông tin do mực đậm hoặc nhạt. Kĩ thuật sử dụng các lăng
kính quang học và kĩ thuật tạo ảnh 3 chiều đòi hỏi có độ chính xác cao trong suốt
quá trình lấy vân tay, đó là yêu cầu áp lực của ngón tay lên bề mặt quang học
phải phù hợp. Hơn nữa, trong một số trường hợp như: ở tay của những công nhân
và tay của người cao tuổi, sự nhô lên của đường vân tay có thể là rất thấp và dấu
vân tay có thể không đọc được.

23


Hình 3.1. Thể hiện của điểm kì dị.
a) Chỉ ra một điểm kết thúc; với (x0,y0) là toạ độ của nó;  là góc mà tiếp tuyến
của đường vân tại điểm kì dị tạo với phương nằm ngang.
b) Chỉ ra một điểm rẽ nhánh; ở đây  được định nghĩa giống như  của điểm

kết thúc nhưng trong ảnh bù của nó.
Một số phương pháp tự động dò tìm điểm kì dị đã được đưa ra. Tuy khác
nhau nhưng hầu hết các phương pháp này đều chuyển ảnh vân tay thành dạng
ảnh nhị phân thông qua một thuật toán đặc biệt. Ảnh thu được trải qua một quá
trình làm gầy, làm cho đường vân có bề dầy giảm xuống còn một điểm ảnh (Hình
3.2)

Hình 3.2. a) Một ảnh vân tay xám; b) Ảnh thu được sau khi thực hiện nhị
phân hoá ảnh a; c) Ảnh thu đươc sau khi thực hiện làm gầy ảnh b).
Trong đề tài này em lựa chọn phương pháp trích rút điểm kì dị trực tiếp từ
ảnh xám mà không cần nhị phân hoá ảnh và làm gầy ảnh bởi các lý do sau:
 Có rất nhiều thông tin của ảnh có thể bị mất trong quá trình nhị phân hoá.
 Nhị phân hoá và làm gầy ảnh tốn nhiều thời gian.

24


 Kĩ thuật nhị phân hoá đã được thử nghiệm nhiều và không tốt khi áp dụng
cho ảnh có chất lượng thấp.

3.2. Kĩ thuật bám theo đường vân
Gọi I là một ảnh xám a  b với g là mức xám, và gray(i,j) là mức xám của
điểm ảnh (i,j) của I với i=1,…,a; j=1,….,b. Gọi z=S(i,j) là bề mặt tương ứng với
ảnh I: S(i,j)=gray(i,j); i=1,…,a; j=1,….,b. Bằng cách kết hợp các điểm ảnh sáng
với mức xám gần 0 và các điểm ảnh tối với mức xám gần g-1, các đường vân tay
(có màu tối trong I) tương ứng với bề mặt đỉnh của các dãy lồi. Khoảng trống
giữa các đường vân (có màu sáng trong I) tương ứng với bề mặt các rãnh lõm
(Hình 3.3).

Hình 3.3. Một bề mặt S, tương ứng với thể hiện của một vùng nhỏ của dấu

vân tay
Theo quan điểm toán học, một đường vân tay được định nghĩa là một tập
hợp các điểm là cực đại cục bộ theo một hướng. Thuật toán trích rút đường vân
cố gắng đưa ra tại mỗi bước một cực đại cục bộ liên quan tới một đoạn cắt trực
giao với hướng của đường vân. Bằng cách dò tìm các cực đại liền kề nhau sẽ đưa
ra được một xấp xỉ đa giác của đường vân.
Gọi (is, js) là một cực đại cục bộ của một đường vân của I và

0

là hướng

của tiếp tuyến với đường vân tay tại (is, js). Đoạn mã giả sau mô tả thuật toán
bám theo đường vân:

25


×