Tải bản đầy đủ (.pdf) (50 trang)

Ứng dụng các thuật toán băm ảnh vào nhận dạng sinh trắc học = Application of image hashing algorithms to biometrics reconigtion

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (22.84 MB, 50 trang )

ĐẠỊ HỌC QUỐC GIA HÀ NỘI
ỨNG DỤNG CÁ C TH U Ậ T TOÁ N BĂM ẢN H VÀ O N H Ậ N DẠ N G
SIN H TRẮC HỌ C
Mã số: QC.06.10
Chủ nhiệm.đề tài: ThS. Đào Minh Thư
ĐẠI HỌC QUỐC GIA HÀ NỘI
Ứ NG D ỤNG CÁ C T H UẬ T TOÁN: BĂM ẢN H VÀO NHẬN DẠNG
SINH TRẮ C HỌC
Mã số: QC.06.10
Chủ nhiệm đề tài: ThS. Đào Minh Thư
n * ' M Ọ C Q U Ố C GIA HẢ NỘI
TPUNG TÂM THÒNG TIN ĨHƯ VIỆN
t)7 i 3 A 2 -
Hà Nội - 2008
1. Name of the project:
Applying hashing algorithms for fingerprint image authentication.
Project serial number: QC.06.10
2. Project leader: Ms. Thu Dao Minh.
3. Main results:
3.1. Scientific results:
> We present a new robust indexing scheme that’s able to fasten the
fingerprint recognition process and propose a hasshing scheme for
facial image recognition.
> Published paper:
Thi Hoi Le & The Duy Bui (2008). A fast and distortion tolerant
hashing fingerprint image authentication. In: Proceedings of CỈSIS 2008,
Advances in Computing Series, Springer Verlag.
3.2. Applications:
> Biometric recognition system.
3.3. Training results:
s 02 student from K49C has finished their Bachelor thesis and


conferred the degree.
3.4. Enhancement:
s To advance professional knowledge in image processing.
REPORT ON MAIN RESULTS OF PROJECT QC.06.12
MỤC LỤC
* •
1 Giới thiêu

2 Phương pháp băm với vân tay

2.1 Mã sửa lỗi




2.2 Đặc trưng thứ cap của dẩu vân tay
2.3 Đẻ xuất mã sữa lỗi đối với điểm đặc trưng dâu vân ta>
2.4 Lược dồ băm dựa trên từ mã ^
2.4.1 Đề xuất

5
2.4.2 Phản tích
lỉ
2.4,3 Thực nghiệm
3 Phương pháp băm vói ảnh mặt người
3.1 So khớp trực tiếp.

3.2 Vec-tơhóa

3.3 So khớp


3.4 Ket quả thực nghiệm

1:
13
14
14
4 Kết luận
15
DANH MỤC BẢNG BIẺU, HÌNH VẼ
Hình 1. Đặc trưng vân vụn (minutiae) của một dấu vân tay
7
Hình 2. Đặc trưng thứ cấp củaM ,. Trong đó rlữ và rti là khoảng cách Euclidean giữa vân
vụn M t và các hàng xóm của nó là N0 và N ị. ạ>k là sai phân về hướng giữa M t và
N k trong đó k nhận giá trị 0 hoặc 1. ô biểu diễn góc nhọn giữa đoạn thẳng M ịN 0
và M IN ] [15] 7
Hình 3: Chia nhỏ một bức ảnh thành các khối
14
Hình 4. Kết quả thực nghiệm băm ảnh trong nhận dạng khuôn m ặt 15
Bảng 1. chỉ số CIP với thuật toán của chúng tôi

.
12
TÓM TÁT NHỮNG KÉT QUẢ CHÍNH CỦA ĐÈ TÀI NCKH
1. Tên đề tài:
“ứng dụng các thuật toán bãm ảnh vào nhận dạng sinh trăc học
Mã số: QC.06.10
2. Chủ trì và đồng chủ trì đề tài: ThS. Đào Minh Thư & TS. BÙI Thê
Duy
3. Những kết quả chính:

3.1. Kết quả về khoa học (những đóng góp cùa đề tài, các công trình khoa
học công bổ):
- Đề tài đưa ra một phương pháp mới để đẩy nhanh tốc độ nhận dạng
dấu vân tay và đề xuất một phương pháp băm ảnh đê áp dụng với bài
toàn nhận dạn khuôn mặt.
- 01 bài báo tại hội nghị quốc tế: Thi Hoi Le & The Duy Bui (2008). A
fast and distortion tolerant hashing fingerprint image authentication. In:
Proceedings of CISIS 2008, Advances in Computing Series, Springer
Verlag.
3.2. Ket quả phục vụ thực tế (các sản phẩm công nghệ, khả năng áp dụng
thực tế):
Hệ thông hỗ trợ nhận dạng sinh trắc học.
3.3. Kết quả đào tạo (số lượng sinh viên, học viên cao học, nghiên cứu
sinh làm việc trong đề tài):
- 02 cứ nhân đã tốt nghiệp:
• Đào Thanh Tuấn, “A SIFT-based Face Recognition Method”,
khóa luận tôt nghiệp trường Đại học Công Nghệ, 2008.
• Vũ Thị Lý. “Nghiên cứu về xứ lý ảnh trong xây dựng bản đồ”,
khóa luận tôt nghiệp trường Đại học Công Nghệ, 2008.
3.4. Kẽt quả nâng cao tiềm lực khoa học (nâng cao trình đò cán bô và
tăng cường trang thiết bị cho dơn vị):
- Nâng cao năng lực chuyên môn cua cán hộ bộ môn về các lĩnh Vực xử lý
REPORT ON MAIN RESULTS OF PROJECT QC.06.12
1. Name of the project:
Applying hashing algorithms for fingerprint image authentication.
Project serial number: QC.06.10
2. Project leader: Ms. Thu Dao Minh.
3. Main results:
3.1. Scientific results:
> We present a new robust indexing scheme that’s able to fasten the

fingerprint recognition process and propose a hasshing scheme for
facial image recognition.
> Published paper:
Thi Hoi Le & The Duy Bui (2008). A fast and distortion tolerant
hashing fingerprint image authentication. In: Proceedings of CISIS 2008,
Advances in Computing Series, Springer Verlag.
3.2. Applications:
> Biometric recognition system.
3.3. Training results:
s 02 student from K49C has finished their Bachelor thesis and
conferred the degree.
3.4. Enhancement:
s To advance professional knowledge in image processing.
1 Giới thiệu
Củng với sự mở rộng của thế 2.ĨỚÌ sổ thì xác thực cá nhân mọt cach tin cạy đa trơ
thành mối quan tâm lớn trong những hoạt động giao tiêp giữa con ngu OI va may
tính. Chứng minh thư điện tử, thương mại điện tử và truy cập mạng máy tinh đeu là
những lĩnh vực mà trong đó các thông tin về định danh người dùng la vo cung quan
trọng. Các phương pháp an ninh sử dụng mật khẩu hay thẻ từ đã đuọc dùng nhiêu
để truy cập đến các tài nguvên trong xã hội thực và và xã hội ảo. Du rai pho dụng
song những phương pháp này vẫn chưa đảm bảo vê mặt an ninh. Tệ hơn nũa là
chúng có thể bị chia sẻ hay đảnh cắp một cách dễ dàng. Mật khâu và các sô PIN
thậm chí còn có thổ bị đánh cấp thông qua các thiết bị điện tử. Hon thê nữa, chúng
không phân biệt được đâu là người dùng được định danh vả đâu là kẻ giả mạo lừa
đào. Các biện pháp sinh trắc học như dấu tay, khuôn mặt và giọng nói cho ta cách
xác thực cá nhân tin cậy và còn giúp giải quyết vấn đề trên, các biện pháp này ngày
càng thu hút sự quan tâm cùa chính phủ và người dân.
Mặc dù dã có nhiêu kêt quả quan trọng trone việc xây dựng các hệ thông định danh
dấu sinh trắc học, vẫn còn có nhiều vấn đề cầnnghiên cứu để tăng cường hiệu quả
của hệ thống. Nhận dạng sinh trắc học tự động là quá trình đòi hỏi rất nhiều tính

toán, nhất là với một cơ sở dữ liệu lớn. Thiểu phương pháp đánh chỉ số sinh trắc hoc
hiệu quả, ta sẽ phải so sánh toàn bộ một mẫu sinh trắc học được yêu cầu vói toàn bộ
các mẫu sinh trắc học khác trong co sở dữ liệu, đây là điều rất cần tránh trong thực
tê. Tuy nhiên, không giông như hệ thống mật khẩu, trong đó các mật khẩu được so
khớp tuyệt đôi nhăm định danh một cá thể nào đó, với hệ thống nhận dạng sinh irắc
học ta chỉ có thể so sánh gần đủng để tìm ra thông tin định danh cá thể với mức độ
tin cậy nhất định do các mẫu sinh trắc học mỗi lần thu nhận lại có sự sai khác nhất
định với những lần trước. Như vậy, ta cần có một số cơ chế chấp nhận lỗi mà vẫn
không làm giảm tính an ninh của hệ thống.
Có 2 lựa chọn công nghệ để giảm thiểu lượng so sánh trone các hệ thống định danh
sinh trào học để có thể giàm thiểu đươc thời gian hồi đáp của một tiến trình nhận
dạng: kv Thuât phân lớp và kv thuật đánh chi mục.
Vơi cái hệ thong 5ử dụnc ván tay cac ky thuật phản lớp truyền thốne ([5] [16]) cố
rãne ph.T dâu tay thanh 5 lòp: Vong phải (R). vòng trái (ĩ ), von? xoắn ốc (W)
vòng cung (A) và Tented Arch (T). Do sự phân bố tự nhiên không đồng đều nên số
lượng các lớp không lớn và các dẩu tay trong thực tê của môi lóp cũng không đêu
nhau: trên 90% dấu tay thuộc về 3 lớp đầu [18]. Điều này dẫn tới kết quà là không
thể giảm không gian tìm kiếm xuống một cách hợp lý những hệ thống như vậy. Kỹ
thuật đánh chỉ mục thực hiện tốt hơn kỹ thuật phân lớp vấn đề định kích cỡ không
gian cần để tìm kiếm. Các thuật toán đánh chỉ mục dấu vân tay chọn tất cả những
ứng viên cần thiết và sắp xếp chúng theo sự tuơng đồng với đàu vào so sánh. Gần
đây, nhiều thuật toán đánh chỉ mục đã được đề xuất. A.K.Jain [13] sử dụng các đặc
trưng quanh điểm lõi của một ảnh lọc Gabor để nhận chỉ mục. Mặc dù cách tiếp cận
này phải dùng đến các thông tin toàn thể (điểm lõi) nhưng khả năng nhận đúng chỉ
một lõi là bị hạn chế. Trong [2], kỹ thuật này dùng điểm đơn (SP) để ưóc lưọng độ
ưu tiên tìm kiếm và nhờ đó không gian tìm kiếm giảm xuống 4% trên toàn bộ tập dữ
liệu. Tuy nhiên việc tìm ra điểm đơn không phải đơn giản. Một số dấu vân tay thậm
chí còn không có điểm đơn và tình trạng nhập nhằng khi xác định điểm đơn là khá
lớn [18]. Bên cạnh đó, còn có nhiều yếu tố nữa làm hỏng chỉ số dấu vân tay trong
các phương pháp khác. R.Cappelli đã đề xuất một cách tiếp cận mới gần đạt được

sự hợp lý trong khi thực hiện và thời gian nhận dạng. Germain và cộng sự [10] sử
dụng bộ ba các vân vụn trong phần đánh chì mục. J.D Boer [3] lại tích hợp các đặc
trưng đa dạng (trường hướng, FingerCode và bộ ba minutiae - các đầu mút của các
đường vân tay). Hầu hết đều thực hiện đánh chỉ mục sau khi thay thế các đặc trưng
này bỏi một số đặc trưng khác. Hầu hết các đặc trưng được trích rút đều khác biệt
với các đặc trưng dùng khi so sánh; do đó, việc trích rút các đặc trưng cần được
thực hiện 2 lân khi áp dụng lược đô này vào bât kỳ một hệ thống vân tay nào đã có
từ trước đến nay. Han nữa, kết quả so sánh không chỉ bị ảnh hưởng bởi các lỗi sinh
ra trong quả trình đánh chì mục mà còn do tiến trình trích rút đặc trưng phụ.
Một điểm mẩu chốt là làm sao để thuật toán đánh chỉ mục trở nên mạnh mẽ hơn,
nhận diện được cả những mẫu sinh trác học bị biến dạng. Có 2 dạng biến dạng: biến
dạng do dịch chuyển và biến dạng hệ thống. Trong hầu hét các lược đồ đánh chỉ sổ,
các biến dạng do dịch chuyển có thể xử lý được bằng cách đánh chỉ số trên các đặc
trưng bất biến. Tuy nhiên, cách làm này sẽ phức tạp hơn với trường hợp dữ liệu sinh
trãc học. Vì nguôn dữ liệu sinh trẳc học cực kỳ đa dạng nên 2 mẫu không thể có
cùng kích cỡ hay hướng. Kết quả là trong một mẫu, một sổ đặc trưng có thể bị mất
và các tập đặc trưng sẽ không còn hợp lệ nữa. Đây là vấn đề rắc rối trong cả thuật
toán so sánh và thuật toán đánh chỉ mục.
5
„ . : , I nhuc những vấr
Trong đê tài này, chúng tôi đê xuât một lược đô bãm cỏ the Kiia1- r ^
tồn đọng đã nêu ở trên. Đẩu tiên chúng tôi trình bày phương phap x ỵ _
việc đưa ra một định nghĩa về từ mã (codeword) của điém đặc trurit, a n ta\
một lược đồ băm sẽ thực thi trên các từ mã này. Đê thu đưọc cac ma tụ ac đổ
đặc trưng, chúng tôi định lưu các thuộc tinh dung thứ loi trong khau so sanh d’;
đề xuất ờ [15]. Nói cách khác, mỗi cập đặc trưng sẽ được so sánh cùng nhau
chúng cùng chia sẻ một giá trị băm như nhau trong lược đo cua chung toi. Hơnj
nữa, để làm giảm số cặp so sánh, chúng tôi có thê .sử dụng mọt lược đo bam ng
nhiên để làm giảm các trùng lặp ở đầu ra. Sau đó chúng toi cung đe xuat R)
phương pháp bãm ảnh để áp dụng với bài toán nhận dạng khuon mạt.

2 Phương pháp băm với vân tay
2.1 Mã sửa lỗi
Cho trước độ đo d, ta có thể xác định các mã sửa lỗi trong không gian tương ỦI
K. Một mã là một tập con c = {w,

WK) c M . Tập c còn được gọi là kho
(codebook), các thành phần K của tập này chính là các từ mã. . Khoảng cách (nil
nhất) của một mã là khoảng cách d nhỏ nhất giữa 2 từ mã phân biệt (phụ thuộc Vỉ
độ đo đ). Cho trước một kho mã c , ta có thể xác dinh một cặp hàm (c, D). Hà:
mã hóa c là một bản đồ xen kẽ các phàn tử của những miền xác định có độ lớn
với các phân tử của c . Hàm mã hóa Dánh xạ mỗi w e M thành một ảnh pre-imaạ
c ' f WA ] thuộc từ mã wt để khoảng cách J[w,wt]Ia tối thiểu. Phạm vi sửa lỗi có bai
kính lớn nhât là (đê với mọi phân tử M/ trong M ta chỉ có một từ mã trong vùng bi
kính t có tâmw. Với các hàm khoảng cách là số nguyên ta có Í = |.K
hiệu tắt chuẩn trong lý thuyết mã hóa là bộ (M. K j).
2.2 Đặc trưng thứ cấp của dấu vân tay
r>
Hình 1. Đặc tru-ng vân vụn (minutiae) của một dấu vãn tay
Mỗi đặc trưng thứ cấp của đấu vân tay là một vectơ có 5 thành phần (xem hình 1).
Với mỗi vân vụn (minutiae) Mịix^y^Oị) và 2 hàng xóm gần nhất là Na (x„0,yn0,ỡn0)
và Nị (x ị,y„Ị,ỡ„Ị), đặc trưng thứ 2 được cấu thành nên nhờ việc định dạng vectơ
s (/'ũ,r1,ípiũJ<7}íi,áí) mà trong đó rtữ và rt là những khoảng cách Euclidean giữa vân
vụn trung tâm M và các hàng xóm của nó là N0 và N]. (plk là sai phân về hướng
giữa M, và Nk, trong đó k nhận giá trị 0 hoặc 1. ốt biểu diễn góc nhọn giữa đoạn
thẳng MịNũ và MịNị.
Hình 2. Đ ặc trun g thứ cấp cùa M . T rong đó r:ũ và Tj là khoảng cách E uclidean giữa vân yụn M vâ
các hàng xóm của nó là N ữ và . (pk là sai phân về hiróng giũa M và N k trong đó k nhận giá trị
0 hoặc 1. Ố' biếu diễn góc nhọn giữa đoạn thẳng M Nữ và M N [ [16].
Lưu ý rằng N0 và A', là 2 hàng xóm gần nhất của vân vụn trung tâm M, và chúng
được đưa ra không phải nhờ khoảng cách Euclidean của mình nhưng chủng phải

thỏa mãn bất đẳng thức:
7
Trong đề tài này, chủng tôi đề xuất một lược đồ băm cỏ thể khắc phục những vấn đề
tồn đọng đã nêu ơ trên. Đầu tiên chúng tôi trình bày phương pháp xử lý vân tay với
việc đưa ra một định nghĩa về từ mã (codeword) của điểm đặc trưng dâu vân tay và
một lược đồ bãm sẽ thực thì trên các từ mã này. Đẻ thu được các mã tự từ các điểm
đặc trưng, chúng tôi định lưu các thuộc tính dung thứ lỗi trong khâu so sánh được
dề xuất ờ [15]. Nói cách khác, mỗi cập đặc trưng sẽ được so sánh cùng nhau vả
chúng cùng chia sẻ một giá trị bãm như nhau trong lược đồ cùa chúng tôi. Hon thế
nữa, để làm giảm só cặp so sánh, chúng tôi có thể sử dụng một lược dô bãm na,ẫu
nhiên để làm giàm các trùng lặp ờ đầu ra. Sau đó chúng tôi cũng đề xuât một
phương pháp băm ảnh để áp dụng với bài toán nhận dạns khuôn mặt.
2 Phương pháp băm với vân tay
2.1 Mả sừa lỗi
Cho trước dộ đo d, ta có thê xác định các mã sữa lỗi trong không gian tương úng
K. Môt mã là một tập con c = ■» ,11, ỊcM. Tập c còn được gọi là lcho mã
(c.ơdebook), các thành phần K cùa tập nay chính là các từ mã. . Khoảng cách (nhỏ
nhất) cùa một mã là khoảng cách d nhỏ nhất giữa 2 từ mã phân biệt (phụ thuộc vào
dộ đo d). Cho trước một kho mã c , ta có thể xác dinh một cặp hám (C,D). Hàm
mã hóa c là một bản đô xen kẽ các phần từ của nhữne miền xác định có độ lởn K
VỚI các phân tử của c . Ham mã hóa Dảnh xạ môi w F M thảnh một ảnh pre-imaíỊS
c [wk] thuộc từ mã ». đẻ khoảng cách d[w,wt ]là tối thiểu. Phạm vi sửa lỗi có bán
kính lớn nhãt là / đê với mọi phân tù vv trong M ta chì cù một từ mã trong vùng hán
kính í có tâm w . Với các hàm khoảng cách là sô nguyên ta có t = Ký
hiệu tăt chuẩn trong lý thuyết mã hóa là bộ (M . K t) .
2.2 Đặc trưng thứ cấp của dấu vân tay
6
Hình 1. Đặc trung vân vụn (minutiae) cùa một dấu vân tay
Mỗi đặc trưng thử cấp của dấu vân tay là một vectơ có 5 thành phần (xem hình 1).
Với mỗi vân vụn (minutiae) M^x^y^Gị) vả 2 hàng xóm gần nhất là N0 (xn0,yn0,ỡnũ)

và (jcnl,>*„,,ớnl), đặc trưng thứ 2 được cấu thành nên nhờ việc định dạng vectơ
j S , )mà trong đỏ ri0 và là những khoảng cách Euclidean giữa vân
vụn trung tâm M và các hàng xóm của nó là N0 và Nị . ẹtk là sai phân về hướng
giữa M' và Nk, trong đó k nhận giá trị 0 hoặc 1. ỗ biểu diễn góc nhọn giữa đoạn
thẳng M Nữ và MiN].
V / / \ ô
Hình 2. Đặc trun g thú cấp của Mr T rong đó r 0 và r.j là khoảng cách Euclidean giữa ván yụn M và
các hàng xóm của nỏ là N0 và N ị . <pik là sai phân về huómg giũa M và Nk trong đó k nhận giá trị
0 hoặc 1. Ỗ biêu diễn góc nhọn giữa đoạn thang M Nc và A/,A': [16],
Lưu ý ràne Nữ và iV, là 2 hàng xóm gần nhất của vân vụn trung tâm M và chúng
được đưa ra không phải nhờ khoảng cách Euclidean của mình nhưng chúng phải
thỏa mãn bất đẳng thức:
7
NữMtxNịM' >0
No là vân vụn thứ nhất và N] là vân vụn thứ cấp được thu nhận trong quay một góc
Z A '.,V / ,V ,.
Với cặp vân vụn tham chiểu tuơng hợp cho trước p andg ta noi rang van vụn
p ịr ,,<D ,e ) tương hợp với ,,0 (i ;|, nếu qt thuộc vùng dung sai của
p . Bởi vậy các hàm ngưởng cho trước Thldr{.), Thỉdệ(.), và 7hldg(.),
\răJ -rư \<Th!dr(r„.), \ệư - ệJ<T hldệ(ậiy) và \ e , , < Thldg (ớ,y) . Lưu ý ràng
các ngưỡng này không phải là các giá trị được xác định trước nhưng ta hoàn toàn có
thể điều chinh được theo r„. và ry,.
Trong tài liệu này. ta coi đặc trưng dấu vân tay thử cấp như một điêm đặc trưng.
2.3 Đề xuất mã sửa lỗi đối với điểm đặc trưng dấu vân tay
Hau hết các lược đồ sửa lỗi đều lưu ý đến khoảng cách Hamming và dùng đại lượng
này để chinh một thông điệp ờ mức bít (ví dụ như các bit kiểm tra parity, lược đó
mô phòng. CRC, ). Bởi vậy. chúng tôi định nghĩa một hàm sửa lỗi mới cũng nhu
từ mã của điểm đặc trưng dấu vân tay. Cụ thể, ở đây chúng tôi chi đề xuất một hàm
mã hóa giông quá trình giải mã những đặc trưng khòng cân thiêt.
Định nghĩa 1: Cho xeRũ, và c(x) là hàm mã hóa cùa lược đồ sửa lỗi với các

khoảng chữa lỗi là t . Ta định nghĩa C(x) = (ợ (x-/) I ợ (x) lợ (>: + /)] trong đó q(x) lí
hàm lượng từ của X với bước lượng tử là t Ta gọi tập xuất của c(x) ịc, ,,c c,„)lí
tập từ mã của
X

C I
= q{x) là tư mã gần nhất cùa X hay nói tất là từ mã cùa X.
Bò đê 1: Cho Jre/?, cho trước một ngưỡng dung sai R, Với mọi y thỏa mãn
X ) • < í, thì từ mã cua y là c =q(y) sẽ trở thành một thành phần trong tập từ mã
của X.
Ta ^ thè chứne minh bổ đC ỉ mõt cach de dàn,? nhà các phép biến đói đai sổ.
Theo cách của mình, chúng tôi sinh một tập từ mã cho tất cả các điểm đặc trưng vân
tay mẫu q và chỉ sinh từ mã cho tất cả các điểm truy vấn p. Theo bô đê 1 và định
nghiã về 2 điểm đặc trưng tương xứng, ta có thể thấy ràng nểu p và q là các điểm
đặc trưng tương ứng của hai phiên bản xuất phát từ cùng một dấu vân tay thì từ mã
của q sẽ là một thành phần trong tập từ mã cùa p .
2.4 Lược đồ băm dựa trên từ mã
Chúng tôi xin trình bày một lược đồ tạo băm đấu tay dựa trên từ mã của điểm đặc
trưng. Ý tưởng chính là: đầu tiên, “chuẩn hóa” các điểm đặc trưng lỗi thành từ mã,
sau đó dùng từ mã này làm đàu vào của một hàm băm ngẫu nhiên, hàm này có thể
phân rải tập đầu vào và đảm bảo rằng khả năng đụng độ của 2 điểm'đặc trưng có
liên quan mật thiết đến khoảng cách giữa các cặp tọa độ tương ứng của chúng (đã
được đưa ra trong định nghĩa về 2 điểm đặc trưng tương xứng)
2.4.1 Đề xuất
Mô tả chung. Đầu tiên, chủng tôi giải thích tại sao dùng và dùng như thế nào một
hàm băm ngẫu nhiên để bảo đảm ràng nó sẽ có những tính chất chịu lỗi và chịu
xung đột. Thứ hai, chúng tôi xin trình bày việc sử dụng hàm băm để xây dựng một
lược đồ băm các điểm đặc trưng của dấu vân tay.
Các đặc trưng dấu vân tay đã lưu trữ trong cơ sở dữ liệu được xác định là rất lớn.
Bởi vậy, chúng tôi muốn thiết kế một hàm băm dành cho các tập đầu vào lớn, nó

không chắc là các thành phần xung đột. Có một cách đạt đưọc tính chất này là sinh
ham băm ngẫu nhiên hơn. Trong bài báo này, chúng tôi có được tính chất này như
sau. Đầu tiên, hoán vị các bit thông điệp và thông điệp kết quả sẽ được chia ra thành
nhiều khối có kích thước bang nhau. Ta tính toán các khối băm này (dùng hàm nén
như SHA) và sau đó nối lại, sử dụng làm đầu vào chuỗi móc nối của tập con từ cac
khối, các tập con này đủ nhỏ và khác biệt nhau. Ý tường cơ bản là với bất cứ tập
đầu vào cho sẵn nào, thuật toán này sẽ phân tán các dữ liệu vào trong phạm vi của
hàm để đầu ra theo xác suất sẽ được phân bố ngẫu nhiên hơn.
Để đảm bảo tính chịu lỗi, hàm băm sẽ thực hiện trên từ mã (đối với các điểm truy
vấn) và tập từ mã (đổi với các điểm mẫu) thay vì trên bản thân điểm đặc trưng.
Chúng tôi đi từ định nghĩa về các điểm đặc trưng thứ cẩp (xem phẩn 2.2) và bổ đề 1
9
đó là điểm truv vấn y v a điểm mẫu X là tương xứng nêu và chì nêu tù mã cua V là
một thành phần trong tập từ mã cùa
X
Đặc tả chính xác. Chunẹ tôi thiết đặt lược đồ băm như sau:
1. Chọn các chiều ngẫu nhiên từ (1-2 D): bằng cách này, chủng tôi điêu
chình sự cân bằng giữa xung đột của các giả trị băm và không gian cơ sỏ' dừ
liệu của mình.
2. Chọn một khoảng cách sửa lỗi và độ đo thích hợp /^cho những chiêu đà
chọn.
Với mỗi điểm mẫu p :
1. Sinh tập từ mã cho pđ. Các giá trị này được ánh xạ sang các xâu nhị phân.
2. Các xâu nhị phân trone tập từ mã của những chiều đã chọn lại được nối VÓI
nhau thành các xâu nhị phân cỏ dạng ủ với i - trons đó L là số chiều
dã chọn.
3. Hoán vị mt và biêu diễn lại dại lượng này dưới dạng các khối có kích thước
băng nhau. Với mỗi đại lượng m :
a. Dung hàm băm độc lập pair-wise để chọn tập con có kích thước jctù
các khôi. Biểu diễn lại các tập con s như một xâu chuỗi của các khối.

b. Có shi = SHAịm^) với s = X
c. Trả lại sh = sỉị \ sh
4. T ôn tại tôi đa ú giá trị băm cùa từng p . Các giá trị này được lưu trong cùng
một bảng bãm cũng như những giá trị phân tách.
Với điểm truy vẩn q :
1. Tinh giá trị từ mã gần nhất cho toàn bộ các chiều đã chọn của q . Sau đỏ ánh
xạ giá trị này thành một xâu nhị phân.
2. Các xâu nhị phân tương ứng với các chiều đã chọn lại được xâu chuỗi lại.
3. Thực hiện bước 3 và 4 giông điêm mẫu. Lưu ý răng chỉ có một xâu nhị phân
tương ứng với điêm truy vấn q .
4. T ra lại tât cà cac điêm có cùng giá trị băm định danh với q
Voi đánh gia tru> ván hãm hám do chung tôi đưa ra sẽ trả vê tất cả các tương xứng
tiêm r.inr Voi tàt t. điêm đặc trưn.c truy vấn. Vì the mỗi dấu vân tay truy vẩn được
10
xem như một tập các điêm, giả lập một đánh giá truy vân đa điêm. Đê thực hiện
được điều này một cách hiệu quả, chúng tôi sử dụng một khung chỉ mục như Ke
[17], trong đó, chúng tôi giữ hai cấu trúc chi mục bổ trợ - bảng file (File Table -
K.T) và bảng điểm khóa (Keypoint Table - KT) - để ánh xạ các điểm đặc trưng vào
dấu vân tương ứng với chúng; một đầu vào trong KT bao gồm chì mục File (vị trí
chỉ mục của KT) và thông tin về điểm đặc trưng.
Các dấu vân mẫu có những điểm có cùng giá trị băm đồng nhất (các xung đột) với
một phiên bản truy vấn được xếp hạng nhờ lượng điểm tương tự. Chỉ có các mẩu N
được chọn để nhận dạng dấu vân tay truy vẩn nhờ so sánh. Bởi vậy, không gian tìm
kiếm đã giảm đáng kể, Tiến trình chọn lựa ứng viên yêu cầu chỉ trả một giá tính
toán tuyến tính để có thể áp dụng truy vẩn tương tác online trên các tập ảnh lớn.
2.4.2 Phân tích
1) Độ phức tạp về không gian
Đẻ nhận dạng đấu vân tay tự động, chúng tôi phải định ra một bộ lưu trữ cực lớn
các giá trị băm cùa dấu vân tay mẫu. Giả sử sổ điểm đặc trưng D chiều được rút ra
từ phiên bản mẫu là N .V ở i L chiều đã chọn, không gian tổng cần thêm cho một

mẫu là ũ ịứ .N Ỵ
Do vậy, lưcrc đồ băm cần một cấu trúc dữ liệu có kích cỡ đa thức cho phép đạt tới
thời gian sub-linear của các hàng xóm gần như sẽ chỉ ra ở phần dưới.
2) Độ phức tập về thời gian
Trên dấu vân tay truy vấn Y có N điểm đặc trưng, chúng tôi phải
- Tính từ mã cho từng điểm đặc trưng với dộ phức tạp là các hàm băm
lượng tử, các hàm này cần độ phức tạp thời gian là hằng số.
- Tính giá trị băm với độ phức tạp 0{time(fDx)}trong đó / l à hàm băm và
tỉme(f,x) là thời gian mà hàm / cần với đầu vào làx .
- Tính điểm tương tự của các mẫu, các mẫu này có điểm chung giá trị đồng nhất
vói cùng dấu tay truy vấn, có độ phức tạp thời gian là O(B.N) trong đó B là
kích thưó'C bucket của bảng băm.
11
Bởi thể nên lượng khóa sẽ là OịB.N + time( / , x))
2.4.3 Thực nghiệm
Chúng tôi đánh giá phương pháp nàv bàng cách kiêm thử trên co sỏ dũ iiệu
FVC2004 [19] có 300 bức ảnh, cứ 3 bức chụp một dẩu vân tay, có 100 dâu vân tay
khác nhau. Cơ sở DBI A lưu mẫu vân tay từng phần với các kích thước khác nhau.
Các bức ảnh nay được thu nhận nhờ một cám biên quang có dộ phân giải là 500dpi,
kết quả cho ra là các ảnh có kích thước 300x200 pixel vói 8 bit câp xám. Sử dụng
mẫu gốc đầy đù để xây dựng cơ sở dữ liệu, trong đó đê nguyên 7 dâu đê băm.
Chúng tôi sử dụng thuật toán trích rút đặc trưng nhu đã mô tả trong tài liệu [15]
trong hệ thống của mình. Tuy nhiên, các tác giả không đề cập chi tiểt dến việc xác
định ngưỡng của độ dung lỗi ra sao. Bới vậy, trong thực nghiệm này, chúng tôi giả
thiêt khoảng cách sửa lôi t là cô định với tât cả các điêin đặc trưng dâu vân tav. Giả
định nàv sẽ khiến cho việc thực nghiệm không, đạt tới trạng thái tốt nhất để thuật
toán tương xứntỉ tổ chức 2 điểm đặc trưng thành “tương xúng”, thuật toán này đã đề
xuất trong [15] có the sẽ không có cùng giá trị băm trong thực nghiệir. của chúng
tôi.
Chủng tôi cũng sừ dụng khoảng cách Euclidean eiữa các chiều tưcmg ứng cua vectư

đặc trưng trong hàm bãm lượng tử.
Bảng I cho thấy Correct Index Power (CIP) được xác dinh nhờ tỷ lệ các truy vấn
được đánh chỉ mục một cách chính xác, các truv vấn này dựa trên tỷ lệ ^iả thiết cần
được tìm trong bước xác minh. Mặc dù thử nghiệm của chúne tôi không đạt mức
hoàn hảo, lược đồ vẫn đạt kết quả CIP tốt. Có thể dễ dàng thấy tỷ lệ tìm kiếm lứn
hơn cho kết quả tôt hơn. Điêu này cho thây răng thử nghiệm hoàn hảo có thể nâng
cao kêt quả thực hiện.
Bảng 1. chì số CIP với thuật toán cùa chúng tôi
indirect Index1 Row
V»'V*r ậ i-J&' fi*ứ
er
Search
D 5%
Percentage
10%
15%
20%
<‘IP 80%
1
87%
04%
96%
12
3 Phương pháp băm với ảnh mặt người
Trong phần này, chúng tôi trình bày phương pháp của chúng tôi để giải quyết bài
toán định danh thông qua ảnh mặt. Đối với ảnh mặt, chúng tôi sử dụng các đặc
trưng SIFT [20] và thuật toán băm Local Sensitive Hashing (LSH) [1]. ứng dụng
thuật toán băm LSH vào việc nhận dạng mặt hoàn toàn hợp lý vì sổ chiều của vec-tơ
đặc trưng được trích chọn là khá cao.
Phương pháp cùa chúng tôi được tiến hành trong hai giai đoạn: Vec-tơ hóa và so

khớp.
3.1 So khớp trực tiếp
Phương pháp thường đùng với các đặc trưng để tìm đủng ảnh mặt là so khớp trực
tiếp các đặc trưng này. Phương pháp này cũng có thể áp dụng ngay với các đặc
trưng SIFT và chọn ảnh mặt nào có số lưọng đặc trưng khớp nhất. Tuy nhiên
phương pháp này đòi hỏi lượng tính toán nhiều, đặc biệt khi dữ liệu lớn.
3.2 Vec-tơ hóa
Khi ghép các đặc trưng SIFT lại với nhau, chúng ta được một vec-tơ. Các vec-tơ
này của các khuôn mặt khác nhau, có sổ chiều khác nhau do số điểm đặc trưng thu
được là khác nhau. Tuy nhiên để có thể dùng các đặc trưng này với thuật toán LSH,
chúng ta phải chuẩn hóa số chiều của vec-tơ đặc trưng. Chúng tôi-chuẩn hóa số
chiều này bằng cách chia nhỏ ảnh khuôn mặt ra thành các khối với một lưới cố định
rồi lẩy giá trị trung bình của các đặc trưng SIFT cho mỗi khối. Như vậy ta thu được
một vec-tơ đặc trưng thứ cấp với số chiều cố định để có thể áp dụng vào thuật toán
LSH.
13
B8B- ' .19«
SiL- 'ịj 11
isait f SHI
illifjsfsi
iiiihitiidB
villgBdll
ĨÌHBmBKÌí
llisilisk
H ình 3: C h ia n hỏ m ột bức àn h th ản h c ác k h ối.
3.3 So khớp
Trong hệ thống đê xuất cùa chúng tôi, ciệc so khớp một ảnh đâu vào được tiên hành
theo hai giai đoạn: Tim kiêm nhanh và tìm kiêm toàn bộ. Việc tìm kiểm nhanh được
thực hiện băn? cách áp dụng thuật toán bãm LSH trên ảnh đâu vào và nhanh chỏng
đưa ra một tập ứng viên cồm k ảnh. Sau đó. trên tập ứng viên k ảnh này, việc tim

kiếm toàn bộ để so khớp ảnh đàu vào với các ảnh trong tập ứng viên mới được thực
hiện. Việc tìm trước tập ứng viên như thế này làm eiảm khối lượng tính toán của
việc tim kiểm toàn bộ cả cơ sở dữ liệu đi rất nhiều.
3.4 Kết quả thực nghiệm
Trong quá trình thực nghiệm, các thông số SIFT được khời tạo đúng, như đề xuất
cùa Lowe [20]. Ngưỡng DoG dược đặt là 0.0075. Giá trị D, dùng để loại bỏ những
đặc trưng ứng viên có dộ tương phản thấp, được đặt là 0.008. Chúng tôi sừ dụn£
phiên bản E2LSH, được cài đặt bởi Alexandr Andoni. Các tham số của LSH đều là
giá trị mặc định.
Cơ sỡ dữ liệu thực nghiệm là YaleB. Cơ sở dữ liệu nảy tập trung vào sự khác biệt
vê màu săc và biểu lộ khuôn mặt. Cơ sở dữ liệu này gồm 20 đối tượne. 3 ảnh cho
môi đôi tượng được lưu lại. 70 ảnh khác của 20 đổi tượng này dùng để kiểm thử.
Giai đoạn kiêm thử được thực hiện với sồ lượng ứng viên k khác nhau. Hình 4 cho
lha} kei qua thực nghiệm là độ chính xác với các k khác nhau và các cách lấy mẫu
khae nhau. Kêt quả thực nghiệm cho thấy phương pháp đư2 ra có khả năng giam
được khôi lượng tinh toán mà vẫn giữ được độ chính xác
14
>*
o
ro
L-
13
u
u
nj
•* » 1. ».•:•isK.R.gei w%Vfc ! ■ ™ '"T
‘.V ; * L f r U ',:
■».
«r*. V *?' ĩ'- -!.' ;•*, > .wfcbMts
’■ • " •:

■ «55 vs ';•••••. . V
- : v .ft j • • •- . 1* •X*. .
10% -
0% -
-♦ 3x3
-«-6x6
9x9
-*-12x12
-*-16x16
■■■; 't
. • pi ’? ■ ■ >-•£ .t •
r‘‘ tf f >- i ■■■
> •* * *- - -SVfc* ••>.**—* - '.ir’ .f r-« •
. » - « . . w
: I
5 7
55%
65%
85%
70%
65%
70%
75%
82.60%
72.50%
70%
72%
80%
81%
75%

70%
75%
78%
80%
77%
70%
H ìn h 4. K ét q uà th ụ c n ghiệm b ăm ả nh tro n g n h ậ n d ạ n g k h u ôn m ặt
4 Kết luận
Trong báo cáo này, chúng tôi đã trình bày một lược đồ băm thực hiện trên từ mã của
điểm đặc trưng dấu vân tay và trên khuôn mặt. ở đây các điểm đặc trưng dấu vân
tay là bộ ba vân vụn. Từ mã được tạo ra để lưu các thuộc tính chịu được sụ biến
dạng của trạng thái tương ứng với điểm đặc trưns; bởi vậy độ chính xác của toàn bộ
hệ thống định danh không bị ảnh hưởng do tiến trình của chúnẹ tôi co hẹp không
gian lại. Chúng tôi cũng đã trình bày một lược đồ bãm ngẫu nhiên có khả năng giảm
bót các xung đột đâu ra cho một tập đâu vào lớn. Thực nghiệm cũng chỉ ra rằng
lược đồ của chúng tôi có thê giảm đáng kể lượne công việc phải thực hiện đối với
15
trạng thái tương ửne với điểm đặc trưng. Đe hệ thống thêm hiệu quả và để tãng CIP
lên ngưởng xáp xi 100%, chúne tôi sẽ xây dựng một quá trình thực thi với những
lựa chọn tôi ưu về tham số khoảng cách sửa lỗi và thực hiện các thử nghiệm trên
nhiêu tập dữ liệu biến dạng hơn. Với ảnh khuôn mặt, phương pháp băm ảnh cũne
hứa hẹn mang lại hiệu quả mà vẫn giữ được độ chính xác cao.
16
TÀI LIỆU THAM KHẢO
*
[]] Alexandr Andoni and Piotr Indyk, "Near-Optimal Hashing Algorithms for Near
Neighbor Problem in High Dimensions" in Proceedings of the Symposium on
Foundations of Computer Science (FOCS'06), 2006.
[2] Bazen A. M. and Sabih H. Gerez (2003). Fingerprint matching by thin-plate
spline modeling of elastic deformations. Pattern Recognition, issue 36, pages

1859-1867.
[3] Bazen A. M., Verwaaijen G. T. B, Garez s. H., Veelunturf L. p. J., and B. J. van
der Zwaag (2000). A correlation-based fingerprint verification system.
ProRJSC2000 Workshops on Circuits, Systems and Signal Processing.
[4] Boer J., Bazen A., and Cerez s. (2001). Indexing fingerprint database based on
multiple features. ProRISC 2001 Workshop on Circuits, Systems and Singal
Processing.
[5] Brown L. (1992). A survey of image registration techniques. ACM Computing
Surveys.
[6] Cappelli R., Lumini A., Maio D., and Maltoni D (1999). Fingerprint
Classification by Directional Image Partitioning. IEEE Trans, on PAMI, volume
21, issue 5, pages 402-421.
[7] Cappelli R., Maio D., and Maltoni D. (2000). Indexing fingerprint databases for
efficicent 1 : n matching. Sixth Int.Conf. on Control, Automation, Robotics and
Vision, Singapore.
[8] Choudhary A. M. and Awwal A. A. s. (1999). Optical pattern recognition of
fingerprints using distortion-invariant phase-only filter. SPIE, Photonic devices
and algorithms for computer, volume 3805, pages 162-170. (20)
[9] Fingerprint verification competition, bo.iưfvc2002/.
[10] Germain R., Califano A., and Colville s. (1997). Fingerprint matching using
transformation parameter clustering. IEEE Computational Science and Eng.,
volume 4, issue 4, pages: 42-49.
[11] Gonzalez, Woods, and Eddins (2004). Digital Image Processing. Prentice
Hall.
[12] Anil Jain, Arun Ross, and Salil Prabhakar. Fingerprint matching using
minutiae texture features (2001). International Conference on Image Processing
pages 282-285.
OẠI HỌC QUỐC GIA HA NCi
TRUNG TÂM THÔNG TIN THƯ VIÊN
[13] Anil Jain, Salil Prabhakar, Lin Hong, and Sharath Pankanti. Filterbank-based

fingerprint matching (2000J. Transactions on Image Processing, volume 9, pages
846-859.
[14] Jain A.K., Prabhakar s., Hong L., and Pankanti s. (1999). FingerCode: a
filterbank for fingerprint representation and matching. Computer Vision and
Pattern Recognition IEEE Computer Society Conference, volume 2, pages 187-
193
[15] Jea T., Chavan V. K., Govindaraju V., and Schneider J. K. (2004). Security
and matching of partial fingerprint recognition systems. SPIE, pages 39-50.
[16] Jea Tsai-Yang, and Govindaraju Venu (2005). A minutia-based partial
fingerprint recognition system. Pattern Recognition, volume 38, issue 10, pages
1672-1684.
[17] Karu K. and Jain A.K. (1996). Fingerprint Classification. Pattern
Recognition, volume 18, issue 3. pa^es 389-404.
[18] Ke Y., Sukthankar R. and Huston L. Í2004). An efficient parts-based near
duplicate and sub-ima&e retrieval system. MM International Conference on
Multimedia, pages 869-876.
[19] Liang X., Asano T., and Bishnu A (2006). Distorted Fingerprint indexing
usine minutiae detail and delaunay triangle. 3rd International Symposium on
Voronoi Diagrams in Science and Engineering (ISVD'06), pages 217-223.
[20] D. G. Lowe, “Distinctive Image Features from Scale-Invariant Keypoints",
International Journal of Computer Vision, 60. 2, pp. 91-1 10, 2004.
[21] D. Maio, D. Maltoni, R. Cappelli, J. L. Wayman and A. K. Jain, "FVC2004:
Third Fingerprint Verification Competition", Proc. International Conference on
Biometric Authentication (ICBAÌ, pp. 1-7, Hong Kong, July 2004.
[22] Nandakumar K. and Jain A. K. (2004). Local correlation-based fingerprint
matching. Indian Conference on Computer Vision, Graphics and Image
Processing, pages 503-508.
[23] Nist fingerprint vendor technology evaluation (' />[24] Bolle Ruud, Connell J. H., Pankanti s., Ratha N. K., and Senior A. w
(2003). Guide to Biometrics. Springer Verlag.
College of Technology

Hanoi National University
Dao Thanh Tuan
SIFT-based Face R ecogn ition Method
Graduation Report
Department of Computer Science
HANOI - 2008

×