Tải bản đầy đủ (.pdf) (61 trang)

Nghiên cứu công nghệ nhận diện khuôn mặt dựa trên kỹ thuật phân tích mống mắt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.6 MB, 61 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------

TÔN LONG TRIỂN

NGHIÊN CỨU CÔNG NGHỆ NHẬN DIỆN KHUÔN MẶT
DỰA TRÊN KỸ THUẬT PHÂN TÍCH MỐNG MẮT

LUẬN VĂN THẠC SĨ KỸ THUẬT

THÀNH PHỐ HỒ CHÍ MINH – NĂM 2016


HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------

TÔN LONG TRIỂN

NGHIÊN CỨU CÔNG NGHỆ NHẬN DIỆN KHUÔN
MẶT DỰA TRÊN KỸ THUẬT PHÂN TÍCH
MỐNG MẮT
Chuyên ngành: KỸ THUẬT VIỄN THÔNG
Mã số: 60.52.02.08

LUẬN VĂN THẠC SỸ KỸ THUẬT

NGƯỜI HƯỚNG DẪN KHOA HỌC

TS. NGUYỄN THANH BÌNH

THÀNH PHỐ HỒ CHÍ MINH – NĂM 2016




i

LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai
công bố trong bất kỳ công trình nào khác.
TP.HCM, ngày 20 tháng 6 năm 2016
Học viên thực hiện luận văn

Tôn Long Triển


ii

LỜI CẢM ƠN
Lời đầu tiên em xin chân thành gửi lời cảm ơn sâu sắc đến Thầy T.S Nguyễn
Thanh Bình đã định hướng cho em đề tài này để tìm hiểu sâu về lĩnh vực máy học.
Đồng thời thầy cũng đã hướng dẫn tận tình, chỉ bảo em về các vấn đề khác liên
quan mật thiết cho việc thực hiện luận văn của em. Xin chân thành cảm ơn các Thầy
Cô đã tận tình hướng dẫn, giảng dạy trong suốt quá trình học tập, nghiên cứu và rèn
luyện ở Học Viện Công Nghệ Bưu Chính Viễn Thông cơ sở thành phố Hô chí Minh
Dù đã cố gắng để hoàn thành tốt nhất bài luận văn có thể nhưng vẫn không thể tránh
khỏi những thiếu sót. Rất mong nhận được sự đánh giá và đóng góp chỉ dẫn từ các
Thầy Cô, bạn bè để làm tốt hơn cho luận văn cao học của em.
Em xin chân thành cảm ơn.

TP.HCM, ngày 20 tháng 6 năm 2016
Học viên thực hiện luận văn


Tôn Long Triển


iii

MỤC LỤC
LỜI CAM ĐOAN ....................................................................................................... i
LỜI CẢM ƠN ............................................................................................................ ii
MỤC LỤC ................................................................................................................. iii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ..............................................v
DANH MỤC CÁC BẢNG........................................................................................ vi
DANH MỤC CÁC HÌNH ........................................................................................ vii
MỞ ĐẦU .....................................................................................................................1
Chương 1 - TỔNG QUAN ..........................................................................................2
1.1. Giới thiệu chung đặc điểm sinh trắc học của mắt ............................................2
1.1.1 Hệ xác thực ................................................................................................3
1.1.2 Nhận dạng ..................................................................................................3
1.1.3 Các thành phần chức năng chủ yếu ............................................................3
1.1.4 Đánh giá hiệu năng và chất lượng hoạt động của hệ sinh trắc học ............4
1.2 Các phương pháp tiền xử lý trích đặc trưng của mống mắt ..............................5
1.2.1 Phân đoạn ảnh ............................................................................................5
1.2.2 Chuẩn hóa ảnh ............................................................................................6
1.3 Các nghiên cứu liên quan ...............................................................................12
1.4 Lý do chọn đề tài .............................................................................................13
Chương 2 - NGHIÊN CỨU GIẢI THUẬT PHÂN LOẠI VÀ NHẬN DẠNG
MỐNG MẮT .............................................................................................................16
2.1 Kỹ thuật phân loại dựa vào khoảng cách Hamming .......................................16
2.2 Kỹ thuật phân loại dựa vào mạng nơron .........................................................16



iv
2.3 Đặc điểm của phương pháp phân loại dựa vào kernel ...................................18
2.3.1 Đặc điểm không gian ánh xạ ....................................................................19
2.3.2 Kernel và những loại kernel khác nhau ...................................................20
2.4 Kỹ thuật phân loại dựa vào kernel của SVM ..................................................21
2.4.1 Optimal Hyperplane (tối ưu siêu phẳng) cho các phân chia tuyến tính ...21
2.4.2 Tối ưu hóa siêu phằng bằng phương pháp toàn phương ..........................24
2.4.2 Mô hình nhiều lớp SVM ..........................................................................27
Chương 3 - KẾT QUẢ MÔ PHỎNG ........................................................................28
3.1 Mô phỏng và đánh giá kết quả ........................................................................28
3.1.1 Mô phỏng phương pháp phân loại dựa vào khoảng cánh hamming ........28
3.1.2 Mô phỏng phương pháp phân loại dựa vào SVM ....................................39
3.2 Kết luận chung ................................................................................................46
3.3 Hướng phát triển của đề tài .............................................................................46
DANH MỤC TÀI LIỆU THAM KHẢO ..................................................................47
PHỤ LỤC ..................................................................................................................49


v

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

Viết tắt

Tiếng Anh

Tiếng Việt

CNN


Convolutional neural network

Mạng nơ-ron tích chập

ERR

Equal error rate

Tỷ lệ kết quả sai

FAR

False accept ratio

Tỷ số chấp nhận sai

FMR

False Match Rate

Tỷ lệ so sánh sai

FNMR

False None Match Rate

Tỷ lệ không so sánh được

FRR


False rejection ratio

Tỷ số từ chối sai

HMM

Hidden Markov model

Mô hình markov ẩn

OAA

One-Against-All

Một chống tất cả

OAO

One-Against-one

Một chống một

RBF

Radial basis function

Hàm bán kính cơ sở

SVM


Support vector machine

Máy vectơ hỗ trợ


vi

DANH MỤC CÁC BẢNG

Bảng 2.1. Các loại hàm kernel khác nhau .................................................................20

Bảng 3.1. Đánh giá kết quả của quá trình nhận dạng dựa vào khoảng cách hamming
37
Bảng 3.2. Thời gian thực hiện nhận dạng dựa vào khoảng cách hamming

37

Bảng 3.3. Đánh giá các thông số của quá trình SVM

41

Bảng 3.4. Đánh giá kết quả quá trình nhận dạng dựa vào SVM

45


vii

DANH MỤC CÁC HÌNH

Hình 1.1. Biểu đồ minh họa của FAR, FRR và ERR .................................................5
Hình 1.2. Quá trình chuẩn hóa từ tọa độ đề cát sang tọa độ cực ................................7
Hình 1.3. Quá trình chuẩn hóa mô hình Daugman’s Rubber Sheet ............................8
Hình 1.4. Cặp bộ lọc Gabor 2D trực giao .................................................................11
Hình 2.1. Mô hình Mạng nơ tron ..............................................................................17
Hình 2.2. Hình ảnh về không gian ánh xạ .................................................................20
Hình 2.3. Hình ảnh về siêu phẳng cho các phân chia tuyến tính ..............................22
Hình 2.4. Hình ảnh về các siêu phẳng có thể có của một tập dữ liệu .......................23
Hình 3.1. Mô hình nghiên cứu tổng quan .................................................................31
Hình 3.2. Xác định các đường cong bằng thuật toán daugman ................................32
Hình 3.3. Hình ảnh của mắt sau khi xác định các thành phần nhiễu ........................32
Hình 3.4. Hình ảnh của mẫu mắt sau khi chuẩn hóa sang tọa độ cực .......................33
Hình 3.5. Hình ảnh sau khi loại bỏ thành phần nhiễu và chuẩn hóa sang tọa đô cực
...................................................................................................................................33
Hình 3.6. Hình ảnh cơ sở dữ liệu Casia iris sau quá trình tiền xử lý ........................34
Hình 3. 7. Quá trình xử lý với hình ảnh thực tế ........................................................35
Hình 3.8. Lưu đồ giải thuật của quá trình nhận dạng dựa vào khoảng cách hamming
...................................................................................................................................36
Hình 3.9. So sánh tỷ lệ FRR và FAR ........................................................................37
Hình 3.10. Mật độ phân bộ của khoảng cách Hamming ...........................................38
Hình 3.11. Sơ đồ khối của quá trình phân loại dựa vào SVM ..................................39


1

MỞ ĐẦU
Công nghệ sinh trắc học là công nghệ sử dụng những thuộc tính vật lý, đặc
điểm sinh học riêng của mỗi cá thể như vân tay, mống mắt, khuôn mặt... để nhận
diện. Bởi đặc tính ổn định và độc nhất của vân tay và mống mắt nên cho đến nay,
các đặc điểm này vẫn được sử dụng trong các phương pháp nhận dạng dựa vào sinh

trắc tin cậy nhất để đáp ứng nhu cầu bảo mật, độ chính xác, tốc độ và độ lớn của cơ
sở dữ liệu để nhận dạng sinh trắc. Hiện nay rất nhiều công nghệ với sự kết hợp của
nhiều thuật toán khác nhau để đem lại hiệu quả cao nhất và ngày càng cải tiến các
phương pháp nhận dạng sinh trắc
Trong đề tài này sẻ tập trung nghiên cứu công nghệ sinh trắc hoc và phương
pháp nhận dạng các cá thể dựa vào đặc điểm riêng biệt của mống mắt, đề tài có xử
nhiều thuật toán để xử lý ảnh và trích những đặc trưng từ các mống mắt và từ đó
xây dựng các mô hình cụ thể để thực hiện quá trình huấn luyện các mẫu mống mắ
có sẳn và lưu trữ vào cơ sở dữ liệu, và qua đó để kiếm tra tính đúng đắn và chính
xác của quá trình ta còn thực hiện quá trình kiểm thử các mẫu mắt từ tập kiểm tra để
qua đó nhận xét tốc độ, độ chính xác của kết quả và tính tối ưu của từng thuật toán


2

Chương 1 - TỔNG QUAN
1.1. Giới thiệu chung đặc điểm sinh trắc học của mắt
Sinh trắc học hay công nghệ sinh trắc học (thuật ngữ khoa học là Biometric)
là công nghệ sử dụng những thuộc tính vật lý, đặc điểm sinh học riêng của mỗi cá
nhân như vân tay, mống mắt, khuôn mặt... để nhận diện. Thuật ngữ sinh trắc
học (Biometric) đựoc dùng ghép theo tiếng Hy Lạp từ 2 từ: Bio (thuộc về thực thể
sinh vật sống) và metriko (kỹ thuật độ đo, đo lường), thuật ngữ này đã được hình
thành trong quá trình phát triển loài người và được biết đến từ lâu để thể
hiện các đặc trưng về thể chất hay về hành vi của từng cá thể con người. Có nhiều
loại đặc trưng sinh trắc học: vân tay (Fingerprint), lòng bàn tay (Palm print),
dạng hình học bàn tay (Hand geometry), chữ ký viết tay (Hand written Signature),
khuôn mặt (Face), tiếng nói (Voice), con ngươi mắt (Iris), võng mạc
(Retina), ADN... Những đặc trưng này đã được phát hiện từ rất sớm để nhận dạng,
xác thực chủ thể con người và hiện nay đang được quan tâm nghiên cứu triển ứng
dụng trong các lĩnh vực an ninh, quốc phòng, thương mại. Các đặc trưng sinh trắc

học của cơ thể người được sử dụng phải đảm bảo các tiêu chuẩn sau đây [18]:
- Tính rộng rãi: là tính chất cho biết khả năng sử dụng hệ thống an ninh
sinh trắc học cho một số lượng người lớn.
- Tính phân biệt: là tính chất phân biệt đặc trưng sinh trắc học giữa hai người
bất kỳ phải khác nhau, đảm bảo sự duy nhất của chủ thể sinh trắc.
- Tính ổn định: là tính chất về sự ổn định theo thời gian của các đặc trưng
sinh trắc.
- Tính dễ thu thập: đặc trưng sinh trắc học phải dễ dàng thu nhận mẫu khi
đăng ký, kiểm tra xác thực, nâng cao tính khả thi trong sử dụng.


3

- Tính hiệu quả: là tính chất mà việc xác thực sinh trắc phải chính xác, nhanh
chóng và tài nguyên cần sử dụng được chấp nhận.
- Tính chấp nhận được: là tính chất mà quá trình thu thập mẫu sinh trắc phải
được sự đồng ý của người người dùng.
- Chống giả mạo: là tính chất ưu việt của việc sử dụng đặc trưng sinh trắc khả năng mẫu sinh trắc khó bị giả mạo cao,

1.1.1 Hệ xác thực
Hệ xác thực hay Hệ thẩm định (Verification) là hệ thống thực hiện
nhiệm vụ đối sánh 1-1 giữa mẫu sinh trắc học thu nhận được (biometric sample)
với mẫu dạng sinh trắc học (biometric template) đã có trong hệ thống từ trước. Kết
quả trả lời câu hỏi mẫu sinh trắc thu nhận có liên quan tới mẫu dạng sinh trắc hay
không? Thông thường trong hệ thẩm định có kết hợp với thông tin định danh chủ
thể để thực hiện chức năng xác thực thẩm định sinh trắc (Authentication). Trong hệ
xác thưc thẩm định đòi hỏi cao về độ chính xác để kết quả trả lời câu hỏi “Sinh trắc
học sống thu nhận được (biometric sample) có phải là sinh trắc của chủ thể đã lưu
trong hệ thống không?


1.1.2 Nhận dạng
Hệ thống nhận dạng (Identification, Recognition) là hệ thống thực hiện chức
năng tìm kiếm trong một cơ sở dữ liệu lưu trữ một tập các mẫu sinh trắc học để tìm
ra một mẫu sinh trắc cụ thể trong các mẫu khuôn dạng sinh trắc thu thập từ trước và
sau đó thực hiện đối sánh xấp xỉ để nhận dạng phân lớp (Classification) hoặc nhận
dạng đồng nhất (Identification), ví dụ như việc tìm mẫu vân tay tội phạm trong hồ
sơ các vân tay, từ đó xác định danh tính của chủ sở hữu vân tay.

1.1.3 Các thành phần chức năng chủ yếu


4

Thu nhận là thành phần có chức năng thu nhận mẫu sinh trắc học và biểu
diễn chúng dưới dạng số.
- Xử lý và trích chọn đặc trưng : là thành phần chức năng thực hiện các phép
xử lý phân tích và trích chọn các đặc trưng từ mẫu sinh trắc học.
- Đối sánh: là thành phần chức năng thực hiện so sánh các đặc trưng vừa
trích chọn với khuôn mẫu sinh trắc đã có trước.
- Ra quyết định: là thành phần chức năng khẳng định danh tính người dùng
(với hệ nhận dạng) dựa trên kết quả đối sánh của chức năng đối sánh có thể là một
câu trả lời đúng hoặc một câu trả lời sai về mẫu sinh trắc học so với khuôn mẫu sinh
trăc có từ trước (với hệ thẩm định).

1.1.4 Đánh giá hiệu năng và chất lượng hoạt động của hệ sinh trắc học
Một hệ sinh trắc học khi hoạt động thường gặp hai vấn đề về lỗi sau đây:
- Lỗi phát sinh khi đối sánh mẫu sinh trắc của hai người khác nhau nhưng
cho kết quả là của cùng một người. Lỗi này được gọi là loại bỏ sai (false reject hay
false match).
- Lỗi phát sinh khi đối sánh hai mẫu sinh trắc của cùng một người nhưng cho

kết quả sai, vì cho rằng là của hai người khác nhau. Lỗi này được gọi là chấp nhận
sai (false accept hay false nonmatch). Để đo lường mức độ lỗi của hệ thống sinh
trắc, các độ đo lường thường dùng được định nghĩa như sau:
- FMR (False Match Rate): còn gọi là FAR (False Accept Ratio) - Tỷ số
chấp nhận sai: cho biết tỉ lệ trả lời là đúng đối với dữ liệu vào là sai
- FNMR (False Nonmatch Rate): còn gọi là FRR (False Rejection Ratio) - Tỷ
số từ chối sai: cho biết tỉ lệ trả lời là sai đối với dữ liệu vào là đúng.
Một vấn đề là hai độ đo lường này có sự ràng buộc với nhau như sau: nếu FAR
cao thì FRR sẽ giảm tương đối và ngược lại. Mức độ chấp nhận được của FAR và


5

FRR tùy thuộc vào từng hệ xác thực sinh trắc cụ thể. Với hệ thống yêu cầu tính bảo
mật cao, và đặt nặng vấn đề an toàn của xác thực hơn sự tiện dụng của người dùng,
thì FAR sẽ nhỏ và FRR sẽ cao. Ngoài hai độ đo trên, người ta còn sử dụng độ đo
FTC (Failure To Capture - thu nhận mẫu thất bại) và FTE (Failure to Enroll - chấp

nhận mẫu thất bại) để đánh giá hiệu năng của hệ xác thực sinh trắc học.
Hình 1.1: Biểu đồ minh họa của FAR, FRR và ERR

1.2 Các phương pháp tiền xử lý trích đặc trưng của mống mắt
1.2.1 Phân đoạn ảnh
Giai đoạn đầu tiên của nhận dạng mống mắt là cô lập khu vực mống mắt
thực tế ở hình ảnh mắt được biểu diễn dưới dạng số. Các khu vực mống mắt, thể
hiện trong hình 1.1, có thể xấp xỉ bằng hai vòng, một cho mống mắt/ màng cứng và
ranh giới khác, cho iris / ranh giới con ngươi. Mí mắt và lông mi thường hấp thụ các
phần trên và dưới của mống mắt khu vực. Và chúng ta cần kỹ thuật cần thiết để cô
lập và loại trừ những điểm không rõ ràng và cũng như là định vị các khu vực mống
mắt.



6

1.2.1.1 Biến đổi Daugman
Biến đổi Daugman sử dụng một toán tử vi tích phân với mục đích định vị
cho vòng tròn của mống mắt và vòng tròn của con ngươi, và cũng là vòng cung của
mí mắt trên và dưới. Các toán tử vi tích phân được định nghĩa là:

max(r,x

0 ,y0 )

G (r)*


r

I (x,y)
 x0 ,y0 2 r ds

(1.1)

Ở đây I(x, y) là hình ảnh mắt, r là bán kính tìm kiếm, Gσ(r) là Gaussian chức
năng làm mịn các điểm ảnh phân đoạn, và

s là các đường viền của hình tròn cho

trước bằng r, x0, y0. Các toán tử tìm kiếm đường tròn tại điểm có sự thay đổi lớn
nhất trong các giá trị của các điểm ảnh, bởi cách thay đổi bán kính và tâm vị trí x,y

của đường viền tròn. Phép toán được áp dụng lặp đi lặp lại nhiều lần và làm mịn
dần dần để việc phân vùng được chính xác. Mí mắt được phân vùng trong một cách
tương tự, với đường tích phân theo chu tuyến thay đổi từ vòng tròn đến một vòng
cung.
Các phép tính vi tích phân có thể được xem như là một biến thể của Hough
biến đổi, vì nó sử dụng các dẫn xuất đầu tiên của hình ảnh và thực hiện tìm kiếm để
tìm thông số hình học. Do nó có thể hoạt động với thông tin gốc, nó không bị các
vấn đề ngưỡng của Hough biến đổi. Tuy nhiên, thuật toán có thể cho kết quả không
chính xác khi có nhiễu trong các hình ảnh của mắt, chẳng hạn như từ sự phản xạ
ánh sáng bên ngoài v.v.

1.2.2 Chuẩn hóa ảnh
Khi một vùng mống mắt được xác định từ các mẫu mắt đầu vào, bước tiếp
theo cần biến đổi vùng mống mắt thành một số đặc trưng cố định được sắp xếp theo
trình tự nhất định để thực hiện quá trình so sánh và tìm kiếm sau này. Các đặc trưng
của vùng mống mắt có thể thay đổi bởi nguyên nhân chính là sự co giãn của con
người khi ánh sáng thay đổi cũng như các khác biệt khác, bao gồm khoảng cách


7

trong ảnh và góc quay của máy chụp ành, và góc quay của mắt. Quá trình chuẩn hóa
các hỉnh ảnh của mống mắt được thực hiện tại vùng xác định mống mắt mà ở đó có
các chiều được cố định sao cho hai ảnh của cùng một mắt dưới điều kiện ánh sáng
khác nhau sẽ có đặc tính giống nhau trong sự phân tập của vị trí.
Một điểm khác cần được chú ý là con ngươi thường không nằm ở vị trí trung
tâm của mống mắt, và nó thường nằm lệch đi một ít. Điều này phải được tính toán
cụ thể để việc chuẩn hóa các vòng đệm được chính xác hơn và phải có một bán kính
xác định rõ ràng.


1.2.2.1 Mô hình Daugman’s Rubber Sheet (DHRS)
Mô hình đồng nhất được phát minh bởi Daugman [1] để thực hiện ánh xạ lại
mỗi điểm trong mống mắt, để một cặp tọa độ cực (r, θ) trong đó r là trong khoảng
[0, 1] và θ là góc [0,2π] như Hình 1.2.

Hình 1.2: Quá trình chuẩn hóa từ tọa độ đề cát sang tọa độ cực

Thực hiện ánh xạ các vùng của mống mắt từ tọa độ đề cát sang hệ tọa độ cực
chuẩn để biễu diễn ảnh mống mắt theo như mô hình bên dưới:
I (x(r, ), y(r, ))  I (r, )

với

(1.2)


8

Ở đây (x, y) là tọa độ hình ảnh của mống mắt, (x, y) là tọa độ Đề cát , (r, θ)
là tọa độ cực tương ứng, và tọa độ của con ngươi và mống mắt được ranh giới theo
hướng θ. Các vùng ảnh trong mô hình Daugman’s Rubber Sheet sẽ chứa thông tin
về các vùng cong của con ngươi với kích thước không đồng nhất để cung cấp một
các mẫu chuẩn với kích thước không đổi. Bằng cách này, các vùng mống mất được
mô hình hóa như một tấm "cao su" linh hoạt tại ranh giới với trung tâm con ngươi là
điểm tham chiếu.
Mặc dù mô hình Daugman’s Rubber Sheet cho phép loại bỏ ảnh hưởng của
sự co giãn của con ngươi, khoảng cách chụp ảnh và sự dịch chuyển không đồng tâm
của con ngươi, nó không bù đắp cho sự khác biệt giữa góc dịch chuyển xoay. Trong
hệ thống Daugman, dịch chuyển xoay được xác định trong suốt quá trình so sánh
bởi quá trình dịch chuyển các mẫu mống mắt theo hướng θ cho đến khi hai tròng

mắt mẫu được liên kết với nhau.

Hình 1.3: Quá trình chuẩn hóa mô hình Daugman’s Rubber Sheet


9

Một số lượng điểm không đổi được lấy mẫu dọc theo mỗi bán kính r' (hình
1.2), vì vậy số điểm dữ liệu được tách ra sẽ không đổi, bất chấp kích thước dài hoặc
ngắn của bán kính r' tại phần góc. Quá trình lấy mẫu được thực hiện bằng cách truy
tìm lại nhưng những tọa độ đề cát của điểm dữ liệu từ bán kính và góc pha của các
mẫu được chuẩn hóa. Từ vành của vùng mống mắt, quá trình chuẩn hóa được lưu
lại dưới dạng ma trận 2D với trục nằm ngang đại diện cho góc pha, và trục nằm dọc
đại diện cho bán kính. Một ma trân 2D khác được tạo ra để đánh giấu sự tương
phản, lông mi, mi mắt được nhận ra trong quá trình phân đoạn. Cuối cùng, để loại
bỏ các vùng dữ liệu không thuộc mống mắt từ sự sai sót của quá trình chuẩn hóa,
các điểm dữ liệu nằm trong vùng giao nhau của con ngươi và vùng giao của mống
mắt được loại bỏ. Như vậy ở mô hình DHRS giúp loại bỏ những khác biệt do dịch
chuyển gây ra để tạo ra các đặc trưng chuẩn nhằm thực hiện quá trình so sánh một
cách chính xác nhất.
Trên hình trên Hình 1.3, kết quả của quá trình chuẩn hóa sẽ là ảnh 2D với độ
phân giải bán kính mống mắt (r) tương ứng 10 điểm ảnh và độ phân giải của góc ()
tương ứng với 40 điểm ảnh.

1.2.3 Quá trình mã hóa đặc trưng
Để quá trình nhận dạng các cá thể được thực hiện chính xác, cần thực hiện
trích trọn các đặc trưng quan trọng nhất từ các mẫu mống mắt. Các đặc trưng quan
trọng của mống mắt được mã hóa sao cho việc so sánh giữa các mẫu có thể thực
hiện nhanh chóng và chính xác.
Những mẫu được tạo ra trong tiến trình mã hóa đặc trưng sẽ được so sánh

theo một phương pháp được lựa chọn trước cho phép "đo lường" mức độ khác biệt
giữa 2 mẫu mống mắt.

1.2.3.1 Mã hóa Wavelet
Biến đổi wavelet có thể sử dụng để phân tích những dữ liệu trong mống mắt
thành 2 phần với các mức độ phân giải khác nhau. Wavelet có nhiều ưu điểm so với


10

biến đổi Fourier (mô tả dữ liệu trong miền tần số) vì các đặc trưng được mô tả trong
miền tần số và miền không gian nên quá trình so sánh các mẫu sẽ chính xác hơn.
Các bộ lọc wavelet còn được gọi là các dải wavelets được sử dụng để phân tích hình
ảnh mống mắt. Kết quả phân tích là các wavelets sẽ được mã hóa theo thứ tự tạo
nên các đặc trưng mô tả hình ảnh mẫu mống mắt.

1.2.3.2 Bộ lọc Gabor
Bộ lọc Gabor được dùng để cung cấp tối ưu các đại diện của tín hiệu trong
không gian và tần số phân tập. Một bộ lọc gabor được xây dựng bằng các điều chế
sóng sin/cosin với một hàm Gaussian. Kết quả có thể cung cấp tối ưu định vị kết
hợp trong cả không gian và thời gian (sóng sin cho phép xác định chính xác vị trí
trong miền tần số nhưng không xác định vị trí trong miền không gian). Quá trình
phân tích tín hiệu được hoàn thành bằng việc sử dụng các cặp trực giao của bộ lọc
Gabor, với phần thực bằng những điều chế cosin với hàm Gaussian, và phần ảo bởi
hàm sin điều chế với Gaussian. Phần thực và ảo của bộ lọc cũng được biết như phần
đối xứng chẵn và lẻ của các thành phần cấu tạo thành. Tấn số trung tâm của bộ lọc
được định danh bởi tần số của sóng sin và cosin và băng thông của bộ lọc được xác
định bằng độ rộng của hàm Gaussian. Daugman sử dụng phiên bản 2D của bộ lọc
Gabor theo thứ tự để mã hóa các mẫu mống mắt. và bộ lọc Gabor 2D qua những
điểm (x,y) được biểu diễn như sau [1]:


G( x , y )  e

2
  x  x0  / a2 ( y  y0 )2 /  2  2 i u  x  x   v ( y  y )
0
0
0 


 0

e

(1.3)

Ở đây (Xo,Yo) là vị trí của ảnh, (α,β) là độ rộng hiệu dụng và độ dài hiệu dụng, và
(u0, v0) điều chế mà tần số phân tập ω 0 = squar(u2 + v2). Bộ lọc Gabor 2D chẵn
và lẻ được biểu diễn trong hình 1.4.


11

a)

b)
Hình 1.4: Cặp bộ lọc Gabor 2D trực giao

a) Thành phần thực hay bộ lọc đối xứng chẵn đặc trưng bởi một cosin điều chế bởi
một Gaussian

b) Thành phần ảo hay bộ lọc đối xứng lẻ đặc trưng bởi một sin điều chế bởi một
Gaussian.
Giải điều chế đầu ra của các bộ lọc Gabor để nén dữ liệu.
Điều này được thực hiện bằng lượng tử thông tin giai đoạn thành bốn cấp độ,
cho mỗi góc phần tư trong mặt phẳng phức. Oppenheim và Lim đã chứng minh rằng
thông tin về pha, chứ không phải là thông tin biên độ cung cấp là quan trọng nhất
trong việc nhận dạng một hình ảnh [19]. Dựa trên thông tin về pha của ảnh sẽ cho
phép mã hóa phân biệt thông tin trong mống mắt, đồng thời loại bỏ các thông tin dư
thừa như mức độ chiếu sáng, được đại diện bởi các thành phần biên độ.
Bốn cấp độ được biểu diễn bằng hai bit dữ liệu, vì vậy mỗi điểm ảnh trong
mẫu mống mắt chuẩn hóa tương ứng với hai bit dữ liệu trong mống mắt mẫu. Tổng
cộng có 2.048 bit được tính cho các mẫu, và một số lượng tương đương của các bit
tạo mặt nạ là để tạo ra mặt nạ ra vùng bị lỗi trong vòng mống mắt. Điều này tạo ra
một mẫu nhỏ 256-byte, cho phép lưu trữ hiệu quả và so sánh mống mắt một các
nhanh chóng. Hệ thống Daugman sử dụng các tọa độ cực cho việc chuẩn hóa, do đó
các bộ lọc được mô tả như sau:


12

2
2
2
2
 i  
H(r, )  e  0  e (r r0 ) /  e i ( 0 ) / 

(1.4)

Ở đây (α,β) là độ rộng hiệu dụng và độ dài hiệu dụng và (r0 , θ0) là tần số

trung tâm của bộ lọc.
Phương pháp giải điều chế và giai đoạn quá trình lượng tử có thể được biểu
diễn như sau:
2

h {Re,Im}  sgn{Re,Im}   I (  ,  )ei (0  )e(r0   )

/ 2

e(0  )

2

/2

pdpd

(1.5)

 

Ở đây h {Re, Im} liên quan đến giá trị phức bao gồm cả giá trị thực và ảo
được độc lập trên ký hiệu của quá trình tích phân 2D và I (φ, ρ) là các mẫu ảnh gốc
trong hệ trục tọa độ phân cực.

1.2.3.3 Bộ lọc Log-Gabor
Một điểm bất thuận lợi của bộ lọc Gabor là những điểm đối xứng chẵn của
bộ lọc sẽ có thành phần DC khi băng thông lớn hơn một octave. Tuy nhiên thành
phần DC sẽ có giá trị bằng 0 khi sử dụng bộ lọc Gabor với hàm Gaussian trên
không gian logarithmic, đây chính là bộ lọc Log-Garbor. Đặc tuyến tần số tương

ứng của bộ lọc Log Gabor được đưa ra bởi công thức sau:

 (log(f/ f0 ))2
G( f )  exp 
 2(log( / f ))2

0





(1.6)

Trong đó f0 đại diện cho tần số trung tâm, và σ cho băng thông của bộ lọc.

1.3 Các nghiên cứu liên quan
Hệ thống nhận dạng sinh trắc học là một hệ thống được sử dụng rộng rãi trong
lĩnh vực khác nhau. Hệ thống nhận dạng dựa trên đặc điểm mống mắt được nghiên
cứu và sử dụng trong nhiều thập kỷ qua. Các hệ thống này vẫn đang được cải tiến
và phát triển hướng tới việc hỗ trợ truy xuất khối lượng lớn dữ liệu nhanh chóng và
dễ dàng. Các kết cấu độc đáo của mống mắt có tất cả các đặc điểm sinh trắc học


13

như độ chính xác, năng thu hồi, xáo trộn, tuổi thọ, tính phổ biến, đảm bảo an ninh
hơn và không khả thi để mạo danh. Và có rất nhiều hướng nghiên cứu nhằm đạt
được hiệu năng cao hơn và độ bảo mật tốt hơn trong quá trình nhận diện khuôn mặt
dựa vào mống mắt

Một số đề tài, bài báo được liệt kê dưới đây để đánh giá về thực trạng nghiên
cứu thực tại:
[1] Cơ sở dữ liệu ảnh đen trắng, để xác thực và đo hiệu năng của thuật toán
nhận dạng:
- Thuật toán phân đoạn, sẽ phân biệt mắt và mí mắt. Tự động hóa phân
đoạn được đề cập thông qua sử dụng vòng tròn biến đổi.
- Các vùng mống mắt được phân đoạn (mảnh) được chuẩn hóa để loại bỏ
sự mâu thuẫn các chiều giữa các vùng trong mống mắt, nó được thực thi bởi
một số model như model Daugmam' rubber (đã phân tích ở trên).
- Các đặc trưng của mống mắt được mã hóa bằng lọc vùng mống mắt được
chuẩn hóa với bộ lọc 1D Log-Gabor và lượng tử pha ở đầu ra theo thứ tự để
xuất ra một mẫu sinh trắc học theo từng phân tử bits.
[2] Tài liệu đánh giá về phương pháp phân loại dựa vào kernel (kernel-based
classifer).
[3],[4] Tài liệu nghiên cứu đánh giá về phương pháp nhận dạng mống mắt
kết hợp với kỹ thuật máy vector hổ trợ và kỹ thuật chuỗi markov ẩn.
[5] Tài liệu đề cập về cách sử dụng bộ lọc Gabor để trích xuất đặc trưng và
để đánh giá khả năng nhận dạng qua việc trích xuất đặc trưng của 1/2 mống
mắt và kết hợp với kiểu phân loại SVM
[11] Tài Liệu nghiên cứu về nhận dạng mống mắt thông qua mạng nơ tron

1.4 Lý do chọn đề tài


14

Hiện nay các hệ thống sinh trắc học đã cung cấp việc nhận dạng cá thể một
cách tự động dựa trên một số đặc tính đặc biệt sở hữu bởi cá thể đó. Các hệ thống
sinh trắc học đã được nghiên cứu và phát triển dựa trên vân tay, khuôn mặt, giọng
nói, chữ viết tay, võng mạc, và một trong những đặc tính sử dụng để nhận dạng

được trình bày trong đề tài này là nhận dạng mống mắt.
Các hệ thống sinh trắc học sẽ thu nhận một mẫu chứa các đặc tính nói trên,
chẳng hạn như ghi lại tín hiệu âm thanh số cho nhận dạng giọng nói, hoặc dùng một
ảnh màu kỹ thuật số cho nhận dạng khuôn mặt. Các mẫu sau đó được chuyển đổi
bằng cách sử dụng một số công cụ toán học. Hầu hết các hệ thống sinh trắc học cho
phép hai chế độ hoạt động. Một chế độ phân loại các mẫu để lưu vào cơ sở dữ liệu,
và một chế độ nhận dạng, nơi mà một mẫu được tạo ra cho một cá nhân và sau đó
được tìm kiếm trong cơ sở dữ liệu của các mẫu đã học.
Đặc điểm sinh trắc học mống mắt là một trong những phương pháp sinh trắc học
hiệu quả nhất và đáng tin cậy trong việc chứng thực các cá thể khác nhau, do đặc
điểm bất biến với độ tuổi của cá thể nhận dạng. Kỹ thuật xử lý hình ảnh có thể
được sử dụng để trích xuất các mẫu mống mắt từ hình ảnh số của mắt và mã hóa nó
thành một bản mẫu sinh trắc học, có thể được lưu trữ trong cơ sở dữ liệu. Các mẫu
trắc học được đại diện bởi đại lượng toán học để lưu trữ thông tin duy nhất từ mẫu
mống mắt, và cho phép thực hiện phép so sánh các mẫu sinh trắc.
Kỹ thuật nhận dạng mống mắt được phân loại theo ba nhóm: giai đoạn, kết cấu
và phương pháp dựa vào kernel. Các phương pháp dựa vào kernel được chứng minh
là tốt nhất cho IRIS. Trong đề tài này sử dụng kỹ thuật phân loại dựa trên khoảng
cách Hamming và kernel của SVM. Khi một hình ảnh được nhóm lại như là một
trong các nhóm bằng SVM, nó có thể được phân loại để được nhận dạng bởi một số
mô hình như mô hình Markov ẩn (HMM).
Với sự gia tăng của bảo mật dữ liệu, các mẫu sinh trắc được giới thiệu trong rất
nhiều ứng dụng bảo mật, bao gồm mẫu giọng nói, mẫu mống mắt, mẫu vân tay, và


15

tất cả những khía cạnh khác nhau của mống mắt được xem xét để được tin tưởng,
riêng biệt nhất của từng cá thể. Việc nâng cao tốc độ và hiệu quả trong quá trình
nhận dạng là điều rất quan trọng. Hầu hết phương thức được chấp nhận và sử dụng

rộng rãi cho kỹ thuật nhận dạng sinh trắc là phương thức dựa vào kernel. Phương
thức dựa vào kernel là phương thức lọc ở cấp độ cao. Ảnh, dữ liệu theo thời gian,
được biểu diễn tại điểm trong không gian chiều thứ n, và mỗi điểm được phân loại
đến một vài tiền phân loại chi tiết bằng cách sử dụng tính năng phân biệt ứng xử.
Phương pháp dựa vào Kernel là phương thức nhận dạng mẫu cơ bản mà ở đó tính
năng phân biệt ứng xử dược cấu trúc lại bởi các hàm hổ trợ từ hạt nhật của kernel
đó.
Phương thức nhận dạng mẫu chiều thấp dựa trên một số kỹ thuật nổi tiếng như
Phân tích thành phần nguyên tắc PCA, phân tích biệt tuyến tính (LDA), phân tích
thành phần độc lập… không thể thỏa mãn hiệu năng nhận dạng các mẫu, mô hình
mới trong nhận dạng mẫu chẳng hạn như phương pháp hạt nhân kernel thúc đẩy bởi
những lý thuyết học thống kê, nhấn mạnh các ánh xạ phi tuyến từ một không gian
dữ liệu vào không gian đặc trưng.


16

Chương 2 - NGHIÊN CỨU GIẢI THUẬT PHÂN LOẠI VÀ
NHẬN DẠNG MỐNG MẮT

2.1 Kỹ thuật phân loại dựa vào khoảng cách Hamming
Khoảng cách Hamming là một thước đo sự gống nhau giữa hai mẫu tín hiệu
số. Sử dụng khoảng cách Hamming của hai mẫu bit, so sánh với ngưỡng, có thể đưa
ra quyết định về mức độ giống nhau giữa hai hình ảnh (mống mắt) vì thế khoảng
cách Hamminh có thể được sử dụng trong các hệ thống nhận dạng.
Khoảng cách Hamming giữa các mẫu bit X và Y là HD, được định nghĩa như
là tổng bit không hợp lệ (tổng của các XOR giữa X và Y) chia cho N (tổng số bit
trong mẫu bit)

1 N

HD   X j (XOR) Yj
N j 1

(2.1)

Nếu hai mẫu bits là hoàn toàn độc lập, chẳng hạn như mống mắt mẫu tạo từ
một mẫu mống mắt khác, khoảng cách Hamming giữa hai mẫu phải bằng 0,5. Điều
này xảy ra bởi tính độc lập các bit trong hai mẫu: xác suất để bít có giá trị là 1 hoặc
0 là 0,5. Do đó, một nửa trong số các bit sẽ đồng ý và một nửa sẽ không đồng ý giữa
hai mẫu. Nếu hai mẫu có nguồn gốc từ cùng một mống mắt, khoảng cách Hamming
giữa chúng sẽ được gần 0.0, vì chúng liên quan chặt chẽ và các bit giống nhau giữa
hai mã mống mắt.
Khoảng cách Hamming là thước đo phù hợp để kết hợp với thuật toán
Daugman, và tính toán khoảng cách Hamming được thực hiện chỉ với các bit được
tạo ra từ vùng mắt đã được phân biệt.

2.2 Kỹ thuật phân loại dựa vào mạng nơron
Mô hình mạng thần kinh nhân tạo mạng nơ-ron trong não đã được chứng
minh hiệu quả của họ trong một số ứng dụng như phân loại, dự đoán, nhận dạng


×