Tải bản đầy đủ (.pdf) (30 trang)

Mô hình tính toán cho nhận dạng ảnh vân lòng bàn tay

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.88 MB, 30 trang )

ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

VĂN THIÊN HOÀNG

MÔ HÌNH TÍNH TOÁN CHO
NHẬN DẠNG ẢNH VÂN LÒNG BÀN TAY

Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 62.48.01.01

TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN

TP. Hồ Chí Minh năm 2016


Công trình được hoàn thành tại: Khoa Công Nghệ Thông Tin,
Trường Đại Học Khoa Học Tự Nhiên

Người hướng dẫn khoa học: TS. Lê Hoàng Thái
TS. Đinh Bá Tiến

Phản biện 1: GS. TS. Nguyễn Thanh Thủy
Phản biện 2: PGS. TS. Lý Quốc Ngọc
Phản biện 3: TS. Lê Thành Sách
Phản biện độc lập 1: PGS. TS. Huỳnh Trung Hiếu
Phản biện độc lập 2: PGS. TS. Phạm Thế Bảo

Luận án sẽ được bảo vệ trước Hội đồng chấm luận án họp tại
Trường Đại Học Khoa Học Tự Nhiên


Vào lúc

giờ, ngày 25 tháng 03 năm 2016

Có thể tìm hiểu luận án tại thư viện:
-

Thư viện Khoa học Tổng hợp Tp.HCM
Thư viện Trường Đại học Khoa học Tự Nhiên


MỞ ĐẦU
1. Động cơ nghiên cứu
Ngày nay, sự phát triển nhanh chóng của các ứng dụng thương mại
điện tử đặt ra nhu cầu dạng cá nhân tin cậy và tự động để kiểm soát an
ninh hiệu quả. Nhận dạng cá nhân tự động truyền thống thường sử
dụng chìa khóa, thẻ định danh, mật khẩu, … Tuy nhiên, chìa khóa
hoặc thẻ định danh dễ bị lấy cắp, còn mật khẩu thì dễ bị quên hoặc bị
tấn công dự đoán. Nhận dạng cá nhận dựa vào đặc trưng sinh trắc học
(như ảnh dấu vân tay, ảnh gương mặt, vân lòng bàn tay, hình dạng bàn
tay, dáng đi, …) có thể khắc phục nhược điểm của phương pháp
truyền thống. Vân lòng bàn tay độ phân giải thấp (<150DPI) là đặc
trưng sinh trắc học mới. Ảnh vân lòng bàn tay có những ưu điểm như:
tính phân biệt cao giữa các cá nhân ngay cả với các cặp sinh đôi, hiệu
quả về giá cả, thân thiện trong việc lấy mẫu, độ chính xác cao và có
tính an toàn cao (khó giả mạo). Hơn nữa, khi so sánh với đặc trưng
sinh trắc học khác ví dụ vân tay, thì lòng bàn tay có bề mặt lớn hơn
nên có nhiều đặc trưng hơn, do đó, có tính phân biệt cao hơn. Tuy
nhiên, vân lòng bàn tay có nhiều thách thức như:



Lòng bàn tay có thể xuất hiện thêm nếp nhăn theo thời gian.



Hình dạng bàn tay bị ảnh hưởng khi trọng lượng cơ thể thay đổi.



Lòng bàn tay có thể xuất hiện thêm sẹo, vết thương, nốt ruồi,…

-1-




Ảnh vân lòng bàn tay chịu sự tác động của ánh sáng đèn vì các
tư thế đặt lòng bàn tay mỗi lần lấy mẫu luôn khác nhau.

Vì vậy, việc nghiên cứu các mô hình tính toán cho các giai đoạn xử lý
của bài toán nhận dạng vân lòng bàn tay là cần thiết. Điều này góp
phần xây dựng thành công hệ thống nhận dạng vân lòng bàn tay và
ứng dụng hệ thống này trong thực tế như hệ thống chấm công, điểm
danh học sinh, kiểm soát an ninh vào/ra công ty… Đây là đề tài có
tính thời sự, có ứng dụng thực tiễn.
Có nhiều phương pháp đã được đề xuất cho nhận dạng vân lòng bàn
tay. Một số phương pháp tiêu biểu được công bố đạt độ chính xác cao
trên cơ sở dữ liệu công khai PolyU của đại học Bách khoa Hong Kong
trước năm 2010 là:



Nhóm tác giả Zhang (đặc trưng PalmCode, 2003): 98% tỉ lệ
chấp nhận đúng với 0.04% tỉ lệ chấp nhận sai cho bài toán xác
thực cá nhân (so sánh 1-1). 97% tỉ lệ chấp nhận đúng với 0.1 tỉ
lệ chấp nhận sai cho bài toán định danh (so sánh 1-100).



Nhóm tác giả Kong (đặc trưng CompCode, 2004): 98.4% tỉ lệ
chấp nhận đúng với 0.000003% tỉ lệ chấp nhận sai cho bài toán
xác thực (so sánh:1-1).



Nhóm tác giả Kong (đặc trưng FusionCode, 2006): 96.33% tỉ lệ
chấp nhận đúng với tỉ lệ chấp nhận sai là 0.0138% cho bài toán
định danh (so sánh 1-488 đối tượng).

-2-




Nhóm tác giả Jia (đặc trưng RLOC, 2008): 98.37% tỉ lệ chấp
nhận đúng với 0.00004% tỉ lệ chấp nhận sai cho bài toán xác
thực (so sánh 1-1).

Ngoài ra, trong nước có nhóm tác giả Hoàng Lan (2010) công bố đạt
89.64% tỉ lệ chấp nhận đúng với 0.0% tỉ lệ chấp nhận sai cho bài toán
định danh (so sánh 1-100) trên cơ sở dữ liệu công khai CASIA của

trung tâm nghiên cứu an ninh dựa vào sinh trắc học của Trung Quốc.
Từ những khảo sát trên, chúng tôi nhận thấy bài toán định danh vân
lòng bàn tay (so sánh 1-N đối tượng) còn nhiều thách thức trong việc
phát triển thuật toán đạt độ chính xác cao hơn, đặt biệt đảm bảo nhận
dạng trong thời gian thực với cơ sở dữ liệu lớn.
2. Mục tiêu và phạm vi nghiên cứu
Mục tiêu và phạm vi nghiên cứu của đề tài là xây dựng mô hình tính
toán để giải quyết thành công bài toán định danh vân lòng bàn tay
được thu nhập từ thiết bị có gờ hướng dẫn đặt bàn tay.
3. Các đóng góp chính của luận án
Luận án đã có những đóng góp mới về mặt khoa học như sau:


Đóng góp thứ nhất: Đề xuất ra mô hình tính toán GridLDA để
rút trích đặc trưng toàn cục ảnh vân lòng bàn tay [CT5].



Đóng góp thứ hai: Đề xuất mô hình tính toán kết hợp đặc trưng
toàn cục và cục bộ sử dụng hàm lọc Gabor wavelet và
GridLDA, gọi là G-GridLDA [CT5]. Sau đó, đề xuất mô hình
-3-


tính toán kết hợp lọc MFRAT và GridLDA, gọi là M-GridLDA
[CT2], [CT3]. M-GridLDA rút trích đặc trưng có nhiều ưu điểm
hơn so với G-GridLDA.


Đóng góp thứ ba: Đề xuất mô hình tính toán phức trong việc

phát hiện các vùng đối xứng trên trường hướng gấp đôi cho bài
toán phát hiện đặc trưng điểm lõi trong vân ngón tay [CT4]. Từ
đó, luận án tiếp tục đề xuất bộ lọc phức để phát hiện đặc trưng
đường cơ bản của vân lòng bàn tay. Đặc trưng này được áp
dụng trong việc tìm kiếm thô nhằm thu hẹp không gian so khớp
tinh khi nhận dạng trên cơ sở dữ liệu lớn [CT1].

Chương 1.

TỔNG QUAN

1.1 Tổng quan về hệ thống nhận dạng vân lòng bàn tay
Vân lòng bàn tay độ phân giải thấp (<150dpi) bắt đầu được nghiên
cứu và ứng dụng trong các hệ thống nhận dạng cá nhân với mục đích
dân sự cách đây khoảng 15 năm. Đặc trưng chủ yếu được các cộng
đồng nghiên cứu sử dụng là các đường cơ bản, nếp nhăn và mẫu kết
cấu vân (Hình 1-1).

Hình 1-1 Ảnh độ phân giải thấp và các đặc trưng vân lòng bàn tay.

-4-


Bài toán nhận dạng sinh trắc học nói chung và bài toán nhận dạng vân
lòng bàn tay có 2 loại: Bài toán xác thực và bài toán định danh.


Bài toán xác thực là kiểm tra xem ảnh truy vấn có phải là của
cá nhân tương ứng với định danh hay không.




Bài toán định danh là xác định xem trong cơ sở dữ liệu có
ảnh huấn luyện của một cá nhân giống với ảnh truy vấn hay
không.

Hình 1-3 Các thành phần của hệ thống nhận dạng vân lòng bàn tay

Nhìn chung, hệ thống nhận dạng vân lòng bàn tay gồm năm thành
phần xử lý: (1) thiết bị thu ảnh vân lòng bàn tay, (2) phân đoạn vùng
nhận dạng, (3) Trích chọn đặc trưng, (4) so khớp, và (5) cơ sở dữ liệu
(Hình 1-3).
1.1.1

Thiết bị thu nhận ảnh
Các nhà nghiên cứu thường sử dụng bốn kiểu thiết bị thu nhận

ảnh: Máy quay CCD, máy chụp ảnh kỹ thuật số, thiết bị quét ảnh kỹ
thuật số và máy quay kỹ thuật số. Các cơ sở dữ liệu được các nhà
nghiên cứu sử dụng phổ biến là cơ sở dữ liệu MultiSpectral và cơ sở
-5-


dữ liệu 2D-3D PolyU do trường đại học Công Nghệ Hong Kong công
bố. Các cơ sở dữ liệu này được tạo ra bằng máy quay CCD.
1.1.2

Phân đoạn vùng nhận dạng

Phân đoạn vùng nhận dạng là thiết lập hệ thống tọa độ nhằm canh

chỉnh các ảnh với nhau, từ đó phân đoạn ra vùng ảnh hợp lệ cho việc
nhận dạng, còn được gọi là vùng đặc trưng nhận dạng.
1.1.3

Trích chọn đặc trưng

Sau khi phân đoạn, vùng nhận dạng là đầu vào của giai đoạn rút trích
đặc trưng. Mục tiêu của giai đoạn này là tính toán cách biểu diễn đặc
trưng ảnh mà nó có tính tách lớp cao và có thể so khớp nhanh. Hơn
nữa, các đặc trưng này có khả năng chống lại nhiễu và sự biến đổi do
chiếu sáng. Các công trình đề xuất có giai đoạn này có thể được phân
loại thành bốn nhóm tiếp cận chính như sau: hướng tiếp cận dựa vào
không gian con, hướng tiếp cận dựa vào đường, hướng tiếp cận dựa
vào mã vân và hướng tiếp cận kết hợp.
1.1.4

So khớp

So khớp là so sánh đặc trưng của hai ảnh với nhau sử dụng các độ đo
khoảng cách và các kỹ thuật phân lớp.
1.1.5

Cơ sở dữ liệu

Bài toán định danh là bài toán so khớp 1-nhiều. Cần có giải pháp xử lý
lưu trữ dữ liệu đặc trưng vân lòng bàn tay hiệu quả với mục tiêu là độ
-6-


chính xác cao và tốc độ nhanh. Có ba giải pháp được các nhà nghiên

cứu sử dụng: gom nhóm phân cấp, phân lớp, và mã vân.
1.2 Phương pháp đánh giá hệ thống nhận dạng vân lòng bàn tay
1.2.1

Các độ đo hiệu quả nhận dạng

Để đánh giá hiệu quả của hệ thống nhận dạng vân lòng bàn tay, các độ
đo thường được sử dụng là tỉ lệ chấp nhận sai (FAR), tỉ lệ chấp nhận
đúng (GAR), tỉ lệ từ chối sai (FRR), (EER) tỉ lệ sai số tại đó
FRR=FAR.và đường cong ROC. Các tỉ lệ FAR, FRR càng nhỏ thì hệ
thống sinh trắc học càng lớn. Trong các hệ thống ứng dụng, giá trị
FAR thường thiết lập bằng 0, khi đó ta có độ đo là ZeroGAR.
ZeroGAR là giá trị lớn nhất của GAR khi đó FAR=0.
1.2.2

Phương pháp thực nghiệm định danh đối tượng

Để tính toán các độ đo hiệu quả nhận dạng chính xác đối tượng, chúng
tôi sẽ tính toán khoảng cách đúng và khoảng cách sai cho mỗi ảnh truy
vấn. Nếu khoảng cách sai bé hơn khoảng cách đúng thì kết quả truy
vấn là định danh sai hay mạo danh. Ngược lại, thì kết quả truy vấn là
định danh đúng. Như vậy, với mỗi truy vấn, đối tượng với khoảng
cách truy vấn nhỏ nhất nhận được cần xác định xem là mạo danh hay
là định danh đúng. Hệ thống sử dụng một ngưỡng định danh xác định
trước để ra quyết định nhận biết đúng đối tượng. Dựa vào các khoảng
cách này, chúng tôi đưa ra các ngưỡng khác nhau để đánh giá độ
chính xác của thuật toán. Tỉ lệ chấp nhận đúng GAR và tỉ lệ chấp nhận
-7-



sai FAR tương ứng đạt được với mỗi ngưỡng hay biểu đồ ROC là các
đại lượng dùng để đánh giá hiệu quả thuật toán.
1.2.3

Thiết lập tập huấn luyện và tập kiểm tra

Mô hình đề xuất có hai giai đoạn: (1) giai đoạn so truy tìm thô và (2)
giai đoạn so khớp tinh. Đối với giai đoạn so khớp tinh, luận án sử
dụng phương pháp Holdout để thiết lập tập huấn luyện và tập kiểm
tra. Đối với giai đoạn truy tìm thô, luận án sử dụng phương pháp xác
thực chéo K-fold để tạo tập dữ liệu huấn luyện và kiểm tra.
1.3 Xây dựng mô hình nghiên cứu
1.3.1

Mô hình tính toán kết hợp đặc trưng cục bộ và toàn cục

Hướng tiếp cận của luận án là xây dựng mô hình tính toán kết hợp đặc
trưng toàn cục và đặc trưng cục bộ.
1.3.2

Mô hình tính toán đặc trưng toàn cục cho nhận dạng thời
gian thực vân lòng bàn tay

Hướng tiếp cận của luận án là xây dựng mô hình tính toán phức cho
việc trích chọn đặc trưng đường cơ bản và áp dụng đặc trưng này vào
việc gom nhóm cơ sở dữ liệu.
1.4 Kết luận
Luận án đã khảo sát tổng quan các công trình nghiên cứu liên quan
đến từng giai đoạn xử lý của hệ thống nhận dạng vân lòng bàn tay, các
độ đo và các mô hình nghiên cứu được thực hiện trong luận án.

-8-


Chương 2.

MÔ HÌNH TÍNH TOÁN GRIDLDA CHO
PHÂN TÍCH TÁCH LỚP ẢNH VÂN LÒNG
BÀN TAY

2.1 Các kỹ thuật phân tích tách lớp tuyến tính
Kỹ thuật phân tích tách lớp tuyến tính (LDA) được sử dụng rộng rãi
trong việc phân lớp dữ liệu đặc trưng sinh trắc học bởi vì dữ liệu huấn
luyện thực tế của mỗi đối tượng là nhiều ảnh với nhiều tư thế khác
nhau. Luận án đã khảo sát, phân tích ưu nhược điểm của các mô hình
tính toán LDA theo sự phát triển của nó cho bài toán phân lớp ảnh
(Hình 2-1). Từ đó, luận án đề xuất ra mô hình phân tích tách lớp mới
GridLDA.

Hình 2-1 Sự phát triển của mô hình tính toán phân tích tách lớp tuyến tính cho phân
lớp đặc trưng ảnh.

2.1.1

Ma trận tương quan và ma trận hiệp phương sai

2.1.2

Mô hình tính toán LDA

LDA truyền thống hay 1D-LDA tìm không gian cơ sở sao cho nó

chuyển đổi dữ liệu đang được biểu diễn trong không gian hiện có sang
không gian mới có tính chất tách lớp dữ liệu cao hơn và có số chiều
nhỏ hơn. Nguyên tắc của mô hình này là chọn ra một số vector chiếu
để lập thành không gian cơ sở, sao cho các mặt phẳng này thỏa điều

-9-


kiện: Dữ liệu được chiếu lên nó phải tối đa phương sai giữa tâm các
lớp và tối tiểu phương sai giữa các phần tử trong lớp
2.1.3

Kỹ thuật giảm số chiều ma trận hiệp phương sai

Ma trận tương quan thông thường được tính bằng độ tương quan giữa
từng phần tử trong vector mà vetor này được tạo ra từ ma trận dữ liệu
đầu vào. Ma trận tương quan trong kỹ thuật giảm số chiều được tính
trực tiếp bằng độ tương quan giữa các cột của ma trận.
2.1.4

Mô hình tính toán 2DLDA

Mô hình tính toán 2DLDA xử lý trực tiếp dữ liệu ở dạng ma trận. Mô
hình tính toán 2DLDA là 1D-LDA với đầu vào là ma trận, trong đó
mỗi cột của ma trận đầu vào đóng vai trò là 1 đơn vị tính phương sai
của mỗi chiều trong 1D-LDA. 2DLDA có nhiều ưu điểm cho bài toán
phân lớp dữ liệu dạng ma trận như:


Ảnh không cần phải biến đổi sang dạng vector trước khi xử lý

như LDA



Ma trận hiệp phương sai có kích thước nhỏ.



Thông tin hình học của ảnh được lưu giữ trong mỗi đơn vị cột.

Tuy nhiên, 2DLDA vẫn còn có nhược điểm là:


2DLDA chỉ lưu giữ đặc trưng hình học của cột (hoặc dòng)



Mỗi chiều đại diện cho một cột (hoặc dòng), do đó, có thể xảy
ra trường hợp các chiều ít tương quan với nhau, nên sẽ khó khăn
trong việc giảm số chiều.

- 10 -


Hình 2-3 (a) Ảnh gốc với kích thước là 128 × 128 và (b)-(h) các ảnh tái tạo của
2DLDA lần lượt với số chiều d là 1, 5, 10, 20, 40, 80, 100.

2.1.5

Mô hình tính toán (2D)2LDA


Mô hình tính toán (2D)2LDA là thực hiện 2DLDA theo cột, rồi kết
quả sẽ là đầu vào của 2DLDA theo dòng. Hình 2-5 minh họa việc
giảm số chiều với d và q bằng nhau.

Hình 2-8 (a) Ảnh gốc và (b)-(h) các ảnh tái tạo của (2D)2LDA với d = q lần lượt là 1,
5, 10, 20, 40, 80, 100.

2.2 Mô hình tính toán đề xuất GridLDA
GridLDA được đề xuất nhằm nâng cao hiệu quả thực hiện của
2DLDA và (2D)2LDA bằng cách sử dụng các ảnh con làm đơn vị để
- 11 -


tính phương sai, đóng vai trò là một chiều trong không gian phân tích
tách lớp của LDA [CT5]. Các ảnh con này được tạo ra từ ảnh ban đầu
bằng cách lấy mẫu dạng lưới.
2.2.1

Định nghĩa

Ma trận đồng dạng cột a, a  R mn là ma trận có cột sau đồng dạng với
cột trước:
aik  sk  ai ,k 1 , k  2..n, i  1..m

(2.33)

Trong đó, hai cột k-1 và k là đồng dạng nhau nếu các phần tử tương
ứng của 2 cột cùng tỉ lệ sk với nhau.
2.2.2


Định lý (N.N. Abdelmalek , 1980)

A là ma trận m×n và B là ma trận n×m, với n≥m. n giá trị riêng của ma
trận BA là m giá trị riêng của AB và n-m giá trị riêng bằng 0.
2.2.3

Mệnh đề

Ma trận tương quan của ma trận đồng dạng cột có duy nhất một giá trị
riêng khác không. (chứng minh dựa vào định lý mục 2.2.2)
2.2.4

Trường hợp tối ưu của 2DLDA

Giả sử dữ liệu đầu vào của 2DLDA là các ma trận đồng dạng cột
(thỏa định nghĩa). Khi đó, các ma trận hiệp phương sai Sb và Sw của
các mẫu huấn luyện này cũng là các ma trận đồng dạng cột. Từ mệnh
đề, chúng ta có thể suy ra ma trận S w1Sb có duy nhất một giá trị
riêng. Đây là trường hợp tối ưu của 2DLDA trong việc giảm số chiều
- 12 -


(chỉ có 1 chiều). Dựa vào điều kiện tối ưu này của 2DLDA, chúng tôi
đề xuất mô hình tính toán mới GridLDA, trong đó, đề xuất phép biến
đổi cột tương đồng (CTD) để biến đổi ảnh đầu vào của 2DLDA tiến
tới thỏa mãn điều kiện của trường hợp tối của 2DLDA.

Hình 2-11 (a) Lược đồ khối của GridLDA, (b) chiến lược gom nhóm dạng lưới, và (c)
quá trình xử lý của việc gom nhóm theo lưới.


2.2.5

Đề xuất phép biến đổi ảnh CTD

Sau khi đề xuất một trường hợp tối ưu của 2DLDA, chúng tôi nghiên
- 13 -


cứu và tìm kiếm công cụ để biến đổi dữ liệu thỏa trường hợp tối ưu
này. Dựa vào công cụ lấy mẫu dạng lưới (Shan, 2008), chúng tôi đề
xuất phép biến đổi cột tương đồng (gọi tắt là CTD) để biến đổi ảnh
đầu vào thành ảnh có tính chất tiến tới thỏa mãn trường hợp tối ưu.
Hình 2-11 biểu diễn quá trình lấy mẫu dạng lưới, quá trình dịch lưới
cải tiến so với nhóm tác giả Shan và ảnh kết quả phép biến đổi CTD.
2.2.6

Thuật toán GridLDA

Thuật toán GridLDA xử lý gồm 2 giai đoạn: (1) Biến đổi ảnh đầu vào
bằng phép biến đổi ảnh CTD và (2) các ảnh kết quả giai đoạn (1) sẽ là
đầu vào của 2DLDA để tạo ra vector đặc trưng có tính tách lớp cao
với số chiều nhỏ (Hình 2-10a).

Hình 2-13 Kết quả xử lý của GridLDA: (a) ảnh gốc, (b) ảnh đồng dạng cột (phương
pháp biến đổi ảnh CTD), (b)-(f) ((h)-(l)) các ảnh tái tạo của 2DLDA (GridLDA)
tương ứng với d={5,15,25,45,75}.

2.2.7


Bàn luận

Mô hình tính toán GridLDA xem mỗi ảnh con là một đơn vị để tính
phương sai của một chiều trong LDA. Các ảnh con này là các cột của
ma trận kết quả của phép biến đổi CTD. Ma trận này tiến tới thỏa điều
kiện của trường hợp tối ưu của 2DLDA nên GridLDA tiệm cận trường
- 14 -


hợp tối ưu của 2DLDA. GridLDA có ưu điểm khi ma trận kết quả
phép biến đổi CTD tiến tới ma trận đồng dạng. Khi đó, cột sau đồng
dạng với cột trước. Đối với dữ liệu ảnh có mức xám biến đổi từ từ thì
các cột dễ tương đồng vì giá trị mức xám hai điểm ảnh thường biến
đổi nhỏ và giống nhau giữa các vùng. Ảnh vân lòng bàn tay có tính
chất như vậy. GridLDA có nhược điểm đối với ảnh có tính chất là: độ
lệch mức xám giữa hai điểm của các vùng khác nhau biến đổi khác
nhau (ví dụ như ảnh vân tay).
2.3 Kết luận
Chương này đã trình bày các mô hình tính toán LDA truyền thống và
mô hình tính toán đề xuất: GridLDA.

Chương 3.

MÔ HÌNH TÍNH TOÁN M-GRIDLDA CHO
NHẬN DẠNG VÂN LÒNG BÀN TAY

3.1 Mô hình tính toán kết hợp đặc trưng cục bộ và toàn cục
Mô hình tính toán được xây dựng trong luận án là mô hình tính toán
kết hợp đặc trưng cục bộ và toàn cục cho nhận dạng vân lòng bàn tay.
Lý do của sự kết hợp này là: (1) Mô hình tính toán đặc trưng cục bộ

trích chọn ra đặc trưng cục bộ ổn định để kháng nhiễu như sự chiếu
sáng, tư thế đặt lòng bàn tay, sự dịch chuyển, xoay. (2) Mô hình tính
toán đặc trưng toàn cục rút trích ra thông tin toàn cục ảnh với kích
thước nhỏ hơn và loại bỏ các thông tin nhập nhằng giữa các đối tượng.

- 15 -


Luận án sẽ trình bày các mô hình tính toán theo trình tự được phát
triển trong quá trình thực hiện luận án.

Hình 3-1 Các mô hình tính toán kết hợp đặc trưng cục bộ và toàn cục.

3.2 Mô hình tính toán G-GridLDA
Mô hình tính toán G-GridLDA được đề xuất nhằm kết hợp ưu điểm
của Gabor wavelet với GridLDA [CT5]. Bộ lọc Gabor wavelet (Hình
3-2) có ưu điểm là biểu diễn được thông tin cục bộ ổn định (đường
vân). GridLDA được áp dụng trên ảnh đường vân để trích chọn ra đặc
trưng toàn cục có kích thước bé và có tính tách lớp cao.

Hình 3-6 Minh họa bộ lọc Gabor wavelet với góc 90˚ và tầng số là 1.5

Hình 3-9 Minh họa mô hình tính toán G-GridLDA

- 16 -


G-GridLDA gồm có hai giai đoạn xử lý: (1) lọc đặc trưng đường sử
dụng bộ lọc Gabor wavelet và (2) trích chọn đặc trưng tách lớp với số
chiều nhỏ bằng GridLDA (Hình 3-3). Mô hình tính toán này có độ

chính xác cao, tuy nhiên nó vẫn còn tồn tại nhược điểm là độ phức tạp
tính toán cao. Hình 3-4 trình bày ảnh kết quả của G-GridLDA.

Hình 3-10 Kết quả xử lý kết hợp của Gabor Wavelet với GridLDA: (a) ảnh gốc, (b)
ảnh kết quả phép lọc Gabor Wavelet, (c) ảnh đồng dạng cột của ảnh (b), (d)/(e) các
ảnh tái tạo của 2DLDA/GridLDA ứng với d={5,15,25,45,75}. [CT5]

3.3 Mô hình tính toán M-GridLDA
Mô hình tính toán kết hợp GridLDA và MFRAT, gọi tắt là MGridLDA, được đề xuất nhằm cho kết quả nhận dạng đạt hiệu năng
cao [CT2], [CT3]. M-GridLDA gồm hai giai đoạn xử lý: (1) biểu diễn
đặc trưng hướng của đường vân và nếp nhăn thành hai ảnh riêng
(AHD và AHA) bằng một lần áp dụng bộ lọc MFRAT, và (2)
GridLDA được sử dụng để giảm số chiều hai ảnh hướng này để có
được tập đặc trưng tách lớp cao và kích thước nhỏ. Hình 3-13 minh
họa các bước thực hiện này.

- 17 -


Hình 3-13 Lược đồ minh họa các bước xử lý của phương pháp M-GridLDA trong
việc rút trích đặc trưng hướng tách lớp.
a

b

c

d

e


f

g

h

i

j

k

l

m

n

o

p

q

r

Hình 3-14 Đặc trưng HTL: (a) ảnh gốc, (b)-(f) các ảnh tái tạo của GridLDA trên ảnh
gốc với d={1, 5, 20, 80, 99}, (g) ảnh AHD, (m) ảnh AHA, (h)-(l), ((n)-(r)) tương ứng
là các ảnh tái tạo của GridLDA trên ảnh AHD, (AHA) với d={1, 5, 20, 80, 99}.


3.4 Kết luận
Chương này đã trình bày các mô hình tính toán G-GridLDA, và MGridLDA cho nhận dạng vân lòng bàn tay.

Chương 4.

MÔ HÌNH TÍNH TOÁN ĐẶC TRƯNG
TOÀN CỤC CHO NHẬN DẠNG THỜI GIAN
THỰC VÂN LÒNG BÀN TAY

4.1 Mô hình tính toán đặc trưng đường cơ bản
4.1.1

Hàm lọc phức
- 18 -


Hình 4-1 Trường hướng của các hàm lọc đối xứng: (a) z(1), (b) z(-1), và (c) z(-2)

Hàm lọc phức được biểu diễn bởi mô hình toán học sau:
z  m   eim

(4.1)

Trong đó, m là bậc của đa thức, i  1 . Hình 4-1 minh họa trường
hướng của các hàm lọc đối xứng. Các hàm lọc này thường được áp
dụng cùng với hàm lọc Gaussian g ở dạng công thức sau:
 x 2  y 2 
z  m  g  eim g  x, y   eim exp  
2 

 2 

(4.2)

Bộ lọc đối xứng này được áp dụng để phát hiện các vùng đặc trưng
đối xứng trong ảnh bằng công thức sau:
D TX  f , z  m  g 

trong đó,
4.1.2

,

2
 f x  if y  ,  x  iy m g  x , y 

(4.5)

là phép tích chập 2 chiều.

Đặc trưng đường cơ bản

Chúng tôi áp dụng hàm lọc phức để phát hiện đường cơ bản trong ảnh
vân lòng bàn tay [CT1]. Hình 4-2 minh họa cấu trúc hướng của đường
cơ bản giống cấu trúc hướng của hàm lọc phức. Hình 4-4b và 4-4e
biểu diễn các ảnh kết quả của hàm lọc phức này. Hình 4-4c và 4-2d
minh họa ảnh đặc trưng đối xứng (gọi tắt là VDX). Đặc trưng VDX
- 19 -



được sử dụng trong truy tìm thô tập ảnh ứng viên cho giai đoạn so
khớp tinh để nhận dạng đối tượng.

Hình 4-3 Minh họa (a) độ lớn hàm lọc Gabor, (b) độ lớn của hàm lọc Z(1), (c) ảnh
gốc, (d) ảnh trường hướng gấp đôi, và (e) ảnh trường hướng của hàm lọc Z(1).

Hình 4-4 Minh họa kết quả lọc ảnh: (a), (d) ảnh gốc, (b), (e) ảnh kết quả lọc đối xứng
với kích thước 128  128 , và (c), (d) ảnh kết quả lọc với kích thước 8  8 .

Hình 4-5 Xử lý biến đổi sang dạng mảng của đặc trưng VDX.

- 20 -


4.2 Nhận dạng nhanh dựa vào cơ sở dữ liệu được gom nhóm
Tổng thể thuật toán đề xuất cho nhận dạng vân lòng bàn tay được
trình bày trong Hình 4-6.

Hình 4-6 Tổng thể thuật toán nhận dạng ảnh vân lòng bàn tay đề xuất.

Hình 4-7 Minh họa kết quả gom 6 nhóm bằng thuật toán KMean: 6 ảnh biểu diễn 6
vector tâm của mỗi nhóm.

Thuật toán nhận dạng gồm có hai giai đoạn xử lý: (1) giai đoạn tìm
kiếm thô sử dụng đặc trưng VDX để tìm ra tập ứng viên và (2) giai
- 21 -


đoạn so khớp tinh dựa vào đặc trưng hướng tách lớp để nhận biết.
Trong giai đoạn tìm kiếm thô, cơ sở dữ liệu cần được gom nhóm trước

khi tìm kiếm trực tuyến. Hình 4-7 minh họa ảnh tâm của 6 nhóm
4.3 Kết luận
Chương này trình bày hàm lọc phức trong việc rút trích các đường cơ
bản cho việc truy tìm thô ảnh vân lòng bàn tay.

Chương 5.

THỰC NGHIỆM ĐÁNH GIÁ CÁC MÔ
HÌNH TÍNH TOÁN ĐỀ XUẤT

Chương này trình bày các kết quả thực nghiệm của từng mô hình tính
toán được đề xuất trong luận án. Các mô hình tính toán gồm có:
GridLDA, G-GridLDA, M-GridLDA, và mô hình tính toán phức. Hơn
nữa, một ứng dụng kiểm soát truy cập vào ra sử dụng các mô hình tính
toán được đề xuất trong luận án cũng được trình bày rõ. Hiệu năng
thực hiện của các thuật toán đề xuất được min họa tron hình 5-7, 5-10.

Hình 5-7 Biểu đồ ROC của đặc trưng HTL, CompCode và RLOC.

- 22 -


Hình 5-10 Biểu đồ ROC của nhận dạng có và không sử dụng tìm kiếm thô.

Hình 5-17 Minh họa kết quả định danh vào

Hình 5-18 Minh họa kết quả định danh ra

- 23 -



×