đại học quốc gia hà nội
khoa công nghệ
Vũ Đình Hoàng
Nhận dạng ảnh mặt ngời
trong điều kiện ánh sáng thay đổi
Ngành: Công nghệ thông tin
Cán bộ hớng dẫn: TS. Hà Quang Thụy
TS. Nguyễn Thanh Tùng
Hà nội 2002
1
Mục lục
lời nói đầu 3
chơng 1. Tổng quan về nhận dạng ảnh mặt ngời 5
1.1 Bài toán nhận dạng ảnh mặt ngời 5
1.1.1 Bài toán và các yêu cầu nhận dạng 5
1.1.2 Giải quyết bài toán từ quan điểm của lý thuyết nhận dạng 8
1.2 giải quyết vấn đề trong bài toán nhận dạng ảnh mặt ngời 9
1.2.1 Thu nhận dữ liệu 10
1.2.2 Biểu diễn đối tợng 12
1.2.3 Lập luận kết quả 14
1.3 hệ thống kỹ thuật nhận dạng ảnh mặt ngời 14
1.3.1 Qui trình công nghệ xử lý thông tin 15
1.3.2 Các vấn đề trong triển khai thực tế 16
1.3.3 Các ứng dụng điển hình 17
chơng 2. nhận dạng ảnh mặt ngời trong điều kiện ánh sáng
thay đổi 19
2.1 Phân tích các yếu tố ảnh hởng đến quá trình nhận dạng 19
2.1.1 ánh sáng 19
2.1.2 Các thay đổi hình học 19
2.1.3 Sai số do hệ thống 20
2.2 Các kỹ thuật giải quyết 20
2.2.1 Đa các thông tin về điều kiện môi tr
ờng vào mô tả đối tợng 20
2.2.2 Cách giải quyết dựa trên kỹ thuật khoảng cách tiếp xúc 24
2.2.3 Kết hợp các cách biểu diễn đối tợng khác nhau 26
Chơng 3. thuật toán nhận dạng trong điều kiện ánh sáng
thay đổi 32
3.1 Thuật toán so sánh khuôn mẫu dựa theo khoảng cách tiếp xúc
32
3.2 Thuật toán so sánh điểm đặc trng dựa theo khoảng cách tiếp
xúc 35
3.3 Kết hợp hai thuật toán so sánh trên 37
2
KÕt luËn 39
Tµi liÖu tham kh¶o 40
3
lời nói đầu
Nhận dạng mặt ngời bằng mắt là một phơng thức thông dụng rất hiệu quả và đạt
độ chính xác cao ngay cả trong trờng hợp có các thay đổi lớn bởi các tác nhân kích thích
trực quan do các điều kiện quan sát, diễn cảm, lão hóa và các tiêu khiển nh kính hoặc các
thay đổi kiểu tóc. Tuy nhiên việc xây dựng các hệ thống tự động thực hiện nhiệm vụ nhận
dạng này thông qua ảnh là rất khó khăn vì gặp phải các biến đổi quan trọng trong quá trình
định dạng ảnh.
Dới đây là một số bài toán có liên quan tới nhận dạng mặt ngời:
- Phát hiện đờng biên của mặt ngời trong một ảnh chụp toàn cảnh nào đó (tách
ảnh mặt ngời),
- Xác định ngời qua ảnh đã đợc tách nhờ đối sánh ảnh với ảnh của một tập hợp
ngời đã đợc quản lý nào đó (định danh ảnh),
- Phân tích các diễn cảm của mặt để biết đợc tình trạng của ngời trong ảnh tại
thời điểm chụp ảnh
Nhận dạng mặt ngời tự động là một công việc khó khăn bởi vì khả năng thay đổi
vốn có của quá trình định dạng ảnh trong giới hạn về chất lợng ảnh và trắc quang, hình
học, che lấp, thay đổi, và cải trang. Ngày nay tất cả các hệ thống nhận dạng mặt tự động
đang sử dụng chỉ có thể thực hiện trên các cở sở dữ liệu ảnh hạn chế trong giới hạn về cỡ,
tuổi, giới tính, và/hoặc chủng tộc và tuy nhiên, nhận dạng mặt tự động đợc thừa nhận là
tốt trong các môi trờng đợc điều khiển.
Khoá luận "Nhận dạng mặt ngời trong điều kiện ánh sáng thay đổi" có nội dung
khảo sát một số phơng pháp và kỹ thuật trong lĩnh vực nhận dạng ảnh, đợc chia thành ba
chơng:
Chơng 1 "Tổng quan về nhận dạng ảnh mặt ngời" trình bày một cách tổng quan
về các nhiệm vụ của hệ thống nhận dạng mặt: Mô tả bài toán, cách giải quyết bài toán theo
quan điểm của lý thuyết nhận dạng và các hệ thống triển khai thực tế. Nội dung của
ch
ơng đợc chia làm 3 phần. Phần thứ nhất mô tả bài toán nhận dạng ảnh mặt ngời,
trình bày các điều kiện bài toán, các yêu cầu nhận dạng và giải quyết bài toán theo quan
điểm của nhận dạng. Phần thứ hai giải quyết các vấn đề trong bài toán nhận dạng, đa ra
các quy trình mà một hệ thống nhận dạng tuân theo. Phần thứ ba mô tả hệ thống kỹ thuật
trong bài toán nhận dạng ảnh mặt ngời, trình bày các quy trình xử lý thông tin, các vấn đề
triển khai thực tế và các ứng dụng điển hình.
Chơng 2 "Phân tích các yếu tố ảnh hởng đến quá trình nhận dạng và các cách tiếp
cận để giải quyết bài toán." trình bày các yếu tố ảnh hởng đến nhận dạng ảnh và hai cách
4
tiếp cận nhằm giải quyết bài toán. Khóa luận xem xét cách tiếp cận dựa trên khuôn mẫu,
cách tiếp cận dựa trên điểm đặc trng và kết hợp cả hai cách tiếp cận này để thu đợc kết
quả tốt nhất.
Chơng 3 "Một số thuật toán giải quyết bài toán dựa trên hai cách tiếp cận nhận
dạng ảnh mặt". Chơng này trình bày các thuật toán nhận dạng một ảnh dựa trên thuật toán
khoảng cách tiếp xúc.
Phần kết luận nêu tóm tắt lại nội dung chính đợc đề cập đến trong khóa luận, một
số kết quả và khiếm khuyết của khóa luận và định ra phơng hớng nghiên cứu tiếp theo.
Phần tài liệu tham khảo trình bày các tài liệu nghiên cứu gần đây của một số tác giả
nớc ngoài. Mỗi tài liệu đều nêu đợc khía cạnh nào đó của nội dung đang nghiên cứu.
Do thời gian và trình độ còn hạn chế, việc triển khai thuật toán nhận dạng ảnh mặt
ngời trong các điều kiện thay đổi của ánh sáng còn ở mức độ nhất định và cha đợc cài
đặt trong thực tế. Hy vọng rằng nếu thời gian và củng cố thêm sự hiểu biết tôi sẽ tiến hành
nghiên cứu sâu hơn về vấn đề này.
5
chơng 1. Tổng quan về nhận dạng ảnh mặt ngời
Công nghệ nhận dạng ảnh đợc ứng dụng trong nhiều miền ứng dụng khác nhau và
tác động đến nhiều khía cạnh của đời sống con ngời:
- Trong công nghiệp: Nhận dạng ảnh mặt ngời tự động đợc áp dụng cho các hệ
thống bảo mật nh kiểm soát truy cập truyền thông trạm làm việc, truy cập ngân hàng.
- Trong chính phủ: Hệ thống nhận dạng mặt ngời tự động đợc dùng trong kiểm
soát xuất nhập cảnh, kiểm soát vùng biên giới và bảo mật an ninh sân bay, hải cảng. Nhận
dạng ảnh mặt ngời tự động có thể hỗ trợ cho việc xác định tội phạm đối với mục đích của
pháp lý và các kỹ thuật chống khủng bố.
- Trong y học: Nhận dạng mặt ngời tự động có thể hữu ích trong việc nghiên cứu
hệ thống thần kinh, sự phản ứng tâm lý của bệnh nhân.
Để xây dựng một hệ thống nhận dạng mặt ngời tự động, trớc hết cần xem xét các
khái niệm và bài toán liên quan trong hệ thống nói trên.
1.1 Bài toán nhận dạng ảnh mặt ngời
Trong bài toán nhận dạng ảnh mặt ngời cần quan tâm đến các yếu tố ngoại cảnh
tác động đến quá trình và quan tâm đến các cách tiếp cận để giải quyết bài toán nhận dạng
sao cho hệ thống nhận dạng là bền vững với các yếu tố tác động đến quá trình nhận dạng.
Trớc hết một số khái niệm đợc giải thích nh dới đây:
- ảnh mặt ngời: Một ảnh chụp mặt của một ngời nào đó đang có trong hệ thống,
- Lớp ảnh mặt ngời: Do ảnh chụp mặt ngời phụ thuộc vào điều kiện ngoại cảnh và
nội tâm của ngời đó khi chụp ảnh nên với mỗi một ngời, hệ thống cần có một tập hợp
ảnh mặt của cùng một ngời đó song thể hiện đ
ợc nhiều trạng thái khác nhau. Chúng ta
gọi tập hợp đó là tập ảnh mẫu của ngời đó. Khi nói đến một lớp ảnh mặt ngời là nói đến
tập ảnh mẫu của cùng một ngời.
1.1.1 bài toán và các yêu cầu nhận dạng
Bài toán nhận dạng ảnh mặt ngời có thể đợc phát biểu nh sau: Cho trớc một tập
hữu hạn (nhóm ngời), danh tính và các thông tin tùy thân có thể đợc biết trớc, x là ảnh
mặt ngời cần nhận dạng thì bài toán thực hiện theo các nhiệm vụ nh sau:
- Xác định danh tính của ngời trong ảnh khi đã biết ngời đó thuộc vào nhóm
ngời đã biết. Đây chính là bài toán phân loại N lớp.
- Xác định xem ngời trong ảnh thuộc vào nhóm ngời cho trớc hay không.
6
- Giả thiết rằng ngời trong ảnh là một ngời thuộc nhóm ngời biết trớc, cần
kiểm tra xem giả thiết đó có đúng không.
- Nhận dạng đầy đủ tức là trớc tiên ta xem ngời trong ảnh có thuộc nhóm ngời
cho trớc hay không, sau đó xác định xem ảnh đó là của ngời nào trong nhóm.
Trớc hết cần làm rõ khái niệm ảnh đợc quản lý trong hệ thống nhận dạng ảnh. Hệ
thống quản lý ảnh quan tâm tới hai yếu tố sau đây:
- Đặc trng ảnh của đối tợng đợc quản lý. Theo lý thuyết nhận dạng ảnh, mỗi một
loại ảnh đối tợng có một số đặc trng nào đó chẳng hạn nh nhận dạng mặt ngời thì có
các loại đặc trng hiểu mặt: trái xoan, chữ điền, tỷ lệ khoảng cách hai mắt hoặc nhận
dạng chữ cái là số thành phần liên thông viết nên chữ cái đó Các đặc trng này đợc
phân thành hai loại: các đại lợng bất biến (không bị thay đổi trong mọi thao tác với ảnh)
và các đặc trng khác. Gọi n
1
là số các đặc trng thuộc loại này.
- Yếu tố tác động của môi trờng vào ảnh khi chụp. ảnh chụp của một đối tợng
phụ thuộc vào môi trờng chụp ảnh (ánh sáng, góc chụp ) vì vậy để nhận dạng ảnh cần
tính đến tác động của môi trờng đối với ảnh chụp. Các ảnh hởng môi trờng mạnh nhất
đó là ánh sáng, góc chụp (yếu tố hình học) Để hệ thống nhận dạng ảnh hoạt động tốt cần
biểu diễn đợc sự tác động nói trên tới ảnh. Giải pháp đầu tiên đợc nghĩ đến là cần nắm
bắt đợc "toàn bộ" các điều kiện môi trờng là không thể thực thi đợc vì khả năng vô hạn
về tác động của môi trờng đối với ảnh chụp. Một hệ thống rất khó thực hiện tốt nếu nh
không gian hoạt động là quá lớn (đa quá nhiều ảnh hởng môi trờng) hoặc quá bé (đa
quá ít điều kiện môi trờng). Điều đó buộc chúng ta phải tạo ra một không gian đủ để hệ
thống có thể hoạt động. Vì vậy, con ngời thờng chọn ra những đặc trng cơ bản nhất của
môi trờng tác động vào ảnh chụp với miền giá trị hạn chế để tập hợp ảnh nắm bắt là nằm
trong thực thi các hệ thống nhận dạng ảnh. Gọi n
2
là số các đặc trng của môi trờng tác
động vào ảnh chụp.
Kết hợp một đối tợng cùng
với một điều kiện môi trờng cụ thể
thì tạo ra một ảnh của một đối tợng
đợc thể hiện thông qua một vector
n = n
1
+ n
2
thành phần, chẳng hạn
ảnh x đợc biểu diễn thông qua một
vector (x
1
, x
2
, , x
n
). Tập hợp các
vector biểu diễn ảnh nói trên đợc
gọi là không gian ảnh.
x
Hình 1.1 Mô tả không gian biểu diễn ảnh
7
Hình 1 mô tả không gian biểu diễn ảnh và vị trị một đối tợng trong không gian đó.
Đối tợng quan sát là đối tợng x bao gồm các hớng biểu hiện các đặc điểm của
đối tợng x. Nếu đối tợng x càng nhiều đặc điểm thì số chiều của không gian trên càng
tăng. Ta gọi số chiều của không gian là d thì không gian đợc biểu diễn S
d
(không gian S
có d chiều). Đến đây x đợc coi là một đối tợng của S
d
(x S
d
).
Đối với bài toán nhận dạng, đối tợng nhận dạng là kết quả của một quá trình quan
sát. Cụ thể trong bài toán nhận dạng này, hệ thống đợc thực hiện qua các quá trình nh:
thu giữ ảnh, biểu diễn ảnh và cuối cùng là lập luận ảnh đã biểu diễn để thu đợc kết quả
mong muốn. Bài toán nhận dạng đợc trình bày nh sau:
- x S
d
: là một vector d-chiều thể hiện kết quả quan sát đợc các số đo từ một quá
trình hay một đối tợng đang nghiên cứu nào đó.
- C ={C
1
C
n
}: tập hợp hữu hạn tên đợc gán cho các quá trình hay đối tợng
nghiên cứu và các tập C
i
(i=1 n) đợc gọi là các lớp.
- g(x): S
d
{C
1
C
n
}: thuật toán nhận dạng là hàm xác định phép ánh xạ từ không
gian S
d
sang tập hợp C. Mục tiêu của bài toán nhận dạng sử dụng hàm g(x) để xác định
một kết quả quan sát đợc x S
d
có thuộc về lớp C
i
C hay không. Để thực hiện đợc
nhiệm vụ này đòi hỏi phải có thuật toán tốt nhất nào đó và thuật toán đợc xác định bằng
cách tối thiểu hàm xác suất nhận dạng sai tức là P[g(x) # C
i
] min.
Nh vậy ta nhận thấy bài toán nhận dạng bao gồm các vấn đề cần đợc giải quyết
sau đây:
- Thu đợc kết quả quan sát.
- Xác định không gian S
d
biểu diễn đối tợng.
- Xác định thuật toán nhận dạng tốt nhất.
Thông thờng từng đối tợng nhận dạng cho phép chúng ta xác định đợc không
gian S
d
sao cho các đại diện của đối tợng này khác so với các đại diện của đối tợng khác.
Tuy nhiên trong bài toán nhận dạng ảnh mặt ngời rất khó có thể biểu diễn đợc đối tợng
tại vì các đại diện thu đợc trong các điều kiện khác nhau đối với mặt của một ngời nh:
độ tuổi làm biến đổi sắc thái mặt, ánh sáng tác động, diễn cảm của mặt, góc chụp ảnh mặt,
tóc, kính và các yếu tố khác có thể ảnh hởng đến sự trích ra các mẫu. Các ảnh thu đợc
còn phải trải qua các quá trình biến đổi nh sự quay, sự co dãn và các dịch chuyển. Các
yếu tố tác động trên không dễ dàng chuẩn hóa để đa vào không gian biểu diễn mà trong
đó sự mô tả các lớp là tách biệt.
8
Các nhiệm vụ trong nhận dạng ảnh mặt ngời đợc minh họa nh hình sau:
Trong các hình minh hoạ trên cho thấy không gian biểu diễn ảnh đợc phân chia
thành các vùng khác nhau, mỗi vùng biểu diễn một đối tợng nhận dạng. Các đờng kẻ
trên không gian biểu diễn ảnh cho ta đợc các luật phân loại ảnh. Quan sát ảnh ta thấy ảnh
biểu diễn 3 ngời khác nhau và mối ngời ứng với một ký hiệu khác nhau. Hình trên cho
biết một hệ thống nhận dạng ảnh phải thực hiện đợc đầy đủ các vấn đề đặt ra trong quá
trình nhận dạng.
1.1.2 Giải quyết bài toán từ quan điểm của lý thuyết nhận
dạng
Phân lớp không gian biểu diễn ảnh
Bài toán này là một bài toán phân loại N lớp tơng ứng với tập các lớp đã có:
C
1
C
N
trong đó C
i
là một lớp ảnh nào đó và tất cả các lớp đó đều đợc mô hình hóa. Lớp
đợc giải quyết bởi biểu diễn dữ liệu của từng lớp và ứng dụng một trong nhiều kỹ thuật
phân loại mẫu. Khả năng xảy ra sai số phân loại một mặt x đợc giảm tới mức tối thiểu bởi
việc gán nó tới lớp C
k
với xác suất hậu nghiệm P(C
k
x) lớn nhất, trong đó
)(
)()(
)(
xp
CPCxp
xCP
kk
k
=
(1)
p(x) là mật độ tuyệt đối, p(x
C
k
) là mật độ xác suất phụ thuộc lớp và P(C
k
) là xác
suất tiên nghiệm đối với lớp C
k
. Vì p(x) là giống nhau đối với mọi lớp nên nó không đợc
định giá để làm tăng xác suất hậu nghiệm. Do đó, một cách tiếp cận tới nhiệm vụ phân loại
là mô hình hóa các mật độ xác suất phụ thuộc lớp p(x
C
k
).
Hình 1.2 Chia không gian ảnh thành các vùng khác nhau, các vùng biểu hiện của 3
n
g
ời khác nhau và biểu hi
ệ
n của mỗi m
ộ
t ảnh tơn
g
ứn
g
với m
ộ
t nhi
ệ
m v
ụ
trên.
9
Xác minh danh tính của một ngời cho trớc theo nghĩa là kiểm tra xem ngời đó có
thuộc một lớp ảnh mặt ngời đã biết hay không
Sự xác minh này có thể đợc xem xét nh một bài toán phân loại 2 lớp. Giả sử đã có
hai lớp C
0
và C
1
tơng ứng với các trờng hợp danh tính đó là đúng hoặc là sai. Để làm
tăng xác suất hậu nghiệm, x sẽ đợc gán cho C
o
nếu và chỉ nếu
)(
)()(
)(
0
11
0
CP
CPCxp
CxP >
(2)
trong đó mật độ p(x
C
1
) miêu tả sự phân tán các mặt ngời khác so với danh ttính
đợc yêu cầu.
Xác định ngời trong ảnh có thuộc nhóm ngời cho trớc hay không
Đối với bài toán này có hai cách giải quyết đó là:
Cách thứ nhất
: Giải quyết nh một bài toán phân loại 2 lớp C
0
và C
1
với lớp C
0
đại
diện cho một tập tất cả các lớp trong nhóm còn C
1
đại diện cho không gian không chứa lớp
nào trong nhóm đó (tập còn lại). Tất cả các lớp đợc cụm lại đợc gọi là lớp C
0
và xác định
đối tợng nhận dạng có thuộc trong lớp C
0
này hay không, ngợc lại thì đối tợng nằm
trong lớp C
1
.
Cách thứ hai
: Một cách tiếp cận khác bao gồm việc xây dựng một trình xác định
danh tính đối với mỗi một ngời trong S. Nhiệm vụ này đợc thực hiện bởi việc đa ra N
sự xác minh danh tính tơng ứng với N lần kiểm tra đối tợng x có thuộc một lớp nào đó
hay không. Nếu không thuộc vào lớp nào thì kết luận không xác định đợc ngời đó,
ngợc lại thì xác minh đợc ảnh đó.
Sự nhận dạng đầy đủ
Nhiệm vụ này phải thực hiện đầy đủ các nhiệm vụ ở trên, trớc tiên phải phân định
đợc các danh tính của đối tợng nhận dạng (phân loại các lớp) và sau đó xác định xem
đối tợng đó là thuộc về lớp nào trong các lớp thu đợc. Nhiệm vụ này đợc thực hiện bởi
sự liên kết N trình xác minh danh tính, tơng tự nh cách tiếp cận xác định đối tợng là
thuộc về lớp nào trong nhóm S.
1.2 giải quyết vấn đề trong bài toán nhận dạng ảnh mặt
ngời
Các vấn đề quan trọng trong nhận dạng ảnh mặt ngời đợc thể hiện nh sau:
Sự thu nhận (Acquisition): đâu là các nhân tố quan trọng trong cách thu thập thông
tin mặt ngời?
10
Sự biểu diễn (Representation): cách biểu diễn các nhân tố thu đợc trong quá trình
thu nhận các thông tin về ảnh.
Sự lập luận (Reasoning): cách mà một hệ thống nhận dạng mặt có thể làm để so
sánh các mặt ngời nhằm đạt hiệu quả nhất.
Mỗi từ các mục con dới đây trình bày chi tiết ba vấn đề đã đợc nêu trên đây.
1.2.1 Thu nhận dữ liệu
Các vấn đề quan trọng trong nhận dạng ảnh mặt ngời đợc thể hiện nh sau:
Sự thu nhận (Acquisition): đâu là các nhân tố quan trọng trong cách thu thập thông
tin mặt ngời?
Sự biểu diễn (Representation): cách biểu diễn các nhân tố thu đợc trong quá trình
thu nhận các thông tin về ảnh.
Sự lập luận (Reasoning): cách mà một hệ thống nhận dạng mặt có thể làm để so
sánh các mặt ngời nhằm đạt hiệu quả nhất.
Mỗi từ các mục con dới đây trình bày chi tiết ba vấn đề đã đợc nêu trên đây.
1.2.2 Thu nhận dữ liệu
Phần này xem xét cách mà dữ liệu gốc đợc thu nhận trớc khi các vấn đề của sự
biểu diễn đợc thực hiện. Câu hỏi đặt ra là: Có bao nhiêu kiểu ảnh mặt là cần thiết và kiểu
đó là gì?. Có bao nhiêu kiểu thay đổi sẽ đợc mô tả trong các ảnh và các kiểu đó là gì?.
Trong vấn đề về bắt giữ dữ liệu ta cần chú ý tới các vấn đề nh là xây dựng đợc cơ
sở dữ liệu ảnh, trình phát hiện mặt, phân đoạn và chuẩn hoá ảnh. Mục đích của việc xây
dựng một cơ sở dữ liệu ảnh là nhằm phục vụ cho việc phân tích thuật toán và cho việc kiểm
Đối
tợng
Phân
đoạn
Phát
hiện mặt
Chuẩn
hoá
DataBas
e
Thôn
g
tin
Vùn
g
thôn
g
tin
Các mặt thu
đợc Lu trữ
Hình 1.3. Mô phỏng các giai đoạn thực hiện của vấn đề bắt giữ dữ liệu
11
nghiệm hệ thống ngoài ra cơ sở dữ liệu còn đợc khai thác trong các hệ thống nhận dạng.
Mô tả vấn đề bắt giữ dữ liệu biểu diễn trong hình 1.3.
Việc xây dựng cơ sở dữ liệu phải thoả mãn đợc sự biểu diễn các biến thể của môi
trờng. Ngoài ra cơ sở dữ liệu phải thể hiện đợc sự mô tả các thông tin về bề mặt, các
diễn cảm của mặt và các ảnh hởng của điều kiện bên ngoài tác động đến quá trình nhận
dạng. Các hệ thống nhận dạng chúng không thể thực hiện đợc trên các dữ liệu lớn, chúng
chỉ có thể thực hiện trên cơ sở dữ liệu hữu hạn. Với bài toán nhận dạng ảnh mặt ngời, yêu
cầu cơ sở dữ liệu phải lu trữ đợc các thông tin quan trọng của mặt nh: mắt, mũi, mồm,
các thông tin có liên quan khác và phải loại bỏ đợc các thông tin không cần thiết. Thay
vào việc lu trữ toàn bộ ảnh mặt của ngời nào đó ta thiết lập một cơ sở dữ liệu chuẩn mà
nó chỉ lu các thông tin quan trọng của mặt ngời mà thôi. Cơ sở dữ liệu chuẩn này cho ta
hai lợi ích đó là: giúp cho hệ thống thực hiện một cách dễ dàng và giảm tối thiểu không
gian lu trữ dữ liệu. Các cơ sở dữ liệu chuẩn hay đợc dùng ngày nay đó là: ORL cơ sở
dữ liệu này đợc phát triển tại phòng thí nghiệm nghiên cứu Olivetti nớc Anh, nó thỏa
mãn các sự biến đổi nh hình dáng, ánh sáng và diễn cảm của mặt. Cơ sở dữ liệu thứ hai
đó là FERET đợc phát triển bởi phòng thí nghiệm nghiên cứu quân sự Mỹ.
Sự phân loại giữa ảnh mặt với ảnh nền là rất khó bởi vì sự đa dạng trong các lớp mặt
(nòi giống, các diễn cảm mặt, kiểu tóc, trang điểm, kính, ria mép, ). Tơng tự nh vậy
trong việc định vị các đặc điểm của mặt cũng là rất khó bởi vì mỗi một ngời có một
khuôn mặt khác nhau. Hơn nữa, có nhiều ảnh hởng khác tới ảnh nh sự chiếu sáng và
hớng chụp.
Với mặt của con ngời các thông tin quan trọng về bề mặt sẽ đ
ợc lu trữ trong cơ
sở dữ liệu. Các thông tin đó có thể là các đặc điểm cấu thành lên bề mặt con ngời nh: hai
mắt, mũi và mồm. Để thu đợc các thông tin cần thiết từ một ảnh gốc, hệ thống thực hiện
các quá trình phân đoạn ảnh thành các vùng con và mục tiêu của quá trình phân đoạn này
nhằm loại bỏ đợc các vùng thông tin không cần thiết. Trong ảnh mặt ngời, các phần
không cần thiết có ảnh hởng rất nhiều đến quá trình thu thập thông tin đó là các vùng của
tóc, ảnh nền, và các thay đổi về hình học của ảnh mặt ngời.
Dựa vào các thông tin của bề mặt và tiến hành phân đoạn ảnh mặt. Việc phân đoạn
giúp cho quá trình phát hiện mặt đợc tốt hơn tại vì ảnh nền có rất nhiều yếu tố khác tác
động trên ảnh. Do đó phải phân đợc các vùng khác nhau của ảnh, các vùng trở nên cô lập
và mỗi vùng miêu tả một số đặc trng của ảnh. Tơng ứng với các vùng có thể hình thành
nên các ảnh mặt. Tiếp sau quá trình phân đoạn ảnh là quá trình phát hiện mặt thông qua
các vùng thu đợc của quá trình phân đoạn.
12
Có rất nhiều phơng pháp đã và đang đợc sử dụng trong việc phát hiện mặt. ở đây,
tôi xin giới thiệu 3 cách tiếp cận giải quyết bài toán. Thứ nhất: cách tiếp cận từ dới lên,
cách này sử dụng các ràng buộc hình học dựa trên điểm đặc trng. Các đặc điểm của bề
mặt đợc hiển thị bằng cách sử dụng bộ lọc sau đó các đặc điểm đợc kết hợp với nhau để
tạo thành một mặt dự tuyển. Cách thứ hai: phát hiện mặt bất biến trong phép quay và co
giãn, các mặt dự tuyển đợc phát hiện bằng cách gom các vùng với nhau cho đến khi độ
sắc nét xấp xỉ hình ellipsis. Cách thứ ba: hầu hết các thuật toán phát hiện mặt sử dụng việc
tìm kiếm nhiều mức với sự phân loại kích thớc cố định.
Hầu hết các kỹ thuật nhận dạng mẫu đã sử dụng các lợc đồ phát hiện nhiều mức
cho việc phát hiện mặt. Cách tiếp cận dễ dàng hơn đó là sử dụng quy tắc quyết định dựa
trên cờng độ ảnh của các ảnh dự tuyển từ sự biểu diễn nhiều mức của ảnh nhập vào.
Ngoài ra còn có các kỹ thuật khác trong việc phát hiện mặt nh: các mô hình Gaussian ứng
dụng trên một không gian con các thành phần chính, ứng dụng máy vector cũng thành
công trong việc phát hiện mặt trong ảnh nền phức tạp và hệ thống dựa trên mạng Neural đã
sử dụng thành công trong việc phát hiện mặt và bất biến với phép quay.
Việc phát hiện mặt có thể đợc giải quyết bằng sự phân loại hai lớp đó là: lớp ảnh
mặt và lớp ảnh nền. Sự phân loại giữa lớp ảnh mặt và các đối tợng ảnh nền là rất khó bởi
vì các sự biến đổi trong các mặt ảnh hởng đến quá trình phát hiện mặt ngời (các ảnh
hởng nh: quan điểm về chủng tộc, các diễn cảm bề mặt, kiểu tóc, cặp kính). Tơng tự
nh vậy, việc xác định vị trí các đặc điểm cũng rất khó vì sự thay đổi giữa các cá nhân
(chủng tộc, các kiểu cấu thành, các diễn cảm mặt) cũng khác nhau.
Sau khi thu đợc ảnh trong một ảnh nền hệ thống tiến hành chuẩn hoá ảnh, thông
thờng việc chuẩn hóa đợc thực hiện trên các giá trị mức độ xám. Đối với bề mặt của con
ngời thì việc chuẩn hóa thờng dựa vào vị trí của hai mắt hoặc là mũi hoặc là mồm.
Các ảnh mặt sau khi chuẩn hoá đợc lu trữ trong cơ sở dữ liệu và kết quả này đợc
sử dụng cho các quá trình tiếp theo có sử dụng kết quả bắt giữ đợc này.
1.2.3 Biểu diễn đối tợng
Đối với một hệ thống nhận dạng ảnh mặt ngời để thực hiện có hiệu quả, thì hệ
thống phải tách và trích ra các điểm đặc trng trong dữ liệu nhập vào và từ đó biểu diễn
các đặc trng của mặt ngời hiệu quả nhất. Các phần tử của sự biểu diễn có thể đợc tạo
nên trong nhiều cách khác nhau, và nó phụ thuộc vào nhiệm vụ mà cách tiếp cận nào là
thích hợp nhất.
13
Vấn đề quan trọng của quá trình biểu diễn dữ liệu là làm giảm kích thớc của ảnh
bằng cách loại bỏ hầu hết các thông tin không cần thiết trong ảnh gốc, làm giảm độ thô
của ảnh.
Một số cách sử dụng phổ biến hiện nay trong quá trình tách và trích đợc các điểm
đặc trng của ảnh dữ liệu nh: cách tiếp cận dựa trên đặc điểm, cách tiếp cận dựa trên
khuôn mẫu, phân tích các thành phần chính và thông qua các bộ lọc.
Cách tiếp cận dựa trên đặc điểm nhằm phát hiện và đo đạc các điểm nổi bật của bề
mặt, sử dụng khoảng cách hình học và góc giữa các đặc điểm chính của bề mặt nh là: hai
mắt, mũi, mồm và nhằm mục đích phân loại các mặt trong đó các phần tử dựa trên mối
quan hệ vị trí và các kích cỡ của chúng. Với cách tiếp cận dựa trên khuôn mẫu sử dụng
thông tin xác đáng của điểm ảnh nh là mức độ xám gốc hoặc xử lý các khía cạnh nổi bật
của dữ liệu. Khuôn mẫu có thể là toàn bộ ảnh hoặc là các vùng tơng ứng với các vị trí của
đặc điểm (vị trí của hai mắt hoặc mồm). Nói chung với cách tiếp cận này chỉ cho ta đợc
một số đặc điểm của đối tợng, nó không đủ để có thể ứng dụng trong thực tế nhng đối
với sự hiệu chỉnh hình học hoặc bộ lọc thì có thể cải tiến đợc các kết quả này.
Cách tiếp cận phân tích các thành phần chính: cách tiếp cận này có thể trích ra đợc
thông tin quan trọng nhất đợc trình bày bằng cách thống kê đối với một tập các ảnh nh
là một tập các vector riêng. Các vector riêng có thể đợc đánh giá nh là tập các điểm đặc
trng chung và định rõ đợc các đặc điểm thay đổi của ảnh trong cơ sở dữ liệu. Mỗi ảnh
đợc biểu diễn một cách chính xác qua một sự liên kết tuyến tính của những vector riêng
này. Để quyết định kích thớc của không gian mặt chúng ta dựa vào số các vector riêng.
Kỹ thuật này phân tích các đặc điểm của ảnh, thu thập các thông tin quan trọng và loại bỏ
đợc các thông tin d thừa không cần thiết cho hệ thống nhận dạng. Do đó nó có thể tìm
đ
ợc sự biểu diễn tối u kích thớc của ảnh nhng kỹ thuật này có thể hữu ích đối với việc
xây dựng lại cấu trúc ảnh hơn là đối với việc nhận dạng. Hơn nữa, phơng thức mặt riêng
(vector riêng) là không bất biến với sự thay đổi hình học của ảnh nh là sự co giãn, dịch
chuyển hoặc phép quay trong dữ liệu gốc.
Cách tiếp cận tiêp theo là sử dụng bộ lọc: hệ thống cho ảnh đi qua bộ lọc và qua bộ
Bộ lọc
* *
* * *
* *
H
ình 1.4 Mô phỏng bộ lọc để lấy đợc các điểm đặc trn
g
14
lọc đó các thông tin đặc trng quan trọng sẽ đợc thu lại và làm giảm không gian lu trữ
ảnh. Kết quả là ta thu đợc các thông tin quan trọng của ảnh. Có thể mô tả nh hình 1.4
trên đây.
Hình trên cho thấy khi cho qua bộ lọc các thông tin d thừa sẽ bị loại bỏ chỉ để lại
các thông tin quan trọng tạo nên ảnh mặt.
Nói tóm lại: các cách tiếp cận trên nhằm mục đích phân loại đợc các điểm đặc
trng và biểu diễn chúng sau đó thực hiện việc tối u các thông tin đó sao cho kích thớc
không gian lu trữ điểm đặc trng là nhỏ nhất.
1.2.4 Lập luận kết quả
Hệ thống so sánh hai ảnh với nhau sao cho có hiệu quả nhất, sụ phù hợp của hai ảnh
đợc tính bằng cách nh: sử dụng cách tiếp khoảng cách tiếp xúc và sử dụng các ngỡng
để đánh giá.
Trong không gian mặt hệ thống so sánh khoảng cách từ một mặt cần tìm đến một
tập hợp các mặt, kết quả là ta thu đợc tập các số đo. Nếu một trong tập các số đo thỏa
mãn yêu cầu về khoảng cách nhận dạng thì đó chính là mặt mà chúng ta cần tìm. Các
khoảng cách chuẩn đợc sử dụng: khoảng cách Euclidean hoặc khoảng cách Mahalanobits
(đối với không gian vector riêng).
Bên cạnh việc sử dụng các khoảng cách để đánh giá sự phù hợp của hai ảnh, chúng
ta còn có thể sử dụng các ngỡng để đánh giá mức độ chính xác của một số cách tiếp cận
khác. Tỷ số nhận dạng sai của các cách tiếp cận khác nhau không thể vợt quá một ngỡng
nào đó. Nếu vợt quá thì kết luận hai mặt đó không phù hợp còn ngợc lai thì hai mặt là
phù hợp và ta tiến hành đánh giá nhận dạng chúng.
1.3 hệ thống kỹ thuật nhận dạng ảnh mặt ngời
Nhận dạng ảnh mặt đã đợc nghiên cứu trong nhiều năm và đang đợc ứng dụng
trong thực tế nh là: các hệ thống bảo mật, sự xác định tội phạm và hỗ trợ các hệ thống
nhận dạng giọng nói. Nhận dạng mặt rất quan trọng đối với con ng
ời bởi vì bề mặt đóng
một vai trò lớn trong giao tiếp với cộng đồng, các biểu hiện của tình cảm, cảm xúc, suy
nghĩ và cảm nghĩ.
Hệ thống nhận dạng ảnh mặt tự động có thể đợc chia thành các phần nh: quy
trình công nghệ xử lý thông tin, các vấn đề triển khai trong thực tế và các ứng dụng điển
hình.
15
1.3.1 Qui trình công nghệ xử lý thông tin
Quy trình thiết kế một hệ thống nhận dạng ảnh mặt tự động là một quá trình xử lý
đa giai đoạn. Những giai đoạn này về cơ bản là các bớc giống nhau. Các giai đoạn có thể
đợc mô tả nh sau:
Bớc 1: Giai đoạn cảm biến
Các nghiên cứu đợc đa ra để xác định tác nhân đem lại các thuộc tính của đối
tợng (cỡ, hình dáng, màu sắc, kết cấu, ). Các giá trị và các mối quan hệ giữa các thuộc
tính của đối tợng đợc sử dụng để biểu thị đặc điểm của một đối tợng trong cách thức
của một vector mẫu. Phạm vi giá trị của thuộc tính đợc hiểu nh là độ lớn của không
gian. Một vấn đề quan trọng là độ chính xác của sự xuất hiện khung cảnh thực đợc thu
bởi vector mẫu nh thế nào. Các vấn đề nhiễu trong ảnh phải dới mức độ cho phép và
không làm mất thông tin chủ yếu.
Các thông tin của đối tợng đợc biểu diễn nh thế nào trong vào giai đoạn cảm
biến này và kết quả thu đợc của giai đoạn nàylà các kết quả đo thông tin của đối tợng,
kết quả đo này đợc đa vào giai đoạn tiền xử lý để thực hiện việc loại bỏ nhiễu, nâng cao
khía cạnh chắc chắn của ảnh
Bớc 2: Giai đoạn tiền xử lý
Giai đoạn tiền xử lý đợc thực hiện để loại bỏ nhiễu, nâng cao khía cạnh chắc chắn
của ảnh, và gây ra các thay đổi khác làm đơn giản hóa các bớc xử lý ở mức độ cao hơn.
Đối
tợng
Dấu hiệu
Cảm biến
Giai đoạn
cảm biến
Kết quả đo tín hiệu
Giai đoạn
tiền xử lý
Trình trích chọn thông tin
đặc trng
Sự trích
chọn đăc
trn
g
Không gian biểu diễn
Giai đoạn
phân loại
Nhóm mẫu
Xử l
ý
thôn
g
tin khung
cảnh
Hình 1.5 Quá trình nhận dạng mẫu
16
Để ngăn ngừa sự loại ra các cạnh của ảnh đã tồn tại hoặc đa ra các cạnh lỗi, thao tác tiêu
biểu đợc sử dụng đó là: tách ngỡng và làm mịn. Tách ngỡng biến đổi một ảnh cấp độ
xám thành một ảnh nhị phân, trong đó mỗi một điểm có thể là đen hoặc trắng. Làm mịn
ảnh đợc dùng để làm giảm nhiễu, để nâng cao sự lựa chọn các điểm đặc trng của ảnh, và
để làm giảm các chi tiết ảnh không mong muốn. Do đó, ảnh đợc phân chia thành các đối
tợng cô lập nhau. Kết quả là thu đợc không gian điểm đặc trng và nó giúp cho giai
đoạn trích chọn điểm đặc trng đợc thực hiện.
Bớc 3: Trích chọn điểm đặc trng
Sau khi có đợc không gian điểm đặc trng, hệ thống tiến hành trích chọn các điểm
đặc trng của đối tợng trong không gian đó. Việc trích ra các đặc trng của đối tợng
thông qua nhiều cách khác nhau nhng ý nghĩa chính của nó vần là phải sử dụng một bộ
lọc để loại bỏ các thông tin không cần thiết và giữ lại đợc các thông tin quan trọng. Các
điểm đặc trng của đối tợng đợc lọc và kết quả đó giúp cho quá trình nhận dạng thuận
tiện. Quá trình lọc này có thể thống kê thành các thuộc tính nh: màu sắc, kết cấu, cờng
độ, khoảng cách, chuyển động Các điểm đặc trng hình thành nên không gian biểu diễn
điểm đặc trng. Kết quả của không gian biểu diễn giúp cho quá trình phân loại các điểm
đặc trng đợc tốt hơn.
Bớc 4: Giai đoạn phân loại
Tiến hành phân loại không gian biểu diễn điểm đặc tr
ng để thu đợc các thông tin
mẫu bằng cách sử dụng các giá trị điểm đặc trng đã chọn. Kết quả là các đối tợng hoặc
các lớp mẫu biểu thị đặc điểm đợc học bởi các miêu tả sự hình thành mẫu chung, các
chuẩn phân loại, hoặc các hàm quyết định.
Bớc 5: Trình xử lý thông tin khung cảnh
Trình xử lý khung cảnh làm tăng độ chính xác của nhận dạng bởi việc cung cấp
thông tin thích hợp có liên quan đến môi trờng xung quanh đối tợng (bằng cách làm phù
hợp các đặc điểm của đối tợng với các mô hình đã đợc lu trữ, hoặc bằng cách phân loại
dựa trên tiêu chuẩn phân loại).
1.3.2 Các vấn đề trong triển khai thực tế
Thành công của một ứng dụng nhận dạng mặt thờng phụ thuộc vào cách mà các
thông tin (dấu hiệu) đợc mô tả. Sự thụ thuộc vào ứng dụng, sự biểu diễn thích hợp sẽ đợc
thực hiện để tạo ra quá trình biểu diễn thông tin mà các thông tin là xác đáng nhất đợc
nhấn mạnh cho ứng dụng. Hai ràng buộc đáng chú ý đó là:
- Kích thớc của trình phân loại mà đợc liên kết với số liên thông trong mạng
Neural.
17
- Số tập các ví dụ đào tạo (cỡ của tập dữ liệu).
Các quyết định phải đợc đa ra để làm giảm cỡ của vector mẫu mà đợc mô tả
trong mạng Neural. Thông thờng kích thớc của các vector mẫu phụ thuộc vào miền của
quang phổ mà quá trình thu ảnh gặp phải. Kích thớc của các vector mẫu có thể đợc giảm
bằng cách sử dụng một số mối quan hệ giữa các vùng quang phổ với nhau.
Sự thay đổi sóng là một kỹ thuật phổ biến khác đợc sử dụng trong quá trình biểu
diễn ảnh, ở đó một dấu hiệu nhất thời đợc biểu diễn trong giới hạn của hàm cơ sở:
=
jk
jkjk
thCtX )()(
(3)
trong đó X(t) là chuỗi thời gian gốc, C
jk
là các hệ số sóng, h
jk
(t) là các nhân sóng, chỉ
số j là các vị trí biểu thị thời gian của nhân, và chỉ số k là sự chia của nhân. Sau đó sự thay
đổi các hệ số sóng C
jk
đợc sử dụng cho việc cung cấp dữ liệu tới mạng Neural.
1.3.3 Các ứng dụng điển hình
Quá trình nhận dạng ảnh mặt ngời tự động có thể đợc chia thành hai nhiệm vụ
chính:
- Tìm một mặt hoặc các mặt trong một ảnh nền và
- Sự nhận dạng các đặc điểm của mặt
Nhiệm vụ thứ nhất: tìm một mặt trong một ảnh giống nh là việc đăng ký mặt
hoặc việc xác định vị trí của mặt. Nhiệm vụ này phụ thuộc vào các nhân tố sau:
+ Điều khiển màu sắc và ảnh nền
+ Các ảnh màu hoặc đơn màu và các ảnh tĩnh hoặc các ảnh video.
Nếu ánh sáng ảnh nền đợc điều khiển thì việc xác định các mặt là dễ dàng. Do đó,
sự phụ thuộc vào điều khiển thông qua các nhân tố sẽ dẫn đến việc xác định vị trí của mặt
có thể là một bài toán dễ hoặc một bài toán khó. Do ảnh hởng của các yếu tố và các loại
ảnh nên việc tìm mặt cũng trở nên khó khăn hơn. Sự biến đổi của ánh sáng cũng nh sự
biến đổi của ảnh cơ sở đều ảnh hởng rất lớn đến quá trình tìm kiếm mặt.
Nhiệm vụ thứ hai: sự nhận dạng và sự xác minh mặt là hai kiểu của bài toán nhận
dạng mặt, cụ thể là bài toán nhận dạng và bài toán xác minh mặt. Trong bài toán xác minh
mặt ngời ta phải kiểm tra mặt đã cho là của ai và do đó việc kiểm tra này làm phù hợp đặc
tính của ảnh đối với một mô hình đơn. Trong bài toán nhận dạng mặt, đây là bài toán tìm
sự phù hợp nhất của một ảnh cha biết dựa vào một cơ sở dữ liệu các mẫu mặt hoặc là định
rõ nó không phù hợp với bất kỳ ảnh nào đó trong cơ sở dữ liệu. Điều quan trọng trong thực
tế đó là sự khác nhau của hai bài toán này về tốc độ: nói chung, nếu ta có N ngời trong
18
một cơ sở dữ liệu thì quá trình nhận dạng sẽ chậm hơn N lần so với quá trình xác minh. Tại
vì quá trình nhận dạng phải so sánh N lần còn quá trình xác minh chỉ phải so sánh một lần.
Các cơ sở dữ liệu đã và đang đợc phát triển
Phòng thí nghiệm nghiên cứu Olivetti (Olivetti Research Laboratory ORL) ở Anh
đã phát triển một cơ sở dữ liệu mặt mà có thể cung cấp nh một điểm chuẩn tốt đối với sự
kiểm tra một hệ thống nhận dạng mặt.
Cơ sở dữ liệu ảnh mặt FERET đợc phát triển tại Mỹ. Cơ sở dữ liệu này đợc kiểm
tra bởi phòng thí nghiệm nghiên cứu quân đội Mỹ.
Hình dới đây mô tả một cơ sở dữ liệu ảnh, trong đó các ảnh biến đổi theo các điều
kiện của ánh sáng:
Hình 1.6. Biểu diễn các ảnh theo các điều kiện thay đổi của ánh sáng
19
chơng 2. nhận dạng ảnh mặt ngời trong điều kiện ánh sáng
thay đổi
Chơng hai này phân tích các yếu tố ảnh hởng đến quá trình nhận dạng và các
cách tiếp cận để giải quyết các yếu tố ảnh hởng đó.
1.4 Phân tích các yếu tố ảnh hởng đến quá trình nhận dạng
Bất cứ một quá trình nhận dạng nào cũng chịu ảnh hởng của nhiều yếu tố không
thuận lợi tới quá trình. Các yếu tố có thể làm giảm tính chính xác của hệ thống, làm giảm
tốc độ nhận dạng, . Có thể kể đến các yếu tố dới đây:
- Môi trờng,
- Biểu diễn khía cạnh hình học của bề mặt (sự quay ảnh, co giãn, thay đổi vị trí,),
- Các sai số do hệ thống.
Các đặc trng bất động của ảnh là những yếu tố cần thiết để khắc phục đợc ảnh
hởng của những yếu tố này song tập những đặc trng bất động không đủ để trình bày ảnh
mặt ngời, vì vậy việc nghiên cứu, phân tích ảnh hởng của các yếu tố đó là quan trọng.
Trong các mục dới đây, các yếu tố ảnh hởng đến hệ thống nhận dạng ảnh tự động
đợc phân tích và một số giải pháp khắc phục đợc giới thiệu.
2.1.1. ánh sáng
Các yếu tố của môi trờng ảnh hởng tới quá trình nhận dạng mặt nh: các yếu tố
về ánh sáng, các thiết bị thu nhận ảnh và khung cảnh mà ảnh đợc thu nhận. ánh sáng làm
biến đổi mức độ xám của ảnh và cờng độ các điểm ảnh do đó nó làm cho ảnh hoàn toàn
biến đổi qua các vùng khác nhau và các yếu tố đó làm cho hệ thống nhận dạng rất khó có
thể nhận dạng ảnh một cách chính xác. Để khắc phục vấn đề đó đòi hỏi phải đa ra cho hệ
thống một số kỹ thuật để loại bỏ các hạn chế đó. ánh sáng làm thay đổi hoàn toàn các dấu
hiệu của ảnh, ngoài ra ánh sáng còn tạo nên các lớp bóng của chính đối tợng nhận dạng
hoặc tạo nên các sự che lấp của bản thân nó.
2.1.2. Các thay đổi hình học
Bên cạnh các yếu tố môi trờng ảnh hởng tới quá trình nhận dạng, hệ thống còn
chịu ảnh hởng của các yếu tố hình học nh: sự quay, sự dịch chuyển và sự co giãn Các
yếu tố này ảnh hởng rất nhiều đến hệ thống nhận dạng tại vì ảnh hởng của nó làm thay
đổi cấu trúc của ảnh, thay đổi hớng chụp, góc chụp và thay đổi kích thớc của ảnh.
20
2.1.3. Sai số do hệ thống
Một hệ thống nhận dạng ảnh dựa vào các điểm đặc trng thì không thể tránh khỏi
các sai số khi một hệ thống xác định vị trí đó gây ra. Nhng mức độ gây ra ở đây là nhiều
hay ít, nó phụ thuộc vào quá trình xác định vị trí đó mà thôi. Ví dụ hệ thống xác định vị trí
hai mắt của tác giả [Mariani], hệ thống nhận dạng này phụ thuộc rất nhiều vào vị trí chính
xác của mắt, nếu hệ thống trả lại kết quả sai thì hệ thống nhận dạng cũng nhận sai. Các sai
số nh là sai số về sự quay, sự so giãn và sự dịch chuyển, các sai số về phép đo này cho hệ
thống những thông tin lệch lạc về vị trí của ảnh so với ảnh gốc, điều đó dẫn đến hệ thống
nhận dạng không chính xác và cho kết quả không nh mong muốn. Do đó cần phải khắc
phục các điều kiện đó bằng cách sử dụng các kỹ thuật có liên quan đến tính chất hình học
và biểu diễn hình học của bề mặt.
1.5 Các kỹ thuật giải quyết
Phần này trình bày một số yếu tố môi trờng ảnh hởng tới quá trình nhận dạng,
yếu tố này ảnh hởng rất nhiều đến sự đăng ký mặt và sự nhận dạng mặt. Với một mặt của
một ngời, trớc khi thu ảnh để đăng ký, đã có các điều kiện môi trờng ảnh hởng đến
ảnh khi đăng ký và lúc nhận dạng thì điều kiện môi trờng cũng lại ảnh hởng đến ảnh cần
nhận dạng. Trong phạm vi của mục này bao gồm các phần sau: (1) Đa các thông tin về
điều kiện môi trờng vào mô tả đối tợng, (2) Kỹ thuật dựa trên khoảng cách tiếp xúc, (3)
Sử dụng nhiều cách biểu diễn đối tợng khác nhau
2.1.1 Đa các thông tin về điều kiện môi trờng vào mô tả đối
tợng
Trong môi trờng có rất nhiều yếu tố ảnh h
ởng đến quá trình nhận dạng ảnh và
quá trình đăng ký ảnh. Các yếu tố môi trờng nh: yếu tố ánh sáng, góc chụp ảnh và các
thiếp bị thu ảnh khác nhau. Ta thấy để xác định đợc tính phù hợp của hai ảnh khác nhau
không phải là dễ dàng tại vì hai ảnh tuy là của cùng một đối tợng nhng chúng lại đợc
chụp ở các thời điểm khác nhau. Do đó các điều kiện này ảnh hởng rất nhiều đến chất
lợng cũng nh ảnh hởng đến các yếu tố hình học và mức xám của ảnh. Ta có thể mô tả
cách mà so sánh hai ảnh của cùng một đối tợng nh hình sau.
21
Hình 2.1 Mô tả cách so sánh hai ảnh với nhau do các tác động của môi trờng
Tại vì hai ảnh lúc chụp khác nhau nên khi so sánh sụ phù hợp của hai ảnh đợc thực
hiện bằng cách ảnh chụp ban đầu đợc phát sinh thành tất cả các mẫu ảnh mà nó đáp ứng
đợc các tác động của môi trờng. Mỗi mẫu tơng ứng với một điều kiện của môi trờng
khác nhau. Để so sánh ảnh cần nhận dạng với ảnh ban đầu ta không thể thực hiện so sánh
hai ảnh trực tiếp mà ta tiến hành so sánh ảnh đó với tất cả các mẫu mà ảnh ban đầu phát
sinh. Sự phù hợp của ảnh này với một mẫu ảnh nào đó cho ta biết đợc sự phù hợp tơng
ứng với điều kiện môi trờng. Kết quả của việc so sánh này cho ta nhận ra đợc các yếu tố
nào của môi trờng đã tác động đến ảnh.
Việc phát sinh các mẫu mặt tơng ứng với các điều kiện của ánh sáng đợc thực
hiện trong quá trình đăng ký mặt mẫu và quá trình phát sinh các mặt nhân tạo nh sau:
* Phát sinh các mẫu mặt tơng ứng với các điều kiện thay đổi của ánh sáng
Trong quá trình phát sinh các mẫu mặt, hiện nay có rất nhiều kỹ thuật để tạo ra các
mẫu mặt nh là sử dụng các mặt nạ về sự thay đổi của hình học và sự thay đổi của quang
học. Với sự thay đổi về hình học cho ta đợc các mẫu mặt chụp trực diện và nó đợc phát
sinh từ một mặt nghiêng. Nhng các mặt nghiêng đó cũng cần giới hạn trong một góc thay
đổi nào đó. Nếu góc nghiêng vợt quá một ngỡng cho phép nào đó thì hệ thống không thể
thực hiện đợc. Vấn đề quan tâm chủ yếu trong phần này là các thay đổi của quang học
ảnh hởng đến mặt trong quá trình phát sinh các mẫu mặt và giả sử các thay đổi của hình
học là không ảnh hởng nhiều đến quá trình phát sinh mặt và đăng ký mặt.
đối tợn
g
ban đầu
đối tợn
g
cần
nh
ậ
n d
ạ
n
g
Tậ
p
các mẫu tơn
g
ứn
g
với
điều ki
ệ
n tác đ
ộ
n
g
22
Sự thay đổi về quang học chỉnh xửa độ xám của một điểm ảnh sử dụng một hàm phi
tuyến, và có thể phụ thuộc vào vị trí của điểm ảnh. Các sự thay đổi tuyến tính không đợc
mô hình hoá nh là các quá trình chuẩn hoá lớp ảnh (cân bằng histogram) đã tồn tại để loại
bỏ những điểm không hiệu quả. Các mặt nạ ánh sáng mô tả dới đây đợc sử dụng trong
quá trình phát sinh và đăng ký mẫu mặt. Những mặt nạ này xấp xỉ với các điều kiện ánh
sáng thực và tỏ ra rất có hiệu quả đối với các ứng dụng nhận dạng mặt. Quá trình này sử
dụng 3 kiểu mặt nạ khác nhau để mô tả các thay đổi của ánh sáng nhng nó có thể dễ dàng
mở rộng ra thành nhiều mặt nạ khác nhau:
Mặt nạ 1: Hàm logarit trên các mức xám
Mục đích của việc ứng dụng mặt nạ này để thu đợc một ảnh sáng hơn từ một ảnh
gốc. Một bảng tra cứu đợc tạo thành để thực hiện nhiệm vụ này. Toàn bộ bảng đợc tính
toán nh sau:
255
)255(
)log()255log(
)log()log(
255)(
min
min
min
min
kw
kv
k
kv
wL
+=
=
(4)
trong đó w là mức xám của ảnh và thay đổi trong [0,255], v là mức xám đợc biến
đổi trong phạm vi [k
min
,255] với k
min
0, và L(w) là mức xám thu đợc trong phạm vi
[0,255] và k
min
là một ngỡng tối thiểu nào đó giới hạn sự thay đổi của mức xám, cho phép
mức xám biến thổi không thấp hơn ngỡng k
min
.
Kết quả của thuật toán này đợc minh hoạ nh hình sau:
Hình 2.2 Biểu diễn ảnh sáng hơn so với ảnh gốc
23
Mặt nạ 2: Hàm số mũ trên các mức xám
Mục đích của ứng dụng mặt nạ này trên các mức xám để thu đợc một ảnh tối hơn
từ một ảnh gốc. Nhiệm vụ này đợc thực hiện bằng cách tạo ra một bảng tra cứu và toàn bộ
bảng đợc tính toán nh sau:
=
1)exp(
1)
255
*
exp(
255)(
max
max
k
kw
wL
(5)
trong đó w [0,255] là mức xám của ảnh, k
max
> 0, và L(w) [0,255] là mức xám
sau khi thực hiện. k
max
là giới hạn mà mức xám biến đổi cực đại.
Kết quả của thuật toán đợc minh hoạ nh hình sau:
Hình 2.3 Biểu diễn ảnh tối hơn so với ảnh gốc.
Mặt nạ 3: Sự phát sinh các mặt nạ bóng ngang và dọc
ý tởng cơ bản sau sự phát sinh các mặt nạ bóng ngang và dọc là giống nhau, do đó
chỉ cần mô tả cách tiếp cận để phát sinh hình bóng đứng theo trực hoành x. Nhiệm vụ này
chỉnh xửa giá trị mức xám của một điểm mà phụ thuộc vào không gian vị trí của điểm đó
trong ảnh. Quá trình này đợc thực hiện theo từng dòng.
Giả sử đặt độ rộng của ảnh là x và là một hệ số thực trong đó 0 < < 1. Đặt
m=*X. Khi đó chúng ta có thể định nghĩa hàm f(x) với x [0,X] nh sau:
(6)
+
=
)(
)(
1
)(
mX
mx
m
x
xf
Nếu x [0,m]
Nếu x ]m,X]
24
Nếu cho một điểm p=(x,y) có mức xám là v thì chúng ta có thể tính toán giá trị xám
của điểm tơng ứng w ở vị trí (x,y) là w=v*f(x). Bằng cách làm nh vậy, chúng ta có thể
phát sinh một ảnh trong đó m điểm đầu tiên của nó là tối hơn và các điểm còn lại là sáng
hơn. Các mặt nạ bóng ngang đợc phát sinh trong một cách tơng tự bằng cách xem xét
toạ độ điểm y, và chiều cao của ảnh là Y. Cuối cùng, kết quả thu đợc là một ảnh đã đợc
chuẩn hoá. Các ảnh dới đây minh hoạ quá trình bóng đứng với 5 giá trị của .
Hình 2.4 Các hình bóng đứng
Nh vậy với quá trình thay đổi trắc quang, hệ thống thu đợc các ảnh biến đổi theo
ánh sáng, theo các mức xám. Bên cạnh các kỹ thuật phát sinh các ảnh nhân tạo thông qua
sự thay đổi trắc quang, còn có kỹ thuật phát sinh ảnh thông qua sự thay đổi của hình học.
Cả hai kỹ thuật này đều cho đợc các mặt nạ mà các mặt nạ này dùng để phát sinh ra các
mẫu mặt và nó là dữ liệu cho quá trình đăng ký mặt.
Nói tóm lại, các kỹ thuật trên cho chúng ta đợc tập các mẫu mặt tơng ứng với các
điều kiện khác nhau của ánh sáng, nhằm giúp cho quá trình đăng ký một mặt mới. Sau khi
đăng ký hoàn thành, cơ sở dữ liệu lu trữ các mẫu mặt này giúp cho việc nhận dạng về sau
của hệ thống.
2.1.2 Cách giải quyết dựa trên kỹ thuật khoảng cách tiếp xúc
Trớc hết trong thực tế, phơng pháp khoảng cách tiếp xúc đợc sử dụng rất thành
công trong bài toán nhận dạng chữ viết tay. Trong đó hình thái của từng chữ cái là xác
định nhng do ngời viết khác nhau nên hình thái của một chữ cái cũng khác nhau.
Nhng đối với mắt thờng thì việc phân biệt sự khác nhau này là không đáng kể. Với cùng
một chữ cái, cho dù ngời nào đó có viết nh thế nào thì mắt thờng vẫn nhận đợc tại vì
hình thái của chữ cái là xác định.
Cũng tơng tự nh vậy, trong việc nhận dạng ảnh mặt ngời nếu đối với mắt thờng
thì không có gì phải bàn đến nhng đối với hệ thống nhận dạng tự động thực sự thì thế nào.
Đây là một bài toán khó mà không phải hệ thống nào cũng có thể làm đợc, tại vì các sự
thay đổi của môi trờng và sai số do hệ thống nhận dạng. Để khắc phục một số ảnh hởng