TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(39).2010
1
PHƯƠNG PHÁP XÁC ĐỊNH ĐƯỜNG ĐỐI XỨNG CỦA MẶT NGƯỜI
TRONG ẢNH SỐ
A METHOD OF FACIAL SYMMETRY LINE DETECTION ON DIGITAL IMAGES
Georgi Kukharev, Vũ Duy Linh
Trường ĐHTH kỹ thuật Điện Xanh-Petecbua – LB Nga
TÓM TẮT
Đường đối xứng của khuôn mặt đóng vai trò quan trọng trong rất nhiều bài toán trong
lĩnh vực sinh trắc học. Trên thực tế phương pháp xác định đường đối xứng một cách tương đối
thường được sử dụng, tuy nhiên trong trường hợp này đường đối xứng có thể sẽ không được
xác định một cách chính xác và sẽ dẫn đến phần trái và phần bên phải của khuôn mặt không
chính xác và tất nhiên là các bước x
ử lý tiếp theo cũng không chính xác. Chính vì thế mà chúng
ta đặt ra bài toán là phải xây dựng một phương pháp xác định chính xác và nhanh đường đối
xứng của khuôn mặt
ABSTRACT
The facial symmetry line is used as input data in many biometric applications based on
facial geometry. A method of approximate facial symmetry line localization is usually applied in
practical computer biometry. In this case, the symmetry line is often incorrectly detected. It leads
to inaccurate detection of right and left facial parts and further incorrect analyses. Therefore, the
development of reliable (accurate and fast) computer methods for facial symmetry line detection
on facial image is considered to be a highly significant task
1. Giới thiệu
Vai trò quan trọng của đường đối xứng của khuôn mặt đã được miêu tả trong các
tài liệu [1]-[4].
Đường đối xứng đó là đường chia khuôn mặt thành 2 phần trái và phải. Trong tài
liệu [1] đường đối xứng được sử dụng để xóa bóng đen trên khuôn mặt. Đường đối
xứng còn được sử dụng trong các bài toán đo đạc tính toán các vị trí trên mặt người [2].
Ví dụ nếu ta biết rõ vị trí c
ủa đường đối xứng thĩ sẽ đơn giản hóa việc xác định vị trí của
mắt trái và phải của mặt người, dễ dàng hơn trong việc xác định các góc trong và ngoài
của mắt, lông mày, cũng như các phần đối xứng khác của khuôn mặt. Các phần này
được sử dụng để xây dựng mô hình mặt người và tính chính xác của các mô hình này
phụ thuộc vào việc xác định chính xác đường đối xứng.
Khi đánh giá trạng thái tâm lý củ
a người theo khuôn mặt ta sẽ so sánh phần trái và
phải của khuôn mặt với nhau, vì thế việc xác định chính xác đường đối xứng cũng đóng
vai trò quan trọng trong bài toán này. Khi khuôn mặt ở vị trí trực diện lý tưởng, đường
đối xứng phải đi qua trung tâm của trán, giữa 2 góc trong của mắt, đi dọc mũi, giữa môi
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(39).2010
2
và cằm. Khi yêu cầu độ chính xác cao thường thì các phương pháp tương tác qua lại
được sử dụng hoặc là được làm cho chính xác bằng hình thức giao tiếp người-máy
tính [3].
Và đường đối xứng cũng chính là điểm mấu chốt trong các bài toán xác định
phương hướng của khuôn mặt [4].
Trên thực tế trong lĩnh vực sinh trắc học để xác định đường đối xứng, chủ yếu là
sử dụng phương pháp đánh giá gần đ
úng vị trí đường đối xứng.Phương pháp dựa trên
việc xác định 2 điểm cơ bản: điểm giữa của 2 đồng tử của mắt và đỉnh của mũi. Trong
trường hợp này đường đối xứng sẽ đi qua 2 điểm trên. Tuy nhiên đồng tử có thể nhìn
về hướng nào đó, còn đỉnh mũi có thể bị che khuất bởi bóng đen. Lúc đó đường đối
x
ứng sẽ không chính xác dẫn đến không xác định chính xác phần mặt trái và phải và các
bước xử lý tiếp theo sẽ không chính xác. Các phương pháp xác định chính xác hơn thì
hoặc là được xây dựng trên cơ sở có thêm sự tác động từ các thiết bị khác, hoặc không
được miêu tả một cách cụ thể trong các tài liệu kỹ thuật.
Chính vì thế trong bài báo này chúng tôi muốn giới thiệu môt phương pháp xác
định chính xác và nhanh đường đối xứng đối với khuôn mặt có vị trị thẳng tr
ực diện.
Miêu tả phương pháp. Giả sử ta có ảnh với kích cỡ M x N điểm ảnh, với M là số
hang, N là số cột. Chúng ta sẽ xem xét trường hợp khuôn mặt ở vị trí thẳng trực diện và
nằm ở trung tâm của bức ảnh.
Biểu diễn ảnh gốc trên hệ tọa độ Đề-các, chúng ta sẽ xem xét phần trọng tâm của
khuôn mặt đượ
c xác định bởi các đường Y
1,
Y
2
, X
1
và X
2.
Ảnh gốc và phần trọng tâm
được biểu diễn trong hình 1.
Hình 1.
Trong phần trọng tâm của khuôn mặt có thể xác định 3 đương đối xứng: 1 đường
toàn cục (global) xác định trục đối xứng của khuôn mặt và 2 đường cục bộ (local) các
trục đối xứng của mắt.Ảnh được biểu diễn trong hình 1 phía bên phải.
Bài toán đặt ra đối với chúng ta là xác định các đường đối xứng này – tọa độ trên
trục X.
Đường đối xứng trung tâm của khuôn mặt (ĐĐXTT). Quá trình tìm ĐĐ
XTT
được thực hiện lặp lại với t = 1, 2, 3, …, còn thuật toán ta có thể miêu tả như sau:
Trong phần trọng tâm của mặt ta chọn ra 2 vùng dọc, phải và trái «L» và «R»,
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(39).2010
3
gồm w >> 1 cột và nằm đối xứng tương ứng với ảnh gương của nó qua «x
t
» theo
trục X.
Với t = 1 trục đối xứng «x
t
» của các vùng này được xác định x
1
= (X
1
+ w), với X
1
– ranh giới bên trái theo trục X. Các vị trị tiếp theo (t = 2, 3, …) được lựa chọn như sau
(x
1
+ w) < x
t
< (x
2
– w), với w – độ rộng của vùng; N – chiều ngang của ảnh.
Như vậy ta sẽ có các cột của ảnh gốc như sau:
x
t
– 1, x
t
– 2, , x
t
– w, đối với vùng L(x
t
) ;
x
t
+ 1, x
t
+ 2, , x
t
+ w, đối với vùng R(x
t
). (1)
Tuy nhiên chúng ta sẽ lần lượt ghi các cột vào vùng «R» tương ứng với vị trị
trong (1):
x
t
+ w, …, x
t
+ 2, x
t
+ 1.
Bây giờ ta xác định khoảng cách giữa các vùng này:
d(x
t
) = || L(x
t
) – R(x
t
) ||,
∀
x
t
. (2)
Khoảng cách cũng có thể xác định như sau:
2
1
1
() ((,) (,))
Y
w
t
ijY
d x abs L i j R i j
==
=−
∑∑
,
Với L(i, j) và R(i, j) – các điểm ảnh của vùng «L» và «R»,
(3)
Vị trí X
c
trục đối xứng trung tâm của khuôn mặt sẽ tương ứng với giá trị của x
t
,
khi d(x
t
) nhận giá trị nhỏ nhất, được xác định theo công thức (2) hoặc (3):
X
c
≡ arg min d(x
t
).
(4)
Trên hình 2 biểu diễn 3 vị trí của x
t
, xuất hiện trong quá trình tìm đường đối xứng
trung tâm:
• Vị trí đầu tiên (First), với t = 1;
• Giữa (Medium), khi thỏa mãn công thức (4);
• Cuối (End), tương ứng với lần tìm kiếm cuối cùng.
Hình 2.
Phía bên phải của hình 2 biểu diễn hàm tính khoảng cách (3), trên hình có đánh
dấu vị trí của x
t
thỏa mãn công thức (4).
Cần nhớ rằng trong công thức (2) khoảng cách được tính trực tiếp theo các giá trị
đầu vào, cho nên việc thay đổi độ sang cục bộ và bề mặt của các vùng được so sánh của
khuôn mặt và các thay đổi về mặt hình học của chúng sẽ làm cho việc đánh giá khoảng
cách sẽ có sự thay đổi rõ rệt.Thay đổi độ sang có thể là các phần của khuôn mặt bị che
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(39).2010
4
khuất bới bóng đen, sự thay đổi về hình học có thể là việc thay đổi vị trị của khuôn mặt,
nghiêng 1 góc nào đó .
Chúng ta tính toán độ sáng histogram
H
(L, BIN)
và H
(R, BIN)
cho các vùng «L» và
«R», tham số BIN ≥ 16. Phương pháp này giúp cho việc đánh giá khoảng cách ít bị ảnh
hưởng hơn bởi sự thay đổi bề mặt và các thay đổi hình học trên phần được so sảnh của
khuôn mặt.
Khoảng cách giữa các Histogram có thể được tính theo công thức sau:
d(x
t
) = || H
(L, BIN)
(x
t
) – H
(R, BIN)
(x
t
) ||,
∀
x
t
. (5)
Đường đối xứng cục bộ. Việc tìm đường đối xứng cục bộ trên vùng mắt được
thực hiện cũng với thuật toán trên, sau khi tìm được đường đối xứng của khuôn mặt.
Khi đó các vùng tìm kiếm sẽ được giới hạn như sau: [X
1
; X
c
] và [X
c
; X
2
] theo trục X và
có thể giới hạn hẹp đi vùng tìm kiếm theo trục dọc. Tham số «w» cũng cần phải nhỏ
hơn.
Trong hình 3 biểu diễn kết quả tìm kiếm trục đối xứng trung tâm của khuôn mặt
cũng nhu các trục đối xứng cục bộ, kết quả của thuật toán được miêu tả phía trên.
Hình 3.
Thuật toán được thực hiện trên môi trường MATLAB đối với ảnh của tác giả bài
báo và cơ sở dữ liệu ảnh ORL [6]. Với M = 112, N = 92, còn các đường giới hạn có giá
trị sau:
Y
1
=] M/4[; Y
2
= M − Y
1
;
X
1
=] N/4[; X2 = N − X
1
,
Với ]*[ – phép tính phần nguyên.
Đối với trục đối xứng trung tâm ta chọn giá trị w = 30. Đối với các trục đối xứng
cục bộ w = 10.
Tuy nhiên khi tìm kiếm các đường đối xứng cục bộ có thể các điểm cực tiểu
không dễ dàng phân biệt. Chúng ta có thể thấy trên hình 4. Ở hình trung tâm hàng thứ 2
biểu diễn hàm khoảng cách d(x
t
), gồm 1 điểm cực tiểu toàn cục (global) và 2 điểm cực
tiểu cục bộ không được rõ ràng lắm.
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(39).2010
5
Hình 4.
Theo tọa độ của các điểm cực tiểu này thì sẽ rất khó để xác định vị trí thật của các
đường đối xứng cục bộ vì nó chứa thông tin không chỉ về trung tâm của mắt mà còn các
thông tin về các góc mắt…
Đễ xác định chính xác vị trí của các đường đối xứng cục bộ cần phải chuyển dãy
khoảng các d(x
t
) sang các dấu hiệu kết thúc. Kết quả được biểu diễn tại hàng thứ 2 trên
hình 4. Các vòng tròn đánh dấu các thời điểm thay đổi dấu hiệu kết thúc tương ứng với
3 vị trí của các đường đối xứng.
Như vậy thuật toán trên cho phép chúng ta xác định chính xác vị trí đường đối
xứng cục bô của khuôn mặt
Kết luận
Bài báo đã giới thiệu phương pháp xác định đường đối xứng của mặt người.
Phương pháp này dựa trên sự so sánh hai vùng ảnh đối xứng nhau trên khuôn mặt qua 1
số đường phân cách. Trong đó vùng thứ nhất là nguyên mẫu , vùng còn lại là đối tượng
để so sánh. Hai vùng này sẽ được dịch chuyển đồng bộ tịnh tiến theo phương nằm
ngang và sẽ ghi lại khoảng cách giữa chúng. Tìm được khoảng cách tổng thể nh
ỏ nhất
thì đường phân cách tương ứng chính là trục đối xứng của gương mặt.
Việc đánh giá khoảng cách giữa các vùng được thực hiện bằng 2 phương pháp: so
sánh trực tiếp hoặc sử dụng phương pháp histogram. Trong bài báo chỉ ra rằng phương
pháp histogram giúp cho việc so sánh chinh xác và không dễ bị thay đổi bởi sự thay đổi
bề mặt và các thay đổi hình học trên phần được so sảnh của khuôn mặt. Phương pháp
này hoàn toàn mới và chư
a được biết đến trong các tài liệu kỹ thuật khác.
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(39).2010
6
TÀI LIỆU THAM KHẢO
[1] Young-Jun Song,Young-Gil Kim., Un-Dong Chang, Heak Bong Kwon. «Face
recognition robust to left/right shadows; facial symmetry», Pattern Recognition 39
(2006), 1542 – 1545
[2] Liu
Y., S. Mitra. Facial Asymmetry Quantification for Expression Invariant Human
Identification - Journal Computer Vision and Image Understanding, Vol. 91, No.
1/2, July, 2003, pp. 138 – 159
[3] Ekaterina Kamenskaya, Georgy Kukharev. Recognition of psychological
characteristics from face. Metody Informatyki Stosowanej, nr 2/2008, pages 59-73,
Poland, May 2008.
[4] Rajinda Senaratne and Saman Halgamuge.
Driver Fatigue Detection by Fusing
Multiple Cues. - Lecture Notes in Computer Science
, Volume 4492/2007, pp. 801-
809
[5] Georgy Kukharev. “Các hệ thống nhận dạng: Phương pháp và môi trường nhận
dạng đặc điểm riêng của người ”. – Saint-Petersburg – 240 trang (2001).
[6] The ORL database. - www.uk.research.att.com/pub/data/att_faces.zip.