Tải bản đầy đủ (.pdf) (125 trang)

Hệ thống phát hiện khuôn mặt dựa trên mạng neural và phương pháp vân vùng màu da

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (957.15 KB, 125 trang )

1
TĨM TẮT

Phát hiện khn mặt là một vấn đề cơ bản trong ngành học quan sát bằng
máy tính. Là một trong những giai đoạn của hệ thống nhận dạng mặt người cùng
với nhiều ứng dụng rộng rãi và phổ biến khác như chỉ số hóa nội dung trong
ảnh, hệ thống giám sát, hội thảo truyền hình…, phát hiện khn mặt đã và đang
dành được sự quan tâm nghiên cứu của nhiều người trong suốt hai thập kỷ qua.
Tuy nhiên, với những thách thức rất lớn gây ra do tính biến động của mơi trường
cũng như tính biến đổi cao của khn mặt, phát hiện mặt người vẫn đang là một
trong những vấn đề mở đối với các nhà nghiên cứu. Và cho đến nay vẫn chưa có
một phương pháp nào thực sự giải quyết hết các thách thức của phát hiện khn
mặt. Nhiều cải tiến, nhiều đề xuất đã được đưa ra nhằm cải thiện chất lượng phát
hiện khn mặt. Và một trong những cải tiến đó là dựa trên những đặc điểm bất
biến hoặc có sự biến động có thể phân vùng được của khn mặt mà màu da của
con người chính là một trong những đặc điểm đó.
Xuất phát từ ý tưởng kết hợp giữa màu da và một phương pháp phát hiện
khn mặt hiệu quả, đồ án đã tập trung xây dựng một hệ thống kết hợp giữa hệ
thống phát hiện khn mặt dựa trên mạng neural và phương pháp phân vùng
màu da dựa trên mơ hình màu da có tham số sử dụng phân phố Gaussian.
Hệ thống phát hiện được xây dựng về cơ bản có ngun tắc hoạt động
theo mơ hình mạng neural kinh điển. Đó là mơ hình mạng neural Perceptron đa
lớp, sử dụng thuật tốn lan truyền nguợc và phương pháp giảm gradient để học
mạng. Về cơ bản kiến trúc mạng neural xây dựng khơng có gì thay đổi, tuy
nhiên, ở đây chúng ta sẽ cải tiến kiến trúc một điểm với việc sử dụng thêm mơ
hình xác suất dựa trên lý thuyết Bayes để có thể có sự mềm dẻo hơn trong việc
đánh giá kết quả cuối cùng của mạng. Ngồi ra, đồ án cũng nêu ra một chiến
thuật huấn luyện hợp lý, cho phép huấn luyện nhanh mà vẫn đảm bảo được tính
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
2
tng quỏt v hiu qu ca mng. ú l chin thut hun luyn mng ch ng cú


hc.
Phng phỏp phõn vựng mu da c kt hp vo h thng nh l mt
gii hn cho phộp gim khụng gian tỡm kim, tc l khuụn mt s ch c tỡm
kim trờn cỏc vựng mu da. Vic phõn vựng ny ó giỳp cho thi gian phỏt hin
ca h thng ci thin ỏng k, hn na nú cũn giỳp cho h thng hot ng hiu
qu hn.
giỳp cho kt qu phỏt hin c rừ rng v cht lng, ỏn cng ó
nờu ra cỏc heuristic c th phự hp cho h thng, Nhng heursitic ny da trờn
kt qu thc t cng nh thng kờ ca quỏ trỡnh hun luyn v kim th h
thng.
ỏn vi tờn gi l H thng phỏt hin khuụn mt da trờn mng
neural v phng phỏp võn vựng mu da c b cc lm nm mc chớnh.

Chng I: Gii thiờu L chng gii thiu, bao gm ba phn nh.
Phn u l tng quan cỏc hng tip cn, cỏc phng phỏp phỏt hin mt ngi
ó c xut. Phn hai l tng quan cỏc phng phỏp phõn vựng mu da da
trờn tớnh cht im nh. Qua phn ny vi nhng ỏnh giỏ cỏc phng phỏp s
giỳp chỳng ta chn c phng phỏp phõn vựng phự hp cho h thng. Phn
ba s l c s lý thuyt c bn nht v mng neural MPL v thut toỏn lan truyn
ngc. õy l kin trỳc mng v thut toỏn s c s dng cho h thng mng
neural ca ỏn.
Chng II: Tng th hot ng ca h thng v vn chun b c s
d liu õy l chng miờu t mụ hỡnh thut toỏn hot ng tng th nht ca
h thng s c xõy dng. ng thi s cp vn chun b v tin x lý
cho cỏc tp c s d liu oc dựng hun luyn mng neural cng nh luyn
tp phõn vựng mu da. õy l mt trong nhng cụng vic quan trng quyt nh
n cht lng ca h thng.
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
3
Chương III: Phát hiện khn mặt dựa trên mạng neural và phương

pháp phân vùng màu da – Đây là chương quan trọng nhất của đồ án. Nó sẽ
miêu tả đầy đủ kiến trúc hệ thống được xây dựng. Thuật tốn và phương pháp
huấn luyện mạng neural. Thuật tốn và phương pháp huấn luyện phân vùng màu
da. Và sẽ đề xuất ra những heuristic giúp cải thiện chất lượng phát hiện và thời
gian chạy của hệ thống.
Chương IV: Phân tích thiết kế và cài đặt chương trình
Chưong V: Khảo sát thực nghiệm và đánh giá chương trình – Đây là
chương sẽ miêu tả kết quả việc kiểm thử chương trình dựa trên bộ test chuẩn và
bộ test tự tạo. Đồng thời sẽ có những đánh giá và nhận xét về kết quả của
chương trình.
Kết luận và hướng phát triển

Trong phạm vi bài đồ án, với việc hệ thống được xây dựng trên một mạng
neural đơn lẻ, vì vậy em đã tiến hành huấn luyện cho mạng nhận biết những
khn mặt với tư thể nhìn thẳng (frontal), có độ nghiêng và góc quay khơng
đáng kể. Các khn mặt có thể có nhiều trạng thái khác nhau. Các ảnh được
dùng để kiểm thử bao gồm cả ảnh chân dung và ảnh tập thể. Ảnh khơng và có
nhiễu (tự thêm) để kiểm tra thêm về tính hiệu quả của hệ thống. Các ảnh được
kiểm thử có kích thước bao gồm 240 x 180, 320 x 240, 480 x 360 điểm ảnh.
Với bộ test bao gồm 300 ảnh chân dung kích thước 320 x 240; 320 ảnh
này đựoc thêm nhiễu, 320 ảnh này được thu nhỏ lại kích thước 240 x 180 để
kiểm tra hệ thống có thể phát hiện các khn mặt có kích thước khác nhau, 320
ảnh này được thêm nhiễu.
Ngồi tập ảnh chân dung chuẩn ra, chương trình còn test với 100 ảnh tập
thể tự tạo với nhiều mục đích khác nhau. 100 ảnh này cũng được thêm nhiễu để
tiến hành kiểm thử.

THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
4


CHNG I: GII THIU

1. Tng quan v cỏc phng phỏp phỏt hin mt ngi

1.1 Phỏt hin mt ngi v ng dng
Nhn bit i tng núi chung v nhn bit mt ngi núi riờng l bi
toỏn c bn v quan trng trong lnh vc quan sỏt bng mỏy tớnh. Nhn bit mt
ngui thu hỳt s tp trung nghiờn cu ca nhiu nh nghiờn cu trong sut nhiu
thp k qua. Tuy nhiờn vn cha cú mt hng tip cn no thc s trn vn
mang li hiu qu v gii quyt ht cỏc thỏch thc v tỡnh hung trong vn
phỏt hin mt ngi, nguyờn nhõn l do tớnh bin i cao ca khuụn mt con
ngi. Chớnh vỡ vy, õy vn l vn m v tip tc thu hỳt s nghiờn cu sõu
hn vi cỏc k thut mi c xut. Cỏc k thut ó c ỏp dng cú th chia
thnh mt trong hai tip cn: so sỏnh s phự hp vi cỏc mụ hỡnh hỡnh hc hai,
ba chiu vo nh, hay phng phỏp so sỏnh s phự hp cỏc mụ hỡnh khung nhỡn
vo nh cú cha khuụn mt cn nhn bit. Cỏc nghiờn cu trc õy cho thy
rng cỏc hng phỏp da trờn khung nhỡn cú th nhn bit cỏc khuụn mt thng
trong nn phc tp mt cỏch hiu qu.
Vi mc ớch tn dng nhng u im ca cỏc k thut ó uc xut,
kt hp chỳng li cú th xõy dng uc mt h thng phỏt hin mt ngi
mt cỏch hiu qu. ỏn ó tp trung vo vn phỏt hin mt ngi trong nh
mu tnh, nhm kt hp nhng c trng ca mt ngi trong nh mu c th l
s dng k thut phõn vựng mu da ngi trong nh mu kt hp vi hng tip
cn da trờn khung nhỡn vi mc ớch s dng mng neural nhõn to - mt
phng phỏp tuy kinh in nhng vn rt m v cha ng nhiu u im trong
vn nhn dng, xõy dng h thng phỏt hin mt ngi.
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
5
Kỹ thuật phân vùng da nguời trong ảnh màu được áp dụng trong hệ thống
nhận biết mặt người với mục đích cuối cùng là giảm khơng gian tìm kiếm mặt

người trong ảnh, giúp cho hiệu năng hoạt động của hệ thống được nâng cao hơn.
Còn ưu điểm nổi bật của mạng neural nhân tạo nói riêng và phướng tiếp cận dựa
trên máy học nói chung trong việc phát hiện mặt nguời đó là có thể miêu tả và
phát hiện khn mặt trong nhiều tình huống khác nhau. Những tình huống gặp
phải khi phát hiện khn mặt bao gồm:
 Tư thế của khn măt (Pose): Khn mặt là nghìn thẳng (frontal),
nghiêng một phần (partial profile) hay nghiêng hồn tồn (full profile).
Khn mặt hướng thẳng đứng (upright) hay là khn mặt xoay một góc
nào đó (rotate)
 Nội dung khn mặt: Khn mặt chứa đầy đủ các đặc trưng như mắt,
mũi, miệng, tai hay thiếu một vài đặc trưng nào đó.
 Trạng thái của khn mặt: Đó chính là trạng thái tình cảm của khn
mặt như cuời, khóc, tức giận…
Đây là những tình huống mà các hướng tiệp cận khác phải mất nhiều cơng
sức và phức tạp để có thể miêu tả được. Nhưng với mạng neural, thơng qua tập
mẫu và q trình huấn luyện mạng hiệu quả, kết quả mang lại là có thể rất khả
quan.

Ứng dụng
Cơng nghệ nhận biết mặt người có sự ứng dụng rộng rãi trong thực tế.
Trong nhận dạng sinh trắc học, trong hội thảo truyền hình, trong chỉ số hố ảnh
và cơ sở dữ liệu video, trong tương tác người máy. Nhận biết mặt người là giai
đoạn đầu trong hệ thống nhận dạng mặt người.
Hai bài tốn nhận biết và nhận dạng đối tượng có liên quan mật thiết. Hệ
thống nhận dạng đối tượng có thể xây dựng mà khơng có tập bộ nhận biết đối
tượng, mỗi bộ nhận biết phát hiện một đối tượng quan tâm. Tương tự, bộ nhận
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
6
biết đối tượng có thể được xây dựng mà khơng có hệ thống nhận dạng đối tượng;
bộ nhận dạng đối tượng này cần phân biệt đối tượng mong muốn với mọi đối

tượng khác có thể xuất hiện hay là lớp đối tượng chưa biết. Do đó hai bài tốn là
như nhau, dù trong thực hành hầu hết các hệ thống nhận dạng đối tượng ít khi
giải quyết nền tuỳ ý, và các hệ thống nhận biết đối tượng ít khi được huấn luyện
trên đủ loại đối tượng để xây dựng hệ thống nhận dạng. Điểm chú trọng khác
nhau của các bài tốn này dẫn đến các trình bày và thuật tốn khác nhau.
Thơng thường, các hệ thống nhận dạng khn mặt làm việc bằng cách
trước hết áp dụng bộ nhận biết khn mặt để định vị khn mặt, sau đó áp dụng
thuật tốn nhận dạng để nhận diện khn mặt.

1.2 Các thách thức trong vấn đề phát hiện mặt người
Việc nhận biết đối tượng là bài tốn xác định cửa sổ con của ảnh có thuộc
về tập các ảnh của đối tượng quan tâm hay khơng. Do đó, đường biên quyết định
của tập ảnh đối tượng phức tạp sẽ làm tăng độ khó của bài tốn và có thể tăng số
lỗi nhận biết. Giả sử ta muốn phát hiện khn mặt nghiêng trong mặt phẳng ảnh,
ngồi các khn mặt thẳng. Việc thêm các khn mặt nghiêng vào tập các ảnh ta
muốn nhận biết làm tăng độ biến thiên của tập, và có thể làm tăng độ phức tạp
của đường biên quyết định của tập ảnh. Độ phức tạp này làm bài tốn nhận biết
khó hơn. Việc thêm ảnh mới vào tập ảnh đối tượng có thể làm đường biên quyết
định đơn giản hơn và dễ học hơn. Có thể tưởng tượng điều này là đường biên
quyết định được làm trơn bằng việc thêm các ảnh vào tập. Có nhiều nguồn biến
đổi trong bài tốn nhận biết đối tượng, và cụ thể trong bài tốn nhận biết khn
mặt. Có các nguồn biến đổi sau [6]:
 Biến đổi trong mặt phẳng ảnh: loại biến đổi ảnh khn mặt đơn giản
nhất có thể được biểu diễn độc lập với khn mặt, bằng cách quay, dịch
chuyển, biến đổi tỷ lệ và lấy đối xứng ảnh.
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
7
 Biến đổi độ sáng và ngữ cảnh: biến đổi do đối tượng và mơi trường gây
ra, cụ thể các thuộc tính bề mặt của đối tượng và các nguồn sáng. Các thay
đổi về nguồn sáng nói riêng có thể biến đổi hồn tồn vẻ bề ngồi của

khn mặt.
 Biến đổi nền: Nhiều nhà nghiên cứu cho răng với kỹ thuật nhận dạng mẫu
hiện nay, tiếp cận dựa trên khung nhìn để nhận biết đối tượng chỉ thích
hợp cho các đối tượng có “đường biên ảnh có thể dự đốn được”. Khi đối
tượng có hình dáng dự đốn được, ta có thể trích ra window chỉ chứa các
pixel bên trong đối tượng, và bỏ qua nền.
 Biến đổi hình dáng: với khn mặt, loại biến đổi này bao gồm biểu lộ
tình cảm khn mặt, miệng và mắt mở hay đóng, và hình dáng khn mặt
của từng người.



1.3 Các vấn đề liên quan đến phát hiện mặt người
Bên cạnh vấn đề phát hiện mặt người, có nhiều vấn đề khác có quan hệ
mật thiết với phát hiện mặt người mà nhiều khi gây ra nhầm lẫn nếu khơng được
tìm hiểu một cách kỹ càng.
Những vấn đề đó bao gồm [7]
 Định vị khn mặt hay xác định vị trí khn mặt: Đây là vấn đề rất
gần với vấn đề phát hiện mặt người. Nếu như phát hiện mặt người trong
ảnh là phải trả lời các câu hỏi có tồn tại khn mặt trong ảnh hay khơng ?
Nếu tồn tại thì tồn tại bao nhiêu khn mặt? Vị trí của khn mặt ở đâu ?
Thì vấn đề định vị mặt người chỉ trả lời cho câu hỏi vị trí mặt người ở đâu
trong một ảnh đã biết trước là có một mặt người . Như vậy có thể thấy,
định vị khn mặt là một phần cơng việc của phát hiện mặt người.
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
8
 Phát hiện các đặc trưng của khuôn mặt: Đây là vấn đề cũng rất gần với
vấn đề định vị khuôn mặt. Nó cũng giả thiết rằng chỉ có một khuôn mặt
trong ảnh. Và việc phát hiện đặc trưng khuôn mặt là tìm ra vị trí của các
đặc trưng như đôi mắt, mũi, miệng, môi, tai…

 Bám sát khuôn mặt: Mục đích của vấn đề này là ước lượng liên tục sự
thay đổi về vị trí và huớng của khuôn mặt trong một chuỗi ảnh thời gian
thực.
 Nhận biết trạng thái khuôn mặt: Mục tiêu của vấn đề này là nhận biết
trạng thái của khuôn mặt con người (hạnh phúc, tức giận, đau khổ…). Đây
là vấn đề rất khó và thú vị vì trạng thái khuôn mặt của từng người có thể là
rất khác nhau trong cùng một trạng thái tâm lý.
 Nhận dạng khuôn mặt: Trong vấn đề này, chúng ta phải đối sánh khuôn
mặt cần nhận dạng với các khuôn mặt có sẵn trong thư viện và tìm ra
nhưng thông tin cần thiết về khuôn mặt cần nhận dạng nếu nó có đăc trưng
tương đồng với khuôn mặt nào đó trong thư viện.
 Thẩm tra và xác minh khuôn mặt: Đây là vấn đề nằm trong vấn đề nhận
dạng khuôn mặt. Thông thường sau khi nhận dạng khuôn mặt, người ta
phải tiến hành một giai đoạn nữa gọi là thẩm tra và xác minh tính đúng
đắn của khuôn mặt được nhận dạng. Nó cho phép tăng sự đúng đắn của
vấn đề nhận dạng khuôn mặt.
Trong những vấn đề nêu trên, có thể thấy nhận biết khuôn mặt và nhận
dạng khuôn mặt là hai vấn đề cơ bản và có thể chứa đựng các vấn đề còn lại. Và
thông thường, nhận biết khuôn mặt sẽ là giai đoạn đầu của hệ thống nhận dạng
khuôn mặt. Sự khác nhau cơ bản giữa phát hiện khuôn mặt với nhận dạng khuôn
mặt đó là: Nếu như nhận dạng khuôn mặt là phân biệt những khuôn mặt khác
nhau trong tập danh mục các khuôn mặt, còn nhận biết khuôn mặt đó là phân lớp
đuợc đâu là danh mục các khuôn mặt và đâu là danh mục các ảnh không phải
khuôn mặt.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
9

1.4 Tnq quan cỏc hng tip cn phỏt hin khuụn mt
Trong sut quỏ trỡnh hn ba thp k, ó cú rt nhiu cỏc hng tip cn v
x lý khỏc nhau c xut gii quyt bi toỏn phỏt hin mt ngi. Cỏc

hng tip cn v x lý thụng thng nhm gii quyt nhng yờu cu c th v
khỏc nhau ,trong tng ng dng c th. Chớnh vỡ vy cú nhiu cỏch cú th
phõn loi cỏc phng phỏp, cỏc k thut, cỏc hng tip cn phỏt hin khuụn
mt. Trong bi lun vn ny, s phõn loi cỏc hng tip cn theo phng phỏp
c s dng nhiu nht. ú l chia cỏc hng tip cn theo hai hng chớnh:
Hng tip cn da trờn c trng ca nh (Feature-based) v hng tip cn
da trờn thụng tin xut hin trờn nh (Image-based).
Cỏc phng phỏp, k thut phõn chia theo cỏch ny cú th nhỡn thy trong
s di õy [7]:















THệ VIEN ẹIEN Tệ TRệẽC TUYEN
10

























Hình 1: Sơ đồ các hướng tiếp cận và phương pháp phát hiện mặt
người
1.4.1 Hướng tiếp cận dựa trên đặc trưng của ảnh (Feature-based
approaches)
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
11
Phương pháp tiệp cận dựa trên đặc trưng của khuôn mặt được chia thành
ba vấn đề. Giả sử cần phải phát hiện một khuôn mặt trong một nền ảnh lộn xộn,
phân tích mức thấp (low-level analysis) thực hiện phân đoạn các đặc trưng của
ảnh dựa trên những thuộc tính của điểm ảnh như độ xám hay màu sắc. Sự phân

đoạn lúc này còn mập mờ và chưa rõ ràng. Vấn đề thứ hai là phân tích đặc trưng,
các đặc trưng của ảnh được tổ chức thành các đặc trưng khuôn mặt có tính tổng
quát hơn dựa trên đặc tính hình học của khuôn mặt. Sau giai đoạn này, tính mập
mờ của các đặc trưng của ảnh đã được giảm bớt, đồng thời, vị trí khuôn mặt
cùng với các đặc trưng khuôn mặt đã được xác định. Tiếp theo sẽ là việc sử dụng
mô hình hình dạng (active shape models). Những mô hình này bao gồm từ mô
hình dạng rắn (snakes - được đề xuất vào những năm 80) cho tới mô hình phân
tán điểm (PDM – Point Distributed Model) được đề xuất vào những năm gần đây
để trích chọn đặc trưng có sự biến động phức tạp như mắt, môi,…

1.4.1.1 Phân tích mức thấp (Low-level analysis)
Người ta gọi là phân tích mức thấp vì việc phân tích ở đây là phân tích dựa
trên các đặc trưng rất cơ bản và mang tính trực quan, những đặc trưng đó bao
gồm biên ảnh, thông tin đa mức xám, màu sắc, chuyển động, tính đối xứng của
khuôn mặt.

1.4.1.1.1 Biên ảnh (Edges)
Đây là một đặc trưng cơ bản nhất trong các ứng dụng về xử lý ảnh, sử
dụng biên để phát hiện khuôn mặt được thực hiện đầu tiên bởi Sakai. Dựa trên
việc phân tích các đường ảnh của khuôn mặt, với mục đích là định vị những đặc
điểm trên khuôn mặt. Một mô hình được đề xuất để tìm ra những đường nét của
mặt người. Công việc tìm ra hình dáng của mặt người được triển khai bao gồm
một đường cong bám sát vào khuôn mặt với một độ cong xác định và ràng buộc
để tránh sự ảnh hưởng của các nhiễu biên. Những đặc tính của đương trong hình
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
12
dỏng ca u ngi sau ú c a ra phõn tớch c trng s dng nột v
v trớ ca khuụn mt. K thut dũ tỡm da vo ng biờn ny cũn c ỏp dng
phỏt hin cp kớnh trờn khuụn mt.
Trong hng tip cn phỏt hin mt ngi da vo ng bin, nhng

ng biờn cn c gỏn nhón v c phự hp vi mụ hỡnh khuụn mt c
sp xp cú th giỳp chỳng ta xỏc minh s ỳng n ca vic phỏt hin ú.
Ngi ta cú th thit lp s gỏn nhón biờn ú bng cỏc s dng mt trỏi, ng
túc hoc mt phi ca khuụn mt. Vic gỏn nhón ny lm cho kh nng phỏt hin
chớnh xỏc khuụn mt trong mt bc nh vi khụng gian phc tp v cú nhiu
khuụn mt.
Mt trong nhng phng phỏp c bit n ú l phng phỏp gỏn nhón
ca Govindaraju, phng phỏp ny s dng h s vng ca khuụn mt lý tng ,
ú l h s gia di v rng ca khuụn mt:


(I.1)

S dng phng phỏp ny, ngi ta ó kim th 60 nh cú nn phc tp
bao gm 90 khuụn mt thỡ thy kh nng h thng cú th phỏt hin chớnh xỏc l
76% vi mc trung bỡnh l sai 2 mt li / nh.
1.4.1.1.2 Thụng tin a mc xỏm (Grayscale Information)
Bờn cnh ng biờn, thỡ thụng tin v mc xỏm trong khuụn mt cng cú
th c xem nh l mt c trng. Nhng c trng khuụn mt nh l lụng
my, ng t hay, mụi thng xut hin vi mc xỏm ln hn nhng thnh phn
ph cn bao quanh chỳng. Tớnh cht ny cú th c khai thỏc phõn bit cỏc
thnh phn khỏc nhau ca khuụn mt. Nhng thut toỏn trớch chn c trng
khuụn mt gn õy thng da vo mc xỏm nh nht trong mt vựng khuụn
mt. Trong nhng thut toỏn ny, bc nh u vo u tiờn c ci thin bng
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
13
viêc làm tăng độ tương phản và biến hình mức xám (gray-scale morphological)
để có thể tăng độ tối của những vùng nói trên, từ đó việc nhân biết sẽ dễ dàng
hơn. Những vùng tối này được trích chọn bằng phép lấy ngưỡng dưới. Bên cạnh
đó, người ta đã tiến hành xây dựng hệ thống tự động tìm kiếm các vùng tối thuộc

mặt thông qua sự phân tích về màu sắc. Hệ thống sử dụng một mẫu mắt gán
trọng số để xác định cac vị trí có thẻ có của cặp mắt.

1.4.1.1.3 Màu (color)
Trong khi thông tin về mức xám được xem là một đặc trưng cơ bản của
ảnh, màu sắc có ý nghĩa nhiều trong việc nhận biết sự xuất hiện của đối tượng.
Một trong những không gian màu được biết đến rỗng rãi nhất đó là không gian
RGB, đó là không gian mà mỗi màu được đĩnh nghĩa bởi sự kết hợp của ba
thành phần màu là Red, Green và Blue. Do đó sự thanh đổi chủ yếu trong màu
sắc của da đó là do sự thay đổi về độ chói, thông thường các màu RGB được coi
trọng hơn, do đó, ảnh hưởng của độ chói có thể được lọc bỏ. Người ta có thể
chuẩn hóa các thành phần màu từ RGB thành rgb như sau:



(I.2)



Từ hệ thức trên chúng ta có thể thấy rằng r+g+b = 1. Việc chuẩn hóa màu
này có ý nghĩa là, chỉ cần viết hai trong số ba giá trị trên là chúng ta có thể tìm ra
giá trị còn lại. Trong việc phân tích màu sắc của da, một biểu đổ màu dựa vào r
và g chỉ ra rằng màu của khuôn mặt tập trung thành một cụm nhỏ trong biểu đồ
mức xám. Để so sánh thông tin màu của một pixel với giá trị của r và g trong
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
14
cụm trên, và từ đó tạo ra khả năng các pixel thuộc vùng da của mặt có thể được
tìm ra.
Bên cạnh mơ hình RGB, chúng ta còn có một vài mơ hình màu khác được
sử dụng trong việc nghiên cứu vấn đề nhận dạng mặt người. Mơ hình HIS là một

ví dụ, mơ hình này có những ưu điểm so với các mơ hình khác trong việc mang
lại sự phân biệt rõ ràng giữa các cụm màu của các đặc trưng khn mặt. Do đó
mơ hình này thường được sử dụng cho cơng việc trích chọn đặc trưng của khn
mặt như mơi, mắt, lơng mày. Do việc này có quan hệ chặt chẽ với việc cảm thụ
màu sắc ở con người, nó cũng được sử dụng phổ biến trong các sơ đồ phần vùng
khn mặt.
Một mơ hình khác được biết đến trong việc áp dụng để nhận dạng khn
mặt đó là mơ hình YIQ. Để chuyển đổi từ khơng gian màu RGB sang khơng gian
YIQ, chúng ta thấy có thành phần I, đó là khoảng màu từ cam (orange) -> xanh
lơ (Cyan), giống như khoảng màu của da người châu á. Việc chuyển đổi này
cũng ảnh hưởng tới việc triệt tiêu nền các màu khác và cho phép nhận biết những
khn mặt nhỏ trong một mơi trường tự nhiên. Các mơ hình màu khác cũng
được áp dụng cho việc nhận biết mặt người còn có HSV, YES, YCrCb, YUV,
CIE-xyz, L*u*v, CSN và UCS(Farnsworth).
Việc phân vùng màu có thể được thực hiện bằng việc sử dụng các ngưỡng
xấp xỉ màu khi màu da được mơ hình hóa thơng qua biểu đồ mức xám. Phương
pháp phức tạp hơn đó là sử dụng phương pháp tính tốn thống kê, sự thay đổi
khn mặt của mơ hình là trong một phổ rộng. Người ta đã tiến hành sử dụng
phân phối Gaussian để tập hợp hàng ngàn mẫu màu của da từ các lồi khác nhau.
Phân phối Gaussian được đặc trưng bởi vector trung bình µ và ma trận hiệp
phương sai ∑. Màu của điểm ảnh từ ảnh đầu vào có thể được so sánh với màu
da của mơ hình bằng cách tính hệ số khoảng cách Mahalanobis. Hệ số này sẽ cho
biết độ tương đồng của màu pixel với màu da của mơ hình.
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
15
Một ưu điểm của mơ hình màu dựa vào phương pháp thống kê đó là sự sai
khác về màu của những đối tượng mới có thể được phù hợp vào mơ hình bằng
phương pháp huấn luyện. Sử dụng phương pháp này, sự nhận biết màu có thể sẽ
hiệu quả hơn, chống lại sự thay đổi của các nhân tố mơi trường như là điều kiện
chiếu sáng và đặc tính riêng của máy ảnh.


1.4.1.1.4 Chuyển động
Nếu như chúng ta phát hiện khn mặt cho video, khi đó thơng tin về sự
chuyển động, cử chỉ, dáng điệu có ý nghĩa rất lớn trong việc xác định đối tượng
chuyển động. Các chuyển động liên tục kế nhau được phân chia bằng việc phân
tích các frame khác nhau. Hướng tiếp cận này, nói chúng là khá đơn giản, được
hộ trợ để phân biệt một chuyển động cận cảnh và có hiệu quả khơng phụ thuộc
điều kiện nội dung bối cảnh. Bên cạnh vùng mặt, người ta còn tiến hành thực
hiện trên nhiều frame khác nhau để định vị các đặc trưng của khn mặt. Như là
trạng thái của đơi mắt bằng cách tính tốn độ lớn về chiều ngang và chiều dọc
giữa những vùng liên tiếp nhận được trong các frame khác nhau.
Một cách khác để có thể tính tốn các chuyển động trực quan đó là thơng
qua việc ước lượng sự chuyển động của các đường viền của ảnh. So sánh các
frame khác nhau, kết quả có được từ sự chuyển động của các đường viền là có
thể tin cậy, đặc biệt là khi chuyển động đó là khơng quan trọng. Một bộ lọc
Gaussian có tính khơng gian và thời gian được sử dụng bởi hệ thống McKenna
để phát hiện chuyển động của vùng bao khn mặt cũng như vùng bao tồn bộ
cơ thể con người. Tiến trình này u cầu giá trị mức xám của ảnh I(x,y) với một
tốn tử biên phụ thưộc thời gian m(x,y,t) được định nghĩa từ bộ lọc Gaussian
G(x,y,t) như sau:


(I.3)
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
16



Trong ú u l h s thi gian, a l rng b lc. Toỏn t biờn ph thuc
thi gian sau ú c nhõn chp vi cỏc frame ca nh theo bi cụng thc:


(I.4)

Kt qu ca tin trỡnh x lý min thi gian ny S(x,y,t) s cho ta mt ch
s trc tip ca s chuyn ng biờn trong I(x,y,t).
Mc dự phng phỏp ny miờu t vic nhn bit biờn v vựng chuyn
ng, nhng chỳng cng cho phộp chỳng ta tin vo s chớnh xỏc ca vic c
lng tc ca chuyn ng lung sỏng hay cũn gi l lung quang (optical
flow). Bi vỡ vic c lg ny da trờn cỏc mu chuyn ng trong mt khong
ngn, v cú cm giỏc nh chuyn ng ú l rt trn v mn. Da vo thụng tin
ca chuyn ng, khuụn mt chuyn ng trong nh tun t c phõn vựng.
Lung quang c mụ hỡnh bi lung nh vi phng trỡnh rng buc sau õy:

(I.5)
Trong ú, Ix, Iy v It l cỏc o hm min thi gian ca cng nh v
Vx v Vy l tc chuyn nh. gii phng trỡnh trờn cho Vx, Vy, mt vựng
bao gm cỏc im nh chuyn ng theo mt qu o c ghi nhn. Nhng
vựng ỏp ng ti nhng qu o chuyn ng khỏc nhau c phõn lp trong
vựng chuyn ng v vựng khụng chuyn ng.

1.4.1.1.5 Tiu chun suy rng (Generalized Measure)
Nhng c trng trc quan nh ng biờn, mu sc hay chuyn ng l
giai on u tiờn trong h thng quan trc con ngi. Quỏ trỡnh ny cho phộp
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
17
nhng thụng tin trc quan c t chc li thnh nhng nhúm hot ng mc
cao. Da vo vic quan sỏt, Reisfeld ó xut rng mt h thng quan sỏt bng
mỏy nờn c bt u vi vic tớnh toỏn mc thp giai on tin tp trựng cỏc
tớnh cht nh c tng hp. Ban u, Reisfeld v Yeshurun ó gii thiu mt
toỏn t i xng tng quỏt da vũ toỏn t im bin. Do nhng c trng ca

khuụn mt cú tớnh i xng mt cỏch t nhiờn. Khi thc hin, toỏn t i xng
ny s tớnh toỏn v gỏn cho mi im nh mt cng gi l cng im
nh da trờn mc nh hng ca vựng bao im dú. Cng i xng ú ,
M

(p), cho mi im nh c xỏc nh bng:


(I.6)

Trong ú, C(i,j) l mc nh hng ca vựng biờn im i,j (ca pixel)
trong tp cỏc pixel c nh ngha bi (p). Nú c xỏc nh theo cụng thc:


(I.7)



Trong ú, D(i,j) l hm h s di, P(i,j) l hm h s phase, r
i
v r
j
c
xỏc nh theo cụng thc di õy:




(I.8)
THệ VIEN ẹIEN Tệ TRệẽC TUYEN

18





Trong đó p
k
chỉ điểm (x
k
, y
k
) với k = 1…K, là gradient của cường độ
tại điểm p
k

ij
là góc theo chiều ngược kim đồng hồ giữa đường thằng qua pi và
pj so với mặt ngang. Hình dưới đây miêu tả một ví dụ về cách tính M
σ
(p) từ
gradient của mătj trước ảnh mặt người. Cường độ đối xứng được tham chiếu một
cách rõ ràng thể hiện sự định vị các đặc trưng của khuôn mặt như là mắt và
miệng.

1.4.1.2 Phân tích đặc trưng (Feature analysis)
Những đặc trưng được tạo ra từ quá trình phân tích mức thấp thực ra là
không rõ ràng. Quả vậy, trong việc định vị vùng mặt sử dụng mô hình màu da,
các đối tượng có cùng màu nền tương tự như màu da có thể cũng được nhận biết.
Điều này có thể được giải quyết bằng việc phân tích mức cao. Trong nhiều kỹ

thuật nhận biết khuôn mặt, những tích lũy hiểu biết hình thái về khuôn mặt đó sẽ
được áp dụng để có thể đặc tính hóa và để xác minh lại những đặc trưng đó từ
những trạng thái mập mờ. Có hai hướng tiếp cận trong ứng dụng về hình thái
khuônn mặt. Hướng tiếp cận đầu tiên liên quan đến chiến lược truy tìm đặc trưng
dựa vào mối quan hệ về vị trí dựa các đặc trưng. Những đặc trưng được nhận
biết nhờ các đặc trưng đã tồn tại. Kỹ thuật thứ hai đó sử dụng kỹ thuật nhóm đặc
trưng thnàh các “chòm sao” bằng cách sử dụng một số mô hình khuôn mặt khác
nhau.

14.1.2.1 Tìm kiếm đặc trưng
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
19
Vic truy tỡm cỏc c trng ca khuụn mt l truy tỡm cỏc c trng ni
bt ca khuụn mt bng cỏch da vo hỡnh thỏi ca chỳng. Vic truy tỡm ny da
vo mi quan h da cỏc c trng ú v khong cỏch hỡnh hc, v tr trong
khuụn mt.
Nhiu thut toỏn, mụ hỡnh ó c xõy dng cho cụng vic ny. De Silva
l mt thut toỏn tiờu biu. Mụ hỡnh ca Jeng cng l h thng phỏt hin c
trng c bit n rng rói. Trong h thng ny, vic khi to s c xỏc nh
bng vic nh v v trớ ca ụi mt trong bc nh. T vic xỏc nh ụi mt, quỏ
trỡnh s truy tỡm cỏc c trng khỏc nh mi, ming v ng t. Mi c trng
sau khi truy tỡm u thit lp cỏc hm quan h vi cỏc c trng khỏc, iu ny
giỳp cho vic xỏc nh khuụn mt cú th tin cy hn, cỏc hm quan h ny chớnh
l cỏc h s c miờu t nh trong ng thc di dõy:

(I.9)
Bờn cnh ú, nhiu h thng truy tỡm c trng cng c xut nh h
thng GAZE ca Herpers da vo s chuyn ng ca mt trong h thng trc
quan con ngi HVS. im ct yu ca h thng l thut toỏn nh v cỏc c
trng ni bt. Mt thut toỏn a mc s dng b lc a hng Gaussian.


1.4.1.2.2 Phõn tớch chũm sao
Mt vi thut toỏn cp n trong phn trờn cú tin cy ph thuc vo
mc t ỳng n v thụng tin c tỡm ra t cỏc tp mụ hỡnh nh mt vi di
nhng iu kin c nh. Nu nh khi iu kin ú khụng cũn tha món, nh l
nh v khuụn mt trong mt bi cnh phc tp, nhiu thut toỏn cú th khụng
cũn chớnh xỏc. Vỡ vy vn ờ t ra l lm th no chỳng ta cú th nhúm cỏc
c trng khuụn mt ú li thnh tng chựm vi nhng tham s i din chung
nht, phn ỏnh c ht cỏc trng hp xy ra ca cỏc c trng, bng vic s
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
20
dng phng phỏp mụ hỡnh húa hiu qu nh l phng phỏp phõn tớch thng
kờ.
Nhiu phng phỏp nhúm thnh cỏc chũm sao c xut. Trong ú
ni bt l phng phỏp s dng lý thuyt nột thng kờ t b lc a cp
Gaussian. Mt mụ hỡnh thng kờ trong min khụng gian ca cỏc c trng khuụn
mt cho phộp phỏt hin mt cỏch linh hot hn. Thut toỏn h tr vic qun lý s
thiu ht c trng cng nh cho phộp s dng cỏc h s m rng. Mc thnh
cụng ca mụ hỡnh ny l 84% khi nghiờn cu tp 150 bc nh. Vic phỏt hin sai
c xỏc nh l do h s ph thuc ca c trng u.
Mụ hỡnh thng kờ cho nh cú s xut hin nhiu khuụn mt cng c
xut, trong mụ hỡnh ny, cỏc khuụn mt c phõn lp thnh tng nhúm vi
nhng c trng chung nht. Nhng nhúm ny li c phõn lp tip trong cỏc
thnh phn c trng khuụn mt. Sau khi c trng ny nhn c t vic x lý
mc thp. Vic nhúm c trng ny cú tỏc dng gim bt sai s c trng sinh ra
do nh hng ca bi cnh hn tp. Mt mng theo lut Bayesian s c h tr
kt hp vi vic phỏt hin riờng cho tng nhúm c trng cú th chc chn
rng gi thuyt v s ỳng n ca khuụn mt cú c s tin cy vi mc
cao.
H thng s dng phng phỏp ny ni ting nht l h thng ca Maio v

Maltoni. Trong h thng ny nh u vo c chuyn i trc tip bng cỏch
s dng mt toỏn t gradient cú ca s 7*7. T nh chuyn i trc tip ny,
ngi ta ỏp dng hai giai on nhn bit khuụn mt. nh c nhn bit s c
khoanh vựng trong mt hỡnh ellipse. H thng ca Maio v Maltoni l h thng
thi gian thc vi mc phỏt hin khi test l 69/70 bc nh m khụng b mt
li no.

1.4.1.3 Cỏc mụ hỡnh hỡnh dng tớch cc (Active shape models)
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
21
õy l mụ hỡnh thi gian thc hiu qu v l thnh tu quan trng ca
hng tip cn da vo phõn tớch c trng. Mụ hỡnh da vo tớnh cht vt lý
tht s v s xut hin mc cao ca cỏc c trng. Mụ hỡnh ASM tng tỏc vi
cỏc c trng nh cc b (biờn, sỏng) v dn dn lm bin dng nột ca
c trng ú. Co ba dng ca mụ hỡnh ASM ang c nghiờn cu. u tiờn l
mụ hỡnh s dng mt ng i kớch hot (active contour) gi l snakes (dng
con rn). Mụ hỡnh th hai l mụ hỡnh da vo cỏc dng mu bin i
(deformable templates) cho phộp thc hin hiu qu hn mụ hỡnh snakes. Mụ
hỡnh th ba l mụ hỡnh Smart snakes (con rn hot thụng minh) v PDM (mụ
hỡnh phõn b im). Mụ hỡnh ny da trờn tp cỏc im c gỏn nhón v ch
cho phộp bin i theo mt vi hỡnh dng da trờn quỏ trỡnh hc.

1.4.1.3.1 Mụ hỡnh dng con rn (Snake)
c s dng xỏc nh ng bao ca u. thc hin vic ny, mt
con rn ban u c khi to ti mt vựng lõn cn xung quanh vựng biờn u.
Sau ú co dn v phớa cỏc ng biờn v a ra hỡnh dng gi nh ca vựng
u. S tin húa ca con rn oc thc hin thụng qua vic cc tiu húa mt
hm nng lng dng E
snake
(tng t nh trong vt lý) v c biu din nh

sau:

E
snake
= E
bờn trong
+ E
bờn ngoi
(I.10)

Trong ú E
bờn trong
v E
bờn ngoi
ln lt l cỏc hm nng lng bờn trong v
bờn ngoi. Nng lng bờn trong l phn nng lng ph thuc v cỏc thuc tớnh
bn cht ca con rn v to nờn s tin húa t nhiờn ca ng biờn ng. Cỏc
tin húa t nhiờn v in hỡnh ca con rn l s co ngn v s m rng. Trong
khi ú, nng lng bờn ngoi cú khuynh hng chng li nng lng bờn trong
v lm cho cỏc ng biờn ng sai lch so vi tin húa t nhiờn thm chớ tha
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
22
nhn hỡnh dng ca cỏc c tớnh gn nht l hỡnh dng ca vựng u khi trng
thỏi cõn bng.
Hai vn chớnh cn quan tõm trong vic ỏp dng mụ hỡnh con rn l la
chn cỏch tớnh nng lng chớnh xỏc v k thut cc tiu húa hng lng. Nng
lng Elastic c s dng ph bin nh l nng lng bờn trong. Khong cỏch
gia cỏc im iu khin trờn ng biờn ng c cõn i v do ú em li
cho ng biờn c tớnh ging nh si dõy cao su cú th co hoc dón. Vn
nng lng bờn ngoi c xem xột da vo kiu dng ca c trng nh c

xem xột. Cú th tớnh nng lng ny theo cỏc thụng s gradient. V theo
cỏchny, cỏc ng biờn ng thng hi t v phớa cỏc v trớ bin. Bờn cnh cỏc
thụng s v gradient, m s cỏch tớnh nng lng bờn ngoi khỏc cũn bao gm
c cỏc hm liờn tc liờn quan n mu da trong ú hp dn cỏc con rn v phớa
cỏc vựng mt.
Mc dự phng phỏp con rn mt cỏch tng quỏt cú th xỏc nh oc cỏc
ng bao quanh cỏc vựng c trng nhng vic trin khai phng phỏp vn b
cn tr bi hai vn . Th nht l cỏc phn ca con rn hay b by vo cỏc vựng
c trng nh khụng ỳng. Th hai l phng phỏp con rn khụng thc s hiu
qu trong xỏc nh cỏc c trng khụng li (c trng xut hin ni bt) do xu
hng tin ti cc tiu cong ca con rn.

1.4.1.3.2 Dng mu cú th bin i (Deformable templates)
Xỏc nh ng bao ca mt vựng c trng khuụn mt khụng phi l mt
vn d gii quyt bi vỡ cỏc du hiu cc b ca cỏc ng biờn mt khú cú
th oc t chc thnh cỏc th th tng th nhn bit thụng qua cỏc ng biờn.
tng phn thp v sỏng xung quanh mt s vựng c trng nh cng lm
cho quỏ trỡnh do tỡm biờn khú thc hin. Yuille v cng s ó m rng khỏi nim
con rn thụng qua vic kt hp cỏc thụng tin tng th v cp mt nõng cao
tin cy ca quỏ trỡnh trớch chn c trng. Mt mu cú th thay i ca mt da
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
23
trờn cỏc c trng ni bt ca chỳng c tham s húa s dng 11 tham s. Hot
ng theo nguyờn tc ging nh con rn, mt mu nu c khi u gn vi
cỏc c trng mt s t bin i hng ti ng bao c trng ti u. C ch
bin i liờn quan n phng phỏp cc tiu húa gim gradient dc nht ca t
hp nng lng ngoi do cỏc vựng trng, ng biờn, nh v sỏng ca nh
(E
v
,


E
e
,

E
p
, E
i
) c tớnh theo cụng thc:

E = E
v
+

E
e
+

E
p
+ E
i
+ E
bờn trong
(I.11)

Tt c cỏc biu thc nng lng trờn c biu din bng mt tớch phõn s
dng cỏc thuc tớnh mu nh din tớch v di ca ng trũn v ng
parabol.

Cú th thy rng, chin lc i sỏnh mu l c nh, do ú v trớ khi u
ca cỏc mu s nh hng nhiu n quỏ trỡnh tin húa. Ngi ta ó ch ra rng,
nu mu c khi õu ti trờn mt thỡ nú s b hp dn bi lụng my thay vỡ cp
mt. Ngoi ra, thi gian x lý cng s rt ln trong quỏ trỡnh thc hin cc tiu
húa. Vỡ vy nhng nghiờn cu gn y tp trung vo vic gim thi gian thc
hin, thay i cỏc mu v biu thc nng lng. Trong mt phỏt trin gn õy,
Lam v Yan s dng cỏc thụng tin v gúc mt ỏnh giỏ cỏc tham s khi u
ca mụ hỡnh mu mt. S gia tng v thụng tin lm cho phộp so sỏnh mu s
chớnh xỏc, tin cy hn. Thi gian mu t c v trớ ti u cng ó gim n
40% (so sỏnh vi mu ban u). Bờn cnh mu mt, cỏc mu ming cng c
s dng vi cựng mt chin lc.

1.4.1.3.3 Mụ hỡnh phõn phi im (PDM Point Distributed Models)
L mt mụ hỡnh mụ t tham s húa ti u ca hỡnh dng da trờn phong
phỏp thng kờ. Kin trỳc ca quỏ trỡnh so khp ca PDM khỏc vi cỏc mụ hỡnh
hỡnh dng ng khỏc. Cỏc ng biờn ng ca PDM c ri rc húa thnh cỏc
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
24
tp im c ỏnh nhón. S bin i ca cỏc tp im ny trc ht c tham
s húa thụng qua cỏc tp mu hc.cha cỏc i tng cú hỡnh dng v t thộ
khỏc nhau. S dng phng phỏp phõn tớch thnh phn chớnh PCA, s bin i
ca cỏc c trng trong tp mu hc c xõy dng thnh mt mụ hỡnh linh
ng tuyn tớnh. Mụ hỡnh oc cu thnh t trung bỡnh ca tt c cỏc c trng
trong tp hp v mụ hỡnh c bn ca s bin i tng im nh: x = x
tb
+ Pv
(I.12)
Trong ú, x biu din mt im trong PDM v x
tb
l c tớnh trung bỡnh

trong tp mu i vi im ú, P = [p
1
, p
2
, , p
t
] l ma trn cha t vector bin
i quan tng nht ca ma trn hip phng sai, cũn v l vector trng s.
Mụ hỡnh PDM u tiờn oc phỏt trin bi Lanitis v cng s. Mụ hỡnh
minh ha dỏng v tng th ca khuụn mt bao gm c tớnh nh lụng my, mi,
mt. S dng 152 im iu khin c chn bng tay v 160 nh mt mu, mt
mụ hỡnh PDM c xõy dng. Ch s dng 16 trng s, mụ hỡnh cú th xp x
c 95% cỏc hỡnh dng khuụn mt trong tp mu. so khp mt mụhnhf
PDM vi mt mt, mụ hỡnh hỡnh dng trung bỡnh (vi im ỏnh nhón l x
tb
) u
tiờn c t gn mt. Sau ú cỏc chin lc tỡm kim trờn mc xỏm cc b
c s dng a tng im hng n im tng ng thuc ng bao.
Trong sut quỏ trỡnh bin i ny, hỡnh dng ch c phộp thay i theo mt
cỏch phự hp vi cỏc thụng tin oc mụ hỡnh húa trong tp mu.
u im cua PDM l s dng mụ hỡnh khuụn mt vi cỏc tham s ti u.
c tớnh tng th ca mụ hỡnh cng cho phộp tt c cỏc c trng c xỏc nh
song song vi nhau v do ú gim bt oc yờu cu phi tỡm kim ln lt cỏc
c trng. Hn n, s thiu vng mt c trng no ú khụng phil mt vn
nghiờm trng khi m n cỏc c trng khỏc trong mụ hỡnh vn cú th t ti
mt gii phỏp ti u ton th.

THệ VIEN ẹIEN Tệ TRệẽC TUYEN
25
1.4.2 Hướng tiếp cận dựa trên thơng tin xuất hiện trong ảnh (Image-based

approach)
Hạn chế của hướng tiếp cận dựa vào đặc trưng của hình ảnh đó là khả
năng nhận biết nhiều khn mặt trong một bức ảnh có bối cảnh phức tạp là
khơng cao cho dù đã có nhiều nỗ lực cải tiến và nâng cao chất lượng dò tìm.
Điều đó đòi hỏi một phương pháp mới, một hướng tiếp cận mới để giải quyết
vấn đề này. Và hướng tiếp cận dựa vào thơng tin hình ảnh là hướng tiếp cận có
thể đáp ứng nhu cầu đó.
Hầu hết các phương pháp trong hướng tiếp cận này đều sử dụng chung
một kỹ thuật đó la kỹ thuật qt cửa sổ hay còn gọi là kỹ thuật qt khung nhìn
để nhận biết khn mặt. Thuật tốn qt cửa sổ sẽ dò tìm trong ảnh đầu vào tất
cả các khn mặt có thể có trong ảnh. Kích thước của cửa sổ, hệ số lấy mẫu,
kích thước của bước qt phụthuộc vào mục đích của phương pháp cũng như
hiệu năng của hệ thống.
Nhận biết khn mặt dữa vào thơng tin hình ảnh được chia làm ba hướng
nghiên cứu con chính đó là phương pháp khơng gian con tuyến tính, phương
pháp dựa vào mạng neural và phương pháp thống kê.

1.4.2.1. Phương pháp khơng gian con tuyến tính (Linear Subspace
Methods)
Hình ảnh của khn mặt con người nằm trên một khơng gian con của tồn
bộ khơng gian hình ảnh. Để thể hiện khơng gian con này, người ta có thể sử
dụng phương pháp về thần kinh, tuy nhiên vẫn có vài phương pháp có liên quan
chặt chẽ hơn với phân tích thống kê độ biến thiên tiêu chuẩn cái mà có thể ứng
dụng được. Các kĩ thuật trong phương pháp này bao gồm phân tích thành phần
chính (PCA principal component analysis), phân tích biệt số tuyến tính (LDA),
và phân tích hệ số (FA).
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN

×