Tải bản đầy đủ (.docx) (31 trang)

Nhận diện khuôn mặt và mô hình mẫu màu da trong nhận diện khuôn mặt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (832.01 KB, 31 trang )

ĐẠI HỌC QUỐC GIA TH ÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

BÀI THU HOẠCH
MÔN: CƠ SỞ TRI THỨC VÀ ỨNG DỤNG
Đề tài: Nhận diện khuôn mặt và mô hình mẫu màu da
trong nhận diện khuôn mặt.
Nhóm học viên thực hiện: NGUYỄN THỊ DIỆU ANH
MSHV 1 : CH1101064
ĐỖ VĂN LUYỆN
MSHV 2 : CH1101021
Giảng viên hướng dẫn : GS. TSKH Hoàng Văn Kiếm
TP HCM, ngày 18 tháng 05 năm 2012
LỜI NÓI ĐẦU
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Từ khi máy tính ra đời và con người làm việc với máy tính, một bài toán đặt ra là
làm thế nào để máy giao tiếp với con người tốt hơn? Liệu máy tính chỉ có thể tính toán
hay là chúng còn có khả năng suy diễn tri thức, giải quyết các bài toán một cách linh
động, có tư duy như con người? Con người nỗ lực để sự giao tiếp giữa người và máy
ngày càng trở nên hoàn thiện hơn, gần gũi hơn. Chúng ta cũng biết não bộ con người là
bộ máy hoàn hảo để xử lý các thông tin mang lại từ thế giới quan tương tác vào con
người, dựa vào đặc điểm cấu trúc của các tế bào nơ-ron thần kinh và hệ thống ngôn ngữ
máy tính, hàng trăm chủ đề được khai thác. Và một trong những lĩnh vực mới mẻ đó là
nhận diện.
Bài toán nhận diện để giải quyết các vấn đề về bảo mật riêng tư, công nghệ, giải trí,
và nhiều ứng dụng khác. Một số mảng về nhận diện như nhận diện dấu vân tay, nhận diện
chữ viết, nhận diện ký tự, nhận diện giọng nói,… và trong phạm vi bài thu hoạch này,
nhóm chúng em xin được trình bày một vấn đề nhỏ trong nhận diện khuôn mặt.
Nhận diện khuôn mặt bắt đầu được nghiên cứu, tìm hiểu vào những năm 1960, tuy
nhiên nhiều vấn đề của bài toán này đến nay vẫn chưa được giải quyết triệt để. Những
năm gần đây, do có nhiều tiến bộ trong kỹ thuật phân tích và xây dựng các mô hình


khuôn mặt mẫu nên lĩnh vực này đạt được một số thành quả nhất định. Vấn đề này ngày
càng nhận được nhiều sự sự quan tâm bởi tính ứng dụng cao của nó trong an ninh, trong
kỹ thuật số và trong các ngành công nghiệp giải trí đa phương tiện.
Chúng em trân trọng cảm ơn GS.TSKH Hoàng Văn Kiếm, người Thầy đã tận tụy
truyền tải các nội dung bộ môn CƠ SỞ TRI THỨC làm nền tảng cho chúng em tìm hiểu,
nghiên cứu và phát triển đề tài. Đồng thời, chúng em cũng trân trọng cảm ơn các Thầy Cô
phòng Sau Đại học – Trường Đại học Công nghệ thông tin – Đại học Quốc gia TP HCM
đã tạo điều kiện thuận lợi nhất cho chúng em học tập.
Trân trọng!
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 2
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
MỤC LỤC
LỜI NÓI ĐẦU 2
I. TỔNG QUAN VỀ NHẬN DIỆN KHUÔN MẶT 4
1. Quy trình nhận dạng khuôn mặt 5
2. Kỹ thuật phân tích không gian con trong nhận diện khuôn mặt 9
3. Phân tích thành phần chính (Principal Component Analysis – PCA ) 10
4. Những ứng dụng trong nhận diện khuôn mặt 13
II. MÔ HÌNH HOÁ MÀU DA 15
1. Đặc trưng màu da và không gian màu 15
2. Mô hình màu da 19
a. Các ảnh riêng lẻ 19
b. Dãy ảnh tuần tự 21
3. Mô hình quỹ tích màu da (Skin locus model) 21
a. Tạo ra quỹ tích da 21
b. Tiếp cận dựa trên quang phổ 22
c. Tiếp cận dựa trên hình ảnh 23
4. Áp dụng quỹ tích da 24
III. DEMO CHƯƠNG TRÌNH NHẬN DIỆN KHUÔN MẶT NGƯỜI
1. Thuật toán áp dụng 25

2. Demo chương trình 26
IV. KẾT LUẬN 30
TÀI LIỆU THAM KHẢO 31
I. TỔNG QUAN VỀ NHẬN DIỆN KHUÔN MẶT
Từ khi mới sinh ra, con người đã có đầy đủ các giác quan và có thể tự mình cảm
nhận được những sự vật hiện tượng xung quanh. Một đứa trẻ sơ sinh có thể biết được
chính xác ai là bố mẹ nó, ai là người thân của nó, quá trình này diễn ra tự nhiên, là bản
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 3
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
năng. Khi chúng ta lớn lên thì việc nhận diện hình ảnh cũng trở nên đa dạng, phong phú.
Có những người dù chỉ gặp một lần nhưng bạn lại không bao giờ quên khuôn mặt của họ,
bởi não bộ đã ghi nhận thông tin và xử lý chính xác mỗi khi bạn nhớ lại, trả về đúng hình
ảnh mà bạn đã thấy từ trước đó rất lâu. Và mặc dù bạn tiếp xúc với bao nhiêu người đi
nữa, thì khó mà có sự nhầm lẫn giữa khuôn mặt người này và người kia.
Nhưng đối với máy tính, việc nhận ra đúng khuôn mặt của một đối tượng mà nó tiếp
xúc là một thách thức lớn, bởi số lượng người trên thế giới quá nhiều và mỗi người sở
hữu một khuôn mặt khác nhau. Không những thế, theo thời gian khuôn mặt của người đó
sẽ thay đổi, đồng thời những tác động bên ngoài như độ sáng, góc nhìn, trạng thái trên
khuôn mặt, ….làm cho việc nhận diện của máy tính trở nên phức tạp với nhiều thông số
đầu vào.
Chúng ta sẽ tìm hiểu về tổng quan lý thuyết nhận dạng khuôn mặt, lĩnh vực này đòi
hỏi xây dựng những thuật toán chính xác và những kỹ thuật phân tích chi tiết, hiệu quả để
đảm bảo độ tin cậy cao, nhất là ứng dụng nhận diện vào trong lĩnh vực an ninh.
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 4
Xác định
khuôn mặt
Liên kết khuôn mặt
Khai thác các đặc trưng khuôn mặt
Tìm mẫu
phù hợp

Cơ sở dữ liệu
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
1. Quy trình nhận diện khuôn mặt
Một hệ thống nhận diện khuôn mặt về cơ bản trải qua bốn giai đoạn:
- Xác định khuôn mặt
- Liên kết, khai thác các đặc điểm
- Cụ thể hoá
- Chuẩn hoá với khuôn mặt
Input vị trí, kích thước
ảnh, video hướng chụp
Output Vectơ
đặc trưng

matching
Sơ đồ: Quy trình nhận diện khuôn mặt
Giai đoạn “Xác định khuôn mặt” chiếm vai trò quan trọng trong quy trình nhận diện
khuôn mặt. Bài toán xác định khuôn mặt được định nghĩa như sau:
- Xác định khuôn mặt người là kỹ thuật máy tính để xác định các vị trí và các kích thước
của các khuôn mặt người trong các ảnh bất kỳ (ảnh kỹ thuật số). Kỹ thuật này nhận biết
các đặc trưng của khuôn mặt và bỏ qua những hình ảnh khác như toà nhà, cây cối, cơ thể,

Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 5
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Dựa vào đặc điểm tính chất của bài toán, các nhà nghiên cứu đã đưa ra bốn hướng
tiếp cận chính để giải quyết bài toán xác định khuôn mặt người:
- Hướng tiếp cận dựa trên tri thức: Xây dựng tập luật dựa trên tri thức con người về các
khuôn mặt người. Đây là hướng tiếp cận dạng top – down. Người nghiên cứu sẽ trích đặc
trưng của khuôn mặt trước tiên để có các ứng viên, sau đó các ứng viên này sẽ được xác
định thông qua các luật để biết ứng viên nào là khuôn mặt, ứng viên nào không phải là
khuôn mặt.[3]

Các đặc trưng cơ bản của khuôn mặt sử dụng trong tập luật như: Khuôn mặt là một
hình gồm có hai mắt, hai chân mày đối xứng qua một trục thẳng đứng, có mũi, miệng …
Những mô tả này sẽ là cơ sở để xây dựng các luật một cách hiệu quả. Tuy nhiên, việc xây
dựng tập luật này thật sự không đơn giản, nếu mô tả quá chi tiết sẽ dẫn đến việc có thể bỏ
qua mất một số đối tượng là khuôn mặt nhưng không được nhận dạng, bởi khi hình ảnh
ghi nhận khuôn mặt còn tuỳ thuộc nhiều vào góc chụp hình, khuyết tật, dị tật trên khuôn
mặt, ….Còn ngược lại nếu mô tả quá thô sơ thì một số đối tượng có thể được nhận dạng
nhầm là khuôn mặt
(VD: biển báo giao thông, logo, ….)
- Hướng tiếp cận dựa trên đặc trưng không thay đổi: Hướng tiếp cận này dựa trên nguyên
tắc cơ bản là cho dù khuôn mặt bị thay đổi trong các tư thế khác nhau, điều kiện ánh sáng
khác nhau, …vv… nhưng vẫn luôn tồn tại những đặc trưng riêng không bị thay đổi. Dựa
trên các đặc trưng này người nghiên cứu sẽ lập trình cho hệ thống nhận diện khuôn mặt.
Thuật toán thường áp dụng trong hướng tiếp cận này là: Cân bằng sáng, khử nhiễu,
các bộ lọc hoặc sử dụng mô hình xác suất. Các đặc trưng như: lông mày, mắt, mũi,
miệng, đường viền của tóc thường được thực hiện bằng phương pháp xác định cạnh,
phương pháp này không hiệu quả khi có bóng của khuôn mặt do có thể cạnh của bóng
hiển thị rõ hơn cạnh của khuôn mặt. Thông thường, các phương pháp xác định khuôn mặt
được thực hiện sau khi biến đổi ảnh sang ảnh xám hoặc ảnh nhị phân và xử lý nhận diện
trên các điểm ảnh dạng bit-map.
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 6
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
- Hướng tiếp cận dựa trên so khớp mẫu: Các mẫu chuẩn sẽ được xây dựng trước hoặc xác
định các tham số thông qua hàm. Từ một ảnh đầu vào, các giá trị tương quan với ảnh mẫu
chuẩn sẽ được so sánh theo đường viền của mắt, mũi, miệng, … Thông qua các giá trị
này mà một ảnh được xác định là có khuôn mặt hay không. Ưu điểm của phương pháp
này là dễ cài đặt, tuy nhiên hiệu quả lại không cao.
Thông thường, có hai tập mẫu cần xây dựng. Đó là tập mẫu chuẩn cho trước và tập
mẫu biến dạng. Các phương pháp phổ biến để xây dựng tập mẫu chuẩn là sử dụng đường
viền (Craw), chia ảnh mẫu thành nhiều khối con (Tsukamoto), phân tích hình chiếu (phân

tích thành phần chính - PCA), phổ màu da (Dowdall), ….
Đối với mẫu biến dạng thì có phương pháp sử dụng đường gấp khúc (Lam và Yan),
phương pháp dùng lý thuyết dòng chảy để xác định đường viền khuôn mặt dựa trên đặc
tính hình học (Huang và Su), còn Lanitis đã biểu diễn khuôn mặt người với cả hai thông
tin: hình dáng và cường độ bằng các vector các điểm mẫu.
- Hướng tiếp cận dựa trên diện mạo: Áp dụng các phương pháp xác suất thống kê và máy
học để tìm các đặc tính liên quan của khuôn mặt và không phải khuôn mặt.
Theo phương pháp xác suất thống kê, một ảnh hay một vector đặc trưng xuất phát từ
một ảnh được xem là biến ngẫu nhiên x (khuôn mặt hoặc không phải khuôn mặt). Khi đó
ta thiết lập các hàm mật độ:
P(x| x là khuôn mặt) hoặc P(x|x không là khuôn mặt)
Có thể dùng phân loại Bayers hoặc khả năng cực đại để phân loại đối tượng, tuy
nhiên đối với Bayers thì khó có thể cài đặt trực tiếp bởi số chiều của x khá cao, các hàm
mật độ là đa phương thức. Vì vậy, người ta thường áp dụng các kỹ thuật làm giảm chiều
của x trước khi sử dụng Bayers.
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 7
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Hướng tiếp cận dựa trên diện mạo là tìm một hàm biệt số để phân tách thành hai lớp
dữ liệu: khuôn mặt và không phải khuôn mặt. Đầu vào là các mẫu ảnh được chiếu vào
không gian có chiều thấp hơn, rồi sau đó dùng hàm biệt số để phân loại (dựa vào các độ
đo khoảng cách), hoặc xây dựng mặt quyết định phi tuyến mạng neural đa tầng, hoặc
dùng SVM – support vector machine và các phương thức kernel chiếu hoàn toàn các mẫu
vào không gian có chiều cao hơn để rời rạc hoá dữ liệu. Sau đó dùng mặt phẳng quyết
định phân loại mẫu khuôn mặt và không phải khuôn mặt.
Sau khi có các đối tượng được xác định với kết quả là khuôn mặt, có thể cần phải
theo dõi các thành phần của đối tượng để cụ thể hoá, chuẩn hoá xem đó có phải thật sự là
khuôn mặt hay không? Quá trình này liên kết từ đối tượng so sánh với các tập mẫu, các
đặc trưng được xây dựng sẵn, hoặc phân tích theo khối hình học. Các thành phần của
khuôn mặt như mắt, mũi, miệng, chân mày, và phác thảo khuôn mặt được đặt dựa trên
đặc điểm vị trí, khoảng cách và chuẩn hoá bằng cách biến đổi hình học hoặc so mẫu biến

dạng. Sau cùng, kỹ thuật bình thường hoá khuôn mặt dựa trên sự chiếu sáng và gam màu
xám.
Khi thu được mẫu chuẩn hoá của khuôn mặt, ta tiếp tục khai thác các đặc trưng, các
tính năng để thu được các thông tin hữu ích phân biệt các khuôn mặt người khác nhau và
xét tính ổn định với các biến thể hình học. Để tìm sự phù hợp với khuôn mặt, ta sử dụng
đầu vào các vector đặc trưng của khuôn mặt và số lần xuất hiện mẫu khuôn mặt trong cơ
sơ dữ liệu để so sánh. Kết quả đầu ra là sự trùng hợp tương đối giữa khuôn mặt mẫu và
đối tượng phân tích, hoặc nếu không tìm thấy sự tương ứng với các đặc trưng mẫu thì kết
luận đối tượng đang xem xét không phải là khuôn mặt.
Kết quả của sự nhận diện khuôn mặt phụ thuộc rất nhiều vào các đặc trưng được
phân tích trong tập mẫu và phương pháp phân loại sử dụng để nhận biết khuôn mặt trong
quá trình cụ thể hoá và chuẩn hoá. Bởi vậy việc lựa chọn đặc trưng và phương pháp nhận
diện chiếm vai trò quan trọng, thể hiện hiệu quả của cả quá trình.
2. Kỹ thuật phân tích không gian con trong nhận diện khuôn mặt
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 8
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Trên thực tế, các hình ảnh và video đầu vào chứa nhiều đối tượng, chẳng hạn một tấm
hình bao giờ cũng chứa các hình ảnh như nhà cửa, cây cối,…còn khuôn mặt chỉ chiếm
một không gian nhỏ. Vì vậy, hình ảnh ban đầu đưa vào là dư thừa, số chiều của ảnh này
có thể giảm xuống, ta chỉ xét đến những không gian mà ở đó có đối tượng được nghi vấn
là có phải mô hình khuôn mặt hay không?
Hình 1: Ảnh đầu vào với số điểm ảnh lớn, trong đó không gian con chứa đối tượng là
khuôn mặt chiếm phần nhỏ
Hình 2: Mô tả tỉ lệ không gian khuôn mặt trong hình ảnh đầu vào
Để tách không gian con cho nhận diện khuôn mặt, phương pháp tiếp cận là phân tích
các thành phần chính (PCA). Các tính năng trong không gian con như cung cấp thông tin
nổi bật, gần với mẫu nhận diện, đầu vào các vector tính năng làm cho mô hình hoá không
gian con tăng hiệu quả đáng kể trong việc nhận diện khuôn mặt. Nếu để nguyên bản ảnh
đầu vào ta nhận thấy sự phi tuyến và không nổi bật lên các đặc trưng của mẫu mô hình
khuôn mặt.

Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 9
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Vậy, bài toán nhận diện khuôn mặt trước hết là giải quyết việc xác định thành phần
là khuôn mặt và không phải là khuôn mặt trong hình ảnh đầu vào.
3. Phân tích thành phần chính (Principal Component Analysis – PCA )[2]
PCA là một phương pháp phân tích dữ liệu nhiều biến đầu vào đơn giản nhất và
được ứng dụng chủ yếu vào bài toán nhận diện khuôn mặt. Như ta đã biết, số chiều trong
hình ảnh đầu vào tương đối lớn, khó hình dung trong không gian 2 chiều hoặc 3 chiều,
bởi vậy chúng ta cần tìm cách đưa dữ liệu về không gian có số chiều nhỏ hơn. PCA như
là một công cụ hữu ích giúp biến đổi với các ưu điểm sau:
- Giảm số chiều của dữ liệu
- PCA xây dựng một không gian mới với số chiều ít hơn, nhưng lại biểu diễn dữ
liệu tương đương với không gian cũ, không làm mất đi tính biến thiên của dữ liệu
trên chiều mới
- Các trục toạ độ trong không gian mới là tổ hợp tuyến tính của không gian cũ, do
đó PCA xây dựng các đặc trưng mới dựa trên các đặc trưng đã quan sát được, và
những đặc trưng này vẫn biểu diễn tốt dữ liệu ban đầu.
- Trong không gian mới, những liên kết tiềm ẩn được phát hiện mà ở không gian cũ
nó bị che khuất hoặc khó phân tích
Như vậy, PCA tuy làm giảm số chiều không gian của dữ liệu đầu vào nhưng nó cho
đảm bảo tính toàn vẹn của dữ liệu, đồng thời cho phép phân tích những đặc trưng khó tìm
thấy ở không gian cũ.
Ví dụ sau đây minh hoạ sự thay đổi hệ quy chiếu làm thay đổi hình ảnh trong không
gian:
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 10
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Hình 3: Ví dụ minh hoạ PCA
Ở hình 3 ta thấy nếu hình ảnh theo chiều thẳng phía trước thì bóng đen không thể
nhận biết được là gì, nhưng nếu xoay chiều nhìn ngang thì dễ dàng đoán nhận đó là hình
ảnh của con lạc đà. Như vậy chứng tỏ hình chiếu từ phía ngang cho ta nhiều thông tin hơn

hình chiếu thẳng.
Ta có thể xem xét ví dụ cụ thể sau để hiểu hơn cơ chế hoạt động của phương pháp
PCA:
Hình 4: Ví dụ minh hoạ biểu diễn dữ liệu theo PCA
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 11
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Trong đó tập điểm màu xanh là tập dữ liệu ban đầu được biểu diễn trong không gian
3 chiều, tuy nhiên không gian này không biểu diễn một cách rõ ràng sự biến thiên của dữ
liệu. Vì vậy người ta dùng phương pháp PCA, chuyển từ không gian 3 chiều sang không
gian 2 chiều với hệ trục toạ độ mới như hình bên phải. Điểm khác biệt cơ bản khi chuyển
sang hệ toạ độ mới là các trục đôi một trực giao (vuông góc) trên cùng một mặt phẳng,
bởi vậy khi xét một điểm biểu diễn dữ liệu trên hệ toạ độ ta luôn tìm được sự tương quan
chính xác của mỗi đối tượng, từ đó nhận thấy rõ sự biến thiên của dữ liệu đầu vào.
Thuật toán của phương pháp PCA như sau: Cho ma trận X = {x
ij
} R
nxp
(đối với nhận điện hình ảnh thì x
ij
là các điểm ảnh)
Các bước thực hiện PCA:
1. Tiền xử lý:
Miền giá trị của đặc trưng thuộc tập dữ liệu ban đầu và trong không gian mới có
thể khác nhau. Ví dụ từ [0, 100] → [-30, 150]. Như vậy cần phải có bước tiền xử lý để
chuẩn hoá dữ liệu trên ma trận X. Thông thường có 2 cách tiền xử lý:
• Centered PCA: Chuyển tất cả đặc trưng của X (cột của X) về cùng 1 gốc toạ độ:
X
^
= {
^

ij
}
^
ij
= (1a) ,
Trong đó n là số dòng của X, là mean của cột thứ j của X, được tính như trên.
• Normed PCA: Chuyển tất cả đặc trưng của X (cột của X) về cùng một gốc toạ độ, đồng
thời chuẩn hoá về cùng một quãng độ lệch chuẩn(standard – deviation)
X
^
= {
^
ij
}
^
ij
= (1b)
Trong đó là độ lệch chuẩn của cột thứ j trong X
Phương pháp Normed thường được dùng. Sau bước tiền xử lý, ma trận X
^
là đầu vào
cho bước tiếp theo
2. Xây dựng không gian mới
Tính ma trận hiệp phương sai của các đặc trưng trong X
^
V =
V là tích của X
^
và chuyển vị của X
^

, do vậy V € R
pxp
và có p trị riêng λ
i
0,
i = 1 p.
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 12
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Tiếp theo, PCA tìm trị riêng và vector tương ứng cho V, sắp xếp giảm dần theo trị
riêng. Giả sử trị riêng của V là λ
1

2

3
>…


p-1

p
Và p vector riêng tương ứng là: u
1
, u
2
,… , u
p.
Khi đó các trục của không gian mới chính là các vector u
i



trên và các vector trực
giao đôi một với nhau. (độc lập tuyến tính)
3. Chuyển dữ liệu từ không gian ban đầu vào không gian mới
Thông thường không gian mới không được xây dựng từ tất cả vector riêng mà chỉ
chọn k vector đầu tiên (k<p). Cách chọn k thỏa mãn:
Như vậy ta gọi: U = [u
1
| u
2
|…|u
k
] € R
pxk
Khi đó toạ độ các điểm trong hệ toạ độ mới là: F = X
^
U
Lần lượt biểu diễn các điểm lên hệ toạ độ ta có không gian mới được xây dựng bằng
phương pháp PCA
4. Những ứng dụng trong nhận diện khuôn mặt
Hiện nay, nhận diện khuôn mặt chiếm được nhiều sự quan tâm và ứng dụng rộng rãi
trong nhiều lĩnh vực, chúng tôi trình bày một số ứng dụng cụ thể như sau:
• An ninh: nhận diện khuôn mặt của tội phạm, hoặc theo dõi con người thông qua các hệ
thống giám sát, các hệ thống an ninh như sân bay, cơ quan xuất nhập cảnh.
• Tương tác người và máy: trao đổi ngôn ngữ giữa người và máy thông qua những biểu thị
của khuôn mặt, đặc biệt là việc hỗ trợ cho những người khuyết tật, hoặc những người gặp
hạn chế trong việc giao tiếp ngôn ngữ.
• Điều khiển vào ra: Cổng giao dịch và quản lý của công ty, văn phòng có thể ứng dụng để
quản lý nhân viên ra vào những khu vực được cho phép, hoặc quản lý thời gian làm việc.
• Tích hợp dữ liệu vào thẻ: như thẻ ATM, thẻ căn cước, chứng minh thư, …

• Tìm kiếm hình ảnh, video: với những từ khoá tương ứng, quá trình tìm kiếm cho những
kết quả tương ứng với khuôn mặt được nhận diện.
• Multimedia: Ứng dụng trong việc phát triển các tính năng của điện thoại di động (video
call, nhận diện người dùng…), hay máy chụp hình nhận diện khuôn mặt, căn chỉnh theo
trạng thái của khuôn mặt (cười, khóc, …)
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 13
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Hính 5: Nhận diện khuôn mặt trong ảnh
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 14
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
II. MÔ HÌNH HOÁ MÀU DA
1. Đặc trưng màu da và không gian màu
Màu sắc là một đặc trưng cấp thấp nhưng lại có khả năng phân biệt tốt và dễ tính
toán, ít bị ảnh hưởng bởi những tính chất hình học. Trong cùng một điều kiện ánh sáng
đồng nhất thì màu da không thay đổi dù ta xoay chiều khuôn mặt, phóng to hay thu nhỏ
hình ảnh. Cơ sở để nhận diện khuôn mặt là màu da có những đặc trưng khác biệt với
những màu sắc khác.
Khi sử dụng các hệ thống nhận diện hình ảnh, vấn đề thường gặp là máy tính khó
nhận biết sự thay đổi màu sắc khi điều kiện ánh sáng thay đổi. Ví dụ sau đây minh hoạ
cho sự thay đổi màu sắc khi độ chiếu sáng và cân bằng trắng thay đổi:
Hình 65: Ảnh hưởng của sự thay đổi ánh sáng
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 15
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Ở hình trên ta thấy màu da chuyển sang màu từ xanh dương nếu được chiếu sáng ở
nhiệt độ cao, ngược lại thì chuyển sang màu đỏ. Như vậy, khi xây dựng mô hình màu da
ta cần xem xét yếu tố ánh sáng. Mô hình màu sắc có thể được thay đổi nếu ta biết trước
những điều kiện ánh sáng và cân bằng trắng có thể xảy ra. Có nhiều lý thuyết đưa ra về sự
ổn định màu sắc, tuy nhiên cho đến nay chưa có kết quả kiểm chứng thành công tổng quát
cho thị giác máy. Ngoài ánh sáng, còn một số yếu tố khác làm thay đổi màu sắc của hình
ảnh như: độ nhạy của camera, phản xạ ánh sáng, đặc tính kỹ thuật. Tuy nhiên, những yếu

tố này ít ảnh hưởng như nguồn sáng.
Nền tảng để xây dựng không gian màu là RGB (red – green – blue) hoặc dựa trên
những không gian màu cơ bản khác. Các không gian màu dẫn xuất này thường chia thông
tin màu sắc thành hai thành phần: sắc độ và cường độ. Việc biến đổi không gian màu sắc
có thể dùng công thức thay thế R→ cR, G →cG, B→cB trong đó c là sự biến đổi đồng
nhất về mức cường độ màu, nếu hệ số c không thể huỷ bỏ để mô tả sắc độ thì việc phân
tách sẽ không hoàn thành.
Nếu không tìm thấy một không gian màu phù hợp từ các không gian đã hình thành
trước đó, ta có thể thiết kế một không gian mới để đáp ứng yêu cầu.
Ví dụ: TSL(tint/saturation/lightness - sắc thái/ độ bão hoà/ độ sáng) là một không gian
màu thiết kế cho việc nhận diện da. Nhiều nghiên cứu nhận định rằng việc thay đổi tông
màu da là do sự thay đổi cường độ, vì vậy biện pháp nhận diện da là loại bỏ thành phần
cường độ. Sự phản xạ quang phổ của các tông màu da khác nhau đều cho kết quả gần
giống nhau.
Hình 7: Quang phổ của các nhóm màu da
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 16
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Ở hình trên ta thấy xét quang phổ của 3 nhóm màu da: màu tối, màu nhợt nhạt, và
màu vàng: các hệ số phản xạ của da đều mượt và tương tự nhau. Sở dĩ có sự tương tự này
do các màu da của các dân tộc trên thế giới đều được hình thành từ 3 yếu tố màu da:
melanin, carotene và hemoglobin.
Đối với phân loại màu da dựa trên biểu đồ do Zarit và một số người khác thực hiện
trên năm không gian màu: CIE Lab, Fleck HS, HSV, bình thường hoá RGB, YCrCb.
Theo đó, phương pháp tra cứu bảng thực hiện tốt nhất đối với không gian Fleck HS.
Terrillon đã so sánh hiệu quả của hàm đơn và hàm Gaussian đối với việc mô hình
hoá sắc độ da và được xếp thành 9 không gian màu sắc: TSL, NCC rgb, CIE xy, CIE SH,
HSV, YIQ, YES, CIE Luv, CIE Lab và đã có những quan sát thú vị: độ bão hoà S trong
không gian HSV chiếm gần như tất cả giá trị đối với một phạm vi màu H giới hạn vì nó
nhạy với nhóm màu da các dân tộc khác nhau trên thế giới. Chuẩn hoá không gian CIE
SH và SH có tỉ lệ phân tách cao nhất giữa các lớp da và không phải là da. Mô hình

Gaussian đơn cung cấp các kết quả tốt nhất trong sự chuẩn hoá chiếu sáng không gian
màu, còn mô hình Gaussian phức cải thiện kết quả trong điều kiện không chuẩn hoá.
NCC rgb và CIE xy cho hiệu quả cao nhất phân đoạn da vì sắc độ da chiếm diện tích nhỏ
và hiệu quả để nhận diện khuôn mặt, trong đó NCC rgb có tỉ lệ nhận diện chính xác cao
hơn.
Caetano và một số người khác đã so sánh mô hình Gaussion đơn và phức trong sự
chuẩn hoá độ RG bằng cách sử dụng các điểm ảnh lấy ra từ các vùng khác nhau của
khuôn mặt, cánh tay và chân của nhóm dân tộc khác nhau. Theo nghiên cứu, mô hình
Gaussian phức từ 2 đến 8 thành phần có cách xử lý tương tự nhau và cho kết quả tốt hơn
mô hình Gaussian đơn. Mô hình Gaussian phức cũng được so sánh với bản đồ tự tổ chức
SOMs trong bốn không gian màu: HSV, Decartes, HS, TSL và không gian rg chuẩn hoá.
Mô hình Gaussian phức cung cấp kết quả tốt hơn trong không gian rg chuẩn hoá, nhưng
SOMs cho tỉ lệ nhận diện nhất quán hơn.
Như vậy, không gian chuẩn hoá RGB phù hợp cho nhiều ứng dụng với tông màu da,
nhưng khó có thể đưa ra mô hình tốt nhất bởi sự ảnh hưởng lên dữ liệu đầu vào còn tuỳ
thuộc nhiều yếu tố khác như: thuộc tính camera, ánh sáng, kỹ thuật …
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 17
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Một vấn đề khó khăn với nhận diện da là sự khác nhau của sắc độ chiếu sáng. Điều
này dẫn đến sự chồng chéo giữa các lớp là da và không phải là da do diện tích mở rộng
của sự xuất hiện màu sắc làm cho các đối tượng có thể thay đổi. Một số nghiên cứu về
vấn đề này đã được tiến hành:
Shin và một số người khác đã so sánh 8 không gian màu: RGB chuẩn hoá, CIE xyz,
CIE Lab, HIS, toạ độ hình cầu, YcbCr, YIQ, YUV với 3 tiêu chí: sự phân tách giữa các
lớp là da và không phải da, độ gắn kết giữa các màu da, sự chống lại các thay đổi về
chiếu sáng. Không gian RGB được lấy làm cơ sở, các thành phần không gian màu được
sử dụng trong khoảng từ 0 255, lượng tử hoá đến 256 độ. Kết luận đưa ra là không gian
thích hợp là RGB và thành phần chiếu sáng làm tăng sự phân tách các lớp.
Một số nghiên cứu khác so sánh toạ độ sắc độ của một vài không gian màu, và toạ
độ 2D là thích hợp trong các ứng dụng nhận diện khuôn mặt. Để đánh giá, các điểm ảnh

trên khuôn mặt thu được từ các cơ sở dữ liệu khuôn mặt bằng vật lý hoặc từ video khuôn
mặt. Các cơ sở dữ liệu này chứa ảnh được thực hiện 16 cân bằng trắng kết hợp với chiếu
sáng bằng 4 nguồn sáng: Horizon 2300K, incandesent A, flourescent TL84, daylight
6500K và sử dụng 4 camera. Các ảnh thu được sau khi chuyển đổi từ RGB sang một
không gian màu khác thì dữ liệu được lượng tử hoá để tăng hiệu quả nhận diện.
Hình 8: Sự ảnh hưởng của thuộc tính camera đối với nhận diện ảnh
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 18
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
2. Mô hình màu da
Mô hình màu da được xây dựng trên hai tập ảnh: ảnh riêng lẻ và ảnh tuần tự. Giờ
chúng ta sẽ xem xét lần lượt từng loại mô hình đối với tập ảnh
a. Các ảnh riêng lẻ
Đối với các ảnh riêng lẻ, việc phân loại các điểm ảnh thuộc thành phần nào: khuôn
mặt, quần áo, cây cối, bàn tay, …. sẽ dựa vào xác suất màu sắc trên những lớp đối tượng
đó hoặc vùng không gian màu của đối tượng. Các phương pháp này cũng có thể được kết
hợp với các bước tiền xử lý ảnh. Lý thuyết nền tảng là sử dụng thống kê, xác suất của
tông màu thường được tính từ tập huấn luyện. Để phân lớp pixel ta dùng một giá trị
ngưỡng lấy ra từ tập huấn luyện. Ngường thường khó xác định trước và thường được thay
đổi, điều chỉnh cho phù hợp với ảnh hoặc tập ảnh đang xét. Ngoài ra còn có thể tiếp cận
bằng phương pháp giới hạn không gian màu.
• Phân lớp dựa vào thống kê:
Phương pháp thống kê dùng Gaussian và Histogram là hai phương pháp dễ cài đặt,
phổ biến và dễ hiểu.
Theo Histogram, xác suất màu của đối tượng được tính bằng công thức sau:
Trong đó: C là màu thuộc về đối tượng
Count[C]: số lượng pixel có màu C
Tcount: tổng số pixel thuộc về đối tượng
Với phương pháp Gaussian hỗn hợp, xác suất được tính
Trong đó: n là số đặc trưng Gaussian
trọng số của Gaussion, là vector trung bình

là ma trận phương sai, d kích thước của dữ liệu
Đối với ảnh riêng lẻ sử dụng phương pháp Gaussian thì n và α = 1, các tham số khác
có thể được xác định giá trị cho phép có xác suất tối đa.
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 19
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Hai phương pháp Gaussian và Histogram có thể được áp dụng trên màu da hoặc trên
các đối tượng khác. Cần phải xác định ngưỡng (có thể dùng tập huấn luyện), một pixel
được phân vào lớp da nếu xác suất của lớp da vượt qua ngưỡng cho trước.
Phương pháp SOMs cũng được dùng để tách da với các đối tượng khác, điểm mạnh
của phương pháp này là mô tả và biểu diễn dữ liệu trên nhiều chiều và chiếu các dữ liệu
sang không gian ít chiều. Người dùng có thể chọn các biên phân lớp và chọn ảnh đầu vào
tuỳ thuộc theo từng ứng dụng. SOMs được dùng trong cả ảnh đơn lẻ và video. Ngoài ra
còn có một số phương pháp khác như xây dựng mô hình dựa vào logic mờ, mô hình tối
đa hoá entropy, …
• Phân lớp dựa vào dãy màu trong không gian màu
Một vùng không gian màu được xác định từ một tập ảnh được xem là thể hiện cho
những màu da khác nhau. Việc xác định vùng màu có thể thực hiện bằng cách tra bảng
hoặc dùng giá trị ngưỡng. Sau đó, chúng ta phân lớp pixel nào là da hoặc không phải là
da. Xác suất của những pixel là da được xác định bằng cách chọn một vùng trong lớp
thành phần. Quá trình này gồm 2 bước: chọn tập ảnh huấn luyện và tìm vùng da. Cần xác
định biên của vùng da, nếu tỉ lệ chính xác cao thì chúng ta có thể tăng biên của vùng này
lên.
Hsu đề nghị kết hợp hiệu chỉnh màu sắc trong quá trình phát hiện da, công đoạn này
làm cho phần chênh lệch gây ra bởi sự chiếu sáng được nhận diện đúng là da hay không
phải là da. Hsu sử dụng kỹ thuật bù sáng với tham chiếu gam màu trắng. Kỹ thuật này giả
định là luôn có ít nhất một đối tượng màu trắng trong ảnh. Các điểm ảnh trắng được nhận
diện dựa vào giá trị độ sáng khi điều chỉnh gramma không tuyến tính, nếu 5% đầu vào
của giá trị này tương ứng với 100 pixel thì giai đoạn hiệu chỉnh màu được sử dụng, nếu
không đủ thì loại bỏ giai đoạn này. Độ lệch màu được hiệu chỉnh bằng các hệ số với kênh
màu RGB. Các hệ số được tính từ việc chia tỉ lệ pixel trắng tương ứng về 255.

Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 20
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
b. Dãy ảnh tuần tự
Cách tiếp cận là phân lớp đối tượng dựa vào những sự biến đổi chậm theo thời gian
hoặc bất biến (ví dụ: nhà cửa, phong cảnh đứng yên, người chuyển động, các bộ phận
trên cơ thể người cử động). Có thể dùng thuộc tính màu sắc hoặc mô hình bất biến và mô
hình thích ứng.
Mô hình bất biến được xử lý như các hình ảnh đơn lẻ được trình bày ở trên. Mô hình
thích ứng dựa trên giả định các thành phần chuỗi ảnh tuần tự gần giống nhau. Đối với
phương pháp sử dụng thuộc tính màu sắc, việc cập nhật mô hình màu có thể được thực
hiện bằng việc hiệu chỉnh sự giới hạn trong vùng không gian và thời gian.
Cho tới nay thì hai hướng tiếp cận áp dụng vào chuỗi ảnh tuần tự đã mang lại những
thành công nhất định. Các cách tiếp cận này đều sử dụng ràng buộc về không gian trong
hình ảnh để chon pixel cập nhật cho mô hình màu da.
3. Mô hình quỹ tích màu da (Skin locus model)
Nền tảng của phương pháp tiếp cận quỹ tích da là dựa trên lý thuyết vậy lý liên quan
đến sự hình thành da, dựa trên thí nghiệm về sự thay đổi màu da khi điều kiện chiếu sáng
khác nhau. Khái niệm “quỹ tích màu da” (skin locus) được Storring đưa ra, ông cũng chỉ
ra việc theo dấu vết sắc độ da theo đường cong của Planckian trong không gian chuẩn hoá
RGB với sự cân bằng trắng.
a. Tạo ra quỹ tích da:
Quỹ tích da đối với máy ảnh có thể được tính toán dựa trên thông tin quang phổ hoặc
thu trực tiếp từ một tập hợp ảnh. Để tính toán quỹ tích ta cần dữ liệu quang phổ của
camera, điều kiện chiếu sáng và da, trong đó thông tin quang phổ là khó thu thập vì
camera thường không có chức năng này. Sau đó ta đưa hình ảnh cần thiết và phạm vi
chiếu sáng với những thiết lập cho phép của camera. Phạm vi chiếu sáng phải dựa trên
các ứng dụng nhất định và điển hình, có nhiệt độ màu tối đa, tối thiểu và trung bình giữa
hai khoảng. Sau đó cần xác định số lượng cân bằng trắng và điều kiện chiếu sáng.
b. Tiếp cận dựa trên quang phổ
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 21

BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Hệ số phản xạ của da có thể thu được thông qua các phép đo lường mô phỏng. Ta
khó có thể thu thập quang phổ dựa vào đặc tính kỹ thuật của camera vì nhà sản xuất ít khi
tích hợp tính năng này, song ta có thể ước lượng dựa vào biểu đồ Macbeth. Các dữ liệu
quang phổ có thể được thay thế vào phương trình màu cơ bản:
Trong đó: O là đầu ra
i là kênh màu đỏ, màu lục hoặc màu lam.
K là hệ số tỉ lệ để xác định phạm vi dữ liệu đầu ra
λ là phạm vi bước sóng (từ 400 → 700)
S là độ nhạy quang phổ của một kênh màu
I là phân phối quang phổ của sự chiếu sáng
δ mô tả hệ số phản xạ quang phổ của một đối tượng
Tử số biểu diễn hiệu ứng của camera đối với bề mặt quan sát được dưới ánh sáng
hiện hành. Mẫu số mô tả tỉ lệ của kênh xác định dưới điều kiện chiếu sáng. Với điều kiện
thông thường thì K và mẫu số là hằng số. Khi sự chiếu sáng không giống với hiệu chuẩn
thì có thể xảy ra sự thay đổi màu sắc.
Hình 9: Ba hàm cơ sở được tính bằng hệ số phản xạ da
và nguồn sáng Planckian
Phương pháp chuẩn hoá dựa trên quang phổ có thể dẫn tới đầu ra khác nhau. Công
thức trên có thể được sử dụng để tính toán hiệu ứng của camera đối với cân bằng trắng và
màu da. Kết quả được dùng mô phỏng phần da mờ, da nổi bật hoặc kết hợp cả hai trong
không gian RGB hoặc không gian chuẩn hoá RG.
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 22
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Một cách tiếp cận khác để tính quỹ tích da là sử dụng các hàm cơ sở của tín hiệu
màu da. Các tín hiệu màu da là quang phổ phản xạ từ da, các hàm cơ sở được tính toán từ
các tín hiệu này để thu được quỹ tích da của các camera khác nhau một cách dễ dàng
bằng cách kết hợp sự ảnh hưởng của các điều kiện chiếu sáng khác nhau. Các thiết lập
thông số của camera cần được xác định cụ thể để tính toán tích quỹ.
c. Tiếp cận dựa trên hình ảnh

Sau khi xác định được phạm vi chiếu sáng và điều kiện cân bằng trắng, chúng ta cần
thu hình ảnh. Phạm vi chiếu sáng thu được từ phạm vi nhiệt độ màu tối thiểu đến tối đa
của ánh sáng. Nên đưa vào nguồn sáng huỳnh quang với thành phần màu xanh lục đậm
để tính toán bởi nguồn sáng này có thể làm thay đổi sắc độ da bên ngoài quỹ tích. Quy
trình thể hiện như sau:
(I) Thu nhận hình ảnh dưới những điều kiện ánh sáng khác nhau
(II) Trích xuất các vùng da
(III) Chuyển đổi da từ RGB sang không gian sắc độ và mô hình hoá
Hình 10: Quy trình mô hình hoá màu da
Việc sử dụng các toạ độ để làm giảm số lượng hình ảnh là cần thiết vì thành phần
cường độ màu có thể được bỏ qua (do sự xấp xỉ tuyến tính của camera) hay sự biến đổi
cường độ trong đầu vào RGB không ảnh hưởng đến sắc độ. Kích thước của quỹ tích da
phụ thuộc vào việc lựa chọn phạm vi chiếu sáng, số lượng hiệu chuẩn và camera được sử
dụng. Để đạt quỹ tích chặt chẽ cần phải xem xét làm thế nào để loại trừ yếu tố sắc độ,
việc này có thể khó khăn vì sự phân phối sắc độ da tuỳ thuộc vào mỗi ảnh, có thể phủ hợp
với ảnh này nhưng lại không phù hợp với ảnh khác. Nếu có đầy đủ dữ liệu ta có thể dùng
phương pháp thống kê để loại trừ các giá trị ít xuất hiện.
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 23
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
4. Áp dụng quỹ tích da
Các ứng dụng nhận diện khuôn mặt có thể được xử lý trên ảnh hoặc video, hoặc
đồng thời cả hai.
• Ảnh tĩnh:
Quỹ tích da ứng dụng trên ảnh tĩnh như một bộ lọc đơn giản mô tả sắc độ da có thể
có cho một camera trong điều kiện nhất định. Vì không có thêm ràng buộc nên phải sử
dụng toàn bộ phạm vi, cần xác định vùng màu da là khuôn mặt. Quỹ tích da cho kết quả
tốt trong những trường hợp thay đổi mạnh về ánh sáng.
• Video
Video là những đối tượng mà các trường chiếu sáng thay đổi theo thời gian và miền
không gian, nhưng những khung ảnh kế tiếp nhau thì phạm vi thay đổi không nhiều. Dựa

vào đặc tính này, sự phân phối màu da của khung ảnh trước đó được dùng cho khung ảnh
hiện tại
Trong thử nghiệm, việc theo vết dựa trên quỹ tích da được khởi tạo thủ công bằng
cách lựa chọn khuôn mặt trong khung ảnh đầu tiên, hoặc có thể lựa chọn khuôn mặt tự
động dựa trên các phương pháp kiểm tra trên một số tín hiệu. Đối với việc biểu diễn
thống kê phân phối màu da thu được ta sử dụng biểu đồ tỉ lệ màu da trong không gian
RG. Sau khi tính toán trên biểu đồ, khung hình tiếp theo được chuyển đổi sang không
gian chuẩn hoá RG và được chiếu lại biểu đồ. Các pixel màu xám tương ứng với các giá
trị pixel RG, do vậy các hình ảnh màu xám được xem là giá trị ngưỡng.
III. DEMO CHƯƠNG TRÌNH NHẬN DIỆN KHUÔN MẶT NGƯỜI
1. Thuật toán áp dụng
Chương trình gồm 2 bước: Thu thập dữ liệu và phát hiện khuôn mặt
Bước 1: Thu thập dữ liệu
- Thu thập các ảnh màu da
- Chuyển từ không gian màu RGB sang không gian màu YCrCb, giữ lại
thông tin Cr và Cb
Cr = 0.5R – 0.419G – 0.081B
Cb = – 0.169R – 0.322G + 0.5B
- Mỗi pixel được biểu diễn bởi một đồ thị 2 chiều, cạnh là Cr, Cb
Sau khi thu thập dữ liệu, ta xây dựng không gian màu da, như biểu đồ dưới đây các
pixel màu vàng được tính toán là màu da mặt
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 24
BTH Cơ sở tri thức và ứng dụng - Nhận diện khuôn mặt người và mô hình hoá màu da
Hình 11: Các pixel thu thập được sau khi chuyển đổi không gian màu
Bước 2: Nhận diện khuôn mặt
- Chuyển ảnh đầu vào từ RGB → YCrCb
- Một pixel được xem là màu da nếu nó thuộc về vùng không gian mẫu
- Các pixel là màu da chuyển sang màu trắng, các pixel khác chuyển thành
màu đen
- Khử nhiễu: với mỗi pixel, đếm số điểm trắng xung quanh

Lớn hơn ngưỡng α thì chuyển thành pixel trắng (α: ngưỡng trên)
Nhỏ hơn β thì chuyển thành màu đen (β: ngưỡng dưới)
Những điểm ảnh còn lại giữ nguyên
- Với mỗi vùng pixel trắng liên thông với nhau, nếu có pixel đen nằm trong
vùng thì đó là da mặt người (đặc trưng khuôn mặt có mắt, mũi. miệng, …
là những vùng không phải màu da → pixel đen)
2. Demo chương trình
- Giao diện chính (1)
Nguyễn Thị Diệu Anh - Đỗ Văn Luyện (T5 - 2012) Page 25

×