Tải bản đầy đủ (.pdf) (83 trang)

xây dựng ứng dụng dựa trên kỹ thuật nhận dạng mẫu ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.89 MB, 83 trang )

Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

LỜI CẢM ƠN
Trong quá trình nghiên „XÂY DỰNG ỨNG DỤNG DỰA TRÊN KỸ
THUẬT NHẬN DẠNG MẪU ẢNH‟ . em xin cám ơn các thầy giáo cô giáo dạy sau
đại học và đặc biệt em xin cám ơn thầy Lê Dũng đã giúp đỡ em rất tận tình trong
thời gian làm đề tài. Đồng thời em xin cám ơn các thầy giáo cô giáo, các bạn bè anh
em cùng chuyên ngành trong trường đã cho em những bài học kiến thức quý báu,
những tài liệu quan trọng để em có hành trang tự tin để nghiên cứu hoàn thành đề
tài luận văn cao học này.
Trân trọng cảm ơn !

HV: Lương Hồng Sơn

Trang 1


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

LỜI CAM ĐOAN
Tôi xin cam đoan những kết quả nghiên cứu trong luận văn của tôi là hoàn toàn
trung thực, không vi phạm bất cứ điều gì trong luật sở hữu trí tuệ và pháp luật Việt
Nam. Nếu sai, tôi hoàn toàn chịu trách nhiệm trước pháp luật.
TÁC GIẢ LUẬN VĂN

HV: Lương Hồng Sơn


Trang 2


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

MỤC LỤC
LỜI CẢM ƠN ................................................................................................................................... 1
LỜI CAM ĐOAN ............................................................................................................................. 2
MỤC LỤC ......................................................................................................................................... 3
DANH MỤC CÁC KÝ HIỆU CHỮ VIẾT TẮT ........................................................................... 6
DANH MỤC CÁC BẢNG ............................................................................................................... 7
DANH MỤC ĐỒ THỊ HÌNH VẼ .................................................................................................... 8
MỞ ĐẦU ..........................................................................................................................................10
Chƣơng 1. CÁC PHƢƠNG PHÁP NHẬN DẠNG KHUÔN MẶT .............................................12
1.1. Giới thiệu.............................................................................................................................12
1.2. Định nghĩa bài toán xác định mặt ngƣời ..........................................................................12
1.3. Ứng dụng của phƣơng pháp xác định khuôn mặt ngƣời ................................................12
1.4. Các phƣơng pháp xác định mặt ngƣời .............................................................................14
1.4.1. Hƣớng tiếp cận dựa trên tri thức .....................................................................................14
1.4.2. Hƣớng tiếp cận dựa trên đặc trƣng không thay đổi ................................................ 19
1.4.2.1. Các đặc trƣng khuôn mặt ................................................................................... 20
1.4.2.2. Kết cấu .................................................................................................................. 23
1.4.2.3. Sắc màu của da .................................................................................................... 23
1.4.2.4. Đa đặc trƣng ......................................................................................................... 24
1.4.3. Hƣớng tiếp cận dựa trên so khớp mẫu ....................................................................... 26
1.4.3.1. Xác định các mẫu trƣớc ...................................................................................... 26
1.4.3.2. Các mẫu bị biến dạng.......................................................................................... 31
1.4.4. Hƣớng tiếp cận dựa trên diện mạo ............................................................................. 33

1.4.4.1. Eigenface............................................................................................................... 33
1.4.4.2. Hƣớng tiếp cận dựa trên phân bố...................................................................... 34
1.4.4.3. Mạng Neural ......................................................................................................... 35
1.5. Những khó khăn trong việc xác định khuôn mặt ngƣời .................................................38
1.6. Kết luận ...............................................................................................................................39
Chƣơng 2. LÝ THUYẾT CĂN BẢN VỀ PHƢƠNG PHÁP NHẬN DẠNG KHUÔN MẶT VÀ
NHẬN DẠNG VỊ TRÍ MẮT ..........................................................................................................40
2.1. Tổng quan thuật giải Adaboost-Haar like feature ............................................................40
2.2. Thuật giải Adaboost ...........................................................................................................42
2.2.1. Định nghĩa ..................................................................................................................... 42

HV: Lương Hồng Sơn

Trang 3


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

2.2.2. Tƣ tƣởng ....................................................................................................................... 42
2.2.3. Thuật toán Adaboost ................................................................................................... 44
2.3. Haar-Like ............................................................................................................................48
2.3.1. Đặc trƣng Haar-Like ................................................................................................... 48
2.3.2. Mô tả về việc áp dụng đặc trƣng Haar-like để phát hiện khuôn mặt ...................... 49
2.3.3. Lợi ích............................................................................................................................ 50
2.3.4. Cascade of Classifiers .................................................................................................. 52
2.4. Cascade of boosting classifiers ..........................................................................................54
2.5. Nhận dang mắt ...................................................................................................................55
2.5.1. Giới thiệu ...................................................................................................................... 55

2.5.2. Xác định tâm mắt ......................................................................................................... 57
2.5.3. Kiến thức ƣu tiên và tiền xử lý .................................................................................... 58
2.5.4. Đánh giá ........................................................................................................................ 59
2.5.5. Các kết quả .................................................................................................................. 60
2.5.5. So sánh với mức hiện tại .............................................................................................. 62
2.6. Kết luận ...............................................................................................................................65
Chƣơng 3. XÂY DỰNG BÀI TOÁN PHẦN MỀM VÀ KẾT QUẢ THỰC NGHIỆM .............66
3.1. Ứng dụng từ lý thuyết ........................................................................................................66
3.2. Sơ đồ khối mô phỏng..........................................................................................................66
3.2.1. Khối camera - ảnh đầu vào ......................................................................................... 67
3.2.2. Khối tiền xử lý ảnh ....................................................................................................... 67
3.2.3. Khối rút trích trọn đặc trƣng ...................................................................................... 67
3.2.4. Khối nhận dạng khôn mặt ........................................................................................... 67
3.2.5. Khối xác định vị trí mắt ............................................................................................... 67
3.2.6. Khối giám sát mắt ........................................................................................................ 67
3.2.7. Khối chấp hành ............................................................................................................ 67
3.3.

Thuật toán và video demo ........................................................................................... 68

3.3.1. Thuật toán điều khiển xe lăn ....................................................................................... 68
3.3.2. Hình ảnh và Video demo ............................................................................................. 73
3.3.2.1. Hình ảnh demo...................................................................................................... 73
3.3.2.2. Video demo điều khiển xe lăn .............................................................................. 76
3.4. Đánh giá kết quả.................................................................................................................76

HV: Lương Hồng Sơn

Trang 4



Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

3.5. Kết luận .................................................................................................................................77
Kết luận ............................................................................................................................................79
TÀI LIỆU THAM KHẢO ..............................................................................................................80

HV: Lương Hồng Sơn

Trang 5


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

DANH MỤC CÁC KÝ HIỆU CHỮ VIẾT TẮT
Từ
viết tắt

Tiếng anh

Tiếng việt

Automatic Teller Machine

Máy rút tiền tự động


PIN

Personal Identification Number

Số nhận dạng cá nhân

GA

Genetic Algorithm

(Tên riêng)

PDF

Probility Density Function

Hàm mật độ xác suất

ML

Maximum- Likelihood

Cực đại khả năng

ATM

CART Classification and Regression Trees Phân loại và cây hồi quy
DoG
CIE


Difference of Gauss
Commission Internationale
del‟Eclairage

Khác nhau biệt cảu Gauss
Hiệp hội không gian màu
Vùng màu-Độ bão hòa màu-Độ

HSV

Hue- Saturation- Value

QMS

Quadrature Mirror Filter

Bộ lọc gương tứ cầu

PCA

Principal Component Analysis

Phân tích thành phần chính

SVM

Support Vector Machines

Phương pháp thống kê


PDM

Point Distribution Model

Phân bố điểm

ASM

Active Shape Model

Hoạt động hình dáng kiểu mẫu

MLP

Multilayer Perceptron Network

Mạng truyền thẳng đa tầng

Self Organizing Map
Optical Character Recognition

Mạng tự tổ chức

Summed Area Table

Tổng giá trị mảng

SOM
OCR
SAT


sáng

Nhận dạng ký tự quang học

RSAT Rotated Summed Area Table

Đặc trưng xoayn giá trị mảng

WEC

Worse eye characteristic

Đặc trưng mắt tệ

ROC

receiver operating characteristic

Đường cong đặc trưng hoạt động

HV: Lương Hồng Sơn

Trang 6


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ


DANH MỤC CÁC BẢNG
Bảng 2.1. So sánh hiệu suất với giá trị e
Bảng 3.1. Đánh giá kết quả thực nghiệm

HV: Lương Hồng Sơn

Trang 7


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

DANH MỤC ĐỒ THỊ HÌNH VẼ
Hình 1.1. Hình ảnh với mức độ phân giải khác nhau giảm dần
Hình 1.2. Một lọai tri trức của người nghiên cứu phân tích trên khuôn mặt
Hình 1.3. Phương pháp chiếu
Hình 1. 4. Chiếu từng phần ứng viên để xác định khuôn mặt
Hình 1.5. Một mẫu khuôn mặt, có 16 vùng và 23 quan hệ
Hình 1. 6. Phân nhóm dữ liệu khuôn mặt và nhóm dữ liệu không phải khuôn mặt
Hình 1.7. (a) Khoảng cách giữa mẫu cần kiểm tra và các nhóm; (b) hai thành phần
khoảng cách
Hình 1.8. Mô hình mạng Neural theo Rowley
Hình 1.9. Một ví dụ cho dữ liệu vào và dữ liệu ra của mạng định hướng
Hình 2.1. Các bộ phân loại yếu
Hình 2.2. Mô hình phân tần kết h p các bộ phân loại yếu để xác định khuôn mặt
Hình 2.3. Kết h p các bộ phận loại yếu thành bộ phận loại mạnh
Hình 2.4. Sơ đồ khối
Hình 2.5. Đặc trưng Haar-Like
Hình 2.6. Mô tả đặc trưng Haar-like

Hình 2.8.Ví dụ cách tính nhanh tổng điểm ảnh của vùng D trên ảnh với các đặc
trưng xoay 450
Hình 2.10. Cascade of boosting classifiers
Hình 2.11. Cách tiếp cận nhiều tầng xác định tâm của mắt
Hình 2.12. Ví dụ trí tuệ nhân tạo với một vòng tròn đen trên một nền sáng
Hình 2.13. Xác định vị trí mắt
Hình 2.14. Kết quả xác định vị trí mắt
Hình 2.15. Phân tích định lư ng của phương pháp đề xuất cho các cơ sở dữ liệu
BioID
Hình 3.1. Sở đồ khối quá trình xử lý ảnh đầu vào tới khối chấp hành
Hình 3.2. Sở đồ thuật toán quá trình xử lý
Hình 3.3. Sử dụng nháy mắt phải điều khiển xe lăn sang phải và sang trái

HV: Lương Hồng Sơn

Trang 8


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

Hình 3.3. Sử dụng nháy mắt phải điều khiển xe lăn sang phải và sang trái
Hình 3.4. Sử dụng nháy mắt trái điều khiển xe lăn tiến và lùi
Hình 3.5. Sử dụng đóng đồng thời hai mắt điều khiển xe lăn dừng lại và tiến
Hình 3.6. Trạng thái bình thường khi xe lăn đang thực hiện đi tiến

HV: Lương Hồng Sơn

Trang 9



Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

MỞ ĐẦU
- Lý do chọn đề tài
Hiện nay điện tử đã đi sâu vào đời sống của con người với nhiều thiết bị hiện
đại đã giúp con người có một chất lư ng ngày càng hoàn hảo hơn. Để có đư c sự
hoàn hảo chọn vẹn đòi hỏi con người càng phải sáng tạo, phát minh nghiên cứu
nhiều hơn nữa. cuộc sống luôn đi đôi với sự phát triển sự phát triển tác động ngư c
lại làm cho cuộc sống ngày càng đi lên. Đó là sự kết h p hài hòa, mềm dẻo của con
người giữa lao động với học tập sáng tạo và nhu cầu cuộc sống.
Người bình thường có một cuộc sống chất lư ng tốt hơn, đư c hưởng l i rất
nhiều từ phát mình công nghệ. Những phát minh chế tạo thiết bị hay sản phẩm họ
điều nhằm mục đích phục vụ đa số chứ không phục vụ tiểu số, chính vì lẽ đó mà
người tàn tật thiệt thòi rất nhiều. Để người tàn tật có đư c cuộc sống bình thường
như người bình thường quả là điều không thể. Với tôi không thể không phải là dấu
chấm hết. tôi là một người không tài giỏi nhưng tôi có một trái tim nhân hậu bao
dung nhưng cũng rất cứng rắn. Đam mê không ngại khó, không biết mệt mỏi khi bắt
tay vào nghiên cứu, tìm tòi, học hỏi. với ý trí đã hun đúc nung nấu từ lâu là muốn
làm cái gì đó để phục vụ họ. Đó là lý do tôi chọn đề tài này nhằm nghiên cứu xe lăn
điều khiển bằng mắt để phục vụ cho người khuyết tật với mục đích là giúp họ có thể
di chuyển như người bình thường. họ có thể đi đến vị trí mà họ cần đến.
- Lịch sử nghiên cứu
Hơn một thập kỷ qua có rất nhiều công trình nghiên cứu về bài toán
xác định khuôn mặt người từ ảnh đen trắng, xám đến ảnh màu như ngày hôm
nay. Các nghiên cứu đi từ bài toán đơn giản, mỗi ảnh chỉ có một khuôn mặt
người nhìn thẳng vào thiết bị thu hình và đầu ở tư thế thẳng đứng trong ảnh đen

trắng. Cho đến ngày hôm nay bài toán mở rộng cho ảnh màu, có nhiều
khuôn mặt trong cùng một ảnh, có nhiều tư thế thay đổi trong ảnh. Không
những vậy mà còn mở rộng cả phạm vi từ môi trường xung quanh khá đơn
giản (trong phòng thí nghiệm) cho đến môi trường xung quanh rất phức tạp
(như trong tự nhiên) nhằm đáp ứng nhu cầu thật sự và rất nhiều của con người.
HV: Lương Hồng Sơn

Trang 10


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

Mặc dù kết quả đó còn nhiều mặt hạn chế, nhưng đó cũng là một nguồn động lực to
lớn để con người nghiên cứu tốt hơn, đến giờ đây con người đã phát minh ra đư c
những máy móc thiết bị tiên tiến đã giúp ích đư c rất nhiều vào cuộc sống, như máy
nhận dạng khuôn mặt, vân tay, cử chỉ hành động.
Mục đích nghiên cứu của luận văn, đối tƣợng, phạm vi nghiên cứu
-

Nghiên cứu phần mềm hệ thống điều khiển xe lăn bằng mắt cho người
khuyết tật, liệt tứ chi.

-

Xử lý ảnh từ Webcam nhận dạng xác định khuôn mặt và vị trí mắt.

-


Giám sát sự thay đổi của mắt, xuất lệnh điều khiển theo sự thay đổi của mắt.

-

Thực nghiệm đánh giá kết quả của sản phẩm

Tóm tắt cơ bản và đóng góp mới của tác giả
-

Nội dung đề tài cần giải quyết các vấn đề:
+ Khái quát về các phương pháp nhận dạng khuôn mặt và mắt
+ Các thuật toán dò tìm khuôn mặt adaboot và Các đặc trưng Haar-like
+ Xây dựng phần mềm điều khiển xe lăn bằng mắt.

Phƣơng pháp nghiên cứu.
Phương pháp nghiên cứu xuất phát từ các yêu cầu thực tiễn, tham khảo các mô
hình thực tế. xây dựng từ nền tảng đã có sẵn, từ đó ứng dụng vào thực tiễn.
Tìm hiểu các công trình nghiên cứu khoa học khoa học của các nhóm, cá nhân,
tập đoàn…
Tôi xin chân thành cảm ơn TS Lê Dũng, cùng quý thầy giáo cô giáo trong Viện
Điện tử - viện truyền thông trường Đại học Bách Khoa Hà Nội, các thành viên trong
trong lớp thạc sĩ kỹ thuật Điện tử 213B đã giúp đỡ tôi hoàn thành nội dung luận văn
này.

HV: Lương Hồng Sơn

Trang 11


Trường ĐH Bách Khoa Hà Nội


Luận văn thạc sĩ

Chƣơng 1. CÁC PHƢƠNG PHÁP NHẬN DẠNG KHUÔN MẶT
1.1. Giới thiệu
Hơn một thập kỷ qua có rất nhiều công trình nghiên cứu về bài toán xác định
khuôn mặt người từ ảnh đen trắng, xám đến ảnh màu như ngày hôm nay. Các
nghiên cứu đi từ bài toán đơn giản, mỗi ảnh chỉ có một khuôn mặt người nhìn
thẳng vào thiết bị thu hình và đầu ở tư thế thẳng đứng trong ảnh đen trắng. Cho
đến ngày hôm nay bài toán mở rộng cho ảnh màu, có nhiều khuôn mặt trong cùng
một ảnh, có nhiều tư thế thay đổi trong ảnh. Đến nay các bài toán xác định mặt
người đã mở rộng với nhiều miền nghiên cứu như nhận dạng khuôn mặt, định vị
khuôn mặt, theo dõi mặt người hay nhận dạng cảm xúc mặt người…
Phát hiện mặt người trong ảnh là phần đầu tiên của một hệ thống nhận dạng mặt
người. Các hệ thống nhận dạng khuôn mặt đư c bắt đầu xây dựng từ những năm
1970, tuy nhiên do còn hạn chế về các luật xác định mặt người nên chỉ đư c áp
dụng trong một số ứng dụng như nhận dạng thẻ căn cước. Nó chỉ đư c phát triển
mạnh mẽ từ những năm 1990 khi có những tiến bộ trong công nghệ video và ngày
nay thì các ứng dụng của xác định mặt người đã trở nên phổ biến trong cuộc sống
[46].
1.2. Định nghĩa bài toán xác định mặt ngƣời
Xác định khuôn mặt người là một phạm vi đề tài mang ý nghĩa khoa học của
ngành kỹ thuật máy tính, để xác định các vị trí và kích thước của các khuôn mặt
người trong các ảnh bất kì. Kỹ thuật này dựa trên nhận biết các đặc trưng của
khuôn mặt và bỏ qua những thứ khác như: song, núi, bầu trời, tòa nhà, cây cối,
động vật, cơ thể người…
1.3. Ứng dụng của phƣơng pháp xác định khuôn mặt ngƣời
Có nhiều ứng dụng đã đư c sử dụng trọng cuộc sống hoặc đang đư c nghiên
cứu và thiết kế, tôi chỉ xin đưa ra một số loại ứng dụng sau:
 Hệ thống tương tác giữa người và máy: giúp những người bị tật hoặc khiếm

khuyết có thể trao đổi. Những người dùng ngôn ngữ tay có thể giao tiếp với
những người bình thường. Những người bị bại liệt thông qua một số ký hiệu
HV: Lương Hồng Sơn

Trang 12


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

nháy mắt có thể biểu lộ những gì họ muốn và đây chính là phạm vi đề tài tôi
nghiên cứu và ứng dụng…
 Bảo mật: các ứng dụng về bảo mật rất đa dạng, một trong số đó là công
nghệ nhận dạng mặt người của laptop, công nghệ này cho phép chủ nhân
của máy tính chỉ cần ngồi trước máy là có thể đăng nhập đư c. Để sử dụng
công nghệ này, người dùng phải sử dụng một webcam để chụp ảnh khuôn
mặt của mình và cho máy “học” thuộc các đặc điểm của khuôn mặt giúp
cho quá trình đăng nhập sau này.
 Nhận dạng người có phải là tội phạm truy nã hay không? Giúp cơ quan an
ninh quản lý tốt con người. Công việc nhận dạng có thể ở trong môi trường
bình thường cũng như trong bóng tối (sử dụng camera hồng ngoại).
 Hệ thống quan sát, theo dõi và bảo vệ. Các hệ thống camera sẽ xác định đâu
là con người và theo dõi con người đó xem họ có vi phạm gì không, ví dụ
xâm phạm khu vực không đư c vào, ….
 Lưu trữ (rút tiền ATM, để biết ai rút tiền vào thời điểm đó), hiện nay có tình
trạng những người bị người khác lấy mất thẻ ATM hay mật mã số PIN và
những người ăn cắp này đi rút tiền, hoặc những người chủ thẻ đi rút tiền
nhưng lại báo cho ngân hàng là mất thẻ và mất tiền. Các ngân hàng có nhu
cầu khi có giao dịch tiền sẽ kiểm tra hay lưu trữ khuôn mặt người rút tiền để

sau đó đối chứng và xử lý.
 Thẻ căn cước, chứng minh nhân dân (Face Identification).
 Điều khiển vào ra: văn phòng, công ty, trụ sở, nhà máy, nhà xưởng…Kết
h p thêm vân tay và mống mắt. Cho phép nhân viên đư c ra vào nơi cần
thiết, hay mỗi người sẽ đăng nhập máy tính cá nhân của mình mà không cần
nhớ tên đăng nhập cũng như mật khẩu mà chỉ cần xác định thông qua khuôn
mặt
 An ninh sân bay, xuất nhập cảnh như hiện nay các nước phát triển tiên tiến
đã ứng dụng như cơ quan xuất nhập cảnh Mỹ đã áp dụng. Dùng để xác thực
người xuất nhập cảnh và kiểm tra có phải là nhân vật khủng bố không.
HV: Lương Hồng Sơn

Trang 13


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

 Tìm kiếm và tổ chức dữ liệu liên quan đến con người thông qua khuôn mặt
người trên nhiều hệ thống cơ sở dữ liệu lưu trữ thật lớn, như internet, các
hãng truyền hình. Ví dụ tìm các đoạn video có tổng mặt người cần tìm trong
đoạn video đó hay không.
 Kiểm tra trạng thái người lái xe có ngủ gật, mất tập trung hay không, và hỗ
tr thông báo khi cần thiết.
 Trong lĩnh vực thiết kế điều khiển robot.
 Hãng máy chụp hình Sony, Canon đã ứng dụng bài toán xác định khuôn mặt
người vào máy chụp hình thế hệ mới để cho kết quả hình ảnh đẹp hơn, nhất
là khuôn mặt người.
 Trong y học, ứng dụng phát hiện trạng thái biểu cảm của mặt người như đau

đớn, cười, ngủ…[46]
1.4. Các phƣơng pháp xác định mặt ngƣời
Có nhiều phương pháp xác định khuôn mặt người, từ ảnh xám đến ngày nay là
ảnh màu. Tôi xin trình bày một cách tổng quát nhất những hướng giải quyết chính
cho bài toán, từ những hướng chính này nhiều tác giả thay đổi một số ý nhỏ bên
trong để có kết quả mới tốt hơn thuận tiện cho mục đích hướng nghiên cứu và ứng
dụng của mình vào trong những công việc cụ thể. Dựa vào tính chất của các
phương pháp xác định khuôn mặt người trên ảnh. Các phương pháp này đư c chia
làm bốn hướng tiếp cận chính. Ngoài bốn hướng này, nhiều nghiên cứu có khi liên
quan đến không những một hướng tiếp cận mà còn liên quan nhiều hơn một hướng
chính.
1.4.1. Hƣớng tiếp cận dựa trên tri thức
Mã hóa các hiểu biết của con người về các loại khuôn mặt người thành các
luật. Thông thường các luật mô tả quan hệ của các đặc trưng.
Trong hướng tiếp cận này, các luật sẽ phụ thuộc rất lớn vào tri thức của những tác
giả nghiên cứu về bài toán xác định khuôn mặt người. Đây là hướng tiếp cận dạng
top-down. Dễ dàng xây dựng các luật cơ bản để mô tả các đặc trưng của khuôn mặt
và các quan hệ tương ứng.Ví dụ, một khuôn mặt thường có hai mắt đối xứng nhau
HV: Lương Hồng Sơn

Trang 14


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

qua trục thẳng đứng ở giữa khuôn mặt và có một mũi, một miệng. Các quan hệ của
các đặc trưng có thể đư c mô tả như quan hệ về khoảng cách và vị trí. Thông
thường các tác giả sẽ trích đặc trưng của khuôn mặt trước tiên để có đư c các

ứng viên, sau đó các ứng viên này sẽ đư c xác định thông qua các luật để
biết ứng viên nào là khuôn mặt và ứng viên nào không phải khuôn mặt.
Thường áp dụng quá trình xác định để giảm số lư ng xác định sai.
Một vấn đề khá phức tạp khi dùng hướng tiếp cận này là làm sao
chuyển từ tri thức con người sang các luật một các hiệu quả. Nếu các luật này
quá chi tiết (chặt chẽ) thì khi xác định có thể xác định thiếu các khuôn mặt có
trong ảnh, vì những khuôn mặt này không thể thỏa mãn tất cả các luật đưa ra.
Nhưng các luật tổng quát quá thì có thể chúng ta sẽ xác định lầm một vùng
nào đó không phải là khuôn mặt mà lại xác định là khuôn mặt. Và cũng khó
khăn mở rộng yêu cầu từ bài toán để xác định các khuôn mặt có nhiều tư thế
khác nhau.

Hình 1.1. Hình ảnh với mức độ phân giải khác nhau giảm dần
(a) Ảnh ban đầu có độ phân giải n=1
(b) Ảnh có độ phân giải n=4
(c) Ảnh có độ phân giải n= 8
(d) Ảnh có độ phân giải n= 16

HV: Lương Hồng Sơn

Trang 15


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

Hình 1.2. Một lọai tri trức của người nghiên cứu phân tích trên khuôn mặt
Yang và Huang dùng một phương thức theo hướng tiếp cận này để xác các
khuôn mặt[7]. Hệ thống của hai tác giả này bao gồm ba mức luật. Ở mức

cao nhất, dùng một khung cửa sổ quét trên ảnh và thông qua một tập luật để
tìm các ứng viên có thể là khuôn mặt. Ở mức kế tiếp, hai ông dùng một tập
luật để mô tả tổng quát hình dáng khuôn mặt. Còn ở mức cuối cùng lại dùng
một tập luật khác để xem xét ở mức chi tiết các đặc trưng khuôn mặt. Một
hệ thống đa độ phân giải có thứ tự đư c dùng để xác định, hình 1.1. Các
luật ở mức cao nhất để tìm ứng viên như: “vùng trung tâm khuôn mặt phần
tối hơn trong hình 1.2 có bốn phần với một mức độ đều cơ bản”, “phần xung
quanh bên trên của một khuôn mặt phần sáng hơn trong hình 1.2 có một mức
độ đều cơ bản”, và “mức độ khác nhau giữa các giá trị xám trung bình của
phần trung tâm và phần bao bên trên là đáng kể”. Độ phân giải thấp nhất
(mức độ) của ảnh dùng để tìm ứng viên khuôn mặt mà còn tìm ở các mức
phân giải tốt hơn. Ở mức hai, xem xét biểu đồ lịch sử (histogram) của các ứng
viên để loại bớt ứng viên nào không phải là khuôn mặt, đồng thời dò ra cạnh
bao xung quanh ứng viên. Ở mức cuối cùng, những ứng viên nào còn lại sẽ
đư c xem xét các đặc trưng của khuôn mặt về mắt và miệng. Hai ông đã
dùng một chiến lư c “từ thô đến mịn” hay “làm rõ dần” để giảm số lư ng
tính toán trong xử lý. Mặc dù tỷ lệ chính xác chưa cao, nhưng đây là tiền đề
cho nhiều nghiên cứu sau này.
Kotropoulos và Pitas đưa một phương pháp tương tự dùng trên độ phân
giải thấp. Hai ông dùng phương pháp chiếu để xác định các đặc trưng khuôn
mặt, Kanade đã thành công với phương pháp chiếu để xác định biên của khuôn
HV: Lương Hồng Sơn

Trang 16


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ


mặt. Với I(x,y) là giá trị xám của một điểm trong ảnh có kích thước m x n ở
tại vị trí (x,y), các hàm để chiếu ảnh theo phương ngang và thẳng đứng đư c
định nghĩa như sau:
(1.4.1)

(1.4.2)
Dựa trên biểu đồ hình chiếu ngang, có hai cực tiểu địa phương khi hai
ông xét quá trình thay đổi độ dốc của HI, đó chính là cạnh bên trái và phải
của hai bên đầu. Tương tự với hình chiếu dọc VI, các cực tiểu địa phương
cũng cho ta biết vị trí miệng, đỉnh mũi, và hai mắt. Các đặc trưng này đủ để
xác định khuôn mặt. Hình 1.3.a cho một ví dụ về cách xác định như trên.
Cách xác định này có tỷ lệ xác định chính xác là 86.5% cho trường h p chỉ có
một khuôn mặt thẳng trong ảnh và hình nền không phức tạp. Nếu hình nền
phức tạp thì rất khó tìm, hình 1 . 3.b. Nếu ảnh có nhiều khuôn mặt thì sẽ
không xác định đư c, hình1. 3.c.

Hình 1.3. Phương pháp chiếu
( a) ảnh chỉ có một khuôn mặt và hình nền đơn giản;
(b) ảnh chỉ có một khuôn mặt và hình nền phức tạp;
(c) ảnh Ảnh có nhiều khuôn mặt

HV: Lương Hồng Sơn

Trang 17


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ


Hình 1. 4. Chiếu từng phần ứng viên để xác định khuôn mặt
Fan phân đoạn ảnh màu để tìm cạnh thông qua thuật toán tăng vùng để xác
định các ứng viên. Dùng đặc tính hình ellipse của khuôn mặt người để xác
định ứng viên nào là khuôn mặt người.
Kim kết h p thuật toán watershed cho các ảnh có nhiều độ phân giải cùng
mô hình màu da người để tìm ứng viên, rồi xác định khuôn mặt người
trong video. Tỷ lệ chính xác khoảng 87-94%. Phương pháp chỉ xử lý cho các
frame ảnh chỉ có một khuôn mặt và ảnh này phải chụp thẳng chỉ có đầu và vai.
Sahbi và Boujemaa sử dụng mạng neural học để ước lư ng các tham số cho
mô hình Gauss, mục đích để tìm ứng viên trên sắc màu da của người. Sau khi
có ứng viên, hai ông chiếu lên hai trục: đứng và ngang để xác định khuôn mặt
người.
Có nhiều nghiên cứu sau này sử dụng phương pháp chiếu để xác định
khuôn mặt người. Min dùng mô hình màu da không tham số, Baskan, Mateos,
và Nicponski xây dựng bộ lọc, để tìm ứng viên khuôn mặt, sau đó chiếu lên hai
trục để xác định các thành phần khuôn mặt để xác định ứng viên đó có phải là
khuôn mặt hay không. Còn Mateos và Chicote dùng kết cấu để xác định ứng
viên trong ảnh màu. Sau đó phân tích hình dáng, kích thước, thành phần khuôn
mặt để xác định khuôn mặt. Khi tìm đư c ứng viên khuôn mặt, hai ông trích
các ứng viên của từng thành phần khuôn mặt, sau đó chiếu từng phần này để
xác thực đó có phải là thành phần khuôn mặt hay không, hình 1.4. Tỷ lệ chính

HV: Lương Hồng Sơn

Trang 18


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ


xác hơn 87%.
Farhad và Abdolhorsein dùng tri thức về histogram để xác định khuôn mặt
trong các frame liên tục trong một đoạn video. Tương tự, Hidekazu và
Mamoru cũng dùng histogram, nhưng hai ông dùng thuật giải di truyền lai
(Genetic Algorithm– GA) như là một phương pháp tìm kiếm ngẫu nhiên dựa
vào đỉnh của biểu đồ màu của ảnh.
Rodrigues và Buf dùng phương pháp chọn các keypoint trong nhiều tỷ lệ
khác nhau, đặc biệt tác giả chỉ dùng các keypoint dư thừa dựa trên nhiều độ
phân giải. Dựa trên quan hệ hình học của các thành phần khuôn mặt, hai
ông nhóm các keypoint lại để xác định khuôn mặt người.
Fred dự trên tính chất đối xứng của khuôn mặt người, ông xem xét các phân
bố trên histogram có tính chất gần đối xứng để xác định khuôn mặt người
trong ảnh xám đơn có khuôn mặt chụp thẳng.
Berbar kết h p mô hình màu da người và xác định cạnh để tìm ứng viên khuôn
mặt người. Sau đó kết h p quan hệ các đặc trưng và phương pháp chiếu các
ứng viên khuôn mặt xuống hai trục: dứng và ngang để xác định ứng viên nào
thật sự là khuôn mặt người[46].
1.4.2. Hƣớng tiếp cận dựa trên đặc trƣng không thay đổi
Mục tiêu các thuật toán đi tìm các đặc trưng mô tả cấu trúc khuôn mặt người
mà các đặc trưng này sẽ không thay đổi khi tư thế khuôn mặt, vị trí đặt thiết bị thu
hình hoặc điều kiện ánh sáng thay đổi.
Đây là hướng tiếp cận theo kiểu bottom-up. Tìm các đặc trưng không thay đổi
của khuôn mặt người để xác định khuôn mặt người. Dựa trên nhận xét thực tế,
con người dễ dàng nhận biết các khuôn mặt và các đối tư ng trong các tư
thế khác nhau và điều kiện ánh sáng khác nhau, thì phải tồn tại các thuộc tính
hay đặc trưng không thay đổi. Có nhiều nghiên cứu đầu tiên xác định các đặc
trưng khuôn mặt rồi chỉ ra có khuôn mặt trong ảnh hay không. Các đặc
trưng như: lông mày, mắt, mũi, miệng, và đường viền của tóc đư c trích
bằng phương pháp xác định cạnh. Trên cơ sở các đặc trưng này, xây dựng

HV: Lương Hồng Sơn

Trang 19


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

một mô hình thống kê để mô tả quan hệ của các đặc trưng này và xác định sự
tồn tại của khuôn mặt trong ảnh. Một vấn đề của các thuật toán theo hướng
tiếp cận đặc trưng cần phải điều chỉnh cho phù h p điều kiện ánh sáng,
nhiễu, và bị che khuất. Đôi khi bóng của khuôn mặt sẽ tạo thêm cạnh mới, mà
cạnh này lại rõ hơn cạnh thật sự của khuôn mặt,vì thế nếu dùng cạnh để xác
định sẽ gặp khó khăn[46].
1.4.2.1. Các đặc trƣng khuôn mặt
Sirohey đưa một phương pháp xác định khuôn mặt từ một ảnh có hình
nền phức tạp. Phương pháp dựa trên cạnh dùng, phương pháp Candy và
Heuristics để loại bỏ các cạnh để còn lại duy nhất một đường bao xung quanh
khuôn mặt. Một hình ellipse dùng để bao khuôn mặt, tách biệt vùng đầu và hình
nền. Tỷ lệ chính xác của thuật toán là 80%. Cũng dùng phương pháp cạnh như
Sirohey, Chetverikov và Lerch dùng một phương pháp dựa trên blob và streak
(hình dạng giọt nước và sọc xen kẽ), để xác định theo hướng các cạnh. Hai ông
dùng hai blob tối và ba blob sáng để mô tả hai mắt, hai bên gò má, và mũi. Mô
hình này dùng các treak để mô tả hình dáng ngoài của khuôn mặt, lông mày, và
môi. Dùng ảnh có độ phân giải thấp theo biến đổi Laplace để xác định khuôn mặt
thông qua blob.
Graf đưa ra một phương pháp xác định đặc trưng rồi xác định khuôn
mặt trong ảnh xám. Dùng bộ lọc để làm nổi các biên, các phép toán hình thái
học (morphology) đư c dùng để làm nổi bật các vùng có cường độ cao và hình

dáng chắc chắn (như mắt). Thông qua histogram để tìm các đỉnh nổi bật để
xác định các ngưỡng chuyển ảnh xám thành hai ảnh nhị phân. Các thành
phần dính nhau đều xuất hiện trong hai ảnh nhị phân thì đư c xem là vùng
của ứng viên khuôn mặt rồi phân loại xem có phải là khuôn mặt không.
Phương pháp đư c kiểm tra trên các ảnh chỉ có đầu và vai của người. Tuy
nhiên còn vấn đề, làm sao sử dụng các phép toán morphology và làm sao xác
định khuôn mặt trên các vùng ứng viên.
Leung trình bày một mô hình xác suất để xác định khuôn mặt ở trong ảnh có hình
HV: Lương Hồng Sơn

Trang 20


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

nền phức tạp trên cơ sở một bộ xác định đặc trưng cục bộ và so khớp đồ thị ngẫu
nhiên. Ý chính là xem bài toán xác định khuôn mặt như là bài toán tìm kiếm với
mục tiêu là tìm thứ tự các đặc trưng chắc chắn của khuôn mặt để tạo thành và
giống nhất một mẫu khuôn mặt. Dùng năm đặc trưng hai mắt, hai lỗ mũi, phần nối
giữa mũi và miệng để mô tả một khuôn mặt. Luôn tính quan hệ khoảng cách với
các đặc trưng cặp như mắt trái, mắt phải, dùng phân bố Gauss để mô hình hóa. Một
mẫu khuôn mặt đư c đưa ra thông qua trung bình tương ứng cho một tập đa
hướng, đa tỷ lệ của bộ lọc đạo hàm Gauss. Từ một ảnh, các đặc trưng ứng viên
đư c xác định bằng cách so khớp từng điểm ảnh khi lọc tương ứng với vector mẫu
(tương tự mối tương quan), chọn hai ứng viên đặc trưng đứng đầu để tìm kiếm cho
các đặc trưng khác của khuôn mặt. Giống như xây dựng một đồ thị quan hệ
mỗi node của đồ thị tương ứng như các đặc trưng của một khuôn mặt, đưa
xác suất vào để xác định. Tỷ lệ xác định chính xác là 86%.

Bên cạnh tính khoảng cách liên quan để mô tả quan hệ giữa các đặc trưng
như Leung[4], Kendall và Dryden [12] dùng lý thuyết xác suất thống kê về
hình dáng. Dùng hàm mật độ xác suất (Probility Density Function - PDF)
qua N điểm đặc trưng, tương ứng (xi, yi) là đặc trưng thứ i với giả sử dựa vào
phân bố Gauss có 2N-chiều. Các tác giả áp dụng phương thức cực đại khả
năng (Maximum- Likelihood - ML) để xác định vị trí khuôn mặt. Một thuận
l i của phương pháp này là các khuôn mặt bị che khuất vẫn có thể xác định
đư c. Nhưng phương pháp không xác định đư c đa khuôn mặt trong ảnh.
Yow và Cipolla trình bày một phương thức dựa vào đặc trưng, dùng số
lư ng lớn các dấu hiệu từ ảnh và cả dấu hiệu về ngữ cảnh. Đầu tiên dùng bộ
lọc đạo hàm Gauss thứ hai, xác định các điểm mấu chốt ở tại cực đại địa
phương trong bộ lọc, rồi chỉ ra nơi có thể là đặc trưng. Giai đoạn hai, kiểm
tra các cạnh xung quanh điểm mấu chốt và nhóm chúng lại thành các vùng.
Tiêu chuẩn để nhóm các cạnh là gần và tương tự hướng và cường độ. Đo
lường các đặc tính vùng như: chiều dài cạnh, cường độ cạnh, và biến thiên
cường độ đư c lưu trong một vector đặc trưng. Từ dữ liệu đặc trưng khuôn
HV: Lương Hồng Sơn

Trang 21


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

mặt đã đư c huấn luyện, sẽ tính đư c giá trị trung bình và ma trận phương
sai của mỗi đặc trưng khuôn mặt. Một vùng là ứng viên khuôn mặt khi
khoảng cách Mahalanobis giữa các vector đặc trưng đều dưới một ngưỡng.
Rồi thông qua mạng Bayes để xác định ứng viên có phải là khuôn mặt
không. Tỷ lệ chính xác là 85%, tuy nhiên mức độ sai là 28%, và chỉ hiệu

quả với hình khuôn mặt có kích thước 60x60 điểm ảnh. Phương pháp này
đư c dùng thêm với mô hình đường viền linh hoạt.
Takacs và Wechsler trình bày một phương pháp dựa trên tích đặc trưng võng
mạc và cử động theo dao động nhỏ của mắt. Thuật toán hoạt động trên bản
đồ hay vùng của các mấu chốt, mô hình hóa lưới võng mạc. Đầu tiên tính
toán ước lư ng thô vùng khuôn mặt trên cơ sở bộ lọc. Giai đoạn thứ hai tinh
chế trên độ phân giải mịn hơn. Tỷ lệ sai là 4.69%.
Han phát triển một kỹ thuật trên cơ sở morphology để trích các đoạn giống
mắt (eye- analogue) để xác định khuôn mặt người. Ông nói rằng mắt và lông
mày là đặc trưng nổi bật nhất và ổn định nhất của khuôn mặt con người, và nó
rất hữu dụng để xác định khuôn mặt người. Ông định nghĩa các đoạn giống
mắt như là các cạnh trên đường viền của mắt. Đầu tiên, các phép t o á n
morphology như đóng, cắt bỏ sai khác, và phân ngưỡng để trích các điểm
ảnh có giá trị cường độ thay đổi đáng kể. Các điểm ảnh này sẽ trở thành các
điểm ảnh giống mắt. Sau đó một tiến trình gán nhãn để sinh các đoạn giống
mắt. Các đoạn này đư c dùng để chỉ dẫn tìm kiếm các vùng tiềm năng có thể
là khuôn mặt qua kết h p các đặc tính hình học của mắt, mũi, lông mày, và
miệng. Các vùng này sẽ đư c một mạng neural xem xét có phải là khuôn mặt
không. Theo tác giả tỷ lệ chính xác là 94%.
Amit đưa ra phương thức xác định khuôn mặt dựa trên hình dáng và áp
dụng cho các khuôn mặt chụp thẳng. Có hai giai đoạn để xác định khuôn
mặt người: tập trung và phân loại chi tiết. Làm có thứ tự các mảnh cạnh,
các mảnh này đư c trích từ bộ xác định cạnh đơn giản thông qua sự khác
biệt cường độ là quá trình tập trung. Khi có các ứng viên từ quá trình trên,
HV: Lương Hồng Sơn

Trang 22


Trường ĐH Bách Khoa Hà Nội


Luận văn thạc sĩ

dùng thuật toán CART để xây dựng một cây phân loại từ các ảnh để huấn
luyện, để xem xét ứng viên nào là khuôn mặt người[46].
1.4.2.2. Kết cấu
Khuôn mặt con người có những kết cấu riêng biệt mà có thể dùng để
phân loại so với các đối tư ng khác. Augusteijn và Skufca cho rằng hình
dạng của khuôn mặt dùng làm kết cấu phân loại, gọi là kết cấu giống
khuôn mặt (face-like texture). Tính kết cấu qua các đặc trưng thống kê thứ tự
thứ hai trên vùng có kích thước 16x16 điểm ảnh. Có ba loại đặc trưng đư c
xem xét: màu da, tóc, và những thứ khác. Hai ông dùng mạng neural về mối
tương quan cascade cho phân loại có giám sát các kết cấu và một ánh xạ đặc
trưng tự tổ chức Kohonen để gom nhóm các lớp kết cấu khác nhau. Hai tác
giả đề xuất dùng phương pháp bầu cử khi không quyết định đư c kết cấu đưa
vào là kết cấu của da hay kết cấu của tóc.
Dai và Nakano dùng mô hình để xác định khuôn mặt người. Thông tin màu sắc
đư c kết h p với mô hình kết cấu khuôn mặt. Hai tác giả xây dựng giải thuật
xác định khuôn mặt trong không gian màu, với các phần tựa màu cam để xác
định các vùng có thể là khuôn mặt người. Một thuận l i của phương pháp
này là có thể xác định khuôn mặt không chỉ chụp thẳng và có thể có râu và
có kính.
Mark và Andrew dùng phân bố màu da và thuật toán DoG (a Difference of
Gauss) để tìm các ứng viên, rồi xác thực bằng một hệ thống học kết cấu của
khuôn mặt.
Manian và Ross dùng biến đổi wavelet để xây dựng tập dữ liệu kết cấu của
khuôn mặt trong ảnh xám thông qua nhiều độ phân giải khác nhau kết h p xác
suất thống kê để xác định khuôn mặt người. Mỗi mẫu sẽ có chín đặc trưng.
Tỷ lệ chính xác là 87%, tỷ lệ xác định sai là 18%[46].
1.4.2.3. Sắc màu của da

Thông thường các ảnh màu không xác định trực tiếp trên toàn bộ dữ liệu
ảnh mà các tác giả dùng tính chất sắc màu của da người (khuôn mặt người)
HV: Lương Hồng Sơn

Trang 23


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

để chọn ra đư c các ứng viên có thể là khuôn mặt người (lúc này dữ liệu đã
thu hẹp đáng kể) để xác định khuôn mặt người.
1.4.2.4. Đa đặc trƣng
Gần đây có nhiều nghiên cứu sử dụng các đặc trưng toàn cục như: màu
da người, kích thước, và hình dáng để tìm các ứng viên khuôn mặt, rồi sau đó
sẽ xác định ứng viên nào là khuôn mặt thông qua dùng các đặc trưng cục
bộ (chi tiết) như: mắt, lông mày, mũi, miệng, và tóc. Tùy mỗi tác giả sẽ sử
dụng tập đặc trưng khác nhau để tiếp cận và xác định.
Yachida đưa ra một phương pháp xác định khuôn mặt người trong ảnh
màu bằng lý thuyết logic mờ. Ông dùng hai mô hình mờ để mô tả phân bố
màu da người và màu tóc trong không gian màu CIE XYZ. Năm mô hình
hình dạng của đầu, một thẳng và bốn xoay xung quanh để mô tả hình dáng
của mặt trong ảnh. Mỗi mô hình hình dạng là một mẫu 2-chiều bao gồm
các ô vuông có kích thước mxn, mỗi ô có thể chứa nhiều hơn một điểm
ảnh. Hai thuộc tính đư c gán cho mỗi ô là: tỷ lệ màu da và tỷ lệ tóc, chỉ ra tỷ
lệ diện tích vùng da (tóc) trong ô so với diện tích của ô. Mỗi điểm ảnh sẽ
đư c phân loại thành tóc, khuôn mặt, tóc/khuôn mặt, và tóc/nền trên cơ sở
phân bố của mô hình, theo cách đó sẽ có đư c các vùng giống khuôn mặt
và giống tóc. Mô hình hình dáng của đầu sẽ đư c so sánh với vùng giống

khuôn mặt và giống tóc. Nếu tương tự, vùng đang xét sẽ trở thành ứng viên
khuôn mặt, sau đó dùng các đặc trưng mắt-lông mày và mũi-miệng để xác
định ứng viên nào sẽ là khuôn mặt thật sự.
Sobottka và Pitas dùng các đặc trưng về hình dáng và màu sắc để xác định
khuôn mặt người. Dùng một ngưỡng để phân đoạn trong không gian màu
HSV để xác định các vùng có thể là màu da người (vùng giống màu da
người), các tiền ứng viên. Các thành phần dính nhau sẽ đư c xác định bằng
thuật toán tăng vùng ở độ phân giải thô. Xem xét tiền ứng viên nào vừa
khớp hình dạng ellipse sẽ đư c chọn làm ứng viên của khuôn mặt. Sau đó
dùng các đặc trưng bên trong như: mắt và miệng, đư c trích ra trên cơ sở
HV: Lương Hồng Sơn

Trang 24


Trường ĐH Bách Khoa Hà Nội

Luận văn thạc sĩ

các vùng mắt và miệng sẽ tối hơn các vùng khác của khuôn mặt, sau cùng
phân loại dựa trên mạng neural để biết vùng ứng viên nào là khuôn mặt người
và vùng nào không phải khuôn mặt người. Tỷ lệ chính xác là 85%.
Dựa vào mức độ cân xứng của các mẫu khuôn mặt người để xác định
khuôn mặt người. Một bộ phân loại màu da, không phải màu da dùng trong
không gian màu YES cho phép làm mịn các vùng kề có đường cong không
mịn, sau khi lọc các vùng có thể là màu da người. Một mẫu khuôn mặt
dạng ellipse đư c dùng để xem xét mức độ tương tự của các vùng có cùng
màu da người với mẫu này thông qua khoảng cách Hausdorff. Sau cùng, xác
định tâm mắt thông qua các hàm tính giá trị dựa trên quan hệ cân đối của
khuôn mặt và vị trí hai mắt. Đỉnh của mũi và tâm của miệng đư c ước lư ng

qua khoảng cách tâm mắt. Mặt hạn chế của phương pháp này là chỉ xác định
trên ảnh chụp thẳng khuôn mặt, chỉ có duy nhất một khuôn mặt trong ảnh,
và xác định đư c vị trí của cả hai mắt.
Trái ngư c với phương pháp xử lý trên điểm ảnh, một phương pháp đư c
xây dựng trên cấu trúc, màu sắc, và liên quan hình học đã đư c đề nghị.
Đầu tiên dùng phân đoạn đa tỷ lệ để trích các vùng đồng đều trong ảnh dựa
vào mô hình màu da người theo Gauss để có đư c các vùng có màu cùng với
màu da người, gom các vùng này vào trong các vùng có hình dạng ellipse.
Một vùng có hình dạng ellipse đư c xác định là một khuôn mặt người nếu
tồn tại mắt miệng trong vùng đó. Tác giả cho biết có thể xác định các khuôn
mặt ở các hướng khác nhau khi có thêm các đặc trưng phụ như: râu, mắt kính.
Bao dùng sắc thái màu da người để xác định ứng viên trong ảnh màu.
Tác giả đã xây dựng các luật mờ dựa vào hai loại đặc trưng: (1) bên ngoài và
(2) bên trong. Đặc trưng bên ngoài gồm: tỷ lệ chiều cao, diện tích, chu vi, mức
độ tròn… Đặc trưng bên trong gồm: quan hệ mức độ cân đối của hai mắt và
miệng cũng như tỷ lệ khoảng cách với khuôn mặt. Phương pháp này cho
phép xác định khuôn mặt ở nhiều tư thế, vị trí, mức độ nghiêng khác nhau
trong môi trường phức tạp. Đặc biệt, tác giả đã xây dựng bộ điều khiển mờ để

HV: Lương Hồng Sơn

Trang 25


×