Phát hiện khuôn mặt nghiêng trên ảnh và video
Đồng Thị Hải Yến
Trường Đại học Công nghệ
Luận văn Thạc sĩ ngành: Công nghệ phần mềm; Mã số: 60 48 10
Người hướng dẫn: PGS,TS Bùi Thế Duy
Năm bảo vệ: 2011
Abstract: Trình bày về lịch sử phát triển, các vấn đề khó khăn trong bài toán phát
hiện khuôn mặt, ứng dụng của bài toán và độ đo đánh giá chất lượng. Tìm hiểu các
hướng tiếp cận giải quyết bài toán, đồng thời tóm tắt, sơ lược về các phương pháp
nghiên cứu và thành quả đạt được của các nhà nghiên cứu trong bài toán phát hiện
khuôn mặt. Đi sâu vào hướng tiếp cận dựa theo thuật toán phân lớp Adaboost. Giới
thiệu về các đặc trưng Haar-like của khuôn mặt, cách tính các đặc trưng Haar-like.
Tiếp theo là giới thiệu về mô hình “Bộ phân tầng của các lớp” và cách áp dụng vào bài
toán phát hiện khuôn mặt thẳng và khuôn mặt nghiêng trên ảnh và video. Xây dựng
ứng dụng với các chức năng phát hiện khuôn mặt nghiêng trên ảnh tĩnh và trên camera
kết hợp với chức năng phát hiện khuôn mặt thẳng của thư viện OpenCV.
Keywords: Nhận dạng hình ảnh; Khuôn mặt; Ảnh; Video
Content
Ngày nay cùng với sự bùng nổ thông tin, sự phát triển công nghệ cao, sự giao tiếp
giữa con người và máy tính đang thay đổi rất nhanh, giờ đây giao tiếp này không còn đơn
thuần dùng những thiết bị cơ học như chuột, bàn phím… mà có thể thông qua các biểu hiện
của khuôn mặt. Bên cạnh đó, công nghệ càng phát triển thì giá cả ngày càng giảm, thêm vào
đó tốc độ xử lý của máy tính ngày càng cao, do đó hệ thống xử lý khuôn mặt đang được phát
triển rất nhiều.
Trong đó, bài toán phát hiện khuôn mặt thẳng và chính diện đang đạt được một kết
quả rất khả quan với mô hình “Bộ phân tầng của các lớp” (Cascade of Boosted Classifiers) do
Viola và Jones đề nghị. Mô hình này đạt hiệu quả cao cả về độ chính xác lẫn thời gian phát
hiện. Tuy nhiên, bài toán này vẫn còn là một thử thách rất lớn bởi phát hiện được khuôn mặt
còn dựa vào nhiều yếu tố như tỉ lệ, vị trí, hướng nhìn (từ trên xuống, quay…), kiểu chụp
(chụp đối diện, chụp ngang …). Ngoài ra, những cảm xúc của khuôn mặt, một số phần bị che,
hoặc hướng ánh sáng cũng ảnh hưởng đến bài toán phát hiện khuôn mặt. Mục tiêu của luận
văn này là thử nghiệm áp dụng mô hình “Bộ phân tầng của các lớp” lên bài toán phát hiện
2
khuôn mặt nghiêng trên ảnh và video với hy vọng nó cũng sẽ đạt được kết quả tốt như trên bài
toán phát hiện khuôn mặt thẳng và chính diện.
Luận văn này nằm trong khuôn khổ dự án “Nghiên cứu xây dựng một mô hình môi
trường phòng làm việc thông minh” thực hiện bởi phòng thí nghiệm Tương tác người – máy,
trường Đại học Công Nghệ, Đại học Quốc Gia Hà Nội.
Nội dung luận văn được trình bày trong 3 chương với bố cục như sau:
Chương 1: Trình bày về lịch sử phát triển, các vấn đề khó khăn trong bài toán
phát hiện khuôn mặt, ứng dụng của bài toán và độ đo đánh giá chất lượng. Tìm hiểu các
hướng tiếp cận giải quyết bài toán, đồng thời tóm tắt, sơ lược về các phương pháp
nghiên cứu và thành quả đạt được của các nhà nghiên cứu trong bài toán phát hiện
khuôn mặt.
Chương 2: Đi sâu vào hướng tiếp cận dựa theo thuật toán phân lớp Adaboost.
Giới thiệu về các đặc trưng Haar-like của khuôn mặt, cách tính các đặc trưng Haar-like.
Tiếp theo là giới thiệu về mô hình “Bộ phân tầng của các lớp” và cách áp dụng vào bài
toán phát hiện khuôn mặt thẳng và khuôn mặt nghiêng trên ảnh và video.
Chương 3: Xây dựng ứng dụng với các chức năng phát hiện khuôn mặt nghiêng
trên ảnh tĩnh và trên camera kết hợp với chức năng phát hiện khuôn mặt thẳng của thư
viện OpenCV.
References
1. T.Kanade, Picture Processing Computer Complex and Recognition of Human Faces
1973, Kyoto.
2. Marcel, S., P. Abbet, and M. Guillemot, Google portrait. 2007, IDIAP Research
Institute.
3. A. T. Nghiem, F.B., M. Thomat, V. Valentin, ETISEO, performance evaluation for
video surveillance systems. Project Orion, INRIA - Sophia Antipolis France, 2007.
4. G.Yang, T.S.H., ed. Human Face Detection in Complex BackgroundVol. 27. 1994.
53-63.
5. T.K.Leung, M.C.B., and P.Perona. Finding Faces in Cluttered Scenes Using Random
Labeled Graph Matching,. in Computer Vision. 1995.
6. C. Garcia, G.Z.a.G.T. Face Detection in Color Images using Wavelet Packet Analysis.
in On Multimedia Computing and System. 1999.
7. T.Sakai, M.N., and S.Fujibayash, ed. Line Extraction and Pattern Detection in a
Photograph. ed. P. Recognition. 1969. 233 - 248.
8. I.Craw, H.E., and J.Lishman, ed. Automatic Extraction of Face Features. ed. P.R.
Letters. Vol. 5. 1987. 183-187.
9. V.Govindaraju. Locating Human Faces in Photographs. in Computer Vision. 1996.
10. P.Sinha, ed. Object Recognition via Image Invariants. ed. Investigative Ophthal
mology and Visual Science. 1994. 1735-1740.
3
11. A.Yuille, P.H., and D.Cohen. Feature Extraction from Faces Using Deformable
Templates. in Computer Vision. 1992.
12. A.Lanitis, C.J.T., and T.F.Cootes, ed. An Automatic Face Identification System Using
Flexible Appearance Models. ed. I.a.V. Computing. 1995. 393-401.
13. L.Sirovich, M.K.a., ed. Application of the Karhunen-Loeve Procedure for the
Characterization of Human Faces. ed. P.A.a.M. Intelligence. Vol. 12. 1990. 103-108.
14. A.Pentland, M.T.a., ed. Eigenfaces for Recognition. ed. C. Neuroscience. 1991. 71-86.
15. T.Poggio, K K.S.a., ed. Example-Based Learning for View-Based Human Face
Detection. ed. P.A.a.M. Intelligence. Vol. 20. 1998. 39-51.
16. H.Rowley, S.B., and T.Kanade, ed. Human Face Detection in Visual Scenes.
Advances in Neural Information Processing Systems 8. 1996. 875 - 881.
17. H.Rowley, S.B., and T.Kanade, ed. Neural Network- Based Face Detection. Computer
Vision and Pattern Recognition. 1996. 203 208.
18. E.Osuna, R.F., and F.Girosi, Training Support Vector Machines : An Application to
Face Detection, in Computer Vision and Pattern Recognition. 1997. p. 130-136.
19. Yoav Freund, R.E.S., A Short Introduction to Boosting. Journal of Japanese Society
for Artificial Intelligence, 1990: p. 771-780.
20. Deng, H., A Brief Introduction to Adaboost. 6 Feb, 2007.
21. Yuriy, C. Ultra Rapid Object Detection in Computer Vision Applications with Haar-
like Wavelet Features. 10 Jul 2008 [cited; Available from:
22. Weize Zhang, R.T., Jinxiang Dong, Boosting 2-Thresholded Weak Classifiers over
Scattered Rectangle Features for Object Detection Dec 2009: Institute of Artificial
Intelligence, Zhejiang University, Hangzhou, 310027, China. p. Journal of
multimedia, Vol. 4, no. 6.
23. Viola, P. and M. Jones, Robust Real-time Object Detection, in Second International
workshop on statistical and computational theories of vision-modeling, learning,
computing and sampling. 2001: Canada.
24. Viola, P. and M. Jones, Robust Real-Time Face Detection, in International Journal of
Computer Vision. 2004. p. 137-154.
25. lqj0808. IMM FACE DATABASE research Facial Expression Recognition friends
useful Oh. [cited; Available from:
26. Frontal Face Images [cited; Available from:
27 Vapnik, V., Support-Vector Networks. Machine Learning, 1995: p. 273-297
28 Kolsch, M. and M. Turk. Robust Hand Detection. in Conference on Automatic Face
and Gesture Recognition. 2004: IEEE Intl.
29 Kolsch, M. and M. Turk. Analysis of Rotational Robustness of Hand Detection with a
Viola-Jones Detector. in Conference on Pattern Recognition. 2004: IEEE Intl.
30 ETISEO, Video understanding Evaluation.
31 Fuzhen Huang and Jianbo Su, “Multiple Face Contour Detection Using adaptive
Flows”, Sinobiometrics 2004, LNCS 3338, pp. 137-143, Springer-Verlag Berlin
Heidelberg, 2004.