Tải bản đầy đủ (.pdf) (68 trang)

Nhận dạng mặt người bằng phương pháp phân tích thành phần chính(pca) và phân tích khác biệt tuyến tính (lda)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.92 MB, 68 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC VINH

LÊ HOÀNG PHÚC

NHẬN DẠNG MẶT NGƯỜI BẰNG PHƯƠNG PHÁP
PHÂN TÍCH THÀNH PHẦN CHÍNH (PCA)
VÀ PHÂN TÍCH KHÁC BIỆT TUYẾN TÍNH (LDA)

LUẬN VĂN THẠC SỸ NGÀNH CÔNG NGHỆ THÔNG TIN

ĐỒNG THÁP, 3/2017


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC VINH

LÊ HOÀNG PHÚC

NHẬN DẠNG MẶT NGƯỜI BẰNG PHƯƠNG PHÁP
PHÂN TÍCH THÀNH PHẦN CHÍNH (PCA)
VÀ PHÂN TÍCH KHÁC BIỆT TUYẾN TÍNH (LDA)
Chuyên ngành: CÔNG NGHỆ THÔNG TIN
Mã số: 60.48.02.01

LUẬN VĂN THẠC SỸ NGÀNH CƠNG NGHỆ THƠNG TIN

Người hướng dẫn khoa học: TS. HỒNG HỮU VIỆT

ĐỒNG THÁP, 3/2017



2

LỜI CẢM ƠN
Tôi chân thành cảm ơn sự giúp đỡ của các Thầy Cô Khoa công nghệ
thông tin Trường đại học Vinh đã tận tình giảng dạy các mơn kiến thức
chuyên đề CNTT, cùng với Thầy TS. Hoàng Hữu Việt đã tận tình hướng dẫn
và giúp đỡ tơi hồn thành luận văn này.
Ngồi ra tơi chân thành cảm ơn các bạn học viên cao học K23 tại Đồng
Tháp đã giúp tôi trong việc cung cấp tài liệu, trau đổi các vấn đề thuộc lĩnh
vực mà tôi nghiên cứu, cảm ơn các cán bộ lãnh đạo nơi tôi công tác đã hỗ trợ
cho tôi trong thời gian làm luận văn.
Đồng Tháp, ngày 25 tháng 2 năm 2017
Học viên

Lê Hoàng Phúc


3

LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “nhận dạng mặt người bằng phương pháp
phân tích thành phần chính (PCA) và phân tích khác biệt tuyến tính (LDA)”
là cơng trình nghiên cứu của tôi với sự hướng dẫn khoa học của TS Hoàng
Hữu Việt, những tham chiếu trong luận văn được ghi rõ ở phần tài liệu tham
khảo, các số liệu thực nghiệm được nghiên cứu thực tế trên cùng một mơi
trường thí nghiệm, các con số thống kê được ghi nhận một cách khách quan,
trung thực và chưa được cơng bố dưới bất kỳ hình thức nào trước đây.

Đồng Tháp, ngày 25 tháng 2 năm 2017

Học viên

Lê Hoàng Phúc


4

MỤC LỤC
Nội dung

Trang

LỜI CẢM ƠN ............................................................................................................2
LỜI CAM ĐOAN ......................................................................................................3
MỤC LỤC ..................................................................................................................4
BẢNG KÝ HIỆU CÁC CHỮ VIẾT TẮT ...............................................................6
DANH MỤC CÁC HÌNH VẼ - ĐỒ THỊ .................................................................7
MỞ ĐẦU ....................................................................................................................9
1.
Lý do chọn đề tài ...........................................................................................9
2.
Mục tiêu nghiên cứu ....................................................................................10
2.1. Mục tiêu tổng quát .........................................................................................10
2.2. Mục tiêu cụ thể ...............................................................................................10
3.
Đối tượng và phạm vi nghiên cứu ...............................................................10
3.1. Đối tượng nghiên cứu ................................................................................10
3.2. Phạm vi nghiên cứu ....................................................................................11
4.
Nội dung nghiên cứu ...................................................................................11

5.
Cấu trúc của luận văn ..................................................................................12
CHƯƠNG 1: TỔNG QUAN...................................................................................13
1.1. Đặt vấn đề ....................................................................................................13
1.2. Tổng quan về hệ thống nhận dạng mẫu .......................................................14
1.2.1 Phân lớp bài tốn nhận dạng ....................................................................15
1.2.1.1. Học có giám sát (supervised learning) ..............................................16
1.2.1.2. Học khơng có giám sát (unsupervised learning) ...............................16
1.2.2 Chu trình thiết kế hệ thống nhận dạng mẫu .............................................17
1.2.3 Hướng tiếp cận hệ thống nhận dạng mặt người bằng phương pháp PCA.
20
1.2.4 Hướng tiếp cận hệ thống nhận dạng mặt người bằng đặc trưng LDA. ...21
1.3. Tình hình nghiên cứu bài toán nhận dạng mặt người ..................................22
CHƯƠNG 2: NHẬN DẠNG ẢNH MẶT NGƯỜI BẰNG PHƯƠNG PHÁP
PCA VÀ LDA ..........................................................................................................25
2.1. Giới thiệu ........................................................................................................25
2.2. Cơ sở toán học [7] ..........................................................................................27
2.2.1. Độ lệch chuẩn (Standard deviation) .......................................................27
2.2.2 Phương sai (Variance) ..............................................................................28
2.2.3 Hiệp phương sai (Covariance) ................................................................29
2.2.4 Ma trận hiệp phương sai (Covariance matrix) .........................................30
2.2.5 Vectơ riêng (Eigenvectors) ......................................................................31
2.2.6 Trị riêng (Eigenvalues) ............................................................................31
2.3. Thuật tốn phân tích thành phần chính PCA .................................................32
2.3.1. Thuật toán [6] ..........................................................................................32
2.3.2. Các bước thực hiện thuật toán.................................................................33


5


2.3.3. Ưu nhược điểm của phương pháp PCA ..................................................40
2.4. Thuật tốn phân tích khác biệt tuyến tính LDA .............................................41
2.4.1. Thuật toán................................................................................................42
2.4.2. Các bước của thuật toán [8] ....................................................................44
2.4.3. Ưu nhược điểm của phương pháp LDA ..................................................46
CHƯƠNG 3: THIÊT KẾ HỆ THỐNG NHẬN DẠNG ẢNH MẶT NGƯỜI ....47
3.1. Dữ liệu thử nghiệm ........................................................................................47
3.2. Nhận dạng với PCA .......................................................................................48
3.2.1. Mục tiêu: .................................................................................................48
3.2.2. Tiêu chí đánh giá: ....................................................................................48
3.2.3. Kết quả thử nghiệm: ................................................................................48
3.3. Nhận dạng với LDA .......................................................................................53
3.3.1. Mục tiêu: .................................................................................................53
3.3.2. Tiêu chí đánh giá: ....................................................................................53
3.3.3. Kết quả thử nghiệm: ................................................................................53
3.4. Thử nghiệm nhận dạng với tập huấn luyện thay đổi .....................................56
3.4.1. Mục tiêu: .................................................................................................56
3.4.2. Tiêu chí đánh giá: ....................................................................................56
3.4.3. Kết quả thử nghiệm: ................................................................................57
3.5. Một số nhận xét .............................................................................................58
KẾT LUẬN ..............................................................................................................60
DANH MỤC CÁC TÀI LIỆU THAM KHẢO .....................................................62
PHỤ LỤC .................................................................................................................64


6

BẢNG KÝ HIỆU CÁC CHỮ VIẾT TẮT
STT


Tên

Ý nghĩa

tắt

Principal Component Analysis (Phân tích các thành phần

1

PCA

2

LDA

3

ICA

4

SVM

Support Vector Machines (Máy Vector hỗ trợ)

5

LVQ


Learning Vector Quantization neural network

6

CNTT Cơng nghệ thơng tin

chính)
Linear Discriminant Analysis (Phân tích khác biệt tuyến tính)
Independent Component Analysis (Phân tích thành phần độc
lập)

Neural Network (Mạng nơron nhân tạo)

7

NN

8

ORL

8

ATT

AT&T

9

IFD


Indian Face Database

(Olivetti Research Laboratory, Surrey University): Cơ sở dữ
liệu ảnh dùng trong luận văn


7

DANH MỤC CÁC HÌNH VẼ - ĐỒ THỊ
Chương 1
Hình 1. 1: Phân lớp nhận dạng mẫu ................................................................ 16
Hình 1. 2: Chu trình thiết kế hệ thống nhận dạng mẫu ................................... 17
Hình 1. 3: Phương pháp đánh giá mơ hình đơn giản ...................................... 19
Hình 1. 4: Phương pháp đánh giá mơ hình Random subsampling ................. 19
Hình 1. 5: Phương pháp đánh giá mơ hình Cross-validation .......................... 20
Chương 2
Hình 2. 1: Ý tưởng của mơ hình thuật tốn PCA ............................................ 32
Hình 2. 2: Phép chiếu trong hệ cơ sở v sang hệ cơ sở u ................................. 33
Hình 2. 3: Các ảnh huấn luyện phải cùng kích thước và khn mặt nằm ở giữa
ảnh ................................................................................................................... 34
Hình 2. 4: Mơ tả khơng gian mặt .................................................................... 38
Hình 2. 5: Minh họa các bước tính tốn các vector chiếu và đo khoảng cách
trong không gian mặt ...................................................................................... 40
Hình 2. 6: Phân loại với LDA ......................................................................... 42
Hình 2. 7: Phân loại dựa trên between và within theo LDA ........................... 42
Chương 3
Hình 3. 1: Ảnh của 1 người trong bộ dữ liệu 1 ............................................... 47
Hình 3. 2: Ảnh của 1 người trong bộ dữ liệu 2 ............................................... 48
Hình 3. 3: Biểu đồ biểu diễn sự tương quan tỷ lệ nhận dạng của 2 bộ dữ liệu

......................................................................................................................... 50


8

Hình 3. 4: Biểu đồ biểu diễn sự tương quan thời gian thực hiện của 2 bộ dữ
liệu ................................................................................................................... 50
Hình 3. 5: Các ảnh nhận dạng bị lỗi của bộ dữ liệu 1 ở tỷ lệ 95% của PCA .. 51
Hình 3. 6: Các ảnh nhận dạng bị lỗi của bộ dữ liệu 2 ở tỷ lệ 73.77% của PCA
......................................................................................................................... 53
Hình 3. 7: Các ảnh nhận dạng bị lỗi của bộ dữ liệu 1 ở tỷ lệ 95% của LDA . 54
Hình 3. 8: Kết quả nhận dạng của LDA trên bộ dữ liệu 1 .............................. 54
Hình 3. 9: Các ảnh nhận dạng bị lỗi của bộ dữ liệu 2 ở tỷ lệ 85.0% của LDA
......................................................................................................................... 56
Hình 3. 10: Kết quả nhận dạng của LDA trên bộ dữ liệu 2 ............................ 56
Hình 3. 11: Biểu đồ biểu diễn sự tương quan tỷ lệ nhận dạng của PCA và
LDA trên tập huấn luyện thay đổi. .................................................................. 57


9

MỞ ĐẦU
1. Lý do chọn đề tài
Trong thời đại kỹ thuật số ngày nay, việc áp dụng công nghệ thông tin
(CNTT) vào các lĩnh vực của đời sống xã hội chúng ta đã trở nên mạnh mẽ
hơn bao giờ hết, từ những lĩnh vực công nghệ cao đến những vấn đề thuộc về
phục vụ con người hằng ngày, từ những tiện ích xã hội đến những vấn đề bảo
mật và an ninh quốc gia. Một trong số tiện ích mà ngành CNTT mang lại đó
là việc dùng các phương tiện CNTT để nhận diện mặt người (Face
Recognition), hiện tại cùng với đà phát triển của các thiết bị di động việc áp

dụng nhận diện mặt người mang lại những lợi ích thiết thực như nhận diện
người trong ảnh để liên kết với các thông tin cá nhân như: số điện thoại, nơi
ở, địa chỉ mạng xã hội cá nhân… Nhận diện gương mặt để mở khóa thiết bị.
Trong lĩnh vực an ninh thì sau sự kiện ngày 11/9 nhiều nước trên thế giới đã
áp dụng việc nhận diện cá nhân trong các nơi cơng cộng như sân bay, văn
phịng chính phủ, kiểm tra hình ảnh trong hộ chiếu, chứng minh thư…
Để đáp ứng các nhu cầu đó hiện nay, nhiều phương pháp nhận dạng
mặt người được đề xuất như PCA, LDA, ICA, SVM, mạng neuron…và đã đạt
được nhiều thành tựu lớn. Tuy nhiên xét về hiệu quả các thuật toán kể trên
đều có những ưu và nhược điểm khác nhau vì vậy cần phải có một nghiên cứu
đặc trưng của các mơ hình từ đó phân tích các các ưu điểm và khắc phục các
nhược điểm của các loại mô hình đó.
Với nhận thức như trên, chúng tơi chọn đề tài: “Nhận dạng mặt người
bằng phương pháp phân tích thành phần chính (PCA) và phân tích khác biệt
tuyến tính (LDA)” làm luận văn tốt nghiệp thạc sỹ ngành CNTT.


10

2. Mục tiêu nghiên cứu
2.1. Mục tiêu tổng quát
Nghiên cứu và xây dựng thử nghiệm hệ thống nhận dạng mặt người bằng
phương pháp phân tích thành phần chính (PCA) và phân tích khác biệt tuyến
tính (LDA).
2.2. Mục tiêu cụ thể
Đề tài tập trung vào các mục tiêu cụ thể sau:
(i) Nghiên cứu tổng quan về bài toán nhận dạng mặt người.
(ii) Nghiên cứu phương pháp PCA cho nhận dạng ảnh mặt người.
(iii) Nghiên cứu phương pháp LDA cho nhận dạng ảnh mặt người.
(iv) Cài đặt thử nghiệm 2 thuật toán gồm PCA và LDA cho nhận dạng ảnh

mặt người.
(v) Đánh giá hiệu quả của 2 thuật toán.
3. Đối tượng và phạm vi nghiên cứu
3.1. Đối tượng nghiên cứu
(a) Nghiên cứu lý thuyết
- Nghiên cứu các tài liệu về bài toán nhận dạng mặt người đã cơng bố ở
trong và ngồi nước;
- Nghiên cứu phương pháp PCA để xây dựng hệ thống nhận dạng ảnh mặt
người;
- Nghiên cứu phương pháp LDA để xây dựng hệ thống nhận dạng ảnh mặt
người;
- Nghiên cứu tài liệu về ngơn ngữ lập trình Matlab để cài đặt các thuật toán
thử nghiệm.
(b) Nghiên cứu thực nghiệm


11

- Cài đặt thử nghiệm hệ thống nhận dạng ảnh mặt người bằng phương
pháp PCA và LDA. Đánh giá hiệu quả của 2 thuật toán nhận dạng.
3.2. Phạm vi nghiên cứu
Bài toán nhận dạng mặt người mới xuất hiện cách đây khơng lâu, chỉ
khoảng vài thập niên, nhưng đã có rất nhiều nghiên cứu về nó. Cho tới nay,
nhiều phương pháp nhận dạng mặt người được đề xuất như PCA, LDA, ICA,
SVM,…và đã đạt được nhiều thành tựu lớn. Trong phạm vi luận văn này,
chúng tôi thử nghiệm giải quyết bài toán nhận dạng mặt người dựa trên tập dữ
liệu ảnh mặt người đã được cho trước. Hai hướng tiếp cận được thử nghiệm
để nhận ra đối tượng được đưa vào từ bức ảnh gồm.
(i) Hệ thống nhận dạng ảnh mặt người dựa trên phương pháp PCA.
(ii) Hệ thống nhận dạng ảnh mặt người dựa trên đặc trưng LDA.

4. Nội dung nghiên cứu
- Nghiên cứu tổng quan lý thuyết nhận dạng mẫu và tình hình nghiên cứu
bài tốn nhận dạng mặt người.
- Nghiên cứu lý thuyết phương pháp PCA để phân tích các thành phần
chính và nhận dạng ảnh mặt người.
- Nghiên cứu lý thuyết phương pháp LDA để trích rút đặc trưng và nhận
dạng ảnh mặt người.
- Nghiên cứu ngơn ngữ lập trình Matlab để cài đặt thử nghiệm 2thuật tốn
nhận dạng.
- Lập trình thử nghiệm 2 thuật tốn nhận dạng ảnh mặt người bằng phương
pháp PCA và LDA.
- Thử nghiệm và đánh giá các thuật toán nhận dạng.
- Viết báo cáo luận văn.


12

5. Cấu trúc của luận văn
Với mục tiêu chính là tìm hiểu, nghiên cứu và thực nghiệm 2 thuật tốn về
nhận dạng mặt người PCA và LDA nên cấu trúc luận văn bao gồm 3 chương:
CHƯƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG MẪU
CHƯƠNG 2: NHẬN DẠNG ẢNH MẶT NGƯỜI BẰNG PHƯƠNG
PHÁP PCA VÀ LDA
CHƯƠNG 3: THIÊT KẾ HỆ THỐNG NHẬN DẠNG ẢNH MẶT
NGƯỜI


13

CHƯƠNG 1: TỔNG QUAN

1.1.

Đặt vấn đề
Nhận dạng mặt người (Face recognition) là một lĩnh vực nghiên cứu của

ngành thị giác máy tính, và cũng được xem là một lĩnh vực nghiên cứu của
ngành Biometrics (tương tự như nhận dạng vân tay – Fingerprint recognition,
hay nhận dạng mống mắt – Iris recognition).
Xét về nguyên tắc chung, nhận dạng mặt có sự tương đồng rất lớn với
nhận dạng vân tay và nhận dạng mống mắt, tuy nhiên sự khác biệt nằm ở
bước trích chọn đặt trưng (feature extraction) của mỗi lĩnh vực. Trong khi
nhận dạng vân tay và mống mắt đã đạt tới độ chín, tức là có thể áp dụng trên
thực tế một cách rộng rãi thì nhận dạng mặt người vẫn còn nhiều thách thức
và vẫn là một lĩnh vực nghiên cứu thú vị với nhiều người.
So với nhận dạng vân tay và mống mắt, nhận dạng mặt có nguồn dữ liệu
phong phú hơn, ta có thể nhìn thấy mặt người ở bất cứ tấm ảnh, video clip nào
liên quan tới con người trên mạng và ít địi hỏi sự tương tác có kiểm sốt hơn
,để thực hiện nhận dạng vân tay hay mống mắt, dữ liệu input lấy từ con người
địi hỏi có sự hợp tác trong mơi trường có kiểm sốt.
Hiện nay các phương pháp nhận dạng mặt được chia thành nhiều hướng
theo các tiêu chí khác nhau: nhận dạng với dữ liệu đầu vào là ảnh tĩnh 2D
(still image based FR) là phổ biến nhất, tuy nhiên tương lai có lẽ sẽ là 3D FR
vì việc bố trí nhiều camera 2D sẽ cho dữ liệu 3D và đem lại kết quả tốt hơn,
đáng tin cậy hơn, cũng có thể chia thành 2 hướng là: làm với dữ liệu ảnh và
làm với dữ liệu video. Trên thực tế người ta hay chia các phương pháp nhận
dạng mặt ra làm 3 loại: phương pháp tiếp cận toàn cục (global, như
Eigenfaces-PCA, Fisherfaces-LDA), phương pháp tiếp cận dựa trên các đặc
điểm cục bộ (local feature based, như LBP, Gabor wavelets) và phương pháp



14

lai (hybrid), là sự kết hợp của hai phương pháp toàn cục và local feature.
Phương pháp dựa trên các đặc điểm cục bộ đã được chứng minh là ưu việt
hơn khi làm việc trong các điều kiện khơng có kiểm sốt và có thể nói rằng
lịch sử phát triển của nhận dạng mặt là sự phát triển của các phương pháp
trích chọn đặc trưng (feature extractrion methods) được sử dụng trong các hệ
thống dựa trên các đặc trưng cơ bản. Các ứng dụng cụ thể của nhận dạng mặt
dựa trên 2 mơ hình nhận dạng: identification (xác định danh tính, bài tốn 1N), và verification (xác thực danh tính, bài toán 1-1). Trong bài toán
identification, ta cần xác định danh tính của ảnh kiểm tra, cịn trong bài tốn
verification ta cần xác định 2 ảnh có cùng thuộc về một người hay không
1.2.

Tổng quan về hệ thống nhận dạng mẫu

Nhận dạng mẫu (pattern recognition) là một ngành thuộc lĩnh vực học
máy (machine learning). Nói cách khác, nó có thể được xem là việc "cần thực
hiện một tác động vào dữ liệu thơ mà tác động cụ thể là gì sẽ tùy vào loại của
dữ liệu đó". Như vậy nó là một tập các phương pháp học có giám
sát (supervised learning).
Nhận dạng mẫu nhằm mục đích phân loại dữ liệu là các mẫu dựa trên:
hoặc là kiến thức tiên nghiệm hoặc dựa vào thơng tin thống kê được trích rút
từ các mẫu có sẵn. Các mẫu cần phân loại thường được biểu diễn thành các
nhóm của các dữ liệu đo đạc hay quan sát được, mỗi nhóm là một điểm ở
trong một khơng gian đa chiều phù hợp. Đó là khơng gian của các đặc tính để
dựa vào đó ta có thể phân loại.
Một hệ thống nhận dạng mẫu hoàn thiện gồm một thiết bị cảm
nhận (sensor) để thu thập các quan sát cần cho việc phân loại hay miêu tả;
một cơ chế trích chọn đặc trưng (feature extraction) để tính tốn các thơng tin
dưới dạng số hay dạng tượng trưng (symbolic) từ các dữ liệu quan sát được;



15

và một bộ phân loại hay lược đồ mô tả nhằm thực hiện công việc phân loại
thực sự dựa vào các đặc tính đã được trích chọn.
Việc phân loại thường dựa vào sự có sẵn của một tập các mẫu mà đã được
phân loại sẵn. Tập các mẫu này được gọi là tập huấn luyện và chiến lược học
nhằm phân loại mẫu vào một trong các lớp có sẵn được gọi là học có giám
sát. Việc học cũng có thể là khơng có giám sát, theo nghĩa là hệ thống không
được cung cấp các mẫu được phân loại tiên nghiệm, mà nó phải tự đưa ra các
lớp để phân loại dựa vào tính ổn định trong thống kê của các mẫu.
Việc phân loại thường dùng một trong các hướng tiếp cận sau: thống
kê hay lí thuyết quyết định, cấu trúc. Nhận dạng mẫu dùng thống kê là dựa
vào các đặc tính thống kê của các mẫu, chẳng hạn rằng các mẫu được tạo mởi
một hệ thống xác suất. Nhận dạng dùng cấu trúc là dựa vào tương quan cấu
trúc giữa các mẫu.
Các ứng dụng phổ biến là nhận dạng tiếng nói tự động, phân loại văn bản
thành nhiều loại khác nhau, ví dụ: những thư điện tử nào là spam/nonspam, nhận dạng tự động các mã bưu điện viết tay trên các bao thư, hay hệ
thống nhận dạng danh tính dựa vào mặt người. Ba ví dụ cuối tạo thành lãnh
vực con phân tích ảnh của nhận dạng mẫu với đầu vào là các ảnh số.
1.2.1 Phân lớp bài toán nhận dạng
Nhận dạng mẫu là một bài toán phân lớp các dữ liệu đầu vào thơng qua
các trích chọn các đặc trưng của dữ liệu hoặc các thuộc tính dữ liệu, q trình
phân lớp được mơ tả ở hình (1.1).


16

Bài tốn nhận

dạng mẫu
Phân lớp
có giám sát

Dựa trên phân bố
Tự do

Phân lớp
khơng giám sát

Phân lớp
thống kê

Phương pháp
có tham số

Phân nhóm

Phương pháp
khơng tham số

Hình 1. 1: Phân lớp nhận dạng mẫu

1.2.1.1. Học có giám sát (supervised learning)
 Dữ liệu (data):
- D = {d1; d2; … ; dn} là một tập n mẫu (examples).
- Mỗi mẫu di = (xi; yi); i = 1; 2; … ; n trong đó xi là một vector vào và yi
là đầu ra mong muốn (được đưa bởi người giám sát - teacher)
 Mục tiêu (objective): học một hàm f : X → Y sao cho yi  f (xi)
với i = 1; 2; … ; n.

 Hai loại bài toán:
- Regression: (X rời rạc hoặc liên tục) và (Y liên tục).
- Classification: (X rời rạc hoặc liên tục) và (Y rời rạc)
1.2.1.2. Học khơng có giám sát (unsupervised learning)
 Dữ liệu (data):
- D = {d1; d2; … ; dn} là một tập n mẫu (samples).
- Mỗi mẫu di = (xi); i = 1; 2; … ; n


17

- xi là một vector vào khơng có giá trị đầu ra mong muốn (không biết yi; i=
1;2;…;n)
 Mục tiêu (objective): học mối quan hệ giữ các mẫu.
 Hai loại bài tốn:
- Clustering: nhóm các mẫu có tính chất tương tự với nhau.
- Density estimation: Tìm mật độ xác suất phân bố của các mẫu.
1.2.2 Chu trình thiết kế hệ thống nhận dạng mẫu
Dữ liệu
Trích chọn đặc trưng

Lựa chọn mơ hình

u cầu biết
trước mẫu

Học

Đánh giá mơ hình
Hình 1. 2: Chu trình thiết kế hệ thống nhận dạng mẫu


 Dữ liệu: Là q trình thu thập mẫu, q trình này có thể cần làm “sạch”
và tiền xử lý
- Làm sạch:
Là quá trình làm giảm nhiễu, loại bỏ các dư thừa nhiễu
- Tiền xữ lý:
Là q trình chuẩn hóa dữ liệu, mục đích làm cho tập dữ liệu được đồng
nhất, tạo thuận lợi cho việc xữ lý, thống kê, biến đổi dữ liệu.
Ví dụ: có các biện pháp tiền xữ lý sau:


18

 Đổi tên (ví dụ hight → 2, normal → 1, low → 0...)
 Chuẩn hóa (ví dụ chuẩn hóa các giá trị về [-1,1] hoặc [0,1])
 Rời rạc hóa (ví dụ rời rạc (lấy mẫu) các giá trị liên tục)
 Trừu tượng (ví dụ trộn các dạng giá trị với nhau,...)
 Trích chọn đặc trưng (feature selection):
Là phương pháp giúp giảm thiểu kích thước dữ liệu vì thơng thường kích
thước dữ liệu mẫu thường rất lớn vì vậy cần có phương pháp làm giảm kích
thước của các mẫu phương pháp thơng thường là trích chọn các đặc trưng của
mẫu.
 Lựa chọn mơ hình (model selection):
Sử dụng các kiến thức về các mẫu, phân tích sự tương quan để đốn mơ
hình.
 Học (learning):
Là q trình huấn luyện từ đó có thể giải được các bài toán tối ưu: Linear
programming, Gradient methods,...
 Đánh giá mơ hình (evaluation)
- Phương pháp đơn giản: chia tập dữ liệu thành tập huấn luyện và tập

kiểm tra (xem hỉnh 1.3).
Ví dụ: 2/3 tập mẫu dùng huấn luyện, 1/3 tập mẫu dùng kiểm tra.


19

Tập dữ liệu

Tập huấn
luyện

Tập thử
nghiệm
Đánh giá
Mơ hình dự
đốn

Học (fit)

Hình 1. 3: Phương pháp đánh giá mơ hình đơn giản

- Các phương pháp phức tạp hơn: có 2 phương pháp
Random subsampling và Random subsampling
1. Random subsampling
Là việc lặp lại phương pháp đơn giản K lần
Dữ liệu
Chia ngẫu nhiên thành
70% huấn luyện, 30% thử nghiệm

Tập huấn luyện


Tập thử nghiệm

Học

Phân lớp /
Đánh giá

Thống kê số liệu
trung bình

Hình 1. 4: Phương pháp đánh giá mơ hình Random subsampling


20

2. Cross-validation
Chia dữ liệu thành k nhóm tương đương. Kiểm tra trên nhóm thứ i và
huấn luyện trên tập cịn lại.
Dữ liệu
Chia thành k nhóm có kích thước
bằng nhau
- Nhóm thứ nhất: Thử nghiệm
- Các nhóm cịn lại: Huấn luyện

Tập huấn luyện

Tập thử nghiệm

Học


Phân lớp /
Đánh giá

Thống kê số liệu
trung bình

Hình 1. 5: Phương pháp đánh giá mơ hình Cross-validation

1.2.3 Hướng tiếp cận hệ thống nhận dạng mặt người bằng phương
pháp PCA.
Trong phương pháp phân tích thành phần chính (PCA  còn gọi là biến
đổi Karhunen-Loeve)[2], tập dữ liệu được biểu diễn lại với số đặc trưng ít hơn
đồng thời giữ được hầu hết các thông tin quan trọng nhất của dữ liệu. PCA
thường được sử dụng cùng phương pháp mặt riêng. Tập con các vector riêng
được dùng làm các vector cơ sở của một khơng gian con, trong đó ta có thể so


21

sánh với các ảnh trong cơ sở dữ liệu để nhận dạng các ảnh mới. Các vector cơ
sở này còn được gọi là các thành phần chính của cơ sở dữ liệu ảnh.
Phép biến đổi tạo ra những ưu điểm sau đối với dữ liệu:
- Giảm số chiều của không gian chứa dữ liệu khi nó có số chiều lớn,
khơng thể thể hiện trong không gian 2 hay 3 chiều.
- Xây dựng những trục tọa độ mới, thay vì giữ lại các trục của khơng
gian cũ, nhưng lại có khả năng biểu diễn dữ liệu tốt tương đương, và
đảm bảo độ biến thiên của dữ liệu trên mỗi chiều mới.
- Tạo điều kiện để các liên kết tiềm ẩn của dữ liệu có thể được khám phá
trong khơng gian mới, mà nếu đặt trong khơng gian cũ thì khó phát hiện

vì những liên kết này khơng thể hiện rõ.
- Đảm bảo các trục tọa độ trong không gian mới luôn trực giao đôi một
với nhau, mặc dù trong không gian ban đầu các trục có thể khơng trực
giao.
1.2.4 Hướng tiếp cận hệ thống nhận dạng mặt người bằng đặc trưng
LDA.
 Discriminant Analysis
[17] Discriminant Analysis (DA) là một phương pháp phân tích trong
thống kê được dùng để phân loại các đối tượng (object) vào các nhóm dựa
trên việc đo lường các đặc trưng của đối tượng. DA tìm cách phân loại các đối
tượng (người, sự vật, ...) vào một trong hai hay nhiều lớp đã được xác định
trước dựa vào các đặc trưng (feature) dùng để mổ tả đối tượng (ví dụ nhữ các
đặc trưng dùng để mô tả đối tượng khách hàng là giới tính, tuổi, nghề nghiệp,
thu nhập,...). Mục đích chính của DA là:


22

 Tìm tập các thuộc tính tốt nhất để mơ tả đối tượng. Vấn đề này cịn gọi
là trích chọn đặc trưng (feature extraction) hay lựa chọn đặc trưng
(feature selection). Mục đích phần này là từ tập các thuộc tính mơ tả
đối tượng ban đầu (thường rất lớn, có thể hàng trăm thuộc tính) tìm ra
tập các thuộc tính tốt nhất để biểu diễn cho đối tượng nhằm làm giảm
số chiều biểu diễn đối tượng tứ đó làm giảm chi phí tính tốn nhưng
chất lượng của mơ hình khơng bị giảm đi.
 Tìm một mơ hình tốt nhất để phân loại (classification) các đối tượng.
1.3. Tình hình nghiên cứu bài toán nhận dạng mặt người
Với sự phát triển của hệ thống máy tính và chun ngành về thị giác, có
rất nhiều phương pháp nhận dạng được nghiên cứu áp dụng. Mục tiêu chung
của các phương pháp này là xây dựng một mơ hình phù hợp nhất có thể thể

hiện chính xác nhất hình ảnh đầu vào. Có khá nhiều nghiên cứu về mơ hình
nhận dạng kinh điển và gần đây. Tuy nhiên, mơ hình thành cơng nhất có thể
kể đến là mơ hình thống kê.
Có hai phương pháp nhận dạng phổ biến hiện nay là nhận dạng dựa trên
đặc trưng của các phần tử trên khuôn mặt như biến đổi Gabor Wavelet và
mạng Neural, SVM (Support Vector Machine),… và nhận dạng dựa trên xét
tổng thể tồn khn mặt như phương pháp PCA, LDA, LFA
[2]. Trong đó, PCA là phương pháp rút trích đặc trưng nhằm giảm số
chiều của ảnh tuy đơn giản nhưng mạng lại hiệu quả tốt. Nhận dạng khuôn
mặt dùng PCA kết hợp với mạng Nơron là phương pháp mạng lại hiệu quả
nhận dạng cao bởi nó phát huy được ưu điểm của PCA và mạng nơron. Bên
cạnh đó, nhận dạng dựa trên các phần đặc trưng của các phần tử trên khuôn
mặt cũng được thu hút nhiều chuyên gia nghiên cứu.


23

Về tình hình nghiên cứu trong nươc có thể liệt kê một số cơng trình: [16]
- Trần Phước Long và Nguyễn Văn Lượng (2003), dùng mạng nơron để
dị tìm khn mặt trong ảnh, kết hợp với phương pháp PCA và biến đổi
cosine rời rạc (DCT) để rút ra các đặc trưng là đầu vào cho bộ nhận dạng
máy học SVM và mơ hình Markov ẩn HMM
- Nguyễn Thành Thái

(2006)

đã kết hợp SVM

(Support Vector


Machine) và mạng Nơron để nhận dạng khuôn mặt người.
- Nguyễn Quốc Bình (2011) đã nhận diện khn mặt bằng cách sử dụng
giải thuật PCA để xây dựng chương trình quản lý nhân viên.
- Võ Hồng Minh, Trần Bình Long, Lê Hồng Thái, Trần Hành (2011)
đã nhận dạng mặt người dùng Polar Cosine Transform và mạng Radial Basis
Function.
- Mai Hữu Lợi (2011) đã sử dụng thuật toán PCA để nhận dạng khuôn
mặt người.
- Từ Minh Hiển – Trần Thị Khánh Hòa (2012) sử dụng mạng Nơron và
phương pháp phân tích thành phần chính để nhận dạng khn mặt. Các đối
tượng được nhận dạng bằng cách sử dụng hai thuật toán: phương pháp đối
sánh dùng khoảng cách Euclides, Mahalanobis và dùng mạng Nơron.
Đối với các cơng trình nghiên cứu ở nước ngồi có thể kể đến như: [14]
Các nghiên cứu (Bledsoe, & cs., 1960; Goldstein, & cs., 1970), sử dụng
tiếp cận dựa trên các đặc trưng như mắt, tai, màu tóc, độ dày mơi để tự động
nhận dạng.
- Kirby và Sirovich (1988); Turk và Pentland (1991) áp dụng phương
pháp phân tích thành phần chính (PCA) và thuật tốn eigenfaces để nhận
dạng khuôn mặt;


24

- Zuo và cs. (2006) đã kết hợp phương pháp PCA hai chiều với phân
tích độc lập tuyến tính (LDA);
- Chen và Yaou Zhao (2006) kết hợp DCT và Hierarchical Radial Basis
Function Network (HRBF);
- Sharif, Sajjad Mohsin, Muhammad Younas Javed, và Muhammad Atif
Ali (2012) kết hợp thuật toán Laplacian of Gaussian (LoG) và DCT;
- Suhas, Kurhe Ajay B., và Dr. Prakash Khanale B (2012) áp dụng PCA

kết hợp với DCT theo hướng tiếp cận toàn diện;
- Sunil (2013) kết hợp PCA với DCT; Bouzalmat, Jamal Kharroubi và
Arsalane Zarghili (2013) áp dụng thuật toán máy học SVM dựa trên LDA, để
nhận dạng khn mặt người trên ảnh.
Nhìn chung từ trước đến nay đã có rất nhiều cơng trình nghiên cứu đề
cập đến vấn đề nhận dạng mặt người bằng nhiều thuật toán khác nhau, Hiện
nay nhiều thuật toán cũng được phát triển để cải tiến cho phương pháp PCA
và LDA. Việc đánh giá các thuật tốn nhằm kiểm nghiệm lại tính hiệu quả là
một cơng việc cần thiết nhằm tìm kiếm những cải tiến cũng như phát hiện
những thuật toán mới nằm nâng cao hiệu suất trong lĩnh vực nhận dạng ảnh
mặt người, tiến gần đến ứng dụng hiệu quả trong thực tế.


×