TRƯỜNG ĐẠI HỌC LẠC HỒNG
KHOA CÔNG NGHỆ THÔNG TIN
----------
BÁO CÁO
NGHIÊN CỨU KHOA HỌC
ĐỀ TÀI:
NGHIÊN CỨU CÔNG NGHỆ NHẬN
DIỆN KHUÔN MẶT KAIROS API VÀ ÁP
DỤNG XÂY DỰNG PHẦN MỀM ĐIỂM
DANH SINH VIÊN
SVTH : ĐINH HỒNG ÂN
GVHD :Th.S TẠ NGUYỄN
BIÊN HÒA, THÁNG 11/2017
i
LỜI CÁM ƠN
Tôi xin chân thành cám ơn các giảng viên trường Đại Học Lạc Hồng, các thầy
cô khoa Công nghệ Thông tin đã giảng dạy và hướng dẫn tôi trong suốt thời gian tôi
theo học tại trường.
Tôi xin gởi lời cám ơn đến thạc sĩ Tạ Nguyễn, là giáo viên đã hướng dẫn tơi
hồn thành đề tài nghiên cứu khoa học này.
Tôi cũng xin gởi lời cám ơn đến thạc sĩ, giáo viên phản biện đã góp ý giúp tơi
hồn thiện chương trình hơn.
Tơi xin cám ơn các thầy, các cơ trong khoa Cơng nghệ Thơng tin đã có những
ý kiến đóng góp trong các buổi báo cáo tiến độ.
Ngồi ra tơi xin cám ơn thầy Nguyễn Minh Phúc, giáo viên chủ nhiệm lớp
13SE111 và các bạn trong lớp cùng tồn thể gia đình và người thân đã giúp đỡ, động
viên tơi trong q trình thực hiện đề tài này.
Với vốn kiến thức còn hạn chế cùng những điều kiện khách quan khơng cho
phép, đề tài của tơi khó tránh khỏi những thiếu sót cũng như chưa đáp ứng đầy đủ các
u cầu. Do đó tơi hy vọng tiếp tục nhận được những ý kiến đóng góp và hướng dẫn của
quý thầy cô để đề tài của tôi được hồn thiện hơn.
Tơi xin chân thành cảm ơn.
Biên Hịa, tháng 11 năm 2017
Sinh viên thực hiện
Đinh Hồng Ân
iii
MỤC LỤC
LỜI CÁM ƠN .................................................................................................................i
MỤC LỤC .................................................................................................................... iii
DANH MỤC HÌNH ẢNH .......................................................................................... vii
DANH MỤC TỪ VIẾT TẮT .......................................................................................ix
PHẦN MỞ ĐẦU ............................................................................................................ x
1. Lý do chọn đề tài .................................................................................................... x
2. Lịch sử nghiên cứu.................................................................................................xi
2.1. Hệ thống điểm danh RFID........................................................................xi
2.2. Hệ thống điểm danh sinh trắc học .......................................................... xii
2.3. Công nghệ nhận diện khuôn mặt. .......................................................... xiii
2.4. So sánh Kairos API với một số sản phẩm khác [24]. .............................xiv
3. Mục tiêu nghiên cứu ......................................................................................... xxiii
4. Đối tượng và phạm vi nghiên cứu .................................................................... xxiii
4.1. Đối tượng nghiên cứu .......................................................................... xxiii
4.2. Phạm vi nghiên cứu ............................................................................. xxiii
5. Phương pháp nghiên cứu .................................................................................. xxiii
6. Những đóng góp mới và những vấn đề mà đề tài chưa thực hiện được ............xxiv
6.1. Những đóng góp mới ............................................................................xxiv
6.2. Những vấn đề chưa thực hiện được ......................................................xxiv
7. Kết cấu của đề tài ...............................................................................................xxiv
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT NHẬN DIỆN KHUÔN MẶT .......................... 1
1. Giới thiệu ................................................................................................................ 1
2. Những khó khăn của nhận dạng khn mặt ........................................................... 2
iv
3. Ứng dụng nhận dạng khuôn mặt ............................................................................. 4
4. Các phương pháp chính để xác định măt người. .................................................... 5
5. Hướng tiếp cận dựa trên tri thức ............................................................................. 5
5.1. Tư tưởng .................................................................................................... 5
5.2. Các nghiên cứu .......................................................................................... 6
6. Hướng tiếp cận dựa trên đặc trưng không thay đổi. ............................................... 7
6.1. Các đặc trưng của khuôn mặt .................................................................... 8
6.2. Kết cấu của khuôn mặt. ........................................................................... 10
6.3. Màu sắc da. .............................................................................................. 10
6.4. Đa đặc trưng. ........................................................................................... 11
7. Hướng tiếp cận dựa trên so sánh khớp mẫu.......................................................... 11
7.1. Tư tưởng. ................................................................................................. 11
8. Hướng tiếp cận dựa trên diện mạo. ....................................................................... 14
8.1. Tư tưởng. ................................................................................................. 14
8.2. Một số phương pháp cụ thế trong hướng tiếp cận dựa trên diện mạo ..... 15
8.3. Phân loại Bayes........................................................................................ 19
8.4. Ưu điểm và nhược điểm của hai loại phương pháp. ................................ 19
CHƯƠNG 2: GIỚI THIỆU VỀ KAIROS API ......................................................... 21
1. Giới thiệu tổng quát .............................................................................................. 21
1.1. Kairos API là gì? ..................................................................................... 21
1.2. Tính năng ................................................................................................. 21
2. Một số thuật ngữ ................................................................................................... 22
2.1. API ........................................................................................................... 22
2.2. REST........................................................................................................ 22
v
3. Quy trình xử lý nhận dạng khn mặt trên Kairos. .............................................. 24
3.1. Đăng ký hình ảnh (quá trình học máy) .................................................... 24
3.2. Nhận dạng hình ảnh (quá trình xử lý hình ảnh) ....................................... 26
3.3. Đưa ra kết quả (xử lý chuỗi dữ liệu) ........................................................ 26
4. Các phương thức của Kairos API ......................................................................... 27
4.1. POST/ ENROLL ...................................................................................... 27
4.2. POST/ VERIFY ....................................................................................... 32
4.3. POST/ RECOGNIZE ............................................................................... 36
5. API error code ....................................................................................................... 41
CHƯƠNG 3: XÂY DỰNG ỨNG DỤNG VÀ THỰC NGHIỆM ............................. 43
1. Đánh giá hiện trạng và nhu cầu. ........................................................................... 43
1.1. Đánh giá hiện trạng .................................................................................. 43
1.2. Khảo sát nhu cầu. ..................................................................................... 43
1.3. Hướng xây dựng ...................................................................................... 43
2. Bài toán điểm danh bằng nhận diện khn mặt. ................................................... 44
2.1. Quy trình ghi danh ................................................................................... 45
2.2. Quy trình điểm danh. ............................................................................... 46
3. Xây dựng chương trình thực tế. ............................................................................ 47
3.1. Qúa trình học máy (Đăng ký thông tin sinh viên) ................................... 47
3.2. Xử lý khuôn mặt (Điểm danh) ................................................................. 50
4. Thực nghiệm ......................................................................................................... 54
4.1. Đối tượng thực nghiệm ............................................................................ 54
4.2. Kết quả thực nghiệm ................................................................................ 55
5. Một số quy tắc đưa ra trong thực nghiệm ............................................................. 56
vi
5.1. Chi tiết kỹ thuật ....................................................................................... 56
5.2. Chụp ảnh: Đề xuất định vị, biểu hiện và trọng tâm. ................................ 57
5.3. Đăng ký khuôn mặt : Đề xuất để tải lên hình ảnh hoặc video. ................ 58
5.4. Thiết lập máy ảnh: Đề xuất vị trí, ánh sáng và khoảng cách. .................. 59
5.5. Định vị máy ảnh: Đề xuất cho màn hình gắn kết, kiốt và thiết bị. .......... 60
5.6. Trên đường đi: Đề xuất cho nhúng, máy ảnh hướng về phía trước......... 61
KẾT LUẬN .................................................................................................................. 62
TÀI LIỆU THAM KHẢO........................................................................................... 63
vii
DANH MỤC HÌNH ẢNH
Hình 0.1 Cơng nghệ điểm danh bằng hệ thống RFID ....................................................xi
Hình 0.2 Hệ thống điểm danh Sinh trắc vân tay .......................................................... xii
Hình 1.1 Một phương pháp xác định khuôn mặt điền theo huớng tiếp cận top-down. ... 6
Hình 1.2 Một mẫu khn mặt........................................................................................ 13
Hình 1.3 Các vector quan sát để huấn luyện cho HMM ............................................... 18
Hình 2.1 Logo nhà sản xuất Kairos API........................................................................ 21
Hình 2.2 Ảnh Elizzabeth được sử dụng để ghi danh. .................................................... 28
Hình 2.3 Yêu cầu tối thiểu khi xây dựng code post/enroll ............................................ 29
Hình 2.4 Code Post ghi danh ảnh lên server bằng PHP. ............................................... 29
Hình 2.5 Code post ghi danh ảnh bằng Node.js ............................................................ 30
Hình 2.6 Code post ghi danh ảnh bằng JavaScript ........................................................ 30
Hình 2.7 Chuỗi Json trả về của server sau khi ghi danh thành cơng ............................. 31
Hình 2.8 Chuỗi Json trả về của server khi không nhận diện được khuôn mặt nào trong
ảnh. ................................................................................................................................ 32
Hình 2.9 Chuỗi Json trả về của server khi quá nhiều khuôn mặt trên một bức ảnh ...... 32
Hình 2.10 Yêu cầu tối thiểu khi xây dựng code post/verify .......................................... 33
Hình 2.11 Code Post ảnh lên server bằng PHP. ............................................................ 34
Hình 2.12 Code post ảnh bằng Node.js ......................................................................... 34
Hình 2.13 Code post ảnh bằng JavaScript ..................................................................... 35
Hình 2.14 Chuỗi Json trả về của server sau khi gọi verify thành cơng ......................... 35
Hình 2.15 Chuỗi Json trả về của server khi khơng tìm thấy gallery trùng khớp ........... 36
Hình 2.16 Chuỗi Json trả về của server khi không nhận diện được khuôn mặt nào trong
ảnh ................................................................................................................................. 36
viii
Hình 2.17 Yêu cầu tối thiểu khi xây dựng code post/recognize .................................... 37
Hình 2.18 Code recognize ảnh lên server bằng PHP. ................................................... 38
Hình 2.19 Code recognize ảnh bằng Node.js ................................................................ 38
Hình 2.20 Code recognize ảnh bằng JavaScript ............................................................ 39
Hình 2.21 Chuỗi Json trả về của server sau khi gọi verify thành cơng ......................... 40
Hình 2.22 Chuỗi Json trả về của server khi khơng tìm thấy gallery trùng khớp ........... 40
Hình 2.23 Chuỗi Json trả về của server khi không nhận diện được khn mặt nào trong
ảnh ................................................................................................................................. 41
Hình 2.24 Chuỗi Json trả về của server khi quá nhiều khuôn mặt trên một bức ảnh .... 41
Hình 3.1 Hai khối chức năng chính trong cơng tác điểm danh ..................................... 44
Hình 3.2 Quy trình ghi danh .......................................................................................... 45
Hình 3.3 Quy trình điểm danh. ...................................................................................... 46
Hình 3.4 Quy trình học máy .......................................................................................... 47
Hình 3.5 Giao diện đăng ký thông tin sinh viên của ứng dụng ..................................... 48
Hình 3.6 Quy trình xử lý khn mặt ............................................................................. 51
Hình 3.7 Giao diện điểm danh của ứng dụng ................................................................ 51
Hình 3.8 Danh sách ảnh ghi danh .................................................................................. 54
Hình 3.9 Ảnh định danh lần 1 ....................................................................................... 55
Hình 3.10 Ảnh định danh lần 2 ..................................................................................... 55
Hình 3.11 Yêu cầu Pixel đối với ảnh............................................................................. 56
Hình 3.12 Vị trí xoay ảnh .............................................................................................. 58
Hình 3.13 u cầu vị trí và khoảng cách ...................................................................... 59
Hình 3.14 Yêu cầu về độ hiển thị .................................................................................. 60
Hình 3.15 Yêu cầu về hướng trực quan ......................................................................... 61
ix
DANH MỤC TỪ VIẾT TẮT
STT
Từ viết tắt
Giải thích
1
API
Application Programming Interface
2
REST
REpresentational State Transfer
3
HTML
HyperText Markup Language
4
IMS QTI
IMS Question and Test Interoperability
5
JRE
Java Runtime Environment
6
LCMS
Learning Content Management System
7
LMS
Learning Management System
8
Moodle
9
PHP
Hypertext Preprocessor
10
SQL
Structured Query Language
11
URL
Uniform Resource Locator
12
UTF-8
UCS Transformation Format-8 bit
13
XHTML
eXtensible HyperText Markup Language
14
XML
eXtensible Markup Language
Modular
Object-Oriented
Dynamic
Environment
Learning
x
PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay, chúng ta thấy một sự gia tăng về tỷ lệ phần trăm giáo dục so với thập
kỷ trước vì nhận thức trong con người và lợi ích đáng kể của việc giáo dục thích hợp
cho sự phát triển bản thân và xã hội. Việc nhập học của sinh viên ngày càng tăng dần
trong các đại học và cao đẳng một cách khơng ngừng. Do đó việc theo dõi sự hiện diện
của tất cả các sinh viên trong lớp học gây ra rất nhiều khó khăn. Vì vậy, để thốt khỏi
điều này, tất cả đang tìm kiếm cho nhiều lựa chọn khác nhau trong đó "Face Recognize"
là một sự thay thế.
Ở nhiều trường đại học, cao đẳng và sự hiện diện là tiêu chí rất quan trọng cho
sinh viên trong kết quả học tập. Phương pháp trước đây, trong đó tự thực hiện và duy trì
danh sách điểm danh đi học là công việc rất không thoải mái cho giáo viên, giảng viên.
Theo truyền thống, việc điểm danh sinh viên có mặt hoặc vắng mặt được làm thủ công
bằng cách sử dụng phiếu điểm danh, gọi tên, làm kiểm tra … gây mất rất nhiều thời gian
và nhân lực. Hơn nữa, việc điểm danh cịn dễ sai sót bởi học sinh có thể gian lận bằng
nhiều cách. Cho nên điểm danh theo cách thủ cơng có tỷ lệ chính xác nghịch với số
lượng học sinh trong lớp. Do đó việc áp dụng cơng nghệ trở thành một phương án thay
thế khi tính tốn thủ cơng tạo ra lỗi, và cũng lãng phí rất nhiều thời gian. Nếu hệ thống
điểm danh tự động được phát triển trong các trường đại học, nó có thể loại bỏ những
yếu tố phiền toái về giấy tờ điểm danh và nhân viên thực hiện. Một hệ thống quản lý tự
động bằng sinh trắc học khuôn mặt sẽ cung cấp những giải pháp cần thiết.
Tuy nhiên, nhằm kế thừa những giá trị ưu tú của các trí tuệ đi trước, vừa áp dụng
và thích nghi với yêu cầu bài toán, đồng thời tạo cơ sở cho các bạn trẻ đam mê cơng
nghệ có khả năng khám phá và xây dựng một phần mềm nhận diện khuôn mặt cho riêng
mình. Dó đó, đề tài này đưa ra giải pháp bằng việc “Nghiên cứu công nghệ nhận diện
khuôn mặt Kairos API” sau đó “áp dụng vào việc xây dựng một phần mềm điểm danh
sinh viên”.
xi
2. Lịch sử nghiên cứu
2.1. Hệ thống điểm danh RFID
RFID
(Radio
Frequency
Identification) là cơng nghệ nhận dạng đối
tượng bằng sóng vơ tuyến. Công nghệ này
cho phép nhận biết các đối tượng thông qua
hệ thống thu phát sóng radio, từ đó có thể
giám sát, quản lý hoặc lưu vết từng đối
tượng. Một hệ thống RFID thường bao gồm
2 thành phần chính là thẻ tag (chip RFID
Hình 0.1 Công nghệ điểm danh bằng hệ
thống RFID
chứa thông tin) và đầu đọc (reader) đọc các
thông tin trên chip.
Nguyên lý hoạt động:
-
Mỗi học sinh, sinh viên sau khi nhập học sẽ được phát 1 thẻ học sinh, sinh
viên là dạng thẻ từ RFID có in ảnh và thơng tin của học sinh, sinh viên đó.
Thẻ từ RFID sẽ được mã hóa tương ứng với mã số riêng tương ứng với
mã học sinh, sinh viên
-
Khi đến giờ học, tiết học của từng môn học sinh, sinh viên đó sẽ quẹt thẻ
của mình lên đầu đọc thẻ gắn trên tường ngay cửa ra vào của từng phòng
học để điểm danh
-
Khi giáo viên lên lớp giảng dạy sẽ nhận được thơng tin điểm danh của lớp
đó từ dữ liệu của đầu đọc thẻ chuyển về. Hệ thống sẽ thống kê sỹ số của
lớp và có bao nhiêu học sinh, sinh viên đến lớp. Danh sách của những
người nghỉ. Đồng thời phịng đào tạo cũng nhận được những thơng tin này
-
Mỗi thẻ khi quẹt lên đầu đọc trên phần mềm quản lý sẽ hiển thị thơng tin
của HS/SV đó như: Tên, Địa chỉ, số điện thoại, Lớp, hình ảnh, thơng tin
liên hệ gia đình.
Ưu điểm:
-
Giảm thời gian điểm danh của giáo viên.
xii
Nhược điểm:
-
Đi học phải mang thẻ, mất thẻ thì không thể điểm danh.
-
Gửi thẻ nhờ bạn điểm danh hộ.
-
Thời gian xếp hàng đợi quét thẻ là rất lâu.
2.2. Hệ thống điểm danh sinh trắc học
Công nghệ Sinh trắc học (Biometric)
là một cơng nghệ sử dụng những thuộc tính vật
lý hoặc các mẫu hành vi, các đặc điểm sinh học
trên cơ thể đặc trưng như dấu vân tay, mẫu
mống mắt, giọng nói, khn mặt, dáng đi… để
nhận diện con người.
Cơng nghệ sinh trắc vân tay được áp
dụng phổ biến từ rất lâu trước đó.
Hình 0.2 Hệ thống điểm danh Sinh
trắc vân tay
Dấu vân tay là một đặc điểm để phân biệt giữa người này và người khác. Vì
vậy, sự phát triển của cơng nghệ nhận dạng vân tay có thể giúp thu nhận và ghi nhớ
được hàng triệu các mẫu ghi chép dưới dạng số hố bằng cơng nghệ thơng tin. Kỹ thuật
này được đánh giá sẽ là đột phá của một cuộc cách mạng công nghệ mới, khi những
thiết bị có khả năng nhận dạng vân tay, được dùng để bảo vệ dữ liệu được ứng dụng
ngày càng nhiều.
Nguyên lý hoạt động:
Nguyên lý hoạt động của công nghệ nhận dạng sinh trắc vân tay là khi đặt ngón
tay lên trên một thiết bị nhận dạng dấu vân tay, ngay lập tức thiết bị này sẽ quét hình
ảnh vân ngón tay và đối chiếu các đặc điểm của vân tay đó với dữ liệu đã được lưu trữ
trong hệ thống trước đó. Q trình xử lý dữ liệu sẽ được thiết bị chuyển sang các dữ liệu
số và ra thơng báo rằng dấu vân tay đó là hợp lệ hay khơng hợp lệ, sau đó để hệ thống
thực hiện các chức năng khác. Khi đến giờ học, tiết học của từng mơn học sinh, sinh
viên đó sẽ quẹt thẻ của mình lên đầu đọc thẻ gắn trên tường ngay cửa ra vào của từng
phòng học để điểm danh
xiii
Ưu điểm:
-
Giảm thời gian điểm danh của giáo viên.
-
Không cần phải mang thẻ.
Nhược điểm:
-
Thời gian xếp hàng đợi quét vân tay là rất lâu.
2.3. Công nghệ nhận diện khuôn mặt.
-
TensorFlow
-
Microsoft face API
-
Face Recognition - Stephen here from Lambda Labs. Face (Detection)
-
Animetrics Face Recognition
-
Skybiometry Face Detection and Recognition
-
ImageVision Face Detection
-
OpenCV Face Recognizer - OpenCV
-
Emgu CV
-
Libface
-
CCV OpenBR - Open Source Biometric Recognition
-
Flandmark
-
FaceReader
-
Affdex
-
Faceware
-
Face detection in iOS
-
Face-Recognition-SDK
-
Oddcast face detection API
-
BioID - world’s first webcam-based personal recognition
-
Betaface API - face detection and recognition
-
FaceIT SDK -
-
FaceSDK
-
Verilook SDK
-
Beyond Reality Face SDK
xiv
-
Sightcorp
-
Visage FaceDetect SDK
-
Microsoft Research Face SDK Beta
-
How To
-
FacePhi FaceRecognition SDK
-
360Biometrics Face SDK
-
Hunter TrueID
-
IMRSV
-
Stupeflix
2.4. So sánh Kairos API với một số sản phẩm khác [24].
Mọi người đều nói về nhận dạng khn mặt và có rất nhiều cơng ty khác nhau
Để giúp đưa ra quyết định sự lựa chọn đúng đắn, người nghiên cứu đã so sánh các dịch
vụ nhận dạng khuôn mặt tốt nhất trên thị trường.
Kairos Amazon Google Microsoft IBM Affectiva OpenCV
Face
Detection
Face
Recognition
(Image)
Face
Recognition
(Video)
Emotional
Depth (%)
Emotions
Present
(Y/N)
Age
&
Gender
Multi-face
Tracking
SDK
API
Ethnicity
xv
Amazon Rekognition i
Tổng Quát
Học sâu dựa trên hình ảnh công nhận. Là một phần của hệ sinh thái AWS của
Amazon. Dựa trên việc mua lại Orbeus vào 12/1/2015 và tung ra lại vào ngày 11/30/16.
Tính Năng Cốt Lõi
-
Phân tích đối tượng và cảnh.
-
Phát hiện khn mặt.
-
Nhận dạng khn mặt.
-
Phân tích tình cảm khn mặt
Điều kiện giới hạn
-
Số khn mặt tối đa được xử lý trong một hình ảnh là 15.
-
Kích thước hình ảnh tối đa được lưu trữ dưới dạng một đối tượng Amazon
S3 giới hạn đến 15 MB. Độ phân giải pixel tối thiểu cho chiều cao và chiều
rộng là 80 pixel.
-
Kích thước hình ảnh tối đa là byte như tham số cho một API là 5 MB.
-
Chỉ JPG và PNG - không hỗ trợ định dạng video.
-
Khơng có phân tích cảm xúc.
-
Số khn mặt tối đa mà người có thể lưu trữ trong bộ sưu tập khuôn mặt
duy nhất là 1 triệu.
-
Đối sánh tối đa mà API trả về tìm kiếm là 4096.
Nhận định
Amazon đã định hướng lại việc mua lại Orbeus như là một phần của nền tảng
AWS của họ và các tính năng tầm nhìn máy tính này khơng phải là trọng tâm cốt lõi của
họ. Nền tảng này gắn liền với hệ sinh thái AWS. Những người dùng không phải là AWS
sẽ gặp khó khăn trong việc thực hiện Rekognition trong sản phẩm của mình.
xvi
API Google Vision ii
Tổng Qt
Phân tích hình ảnh và video trên khuôn mặt. Một phần của Nền tảng Dịch vụ
Nhận thức của Microsoft.
Tính Năng Cốt Lõi
-
Phát hiện khn mặt.
-
Xác minh khuôn mặt.
-
Xác nhận khuôn mặt (công nhận).
-
Phát hiện cảm xúc.
Điều kiện giới hạn
-
Chỉ API, khơng có SDK cục bộ.
-
Bộ sưu tập Kích thước bộ sưu tập khn mặt giới hạn 1000.
-
Chỉ có 27 điểm trên khn mặt, tối đa 64 khn mặt cho mỗi hình ảnh.
-
Phân tích Emotion Video giới hạn tối đa 100MB (10-20 giây video ở độ
phân giải 1080p, <30 giây ở độ phân giải 720p HD).
-
Hình ảnh có kích thước tối đa 4MB (nhỏ hơn 2 megapixel).
-
Phân loại cảm xúc: tức giận, khinh thường, ghê tởm, sợ hãi, hạnh phúc,
trung lập, buồn bã, bất ngờ (không chú ý).
-
10 giao dịch mỗi giây đối với API khn mặt và hình ảnh API cảm xúc.
-
Tối đa 1 video cho mỗi phút trên Emotion API, giới hạn truy vấn trạng
thái video 2 phút.
-
$1,50 / 1000 cuộc gọi mỗi tháng, gói mở rộng $0,50 trên 1000 khn mặt
được lưu trữ trong một thư viện.
-
30k cuộc gọi miễn phí mỗi tháng cho Emotion và Face APIs.
-
Khách hàng nhận diện khuôn mặt = 3004 đô la / tháng.
-
Nếu người dùng thêm các tính năng bổ sung, chẳng hạn như phát hiện biểu
tượng hoặc thuộc tính hình ảnh, người dùng phải trả $1,50 / 1000 * số tính
năng mà người dùng yêu cầu.
xvii
-
Cảm xúc của khách hàng mẫu = $N / A - Video tối đa phải được xử lý là
50 giờ đầu tiên phải được hạ cấp và cắt thành đoạn clip thứ 30, khơng có
giá cả.
-
API cảm xúc tối đa 3000 video mỗi tháng ở mức $.25 / 1000 cuộc gọi.
Nhận định
Là một phần nhỏ của nền tảng đám mây của Google. Giá cả phức tạp, giới hạn
bởi tính năng combo. Đứng từ nhận thức của nhà phát triển, giống như các dịch vụ khác
của Google, API của Cloud Vision có thể dễ dàng ngưng bất cứ lúc nào.
Microsoft Face API (FKA ‘Project Oxford’) iii
Tổng Quát
Phân tích nội dung. Phân loại hình ảnh và video thành hàng ngàn chủng loại.
Tính Năng Cốt Lõi
-
Phát hiện nội dung khơng phù hợp.
-
Phân tích tình cảm hình ảnh (khn mặt).
-
OCR và nhận dạng ngôn ngữ tự động.
-
'Video Intelligence' - Cảnh, đối tượng và 'thực thể'.
Điều kiện giới hạn
-
Chỉ báo cáo lại 34 mặt mốc.
-
Khơng nhận dạng khn mặt có thể.
-
Chỉ gửi hình ảnh qua mã hóa Base64.
-
Kích thước tối đa 4MB hình ảnh (nhỏ hơn 2 megapixel).
-
10 yêu cầu tối đa mỗi giây.
-
20m hình ảnh mỗi tháng tối đa
-
Chỉ có Cloud API, khơng có SDK.
-
Phân loại cảm xúc: niềm vui, nỗi buồn, tức giận, và bất ngờ. Chỉ với 'khả
năng', chứ khơng phải cường độ.
-
1-1000 hình ảnh miễn phí mỗi tháng.
-
1001-5.000.000 hình ảnh 1,50 đơ la cho mỗi 1000 hình ảnh.
xviii
-
2 triệu ảnh/ tháng = $3000 chỉ nhận diện khuôn mặt và phát hiện tình cảm
giới hạn, khơng nhận dạng khn mặt, khơng có phân tích video cảm xúc
nào có thể.
-
Nếu người dùng thêm các tính năng bổ sung, chẳng hạn như phát hiện biểu
tượng hoặc thuộc tính hình ảnh, người dùng phải trả $1,50 / 1000 * số tính
năng mà người dùng yêu cầu.
Nhận định
Microsoft có một dịch vụ phân tích khn mặt chắc chắn cho đám mây. Tuy
nhiên, dịch vụ bị giới hạn bởi giới hạn sử dụng và sự mất ổn định về giá - hãy xét "giá
trước" của họ, điều này sẽ tăng 50% khi có sẵn. Là một phần của nền tảng Cognitive
Services lớn hơn của họ, nó cũng thiếu sự tập trung của một nhà cung cấp chuyên dụng.
Họ có một số bản dtôio dễ thương.
IBM Watson Visual Recognition API iv
Tổng Quát
Hiểu nội dung của hình ảnh. Một phần của Cloud phát triển của Watson.
Tính Năng Cốt Lõi
-
Phát hiện khn mặt.
-
Người nổi tiếng công nhận.
-
Nhận diện đối tượng và cảnh.
Điều kiện giới hạn
-
Nhận diện khuôn mặt được giới hạn trong những người nổi tiếng.
-
250 hình ảnh / ngày lên đến 5000 hình ảnh.
-
Phát hiện độ tuổi và giới tính.
Nhận định
Một thành phần nhỏ trong khả năng mở rộng của Watson. Khơng có trọng tâm
rõ ràng về phân tích khn mặt và phụ thuộc nhiều vào nền tảng đám mây Blutoix của
xix
IBM. Chiến lược của IBM Watson tập trung không theo nhận dạng trực quan so với các
phân tích dựa trên văn bản chính của nó.
Cognitec v
Tổng Qt
Tìm kiếm cơ sở dữ liệu hình ảnh khn mặt, các giải pháp kiểm tra video thời
gian thực.
Tính Năng Cốt Lõi
-
Theo dõi khuôn mặt
-
Nhận dạng khuôn mặt.
-
Phát hiện độ tuổi và giới tính.
-
Nhận dạng khn mặt video.
Điều kiện và giới hạn
-
Nhà cung cấp phần mềm nhận dạng khuôn mặt hàng đầu cho các chính
phủ, quân đội, an ninh và các ngành chơi game.
-
Chỉ SDK, khơng có API web.
-
Hoạt động tốt dưới các kịch bản được kiểm soát như kiểm soát hộ chiếu.
-
Tốc độ ghi danh chậm và tỷ lệ phù hợp.
-
Không có phân tích cảm xúc.
-
C, C + +, Java, và phát triển C # có thể.
-
Hỗ trợ khách hàng chỉ dành cho khách hàng doanh nghiệp quy mô lớn.
-
Cấp phép khó khăn và mơ hình định giá.
Nhận định
Là một cơng ty lớn trong thị trường chính phủ, Cognetic là một sản phẩm rất
phức tạp và tốn kém để thiết lập, sử dụng và duy trì.
NEC Face Recognition vi
Tổng Quát
Một phần của bộ dữ liệu pháp lý và an ninh của NEC.
xx
Tính Năng Cốt Lõi
-
Phân tích ngón tay và cọ.
-
Phát hiện và nhận diện khuôn mặt.
-
Nhận dạng khuôn mặt trên hình ảnh và video.
-
Họ thích xây dựng các giải pháp hoàn chỉnh trong nhà hơn là cấp phép
SDK cho các nhà tích hợp hoặc nhà phát triển bên ngồi.
Điều kiện và giới hạn
-
Khơng có phân tích cảm xúc.
-
Khơng có API trên đám mây.
-
SDK chỉ, cũng được phân phối như một thiết bị phần cứng cho các nhà
tích hợp.
-
Rất khó để tìm thấy bất kỳ thơng tin nào về SDK của họ.
-
SDK chỉ, cũng được phân phối như một thiết bị phần cứng cho các nhà
tích hợp.
-
NEC cung cấp rất ít thơng tin về dịng sản phẩm NeoFace, khơng có cách
nào rõ ràng để mua nó.
-
Bán hàng và bộ phận hỗ trợ khó khăn để tham gia với.
-
Cung cấp một đóng góp rất nhỏ cho một cơng ty rất lớn, nó có thể bị cắt
tại bất kỳ điểm nào.
Nhận định
Một bộ phận của NEC có trụ sở tại Nhật Bản. Giống như bất kỳ tổ chức cực lớn
nào, thật khó để liên hệ với họ trên điện thoại hoặc trả lời email. Sản phẩm của họ là tốt,
và trong nhiều năm đã được coi là một đối thủ lớn.
Affectivavii
Tổng Qt
Phần mềm nhận dạng tình cảm và phân tích hình ảnh và video. MIT Spywareff
của Media Lab.
xxi
Tính Năng Cốt Lõi
Phân tích vân tay.
Phát hiện và nhận diện khuôn mặt.
Nhận dạng khuôn mặt trên hình ảnh và video.
Họ thích xây dựng các giải pháp hoàn chỉnh trong nhà hơn là cấp phép
SDK cho các nhà tích hợp hoặc nhà phát triển bên ngồi.
Điều kiện và giới hạn
Chỉ phân tích cảm xúc.
Khơng nhận diện khn mặt.
Chỉ có 34 dấu vết mặt được theo dõi.
SDK miễn phí để sử dụng dưới 1 triệu đô la doanh thu hàng năm.
Ra mắt một 'API Phân tích Speech' mới vào tháng 9 năm 2017
Nhận định
Affectiva là một nhà phát triển có được nguồn tài trợ tốt. Họ đã tăng 34 triệu đơ
la trong vịng 6 năm và liên kết chặt chẽ với WPP của tập đoàn quảng cáo. Với sự tập
trung vào phân tích cảm, họ khơng cung cấp mảng nhận diện khn mặt.
Face ++ viii
Tổng Qt
Face phân tích các dịch vụ đám mây. Được xây dựng và sở hữu bởi tập đồn
viễn thơng máy tính Trung Quốc Megvii, Inc.
Tính Năng Cốt Lõi
Phát hiện khn mặt.
Nhận dạng khuôn mặt.
Biểu cảm Emoji.
Xác minh khuôn mặt.
Phân tích khn mặt (mỉm cười, tuổi, giới tính và dân tộc thiểu số).
xxii
Điều kiện và giới hạn
Cloud API.
SDK 'Offline' để phát hiện và so sánh mốc thời gian giới hạn. Không nhận
dạng khuôn mặt. chỉ hỗ trợ iOS và Android.
Đã phát hiện được 83 điểm mặt (106 có trong SDK).
Galleries giới hạn tới 10.000 khuôn mặt.
Thêm khn mặt địi hỏi phải đào tạo lại để diễn ra trên toàn bộ bộ sưu
tập.
Nhận định
Họ chủ yếu hoạt động ở Trung Quốc, được tài trợ rất tốt (khoảng $150 triệu),
và được biết đến khi đưa vào các sản phẩm của Lenovo.
Vào đầu năm 2017, Face ++ bắt đầu tự tái tạo thương hiệu như một nhà cung
cấp Dịch vụ Cognitive - bắt chước các dịch vụ tương tự của Microsoft, Amazon và
Google. Thật khó để nói những gì tập trung của họ sẽ trở thành.
OpenCV ix
Tổng Quát
Là thư viện mã nguồn mở về phần mềm học máy. Được duy trì bởi Intel, trước
đây là Itseez Inc., cơng ty mà Intel mua lại vào năm 2016.
Tính Năng Cốt Lõi
Quá nhiều để liệt kê. Họ có 2500 thuật tốn được tối ưu hóa cho bất cứ điều gì
từ phát hiện khn mặt để theo dõi các đối tượng trong video.
Điều kiện và giới hạn
-
Phức tạp, khó sử dụng phần mềm được thiết kế cho các chuyên gia tầm
nhìn máy tính.
-
Bao gồm một diện tích rộng liên quan đến tầm nhìn máy tính.
-
Hạn chế chiều sâu liên quan đến nhận diện khuôn mặt / công nhận.
-
Chỉ SDK.
xxiii
Nhận định
Tuyệt vời cho các nhà phát tiển với để xây dựng các chương trình trong nghiên
cứu. Ít ứng dụng thương mại, chủ yếu dùng trong giáo dục và đào tạo.
3. Mục tiêu nghiên cứu
Đề tài được thực hiện với mục tiêu giới thiệu bộ API nhận diện khuôn mặt của
Kairos và xây dựng một trang web ứng dụng nhận diện khuôn mặt trong việc điểm danh
sinh viên. Nội dung chi tiết gồm:
-
Tìm hiểu về Kairos Face API
-
Xây dựng trang web nhận diện khuôn mặt.
-
Cho ứng dụng học máy và đưa ra đánh giá.
-
Ứng dụng trang web trong việc điểm danh sinh viên
-
Xây dựng thêm một số chức năng mở rộng.
4. Đối tượng và phạm vi nghiên cứu
4.1. Đối tượng nghiên cứu
-
Hệ thống nhận diện khuôn mặt.
-
Kairos face API
-
Quy trình điểm danh bằng hệ thống nhận dạng khn mặt.
4.2. Phạm vi nghiên cứu
-
Quy trình điểm danh sinh viên bằng nhận diện khuôn mặt.
-
Cách sử dụng Kairos API
5. Phương pháp nghiên cứu
-
Nghiên cứu và so sánh các thư viện (libaries), API, và SDK sử dụng cho việc
nhận diện khn mặt.
-
Tìm hiểu về quy trình điểm danh của các bài tốn điểm danh truyền thống và bán
truyền thống.
-
Chọn lọc và xây dựng trang web ứng dụng.
-
Phát triển thêm những tính năng khác.
xxiv
6. Những đóng góp mới và những vấn đề mà đề tài chưa thực hiện được
6.1. Những đóng góp mới
Giúp cho việc điểm danh được tiện lợi, giảm bớt những nhược điểm về thời gian,
-
sức lực và nhân sự.
-
Ứng dụng được cơng nghệ nhận diện khn mặt vào chương trình.
-
Đưa ra những cơ sở lý thuyết về Karos API để các bạn trẻ đam mê cơng nghệ có
cơ hội tiếp cận, nghiên cứu và áp dụng vào việc xây dựng phần mềm riêng cho
mình.
6.2. Những vấn đề chưa thực hiện được
Đề tài chưa tối ưu hóa thời gian xử lý trên server.
-
7. Kết cấu của đề tài
Luận văn được chia làm ba phần: phần mở đầu, phần nội dung và phần kết luận.
Phần mở đầu
Nêu lý do chọn đề tài, tổng quan tình hình phát triển, mục tiêu nghiên cứu đề
tài, đối tượng, phạm vi, phương pháp nghiên cứu cũng như những đóng góp mới của đề
tài. Bên cạnh đó cũng chỉ ra mặt hạn chế mà đề tài chưa thực hiện được để giúp mọi
người có cái nhìn rõ hơn.
Phần nội dung chính: gồm 4 chương
Chương 1: Cơ sở lý thuyết nhận diện khuôn mặt
Trong chương này người nghiên cứu sẽ trình bày cơ sở lý thuyết về một số
phương pháp nhận diện khuôn mặt đang được áp dụng hiện này đồng thời đưa ra so
sánh.
Chương 2: Giới thiệu về Kairos API
Chương này người nghiên cứu sẽ lần lượt giới thiệu tổng quát về Kairos API,
một số thuật ngữ về API và Rest, quy trình nhận diện khuôn mặt của Kairos, các phương
thức, thông báo và kinh nghiệm sử dụng.
Chương 3: Xây dựng chương trình và đánh giá kết quả.
xxv
Nêu cách xây dựng chươngc và các chức năng mà chương trình hỗ trợ. Chạy
chương trình thử nghiệm trên nhiều tiêu chí: Sự tiện lợi trong việc sử dụng, thời gian
điểm danh, độ chính xác, mật độ người trong ảnh, vị trí chụp…từ đó đưa ra kết luận.
Phần kết luận