Tải bản đầy đủ (.pdf) (135 trang)

Ứng dụng công nghệ trí tuệ nhân tạo trong bài toán giám sát an ninh tại trung tâm dịch vụ ký túc xá bách khoa trường đại học bách khoa, ĐHQG TP hồ chí minh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.99 MB, 135 trang )

ỦY BAN NHÂN DÂN
THÀNH PHỐ HỒ CHÍ MINH
SỞ KHOA HỌC VÀ CÔNG NGHỆ

ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
TRUNG TÂM KỸ THUẬT ĐIỆN TỐN

CHƯƠNG TRÌNH KHOA HỌC VÀ CÔNG NGHỆ CẤP THÀNH PHỐ

BÁO CÁO TỔNG HỢP
KẾT QUẢ NHIỆM VỤ NGHIÊN CỨU KHOA HỌC CÔNG NGHỆ
ỨNG DỤNG CÔNG NGHỆ TRÍ TUỆ NHÂN TẠO TRONG BÀI TỐN
GIÁM SÁT AN NINH TẠI TRUNG TÂM DỊCH VỤ KÝ TÚC XÁ BÁCH
KHOA - TRƯỜNG ĐẠI HỌC BÁCH KHOA - ĐHQG TP. HỒ CHÍ MINH

Cơ quan chủ trì nhiệm vụ: Trung tâm Kỹ thuật Điện toán
Chủ nhiệm nhiệm vụ:

TS. Dương Ngọc Hiếu

Thành phố Hồ Chí Minh – 2021


ỦY BAN NHÂN DÂN
THÀNH PHỐ HỒ CHÍ MINH
SỞ KHOA HỌC VÀ CÔNG NGHỆ

ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
TRUNG TÂM KỸ THUẬT ĐIỆN TỐN



CHƯƠNG TRÌNH KHOA HỌC VÀ CÔNG NGHỆ CẤP THÀNH PHỐ

BÁO CÁO TỔNG HỢP
KẾT QUẢ NHIỆM VỤ NGHIÊN CỨU KHOA HỌC VÀ CÔNG NGHỆ

ỨNG DỤNG CÔNG NGHỆ TRÍ TUỆ NHÂN TẠO TRONG BÀI TỐN
GIÁM SÁT AN NINH TẠI TRUNG TÂM DỊCH VỤ KÝ TÚC XÁ BÁCH
KHOA - TRƯỜNG ĐẠI HỌC BÁCH KHOA - ĐHQG TP. HỒ CHÍ MINH
(Đã chỉnh sửa theo kết luận của Hội đồng nghiệm thu ngày 03/12/2021)
Chủ nhiệm nhiệm vụ:

Cơ quan chủ trì nhiệm vụ

Thành phố Hồ Chí Minh - 2021


MỤC LỤC
DANH SÁCH BẢNG .........................................................................................................III
DANH SÁCH HÌNH.......................................................................................................... IV
DANH MỤC TỪ VIẾT TẮT ............................................................................................. V
MỞ ĐẦU............................................................................................................................... 1
1. Tổng quan ..................................................................................................................... 1
2. Nghiên cứu liên quan .................................................................................................... 8
2.1. Các nghiên cứu liên quan ngoài nước ................................................................... 8
2.2. Các nghiên cứu liên quan trong nước ................................................................. 11
CHƯƠNG I: THÔNG TIN CHUNG ............................................................................... 14
1. Thông tin về dự án ...................................................................................................... 14
2. Mục tiêu đề tài............................................................................................................. 15
3. Sản phẩm đầu ra .......................................................................................................... 16

CHƯƠNG II: NỘI DUNG ĐỀ TÀI ................................................................................. 21
1. Phân tích yêu cầu ........................................................................................................ 21
2. Nội dung đề tài ............................................................................................................ 22
CHƯƠNG III: PHƯƠNG PHÁP NGHIÊN CỨU .......................................................... 29
1. Tổng quan ................................................................................................................... 29
1.1. Thách thức dữ liệu lớn ......................................................................................... 29
1.2. Kiến trúc hệ thống đề xuất ................................................................................... 30
2. Mơ hình học sâu .......................................................................................................... 32
2.1. Giới thiệu về học sâu ........................................................................................... 32
2.2. Nhận diện khuôn mặt bằng học sâu ..................................................................... 32
2.3. Qui trình nhận diện và phân loại đối tượng bằng học sâu .................................. 43
3. Kỹ thuật tăng cường mẫu ............................................................................................ 46
4. Kỹ thuật tối ưu lưu trữ và tìm kiếm khn mặt .......................................................... 62
CHƯƠNG IV: HIỆN THỰC ĐỀ TÀI ............................................................................. 64
1. Kiến trúc hệ thống phần mềm ..................................................................................... 64
1. Phân hệ VMS .............................................................................................................. 64
2. Phân hệ giám sát an ninh ba cấp độ ............................................................................ 79
3. Phân hệ ứng dụng di động........................................................................................... 84
4. Core AI và đánh giá hiệu năng.................................................................................... 89
4.1. Mơ hình nhận diện khn mặt ............................................................................. 89
4.2. Mơ hình phân biệt giới tính dựa trên khuôn mặt ................................................. 95
CHƯƠNG V: TRIỂN KHAI ĐỀ TÀI .............................................................................. 97
1. Sơ đồ lắp đặt camera ................................................................................................... 97
2. Tiến độ công việc thực hiện ........................................................................................ 98
3. Sử dụng kinh phí ......................................................................................................... 99
4. Kêt quả đề tài .............................................................................................................. 99
CHƯƠNG VI: KẾT LUẬN VÀ KIẾN NGHỊ ............................................................... 103
1. Kết luận ..................................................................................................................... 103
2. Kiến nghị ................................................................................................................... 103
TÀI LIỆU THAM KHẢO............................................................................................... 104



PHỤ LỤC 01: PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG ......................................... 105
1. Lược đồ trường hợp sử dụng..................................................................................... 105
1.1. Giám sát đối tượng ............................................................................................ 105
1.2. Giám sát vào ra cổng ......................................................................................... 105
1.3. Giám sát khu vực ............................................................................................... 106
1.4. Giám sát đối tượng thuộc danh sách đen .......................................................... 106
1.5. Giám sát đối tượng thuộc danh sách trắng ....................................................... 107
1.6. Quản lý đối tượng (sinh viên) ............................................................................ 107
1.7. Quản lý camera .................................................................................................. 110
1.8. Quản lý mẫu ảnh của đối tượng ........................................................................ 113
1.9. Báo cáo – thống kê............................................................................................. 115
1.10. Quản lý danh mục ............................................................................................ 117
1.11. Quản lý người dùng ......................................................................................... 119
2. Lược đồ hoạt động .................................................................................................... 121
2.1. Qui trình đồng bộ thơng tin sinh viên ................................................................ 121
2.2. Qui trình xử lý tăng cường mẫu ảnh thực tế ...................................................... 121
2.3. Qui trình xử lý quẹt thẻ và cảnh báo sự kiện tại cổng ....................................... 122
2.4. Qui trình xử lý sự kiện cho camera thang bộ và hành lang ............................... 122
2.5. Qui trình xử lý luồng camera tại VMS ............................................................... 123
3. Lược đồ cơ sở dữ liệu ............................................................................................... 123
3.1. Cơ sở dữ liệu đối tượng sinh viên ...................................................................... 123
3.2. Cơ sở dữ liệu sự kiện ......................................................................................... 125
3.3. Cơ sở dữ liệu phân quyền .................................................................................. 126

ii


DANH SÁCH BẢNG

Bảng 1. Các nhóm nghiên cứu về AI tiêu biểu. .......................................................................... 3
Bảng 2. Một số doanh nghiệp có đầu tư về AI. .......................................................................... 5
Bảng 3. Kết quả nhận diện gương mặt của kết hợp các phương pháp trên các tập dữ liệu khác
nhau .......................................................................................................................................... 37
Bảng 4. So sánh kết quả của FaceNet, CosFace và ArcFace trên ba tập dữ liệu khác nhau. ... 43
Bảng 5. Tương quan giữa giá trị consine threshold và TAR, FAR của 10670 lượt đi vào cổng.
.................................................................................................................................................. 92
Bảng 6. Kết quả thực nghiệm trong 2 tuần ở thời gian ban ngày từ 7 giờ sáng đến 5 giờ chiều.
.................................................................................................................................................. 93
Bảng 7. Kết quả thực nghiệm trong 2 tuần ở thời gian ban đêm từ 5 giờ chiều đến 7 giờ sáng
hôm sau. .................................................................................................................................... 94

iii


DANH SÁCH HÌNH
Hình 1. Hệ thống giám sát an ninh 3 mức độ tại Trung tâm dịch vụ Ký túc xá Bách KhoaTrường ĐH Bách Khoa,ĐHQG-HCM ..................................................................................... 22
Hình 2. Kiến trúc hệ thống phần mềm trong đó (a) là phần nội dung huấn luyện mơ hình trí tuệ
nhân tạo và (b) là phần nội dung giám sát thời gian thực......................................................... 30
Hình 3. Các bước cần xử lý khi nhận diện khn mặt một đối tượng...................................... 34
Hình 4. Sơ đồ kết hợp bốn tác vụ trong mơ hình RetinaFace .................................................. 37
Hình 5. Sơ đồ hai bước dự đoán và cập nhật của thuật tốn Kalman filter. ............................. 39
Hình 6. Sơ đồ quá trình training với hàm lỗi Angular Margin Softmax Loss của mơ hình
ArcFace. .................................................................................................................................... 42
Hình 7. Quy trình xây dựng tập dữ liệu mẫu. ........................................................................... 44
Hình 8. Giao diện cơng cụ làm nhãn dữ liệu. ........................................................................... 45
Hình 9. Kiến trúc của mơ hình mobilenet-v2. .......................................................................... 46
Hình 10. Qui trình lấy mẫu đối tượng của hệ thống. ................................................................ 48
Hình 11. Đối tượng được định danh bởi ba loại ảnh mẫu. ....................................................... 50
Hình 12. Ba trạng thái mẫu của một đối tượng. ....................................................................... 52

Hình 13. Phương pháp tăng cường mẫu thực tế. ...................................................................... 54
Hình 14. Tổng quan các phương pháp làm nhiều thêm dữ liệu ảnh [15]. ................................ 57
Hình 15. Kiến trúc VSearch (). ................................................. 63
Hình 16. Kiến trúc các phân hệ của hệ thống giám sát an ninh ba mức độ. ............................. 64
Hình 17. Sơ đồ tổng quát của ZoneMinder .............................................................................. 68
Hình 18. Process Capture của ZoneMinder. ............................................................................. 73
Hình 19. Process Analyze. ........................................................................................................ 74
Hình 20. Process stream event. ................................................................................................. 75
Hình 21. Process live stream. ................................................................................................... 76
Hình 22. Màn hình giám sát camera trên nền bản vẽ BIM. ...................................................... 79
Hình 23. Tương quan giá trị cosine threshold và TAR, FAR................................................... 92
Hình 24. Vị trí lắp đặt camera. ................................................................................................. 97

iv


DANH MỤC TỪ VIẾT TẮT
ICT

Công nghệ thông tin và truyền thơng

CSDL

Cơ sở dữ liệu

AI

Artificial Intelligence – trí tuệ nhân tạo

CNTT


Cơng nghệ thông tin

DL

Deep Learning – học sâu

ML

Machine Learning – học máy

CNN

Convolutional Neural Network – mạng tích chập

ANN

Artificial Neural Network – mạng nơ ron nhân tạo

FD

Face Detection – phát hiện khuôn mặt

FR

Face Recognition – nhận diện khuôn mặt

v



MỞ ĐẦU
1. Tổng quan
Nhân loại đang bước vào kỷ nguyên số, trong đó việc phân tích dữ liệu và ứng dụng
tính tốn trong mọi lĩnh khoa học & cơng nghệ ngày đang mang lại các giá trị đáng ghi
nhận. Tuy nhiên, bài tốn cần giải có khối lượng tính tốn và khối lượng dữ liệu cần
phân tích cũng lớn dần lên. Vì vậy ngày nay chúng ta khơng thể giải quyết các vấn đề
này mà khơng có hệ thống máy tính mạnh.
Theo báo cáo thị trường của cơng ty cơng nghệ Comparitech tháng 7/2020, trên thế
giới có 770 triệu camera đang hoạt động, dự kiến đến năm 2021 con số này sẽ tăng lên
1 tỷ. Tổng quy mô thị trường camera năm 2019 là 42,94 tỷ USD và dự kiến sẽ đạt 144,85
tỷ USD trong năm 2027 với tốc độ tăng trưởng trung bình hàng năm là 14,6% (theo báo
cáo thị trường của Allied Market Research, tháng 4/2020).

Camera giám sát đang ngày càng trở thành một công cụ hữu hiệu trong hệ thống an
ninh.
Trước đây, hệ thống giám sát thường chỉ được đặt ở những nơi yêu cầu tính bảo mật
cao như sân bay, ngân hàng. Tuy nhiên trong những năm gần đây, nhu cầu sử dụng và
lắp đặt hệ thống camera giám sát đang bùng nổ, hệ thống camera giám sát đã bắt đầu
được sử dụng rộng rãi trong các nhà hàng, tòa nhà văn phòng, các cơ quan hành chính,
1


hay cửa hàng bn bán nhỏ lẻ, hộ gia đình, với nhiều hình thức như camera IP hay
Analog, có dây hay không dây, v.v…
Vượt qua yêu cầu đảm bảo an ninh, hệ thống giám sát qua video ngày nay còn cung
cấp lượng dữ liệu khổng lổ, giúp các công ty nhận biết thói quen, xu hướng, phân tích
hành vi của khách hàng, tìm hiểu các thói quen của người tiêu dùng, qua đó tăng cường
trải nghiệm tích cực của khách hàng, theo đó cung cấp dịch vụ tốt nhất, gia tăng doanh
thu. Nói cách khác, một cách gián tiếp hệ thống giám sát hứa hẹn tiềm năng gia tăng
doanh thu cho các công ty.

Cách đây hơn 10 năm, camera an ninh thu thập hình ảnh thật - nếu có, cũng chỉ
dừng lại ở chất lượng hình ảnh thấp, mờ nhịe, rất khó xử lý dữ liệu khi có sự cố. Tuy
nhiên, khi nhu cầu an ninh tăng cao và công nghệ ngày càng phát triển, các hệ thống an
ninh hiện nay đã có thể cung cấp hình ảnh chất lượng cao với giá thành hợp lý. Chỉ cần
bỏ ra từ vài triệu đồng, một gia đình hoặc hộ kinh doanh nhỏ lẻ đã có thể trang bị cho
mình một hệ thống camera giám sát, gồm camera, đầu ghi hình, ổ lưu trữ cùng giải pháp
truy cập và theo dõi qua mạng.
Tuy nhiên, nếu chỉ dừng ở việc giám sát an ninh thơng qua dữ liệu video thời gian
thực, thì giám sát viên chỉ có thể giám sát một số lượng camera tương đối nhỏ và trong
một khoảng thời gian ngắn, khơng thể liên tục 24/24. Vì vậy, thực tế đặt ra những thách
thức cho các nhà khoa học là xử lý tự động những bất thường liên quan an ninh bằng
những giải pháp xử lý ảnh, trí tuệ nhân tạo. Cho đến thời điểm hiện tại, có nhiều bài tốn
xử lý camera thời gian thực được giải quyết tốt và ứng dụng hiệu quả vào thực tế như:
phân tích nội dung camera thời gian thực, nhận diện khuôn mặt, phát hiện hành vi bất
thường (ví dụ: trộm, hành vi gian lận), truy vết đối tượng, v.v…
Công nghệ nhân diện khuôn mặt (Facial Recognition Technology) hiện là một công
nghệ đang được sử dụng khá phổ biến tại các quốc gia phát triển. Cơng nghệ này có khả
năng xác định hoặc xác nhận một người từ hình ảnh kỹ thuật số được lấy mẫu trước đó
hoặc từ một khung hình trong một nguồn video khác. Công nghệ nhân diện khuôn mặt
dựa trên sinh trắc học ít tác động đến người dùng nhất và là công nghệ sinh trắc học
nhanh nhất. Nhà quản lý có thể chủ động hơn trong việc kiểm sốt, hệ thống sẽ nhận
diện khn mặt một cách kín đáo bằng cách chụp ảnh khuôn mặt của những ai bước vào
2


một khu vực được xác định từ camera giám sát. Trong nhiều trường hợp đối tượng hồn
tồn khơng hay biết gì về q trình này. Họ khơng cảm thấy “bị giám sát” hoặc sự riêng
tư của họ bị xâm phạm.
Nếu cả thế giới vẫn chưa hết bất ngờ vì khả năng của cơng nghệ nhận diện khn
mặt thì Trung Quốc đã triển khai phần mềm giám sát mới ở Bắc Kinh và Thượng Hải mà giới chức quản lý cho biết có thể xác định danh tính người dân từ cách đi bộ của họ,

ngay cả khi quay lưng lại và che mặt đi. CEO của Watrix, công ty đứng sau công nghệ
"gait recognition" (nhận diện dáng đi), cho biết nó sẽ cải thiện và khắc phục các vấn đề
của nhận diện khn mặt, dựa trên hình ảnh cận cảnh, chất lượng cao để nâng cao tỉ lệ
xác minh chính xác, Associated Press đưa tin. Công nghệ nhận dạng mới sẽ lưu lại mơ
hình kỹ thuật số về hình dáng và cách đi bộ của một người từ video giám sát, sau đó tạo
ra mơ hình 3D riêng biệt cho điệu bộ của mỗi người.
Theo Asia Times, nó sẽ đo và lưu lại chiều dài bước, sải chân, nhịp bước chân, cơ
sở động lực, đường tiến triển, góc chân, góc hông và cách ngồi xổm, v.v... Huang, CEO
của Watrix cho hay, video trích xuất từ camera an ninh sẽ trở thành cơ sở dữ liệu để
phần mềm xác định danh tính của người qua đường.
Tại Việt Nam, các nhóm nghiên cứu tại các trường Đại học trong thời gian qua đã
và đang tập trung đẩy mạnh nghiên cứu nhiều bài tốn về AI, trong đó bao gồm Thị giác
máy tính, Nhận dạng và tổng hợp tiếng nói, Xử lý ngơn ngữ tự nhiên, Robotics, Biểu
diễn tri thức và suy diễn. Trong đó các trường Đại học có quy mơ lớn đều mong muốn
thúc đẩy hầu hết các nhánh nghiên cứu trong Trí tuệ nhân tạo nói trên, một số nhóm tiêu
biểu được liệt kê trong Bảng 1. Hiện tại, các nhóm nghiên cứu như vậy thu hút một
lượng lớn sinh viên, học viên, và nghiên cứu sinh tham gia học tập và nghiên cứu. Thơng
qua các hoạt động trong nhóm, họ góp phần đáp ứng nhu cầu về nhân sự cho các tổ chức
đào tạo và các doanh nghiệp.
Bảng 1. Các nhóm nghiên cứu về AI tiêu biểu.
STT Lĩnh vực nghiên cứu

Đơn vị

Các nhà nghiên cứu

3


1


Thị giác máy tính và Trường Đại học Bách TS. Lê Thành Sách,
ứng dụng
Khoa - ĐHQG-HCM
PGS. TS. Thoại Nam,
TS. Trần Tuấn Anh,
TS. Nguyễn Hồ Mẫn
Rạng,
TS. Dương Ngọc Hiếu,
(với hơn 70 sinh viên và
học viên cao học trong
một năm)

2

Thị giác máy tính và Trường Đại học Khoa PGS. Lý Quốc Ngọc,
ứng dụng
học Tự nhiên- ĐHQG- PGS. TS. Lê Hoàng Thái,
HCM
PGS. TS. Trần Minh
Triết,
TS. Nguyễn Thái Sơn,
TS. Đinh Bá Tiến

3

Thị giác máy tính và Trường Đại học Cơng TS. Lê Đình Duy,
ứng dụng
nghệ Thông tin- ĐHQG- TS. Ngô Đức Thành,
HCM

PGS. TS. Vũ Đức Lung

4

Thị giác máy tính và Trường Đại học Cơng PGS. TS. Huỳnh Trung
ứng dụng
nghiệp Tp.HCM
Hiếu, ThS. Lê Trọng
Ngọc

5

Thị giác máy tính và Trường Đại học Sài Gịn PGS. TS. Phạm Thế Bảo
ứng dụng

6

Nhận dạng và tổng hợp Trường Đại học Khoa PGS. TS. Vũ Hải Quân
tiếng nói
học Tự nhiên- ĐHQGHCM

7

Nhận dạng và tổng hợp Trường Đại học Bách TS. Nguyễn Đức Dũng
tiếng nói
Khoa- ĐHQG-HCM

8

Xử lý ngơn ngữ tự nhiên Trường Đại học Bách PGS. TS. Quản Thành

Khoa - ĐHQG-HCM
Thơ,
TS. Nguyễn Hứa Phùng

4


9

Xử lý ngôn ngữ tự nhiên Trường Đại học Khoa PGS. TS. Đinh Điền
học Tự nhiên - ĐHQGHCM

10

Khai phá dữ liệu

11

Bảo mật và an ninh Trường Đại học Bách PGS.TS
Trần
Ngọc
thông tin dùng AI trên Khoa- ĐHQG-HCM
Thịnh,
FPGAs
TS. Phạm Quốc Cường

12

Phân tích dữ liệu giao Trường Đại học Bách PGS. TS. Phạm Trần Vũ
thơng

Khoa- ĐHQG-HCM

13

Hệ thống tính tốn Trường Đại học Bách
mạnh & platform cho Khoa- ĐHQG-HCM
ứng dụng phân tích dữ
liệu lớn dùng AI

JVN - ĐHQG-HCM

GS. TS. Hồ Tú Bảo

PGS. TS. Thoại Nam,
PGS. TS. Trần Văn Hoài,
TS. Nguyễn Lê Duy Lai
& các đối tác công nghiệp
Nvidia, HPE, Intel, Oracle
& GS. TS. Dieter
Kranzlmüller - Trung tâm
Siêu máy tính Leibniz Đức

(bảng này chỉ nêu các nhóm nghiên cứu về AI tiêu biểu, chưa kể các nhóm có dùng kỹ
thuật AI trong phân tích dữ liệu nói chung khác)
Ngồi các trường Đại học, nhiều doanh nghiệp trên địa bàn Tp.HCM cũng rất quan
tâm đầu tư và đưa Trí tuệ nhân tạo vào ứng dụng thực tiễn. Nhiều đơn vị thành lập phịng
thí nghiệm về Trí tuệ nhân tạo và dữ liệu lớn; một số doanh nghiệp rất quan tâm AI như
được trình bày trong Bảng 2 sau đây.
Bảng 2. Một số doanh nghiệp có đầu tư về AI.
STT Cơng ty/Tập Các hoạt động

đồn

5


1

2

3

4

5

Cơng
Bosch
Nam

ty
Việt

Tập
đồn
VNPT

Tập
FPT

Cơng

VNG

Cơng
TMA

đồn

ty

ty

-

Nghiên cứu phát triển xe tự hành

-

Phát triển các ứng dụng hỏi đáp tự nhiên giữa người và
máy

-

Ứng dụng AI để xây dựng hệ thống tương tác người –
máy thông minh, thông qua ứng dụng của các kỹ thuật
thực tại ảo và thực tại tăng cường.

-

Phát triển ứng dụng phân tích video thơng minh cho các
ứng dụng như an ninh, giao thông, quản lý môi trường và

đô thị.

-

Ứng dụng AI để số hóa văn bản và hỗ trợ truy tìm văn
bản một cách thông minh

-

Ứng dụng AI để xây dựng hệ thống hỏi-đáp thông minh
thông qua di động

-

Phát triển xe tự hành: cuộc đua số đã được triển khai vài
năm nay để hỗ trợ phát triển xe tự hành

-

Ứng dụng các ứng dụng AI dựa trên nền tảng số hóa dữ
liệu

-

Xây dựng trợ lý ảo, thông qua nhận dạng và tổng hợp
tiếng nói, cũng như hiểu ngơn ngữ tự nhiên

-

Ứng dụng AI để xây dựng các ứng dụng phân tích hình

ảnh và video thơng minh

-

Ứng dụng AI vào nơng nghiệp thơng minh và chăm sóc
sức khỏe

-

Phát triển ứng dụng phân tích hồ sơ khách hàng

Qua một số thống kê tóm tắt cho thấy tầm quan trọng của Trí tuệ nhân tạo đã được
nhận thức rõ nét tại các đơn vị đào tạo và các doanh nghiệp. Một số trường đại học lớn
trong vùng cũng đã tận dụng nhiều nguồn kinh phí để đầu tư cho việc nghiên cứu và thử
nghiệm để cho ra một số sản phẩm đạt chất lượng để triển khai thực tiễn. Các doanh
nghiệp trên địa bàn cũng rất quan tâm về AI, bằng chứng là nhu cầu tuyển dụng nhân sự

6


về AI rất cao và được đãi ngộ tốt. Một số doanh nghiệp cũng đã quan tâm đến việc phát
triển phịng thí nghiệm chung, phối hợp với các đại học.
Tại Trung tâm dịch vụ Ký túc xá Bách Khoa (KTX), việc ứng dụng công nghệ thông
tin là rất tốt. Hệ thống thông tin quản lý được triển khai hiệu quả cho hầu hết các phòng
ban chức năng. Mặc dù tổng số lượng sinh viên lên đến 2434 sinh viên, nhưng nhờ ứng
dụng công nghệ thông tin hiệu quả, số lượng cán bộ hiện tại là 24. Bên cạnh đó, để tăng
cường việc giám sát an ninh, Ban giám đốc KTX đã triển khai 173 cam để lắp đặt hầu
hết những vị trí quan trọng như khu vực ngã 4 Hịa Hảo – Nguyễn Kim, ngã 4 Nguyễn
Kim- Đào Duy Từ, khu vực cổng bảo vệ, sân trước, sân sau, tầng trệt, thang máy, thang
bộ tầng 2, hành lang 11 tầng sinh viên lưu trú, 11 phòng sinh hoạt chung, penthouse,

một số phòng chức năng. Nhờ hệ thống camera, ký túc xá đã giải quyết nhiều vấn đề an
ninh như trộm cắp, phá rối (phá hoại thang máy), vi phạm nội qui kí túc xá, v.v… Từ
đó tạo nề nếp học tập, sinh hoạt lành mạnh trong khuôn viên KTX, cũng như hỗ trợ công
tác giám sát từ xa của Ban Giám Đốc KTX và tạo ý thức tôn trọng tài sản chung, tài sản
của người khác làm rơi (khi nhặt được của rơi, sinh viên thường tự giác mang đến Văn
phịng để nhờ tìm chủ tài sản).
Tuy nhiên, hạ tầng camera cịn hạn chế là chưa đồng bộ cơng nghệ camera, một số
camera chất lượng thấp. Ngồi ra, vì chưa được ứng dụng các phương pháp xử lý camera
tự động, nên ứng dụng camera trong an ninh để truy vết, tìm bằng chứng là hạn chế; cần
nâng cấp giải pháp để có thể phát hiện tức thời các hành vi trộm cắp, vi phạm qui chế kí
túc xá, v.v... Minh hoạ cụ thể về hạn chế là phần mềm kiểm soát cổng bằng thẻ RFID.
Mặc dù đây là một trong những ứng dụng tiêu biểu và rất hiệu quả của phần mềm quản
lý KTX, mang lại hiệu quả an ninh cao cho KTX. Nhờ phần mềm này mà giảm thiểu
được thời gian kiểm thẻ, đối soát giấy tờ tùy thân của tổ bảo vệ, bộ phận quản lý có thể
linh hoạt trong việc cho phép sinh viên mới vào KTX, hoặc không cho sinh viên cũ đã
hết hạn hợp đồng lưu trú vào trong KTX. Điểm hạn chế của phần mềm này là cơ chế
nhận dạng còn phụ thuộc vào con người (nhân viên bảo vệ là người quyết định việc nhận
dạng và cho phép/ngăn chặn các đối tượng vào trong KTX). Khi một đối tượng đã qua
được cổng bảo vệ và vào trong KTX thì sẽ rất khó để nhận biết đâu là sinh viên đang
lưu trú, đâu là người đột nhập trái phép.
7


Vì những lý do đã trình bày trên, đề tài “Ứng dụng cơng nghệ trí tuệ nhân tạo trong
bài tốn giám sát an ninh tại Trung tâm dịch vụ Ký túc xá Bách Khoa -Trường Đại học
Bách Khoa, ĐHQG TP. Hồ Chí Minh” là rất cần thiết.
2. Nghiên cứu liên quan
2.1. Các nghiên cứu liên quan ngồi nước
Nhận diện khn mặt là bài toán rất kinh điển, được nhiều nhà khoa học, tập đoàn,
trường đại học, quốc gia trên thế giới quan tâm. Từ những năm đầu tiên 1990, những

nghiên cứu về nhận diện khuôn mặt đã dần trở nên phổ biến và là thách thức đối với các
nhà khoa học [2]. Qua một thời gian dài, có nhiều nghiên cứu xuất hiện cho ra đời nhiều
phương pháp, giải thuật khác nhau, nhưng trong đó mạng neural nhân tạo (ANN) là một
phương pháp được sử dụng rất nhiều. Những mạng ANN trước đây thường ít tầng (cịn
gọi là shallow ANN) dù được hỗ trợ các kỹ thuật xử lý ảnh tinh tế, nhưng qua hàng thập
niên, khi thử nghiệm trên các tập dữ liệu benchmarks thì độ chính xác vẫn không vượt
qua 95% [3].
Tuy nhiên từ năm 2012, khi mạng AlexNet giành chiến thắng trong cuộc thi
ImageNet thì cộng đồng xử lý ảnh đã có sự thay đổi lớn, do sự ra đời của khái niệm học
sâu (deep learning) [4]. Và kể từ đó, đối với những vấn đề về xử lý ảnh như phân loại
ảnh (image classification), phát hiện đối tượng trong ảnh (object detection), nhận diện
khuôn mặt (face recognition), … đã trở nên đơn giản hơn rất nhiều. Mặc dù khái niệm
học sâu đã xuất hiện trước đó khá lâu, nhưng do hạn chế về thời gian huấn luyện mạng
nên học sâu chỉ mang tính chất nghiên cứu, không thể ứng dụng vào thực tế. Với sự phát
triển rất nhanh về phần cứng, cụ thể là các card đồ hoạ (GPU) hỗ trợ rất tốt cho học sâu,
nên gần như thời gian gần đây, nói đến phân tích ảnh, video, … thường đề cập đến học
sâu.
Trong những năm gần đây, khi công nghiệp 4.0 bùng nổ và nhu cầu xây dựng thành
phố thông minh tại các quốc gia trên thế giới, vài trị của AI nói chung và học sâu nói
riêng càng thể hiện rõ ràng. Trong bài viết [5] đã chỉ ra nhiều ứng dụng của học sâu
trong các bài tốn cụ thể của thành phố thơng minh như phát hiện đối tượng, truy vết
đối tượng, phân loại ảnh, nhận diện khuôn mặt, v.v…

8


Đối với bài tốn nhận diện khn mặt, trong thời gian gần đây, các nhà khoa học,
trường đại học, tập đồn, v.v… đã nghiên cứu và cho ra đời vơ số những phương pháp,
thuật giải và đã kiểm nghiệm trên các tập dữ liệu benchmarks với kết quả cực kỳ ấn
tượng (độ chính xác hơn 99%) [6]. Trong những phương pháp nhận diện khuôn mặt,

Facenet là phương pháp ra đời khá sớm (2015), khi kiểm nghiệm trên tập dữ liệu LFW
(Labeled Faces in the Wild) có độ chính xác là 99.63% và trên tập dữ liệu Youtube Faces
DB có độ chính xác 95.12% [7]. Một phương pháp khác là DeepFace với cách tiếp cạnh
là canh chỉnh khuôn mặt thẳng trong không gian 3D trước khi đưa vào mạng nơ-rơn [9].
Nhờ tiền xử lý khuôn mặt trước nên kiến trúc mạng nơ-rơn của cách tiếp cận này sẽ nhỏ
hơn so với các phương pháp khác, và kết quả đạt được của phương pháp này là 99.35%
trên tập LFW và 92.5% trên tập YTF. Khơng dừng lại ở đó, bằng phương pháp thay đổi
hàm loss cho phù hợp với bài toán nhận diện khuôn mặt, một thuật giải mới được ra đời
vào năm 2018 với tên ArcFace [10]. Phương pháp này cho độ chính xác trên tập dữ liệu
LFW và YTF lần lượt là 99.83% và 98.02%. Từ những mơ hình nhận diện khuôn mặt
bằng học sâu, đã cho ra đời những ứng dụng thực tế vơ cùng hữu ích, và dưới đây là tóm
tắt một số ứng dụng thực tế:


Tại Trung Quốc, từ du lịch, bán lẻ, giao thông đến ngân hàng đều đã áp dụng
hệ thống nhận dạng khuôn mặt. Một số ngân hàng ở nước này đã tích hợp công
nghệ nhận dạng khuôn mặt vào mạng lưới ATM. Không chỉ trong lĩnh vực ngân
hàng, công nghệ nhận diện khuôn mặt còn được ứng dụng trong nhiều lĩnh vực
khác như dịch vụ tại cửa hàng KFC ở Hàng Châu ra mắt dịch vụ “cười để thanh
toán”. Dịch vụ này cho phép khách hàng chọn “qt hình ảnh khn mặt” như
một phương thức thanh toán sau khi đặt hàng.



Năm 2017, Baidu - cơng ty cung cấp dịch vụ tìm kiếm dữ liệu trên mạng lớn
nhất Trung Quốc, đã thử nghiệm thành công hệ thống nhận diện khuôn mặt của
họ tại sân bay Bắc Kinh. Bằng nghiên cứu Face Recognition via Deep Learning
được thực hiện bởi nhóm nghiên cứu của Baidu, được đánh giá là có khả năng
nhận diện tốt hơn cả người thực với độ chính xác lên đến 99.7% [1]. Thay vì
dùng cả khn mặt để trích xuất đặc trưng truyền thống, họ trích xuất đặc cho

từng bộ phận trên mặt (mắt, mũi, miệng, v.v...) rồi tổng hợp lại. Tương tự, tại
9


một số sân bay của Mỹ, công nghệ nhận dạng khuôn mặt cũng đang được triển
khai để xác định danh tính tất cả những người sở hữu visa khi họ rời khỏi quốc
gia. Tháng 8/2017, tại sân bay Berlin (Đức) ứng dụng công nghệ nhận diện
gương mặt để giúp phát hiện các đối tượng nằm trong danh sách bị theo dõi và
tình nghi khủng bố. Singapore, Australia cũng đang đầu tư mạnh cho công nghệ
nhận dạng khuôn mặt tại tất cả sân bay quốc tế của nước này.


Alipay - là một ví điện tử tại Trung Quốc do tập đồn Alibaba Group sở hữu và
phát triển đã cung cấp thiết bị xác thực khi thanh toán mang tên Dragonfly dùng
để thay thế những máy POS truyền thống, thiết bị này kết hợp sử dụng camera
3D và giải thuật Deep Learning để trích xuất đặc trưng khn mặt của hành
khách và tiến hành xác thực với hệ thống. Nhờ công nghệ này, nhiều cửa hàng
đã tiết kiệm được thời gian xử lí đơn hàng cho khách. Dữ liệu của khách hàng
được mã hóa và đảm bảo tính riêng tư, đồng thời chúng sẽ không được phép
truy cập bởi các thương gia nơi mà các phần cứng Dragonfly được lắp đặt 1.



Tại Trung Quốc, trong nhiều lĩnh vực, các công ty công nghệ đang hợp tác chặt
chẽ với các cơ quan chính phủ về các vấn đề liên quan nhận diện khuôn mặt.
Tại lễ hội bia Thanh Đảo được tổ chức vào năm 2017, công ty Yitu Technology
đã đã làm việc với cơ quan hải quan và nhập cư Trung Quốc để cung cấp giải
pháp công nghệ cho phép xác định nghi phạm truy nã và bn lậu. Theo trang
web của mình, Yitu cho biết đã xây dựng được một cơ sở dữ liệu khuôn mặt lớn
nhất thế giới, với tổng số gần 1,5 tỷ khuôn mặt. Theo báo cáo của lực lượng

cảnh sát Thanh Đảo, nhờ công nghệ nhận diện khuôn mặt này, họ đã xác định
và bắt giữ 25 nghi phạm hình sự trong suốt thời gian diễn ra Lễ hội2.



Gần đây, vào đầu năm 2018, Nvidia công bố chương trình hợp tác cùng với
AnyVision để phát triển cơng nghệ nhận diện khuôn mặt cho các dự án smart
cities trên thế giới3. Dự án hợp tác nhằm mục tiêu tích hợp công cụ nhận diện
khuôn mặt vào các CCTV dùng để theo dõi tội phạm. Với công nghệ này,

1

/> />3
/>2

10


AnyVision nhận định rằng nó giúp cho các camera có thể quét khuôn mặt liên
tục 24/7, tự động xác định và theo dấu đối tượng trong đám đông với độ chính
xác đạt đến 99%. Nó cịn hỗ trợ để người giám sát có thể so sánh những khn
mặt được qt với hình ảnh những tên tội phạm, khủng bố có trong cơ sở dữ
liệu.


Panasonic – FacePRO là hệ thống nhận diện khuôn mặt sử dụng kỹ thuật Deep
Learning của Panasonic, được phát triển bởi Đại học quốc gia Singapore
(NUS)4. Hệ thống có thể hoạt động tốt với những trường hợp mặt khuôn mặt bị
nghiên sang trái hoặc phải đến 45 độ, bị che bởi kính mát, hoặc khn mặt bị
thay đổi bởi độ tuổi. Bằng chức năng Best Shot tự động lựa chọn tấm ảnh có

chất lượng tốt nhất từ loạt ảnh quay bởi camera và chỉ gửi những hình ảnh chất
lượng nhất đó tới server, hệ thống giảm tải được một lượng lớn dữ liệu phải xử
lí và gia tăng tốc độ nhận diện (khoảng 1 giây với tối đa là 30,000 khn mặt
được đăng kí). Theo kế hoạch công bố, sản phẩm được đưa ra thị trường vào
cuối năm 2018.



Trong nhóm dự án smart city của tập đồn Hitachi, Hitachi Kokusai Electric đã
tiết lộ hệ thống giám sát camera thế hệ mới có khả năng phát hiện khn mặt và
tìm kiếm với tốc độ cao – có khả năng xử lý 36 triệu khuôn mặt trong một giây
để tìm một khn mặt có trong cơ sở dữ liệu hay không. Công nghệ mới của
Hitachi ứng dụng thuật giải tìm kiếm và nhân diện khn mặt có khả năng xử
lý những ảnh khn mặt có độ lệch lên tới 30o quay theo chiều dọc và chiều
ngang của máy ảnh.

2.2. Các nghiên cứu liên quan trong nước
Tại Việt Nam, qua thống kê tóm tắt tại Bảng 1 và 2, cho thấy tầm quan trọng của
Trí tuệ nhân tạo đã được nhận thức rõ nét tại các đơn vị đào tạo và các doanh nghiệp.
Việc nhận thức tầm quan trọng xuất phát từ sự phát triển và ứng dụng hiệu quả Trí tuệ
nhân tạo của thế giới cũng như nhu cầu thực tế và cấp thiết của xã hội Việt Nam. Điển
hình trong năm 2018, Trường Đại Học Bách Khoa, ĐHQG Tp. Hồ Chí Minh nhận đặt

4

/>
11


hàng ứng dụng Trí tuệ nhân tạo trong giám sát an ninh và trật tự công cộng trên địa bàn

Quận. Đầu năm 2019, hệ thống đã được triển khai thí điểm thành công tại Công An
Phường 11, Quận 10. Tương tự đầu năm 2019, Trung tâm Kỹ thuật Điện toán nhận đặt
hàng từ UBND Phường 1 Tp. Vĩnh Long về việc ứng dụng Trí tuệ nhân tạo trong cơng
tác giám sát an ninh và trật tự công cộng, định hướng ứng dụng cho tồn Thành phố
Vĩnh Long. Từ đó đến nay, hệ thống đã được ứng dụng nhiều địa phương khác như:
-

Sở TT&TT Tây Ninh từ tháng 8/2019

-

UBND Tp. Hà Tiên từ tháng 04/2020

-

ĐH Bách Khoa – ĐHQG Tp. Hồ Chí Minh từ 7/2020

-


Ngồi ra, theo thơng tin truyền thơng thì vào năm 2016, sản phẩm Workforce

Management của FPT Telecom đã ứng dụng nhận diện khuôn mặt để điểm danh, chấm
công, triển khai sử dụng cho hơn 13 trung tâm phịng ban với hơn 2000 nhân viên của
cơng ty, bằng cách sử dụng học sâu trích xuất đặc trưng của khuôn mặt trong ảnh 2D cụ
thể là haar-like features và so sánh, nhận dạng.
Bên cạnh đó, nhiều cơng ty khởi nghiệp về nhận diện khuôn mặt cũng vừa ra đời
trong những năm gần đây. EyeQ là một trong số đó. Với công nghệ nền tảng là nhận
diện khuôn mặt, công ty này đã tích hợp tạo ra một vài sản phẩm về an ninh đang được
thử nghiệm như: phát hiện xâm nhập trái phép, dùng khn mặt để mở khóa xe trong

trong siêu thị, v.v… Tuy nhiên những sản phẩm của các cơng ty đều có chung đặc điểm
là chỉ giới thiệu tính năng, cịn về thuật giải sử dụng, độ chính xác của thuật giải, v.v…
thì khơng nói rõ. Vì vậy hiện tại cũng khó đánh giá được chất lượng của những sản phẩm
này.
Phần còn lại của báo cáo tổng hợp được trình bày như sau:
 Chương 1: Thơng tin chung – tóm tắt các thơng tin liên quan đề tài như mục
tiêu đề tài và sản phẩm của đề tài cần phải đạt được.
 Chương 2: Nội dung đề tài – trình bày nội dung mà nhóm đề tài đăng ký tỏng
trong thuyết mình và đã được thực hiện.

12


 Chương 3: Phương pháp nghiên cứu – chương này trình bày chi tiết các nghiên
cứu liên quan đến cơng nghệ nhận diện khn mặt mà nhóm đã ứng dụng vào
trong quá trình thực hiện đề tài.
 Chương 4: Hiện thực đề tài – chương này trình bày cách hiện thực từng phân
hệ phần mềm. Trong đó có nội dung phân tích hiệu năng của Lõi trí tuệ nhân
tạo được thử nghiệm tại Cổng KTX ĐH Bách Khoa.
 Chương 5: Triển khai đề tài – chương này tóm tắt quá trình triển khai đề tài, số
lượng camera tích hợp vào hệ thống để thử nghiệm kết quả đề tài.
 Chương 6: Kết luận và kiến nghị.
 Phụ lục 1: Phân tích thiết kế hệ thống phần mềm – trình bày các lược đồ UML
và lược đồ cơ sở dữ liệu.

13


CHƯƠNG I: THƠNG TIN CHUNG
1. Thơng tin về dự án

Tên dự án: “Ứng dụng cơng nghệ trí tuệ nhân tạo trong bài toán giám sát an ninh
tại Trung tâm dịch vụ Ký túc xá Bách Khoa -Trường Đại học Bách Khoa, ĐHQG TP.
Hồ Chí Minh”.
Thời gian thực hiện: 24 tháng từ 11/2019 đến 10/2021.
Kinh phí thực hiện: 2.644.000.000 đồng.
Nguồn kinh phí: ngân sách nhà nước
Cơ quan chủ đầu tư: Sở Khoa học và Cơng nghệ Tp. Hồ Chí Minh.
˗

Địa chỉ: 244 Điện Biên Phủ, Phường 7, Quận 3, Thành phố Hồ Chí Minh

˗

Số điện thoại: 028 3932 7831

Cơ quan phối hợp thực hiện chính
˗

Tên tổ chức phối hợp:Trung tâm dịch vụ Ký túc xá Bách Khoa -Trường Đại
học Bách Khoa, ĐHQG TP. Hồ Chí Minh.

˗

Địa chỉ: 497 Hồ Hảo, P. 7, Q. 10, Tp. HCM

˗

Giám đốc: ThS. Trần Tấn Phúc

˗


Điện thoại: 028.39573946

Cơ quan chủ trì
˗

Tên tổ chức chủ trì dự án: Trung Tâm Kỹ Thuật Điện Toán, Trường Đại học
Bách Khoa, ĐHQG TP.HCM.

˗

Điện thoại: (08) 3864 7256 – 5371, Fax: (08) 3865 8687

˗

Website:

˗

Địa chỉ: 105 A5, 268 Lý Thường Kiệt, P. 14, Q. 10, Tp. HCM

˗

Họ và tên thủ trưởng tổ chức: PGS. TS. Thoại Nam

˗

Số tài khoản: 3878969

˗


Kho bạc nhà nước/Ngân hàng: Ngân hàng Á Châu (ACB) Chi nhánh Phú Thọ
- Tp. HCM.

14


Chủ nhiệm đề tài
˗

Họ và tên: TS. Dương Ngọc Hiếu

˗

Ngày, tháng, năm sinh: 30/12/1979, Giới tính: Nam.

˗

Học hàm, học vị/ Trình độ chun mơn: Tiến sĩ ngành khoa học máy tính, tốn
ứng dụng

˗

Chức danh khoa học: ...........................................

Chức vụ: Phó giám đốc

Trung Tâm Kỹ Thuật Điện Toán, Trường Đại học Bách Khoa, ĐHQG
TP.HCM
˗


Điện thoại: Tổ chức: (08) 3864 7256 – 5371, Mobile: 0918.497285

˗

Fax:(08) 3865 8687, E-mail:

˗

Tên tổ chức đang công tác: Trung tâm Kỹ thuật điện toán - Trường Đại học
Bách Khoa, ĐHQG TP.HCM.

˗

Địa chỉ tổ chức: 268 Lý Thường Kiệt, P. 14, Q. 10, Tp. HCM

˗

Địa chỉ nhà riêng: 856 Tạ Quang Bửu, P. 5, Q. 8, Tp. HCM

2. Mục tiêu đề tài
Mục tiêu tổng quát: Ứng dụng công nghệ trí tuệ nhân tạo trong bài tốn giám sát
an ninh tại Trung tâm dịch vụ Ký túc xá Bách Khoa -Trường Đại học Bách Khoa,
ĐHQG TP. Hồ Chí Minh, đáp ứng ba mức độ an ninh:
˗

Mức độ 1: Giám sát vào/ra cổng chính Ký túc xá bằng cơng nghệ nhận diện
khuôn mặt, kết hợp với giải pháp vào ra hiện tại (dùng công nghệ RFID). Cảnh
báo đối tượng sử dụng thẻ không phải chủ thể thẻ.


˗

Mức độ 2: Giám sát người không phải sinh viên, cán bộ vào khu vực ở của
sinh viên (ví dụ nhân viên căn tin).

˗

Mức độ 3: Giám sát tình hình sinh viên nam vào khu vực nữ và ngược lại.

Mục tiêu cụ thể
Mục tiêu 1: Khảo sát hiện trạng ứng dụng công nghệ thông tin trong quản lý tại
Trung tâm dịch vụ Ký túc xá Bách Khoa -Trường ĐH Bách Khoa, ĐHQG-HCM và hiện
trạng lắp đặt camera. Từ đó đánh giá khả năng triển khai đề tài giám sát an ninh thông
qua hệ thống camera sử dụng kỹ thuật trí tuệ nhân tạo.
15


Mục tiêu 2: Nghiên cứu giải pháp quản lý video - VMS (Video Management
System).
Mục tiêu 3: Nghiên cứu các phương pháp học sâu phát hiện khuôn mặt trong
video và nhận diện đối tượng thông qua ảnh khuôn mặt phát hiện được; cũng như phát
hiện đối tượng và xác định giới tính của đối tượng trong video.
Mục tiêu 4: Thực hiện lấy mẫu dữ liệu và huấn luyện các mơ hình học sâu được
lựa chọn.
Mục tiêu 5: Xây dựng hệ thống phần mềm đáp ứng yêu cầu giám sát an ninh tại
Ký túc xá Trường ĐH Bách Khoa - ĐHQG-HCM được theo ba mức độ:
˗

Mức độ 1: Giám sát vào/ra cổng chính ký túc xá bằng cơng nghệ nhận diện
khn mặt, kết hợp với giải pháp vào ra hiện tại (dùng công nghệ RFID). Cảnh

báo đối tượng sử dụng thẻ không phải chủ thể thẻ.

˗

Mức độ 2: Giám sát người không phải sinh viên, cán bộ vào khu vực ở của
sinh viên (ví dụ nhân viên căn tin).

˗

Mức độ 3: Giám sát tình hình sinh viên nam vào khu vực nữ và ngược lại.
Giám sát đối tượng nam và khu vực nữ và ngược lại (trong trường hợp không
định danh được khuôn mặt đối tượng).

Lưu ý ba mức độ ở đây ám chỉ phạm vi giám sát an ninh, đó là: 1) Mức độ 1: an
ninh vào khuôn viên KTX; 2) Mức độ 2: phạm vi khu vực lưu trú của sinh viên và 3)
Mức độ 3: an ninh giữa khu lưu trú của sinh viên nam và nữ.
3. Sản phẩm đầu ra
a) Dạng II
TT

Tên sản phẩm

1

Phần mềm vào
cổng kết hợp cơng
nghệ RFID và trí
tuệ nhân tạo

u cầu khoa học cần đạt


Tiêu chí sản phẩm

Nâng cấp phần mềm vào cổng, bổ Phần mềm đảm bảo độ chính
sung hai tính năng:
xác hơn 90% trong thí
- Tính năng lấy mẫu ảnh sinh viên. nghiệm và 85% trong vận
- Tính năng phát hiện sử dụng thẻ hành thực tế. Việc đánh giá
trong thí nghiệm dựa trên tập
RFID không đúng chủ thể.
dữ liệu mẫu thu thập được từ
dữ liệu sinh viên lưu trú. Việc
đánh giá vận hành thực tế sẽ
16


căn cứ trên % cảnh báo
đúng/sai khi đưa phần mềm
vào vận hành. Thời gian đánh
giá độ chính xác trong vận
hành thực tế ít nhất 30 ngày.
2

Phần mềm quản lý Giải pháp quản lý video VMS dựa - Đảm bảo kết nối đồng thời
video VMS
trên cơng nghệ mã nguồn mở đảm
ít nhất 50 camera đối với
bảo ít nhất 03 tính năng quan trong
kết nối mạng nội bộ.
sau:

- Đảm bảo hoạt động liên
tục 24/7 trong trường hợp
- Tích hợp được các camera cần sử
hạ tầng máy chủ đảm bảo.
dụng cho mục tiêu giám sát an
Thời gian đánh giá độ ổn
ninh theo chuẩn RTSP hoặc
định ít nhất 30 ngày.
HTTP.
- Hỗ trợ chức năng streaming
server.
- Cho phép truy xuất dữ liệu video
playback khi phát hiện hành vi vi
phạm an ninh.

3

5

Lõi nhận diện Ứng dụng cơng nghệ học sâu trong - Độ chính xác của mơ hình
khn mặt bằng nhận diện khn mặt và nhận diện
nhận diện khn mặt chính
thuật giải học sâu giới tính đối tượng bao gồm ba tính
xác hơn 90% trong thí
năng chính:
nghiệm và hơn 85% trong
thực tế vận hành. Việc
- Phát hiện được khn mặt trong
đánh giá trong thí nghiệm
khung hình (ảnh hoặc video).

dựa trên tập dữ liệu mẫu
- Nhận diện được khuôn mặt của
thu thập được từ dữ liệu
đối tượng trong cơ sở dữ liệu ảnh
sinh viên lưu trú. Việc
bao gồm ảnh sinh viên và ảnh 24
đánh giá vận hành thực tế
cán bộ đang công tác tại KTX.
sẽ căn cứ trên % cảnh báo
- Phát hiện đối tượng là nam hay
đúng/sai khi đưa phần
nữ.
mềm vào vận hành. Thời
gian đánh giá độ chính xác
trong vận hành thực tế ít
nhất 30 ngày.
- Được huấn luyện đầy đủ
trên tập dữ liệu mẫu
Trillionpair5 và dữ liệu thu
thập tại KTX.
- Khả năng phân loại
nam/nữ hơn 90%. Phương
pháp đánh giá cũng tương

/>
17


tự khi đánh giá mơ hình
nhận diện khn mặt.

4

Phần mềm giám - Phần mềm đáp ứng được nhu cầu - Phần mềm đáp ứng yêu
sát an ninh 3 mức
cầu sử dụng và được xác
thực tế tại Trung tâm dịch vụ Ký
độ
nhận bằng văn bản của đại
túc xá Bách Khoa-Trường ĐH
diện KTX ĐH Bách Khoa
Bách Khoa, ĐHQG-HCM, bao
– là đơn vị sử dụng và đánh
gồm các tính năng sau:
giá.
- Quản lý danh sách camera bao
Phần mềm được đưa vào
gồm thông số camera, luồng
sử dụng ít nhất 03 tháng
camera, cấu hình mục đích sử
trước khi nghiệm thu để
dụng camera – phục vụ bài tốn
đơn vị sử dụng có cơ sở
an ninh ba mức độ.
đánh giá chất lượng và tính
- Giám sát vào ra cổng cửa, cảnh
ổn định của phần mềm.
báo sinh viên mượn thẻ vào/ra
của người khác. Tính năng này - Hồn thành đăng ký giải
pháp hữu ích.
được tích hợp vào phần mềm vào

cổng dùng công nghệ RFID.
- Giám sát người không phải là
sinh viên hoặc cán bộ vào khu
vực ở của sinh viên.
- Giám sát tình hình sinh viên nam
vào khu vực nữ và ngược lại, sử
dụng kỹ thuật nhận diện khn
mặt.
- Giám sát tình hình đối tượng
nam vào khu vực nữ và ngược lại
sử dụng kỹ thuật phát hiện giới
tính đối tượng xuất hiện trong
khung hình camera.
- Phát hiện đối tượng thuộc danh
sách đen (black list). Ví dụ sinh
viên vi phạm qui chế KTX
nghiêm trọng (đánh nhau, trộm
cắp, …) và khơng được phép lưu
trú, thì đánh dấu thuộc danh sách
đen.
- Phát hiện đối tượng thuộc danh
sách trắng (white list). Ví dụ
những trường hợp cán bộ về hưu,
ghé lại thăm KTX thì thuộc danh
sách trắng, khơng phải người lạ.
- Khi phát hiện sự cố, lưu lại hình
ảnh, video playback để làm minh
chứng.
18



×