Tải bản đầy đủ (.pdf) (100 trang)

Hcmute điều khiển mô hình bãi giữ xe thông minh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (7.52 MB, 100 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH

CƠNG TRÌNH NGHIÊN CỨU KHOA HỌC CỦA SINH VIÊN

ĐIỀU KHIỂN MƠ HÌNH BÃI GIỮ XE THÔNG MINH
S

K

C

0

0

3

9

5

9

MÃ SỐ: SV2021 - 126
CHỦ NHIỆM ĐỀ TÀI: NGUYỄN MINH NHẬT

S KC 0 0 7 6 4 7

Tp. Hồ Chí Minh, tháng 10/2021



Luan van


BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐH SƯ PHẠM KỸ THUẬT TPHCM
Khoa Đào Tạo Chất Lượng Cao

BÁO CÁO TỔNG KẾT
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CỦA SINH VIÊN
Đề tài

ĐIỀU KHIỂN MƠ HÌNH BÃI GIỮ XE THƠNG MINH
SV2021-126

Thuộc nhóm ngành khoa học:

SV thực hiện: Nguyễn Minh Nhật

Giới tính: Nam

Dân tộc: Kinh
Lớp, khoa: Khoa Đào Tạo Chất Lượng Cao

Năm thứ: 4 / Số năm đào tạo: 4

Ngành học: Công nghệ kỹ thuật điều khiển và tự động hoá
Người hướng dẫn: Trưởng ngành CNKT điều khiển và tự động hoá
– Ths. Nguyễn Trần Minh Nguyệt


Thành Phố Hồ Chí Minh, tháng 10 năm 2021

2

Luan van


LỜI CẢM ƠN
Lời đầu tiên, nhóm chúng em xin được gởi lời cảm ơn chân thành nhất đến cô Nguyễn
Trần Minh Nguyệt là giáo viên hướng dẫn cho chúng em trong đề tài này. Chúng em rất
biết ơn cô đã dành thời gian chỉ bảo và giúp đỡ chúng em trong thời gian hồn thành đề
tài này, mặc dù cơng việc của cô rất nhiều, đặc biệt là trong mùa dịch.
Kế đến, nhóm chúng em cũng xin chân thành cảm ơn các thầy cô, cán bộ công nhân
viên chức của trường Đại Học Sư Phạm Kỹ Thuật Thành phố Hồ Chí Minh nói chung
và các thầy cơ trong Khoa Đào Tạo Chất Lượng Cao nói riêng đã tạo mọi điều kiện và
hỗ trợ chúng em trong quá trình học tập và thực hiện đề tài nghiên cứu khoa học này.
Cuối cùng nhưng không kém phần quan trọng, chúng em xin dành sự biết ơn sâu sắc
đến gia đình, mọi người đã, đang và sẽ mãi là chỗ dựa vững chắc cho chúng em về mặt
vật chất cũng như tinh thần. Với những kiến thức cũng như điều kiện thuận lợi mà mọi
người đã mang đến, chúng em xin hứa sẽ cố gắng hết sức để phát triển đất nước và
xã hội mai này.

3

Luan van


MỤC LỤC
LỜI CẢM ƠN ................................................................................................................3

MỤC LỤC ......................................................................................................................4
DANH MỤC BẢNG BIỂU ...........................................................................................6
DANH MỤC NHỮNG TỪ VIẾT TẮT ......................................................................10
THÔNG TIN KẾT QUẢ NGHIÊN CỨU CỦA ĐỀ TÀI .........................................11
A. PHẦN MỞ ĐẦU .....................................................................................................13
1. Lý do chọn đề tài ..................................................................................................13
3. Mục tiêu đề tài ......................................................................................................14
4. Giới hạn đề tài ......................................................................................................15
5. Phương pháp nghiên cứu......................................................................................15
B. PHẦN NỘI DUNG ..................................................................................................18
Chương 1: Cơ sở lý thuyết ........................................................................................18
1.1. Tổng quát xử lý ảnh ......................................................................................18
1.1.1. Không gian màu ....................................................................................18
1.1.2. Tạo ảnh xám .........................................................................................21
1.1.3. Cân bằng biểu đồ ..................................................................................22
1.1.4. Phép phân ngưỡng ................................................................................23
1.1.5. Lọc mịn ảnh ..........................................................................................26
1.1.6. Phép cắt biên .........................................................................................28
1.1.7. Phép nối đường bao ..............................................................................34
1.2. Nhận diện biển số .........................................................................................35
1.2.1. Phát hiện biển số ...................................................................................35
1.2.1.1. Phát hiện biển số sử dụng các thuật toán xử lý ảnh ......................36
1.2.1.2. Phát hiện biển số sử dụng mạng thần kinh YOLO .......................37
1.2.2. Trích xuất ký tự.....................................................................................39
1.2.3. Nhận diện ký tự.....................................................................................39
1.3. Nhận diện khuôn mặt ....................................................................................40
1.3.1. Định nghĩa Haar Cascade .....................................................................40
1.3.2. Lựa chọn đặc trưng Haar ......................................................................41
1.3.3. Tạo ảnh tích hợp ...................................................................................41
1.3.4. Bộ phân loại AdaBoost .........................................................................42

1.3.5. Phân loại Cascade .................................................................................44
1.4. Kết cấu bãi giữ xe .........................................................................................45
1.5. Thẻ từ ............................................................................................................47
1.5.1. Giới thiệu chung ...................................................................................47

4

Luan van


1.5.1.1. Sơ lược về công nghệ RFID .........................................................47
1.5.1.2. Các thành phần của hệ thống RFID ..............................................48
1.5.2. Hoạt động của hệ thống RFID ..............................................................49
1.5.2.1. Nguyên lý hoạt động .....................................................................49
1.5.2.2. Các dải tần số trong RFID ............................................................49
1.5.3. Ứng dụng công nghệ RFID ở Việt Nam và thế giới.............................51
1.5.3.1. Việt Nam .......................................................................................51
1.5.3.2. Thế giới .........................................................................................51
1.5.4. Công nghệ BARCODE và RFID ..........................................................51
1.6. Module RFID RC522 ...................................................................................52
1.6.1. Sơ lược các giao thức truyền dữ liệu của RFID ...................................52
1.6.1.1. I2C ................................................................................................52
1.6.1.2. SPI .................................................................................................52
1.6.1.3. UART............................................................................................53
1.6.2. Hoạt động của Module..........................................................................53
1.6.3. Vùng dữ liệu .........................................................................................54
CHƯƠNG 2: PHẦN CỨNG .....................................................................................57
2.1. Thanh ghi dịch 74HC595 .............................................................................57
2.2. Thanh ghi dịch MBI5026 .............................................................................58
2.3. Cảm biến siêu âm HC-SR04 .........................................................................59

2.4. MODULE RFID MFRC522: ........................................................................62
2.4.1. Thơng số chính .....................................................................................62
2.4.2. Module RFID và Arduino .....................................................................63
Chương 3: Kết quả nghiên cứu, áp dụng thực tiễn và những điều cần lưu ý ..........65
3.1. Phần nhận diện biển số .................................................................................65
3.1.1. Giai đoạn 1: Phân tách biển số .............................................................65
3.1.2. Giai đoạn 2: Trích xuất ký tự ................................................................77
3.1.3. Giai đoạn 3: Nhận diện ký tự ................................................................79
3.2. Nhận diện khuôn mặt ....................................................................................83
3.2.1. Khởi tạo dữ liệu học có giám sát: .........................................................83
3.2.2. Tiến hành chạy thử ...............................................................................85
3.2.3. Kết quả và đánh giá ..............................................................................86
C. KẾT LUẬN VÀ PHƯƠNG HƯỚNG PHÁT TRIỂN .........................................88
TÀI LIỆU THAM KHẢO...........................................................................................89
PHỤ LỤC .....................................................................................................................90
MINH CHỨNG SẢN PHẨM ĐỀ TÀI: BÀI BÁO KHOA HỌC ............................98
POSTER .......................................................................................................................99

5

Luan van


DANH MỤC BẢNG BIỂU
Hình 1: So sánh các mức của xử lý ảnh ........................................................................18
Hình 2: Minh họa hệ màu RGB .....................................................................................19
Hình 3: Mơ hình Netscape Color Cube hiển thị qua kênh xanh dương ........................19
Hình 4: Vùng màu trong hệ HSV ...................................................................................20
Hình 5: Phép chuyển đổi ảnh xám ................................................................................21
Hình 6: Kết quả phép cân bằng biểu đồ xám ................................................................23

Hình 7: Các phương pháp lấy ngưỡng cơ bản ..............................................................24
Hình 8: Hoạt động của phép phân ngưỡng thích nghi ..................................................25
Hình 9: Phép chập ma trận ảnh ....................................................................................26
Hình 10: Các loại biên thường gặp ...............................................................................28
Hình 11: Phép lọc Robert Cross Gradient ....................................................................30
Hình 12: Phép lọc Sobel ................................................................................................30
Hình 13: Phép lọc Laplacian ........................................................................................31
Hình 14: Các biến thể của phép lọc Laplacian .............................................................31
Hình 15: Phép nén .........................................................................................................32
Hình 16: Phép tìm biên Canny với điểm cực đại cục bộ ...............................................33
Hình 17: Kết quả các phép cắt biên ..............................................................................33
Hình 18: Phép tìm đường bao trên ảnh được xử lý cắt biên Canny .............................34
Hình 19: Kết quả phép tìm đường bao ..........................................................................35
Hình 20: Quy trình xử lý ảnh chứa biển số ...................................................................35
Hình 21: Đặc điểm về màu sắc chữ và nền biển số ......................................................36
Hình 22: Đặc điểm về kích thước biển số .....................................................................37
Hình 23: Cấu trúc mạng YOLO.....................................................................................37
Hình 24: Q trình nhận diện của mơ hình YOLO .......................................................38
Hình 25: Mơ tả trực quan thuật tốn SVM....................................................................40
Hình 26: Cửa sổ phát hiện bao quanh ..........................................................................41
Hình 27: Bốn mảng tham chiếu .....................................................................................42
Hình 28: Phân loại yếu để nhận dạng khn mặt .........................................................43
Hình 29: Sự kết hợp của trình phân loại yếu ................................................................44
Hình 30: Quá trình phân loại Cascade .........................................................................44
Hình 31: Hướng đi vào bãi xe .......................................................................................45

6

Luan van



Hình 32: Hướng ra khỏi bãi xe .....................................................................................46
Hình 33: Sơ đồ một tầng bãi giữ xe với góc nhìn từ trên xuống ...................................46
Hình 34: Ảnh dựng 3D mơ tả bên trong bãi giữ xe .......................................................47
Hình 35: Phần cứng của hệ thống RFID.......................................................................48
Hình 36: Nguyên lý hoạt động của hệ thống RFID .......................................................49
Hình 37: Giao thức UART .............................................................................................53
Hình 38: Sơ đồ khối Module RC552 .............................................................................53
Hình 39: Hoạt động chi tiết của MODULE RC552 ......................................................54
Hình 40: Vùng dữ liệu ...................................................................................................55
Hình 41: Khối Sector Trailer ........................................................................................55
Hình 42: Các lệnh điều khiển ........................................................................................56
Hình 43. Sơ đồ chân 74HC595 ......................................................................................57
Hình 44: Sơ đồ chân của MBI5026 ...............................................................................58
Hình 45: Cơng thức tính quảng đường của cảm biến siêu âm ......................................60
Hình 46: Nguyên lý hoạt động các xung của HC-SR40 ................................................61
Hình 47: Sơ đồ kết nối chân giữa Arduino và cảm biến HC-SR04 ...............................61
Hình 48: Module RC552 ...............................................................................................62
Hình 49: Lưu đồ quá trình đọc thẻ ................................................................................63
Hình 50: Sơ đồ kết nối ...................................................................................................64
Hình 51: Lưu đồ quá trình phân tách biển số bằng các phương pháp xử lý ảnh .........65
Hình 52: Kết quả chuyển ảnh xám cho phân tách biển số ............................................66
Hình 53: Kết quả lọc ảnh cho phân tách biển số ..........................................................67
Hình 54: Kết quả phân ngưỡng ảnh cho phân tách biển số ..........................................67
Hình 55: Kết quả xác định vị trí biển số .......................................................................68
Hình 56: Kết quả phân tách biển số ..............................................................................68
Hình 57: Trường hợp nhiễu sáng ngồi trời .................................................................69
Hình 58: Lưu đồ q trình phân tách biển số sử dụng mơ hình YOLO ........................70
Hình 59: Chương trình gắn nhãn ảnh Labelimg ...........................................................71
Hình 60: Dữ liệu nhãn cho YOLO .................................................................................71

Hình 61: Đường bao vật thể YOLO...............................................................................72
Hình 62: Cấu trúc mạng YOLO thực tế.........................................................................73
Hình 63: Cấu hình Google Colab .................................................................................74

7

Luan van


Hình 64: Những thơng số của q trình huấn luyện .....................................................74
Hình 65: Kết quả huấn luyện mơ hình...........................................................................75
Hình 66: Kết quả phân tách với biển số dài ..................................................................76
Hình 67: Kết quả phân tách với biển số vng .............................................................76
Hình 68: Sơ đồ giải thuật q trình trích xuất kích tự ..................................................77
Hình 69: Kết quả chuyển ảnh xám cho trích xuất ký tự ................................................77
Hình 70: Kết quả phân ngưỡng cho trích xuất ký tự .....................................................77
Hình 71: Kết quả lọc nhiễu cho trích xuất ký tự ...........................................................78
Hình 72: Kết quả phân đoạn ký tự ................................................................................78
Hình 73: Quy trình huấn luyện SVM .............................................................................79
Hình 74: Thư mục ký tự gốc ..........................................................................................80
Hình 75: Thư mục ký tự huấn luyện ..............................................................................80
Hình 76: Thơng số huấn luyện SVM..............................................................................80
Hình 77: Tập tin dữ liệu huấn luyện .............................................................................81
Hình 78: Kết quả nhận diện ký tự trên biển số dài .......................................................81
Hình 79: Kết quả nhận diện ký tự trên biển số vng ...................................................82
Hình 80: Lưu đồ cho việc khởi tạo dữ liệu ....................................................................83
Hình 81: Các hình ảnh đã được thành dạng ma trận số. ..............................................84
Hình 82: Trước và sau khi đã đánh nhãn ......................................................................84
Hình 83: Lưu đồ nhận diện khn mặt ..........................................................................85
Hình 84: Nhận dạng vị trí gương mặt ...........................................................................86

Hình 85: Điều kiện đầy đủ độ sáng ...............................................................................86
Hình 86: Điều kiện thiếu sáng .......................................................................................87

Bảng 1: Dải tần số thấp trong RFID (Low Frequency) ................................................49
Bảng 2: Dải tần số cao trong RFID (High Frequency) ................................................50
Bảng 3: Dải tần số cực cao trong RFID (Ultra High Frequency) ................................50
Bảng 4: Bảng so sánh công nghệ BARCODE và RFID ................................................51
Bảng 5: Sơ đồ chân 74HC295 .......................................................................................57
Bảng 6: Bảng trạng thái của 74HC295 .........................................................................58
Bảng 7: Sơ đồ chân của MBI5026.................................................................................59

8

Luan van


Bảng 8: Bảng trạng thái MBI5026 ................................................................................59
Bảng 9: Thông số kỉ thuật của cảm biến siêu âm HC-SR04 .........................................60
Bảng 10: Sơ đồ chân cảm biến siêu âm HC-SR04 ........................................................60
Bảng 11: Bảng kết nối chân Arduino và Module RC522 ..............................................64

9

Luan van


DANH MỤC NHỮNG TỪ VIẾT TẮT
RGB = Red, Green, Blue: Kênh màu hình thành từ lớp màu đỏ, xanh lá, và xanh dương
LAB = Lightness, Channel A, Channel B: Kênh màu hình thành từ 3 lớp: Lớp cường
độ sáng, lớp màu từ đỏ đến xanh lá, lớp màu từ vàng đến xanh dương.

HSV = Hue, Saturation, Value: Kênh màu hình thành từ 3 lớp: Lớp màu sắc, lớp bão
hòa màu, và lớp cường độ sáng
HIS = Hue, Intensity, Saturation: Giống HSV
HSB = Hue, Saturation, Brightness: Giống HSV
HSL = Hue, Saturation, Lightness: Giống HSV
YOLO = You Only Look Once: Mơ hình mạng thần kinh nhân tạo được ứng dụng trong
việc nhận diện vật thể với tốc độ nhanh và độ chính xác cao.
SVM = Support Vector Machine: Thuật toán
SDA = Serial Data Line
SCL = Serial Clock Line
SSD = Single Shot MultiBox Detector: Mạng thần kinh nhân tạo tích hợp q trình phát
hiện và phân loại vật thể trong cùng 1 mạng.
R-CNN = Region Based Convolutional Neural Networks: Mạng thần kinh nhân tạo xác
định vùng đặc trưng dựa trên mơ hình CNN.
Faster R-CNN = Faster Region Based Convolutional Neural Networks: Phiên bản RCNN được cải thiện về tốc độ xử lý, ứng dụng cho nhận diện thời gian thực.
WPOD = Wrapped Planer Object Detection: Mơ hình nhận diện vật thể kết hợp xoay
ảnh về góc nhìn trực diện.
UID = Unique Identification:

10

Luan van


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐH SƯ PHẠM KỸ THUẬT TPHCM

THÔNG TIN KẾT QUẢ NGHIÊN CỨU CỦA ĐỀ TÀI
1. Thơng tin chung:
- Tên đề tài: Điều Khiển Mơ Hình Bãi Giữ Xe Thông Minh

- Chủ nhiệm đề tài: Nguyễn Minh Nhật
- Lớp: 18151CLA1

Mã số SV: 18151099

Khoa: Đào Tạo Chất Lượng Cao

- Thành viên đề tài:
Stt

Họ và tên

MSSV

Lớp

Khoa

1

Bùi Hồng Thơng

18151039 18151CLA1 Đào Tạo Chất Lượng Cao

2

Phạm Tuấn Quang Huy

18151011 18151CLA1 Đào Tạo Chất Lượng Cao


3

Nguyễn Quốc Bảo Long

18151018 18151CLA1 Đào Tạo Chất Lượng Cao

4

Phan Sử Đăng Khoa

18151013 18151CLA2 Đào Tạo Chất Lượng Cao

- Người hướng dẫn: Ths. Nguyễn Trần Minh Nguyệt
2. Mục tiêu đề tài:
- Thiết kế và thi công mơ hình bãi giữ xe tự động với tổng thời gian xử lý ngắn, độ
chính xác cao, mang lại tiện ích cho người gửi.
3. Tính mới và sáng tạo:
- Thiết kế mơ hình bãi giữ xe tự động, hạn chế số lượng nhân viên.
4. Kết quả nghiên cứu:
- Giải thuật nhận diện biển số xe Việt Nam.
- Giải thuật nhận diện khn mặt.
- Mã hóa thơng tin người dùng qua thẻ từ và lưu trữ trong bộ nhớ.

11

Luan van


5. Đóng góp về mặt giáo dục và đào tạo, kinh tế - xã hội, an ninh, quốc phòng và
khả năng áp dụng của đề tài:

- Về mặt giáo dục: Đưa ra phương án kết hợp các thuật toán kinh điển với sinh viên
nhằm ứng dụng trong thực tế.
- Về mặt kinh tế: Đưa ra các phương án lựa chọn việc xây dựng hệ thống thơng minh
cho bãi giữ xe.
Tính ứng dụng của đề tài: Mơ hình có thể được áp dụng với các bãi giữ xe đã được
xây dựng trước nhưng chưa có các tính năng về camera giám sát, nhận diện thay thế
nhân viên bảo vệ.
6. Công bố khoa học của SV từ kết quả nghiên cứu của đề tài:

Ngày

tháng

năm

SV chịu trách nhiệm chính
thực hiện đề tài
(kí, họ và tên)

12

Luan van


A. PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Trong cuộc sống phát triển hiện nay, công nghệ kỹ thuật ngày càng phát triển, đặc
biệt lĩnh vực học máy và trí tuệ nhân tạo đã cung cấp cho loài người những tiện ích đáng
kinh ngạc trên các lĩnh vực như giáo dục, kinh tế, khoa học, quốc phòng, an ninh, và
nhiều lĩnh vực khác. Từ những điều gần gũi thân thuộc với con người như thuật toán thu

thập hành vi người dùng để đưa ra những lựa chọn hợp lý của các nền tảng thương mại
điện tử, thuật tốn tìm kiếm để đưa ra kết quả phù hợp nhất với từ khóa người dùng đưa
ra, cho đến các chương trình dự đoán quỹ đạo bay của các hành tinh, dự đoán thiên tai
như động đất, núi lửa phun trào,... những thuật toán này đang giúp con người biến những
điều tưởng chừng bất khả thi trở nên hợp lý hơn bao giờ hết. Bên cạnh đó, việc cơng
nghệ máy móc hay các sản phẩm tự động hóa được nghiên cứu phát triển để ngày càng
trở nên hồn thiện, nguồn lao động chính trên thế giới hàng ngàn năm nay là con người
đã và đang dần bị thay thế với một tốc độ chóng mặt bởi các cỗ máy mạnh mẽ. Ở các
nước tiên tiến như Nhật Bản hay Hoa Kỳ, trong các khâu sản xuất và lắp ráp, nơi tính
bền bỉ, khơng biết mệt, tốc độ xử lý với độ chính xác đáng kinh ngạc của những bộ máy
tân tiến hoàn toàn đánh bật loài người về năng suất lao động cũng như chất lượng sản
phẩm. Trở lại với Việt Nam, tuy đất nước chúng ta là một trong những nước có nguồn
nhân lực dồi dào, có trí tuệ, có khả năng ứng biến và thích nghi với những cơng nghệ
mới và đặc biệt còn nhận được sự hỗ trợ từ các quốc gia bằng hữu về mặt giáo dục bằng
các suất học bổng hay kinh tế bằng việc xây dựng chi nhánh của các công ty đa quốc
gia, nhưng chúng ta dường như chưa thể áp dụng công nghệ vào đời sống thường ngày
một cách hiệu quả và hợp lý, tiêu biểu như việc lãng phí nguồn nhân lực có sức khỏe
trong việc làm nhân viên soát vé cho bãi giữ xe.
Nhận thấy hiện thực rằng các hệ thống quản lý và điều khiển thông minh nên được
áp dụng vào hầu hết các mặt trong cuộc sống, cũng như ý thức được vấn đề về tốc độ
gia tăng số lượng phương tiện cá nhân trong nước, nhóm quyết định thiết kế mơ hình
điều khiển bãi giữ xe thơng minh lắp đặt trong bãi giữ xe của công ty, bệnh viện, chung
cư,…

13

Luan van


2. Tầm quan trọng của đề tài:

Ngày nay, dân số lồi người đang tăng theo tốc độ chóng mặt. Bất chấp cố gắng của
các quốc gia trong việc thiết đặt các giới hạn về số lượng con cái mà một cặp vợ chồng
được phép hạ sinh và nuôi dưỡng, tỉ lệ gia tăng dân số tự nhiên của thế giới vẫn đang ở
mức 1.05% (dữ liệu được lấy vào năm 2020). Việt Nam là một trong những đất nước
phải gánh chịu ảnh hưởng từ việc dân số tăng nhanh, có thể nhận thấy việc này biểu hiện
ở số lượng phương tiện cá nhân dày đặc và tình trạng ùn tắc giao thông trong giờ cao
điểm. Việc gia tăng phương tiện cá nhân, vơ hình chung tạo nên sức ép cho các bãi giữ
xe trong trung tâm thành phố, nơi có nhiều phương tiện ra vào trong giờ cao điểm. Việc
có một hệ thống điều khiển bãi giữ xe giúp tăng tốc độ ra vào của các xe, giúp gia giảm
nhân cơng, tránh các yếu tố con người gây thất thốt, thu phí minh bạch, tiết kiệm thời
gian, tránh ùn tắc xe, và tăng tính bảo mật cho việc giữ xe với camera giám sát, tự động
nhận diện và lưu trữ dữ liệu về khuôn mặt người gửi cũng như dữ liệu biển số. Bên cạnh
những thiết bị chính như camera, thiết bị xử lý, đầu đọc thẻ từ, mơ hình điều khiển bãi
giữ xe có sử dụng những thiết bị phụ trợ như barrier tự động đóng mở, gờ giảm tốc,
hàng rào,… Đây là mơ hình ứng dụng những thành tựu của ngành cơng nghệ thơng tin,
tự động hóa và viễn thơng vào cuộc sống. Qua mơ hình này, các sinh viên ứng dụng
được những kiến thức được học trên trường và biết cách kết hợp những thành tựu khoa
học lại với nhau theo đúng quy trình kỹ thuật.
3. Mục tiêu đề tài
Với đề tài, nhóm đặt mục tiêu xây dựng mơ hình bãi giữ xe thơng minh với những
tính năng thơng minh và tự động như kiểm sốt xe ra vào bằng nhận diện biển số, nhận
diện khuôn mặt và mã hóa các thơng tin trên bằng thẻ từ. Đồng thời, đề tài được mong
đợi sẽ đưa ra các giải pháp giúp tối ưu hoá việc ra/vào của các xe một cách nhanh nhất
và hiệu quả nhất có thể. Với chi phí trong mức cho phép, nhóm nghiên cứu tập trung
vào bãi giữ xe cho xe hơi vì sẽ giảm thiểu được số lượng camera và cảm biến cần sử
dụng.

14

Luan van



4. Giới hạn đề tài
Bãi giữ xe được thiết kế với hai tầng, giới hạn số xe cùng gởi trong bãi là 32.
Bãi giữ xe được thiết kế để nhận diện biển số ơ tơ. Vì vậy, các mơ hình được huấn
luyện sẽ gặp khó khăn nếu được áp dụng cho việc nhận diện biển số xe máy.
Bãi giữ xe chỉ được lắp đặt một camera cho đường xe ra và một camera cho đường
xe vào. Tính năng camera giám sát cho các xe trong bãi tạm thời được bỏ qua do điều
kiện về kinh tế cũng như quy mô đề tài.
Kết quả đầu ra của đề tài được dự kiến ứng dụng cho mơ hình nhỏ và vừa. Vì thế,
các thiết bị được sử dụng trong mơ hình như cảm biến, module đọc thẻ từ là những thiết
bị điện tử có giá trị kinh tế tuy khơng cao nhưng lại phù hợp với nhu cầu nghiên cứu của
sinh viên.
Để duy trì tốc độ ra/vào của xe ở mức hợp lý, phù hợp với điều kiện nghiên cứu và
khả năng của nhóm, thời gian xử lý cho một pha ra hoặc vào gồm các bước nhận diện
khuôn mặt, nhận diện biển số và đối chiếu thơng tin được mã hóa trên thẻ từ được phép
rơi vào khoảng dưới 5 giây.
5. Phương pháp nghiên cứu
Trong quá trình triển khai đề tài, nhóm ứng dụng phương pháp nghiên cứu phân
tích và tổng hợp lý thuyết. Cụ thể, nhóm chia đề tài thành các phần nhỏ hơn như nhận
diện biển số, nhận diện gương mặt, lưu trữ dữ liệu bằng thẻ từ và đọc thông tin về số
lượng xe hiện tại trong bãi cũng như vị trí gửi xe nào đang trống bằng cảm biến. Sau
đó, các phần này lại được chia nhỏ nếu có thể. Ví dụ, phần nhận diện biển số được
chia nhỏ thành các phần phân tách biển số, trích xuất ký tự và nhận diện ký tự. Bằng
việc này, việc nghiên cứu của nhóm diễn ra một cách có chọn lọc, có lộ trình rõ ràng
và giảm thiểu số lượng tài liệu cần nghiên cứu
Bên cạnh đó, nhóm ứng dụng việc tìm hiểu trước về các mơ hình bãi giữ xe trên thế
giới và ưu nhược điểm của từng loại. Từ đó, nhóm trích lọc được những yếu tố cần
thiết cũng như không cần thiết cho sản phẩm của bản thân.


15

Luan van


6. Phương tiện nghiên cứu
Trong đề tài này, nhóm tập trung sử dụng các thuật toán được cài đặt sẵn trong thư
viện OpenCV (Open Source Computer Vision Library). Đây là thư viện được nghiên
cứu bởi Intel từ 1999 và được sử dụng rộng rãi cho cả mục đích học thuât cũng như
thương mại dựa vào khả năng ứng dụng cao trong các lĩnh vực thị giác máy tính
(Computer Vision) và Học Máy (Machine Learning).
Kết hợp với thư viện OpenCV, nhóm sử dụng ngơn ngữ lập trình Python. Tuy được
xem như một ngơn ngữ lập trình bậc cao dễ đọc, dễ nhớ và dễ hiểu với mã nguồn mở
cùng cộng đồng người dùng đa dạng, Python không hề tỏ ra kém cạnh trong các công
nghệ dẫn đầu trong lĩnh vực nghiên cứu hiện nay như xe tự hành, robotic, xử lý hình
ảnh đường phố, xử lý hình ảnh trong y sinh, dựng mơ hình 3D từ tập hợp ảnh 2D,…
Việc tham khảo tài liệu được thực hiện với cả tài liệu tiếng Anh lẫn tài liệu tiếng
Việt, đặc biệt với những tài liệu liên quan đến mơ hình bãi giữ xe thơng minh
Những ý tưởng khơng được hiện thực hóa thì sẽ mãi là ý tưởng. Vì thế, nhóm chọn
việc mơ hình hóa bãi xe bằng cách sử dụng phần mềm Blender để vẽ mô phỏng 3D lại
bãi giữ xe thông minh. Từ đó, nhóm thu nhận được một cái nhìn tổng quan về cách hoạt
động của mơ hình điều khiển bãi giữ xe, cũng như những điều cần lưu ý trước khi xây
dựng mơ hình thực tế.
Vấn đề bảo mật cho bãi giữ xe được nhóm triển khai nghiên cứu trên các phương
tiện như khóa thẻ từ hay mã vạch. Sau khi tìm hiểu, nhóm quyết định chọn phương pháp
sử dụng thẻ từ dựa trên nguyên lý hoạt động tuy khá đơn giản nhưng lại bảo mật an ninh
vô cùng cao. Mỗi khi người dùng muốn mở cửa ra vào thì chỉ cần đưa thẻ từ lên ơ quẹt
thẻ thì đầu đọc sẽ tự chạy dữ liệu phân tích để bắt đầu nhận diện, nếu dùng đúng thẻ từ
thanh chắn sẽ tự động mở ra dựa trên có hệ thống anten thu phát sóng vơ tuyến liên kết
giữa thẻ và thiết bị đọc thẻ RFID hoặc MF. Việc lưu trữ, bảo vệ thông tin người ra vào

bãi giữ xe khá là quan trọng. Việc dùng thẻ từ sẽ khiến cho khách hàng khó có thể làm
mất thẻ cũng như giữ thẻ không bị gãy khi va chạm.
Để chuẩn bị cho q trình thực hiện phương pháp gán nhãn tồn phần và mơ hình
phân lớp SVM, nhóm đưa ra và thử nghiệm 2 phương pháp phân tách biển số dựa trên

16

Luan van


khả năng và yêu cầu lắp đặt. Phương án 1, nhóm sử dụng các phép xử lý ảnh, từ các
phép xử lý cơ bản như xám hóa ảnh, lọc mịn ảnh cho đến các phép xử lý cấp cao hơn
như phân ngưỡng tự động, đóng mở ảnh dựa trên các phép hình thái học, cắt biên vật
thể và xác định đường bao cho vật thể. Tuy độ chính xác cũng như khả năng nhận diện
theo thời gian thực của mô hình khơng được đánh giá cao, đây vẫn là một phương án an
toàn với yêu cầu thấp về phần cứng, độ chính xác có thể được cải thiện đáng kể bằng
việc chọn lựa góc quay tốt và cố định, góc quay được đề xuất sẽ là góc chụp mặt trước
của xe giúp hạn chế vấn đề về khoảng cách chụp gây ra bởi chiều dài xe, cũng như lắp
đặt camera có bộ phận lọc nhiễu sáng. Phương án 2, nhóm sử dụng mạng thần kinh nhân
tạo mang lại khả năng xử lý chính xác, độ hiệu quả cao và đáp ứng nhanh cho công việc
nhận diện theo thời gian thực. Tuy nhiên, phương án này đòi hỏi việc lắp đặt phần cứng
có cấu hình cao, đặc biệt là card màn hình có dung lượng đủ lớn để xử lý song song các
tác vụ trên ảnh và video như lưu trữ dữ liệu về khn mặt, huấn luyện mơ hình nhận
diện các khuôn mặt mới.

17

Luan van



B. PHẦN NỘI DUNG
Chương 1: Cơ sở lý thuyết
1.1. Tổng quát xử lý ảnh
Trong lĩnh vực thị giác máy tính, nhóm kiến thức sau về cấu tạo ảnh cũng như tiền
xử lý ảnh là vô cùng quan trọng để phát triển thuật tốn. Trong đó, các phép tốn được
chia thành từng cấp độ, từ việc cơ bản như lọc nhiễu, làm sắc nét, cân bằng sáng cho
đến việc phân đoạn ảnh giúp nắm bắt được cái bên ngoài, cái vỏ bọc của vật thể, và cuối
cùng là nắm bắt được cái bên trong, phần nội dùng của vật thể.

Hình 1: So sánh các mức của xử lý ảnh
1.1.1. Không gian màu
Đối với phương pháp xử lý ảnh, người lập trình cần có kiến thức về các thành phần
cơ bản cấu thành điểm ảnh cũng như không gian màu – được hiểu như một cách số hóa
màu sắc. Như ta đã biết, hình ảnh mà các thiết bị kỹ thuật số hiển thị cho chúng ta thấy
được là do sự kết hợp giữa các kênh màu. Trong đó, chúng ta khơng thể không kể đến
một hệ màu thông dụng là RGB (Red, Green, và Blue) với mỗi kênh màu có cường độ
từ 0 bit đến 8 bit (giá trị từ 0 đến 255) tạo thành một ma trận 3 chiều. Hình 1 cho thấy
một bức ảnh màu được cấu tạo từ 3 ma trận 5x5 tương ứng với màu đỏ, màu xanh lá, và
màu xanh dương.
Sự kết hợp này tạo ra độ đa dạng cho màu sắc trong kỹ thuật số khi một điểm ảnh sẽ
mang dải giá trị từ 0 đến 2563-1 ứng với 16.777.216 màu có thể hiển thị. Tuy nhiên,
không phải lúc nào sự đa dạng cũng mang đến tính tiện lợi cho con người. Đối với các
màn hình bị giới hạn về độ sâu của màu sắc, chúng chỉ có thể hiển thị 216 màu RGB
tương ứng với 6 giá trị màu cho mỗi kênh theo hệ thập lục phân: #00, #33, #66, #99,

18

Luan van



#CC, và #FF. Hình 2 bên dưới trình bày cách kết hợp màu sắc giữa kênh xanh dương
với kênh đỏ (trục tung) và kênh xanh lá (trục hồnh) theo mơ hình Netscape Color Cube.

Hình 2: Minh họa hệ màu RGB

Hình 3: Mơ hình Netscape Color Cube hiển thị qua kênh xanh dương

19

Luan van


Tuy nhiên, với sự phát triển vượt bậc về công nghệ hiển thị, giờ đây việc hiển thị
đầy đủ giá trị màu của kênh RGB với 24 bit mỗi điểm ảnh (24bpp) khơng cịn là vấn đề
q lớn. Thậm chí, các màn hình với cơng nghệ tiên tiến hiện nay có thể hiển thị với độ
sâu lên đến 48bpp (16bit mỗi kênh), mang đến khả năng hiển thị hơn 68 tỷ màu.
Thế nhưng, hệ màu RGB khơng đóng vai trị quá trọng tâm trong các bài toán về thị
giác máy tính, ngay cả với các bài tốn có liên quan đến việc nhận diện vật thể dựa trên
màu sắc. Việc này đến từ tính phức tạp trong cách tính tốn cũng như việc hệ RGB chú
trọng việc diễn đạt màu sắc kỹ thuật số cho con người, điều này thiếu sự đồng nhất và
bị ảnh hưởng bởi những thứ không thể điều khiển như cấu trúc vật thể hay ánh sáng.
Cùng một bức ảnh với hệ màu RGB, hình ảnh con người nhìn thấy đơi khi lại rất khác
so với thứ mà các bộ vi xử lý có khả năng nhìn thấy và hiểu được.
Thay vào đó, một số hệ màu khác có cấu tạo tách biệt phần ánh sáng và được định
nghĩa gần gũi hơn với thường thức của con người sẽ được sử dụng, tiêu biểu là các hệ
màu như LAB, HSV, YCbCr,... Lấy ví dụ, màu sắc trong hệ HSV có thể được nhận biết
qua “hình 4”.

Hình 4: Vùng màu trong hệ HSV
Trục hoành tương ứng với giá trị H-Hue–Màu sắc. Khi Hue tăng dần từ 0 đến 180,

màu sắc hiển thị sẽ tương ứng với sự giảm dần của bước sóng từ màu đỏ cho đến màu
tím.
Vùng (1) trong “hình 4” (phía trên trục hồnh) là khu vực mà giá trị S-Saturation Bão hòa chưa đạt ngưỡng tối đa. Độ bão hòa đặc trưng cho độ đậm nhạt của màu sắc, S
càng thấp sẽ cho ra màu sắc càng nhạt và ngược lại. Vùng (2) trong “hình 4” (phía dưới

20

Luan van


trục hồnh) là khu vực mà giá trị bão hịa đã đạt ngưỡng, màu sắc không thay đổi khi
chúng ta tiếp tục tăng giá trị bão hịa.
Trong hình, con số V-Value–Giá trị (vì khơng được chuẩn hóa nên đơi khi cịn được
gọi là I-Intensity-Độ sâu, L-Lightness-Độ sáng hay B-Brightness-Độ chói tạo thành hệ
màu HIS hay HSB với cùng ý nghĩa). Trong hình trên, giá trị ln được đặt ở mức
ngưỡng là 255 tại mọi điểm để mang lại cái nhìn chân thực nhất về màu sắc, nếu giá trị
quá thấp, màu sắc sẽ hoàn toàn bị phủ đen. Một cách hiểu khác, giá trị là sự kết hợp giữa
màu sắc với màu trắng, khi được thay đổi, giá trị càng thấp thì ảnh hiển thị ra càng tối.
Ngồi tính dễ hiểu, việc tách biệt các giá trị về màu sắc, sắc độ cũng như cường độ
sáng còn mang lại lợi ích trong các thuật toán tiền xử lý ảnh. Lấy ví dụ, trong phép cân
bằng biểu đồ, nếu khơng tách biệt màu sắc khỏi cường độ sáng, việc cân bằng sẽ mang
lại kết quả rất khác so với mong đợi. Một ví dụ thực tế khác, trong việc nhận diện biển
báo giao thơng, điều kiện ánh sáng như chói sáng hoặc nhiễu đổ bóng dễ làm phần mềm
khơng nhận diện được các biển báo do phần cạnh cần thiết để nhận diện bị chìm trong
nhiễu. Như vậy, việc tách biệt bóng hay các phần ảnh bị chói sẽ gia tăng độ chính xác
và tính hiệu quả của mơ hình nhận diện liên quan đến màu sắc.
1.1.2. Tạo ảnh xám
Đây là một trong những phương pháp được sử dụng phổ biến trong quá trình tiền xử
lý. Tương tự với giá trị Brightness, Lightness, hay Value trong các hệ màu HSB, HSL,
hay HSV, giá trị của hệ màu xám trình bày đặc điểm về cường độ sáng của điểm ảnh..

Giá trị của các điểm ảnh trong hệ màu xám được xác định từ 0 (màu đen) đến 255 (màu
trắng), từ 1 đến 254 là các sắc độ từ xám đậm đến xám nhạt. “Hình 5” minh họa quá
trình chuyển đổi từ ảnh màu sang ảnh xám.

Hình 5: Phép chuyển đổi ảnh xám

21

Luan van


Như chúng ta thấy, phép chuyển đổi từ ảnh màu sang ảnh xám giữ nguyên tính chất
ảnh về các cấu trúc, chiều sâu, và ánh sáng, trừ yếu tố màu sắc. Việc chuyển đổi hình
ảnh thành hệ màu xám để sử dụng trong quá trình xử lý giúp giảm dùng lượng bộ nhớ
và tăng tốc độ xử lý của hệ thống một cách đáng kể do ảnh xám chỉ yêu cầu 8 bits dữ
liệu cho mỗi điểm ảnh thay vì ít nhất 24 bits như trong các hệ màu khác (lưu ý rằng với
mỗi điểm ảnh RGB, hệ thống luôn cấp đủ 24 bits cho dù tất cả các giá trị của hệ màu là
0). Vì vậy, phần lớn các thuật toán xử lý ảnh đều yêu cầu ảnh đầu vào là một ảnh xám
vì chúng giúp đơn giản hóa thuật tốn cũng như giảm số lượng phép tính cần phải thực
hiện, nhờ đó bộ nhớ máy tính có thể lưu trữ nhiều dữ liệu hơn, khả năng xử lý đa nhiệm
cũng được cải thiện một cách đáng kể.
Nói đến phép tính chuyển đổi ảnh màu thành ảnh xám, như được đề cập trong bài
báo khoa học của Christopher Kanan và Garrison W. Cottrell trên tập san PLOS One,
có ít nhất 13 cách chuyển đổi ảnh màu thành ảnh xám, lựa chọn dựa trên yêu cầu về việc
loại bỏ nhiễu sáng. Tuy nhiên, trong bài báo cáo này, nhóm chỉ sử dụng phép chuyển
đổi Luminance. Đây là phép toán được sử dụng trong các mã nguồn xử lý ảnh phổ biến
như OpenCV và MATLAB. Trong đó, giá trị xám của điểm ảnh khi chuyển đổi từ ảnh
màu hệ RGB sang ảnh xám là:
𝐺𝐿𝑢𝑚𝑖𝑛𝑎𝑛𝑐𝑒 = 0.3𝑅 + 0.59𝐺 + 0.11𝐵 (1)
Công thức (1) cũng chỉ ra khả năng nhận diện màu sắc về khía cạnh sinh lý của con

người: nhạy cảm nhất với ánh sáng xanh lá, ít hơn là màu đỏ, và ít nhất là màu xanh
dương.
1.1.3. Cân bằng biểu đồ
Bước cân bằng biểu đồ được ứng dụng để lọc bớt nhiễu sáng trong ảnh. Trong phép
cân bằng biểu đồ, những thông số sau cần được xác định cho việc tính tốn:
𝑟𝑘 : mức xám của điểm ảnh.
𝑛𝑘 : số lần xuất hiện của điểm ảnh có giá trị 𝑟𝑘 trong ảnh.
𝑝𝑟 =

𝑛𝑘
𝑀𝑁

: tỉ lệ xuất hiện của điểm ảnh có giá trị 𝑟𝑘 trong ảnh, với MN là tích chiều

dài và chiều rộng của ảnh.

22

Luan van


𝑠𝑘 : giá trị xác suất mật độ của từng cường độ sáng trong ảnh
Giá trị 𝑠𝑘 được tính tốn bằng công thức sau:
𝑠𝑘 = (𝐿 − 1) ∑𝑘𝑗=0 𝑝𝑟 (𝑟𝑗 ) (2)
Với 𝐿 là giá trị cao nhất của mức xám trong ảnh (2𝑠ố 𝑏𝑖𝑡 ả𝑛ℎ − 1) và 𝑘 ∈ [0, 𝐿 − 1]
Sau khi tính tốn, giá trị 𝑠𝑘 được làm tròn để gán vào giá trị các điểm ảnh. Hình 6
minh họa sự khác biệt về biểu đồ xám giữa hình được cân bằng biểu đồ và hình chưa
qua xử lý.

Hình 6: Kết quả phép cân bằng biểu đồ xám

Với ảnh chưa được cân bằng biểu đồ xám, cường độ các điểm ảnh chỉ nằm ở một
phía biểu đồ, hoặc nằm giữa biểu đồ. Sau bước cân bằng, cường độ các điểm ảnh được
san bằng xuyên suốt biểu đồ, mang lại độ tương phản cao cho ảnh.
1.1.4. Phép phân ngưỡng
Phép phân ngưỡng được sử dụng để chuyển đổi ảnh đa cấp xám (mỗi điểm ảnh có
giá trị cường độ xám từ 0 đến 255) thành ảnh nhị phân (mỗi điểm ảnh chỉ mang giá trị
0 hoặc 255). Việc phân ngưỡng được ứng dụng nhiều trong các bài toán về phát hiện vật
thể, phân lớp, và giúp tăng tốc các bài toán liên quan đến vùng ảnh. Đối với một ảnh
xám, nếu độ đậm G của điểm ảnh lớn hơn giá trị ngưỡng đặt trước, điểm ảnh sẽ được
gán một giá trị ở đầu ra của phép phân ngưỡng. Trường hợp độ đậm G của điểm ảnh
nhỏ hơn hoặc bằng giá trị ngưỡng, điểm ảnh sẽ được gán một giá trị khác. Các giá trị

23

Luan van


đầu ra được quyết định dựa trên sự lựa chọn về phương pháp phân ngưỡng. Một số
phương pháp phân ngưỡng cơ bản có thể được kể đến như:
- Phân ngưỡng nhị phân: Nếu G lớn hơn ngưỡng, điểm ảnh được gán giá trị 255
(hoặc giá trị bất kỳ được đặt trước), ngược lại, điểm ảnh được gán giá trị là 0.
- Phân ngưỡng nhị phân đảo: Nếu G lớn hơn ngưỡng, điểm ảnh được gán giá trị 0.
Ngược lại, điểm ảnh được gán giá trị là 255 (hoặc giá trị bất kỳ đặt trước).
- Phân ngưỡng cụt (Ngưỡng Truncate): Nếu G lớn hơn ngưỡng, điểm ảnh được gán
với giá trị ngưỡng. Ngược lại, giá trị điểm ảnh không thay đổi.
- Phân ngưỡng Về-không (Ngưỡng Tozero): Nếu G lớn hơn ngưỡng, giá trị điểm ảnh
không thay đổi. Ngược lại, điểm ảnh được gán giá trị 0.
- Phân ngưỡng Về-không đảo (Ngưỡng Tozero Inverted): Nếu G lớn hơn ngưỡng,
điểm ảnh được gán giá trị 0. Ngược lại, giá trị điểm ảnh không thay đổi.
Hình dưới minh họa kết quả của 5 phép phân ngưỡng cơ bản:


Hình 7: Các phương pháp lấy ngưỡng cơ bản

24

Luan van


Các phép phân ngưỡng cơ bản còn được gọi là phép phân ngưỡng tồn cục vì giá trị
ngưỡng được áp dụng lên tất cả điểm ảnh. Tuy dễ dàng để hiểu và sử dụng, các phép
phân ngưỡng này thường có hiệu năng không quá nổi bật với các ảnh đầu vào không
được tiền xử lý đủ tốt để loại bỏ nhiễu, đặc biệt là nhiễu sáng. Trong những trường hợp
này, tính tồn cục sẽ gây khó khăn cho việc lựa chọn giá trị cũng như loại phân ngưỡng,
giá trị ngưỡng áp dụng tại điểm A là hợp lý, trong khi giá này lại quá thấp khi áp dụng
tại điểm B bị nhiễu sáng.
Để giải quyết vấn đề này, phép phân ngưỡng thích nghi (Adaptive Threshold) sẽ
được ưu tiên lựa chọn để thực hiện cơng việc nhị phân hóa hình ảnh. Phép phân ngưỡng
thích nghi chia ảnh thành các vùng nhỏ và đặt giá trị ngưỡng trên các vùng đó thay vì
tồn bộ ảnh. Có hai phương pháp chọn ngưỡng cho từng vùng trong phép phân ngưỡng
thích nghi, lần lượt là:
- Phân ngưỡng thích nghi theo giá trị trung bình: Trong cách này, giá trị ngưỡng của
một vùng được chọn dựa trên việc tính tốn giá trị trung bình của các vùng xung quanh,
và lấy kết quả phép tính trừ đi giá trị ngưỡng C đặt trước.
- Phân ngưỡng thích nghi theo trọng số Gaussian: Trong cách này, giá trị ngưỡng
của một vùng được chọn dựa trên việc nhân giá trị của các vùng xung quanh với trọng
số Gauss, và lấy kết quả phép tính trừ đi giá trị ngưỡng C đặt trước.
“Hình 8” so sánh phép phân ngưỡng tồn cục với hai phép phân ngưỡng thích nghi.

Hình 8: Hoạt động của phép phân ngưỡng thích nghi


25

Luan van


×