Tải bản đầy đủ (.pdf) (136 trang)

Nghiên cứu phát triển một số thuật toán phát hiện và phân loại phương tiện từ dữ liệu video giao thông

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.24 MB, 136 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ QUỐC PHÒNG

VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ

NGUYỄN VĂN CĂN

NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT
TOÁN PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG TIỆN
TỪ DỮ LIỆU VIDEO GIAO THÔNG

LUẬN ÁN TIẾN SĨ TOÁN HỌC

HÀ NỘI, NĂM 2015


BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ QUỐC PHÒNG
VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ

NGUYỄN VĂN CĂN

NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT
TOÁN PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG TIỆN
TỪ DỮ LIỆU VIDEO GIAO THÔNG

Chuyên ngành: CƠ SỞ TOÁN HỌC CHO TIN HỌC
Mã số: 62 46 01 10

LUẬN ÁN TIẾN SĨ TOÁN HỌC



NGƯỜI HƯỚNG DẪN KHOA HỌC
1. PGS. TS. NGUYỄN ĐỨC HIẾU
Học viện Kỹ thuật Quân sự
2. TS. PHẠM VIỆT TRUNG
Cục Công nghệ thông tin – Bộ Quốc phòng
HÀ NỘI, NĂM 2015


LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Những
nội dung, số liệu và kết quả trình bày trong luận án là hoàn toàn trung thực
và chưa có tác giả nào công bố trong bất cứ một công trình nào khác.
Tác giả luận án

Nguyễn Văn Căn


LỜI CẢM ƠN

Trước hết tôi xin bày tỏ lòng biết ơn chân thành của tôi với tập thể giáo
viên hướng dẫn của tôi, PGS. TS Nguyễn Đức Hiếu, Giám đốc Trung tâm Công
nghệ thông tin, Học viện Kỹ thuật Quân sự Việt Nam; TS. Phạm Việt Trung,
Phó cục trưởng Cục Công nghệ thông tin - Bộ Quốc phòng trực tiếp hướng dẫn
cho tôi thông qua sự tiến bộ nghiên cứu.
Tôi muốn cảm ơn tất cả các giảng viên mà tôi đã có vinh dự được cùng
làm việc hoặc tham gia các khóa học trong quá trình làm nghiên cứu sinh. Cảm
ơn các thầy giáo, cô giáo Viện Công nghệ thông tin, phòng Quản lý đào tạo sau
đại học thuộc Viện Khoa học và Công nghệ quân sự - Bộ quốc phòng.

Tôi muốn đặc biệt cảm ơn PGS. TS Ngô Quốc Tạo, TS. Nguyễn Đức
Dũng, phòng Nhận dạng và Xử lý tri thức, thuộc Viện Công nghệ thông tin,
Viện hàn lâm Khoa học Việt Nam; cảm ơn các đồng nghiệp công tác tại Trường
Đại học Kỹ thuật – Hậu cần Công an nhân dân đã có những bàn luận, thảo luận
hữu ích, cài đặt thử nghiệm trong công việc nghiên cứu của tôi.
Cuối cùng, tôi dành luận án này cho gia đình tôi và bạn bè của tôi. Nếu
không có sự hỗ trợ của họ đầy đủ, tôi sẽ không có can đảm để đi qua tất cả
những khó khăn trong việc nghiên cứu.


i

MỤC LỤC

DANH MỤC CÁC KÝ HIỆU ................................................................................................... iii
DANH MỤC CHỮ VIẾT TẮT ................................................................................................. iv
DANH MỤC CÁC BẢNG ......................................................................................................... v
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ................................................................................... vi

MỞ ĐẦU ............................................................................................................... 1
Chương 1. TỔNG QUAN VỀ PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG
TIỆN GIAO THÔNG TỪ VIDEO ........................................................................ 8
1.1. Cơ sở lý thuyết và những khái niệm cơ bản ........................................... 8
1.1.1. Dữ liệu video số ............................................................................... 8
1.1.2. Mô-men bất biến ............................................................................ 12
1.1.3. Hình dạng và Khối đối tượng chuyển động ................................... 13
1.1.4. Đường viền đối tượng .................................................................... 13
1.1.5. Nền và đối tượng chuyển động ...................................................... 21
1.1.6. Entropy của khối ............................................................................ 22
1.1.7. Biểu diễn hình dạng đối tượng theo vector khoảng cách .............. 25

1.2. Một số phương pháp và công trình nghiên cứu liên quan .................... 29

1.2.1. Hệ thống điều khiển giao thông và giám sát an ninh ..................... 30
1.2.2. Hệ thống phát hiện và phân loại xe dựa trên video ....................... 32
1.2.3. Hệ thống giám sát giao thông dựa trên độ dài ............................... 34
1.2.4. Hệ thống giám sát tích hợp phát hiện, theo dõi, phân loại ............ 36
1.2.5. Phát hiện đối tượng ........................................................................ 38
1.2.6. Phân loại đối tượng ........................................................................ 41
1.3. Hướng tiếp cận của luận án .................................................................. 45
1.3.1. Sơ đồ khái quát hướng tiếp cận xử lý bài toán .............................. 45
1.3.2. Xác định vùng quan tâm và nhiệm vụ của luận án ........................ 47
1.4. Kết luận chương 1 ................................................................................. 49
Chương 2. PHÁT HIỆN ĐỐI TƯỢNG CHUYỂN ĐỘNG TỪ VIDEO DỰA
TRÊN MÔ HÌNH GAUSS HỖN HỢP THÍCH NGHI VỚI THAY ĐỔI
ÁNH SÁNG ........................................................................................................ 51
2.1. Một số thuật toán phát hiện chuyển động ............................................. 51
2.1.1. Thuật toán trừ nền cơ bản .............................................................. 51
2.1.2. Thuật toán trừ nền trung bình: ....................................................... 53
2.1.3. Thuật toán Σ-Δ: .............................................................................. 54
2.1.4. Thuật toán Σ-Δ cải tiến: ................................................................. 56


ii

2.1.5. Thuật toán thống kê khác biệt cơ bản ............................................ 58
2.1.6. Mô hình Gauss hỗn hợp ................................................................. 61
2.1.7. Đánh giá các thuật toán trừ nền thông qua một số phép đo ........... 66
2.2. Mô hình và thuật toán đề nghị .............................................................. 72
2.2.1. Mô hình GMM đề nghị .................................................................. 72
2.2.2. Thuật toán trích chọn khối chuyển động (EMB) ........................... 77

2.3. Phương pháp đếm phương tiện giao thông áp dụng mô hình GMM
thích nghi thay đổi ánh sáng kết hợp luồng quang học ............................... 78
2.3.1. Sơ đồ khối tổng quát ...................................................................... 79
2.3.2. Thuật toán phát hiện và gán nhãn cho khối (SLBBI) .................... 82
2.3.3. Thuật toán trích chọn luồng quang học (EBOF) ........................... 83
2.3.4. Kết quả thực nghiệm. ..................................................................... 86
2.4. Kết luận chương 2................................................................................. 91
Chương 3. PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG TỪ VIDEO
DỰA TRÊN ĐẶC TRƯNG HÌNH DẠNG ........................................................ 93
3.1. Phân đoạn khối phương tiện dựa trên kích thước ................................. 93
3.1.1. Phân tích kích thước phương tiện .................................................. 93
3.1.2. Thuật toán phân loại theo kích thước ............................................ 95
3.2. Phân loại phương tiện bằng kết hợp kích thước ảnh và hình chiếu
hình dạng khối phương tiện ......................................................................... 98

3.2.1. Ý tưởng phương pháp .................................................................... 99
3.2.2. Giai đoạn chuẩn bị CSDL ............................................................ 100
3.2.3. Thuật toán phân loại dựa trên độ dài và hình chiếu đối tượng .... 101
3.3. Phân loại phương tiện dựa trên đường viền biểu diễn bằng số phức . 103
3.3.1. Sơ đồ khái quát............................................................................. 104
3.3.2. Xấp xỉ độ dài đường viền và thuật toán Douglas Peucker........... 104
3.3.3. Thuật toán CCAVC...................................................................... 107
3.3.4. Kết quả thực nghiệm: ................................................................... 111
3.4. Kết luận chương 3 ............................................................................... 114
PHẦN KẾT LUẬN ........................................................................................... 116
PHỤ LỤC .............................................................................................................. 1
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ ........................................ 118
TÀI LIỆU THAM KHẢO ................................................................................. 119



iii
DANH MỤC CÁC KÝ HIỆU
Ký hiệu

Ý nghĩa



Giá trị ngưỡng cho trước trong trừ nền

B(x,y)

Giá trị nền cố định tại điểm ảnh (x,y)

It(x,y)

Giá trị điểm ảnh tại điểm ảnh (x,y)

Dt(x,y)

Mặt nạ nhị phân của đối tượng tiền cảnh

α,,,

Hằng số tỷ lệ học cho trước

t(x,y)

Giá trị tuyệt đối của hiệu giá trị điểm ảnh trừ giá trị nền của điểm ảnh
(x,y) tại thời điểm t


Vt(x,y)

Giá trị điểm ảnh (x,y) của khung hình đang xét thời gian t

xy

Giá trị trung bình của các điểm ảnh tương ứng của tập hợp điểm ảnh
(x,y) theo các khung hình đang xét

xy

Trung bình độ lệch chuẩn của điểm ảnh (x,y)
Mô hình nền thích nghi biến đổi cosin rời rạc
Khoảng cách Ơclit giữa các mô hình nền thích nghi

P(Xt)
(Xt, , )

Xác suất quan sát của điểm ảnh tại thời điểm t
Hàm mật độ xác suất tại thời điểm t

i,t

Ma trận hiệp phương sai của phân bố Gauss thứ i tại thời gian t

i,t

Giá trị trung bình của các điểm ảnh tại thời điểm t
Biến nhận giá trị 1/0 thể hiện sự phù hợp mô hình của điểm ảnh mới


k,t

Hệ số cập nhật nền K mô hình tại thời điểm t

t

Hệ số biểu thị mức độ ánh sáng thay đổi

Et

Giá trị thông tin Entropy của điểm ảnh tại thời điểm t

D(t,t-1)
i
IL(x,y)

Hàm biểu diễn cường độ sáng
Hệ số lựa chọn sự thay đổi ánh sáng
Ảnh điểm ảnh (x,y) biểu diễn mức L trong mô hình kim tự tháp
Tập biểu diễn kết quả phát hiện đối tượng tại thời điểm t

i

Tính chất thứ i của mô-men bất biến



Hằng số xấp xỉ diện tích hai hình đa giác


Lrounded

Khoảng cách giữa các điểm cơ bản trên biên

D(si,c)

Khoảng cách giữa điểm mẫu và trọng tâm đa giác

SIM(D1,D2)

Độ đo tương tự giữa 2 đa giác D1 và D2.


iv
u

Chiều dài đối tượng tính xấp xỉ

v

Chiều rộng đối tượng tính xấp xỉ



Đường viền Vector



Vector cơ sở đường viền




Tích vô hướng giữa 2 đường viền

(m)
( )

Hàm tương quan giữa 2 đường viền m đỉnh
( )

{


v

DANH MỤC CÁC CHỮ VIẾT TẮT
Chữ viết tắt

Ý nghĩa

ACF

Hàm tự tương quan (Auto Correlation Function)

BMC

Thách thức mô hình trừ nền (Background Models Challenge)

BSM


Trừ nền (Background Subtraction Method)

BGS

Thư viện trừ nền (Background Subtraction Library)

CA

Phân tích đường viền (Contour Analys)

CSDL

Cơ sở dữ liệu (Database)

EV

Vector cơ sở (Elementary Vector)

FG

Tiền cảnh (Foreground)

GMM

Mô hình hỗn hợp Gauss (Gauss Mixture Model)

ICF

Hàm tương quan (Intercorrelation Function)


NSP

Tích vô hướng chuẩn hóa (Normalized Scalar Product)

ROI

Vùng quan tâm (Region of Interest)

TVH

Tích vô hướng

VC
VVDC

đường viền vector (Vector Contour)
Phát hiện và phân loại phương tiện dựa trên video (Video-based
Vehicle Detection and Classification)


vi

DANH MỤC CÁC BẢNG
Bảng 1.1. Phân loại các phương pháp mô hình nền ...................................................... 40
Bảng 1.2. Kết quả sử dụng độ dài đường biên hình chiếu ...........................................42
Bảng 2.1. Ưu điểm và nhược điểm các thuật toán BSM đã trình bày .......................... 64
Bảng 2.2. Hệ số đánh giá toàn cục các thuật toán BS trong tập dữ liệu BMC [36]. ....69
Bảng 2.3. Dữ liệu thực nghiệm..................................................................................... 87
Bảng 2.4. Phản ứng với mật độ xe trên các cung đường ..............................................90
Bảng 2.5. So sánh thời gian xử lý của thuật toán với mỗi khung hình ......................... 90

Bảng 3.1. Kết quả thực nghiệm thuật toán CVIL ......................................................... 98
Bảng 3.2. Bảng kết quả thực nghiệm thuật toán VCALOS .......................................103


vii
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1. Cấu trúc phân đoạn của video ............................................................... 8
Hình 1.2. Các biến đổi hình dáng đối tượng trong không gian 2D. .................... 12
Hình 1.3. Biểu diễn đường viền bằng vector số phức ......................................... 14
Hình 1.4. NSP trên đường viền vector ................................................................ 18
Hình 1.5. Biểu diễn đường viền và lược đồ xám ................................................ 21
Hình 1.6. Mô tả hình dạng hình tròn ................................................................... 26
Hình 1.7. Đa giác xấp xỉ đối tượng có n cạnh..................................................... 27
Hình 1.8. Điểm mẫu căng đều trên mỗi cạnh biên .............................................. 28
Hình 1.9. Kiến trúc tổng thể hệ thống CadProTMS ........................................... 31
Hình 1.10. Trạm nghiệp vụ xử lý phạt nguội vượt đèn đỏ ngã tư ...................... 32
Hình 1.11. Cấu trúc hệ thống phát hiện và phân loại xe dựa trên video ............. 33
Hình 1.12. Sơ đồ của hệ thống giám sát giao thông tự động .............................. 35
Hình 1.13. Cấu trúc hệ thống tích hợp phát hiện, phân loại, theo dõi đối tượng 36
Hình 1.14. Cấu trúc hệ thống phát hiện đối tượng chuyển động ........................ 37
Hình 1.15. Lược đồ khái quát phân loại đối tượng dựa trên hình chiếu ............. 38
Hình 1.16. Cấu trúc khái quát hệ thống nhận dạng đối tượng chuyển động ...... 46
Hình 1.17. Sơ đồ xác định vùng nghiên cứu ....................................................... 47
Hình 1.18. Hướng tiếp cận xử lý bài toán ........................................................... 49
Hình 2.1. Lược đồ khái quát thuật toán CCA-GMMOF ..................................... 80
Hình 2.2. Minh họa thuật toán gán nhãn cho khối .............................................. 83
Hình 2.3. Dữ liệu video quay trên đường quốc lộ 5, hướng Hải phòng - Hà Nội
............................................................................................................................. 88
Hình 2.4. Một số hình ảnh từ camera đưa vào thực nghiệm ............................... 89
Hình 2.5. Giao diện kết quả thực nghiệm của hệ thống ...................................... 89

Hình 3.1. Phân tích kích thước khối xe ô tô con ................................................. 93
Hình 3.2. Sơ đồ tổng quát phân giải theo độ dài ................................................. 95
Hình 3.3. Sơ đồ tổng quát phân loại theo hình dạng ........................................... 99
Hình 3.4. Sơ đồ khối tổng quát phân loại theo đường viền .............................. 104
Hình 3.5 Đơn giản hóa đường công theo thuật toán Douglas Peucker ............ 105
Hình 3.6. Xấp xỉ hóa đường viền ...................................................................... 106
Hình 3.7. Giao diện hệ thống thực nghiệm thuật toán CCAVC ....................... 111
Hình 3.8. Giao diện hệ thống thực nghiệm thuật toán CCAVC ....................... 112
Hình 3.9. Ví dụ về tập mẫu để so sánh ............................................................. 113
Hình 3.10. Ví dụ kết quả nhận dạng xe ô tô và xe máy .................................... 114


1
MỞ ĐẦU
Phần này giới thiệu bài toán phát hiện và phân loại phương tiện giao thông,
những vấn đề đặt ra cho bài toán để giải quyết vấn đề tăng độ chính xác với điều
kiện giao thông đông đúc và đa dạng ở Việt Nam. Tiếp theo, trình bày mục tiêu,
phạm vi, nội dung và phạm vi nghiên cứu của luận án. Cuối cùng là giới thiệu
cấu trúc của luận án.
1. Tính cấp thiết của vấn đề nghiên cứu
Giám sát và quản lý giao thông đã và đang được các nhà khoa học thế giới
và Việt Nam quan tâm nghiên cứu phát triển. Trong điều kiện giao thông Việt
Nam, từ các tuyến đường quốc lộ, đường cao tốc, đến giao thông đô thị, giao
thông nông thôn mật độ phương tiện rất dày đặc, đa dạng về chủng loại, trong đó
hai thành phần chính đó là ô tô và xe máy. Nếu mật độ xe dày đặc, tức là số
lượng xe trên một vùng quan sát là lớn, khi đó ảnh giao thông thu được tồn tại
các phương tiện trước sau, bên cạnh liên tiếp nhau, các phương tiện tạo thành
khối phương tiện, khi đó các đường viền có thể bị che khuất thì việc phân tích
đường viền các phương tiện để phát hiện, đếm, phân loại gặp rất nhiều khó
khăn.

Nhiều nghiên cứu trên thế giới và Việt Nam đã quan tâm đến vấn đề phát
hiện và phân loại phương tiện giao thông, tuy nhiên chưa có nghiên cứu đầy đủ
nào quan tâm đến mức độ dày đặc của phương tiện trên đường, cũng như quan
tâm đặc biệt đến phương tiện giao thông chủ yếu là xe máy và xe ô tô.
Việc lựa chọn phương pháp, thuật toán, hay phối kết hợp các thuật toán sử
dụng trong hệ thống giám sát tự động, cũng như cải tiến một số thông số kỹ
thuật trong thuật toán mang lại lợi ích cho việc phát hiện và phân loại phương
tiện giao thông trong bối cảnh Việt Nam là điều cần thiết có ý nghĩa cả về lý
thuyết và thực tiễn.
Bài toán phát hiện và phân loại phương tiện giao thông dựa trên video là
xét xem tại một thời điểm, trong vùng quan tâm, có những loại phương tiện gì,
số lượng tương ứng. Về ứng dụng, bài toán thuộc nhóm các ứng dụng liên quan


2
đến giao thông thông minh. Bài toán được ứng dụng nhiều trong lĩnh vực quản
lý giao thông, trong nhiều hoạt động an ninh, quốc phòng, kinh tế xã hội, như
cảnh báo trộm, cảnh báo cháy, giám sát bảo vệ các mục tiêu quan trọng, thu thập
các chứng cứ tại những tình huống nhạy cảm.
Yêu cầu cơ bản của bài toán phát hiện và phân loại giao thông là với dữ
liệu đầu vào là video giao thông, yêu cầu đầu ra là loại phương tiện tham gia
giao thông trong vùng quan sát (ô tô, xe máy và các phương tiện thô sơ khác).
Hướng tiếp cận giải quyết bài toán:
Thứ nhất, cần xem xét cấu trúc và phương pháp xử lý dữ liệu video. Cấu
trúc dữ liệu video được kết cấu từ tập các khung hình, tốc độ hiển thị các khung
hình trong một đơn vị thời gian (giây), mỗi khung hình là một ảnh tĩnh,...
Phương pháp xử lý dữ liệu video là việc xử lý lưu trữ, trích chọn khung hình,
phân đoạn, phân tích, trích chọn đặc trưng dựa trên cơ sở dữ liệu (CSDL) tri
thức có sẵn. Từ những tập dữ liệu video, qua quá trình xử lý, mang lại những
thông tin hữu ích theo mục đích yêu cầu của con người.

Thứ hai, cần xác định tập các đặc trưng riêng có của video giao thông. Các
đặc trưng của phương tiện chuyển động trong video được chia thành 2 mức tiếp
cận: mức cục bộ và mức toàn cục. Mức toàn cục quan tâm đến các đặc trưng
toàn cảnh như nền, đối tượng chuyển động, khối, đốm sáng. Mức cục bộ quan
tâm đến các vấn đề xử lý hình dạng, khoảng cách, đường biên,...
Đặc trưng tiếp cận ở mức toàn cục gồm:
 Vùng quan tâm (ROI), hướng quan sát, khoảng cách quan sát;
 Video và khung hình;
 Đối tượng chuyển động và nền (Moving Object and Background);
 Khối chuyển động (Block);
 Đốm sáng (Blob).
Đặc trưng ở mức toàn cục ảnh hưởng nhiều đến trích chọn đối tượng
chuyển động. ROI ảnh hưởng đến việc xét điểm bắt đầu và điểm kết thúc thời
điểm quan sát, hướng quay ảnh hưởng đến hình dạng đối tượng; Video ảnh


3
hưởng đến chất lượng hình ảnh, độ phân giải, tốc độ hình; Khung hình được
trích chọn từ video thành ảnh tĩnh để phân tích,...
Đặc trưng tiếp cận ở mức cục bộ gồm:
 Đối tượng chuyển động và bóng của nó (Moving Object, Shadow);
 Độ dài (Visual Length);
 Hình dạng đối tượng (Edge, Contour), hình dạng và đường viền;
 Mức xám khu vực đèn trước/sau xe;
 Mức xám và đặc điểm khu vực biển số xe, kính trước xe;
 Các đường biên ngang trên xe.
Đặc trưng ở mức cục bộ, đặc biệt là độ dài, hình dạng đối tượng, các đường
biên bên ngoài và bên trong phương tiện là những đặc trưng quan trọng trong
việc phân loại phương tiện. Sử dụng một đặc trưng, hoặc kết hợp 2 hay nhiều
đặc trưng và một số kỹ thuật liên quan để phân loại phương tiện là rất hiệu quả.

Yếu tố ảnh hưởng đến phương pháp tiếp cận:
Về màu sắc phương tiện thay đổi liên tục theo thời gian, thêm vào đó có
nhiều loại phương tiện có màu sắc tương đồng nhau, do vậy việc phân loại dựa
trên màu sắc là khó khăn và không mang lại kết quả.
Về hình dạng, các phương tiện có thể đi sát nhau trong khung hình quan
sát, hợp thành các khối và dẫn đến khó xác định được chính xác đó là phương
tiện gì bằng biện pháp thông thường. Đặc biệt trong điều kiện giao thông tại Việt
Nam, mật độ phương tiện di chuyển trên đường dày đặc về mật độ, đa dạng về
chủng loại thì việc phân loại càng khó khăn. Tuy nhiên hình dạng xe ô tô, hình
dạng xe máy, phương tiện thô sơ khác là một tập có thể xác định kể cả khi chúng
hợp khối.
Ngoài việc xác định tập đặc trưng của phương tiện chuyển động trong
video, để có thể nhận dạng, xác định mật độ phương tiện, cần xác định các yếu
tố, tình huống ảnh hưởng đến phương pháp xác định các tập thuộc tính liên quan
đến phương pháp tiếp cận phát hiện và phân loại phương tiện giao thông.
Tình huống liên quan đến chuyển động gồm:


4
 Đối tượng bắt đầu vào vùng quan sát;
 Đối tượng ra khỏi vùng quan sát;
 Đối tượng đang đi rồi dừng lại;
 Đối tượng đang dừng thì chuyển động;
 Nền động (dao động tự nhiên).
Tình huống liên quan đến khối chuyển động gồm:
 Các đối tượng di chuyển cạnh nhau tạo thành một khối đối tượng;
 Đối tượng đang di chuyển tách khối;
 Đối tượng đang di chuyển thì hợp khối.
Tình huống liên quan đến chất lượng ảnh gồm nhiều yếu tố liên quan,
nhưng chủ yếu là:

 Ánh sáng thay đổi;
 Điều kiện thời tiết.
2. Mục tiêu nghiên cứu của luận án
- Mục tiêu chung: Từ dữ liệu video thu được từ các đường quốc lộ, tìm một
số thuật toán hợp lý để phân loại và xác định phương tiện chuyển động.
- Mục tiêu cụ thể:
+ Lựa chọn và cải tiến phương pháp phát hiện phương tiện chuyển động
phù hợp với môi trường ngoài trời, chịu tác động nhiều của sự thay đổi ánh
sáng.
+ Trích chọn các đặc trưng của phương tiện chuyển động, phân tích và biểu
diễn đặc trưng phù hợp để đề xuất và áp dụng thuật toán phân loại phương tiện
chuyển động.
+ Trên cơ sở phân tích tập thuật toán, đề xuất sự cải tiến, kết hợp các thuật
toán cho mục đích phát hiện, phân loại phương tiện giao thông trong điều kiện
giao thông đông đúc và đa dạng về chủng loại phương tiện.
3. Đối tượng và phạm vi nghiên cứu
Vấn đề "Nghiên cứu phát triển một số thuật toán phát hiện và phân loại
phương tiện từ dữ liệu video giao thông” được thực hiện chủ yếu trên môi


5
trường ngoài trời. Dữ liệu video giao thông có thể thu được từ những cung
đường khác nhau: từ các cung đường nông thôn (quận, huyện), từ các đường
quốc lộ (cao tốc), từ các đường trong đô thị (thành phố). Trong điều kiện ở Việt
Nam hiện nay, việc gắn các camera giao thông của các cơ quan quản lý và điều
khiển giao thông ở các đường quốc lộ (đường cao tốc) là phổ biến, tập dữ liệu
dùng cho việc thực nghiệm cũng thu được một cách dễ dàng hơn. Dữ liệu video
nghiên cứu trong luận án tập trung vào việc nghiên cứu dữ liệu video thu được
từ các cung đường quốc lộ. Chẳng hạn như quốc lộ 1, quốc lộ 5 và một số đường
cao tốc mới xây dựng như đại lộ Thăng long, Bắc Thăng long - Nội bài.

Luận án tập trung trình bày và giải quyết cốt lõi của hệ thống phát hiện và
phân loại phương tiện giao thông thông qua quá trình xử lý hình ảnh và đưa ra
thông tin. Bản chất của quá trình này là: phân tách video thành các khung hình;
phát hiện đối tượng chuyển động trong cảnh video; dựa vào các đặc trưng hình
học, chuyển động để phân loại và kết hợp với những đặc tính không gian, thời
gian khác để đếm các loại đối tượng chuyển động có trong video. Đối tượng
nghiên cứu của luận án gồm: Bài toán phát hiện, theo dõi và phân loại đối tượng
chuyển động; Các công trình đã và đang nghiên cứu trong và ngoài nước về vấn
đề phát hiện, theo dõi và phân loại đối tượng chuyển động; Các thuật toán,
phương pháp đã áp dụng trong vấn đề này. Các đoạn video quay cảnh giao
thông.
Tổng quát lại, đây là một phạm vi rộng, bao gồm: phát hiện, phân loại và
theo dõi đối tượng chuyển động. Luận án tập trung vào việc nghiên cứu một số
thuật toán phát hiện và phân loại đối tượng chuyển động trong vùng quan tâm;
giải quyết vấn đề ô tô, xe máy trong video giao thông mà lưu lượng giao thông
đông đúc ("dày đặc") có sự và "dính nhau" trong điều kiện Việt Nam.
4. Phương pháp nghiên cứu
Thu thập và nghiên cứu tài liệu về các nghiên cứu đã thực hiện trên thế giới
và Việt nam về vấn đề giám sát thông minh bằng hình ảnh.


6
Phân tích cấu trúc một hệ thống giám sát thông minh bằng hình ảnh; thống
kê, phân tích và đánh giá các phương pháp đã sử dụng; trên cơ sở đó thực hiện
một số công việc giải quyết bài toán:
 Lựa chọn phương pháp phù hợp trong từng điều kiện hoàn cảnh khác
nhau của bài toán giám sát tự động.
 Phân tích và cải tiến hệ thống về mặt cấu trúc, quy trình, khung làm
việc của hệ thống giám sát tự động.
 Lựa chọn và đề xuất cải tiến một số thuật toán áp dụng.

Thử nghiệm và đánh giá kết quả một số phương pháp đề xuất:
 Thu thập dữ liệu video trên một số cung đường tại đường quốc lộ.
 Viết chương trình thử nghiệm bằng ngôn ngữ lập trình C++ trên môi
trường .NET.
 Đánh giá và phân tích kết quả.
5. Ý nghĩa khoa học và thực tiễn của luận án
Ý nghĩa khoa học:
Làm phong phú hơn về lý luận cho phương pháp phát hiện và phân loại đối
tượng chuyển động trong video.
Tổng hợp và xây dựng một tập các phương pháp trích chọn các đặc trưng
phương tiện chuyển động, biểu diễn và xử lý các đặc trưng của phương tiện theo
từng cấp độ phù hợp cho phân loại và đếm đối tượng, bao gồm:
 Đặc trưng khối chuyển động.
 Đặc trưng hình dạng và kích thước đối tượng.
 Đặc trưng luồng quang học.
 Đặc trưng đường viền đối tượng.
Đề xuất khung làm việc chung cho bài toán xác định mật độ phương tiện
trong video giao thông.
Ý nghĩa thực tiễn:
Mở ra khả năng tính toán mới để xác định đối tượng trong ảnh nhanh hơn;
có sự phân loại tốt hơn, tránh được những thông tin dư thừa do mật độ đối tượng


7
chuyển động dày đặc, đan xen gây ra... phục vụ cho các ứng dụng thực tế như đo
lưu lượng giao thông, xác định hiện trường tai nạn giao thông, chứng thực xe đã
đi qua đoạn đường trong khoảng thời gian t,... phục vụ trong công tác an ninh.
6. Cấu trúc của luận án
Phần mở đầu. Giới thiệu tổng quát bài toán, phương pháp tiếp cận, phạm vi
nghiên cứu, những thách thức đặt ra cho bài toán, hướng nghiên cứu, ý nghĩa

khoa học, ý nghĩa thực tiễn của bài toán nghiên cứu.
Chương 1. Tổng quan về bài toán phát hiện và phân loại phương tiện trong
video giao thông. Đặt vấn đề về bài toán nghiên cứu; trình bày kết quả của một
số nghiên cứu liên quan. Đề xuất vấn đề nghiên cứu của luận án.
Chương 2. Trình bày phương pháp trích chọn đặc trưng đối tượng chuyển
động từ video. Cải tiến phương pháp GMM thích nghi với ánh sáng thay đổi. Áp
dụng kết hợp GMM thích nghi với phát hiện luồng quang học để đếm số lượng
xe trong vùng quan tâm.
Chương 3. Trình bày cách thức phân loại phương tiện giao thông thông qua
một số phương pháp: tính toán độ dài; biểu diễn hình dạng đối tượng dựa trên
vector khoảng cách từ tâm đến cạnh của đa giác xấp xỉ; kết hợp độ dài và vector
khoảng cách để nhận dạng, phân loại phương tiện trong ảnh; Áp dụng một số
tính chất của đường viền vector để phân loại phương tiện dựa trên độ dài và hình
dáng đường viền dựa trên đối sánh ảnh.
Phần kết luận. Trình bày những đóng góp và hướng nghiên cứu phát triển
tiếp theo của luận án.


8
Chương 1. TỔNG QUAN VỀ PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG
TIỆN GIAO THÔNG TỪ VIDEO
Chương này trình bày một số phương pháp, kỹ thuật xử lý, kết quả trong
bài toán xác định mật độ phương tiện giao thông đã sử dụng. Tập trung phân
tích những kỹ thuật, phương pháp liên quan đến hướng tiếp cận của bài toán.
Bao gồm 3 nhóm phương pháp chính: phát hiện, phân loại và theo dõi. Tuy
nhiên những kỹ thuật liên quan đến máy camera, nén dữ liệu, tiền xử lý dữ liệu
không được đề cập đến trong luận án này.
1.1. Cơ sở lý thuyết và những khái niệm cơ bản
1.1.1. Dữ liệu video số
Năm 2005, Sagar Deb, University Southem Queensland, Australia, đã tổng

hợp và biên tập tài liệu Quản lý dữ liệu video và tìm kiếm thông tin [20], trong
đó đã xác định khái niệm, cấu trúc video số, cách tổ chức và xem xét cấu trúc dữ
liệu video.
Định nghĩa 1.1. Video số
Video số là một dãy các khung hình liên tiếp, mỗi khung hình tương ứng
với một hình ảnh tĩnh. Khi video được thực hiện, dãy khung hình được hiển thị
tuần tự với một tốc độ nhất định. Tốc độ hiển thị các khung hình thường là 30
hoặc 25 khung hình/giây [20].
Hình 1.1 thể hiện cấu trúc tổng quát của dữ liệu Video: khung hình, cảnh
quay, cảnh.

Hình 1.1. Cấu trúc phân đoạn của video


9
Trong kỹ thuật xử lý dữ liệu video tác động đến nhiều thành phần và các
đối tượng kéo theo của video như: cảnh, cảnh quay, khung hình, ảnh, điểm ảnh,
ngưỡng, tách ngưỡng, đường viền, nền, phép cộng ảnh, phép nhân ảnh với 1
số... Dữ liệu video và những thành phần liên quan được đặc tả hình thức bằng
ngôn ngữ đặc tả hình thức RAISE như sau:
scheme Video=
class
type
Video=Scene-list, /*Video là một danh sách các cảnh*/
Scene=Shot-list, /*Cảnh là một danh sách các cảnh quay*/
Shot=Image-list,

/*Cảnh quay là một danh sách các ảnh*/

Image=Point-set, /*Ảnh là một tập hợp các điểm ảnh*/

Point=Nat>dòng và tọa độ cột*/
Cycle ={|pl:Point-list:-Check_Cycle(pl)|} /*Một chu trình
điểm ảnh khép kín */
value
/* tốc độ hiển thị video*/
speed:Video><Real->Real
speed(v,t) is real(len(v))/t,
/* thời gian hiển thị*/
displaytime:Video><Real->Real
displaytime(v,t) is real(Shotnumber(v))/t,
/* Số cảnh quay trong một video*/
Shotnumber:Video->Nat
Shotnumber(v) is if v=<..> then 0
else Shotnumber(hd(v))+Shotnumber(tl(v))
end,
/* Số cảnh quay trong một cảnh */
Shotnumber:Scene->Nat
Shotnumber(s) is if s=<..> then 0
else Shotnumber(hd(s))+Shotnumber(tl(s))


10
end,
Shotnumber:Shot->Nat
Shotnumber(sh) is if sh=<..> then 0
else 1+Shotnumber(tl(sh))
end,
/* Định nghĩa phép tổng hai ảnh */
+: Image><Image->Image,

tong:Shot->Image
tong(sh) is if len(sh) = 1 then hd(sh)
else hd(sh)+tong(tl(sh))
end,
/:Image><Nat->Image,
/* Định nghĩa ảnh nền */
back1:Shot->Image
back1(sh) is tong(sh)/Shotnumber(sh),
/* Định nghĩa phép nhân ảnh với một số*/
alpha: Real,
*:Real><Image-> Image,
back:Shot->Image /* anh nen*/
back(sh) is if
else

len(sh) = 1 then hd(sh)

alpha*hd(sh)+(1.0-alpha)*back( tl(sh))
end,

/* Định nghĩa ảnh biên */
constraint:Image><Image->Bool,
anhbien:Image->Image
anhbien(I) as I1 post constraint(I,I1),
/* Tách ngưỡng */
constraint:Image><Image><Real->Bool,
tachnguong:Image><Real->Image
tachnguong(I,

threshold)


constraint(I,I1,threshold)

as

I1

post


11
/* Xác định đường viền */
Check_Cycle

:Point-list-> Bool /* Kiểm tra chu trình*/

Check_Cycle(pl) is hd(pl)=ptcuoi(pl),
ptcuoi: Point-list-~->Point
ptcuoi(pl) is if len(pl)=1
then hd(pl)
else ptcuoi(tl(pl))
end
pre len(pl)>0,
end

Đặc trưng của video: Bao gồm màu, kết cấu, hình dạng và chuyển động.
- Màu (Color): Màu sắc là một đặc trưng cơ bản của ảnh. Với ảnh thì lược
đồ màu là biểu diễn sự phân bố màu trong ảnh. Biểu đồ màu không phụ thuộc
vào việc quay ảnh, dịch chuyển ảnh, hướng ảnh mà phụ thuộc vào vào hệ màu
và các phương pháp lượng tử hóa ảnh được dùng.

- Kết cấu (Texture): là một đặc trưng quan trọng của bề mặt khung hình,
nơi xảy ra việc lặp lại mẫu cơ bản. Có hai dạng biểu diễn kết cấu phổ biến: ma
trận đồng thời và Tamura. Ma trận đồng thời mô tả hướng và khoảng cách giữa
các điểm ảnh, ta có thể trích chọn được các thống kê có ý nghĩa. Biểu diễn
Tamura bao gồm các thuộc tính đo tính thô, độ tương phản, hướng, tính trơn,
tính cân đối và độ thô ráp. Các đặc tính này rất quan trọng trong việc tìm hiểu
nội dung ảnh vì nó biểu diễn rất trực quan.
- Hình dạng (Shape): đặc trưng hình dạng có thể được phân chia thành đặc
trưng toàn cục và đặc trưng cục bộ. Đặc trưng toàn cục là đặc trưng thu được từ
toàn bộ hình dáng đối tượng trong ảnh (Ví dụ: chu vi, tính tròn, hướng trục
chính...). Đặc trưng cục bộ là đặc trưng thu được từ việc thao tác với một phần
của ảnh, không phụ thuộc vào toàn bộ ảnh.
- Chuyển động (Motion): Là thuộc tính quan trọng của video. Các đặc
trưng chuyển động như mô-men của trường chuyển động, biểu đồ chuyển động,
các tham số chuyển động toàn cục có thể được trích chọn từ vectơ chuyển động.


12

1.1.2. Mô-men bất biến
Mô-men có nhiều ứng dụng trong kỹ thuật phân đoạn ảnh, đối sánh ảnh và
nhận dạng ảnh. Năm 2004, Chee-Way Chong and và cộng sự nghiên cứu về lý
thuyết môn men và ứng dụng [6]. Từ những năm 1962, tác giả Hu M. K [13] đã
đề cập đến vấn đề hệ số tương quan trong kỹ thuật phân đoạn ảnh. Dựa vào tính
chất bất biến và hệ số tương quan của mô-men để đối sánh và phân loại đối
tượng trong ảnh theo hình chiếu đối tượng trong không gian 2D.
Ứng dụng của mô-men bất biến trong nhận dạng ảnh:
Mô-men bất biến thường được dùng để trích đặc điểm trong xử lý ảnh, và
ghi nhận hình dạng đối tượng và phân lớp. Mô-men có thể cung cấp các đặc
điểm của một đối tượng duy nhất mô tả hình dạng của đối tượng.

Hình dạng đối tượng không phụ thuộc vào 3 dạng biến đổi: chuyển đổi
(thay đổi vị trí), co giãn (thay đổi kích thước) và hướng (biến đổi quay). Hình
1.2 thể hiện sự bất biến đối với phép biến đổi trong không gian 2 chiều.
Tính bất biến của chuyển đổi vị trí được xác định bởi mô-men đã được
chuẩn hóa là trọng tâm của đối tượng. Tính bất biến của biến đổi kích thước đối
tượng là sự bất biến của các giá trị đại số liên quan đã được chuẩn hóa.
Một vấn đề thiết yếu trong lĩnh vực phân tích mẫu là việc ghi nhận đối
tượng và đặc điểm ký tự cho dù đối tượng đó thay đổi vị trí, thay đổi kích thước
hay là biến đổi hướng. Mô-men bất biến được tính toán cơ bản dựa trên các
thông tin được cung cấp bởi đường biên và miền bên trong của đối tượng.

Hình 1.2. Các biến đổi hình dáng đối tượng trong không gian 2D.


13

1.1.3. Hình dạng và Khối đối tượng chuyển động
Định nghĩa 1.2. Khối đối tượng chuyển động
Khối đối tượng chuyển động là tập hợp các điểm ảnh của các đối tượng
chuyển động được trích ra từ các khung hình sau khi loại bỏ các đối tượng
không chuyển động. Khối đối tượng chuyển động có thể gồm một đối tượng độc
lập, hoặc có thể là một tập hợp các đối tượng dính nhau, che khuất nhau một
phần. Gọi I là khung hình trích ra từ video, B là các đối tượng không chuyển
động, X là khối đối tượng chuyển động,  là ngưỡng sai số cho phép. Khi đó:
X=I–B+
Một số các thao tác trên X:
- Xác định X trở thành vấn đề xác định B và ngược lại.
- Loại bỏ nhiễu, tức là làm sạch X, loại bỏ những thành phần không quan
tâm ra khỏi X. Thường là xác định ngưỡng kích thước để loại bỏ những thành
phần nhỏ ra khỏi khối X quan tâm.

- Phân rã X thành các khối con: X=X1+ ... + Xn, với tiêu chuẩn phân rã là
một ngưỡng xác định để các điểm ảnh tạo thành một khối.
- Gán nhãn cho các khối con: Xác định đối tượng có trong khối.
Định nghĩa 1.3. Hình dạng khối đối tượng
Hình dạng khối đối tượng [30] là một đa giác được xấp xỉ lên đường biên
của nó. Biên đối tượng trong ảnh là một tập hợp các điểm ảnh phân biệt giữa
vùng bên trong và bên ngoài đối tượng. Gọi X là đường biên của đối tượng, DG
là đa giác xấp xỉ lên đường biên đối tượng, DT(X) là diện tích khối ảnh đối
tượng, DT(DG) là diện tích của đa giác xấp xỉ lên X. Khi đó:
DT(X)  DT(DG) + , với  là ngưỡng xác định cho phép sai số.
1.1.4. Đường viền đối tượng
Định nghĩa 1.4. Đường viền
Tập hợp tất cả các điểm biên của đối tượng, tạo thành một đường khép kín
bao quanh đối tượng gọi là đường viền của đối tượng, hay nói cách khác đường
viền của một đối tượng là đường biên khép kín bao quanh đối tượng [30].


14
Một số đặc tính của đường viền như độ dài, hình dáng, trọng tâm diện tích
bên trong, rất có ích để tính toán, nhận diện đối tượng là gì. Biểu diễn đường
viền trong ảnh có nhiều cách khác nhau. Trong các hệ thống thị giác máy tính,
một vài định dạng mã hóa đường viền được sử dụng như mã hóa Freeman, mã
hóa 2 chiều, mã hóa đa giác thường được sử dụng.
Phân tích đường viền (CA) [30] cho phép mô tả, lưu trữ, so sánh và tìm ra
các đối tượng biểu diễn dưới dạng đường viền. Đường viền chứa thông tin cần
thiết về hình dạng đối tượng. Không quan tâm nhiều đến các điểm bên trong của
đối tượng. Các trường hợp không quan tâm nhiều đến vùng bên trong đối tượng
nhưng quan tâm nhiều về thể hiện đường viền bên ngoài thì cho phép chuyển về
không gian 2 chiều của ảnh tức là không gian đường viền, từ đó cho phép giảm
thời gian tính toán và độ phức tạp tính toán. CA cho phép giải quyết hiệu quả

các bài toán cơ bản của nhận dạng mẫu – biến đổi, quay và tỷ lệ của ảnh đối
tượng. Phương pháp CA là bất biến đối với phép biến đổi.
Một phương pháp biểu diễn đường viền được đề nghị là biểu diễn bằng một
dãy các số phức (Xem Hình 1.3). Trên một đường viền, điểm bắt đầu cần được
xác định. Tiếp theo, đường viền sẽ được quét (xoay theo chiều kim đồng hồ), và
mỗi vector được biểu diễn bằng một số phức a+ib. Với a, b là điểm tương ứng
trên trục x, y. Các điểm được biểu diễn kế tiếp nhau.

Hình 1.3. Biểu diễn đường viền bằng vector số phức

Do tính chất vật lý của các đối tượng ba chiều, đường viền của chúng luôn
khép kín và không tự giao nhau. Nó cho phép xác định rõ ràng việc duyệt qua


×