Tải bản đầy đủ (.pdf) (65 trang)

Thiết kế hệ thống giám sát và ước lượng tình trạng giao thông

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.51 MB, 65 trang )

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HCM

PHAN QUANG

THIẾT KẾ HỆ THỐNG GIÁM SÁT VÀ ƯỚC LƯỢNG TÌNH
TRẠNG GIAO THƠNG

Chun ngành: Kỹ Thuật Điện Tử
Mã số: 60 52 02 03

LUẬN VĂN THẠC SĨ

TP. Hồ Chí Minh, 2017


Cơng trình được hồn thành tại: Trường Đại học Bách Khoa –ĐHQG-HCM
Cán bộ hướng dẫn khoa học : ......................................................................................
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Cán bộ chấm nhận xét 1 : ............................................................................................
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Cán bộ chấm nhận xét 2 : ............................................................................................
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp.HCM
ngày . . . . . tháng . . . . năm . . . . .
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)
1. ............................................................
2. ............................................................
3. ............................................................
4. ............................................................


5. ............................................................
Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên
ngành sau khi luận văn đã được sửa chữa (nếu có).
CHỦ TỊCH HỘI ĐỒNG

TRƯỞNG KHOA ĐIỆN- ĐIỆN TỬ


ĐẠI HỌC QUỐC GIA TP.HCM

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

TRƯỜNG ĐẠI HỌC BÁCH KHOA

Độc lập – Tự do – Hạnh phúc

NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: PHAN QUANG

MSSV: 13141122

Ngày, tháng, năm sinh: 20/10/1989

Nơi sinh: Quảng Nam

Chuyên ngành: Kỹ Thuật Điện Tử

Mã số: 60 52 02 03

I. TÊN ĐỀ TÀI: THIẾT KẾ HỆ THỐNG GIÁM SÁT VÀ ƯỚC LƯỢNG

TÌNH TRẠNG GIAO THƠNG
II. NHIỆM VỤ VÀ NỘI DUNG:
Xây dựng hệ thống giám sát, ước lượng tình trạng giao thơng tại các ngã tư, giao
lộ, có thể được kết hợp với các hệ thống giao thông thông minh để hỗ trợ việc
điều tiết giao thông, giảm ùn tắt tại các nút giao thông ở TpHCM
III. NGÀY GIAO NHIỆM VỤ:11-01-2016
IV. NGÀY HOÀN THÀNH NHIỆM VỤ: 20-12-2016
V.

CÁN BỘ HƯỚNG DẪN: TS. TRƯƠNG CÔNG DUNG NGHI

Tp. HCM, ngày 20 tháng 12 năm 2016
CÁN BỘ HƯỚNG DẪN

CHỦ NHIỆM BỘ MÔN ĐÀO TẠO

(Họ tên và chữ ký)

(Họ tên và chữ ký)

TRƯỞNG KHOA ĐIỆN ĐIỆN TỬ
(Họ tên và chữ ký)


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

LỜI CÁM ƠN
Em xin gởi đến TS. Trương Công Dung Nghi lời cảm ơn chân thành với sự trân

trọng và lòng biết ơn sâu sắc về sự hướng dẫn chu đáo và đầy nhiệt tình. Cơ đã
dẫn dắt, tạo cho em cách tư duy và làm việc một cách khoa học, hướng em đến đề
tài khoa học mới mẻ, tiếp cận với các công nghệ hiện đại.
Em xin chân thành cám ơn các thầy cơ ngành Kỹ Thuật Điện Tử đã hết lịng
dạy dỗ và truyền đạt cho em những kiến thức q báu.
Tơi xin cảm ơn các bạn đã cùng học tập, giúp đỡ, động viên và đồng hành cùng tôi
trong suốt giai đoạn làm luận văn.

Tp. Hồ Chí Minh, tháng 12 năm 2016
Học viên

PHAN QUANG

I


Luận Văn Thạc Sĩ

GVHD:TS.Trương Cơng Dung Nghi

TĨM TẮT LUẬN VĂN
Luận văn trình bày hệ thống giám sát và ước lượng tình trạng giao thơng hỗ trợ các
hệ thống giao thơng thông minh trong việc điều tiết luồng giao thông, giảm ùn tắc tại
các nút giao thông Hệ thống sử dụng bộ thư viện mã nguồn mở OpenCV do Intel phát
triển
Hệ thống thu thập hình ảnh qua camera được gắn tại các ngã 3, ngã tư, theo dõi và
nhận dạng và hiển thị trạng thái giao thông ở một thời điểm xác định. Quá trình phát
hiện và nhận dạng trải qua ba giai đoạn chính: tiền xử lý, phát hiện và nhận dạng.
Thuật toán dựa trên phương pháp trừ nên kết hợp bộ trộn Gauss để phát hiện tiền
cảnh.

Bên cạnh đó, giải thuật dòng quang học cũng được sử dụng trong quá trình ước
lượng vận tốc của đối tượng chuyển động. Sau cùng thuật toán sẽ phân loại các trạng
thái giao thông thông qua kỹ thuật logic mờ.
Kết quả thực nghiệm cho thấy thuật tốn cho độ chính xác cao, hiệu suất tốt và có thể
áp dụng vào thực tế.

I


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

ABSTRACT
The thesis perform a system to monitor, estimate the traffic situation and then
support the ITS( Intelligent Transport System) in function partly handle traffic flow
and decrease traffic jam at cross- road, intersection. The system uses the open source
OpenCV library developed by Intel.
The system collect videos through a camera mounted on traffic lamp, then detect,
tracking and recognize the moving object, calculate and display the result on the
screen.
The system is based on three major stages: pre-processing, detection and
recognition.
The algorithm is based on the background subtraction method combined to Gauss
mixture Model to detect the moving objects passed into ROI( intersection, cross- road)
Optical Flow method is also used to estimate the speed of traffic flow. After then,
the situation of the traffic will be determined through fuzzy- logic technique.
Experimental results show that the algorithm can be used with accuracy, providing
high performance and can be applied in reality.


II


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

LỜI CAM ĐOAN
Tôi xin cam đoan các kết quả đề tài thực hiện chưa từng cơng bố trong bất kỳ cơng
trình khoa học trước đây.
Người cam đoan

PHAN QUANG

III


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

MỤC LỤC
CHƯƠNG 1: GIỚI THIỆU .............................................................................................. 4
1.1 Giới thiệu tổng quan .............................................................................................. 4
1.2 Nội dung đề tài ...................................................................................................... 4
1.3 Mục tiêu đề tài ....................................................................................................... 5
1.4 Phương pháp nghiên cứu ........................................................................................ 5
1.5 Một số thách thức ................................................................................................... 5
CHƯƠNG 2: TÌNH HÌNH NGHIÊN CỨU .................................................................... 6
2.1 Các cơng trình nghiên cứu liên quan ..................................................................... 6

2.2 Tình hình nghiên cứu trong nước .......................................................................... 8
CHƯƠNG 3: NỘI DUNG LÝ THUYẾT VÀ GIẢI THUẬT ĐỀ NGHỊ .................... 14
3.1 Cơ sở lý thuyết...................................................................................................... 14
3.1.1 Phép trừ nền .................................................................................................. 15
3.1.2 Các phương pháp tĩnh ................................................................................... 21
3.1.4 Phương pháp Optical Flow ........................................................................... 23
3.2 Phương pháp trừ nền sử dụng mơ hình bộ trộn Gauss .................................... 23
3.3 Phương pháp optical flow..................................................................................... 25
3.3.1 Phương pháp Lucas-Kanade ......................................................................... 25
3.3.2 Phương pháp Horn-Schunck ......................................................................... 28
3.4 Giải thuật đề nghị ................................................................................................. 31
3.4.1 Phát hiện đối tượng chuyển động: ................................................................ 33
3.4.2 Lọc nhiễu ...................................................................................................... 35

1


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

3.4.3 Nhận dạng tiền cảnh bằng ma trận đồng hiện diện: ..................................... 37
3.4.4 Ước lượng mật độ tiền cảnh ở vùng quan tâm

................ 40

3.4.5 Ước lượng tốc độ di chuyển của các phương tiện : ...................................... 40
3.4.6 Phân loại tình trạng giao thơng bằng logic mờ: ............................................ 41
CHƯƠNG 4: KẾT QUẢ THỰC HIỆN ......................................................................... 44
4.1 Tách đối tượng tiền cảnh ra khỏi nền ................................................................... 44

4.2 Ước lượng tốc độ ................................................................................................. 45
4.3 Giao diện chương trình : ...................................................................................... 46
CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ............................................. 54
5.1 Kết luận ................................................................................................................ 54
5.2 Hướng phát triển : ................................................................................................ 54
TÀI LIỆU THAM KHẢO .............................................................................................. 55

DANH SÁCH HÌNH
Hình 2.1 : Sơ đồ hệ thống phân tích mật độ đám đơng dựa vào LBPCM[1]................... 6
Hình 2.2 : Kết quả đánh giá tình trạng giao thơng [9]. .................................................... 8
Hình 2.3 : Hệ thống CadProTMS ................................................................................... 10
Hình 2.4 : Sơ đồ khối thuật tốn CCA-GMMOF........................................................... 11
Hình 3.1 : Sơ đồ khối lược đồ chung cho các thuật toán xử lý video ............................ 14
Hình 3 2 : Sơ đồ giải thuật ............................................................................................. 16
Hình 3.3 : Ảnh (a) là ước lượng nền cơ sở, ảnh (b) thu được ở bước tiếp theo, ảnh (c)
thể hiển bản đồ điểm ảnh nổi trôi phát hiện dược bằng cách sử dụng phép trừ nền ...... 20
Hình 3.4 Ví dụ về sự khác biệt theo thời gian ............................................................... 22
Hình 3.5 : Sơ đồ tổng quát của hệ thống ........................................................................ 32
2


Luận Văn Thạc Sĩ

GVHD:TS.Trương Cơng Dung Nghi

Hình 3.6: Sơ đồ khối nhận dạng đối tượng chuyển động .............................................. 33
Hình 3.7 : Các lân cận của một điểm ảnh ...................................................................... 36
Hình 3.8 : Tiền cảnh được lọc ở mức 1.......................................................................... 36
Hình 3.9 : Tiền cảnh được lọc nhiễu ở mức 2 ................................................................ 37
Hình 3 10: Tiền cảnh được xác định bởi phương pháp GLCM ..................................... 38

Hình 3 11 :Tiền cảnh được xác định bởi phương pháp GMM ....................................... 39
Hình 3.12 : Đồ thị tập mờ cho tốc độ ước lượng ........................................................... 42
Hình 3.13: Đồ thị tập mờ cho mật độ ước lượng ........................................................... 42
Hình 4.1 : Đối tượng tiền cảnh đã tách ( từ trái sang phải : ảnh gốc ban đầu, ảnh đánh
dấu các đối tượng tiền cảnh) .......................................................................................... 44
Hình 4.2 : Nền tham khảo .............................................................................................. 45
Hình 4.3 : Ước lượng tốc độ của đối tượng chuyển động.............................................. 45
Hình 4.4 :Giao diện chương trình : ................................................................................ 46
Hình 4.5 :Đường trống ( Ngã tư Điện Biên Phủ - Đinh Tiên Hoàng) ........................... 47
Hình 4.6 : Đường trống(Nước ngồi) ............................................................................ 48
Hình 4.7 : Đường thơng thống ( Nước ngồi) .............................................................. 49
Hình 4.8 : Đường thơng thống(Ngã tư Điện Biên Phủ- Đinh Tiên Hồng) ................. 50
Hình 4.9 : Đường bình thường(Ngã tư Điện Biên Phủ - Đinh Tiên Hồng) ................. 51
Hình 4.10 : Đồ thị biểu diễn mật đô, tốc độ phương tiện và trạng thái giao thông trong
vùng quan sát.................................................................................................................. 52
DANH SÁCH BẢNG
Bảng 3.1 : Bảng phân loại định tính trạng thái giao thông ............................................ 43
Bảng 3.2 : Bảng phân loại định tính trạng thái giao thơng ............................................ 43

3


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

CHƯƠNG 1: GIỚI THIỆU
1.1 Giới thiệu tổng quan
Cùng với sự tập trung cao độ về mật độ dân số và phương tiện giao thông tại các
thành phố lớn, vấn nạn kẹt xe vẫn luôn là một trong những vấn đề nổi bật, thu hút được

sự quan tâm của nhiều thành phần khác nhau trong xã hội. Ở Việt Nam, vấn đề này
luôn là một vấn đề nhức nhối, đặc biệt ở hai thành phố lớn là Hà Nội và Tp. Hồ Chí
Minh. Nhiều giải pháp đã được thực hiện nhằm giảm thiểu tình trạng kẹt xe, như phân
luồng giao thông, đầu tư hệ thống cơ sở vật chất (xây dựng cầu vượt, lắp đặt các hệ
thống camera giám sát nhằm thơng báo tình trạng kẹt xe đến người đi đường thông qua
hệ thống bảng thông báo điện tử, qua đài phát thanh…). Hiện tại, hệ thống camera
giám sát giao thông ở các thành phố lớn tại Việt Nam càng lúc càng được mở rộng.
Tuy nhiên, cơng việc giám sát, đánh giá tình trạng giao thơng vẫn phụ thuộc vào con
người là chính. Việc xây dựng một hệ thống có khả năng giám sát lưu lượng giao thơng
tự động, có thể kết nối với hệ thống điều tiết đèn giao thông để đưa ra những điều
khiển tối ưu là một trong những giải pháp đáng quan tâm và đầu tư để giải quyết bài
toán kẹt xe ở Việt Nam.
Hệ thống trong đề tài này sẽ gồm các phần: nhận dạng đối tượng tiền cảnh, đánh giá
lưu lượng di chuyển của các phương tiện lưu thông trên đường. Hệ thống sử dụng các
đoạn tư liệu video quay lại từ các camera giao thơng hoặc hình ảnh trực tiếp từ camera.
Sau đó, hệ thống sẽ xử lý từng khung ảnh để:
+ Tách các đối tượng tiền cảnh ra khỏi nền
+ Đánh giá lưu lượng chuyển động của dối tượng trong vùng quan sát
1.2 Nội dung đề tài
 Tìm hiểu về bài tốn giám sát giao thơng, đưa ra cái nhìn tổng qt về việc phát
hiện và dị tìm chuyển động, những hướng tiếp cận chính trong những nghiên cứu
hiện nay.
 Tìm hiểu về 2 vấn đề chính của hệ thống giám sát giao thông:
+ Tách tiền cảnh và ước lượng mật độ phương tiện giao thông
+ Ước lượng vận tốc của các phương tiện giao thông
 Tập trung vào việc nghiên cứu phương pháp tách đối tượng chuyển động ra khỏi
nền và ước lượng chuyển động của đối tượng trong vùng quan sát.

4



Luận Văn Thạc Sĩ

GVHD:TS.Trương Cơng Dung Nghi

 Tìm hiểu và xây dựng chương trình phát hiện chuyển động của xe cộ trong các
video giám sát giao thông, ước lượng mật độ, vận tốc các phương tiện giao thơng,
từ đó suy ra trạng thái giao thông trong các khung ảnh giám sát.
1.3 Mục tiêu đề tài
-

Chọn ra phương pháp giải thuật tối ưu để giải quyết bài toán ước lượng lưu
lượng xe cộ trong điều kiện giao thông ở Việt Nam.
Xây dựng chương trình dị tìm chuyển động và ước lượng mật độ giao thông
trong video giám sát.

-

Xây dựng hệ thống giám sát thông minh đáp ứng tốt nhu cầu thực tiễn.

1.4 Phương pháp nghiên cứu
 Tham khảo các giải thuật liên quan đã được đề xuất trong các cơng trình nghiên cứu
trong và ngoài nước.
 Đánh giá ưu điểm và hạn chế của từng thuật toán để chọn lọc và áp dụng cho
nghiên cứu.
 Kế thừa và kết hợp các thế mạnh của các thuật toán và cải tiến một số bước để thuật
toán giải quyết hiệu quả bài toán đặt ra.
 Xây dựng chương trình phát hiện chuyển động và ước lượng mật độ giao thông.
 So sánh kết quả đạt được với kết quả của các cơng trình nghiên cứu trước đó (nếu
có) để đánh giá mức độ hiệu quả của giải thuật.

1.5 Một số thách thức
Hầu hết các giải thuật về dị tìm phương tiện đều áp dụng cho xe 4 bánh, và các
phương tiện di chuyển theo làn. Ở Việt Nam, số lượng phương tiện tham gia giao
thông khá nhiều và nhiều chủng loại, đồng thời tốc độ di chuyển của các phương tiện
cũng rất khác nhau. Thêm nữa, các phương tiện thường không di chuyển theo 1 làn xe
nhất định. Do vậy cần có thuật tốn thích hợp để áp dụng cho tình hình giao thông thực
tế ở Việt Nam.

5


Luận Văn Thạc Sĩ

GVHD:TS.Trương Cơng Dung Nghi

CHƯƠNG 2: TÌNH HÌNH NGHIÊN CỨU
2.1 Các cơng trình nghiên cứu liên quan
Đã có nhiều nghiên cứu giải quyết bài toán phát hiện vật thể chuyển động hoặc
nhận dạng vùng đám đông. Phương pháp nhận dạng đám đơng dựa vào phân tích
texture được đề cập trong nghiên cứu của Zhe Wang, Hong Liu, Yueliang Qian và Tao
Xu trong bài báo [1]. Ở đây, nhóm tác giả đề xuất một trình mơ tả kết cấu dựa vào ma
trận hiệp phương mơ hình nhị phân cục bộ (LBPCM) cho việc ước lượng mật độ đám
đơng. Nó được xây dựng từ nhiều cell chồng chéo nhau trong một khối ảnh mà sẽ được
phân loại ra thành nhiều mức mật độ đám đông khác nhau. LBPCM mô tả cả thuộc tính
thống kê và các thơng tin khơng gian của LBP do vậy sử dụng đầy đủ các chức năng
của LBP cho đặc tính kếu cấu cục bộ. Thêm vào đó, họ cịn trích xuất LBP trên màu
xám và gradient ảnh để cải thiện hiệu suất ước lượng mật độ đám đông. Cuối cùng kĩ
thuật cửa sổ trượt dùng để phát hiện những vùng đám đơng có khả năng xuất hiện cao
nhất.


Hình 2.1 : Sơ đồ hệ thống phân tích mật độ đám đơng dựa vào LBPCM[1].

6


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

Một phương pháp thông dụng thường được sử dụng để phát hiện vật thể, đó là dùng
đặc trưng HOG (Histogram of Gradient). A. Shakin Banu và P. Vasuki đã khai thác
đặc tính của HOG, kết hợp với phép thực hiện hình thái để phát hiện phương tiện trong
bài báo [2]. Trong bài báo này, vùng quan tâm ROI (Region of Interest) sẽ được chọn.
Những pixel ở bên trong của vùng này một mình được phát hiện. Toán tử Sobel được
dùng cho việc xác thực những pixel biên. Gradient đạt được bằng cách tìm những pixel
chung trong vùng được phát hiện và vùng ROI. Cuối cùng, quá trình phát hiện đối
tượng được thực hiện dùng xử lý hình thái và xử lý HOG. Độ chính xác của phương
pháp này là 83%.
Bên cạnh hai phương pháp này, còn một phương pháp được sử dụng khá phổ biến
trong lĩnh vực phát hiện đối tượng chuyển động, đó là dùng phương pháp trừ nền. Đầu
tiên phải kể đến là Chris Stauffer W.E.L Grimson với bài báo [3]. Tác giả đề xuất mơ
hình mỗi pixel nền bằng cách sử dụng bộ trộn 3 Gauss tương ứng với đường, xe cộ và
bóng râm. Mơ hình này đầu tiên dùng thuật tốn EM. Sau đó các Gaussian sẽ đươc tự
đánh nhãn một cách phỏng đoán như sau: các thành phần tối nhất được dán nhãn là cái
bóng; trong hai thành phần cịn lại, một với phương sai lớn nhất là có nhãn là phương
tiện và một khác như đường. Điều này vẫn cố định cho tất cả các quá trình cho thấy sự
thiếu thích ứng với những thay đổi theo thời gian. Về phát hiện tiền cảnh, mỗi điểm
ảnh được so sánh với mỗi Gaussian và được phân loại theo Gaussian tương ứng với nó.
Việc bảo trì được thực hiện bằng cách sử dụng một Thuật toán EM tăng cường để xem
xét vấn đề thời gian thực. Sau này tác giả đã khái qt hóa bằng cách mơ hình các đặc

điểm màu sắc của những pixel liền kề theo thời gian {X1,X2,..Xn} bằng bộ trộn K
Gausians. Phương pháp này sẽ được đề cập ở phần tiếp theo.
Một số nghiên cứu khác tập trung trực tiếp vào bài toán ước lượng mật độ xe và
tình trạng giao thơng. Maurin [4] tính tốn mật độ giao thông bằng cách phát hiện các
đối tượng chuyển động trên các làn đường, đồng thời tính tốn vận tốc của các đối
tượng này bằng giải thuật dòng quang học (optical flow) [5], sau đó dùng logic mờ để

7


using the recorded traffic images, processed data and the clearly separate
road users’ ratings. Single step differences in classification, and heavy tra
e.g., light to heavy and heavy to jam, are due to the different congestion leve
points of view on congestion of motorists, in which difficult and co
Luận Văn Thạc Sĩ
GVHD:TS.Trương
Công
Dung Nghi
definitive conclusions
cannot be drawn.
Additionally,
the using only spee
percentage of these differences is relatively low. We will a counter-intu
focus our attention on the significant differences from light congestion leve
to jam or vice versa.
between 87 to
In the
first case,
jam (0.11%),
theđiểm

analysiskẹt that the opini
đưa ra quyết định có xảy ra kẹt xe hay khơng.
Porikli
[6]i.e.,
lấylight
trựcto tiếp
các đặc
revealed that the speed is between 6.04 to 14.27 km/h. All classification pa
of recorded
onehình
example
shown inẩn
Fig.
7 (to
xe từ dữ liệu đang nén (compressed domain)
và ápimages,
dụng asmô
Markov
kết
hợp
Sukhumvit), clearly confirm that the traffic was in jam
bộ trộn Gauss (Gaussian Mixture Hiddencondition.
Markov Models (GM-HMM)) ứng với 5

trạng thái giao thơng, sau đó dùng tiêu chí lân cận cực đại (Maximum Likelihood) để
đánh giá tình trạng kẹt xe. Hu và cộng sự [7] ước lượng vận tốc trung bình của các
phương tiện giao thơng bằng cách sử dụng trực tiếp vector chuyển động trong nén
Proceedings of the World Congress on Engineering 2009 Vol I

MPEG.

sửU.K.
dụng bộ phân loại SVM (Support Vector Machine) để xây
WCE 2009,Hướng
July 1 - 3, tiếp
2009, cận
London,
dựng
mơ The
hìnhvalues
nềnin có
khảcells
năng
ứng với điều
kiệninvestigated
thay đổithếnh
sang của
mơi
technique.
shaded
show thích
the percentage
We further
relationship
between
speed
of mutual classification by both models.

and congestion level of the existing system as shown in Fig.

using the recorded traffic images, processed data and the


clearly separates one from each other, especially for light

Fig. 9. The con
trường
được đề xuất
bởi of
Wassantachat
và cộng
trong
[8].speed
Mộtrange
hướng
nghiên
cứulevel
We investigated
the causes
different classification
9. sự
In Fig.
6, the
of each
congestion

khác
dụng
mạng
nhân tạo
để huấn luyện
nhận

dạngthevàspeed
phânranges
loại of
cácthree Thus,
roadsử
users’
ratings.
Singlenơron
step differences
in classification,
and mơ
heavyhình
traffic.
However,

it saf
e.g., light to heavy and heavy to jam, are due to the different congestion levels in Fig. 9 largely overlap. This makescould
it achieve
points
on congestion
of motorists,
in bởi
whichPosawang
difficult and
distinguish
mức
độ ofkẹtview
xe trên
đường được
đề xuất

vàconfusing
cộng sựto [9]
cũng the
chocongestion
kết quảlevel
traffic congesti
Fig. 7.only
Image
classified
as jamAdditionally,
traffic by ANN
definitive conclusions cannot be drawn. Additionally, the using
speed
attributes.
the figure shows
Bangkok using
and
as light
by OR
technique.
of these
is relatively
counter-intuitive
between
rấtpercentage
khả quan
(hìnhdifferences
2.2). Asmaa
và low.
cộngWesựwill[10]a kết

hợp
cáctraffic
ba relationship
bộ
phân
loại
khácspeed
nhau and
as much as 12.
focus our attention on the significant differences from light congestion level. For example, the speed range of jamitself
is reaching 9
In the
second
jam
light (12.04%),
the
jam or viceNeighbor
versa.
between
87 case,
to 127i.e.,
km/h.
Thetovà
preliminary
results
suggested
(KtoNearest
(kNN), Learning Vector
Quantization
(LVQ)

Support
Vector
analysisthatrevealed
that the speed
is between
In the first case, i.e., light to jam (0.11%), the analysis
the opinion-based
ANN
exhibits a70.19
moreand
concrete
129.41
km/h.
All
of
recorded
images,
as
one
example
shown
revealed
that
the
speed
is
between
6.04
to
14.27

km/h.
All
classification
pattern.
Machine (SVM)) để trích tách các tham sốinviFig.
mơ8,vàclearly
vĩ mơ,
từ đó phân tích và đánh giá
confirm that the traffic was in light
of recorded images, as one example shown in Fig. 7 (to
The study
condition,
in
which
our
model
classified accurately.
Sukhumvit), clearly confirm that the traffic was in jam
tình
trạng
kẹt
xe
trên
đường.
technique
to au
condition.
levels achievin
square of 0.158
10-11-3 node c

input were spee
of day, and the
and the mom
respectively. T
the motorists’ p
used by the ex
Area. This m
accuracy of th
affected the co
Fig. 9. The congestion classification derived from the BMA
modified and u
system.
the data collec
Thus, it safe to claim that this neural network model
traffic camera,
could achieve higher accuracy in the determination of the
traffic congestion level than the current system operating in
Fig. 8. Image classified as light traffic by ANN
Fig. 7. Image classified as jam traffic by ANN
Bangkok
using
OR technique;
consistencies were greater by
Hình
2.2
Kết
quả
đánh
giá
tình

trạng
giao
thơng
and as jam
traffic
by OR[9].
technique.
and as light traffic by OR technique.
as much as 12.15% with the overall accuracy of the modelWe apprecia
itself reaching 94.99%.
survey particip
In the second case, i.e., jam to light (12.04%), the

2.2 Tình hình nghiên cứu trong nước

analysis revealed that the speed is between 70.19 and
129.41 km/h. All of recorded images, as one example shown
V. CONCLUSION
Cũng
cóclearly
một vài
nghiên
cứu
và was
luậnin văn
in
Fig. 8,
confirm
that the
traffic

light về mảng giám sát giao thông, nhưng thực
ISBN: 978-988-17012-5-1
The
study
employed
the artificial neural network
condition, in which our model classified accurately.
tế nhất vẫn là cơng trình nghiên cứu của ThS Đặng
Quang
Thạch, determine
Bộ môntheĐiều
technique
to automatically
traffic khiển
congestion
levels achieving an accuracy of 94.99% and the root mean
square of 0.1583, based on motorists’ perceptions, with the
10-11-3 node configurations. The weighting priorities of the
8 input were speed (km/h), traffic volume (car/min), the time
of day, and the day of week. The optimized learning rate
and the momentum parameters were 0.3 and 0.2
respectively. The model was 12.15% more consistent with
the motorists’ perceptions than the Occupancy Ratio method
used by the existing system in the Bangkok Metropolitan


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi


học, khoa Điện - Điện tử Trường ĐH GTVT với đề tài cấp Nhà nước[10] Giải pháp sử
dụng hệ thống giám sát giao thông ứng dụng công nghệ xử lý ảnh đã được xây dựng và
thử nghiệm trong khuôn khổ đề tài KHCN cấp Nhà nước, do Trường Đại học GTVT
chủ trì.
Module được sử dụng trong hệ thống khởi tạo và cập nhật ảnh nền nhằm xử lý ảnh
chụp q trình giao thơng. Module này có nhiệm vụ xử lý được ảnh nền (background)
và ảnh tiền cảnh (foreground) để phản ánh chính xác được ảnh của xe đang lưu thông.
Phần mềm xử lý ảnh cịn có Module phát hiện chuyển động có nhiệm vụ xác định có
hay khơng các đối tượng chuyển động trong một khung hình, sau đó tách ảnh đối tượng
chuyển động khỏi ảnh nền và Module phát hiện, phân loại, ghi nhận các tình huống vi
phạm Luật Giao thơng.
Hệ thống này hiện đang được thử tại km192+422 đường cao tốc Pháp Vân. Trong
điều kiện ánh sáng ban ngày và lưu lượng giao thơng bình thường, hệ thống cho kết
quả khá tốt. Để đánh giá sai số chức năng phát hiện xe chuyển làn trái phép, kết quả
tính tốn bằng máy được so sánh với kết quả quan sát bằng mắt thường, theo cách này,
độ chính xác của phần mềm là 97%. Kết quả phát hiện xe chạy tốc độ được so sánh với
súng bắn tốc độ theo nguyên lý Rada, sai số của phần mềm so với súng là 5%.
Một hệ thống khác được đề cập trong tạp chí [11] Hệ thống điều khiển giao thông
và giám sát an ninh hệ thống CadProTMS của nhóm nghiên cứu Phạm Hồng Quang
(2014), Trung tâm Tin học và TínhTốn, Viện Hàn lâm KHCN Việt Nam.

9


Luận Văn Thạc Sĩ

GVHD:TS.Trương Cơng Dung Nghi

Hình 2.3 : Hệ thống CadProTMS
Hệ thống đã được triển khai áp dụng trong tại cao tốc Cầu Giẽ - Ninh Bình. Có cả

tất 22 camera đã được lắp đặt tại 11 vị trí khác nhau dọc tuyến đường cao tốc từ
Km212+480 cho đến Km259+060. Tại mỗi vị trí lắp đặt, có 2 camera để giám sát theo
2 chiều đi khác nhau của đường cao tốc. Các camera được lắp đặt trên các khung giá
long mơn hoặc trên cột có tay vươn ở độ cao trên 6m. Hệ thống xử lý ảnh đã đưa ra
được ngày giờ và vị trí của các lượt đếm xe, biển số xe nhận dạng, tốc độ xe đo được,
phân loại xe theo kích thước, cảnh báo sự kiện xe đi ngược chiều, xe dừng đỗ, xe đi
vào đường cấm…từ nguồn hình ảnh video ghi được do các camera gửi về từ hiện
trường. Từ đây, các dữ liệu sẽ truyền về các cơ quan chức năng (cảnh sát giao thông,
thanh tra giao thông) để phát hiện các xe đi quá tốc độ, lấn đường... và có thể in biên
bản phạt nguội.
Tuy nhiên, camera mới chỉ hoạt động tốt ở thời điểm ánh sáng mạnh, còn vào thời
điểm ban đêm hoặc chiều tối, độ chính xác nhận dạng biển số và đếm số lượng xe có bị

10


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

giảm. Khi mức độ dày đặc phương tiện được gia tăng, việc căn cứ vào một số đặc tính
kỹ thuật khác về kích thước khối hỗn hợp phương tiện, phân tách và nhận dạng vẫn là
vấn đề vẫn cần nghiên cứu tiếp tục.
Một nghiên cứu khác đề xuất bởi Nguyễn Văn Căn[12] với Thuật toán CCAGMMOF - Car Counting Algorithm using GMM and Optical Flow, thuật toán đếm xe
dựa vào việc phát hiện đối tượng dựa vào phương pháp GMM thích nghi với sự thay
đổi ánh sáng kết hợp với luồng quang học.
Bắt đầu
Xác định ROI
Trích chọn khung hình trong ROI
Trích chọn đối tượng6.Thực hiện đếm số


lượng xe
Xác định khối và gán nhãn cho khối đối
Xác định và trích chọn luồng quang học
trên từng khối
Thực hiện đếm số lượng xe

Kết thúc
Hình 2.4 : Sơ đồ khối thuật toán CCA-GMMOF

11


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

Chức năng của các khối:
- Xác định vùng ROI: vùng quan tâm chịu ảnh hưởng của phương pháp đặt camera để
thu nhận dữ liệu video. Có nhiều các để đặt camera như đặt bên hông đường, đặt trực
diện ở tầm cao, đặt trực diện ở tầm thấp. Ở đây xác định đặt camera ở độ cao phù hợp,
ngang tầm với các cầu vượt đường cao tốc để theo dõi trực tiếp phương tiện chuyển
động. Vùng quan tâm được xác định là cặp vạch ảo thiết lập trên làn đường theo chiều
ngang. Khung hình được thu nhận liên tiếp từ vạch thứ nhất (ở xa) và được theo dõi,
phân tích cho đến khi ra khỏi vạch thứ 2 (ở gần).
Căn cứ vào cấu trúc, cầu hình của camera mà xác định số lượng khung hình trích
chọn cho phù hợp. Theo cấu trúc dữ liệu video hiện này thì thường có tốc độ 25
frames/giây. Dùng thuật tốn nắm bắt khung hình kết hợp với đồng bộ trong ngơn ngữ
lập trình có thể thu nhận dữ liệu các khung hình thành file ảnh màu tương ứng.
- Trích chọn đối tượng chuyển động và tiền xử lý: Căn cứ vào các dãy khung hình thu

được, sử dụng BSM, áp dụng mơ hình GMM thích nghi với ánh sáng để phát hiện mặt
nạ đối tượng chuyển động. Ảnh nhị phân được làm sạch bằng phương pháp loại bỏ
nhiễu. Nhiều được xác định là các khối có kích thước nhỏ theo quy ước của một
ngưỡng đối tượng xác định tương ứng trước. Áp dụng phương pháp loại bỏ nhiễu,
những đối tượng khơng phải là đối tượng chuyển động, kích thước bé..ra khỏi mặt nạ
phương tiện chuyển động, tiếp tục nhị phân hóa ảnh mặt nạ phương tiện.
Mặt nạ đối tượng chuyển động chứa các khối chuyển động riêng biệt trong ảnh nhị
phân. Cần phải gán nhãn cho các khối này, hoặc chỉ mục hóa các khối này để chuyển
sang giai đoạn sau là phân tích hình dạng và đường viền.
Xác định và trích chọn luồng quang học trên từng khối: Luồng quang học là đường đi
của một điểm ảnh giữa các khung hình được trích ra từ video. Gọi Po ( xo  yo  zo ) là
điểm ảnh thuộc khung hình I (to ) tại thời điểm to, điểm Pn ( xn  y n  zn ) là điềm ảnh
thuộc khung hình I (tn ) với n>=1. Luồng quang học được xác định khi Po  P1  d với
12


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

d là khoảng cách giữa các điểm ảnh thời điểm to , tn Xác định luồng quang học là xác
định khoảng cách d.
- Thực hiện đếm xe: Thực hiện chọn 1 điểm trên mỗi block khi xuất hiện ở vạch xuất
phát ở xa hướng quan sát, nếu điểm này sau 1 khoảng cách khung hình chạm tới vạch
đích (gần hướng quan sát).

13


Luận Văn Thạc Sĩ


GVHD:TS.Trương Công Dung Nghi

CHƯƠNG 3: NỘI DUNG LÝ THUYẾT VÀ GIẢI THUẬT ĐỀ NGHỊ
3.1 Cơ sở lý thuyết
Việc xử lý video cho những ứng dụng khác nhau cần giải quyết những yêu cầu khác
nhau. Tuy nhiên, chúng có một số điểm chung sau: các đối tượng chuyển động. Như
vậy, việc phát hiện các đối tượng chuyển động là bước đầu tiên của bất kỳ hệ thống xử
lý video nào. Khi tìm kiếm thấy các đối tượng chuyển động mới bắt đầu chuyển sang
bước xử lý khác.

Hình 3.1 : Sơ đồ khối lược đồ chung cho các thuật toán xử lý video
Vấn đề phát hiện đối tượng đang được nghiên cứu và có nhiều ứng dụng trong cuộc
sống. Các đối tượng được phát hiện nhờ những thông tin trong một frame ảnh. Thực tế
thì các Video thu được từ camera có rất nhiều nhiễu, chẳng hạn như sự thay đổi của
ánh sáng, sự thay đổi của thời tiết, lá rung,…Việc phát hiện đối tượng chuyển động gặp
vấn đề khó khăn để xử lý một cách chính xác. Có rất nhiều hướng tiếp cận để giải
quyết vấn đề trên, cần phải dựa vào từng tình huống cụ thể để lựa chọn phương pháp
áp dụng cho thích hợp. Các cơng nghệ thường xuyên được sử dụng để phát hiện đối
tượng chuyển động là phép trừ nền, các phương pháp tĩnh, sự khác biệt về thời gian và
optical flow.
Giới thiệu một số phương pháp phát hiện đối tượng chuyển động trong video:

14


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi


3.1.1 Phép trừ nền
3.1.1.1 Giới thiệu
Nhận dạng đối tượng chuyển động từ một chuỗi ảnh là một nhiệm vụ cơ bản và cốt
yếu trong giám sát video, giám sát và phân tích tình hình giao thông, nhận dạng và theo
dõi người và nhận biết cử chỉ trong giao tiếp giữa người và máy.
Một phương pháp thường được sử dụng để xác định đối tượng chuyển động là trừ
nền(background subtraction). Đây là một phương pháp thường được sử dụng để phân
đoạn chuyển động trong hình ảnh tĩnh. Mỗi khung ảnh sẽ được so sánh với một nền
tham khảo.Các điểm ảnh trong khung ảnh hiện tại có sự khác biệt đáng kể với nền
được xem là đối tượng chuyển động. Các điểm ảnh tiền cảnh này sẽ được xử lý ở bước
định vị và theo dõi.
Phương pháp này sẽ cố gắng phát hiện vùng chuyển động bằng cách lấy từng điểm
ảnh của hình ảnh hiện tại trừ đi cho một ảnh nền tham khảo (reference background
image) được tạo ra bằng cách lấy trung bình các ảnh trong khoảng thời gian khởi tạo
ban đầu. Điểm ảnh nào có hiệu số trên mức ngưỡng được phân loại vào nhóm tiền cảnh
(foreground). Sau khi tạo được ma trận các điểm ảnh tiền cảnh, các thao tác tiền xử lý
hình thái học (morphological) ví dụ như co ảnh (erosion), giãn nở (dilation) và đóng
ảnh (closing) được thực hiện nhằm làm giảm ảnh hưởng của nhiễu và cải thiện vùng
được nhận dạng. Ảnh nền được cập nhật với các ảnh mới theo thời gian để thích nghi
với sự thay đổi của hình ảnh.
Kể từ khi trừ nền trở thành bước đầu tiên trong nhiều ứng dụng thị giác máy tính,
việc tách các điểm ảnh tiền cảnh tương ứng với đối tượng chuyển động một cách chính
xác là rất quan trọng. Mặc dù đã có nhiều giải thuật trừ nền đã được đề xuất trong các
tài liệu, vấn đề nhận dạng đối tượng chuyển động trong môi trường phức tạp vẫn sẽ
chưa được giải quyết triệt để.
Có nhiều vấn đề một giải thuật trừ nền mạnh phải giải quyết được. Xét một chuỗi
ảnh từ một camera cố định quan sát tại một nút giao thơng. Bởi vì xử lý với mơi trường
ngồi trời (outdoor), giải thuật cần thích nghi nhiều mức độ chiếu sáng trong nhiều thời
điểm khác nhau của ngày và xử lý các trạng thái thời tiết đối nghịch như sương mù hay
tuyết làm thay đổi nền. Bóng của các đối tượng nên được loại bỏ để các đặc điểm nhất

qn có thể được trích từ đối tượng trong các bước xử lý sau.
Luồng di chuyển phức tạp ở nút giao thông cũng là một thách thức. Các phương tiện
di chuyển với tốc độ bình thường khi đèn xanh, dừng lại khi đèn đỏ và sẽ không di
chuyển cho tới khi đèn xanh trở lại. Một giải thuật mạnh phải xử lý được đối tượng
chuyển động khi lúc ban đầu vẫn cịn hợp nhất với nền và sau đó khi trở thành tiền
cảnh. Thêm nữa, để thích ứng với các ứng dụng thời gian thực, nó phải đơn giản khi
tính toán và yêu cầu về bộ nhớ thấp, trong khi vẫn xác định chính xác đối tượng trong
video.

15


Luận Văn Thạc Sĩ

GVHD:TS.Trương Cơng Dung Nghi

Mặc dù có nhiều phương pháp đã được công bố, chúng thường chỉ là một phần trong
ứng dụng thị giác máy tính. Một giải thuật trừ nền thường có 4 tác vụ: tiền xử lý
(preprocessing), mơ hình nền (background modeling), nhận dạng tiền cảnh (foreground
detection) và xác thực dữ liệu (data validation).
3.1.1.2 Giải thuật
Mặc dù có rất nhiều tài liệu về giải thuật trừ nền nhưng nhìn chung hầu hết các giải
thuật này đều tn theo 4 thao tác chính: tiền xử lý, mơ hình nền, nhận dạng tiền cảnh
và xác thực dữ liệu. Tiền xử lý bao gồm các bước xử lý ảnh đơn giản chuyển đầu vào
video thô thành định dạng phù hợp với các thao tác xử lý tiếp theo. Mô hình nền dùng
các khung ảnh ở thao tác tiền xử lý để tính tốn và cập nhật mơ hình nền. Mơ hình này
cung cấp mơ tả thống kê về tồn bộ nền. Tiếp theo nhận dạng tiền cảnh xác định các
điểm ảnh trong khung ảnh mà mơ hình nền khơng thể giải quyết thỏa đáng và sau đó
xuất ra một mặt nạ tiền cảnh nhị phân dạng thô. Cuối cùng, xác thực dữ liệu khảo sát
mặt nạ này, loại bỏ các điểm ảnh không tương ứng với đối tượng chuyển động và xuất

ra mặt nạ tiền cảnh hoàn chỉnh. Lĩnh vực tri thức (domain knowledge) và các giải thuật
thị giác tính tốn mạnh thường được sử dụng trong xác thực dữ liệu. Xử lý thời gian
thực là khả thi nếu như những giải thuật phức tạp chỉ áp dụng lên một số
lượng nhỏ các điểm ảnh của tiền cảnh

Hình 3 2 : Sơ đồ giải thuật

Tiền xử lý:
Trong đa số các hệ thống thị giác máy tính, phương pháp làm mịn (smoothing) về
không gian và/hay thời gian thường được sử dụng trong các bước đầu để giảm nhiễu
camera. Làm mịn có thể dùng để loại bỏ nhiễu ngắn hạn của môi trường như mưa hay
tuyết. Với hệ thống thời gian thực, việc giảm kích thước của khung ảnh và tốc độ
khung ảnh sẽ giúp giảm việc xử lý dữ liệu. Nếu camera di chuyển hay có nhiều camera
đặt ở nhiều vị trí, phải sử dụng image registration (kỹ thuật giúp gom các dữ liệu từ các
nguồn khác nhau vào chung một hệ quy chiếu) cho các khung ảnh liên tiếp hoặc từ các
camera khác nhau trước khi tạo mơ hình nền.
Một vấn đề chính trong thao tác này là định dạng dữ liệu được sử dụng bởi các giải
thuật trừ nền. Phần lớn các giải thuật xử lý với cường độ ánh sáng là một giá trị vô
16


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

hướng với mỗi điểm ảnh. Tuy nhiên, với ảnh màu hệ RGB hay HSV, ngày càng phổ
biến trong các tài liệu về trừ nền[9, 17]. Các tài liệu này kết luận rằng màu sắc sẽ giúp
xác định đối tượng chuyển động tốt hơn cường độ sáng trong vùng ít tương phản và ít
có Bóng đổ từ đối tượng. Ngoài ra, các đặc trưng từ điểm ảnh như đạo hàm về không
gian và thời gian để kết hợp các thông tin về cạnh và chuyển động. Ví dụ, giá trị cường

độ và đạo hàm khơng gian có thể kết hợp thành một vùng đơn trạng thái để theo dõi
nền với bộ lọc Kalman. Pless et al. kết hợp cả đạo hàm về không gian và thời gian
nhằm tạo thành mơ hình nền, hằng số vận tốc để xác định tốc độ của các phương tiện.
Hạn chế chính của việc thêm màu hoặc lấy đạo hàm các đặc trưng trong việc tạo mơ
hình nền là làm tăng tính phức tạp cho việc xấp xỉ đặc trưng của mơ hình.
Mơ hình nền (background):
Mơ hình nền là lõi của mọi giải thuật trừ nền. Nhiều nghiên cứu được dành cho việc
phát triển một mơ hình nền đủ mạnh để xử lý với điều kiện thay đổi của môi trường
nhưng đủ nhạy xác định tất cả các đối tượng chuyển động. Có 2 loại phương pháp để
tạo ra mơ hình nền: đệ quy và phi đệ quy.
a. Phương pháp phi đệ quy (non-recursive)
Phương pháp này sử dụng một cửa sổ trượt để ước lượng nền. Nó chứa bộ đệm của
L các khung ảnh trước và ước lượng nền dựa trên sự biến thiên theo thời gian của mỗi
điểm ảnh trong bộ đệm. Phương pháp phi đệ quy thích nghi ở mức độ cao vì nó khơng
phụ thuộc vào lịch sử ngoài những khung ảnh lưu trữ trong bộ đệm. Mặt khác, yêu cầu
lưu trữ có thể là rất nhiều nên cần một bộ đệm lớn để đối phó với tình trạng giao thơng
di chuyển chậm chạp. Với một bộ đệm có kích thước cố định, vấn đề này có thể được
giảm nhẹ một phần bằng cách lưu trữ các khung ảnh tốc độ khung ảnh thấp hơn. Một
số phương pháp phi đệ quy thường sử dụ ng được mô tả dưới đây:
Khác biệt theo khung ảnh (Khung ảnh differencing): Có thể cho rằng đây là phương
pháp mơ hình nền đơn giản nhất, khác biệt theo khung ảnh sử dụng khung ảnh tại thời
điểm t − 1 là mơ hình nền cho khung ảnh tại thời điểm 𝑡. Khi nó chỉ sử dụng một
khung ảnh duy nhất trước đó, trừ ảnh có thể khơng xác định được các điểm ảnh bên
trong của một đối tượng chuyển động lớn và không thay đổi màu.
Bộ lọc trung vị (Median filter): Lọc trung vị là một trong những phương pháp mơ
hình nền được sử dụng phổ biến nhất. Ước lượng nền được định nghĩa là trung bình ở
mỗi vị trí điểm ảnh của tất cả các khung ảnh trong bộ đệm.
Bộ lọc ước lượng tuyến tính (Linear predictive filter): Toyama et al. tính toán nền
hiện tại bằng cách áp dụng một bộ lọc dự đốn tuyến tính trên các điểm ảnh trong bộ
đệm. Các hệ số bộ lọc được ước tính cho mỗi khung ảnh dựa trên các hiệp phương sai

mẫu, làm cho phương pháp này rất khó áp dụng trong thời gian thực.

17


Luận Văn Thạc Sĩ

GVHD:TS.Trương Công Dung Nghi

b.Phương pháp đệ quy (recursive)
Phương pháp này khơng duy trì một bộ đệm cho ước tính nền. Thay vào đó, nó lặp
lại việc cập nhật cho một mơ hình nền duy nhất dựa trên mỗi khung ảnh đầu vào. Kết
quả là, khung ảnh đầu vào trong quá khứ có thể có ảnh hưởng đến các mơ hình nền
hiện tại. So với phương pháp phi đệ quy, phương pháp này lưu trữ ít hơn, nhưng bất kỳ
lỗi nào trong mơ hình nền có thể kéo dài trong một khoảng thời gian dài hơn nhiều.
Một số phương pháp đệ quy được mô tả dưới đây:
Bộ lọc trung vị xấp xỉ (Approximated median filter): Do sự thành công của bộ lọc
trung vị, McFarlane và Schofield đề xuất một bộ lọc đệ quy đơn giản để ước tính trung
vị. Phương pháp này cũng được sử dụng trong mô hình nền cho giám sát giao thơng đơ
thị. Trong chương trình này, ước lượng hoạt động của các trung vị được tăng lên một
khi các điểm ảnh đầu vào là lớn hơn so với ước lượng và giảm một nếu nhỏ hơn. Ước
tính này cuối cùng hội tụ đến một giá trị mà một nửa trong số các điểm ảnh đầu vào lớn
hơn và một nửa là nhỏ hơn giá trị này, đó là, trung vị.
Bộ lọc Kalman (Kalman filter): bộ lọc Kalman là một phương pháp được sử dụn
rộng rãi để theo dõi hệ thống tuyến tính động dưới nhiễu Gauss. Nhiều phiên bản khác
nhau Đã được đề xuất cho mơ hình nền, khác nhau chủ yếu trong khơng gian trạng thái
được sử dụng để theo dõi. Phiên bản đơn giản nhất chỉ sử dụng cường độ sáng.
Karmann và von Brandt sử dụ ng cả hai cường độ và đạo hàm thời gian của nó, trong
khi Koller, Weber, Và Malik sử dụng cường độ và đạo hàm không gian.Bộ trộn các
Gauss (Mixture of Gaussians): Không giống như bộ lọc Kalman theo dõi sự phát triển

của một Gauss duy nhất, phương pháp bộ trộn các Gauss theo nhiều phân phối Gauss
cùng một lúc. Bộ trộn các Gauss duy trì một hàm mật độ cho mỗi điểm ảnh. Vì vậy, nó
có khả năng xử lý nhiều phân phối của nền. Mặt khác, kể từ khi bộ trộn các Gauss là
tham số, các thơng số mơ hình có thể được cập nhật thích nghi mà khơng cần giữ một
bộ đệm lớn các khung ảnh.
Phát hiện tiền cảnh (foreground) :
Phát hiện tiền cảnh là so sánh các khung ảnh video đầu vào với mơ hình nền, và xác
định các ứng cử viên điểm ảnh nền trước từ khung ảnh đầu vào. Ngoại trừ các mơ hình
phi tham số và mơ hình trộn Gauss, tất cả các phương pháp được giới thiệu vào sử
dụng một hình ảnh duy nhất như là mơ hình nền. Cách tiếp cận thường gặp nhất để
phát hiện tiền cảnh là để kiểm tra xem các điểm ảnh đầu vào có khác biệt đáng kể so
với ước tính nền tương ứng:
|(𝑥, 𝑦) − 𝐵𝑡(𝑥, 𝑦)| > 𝑇
(3.1)
Một cách phát hiện tiền cảnh phổ biến là ngưỡng dựa trên số liệu thống kê chuẩn
hóa:
|(𝑥, 𝑦) − 𝐵𝑡(𝑥, 𝑦) − 𝜇𝑑|𝜎𝑑 >𝑇𝑠
(3.2)

18


×