Tải bản đầy đủ (.pdf) (78 trang)

(Luận văn thạc sĩ) Ứng dụng xử lý ảnh để tính lưu lượng xe lưu thông trên đường

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.7 MB, 78 trang )

LỜI CAM ĐOAN

Tơi cam đoan đây là cơng trình nghiên cứu của tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố
trong bất kỳ cơng trình nào khác
Tp. Hồ Chí Minh, ngày 24 tháng 03 năm 2016

ii


LỜI CẢM ƠN
Luận văn này được thực hiện tại Trường Đại học Sư phạm kỹ thuật TP. Hồ Chí
Minh. Để hồn thành được luận văn này tơi đã nhận được rất nhiều sự động viên, giúp
đỡ của nhiều cá nhân và tập thể.
Trước hết, tơi xin bày tỏ lịng biết ơn sâu sắc đến Thầy TS. Nguyễn Thanh Hải đã
hướng dẫn tơi thực hiện nghiên cứu của mình.
Xin cùng bày tỏ lịng biết ơn chân thành tới các thầy cơ giáo, người đã đem lại cho
tôi những kiến thức bổ trợ, vơ cùng có ích trong những năm học vừa qua.
Cũng xin gửi lời cám ơn chân thành tới Ban Giám hiệu, Phòng Đào tạo sau đại học,
Đại học Sư phạm kỹ thuật TP. Hồ Chí Minh đã tạo điều kiện cho tơi trong q trình học
tập.
Cuối cùng tơi xin gửi lời cám ơn đến gia đình, bạn bè, những người đã ln bên
tơi, động viên và khuyến khích tơi trong quá trình thực hiện đề tài nghiên cứu của mình.
Tp. Hồ Chí Minh, ngày 24 tháng 03 năm 2016

iii


TÓM TẮT
Ngày nay dân số và số lượng phương tiện của các thành phố đang tăng lên từng
ngày, ùn tắc giao thơng thường xun xảy ra. Vì vậy nhu cầu kiểm soát mật độ phương


tiện trên các tuyến đường là hết sức quan trọng. Đề tài này đã xây dựng một hệ thống
phát hiện và tính lưu lượng xe lưu thông trên đường dùng xử lý ảnh với dữ liệu ngõ vào
là các video thu được từ camera hoặc máy ảnh đặt trên đường. Phương pháp thực hiện
là trừ nền, xử lý hình thái, phát hiện xe và tính số xe phát hiện được. Đầu tiên, sử dụng
mơ hình Gaussian hỗn hợp để trừ nền, chuyển ảnh màu thành ảnh nhị phân trong đó xe
là các đốm trắng và nền đường là đen. Sau đó sử dụng phép xử lý ảnh hình thái để tơ đầy
các xe thành khối màu trắng thống nhất đồng thời loại bỏ các thành phần không mong
muốn. Kết quả thu được là ảnh nhị phân hồn chỉnh. Cuối cùng sử dụng thuật tốn dán
nhãn để dán nhãn và đếm số lượng xe.
Kết quả mô phỏng trên phần mềm Matlab cho thấy phương pháp này tính tốn số
lượng xe khá chính xác trong trường hợp góc quay camera gần và đủ rõ. Việc xác định
chính xác lưu lượng xe lưu thông trên một tuyến đường sẽ góp phần quan trọng trong
việc đưa ra cảnh báo về mật độ phương tiện, từ đó cải thiện tình trạng ùn tắc giao thông
ở các đô thị hiện nay.

iv


ABSTRACT
Nowadays, the population and number of vehicles in the big cities are increasing
day by day, so traffic jams often occur. Therefore, controlling the density of vehicles on
the roads is very important. This thesis has developed a system to detect and count
circulating traffic flow on the road using image processing, in which video data is
obtained from cameras placed on the road. In this project, methods are background
subtraction, morphological operation, vehicle detection and vehicle counting. First,
Gaussian mixture model for background subtraction is used to transfer color picture into
binary image, in which vehicles are white spots and roads are black. After that, the
morphological operation is employed to fill the white car into an unified block and it is
removed unwanted components to produce a complete binary image. Finally, the
labeling algorithm is applied for labeling and counting the number of vehicles.

Simulation results in Matlab software show that proposed method is quite
accurate in the case of close, clear camera angles. The accuracy of vehicle traffic flow
detection will contribute significantly in making warnings about the density of vehicles
and improving traffic congestion in urban areas.

v


MỤC LỤC
Trang tựa
Quyết định giao đề tài
Lý lịch cá nhân

i

Lời cam đoan

ii

Cảm tạ

iii

Tóm tắt

iv

Mục lục

vi


Danh sách các chữ viết tắt

ix

Danh sách các hình

x

Danh sách các bảng

xi

Chương 1: TỔNG QUAN

1

1.1. Tổng quan về lĩnh vực nghiên cứu, các kết quả nghiên cứu trong và ngồi nước đã
cơng bố.
1
1.1.1. Tổng quan về lĩnh vực nghiên cứu

1

1.1.2. Một số kết quả nghiên cứu đã công bố

3

1.2. Mục tiêu của đề tài


5

1.3. Nhiệm vụ và giới hạn của đề tài

5

1.3.1. Nhiệm vụ:

5

1.3.2. Giới hạn:

5

1.4. Phương pháp nghiên cứu

6

Chương 2: KHÁI QUÁT XỬ LÝ ẢNH

7

2.1. Xử lý ảnh

7

2.1.1. Giới thiệu

7


2.1.2.Một số ứng dụng cơ bản trong xử lý ảnh

7

2.1.3. Xử lý video

8

2.1.4. Một số vấn đề cơ bản trong xử lý video

vi

10


2.2. Theo dõi đối tượng

10

2.2.1. Các thành phần trong xây dựng hệ thống theo dõi đối tượng

10

2.2.2. Các bước chính cần thực hiện trong hệ thống theo dõi đối tượng

12

Chương 3: PHƯƠNG PHÁP TRỪ NỀN

13


3.1. Giới thiệu

13

3.2. Các phương pháp cơ bản

14

3.2.1. Trừ khung

14

3.2.2. Trung bình chạy

15

3.2.3. Trung vị chạy

18

3.3. Phương pháp trừ nền cao cấp

20

3.3.1. Trung bình chạy Gaussian (Gaussian đơn)

20

3.3.2. Mơ hình Gaussian hỗn hợp


20

3.4. Kết luận

24

Chương 4: PHƯƠNG PHÁP HÌNH THÁI VÀ THUẬT TỐN DÁN NHÃN

25

4.1. Phương pháp hình thái

25

4.1.1. Phép co ảnh

26

4.1.2. Phép giãn ảnh

30

4.1.3. Phép mở ảnh

32

4.1.4. Phép đóng ảnh

33


4.1.5. Các bước xử lý hình thái

34

4.1.6. Kết luận

37

4.2. Thuật tốn dán nhãn

37

4.2.1. Mục đích

37

4.2.2. Thành phần liên kết

37

4.2.3. Thuật toán dán nhãn

37

Chương 5: KẾT QUẢ

42

5.1. Sơ đồ khối


42

5.2. Trừ nền dùng mơ hình Gaussian hỗn hợp

42

5.3. Chọn vùng theo dõi

44

vii


5.4. Xử lý hình thái

46

5.5. Loại bỏ nhiễu

52

5.6. Phát hiện xe

53

5.7. Tính số xe

55


Chương 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

60

6.1. Kết luận

60

6.2. Hướng phát triển

60

TÀI LIỆU THAM KHẢO

61

PHỤ LỤC

63

viii


DANH SÁCH CÁC CHỮ VIẾT TẮT
GMM:

Gaussian Mixture Model

BG:


Background

FG:

Foreground

EM:

Expectation Maximization

ROI:

Region of Interest

RGB:

Red Green Blue image

ix


DANH SÁCH CÁC BẢNG
BẢNG

TRANG

Bảng 1.1: Phân loại các thuật toán phát hiện đối tượng

2


Bảng 1.2: Phương pháp trừ nền và phân tích hiệu suất

5

Bảng 4.1: Tập các nhãn thu được sau lần duyệt đầu tiên

40

Bảng 5.1: Đánh giá kết quả chạy mô phỏng

58

x


DANH SÁCH CÁC HÌNH
HÌNH

TRANG

Hình 2.1: Khung hình

8

Hình 2.2: Thước đo độ xám

9

Hình 2.3: Khơng gian màu RGB


9

Hình 2.4: Theo dõi vi phạm giao thơng qua camera

11

Hình 2.5: Các bước cần thực hiện trong quá trình theo dõi tự động

12

Hình 3.1: Kết quả trừ khung với các mức ngưỡng khác nhau

15

Hình 3.2: Ảnh nền và kết quả trừ nền trung bình chạy

17

Hình 3.3: Nền và kết quả trừ nền trung vị chạy

19

Hình 4.1: Phép xử lý hình thái cho ảnh giao thơng với 2 xe di chuyển trên đường 26
Hình 4.2: Phép co ảnh

27

Hình 4.3: Phần tử cấu trúc; (a) là phần tử cấu trúc vuông, (b) là phần tử cấu trúc
đường.


28

Hình 4.4: Phép co ảnh

29

Hình 4.5: Phép giãn ảnh

30

Hình 4.6: Phép giãn ảnh

31

Hình 4.7: Phép mở ảnh

32

Hình 4.8: Phép đóng ảnh

33

Hình 4.9: Phép đóng ảnh

34

Hình 4.10: Sơ đồ các bước xử lý hình thái

35


Hình 4.11: Ảnh gốc và ảnh sau khi trừ nền

35

Hình 4.12: Kết quả của các phép xử lý hình thái

35

Hình 4.13: Kết quả đếm sai, 2 xe thành 1 xe

36

xi


Hình 4.14: Kết quả đếm đúng 2 xe

36

Hình 4.15: Liên kết 4 và liên kết 8

37

Hình 4.16: Minh họa 4 điểm lân cận của X

38

Hình 4.17: Ảnh gốc trước khi áp dụng thuật tốn

39


Hình 4.18: Ảnh sau lần duyệt đầu tiên

39

Hình 4.19: Ảnh sau lần duyệt lần 2

40

Hình 4.20: Dán nhãn liên kết 4 và liên kết 8

41

Hình 5.1: Sơ đồ khối

42

Hình 5.2: Trừ nền bằng mơ hình Gaussian hỗn hợp

44

Hình 5.3: Chọn vùng theo dõi

45

Hình 5.4: Chọn vùng theo dõi

46

Hình 5.5: Các phép xử lý hình thái cho kết quả sai


47

Hình 5.6: Các phép xử lý hình thái cho kết quả đúng

48

Hình 5.7: Xử lý hình thái và kết quả đếm tương ứng

49

Hình 5.8: Xử lý hình thái và kết quả đếm tương ứng

51

Hình 5.9: Một vài kết quả xử lý hình thái khác

52

Hình 5.10: (a), (b) ảnh cần xử lý; (c), (d) là ảnh đã được loại bỏ các đốm nhỏ

53

Hình 5.11: Phát hiện đối tượng với ngưỡng khác nhau

54

Hình 5.12: Dán nhãn

55


Hình 5.13: Kết quả dán nhãn và đánh dấu hộp biên

56

Hình 5.14: Sơ đồ khối đếm tổng số xe cho nhiều khung trong video; xn và xn-1
lần lượt là số xe đếm được của khung hiện tại và khung liền kề trước đó

57

Hình 5.15 : Kết quả đếm

59

xii


Chương 1

TỔNG QUAN
1.1. Tổng quan về lĩnh vực nghiên cứu, các kết quả nghiên cứu trong và ngồi nước
đã cơng bố.
1.1.1. Tổng quan về lĩnh vực nghiên cứu
Việc theo dõi trực tiếp bằng các thiết bị theo dõi hiện đại (camera) là một trong
những chủ đề được phát triển và nghiên cứu rất nhiều trong những năm gần đây. Dựa
vào sự phát triển không ngừng của kĩ thuật xử lý hình ảnh đã giúp cho con người dễ dàng
hơn trong việc triển khai các hệ thống theo dõi tự động thơng minh hơn điển hình như
nó có phát hiện đối tượng chuyển động, phân loại đối tượng, bám đối tượng chuyển
động, dự đốn các hành vi của đối tượng…Vì những lý do đó mà các hệ thống theo dõi
được ứng dụng ngày một rộng rãi hiện nay trong nhiều lĩnh vực của đời sống xã hội.

Một trong những hệ thống theo dõi được sử dụng khá phổ biến hiện nay là hệ
thống theo dõi camera giao thông. Hệ thống này có thể nhận về mật độ các phương tiện
lưu thơng trên một tuyến đường từ đó hệ thống sẽ đưa ra các tín hiệu cảnh báo cho các
tài xế. Điều này góp phần khơng nhỏ trong việc điều tiết giao thơng, nhất là với tình hình
giao thơng của nước ta hiện nay.
Việc phát hiện đối tượng chuyển động không chỉ giúp ích trong việc theo dõi các
đối tượng chuyển động để phát hiện mật độ xe trên một hệ thống giám sát trực tiếp mà
còn mang lại nhiều ứng dụng trong cuộc sống. Các đối tượng được phát hiện nhờ những
thơng tin trong một khung ảnh. Có rất nhiều hướng tiếp cận để giải quyết vấn đề trên sử
dụng nhiều thuật tốn và phương pháp khác nhau. Theo nhóm tác giả Alper Yilmaz,
Omar Javed và Mubarak Shah [1], họ đã phân loại các hướng tiếp cận này thành những
loại như bảng 1.1.

Trang 1


Bảng 1.1: Phân loại các thuật toán phát hiện đối tượng
Loại

Những nghiên cứu liên quan
 Moravec’s detector
 Harris detector

Point detectors

 Scale Invariant Feature Transform
 Affine Invariant Point Detector
 Mean-shift

Segmentation


 Graph-cut
 Active contours
 Mixture of Gaussians
 Eigenbackground

Background Modeling

 Wall flower
 Dynamic texture background
 Support Vector Machines

Supervised Classifier

 Neural Networks
 Adaptive Boosting

Qua bảng trên ta thấy có nhiều hướng tiếp cận để xử lý vấn đề phát hiện đối tượng.
Tuy nhiên việc lựa chọn phương pháp áp dụng thì dựa vào tình huống cụ thể.
Đối với trường hợp có ảnh nền khơng thay đổi thì việc phát hiện đối tượng chuyển
động có thể được thực hiện bằng các phương pháp trừ nền. Chi tiết về các giải thuật này
sẽ được trình bày ở phần sau. Hướng giải quyết thường gặp là xây dựng mơ hình nền,
sau đó sử dụng mơ hình này cùng với khung (frame) hiện tại để từ đó rút ra được các đối

Trang 2


tượng (foreground) chuyển động. Ưu điểm của giải thuật này là đơn giản. Để có thể tiếp
cận theo hướng này thì ta cần phải xây dựng được mơ hình nền (background). Có rất
nhiều phương pháp xây dựng mơ hình nền như: Anurag Mittal dùng adaptive kernel

density estimation để xây dựng mơ hình nền [2]. Phương pháp này cho kết quả tốt tuy
nhiên gặp khó khăn về khơng gian lưu trữ, tính tốn phức tạp, tốc độ khơng đáp ứng thời
gian thực. Stauffer sử dụng Mixture of Gaussian [3] để xây dựng mơ hình nền… Sau khi
đã phát hiện ra được các đối tượng chuyển động thì việc xác định xem những đối tượng
này có đúng là những đối tượng ta cần phát hiện hay khơng cũng là một khó khăn lớn
phải đối mặt.
1.1.2. Một số kết quả nghiên cứu đã công bố
Năm 2009 Serap Kazan và Musa Balta [4] đã ước lượng mật độ giao thông sử
dụng hệ thống quan sát máy tính thời gian thực. Phương pháp được sử dụng là tìm sự
khác nhau giữa 2 khung sau đó xử lý ngưỡng, chọn ngưỡng tối ưu để nhị phân ảnh. Sử
dụng phép xử lý hình thái để loại bỏ nhiễu và lấp đầy các khe hở. Cuối cùng phương
pháp tìm số thành phần kết nối lân cận được sử dụng để tính số xe trong ảnh nhị phân.
Phương pháp này cho kết quả tốt trong trường hợp góc quay của camera gần và rõ nhưng
gặp thách thức khi camera đặt ở vị trí khơng thuận lợi.
Năm 2012 G. SalviAn [5] dựa trên phân tích Blob để tính xe tự động trong hệ
thống giám sát giao thông. Phương pháp thực hiện là trừ nền, phát hiện Blob, phân tích
Blob dùng phương pháp k-means clustering, theo vết Blob và tính số phương tiện. Hệ
thống cho kết quả chính xác cao và đảm bảo tính thời gian thực. Tuy nhiên hạn chế của
hệ thống này là chưa phân loại được xe (xe máy, xe tải, xe ôtô ) di chuyển trên đường.
Năm 2012 Pejman Niksaz [6] đã nghiên cứu và thực thi hệ thống ước lượng mật
độ phương tiện trên đường cao tốc dùng xử lý ảnh. Phương pháp nghiên cứu là chuyển
ảnh RGB thành ảnh xám, tăng cường ảnh và xử lý hình thái. Phương pháp này được thực
thi trên phần mềm Matlab nên chi phí thấp nhưng vẫn cho kết quả chính xác ở tốc độ

Trang 3


cao. Ưu điểm của phương pháp này là không sử dụng cảm biến. Tuy nhiên nhược điểm
lớn nhất của nó là rất nhạy với ánh sáng.
Năm 2013 P. Srinivas và Y.L. Malathilatha [7] cũng đã đề xuất để thực thi một

hệ thống đèn giao thông thông minh trong thời gian thực dùng xử lý ảnh. Phương pháp
thực hiện là trừ nền, cập nhật nền, phương pháp phát hiện biên và tính số phương tiện
dùng thuật tốn Moore-neighborhood. Kết quả cho thấy phương pháp phát hiện biên
Canny cho kết quả tốt hơn so với hai phương pháp phát hiện biên khác là Boolean và
Marr-Hildreth.
Năm 2015 Mrs. Muth Sebastian, Anisha Ann Sam và một số cộng sự [8] cũng đã
thảo luận phương pháp để giảm được tần suất tai nạn ở những đoạn đường quanh co
bằng cách chỉ ra số lượng xe và tốc độ các xe đang đến gần trên màn hình. Phương pháp
được sử dụng là mơ hình Gaussian hỗn hợp (GMM), lọc nhiễu cho mơ hình GMM, phát
hiện Blob, phân tích Blob, tính số phương tiện và tốc độ của nó. Trong đó tốc độ được
giám sát bằng cách phát hiện vị trí của xe di chuyển và vị trí điểm tham chiếu, giá trị này
được so sánh với số khung đã biết trước. Một số cơng trình nghiên cứu khác [9-10].
Qua những nghiên cứu đã trình bày ở trên ta có thể nhận thấy rằng hầu hết các
bài báo đều phát hiện đối tượng (xe) bằng phương pháp trừ nền. Phương pháp trừ nền
được sử dụng nhiều vì nền (đường) trong camera giao thông thường là nền tĩnh. Một số
phương pháp trừ nền đã được Massimo Piccardi [11] tổng hợp lại như bảng 1.2.

Trang 4


Bảng 1.2: Phương pháp trừ nền và phân tích hiệu suất
Method

Speed

Memory

Accuracy

Running Gaussian average


L

L

L/M

Temporal median filter

ns

ns

L/M

Mixture of Gaussians

m

m

H

Kernel density estimation (KDE)

n

n

H


Sequential KD approximation

m+1

m

M/H

Cooccurence of image variations

8n/N2

nK/N2

M

Eigenbackgrounds

M

n

M

1.2. Mục tiêu của đề tài
Mục tiêu của đề tài là xây dựng hệ thống tính lưu lượng xe trên một tuyến đường
từ camera giao thông, từ đó đưa ra cảnh báo về mật độ phương tiện, góp phần vào việc
điều tiết giao thơng, giảm tình trạng kẹt xe ở các đô thị hiện nay.
1.3. Nhiệm vụ và giới hạn của đề tài

1.3.1. Nhiệm vụ:
-

Nghiên cứu các thuật tốn trừ nền cơ bản, xây dựng mơ hình Gaussian để tách
các xe di chuyển ra khỏi nền đường.

-

Tìm hiều về phép xử lý ảnh hình thái, phương pháp dán nhãn để tính số xe trong
một khung ảnh và tổng số xe trong video thu được từ camera giao thông.

1.3.2. Giới hạn:
-

Xử lý video không trực tuyến

-

Chưa phân loại được xe

Trang 5


1.4. Phương pháp nghiên cứu
Phương pháp nghiên cứu tài liệu: thu thập thông tin tài liệu, sách báo điện tử liên
quan đến lĩnh vực nghiên cứu, xử lý các thông tin cùng với việc quan sát và thực hiện
mô phỏng trên phần mềm Matlab.

Trang 6



Chương 2

KHÁI QUÁT XỬ LÝ ẢNH
2.1. Xử lý ảnh
2.1.1. Giới thiệu
Xử lý ảnh là một lĩnh vực mang tính khoa học và cơng nghệ. Nó là một ngành
khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất
nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chun dụng
riêng cho nó.
Q trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra
kết quả mong muốn. Kết quả đầu ra của một q trình xử lý ảnh có thể là một ảnh “tốt
hơn” hoặc một kết luận [12].
2.1.2.Một số ứng dụng cơ bản trong xử lý ảnh
Xử lý ảnh là một trong những ngành khoa học mới nhưng có những thành tựu và
khả năng ứng dụng trong nhiều lĩnh vực [13].
-

Công việc văn phòng: nhận dạng ký tự quang học, xử lý tài liệu, nhận dạng kịch
bản, nhận dạng logo và biểu tượng, xác định vị trí địa chỉ trên phong bì tài liệu và
một số ứng dụng khác.

-

Cơng nghiệp tự động hóa: Cơng nghệ chế tạo rơ-bốt, máy cơng nghiệp, sản xuất.

-

Xử lý ảnh y tế: Phân tích ảnh điện tâm đồ ECG- Electrocardiogram, điện não đồ
EEG- Electroencephalogram, đo điện cơ EMG- Electromyography, phân tích ảnh

X-quang và nhiều ứng dụng quan trọng khác.

-

Remote sensing: Nghiên cứu và quản lý tài ngun thiên nhiên, kiếm sốt ơ nhiễm
mơi trường và các nghiên cứu khác.

Trang 7


-

Kiểm soát tội phạm (Criminology): nhận dạng vân tay, đối sánh mặt người, giám
định pháp y.

-

Ứng dụng trong khoa học vũ trụ: phân tích ảnh viễn thám.

-

Khí tượng học: dự báo thời tiết, xác định thay đổi thời tiết dựa vào ảnh thu nhận
từ vệ tinh, phân tích mẫu mây.

-

Cơng nghệ thơng tin: truyền tín hiệu fax, hội thảo từ xa…Và nhiều ngành khoa
học khác như giải trí, in ấn, nghệ thuật.

2.1.3. Xử lý video

Video là một tập hợp các khung hình (frames). Mỗi khung hình là một hình
ảnh, là đơn vị dữ liệu cơ bản nhất của video. Video có thể được hiểu là một chuỗi các
hình ảnh liên tiếp. Để mắt người có thể cảm nhận được sự chuyển động của các
hình ảnh thì các khung hình phải được phát liên tục với một tốc độ nhất định. Thơng
thường, tốc độ đó là 25 hình/giây hoặc 30 hình/giây.

Hình 2.1: Khung hình
Khơng gian độ xám chỉ có một thành phần, biến đổi từ đen đến trắng. Không
gian độ xám thường được sử dụng trong hiển thị và in trắng đen.

Trang 8


Hình 2.2: Thước đo độ xám
Một khơng gian màu là một mơ hình đại diện cho màu về mặt giá trị độ sáng, một
không gian màu xác định số thông tin màu được thể hiện. Mỗi điểm ảnh trong khung
hình (ảnh) có thể được coi là đại diện của một điểm trong khơng gian màu ba chiều.
Thơng thường có các không gian màu: RGB, CMY, Munsell, CIE,HSV…bên cạnh các
không gian màu này có khơng gian độ xám.
Khơng gian màu RGB là không gian được sử dụng rộng rãi trong hiển thị hình
ảnh. Khơng gian này tạo ra các màu mà mắt người nhìn thấy và cảm nhận được từ ba
màu cơ bản R (Red-đỏ), G (Greeen-xanh) và B (Blue-lam)

Hình 2.3: Không gian màu RGB

Trang 9


Xử lý video được xem là một trường hợp đặc biệt của xử lý tín hiệu.
Trong đó, các tín hiệu đầu vào và đầu ra là các tệp video hay luồng video.

2.1.4. Một số vấn đề cơ bản trong xử lý video
Video là do một chuỗi ảnh liên tiếp chuyển động tạo thành. Để có thể truyền tải
video, các thơng tin và dữ liệu này được mã hóa. Do đó, để có thể xử lý được các tín
hiệu video bên cạnh việc xử lý các vấn đề khách quan như điều kiện ánh sáng, vị trí đặt
camera… ta cũng cần quan tâm tới các vấn đề về tiêu chuẩn nén của video.
Về cơ bản hệ thống xử lý video gần giống với hệ thống xử lý ảnh. Tuy nhiên, do
đặc trưng chuyển động của hình ảnh nên ta cần quan tâm tới các vấn đề:
-

Xác định đối tượng, số lượng đối tượng có trong ảnh

-

Xác định đối tượng chuyển động trong ảnh: các đối tượng dời đi hay chuyển tới,
chuyển động đơn hay chuyển động trong đám đông

-

Tách đối tượng từ một nhóm đối tượng chuyển động

-

Tách đối tượng với bóng của nó

2.2. Theo dõi đối tượng
2.2.1. Các thành phần trong xây dựng hệ thống theo dõi đối tượng
Trong hệ thống theo dõi đối tượng, tất cả các thông tin về hình ảnh thu nhận được
từ camera hoặc hệ thống camera được truyền về trung tâm. Tại đây, các thông tin sẽ
được phân tích, xử lý để đưa ra các quyết định phù hợp. Hệ thống theo dõi đối tượng với
quy mơ nhỏ hay lớn đều cần có:


Trang 10


Hình 2.4: Theo dõi vi phạm giao thơng qua camera
-

Camera (hoặc hệ thống camera -với quy mô lớn): Trong hệ thống nhỏ có thể chỉ
cần một camera. Đối với các hệ thống lớn, ta có một hệ thống camera được đặt
tại các khu vực cần quan sát. Ví dụ: tại một tòa nhà ta cần đặt camera tại bãi đỗ
xe, tại sảnh, cầu thang (cầu thang bộ, cầu thang máy), tại các tầng….

-

Màn hình theo dõi (hoặc hệ thống màn hình): Trên một màn hình có thể đặt tương
ứng với một camera hoặc chia chế độ màn hình hiển thị với các phân vùng ứng
với số lượng camera…

-

Đầu ghi hình DVR độc lập ( hoặc card DVR cắm máy tính)

-

Phịng điều khiển (giám sát): Tại đây đặt màn hình theo dõi của hệ thống. Phịng
có bố trí nhân viên để phụ trách quản lý và điều hành hệ thống.

Trang 11



2.2.2. Các bước chính cần thực hiện trong hệ thống theo dõi đối tượng

Hình 2.5: Các bước cần thực hiện trong q trình theo dõi tự động
Để có thể xây dựng hệ thống theo dõi thông minh, bên cạnh việc thiết lập một hệ
thống phần cứng phục vụ quá trình theo dõi, ta cần phát triển hệ thống phần mềm hỗ trợ
quá trình xử lý. Lược đồ trên (hình 2.5) đã chỉ ra các bước cơ bản cần thực hiện trong
quá trình xây dựng phần mềm hỗ trợ theo dõi tự động.

Trang 12


Chương 3

PHƯƠNG PHÁP TRỪ NỀN
3.1. Giới thiệu
Trong những ứng dụng về thị giác máy tính, vấn đề cơ bản nhất được đặt ra là
làm thế nào để phát hiện được các đối tượng chuyển động trong video (foreground), làm
thế nào để biết được đâu là những cảnh vật không thay đổi (background)… Để giải quyết
được những vấn đề đã nêu ở trên thì ta dùng phương pháp trừ nền. Đây là một trong
những phương pháp nền tảng nhất trong lĩnh vực thị giác máy tính. Có nhiều giải thuật
khác nhau về trừ nền. Các giải thuật này được chia thành hai nhóm là: phương pháp cơ
bản và phương pháp cao cấp. Trong giới hạn của luận văn này sẽ trình bày chi tiết về
những giải thuật trừ nền sau đây:
 Phương pháp cơ bản:
o Trừ khung (Frame Differencing)
o Trung bình chạy (Running Average)
o Trung vị chạy (Running Median)
 Phương pháp cao cấp:
o Trung bình chạy Gaussian (Running Gaussian Average)
o Mơ hình Gaussian hỗn hợp (Mixture of Gaussians)

Ý tưởng chung của các phương pháp trừ nền: để phát hiện ra được các đối tượng
chuyển động trong video chúng ta phải có được mơ hình nền. Mơ hình nền này có thể
được học qua nhiều khung ảnh. Sau đó ta sẽ dùng mơ hình nền này để so sánh với khung
ảnh hiện tại và kết quả là ta sẽ nhận biết được đâu là vùng nền, đâu là các đối tượng.

Trang 13


3.2. Các phương pháp cơ bản
3.2.1. Trừ khung
Trong tất cả các phương pháp trừ nền thì phương pháp trừ khung được xem là
phương pháp đơn giản nhất. Chi phí tính toán thấp, tốc độ thực thi thuật toán nhanh. Tuy
nhiên kết quả đạt được khi ta áp dụng thuật toán này là tương đối thấp.
Ý tưởng chính trong phương pháp trừ khung: các đối tượng chuyển động sẽ được
phát hiện dựa trên sự khác biệt giữa hai frame ảnh liên tiếp nhau cùng với một ngưỡng
được chọn trước. Giải thuật trên được thực hiện bằng phương pháp trừ hai khung liên
tiếp, đối với mỗi giá trị pixel kết quả ta so sánh giá trị tại pixel đó với ngưỡng đã được
chọn. Nếu giá trị này nằm trong ngưỡng cho phép thì tại đó ta xem như là nền. Ngược
lại là đối tượng [14].
|𝐹𝑡+1 − 𝐹𝑡 | < 𝑡ℎ

(3.1)

trong đó:
 Ft+1: khung ảnh thứ t - 1
 Ft : khung ảnh thứ t
 Th là giá trị ngưỡng được chọn và độ chính xác của thuật tốn phụ thuộc vào giá
trị ngưỡng này.
Ưu điểm: Đơn giản và dễ thực hiện, tốc độ thực thi nhanh. Tuy nhiên thuật tốn
này chạy chính xác trong trường hợp các đối tượng di chuyển liên tục, nền trong video

là nền tĩnh.
Khuyết điểm: Độ chính xác của thuật toán là tương đối thấp. Thuật toán trên chỉ
xác định đối tượng chính xác đối với những điểm biên của đối tượng. Đối với những
điểm ảnh bên trong lòng đối tượng do sự dịch chuyển của những điểm ảnh này là không

Trang 14


×