Tải bản đầy đủ (.pdf) (6 trang)

BIỂU DIỄN MỘT SỐ ĐẶC TRƯNG ẢNH ÁP DỤNG ĐỂ PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG TRONG VIDEO.

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (625.93 KB, 6 trang )

Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông-Đắk Lắk,30-31/10/2014

1

BIỂU DIỄN MỘT SỐ ĐẶC TRƯNG ẢNH ÁP DỤNG ĐỂ PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG
TRONG VIDEO.

Nguyễn Văn Căn, Nguyến Đăng Tiến, Dương Phú Thuần, Trần Xuân Ban
Trường Đại học Kỹ thuật – Hậu cần CAND
, ,

TÓM TẮT- Mục đích của bài viết này là trình bày một
số phương pháp biểu diễn đặc trưng ảnh phục vụ cho
phát hiện và phân loại phương tiện giao thông từ
video: trích chọn đối tượng chuyển động bằng phương
pháp luồng quang học; biểu diễn hình dạng đối tượng;
biểu diễn đường viền trên trường số phức, biểu diễn
đường viền theo đỉnh hình dạng. Đề xuất một khung
làm việc chung cho hệ thống phân loại và xác định mật
độ phương tiện giao thông từ video trong vùng quan
sát.
Keywords: Optical Flow, Contour Analysis, Car
Counting, Shape Detection.
I. GIỚI THIỆU
Bài toán phát hiện và phân loại phương tiện giao
thông trong video có nhiều ý nghĩa trong thực tế
quản lý giao thông. Các tham số về phương tiện
giao thông, có nhiều ý nghĩa trong việc xác định
chứng cứ vi phạm luật giao thông, điều khiển giao
thông, giải quyết tranh chấp trong hiện trường tai
nạn Để đáp ứng điều kiện giao thông Việt Nam,


khi mà giao thông đông đúc, đa dạng thì việc lựa
chọn những kỹ thuật, phương pháp trích chọn đặc
trưng, biểu diễn mô hình đối tượng là hết sức quan
trọng cho giải quyết bài toán phát hiện và phân loại
phương tiện giao thông từ video.
Các đặc trưng của phương tiện chuyển động
trong video được chia thành 2 mức tiếp cận: mức
cục bộ và mức toàn cục. Mức toàn cục quan tâm
đến các đặc trưng toàn cảnh như nền, đối tượng
chuyển động, khối, đốm sáng. Mức cục bộ quan tâm
đến các vấn đề xử lý bóng, xử lý khoảng cách,
đường biên,
Đặc trưng tiếp cận ở mức toàn cục: Vùng quan
tâm (ROI); Video và frame; Đối tượng chuyển động
và nền; Khối chuyển động; Đốm sáng; Đặc trưng
tiếp cận ở mức cục bộ: Đối tượng chuyển động và
bóng của nó; Độ dài ảnh; Hình dạng đối tượng; Mức
xám khu vực đèn trước/sau xe; Mức xám và đặc
điểm khu vực biển số xe; Các đường biên ngang
trên xe;
Trên thế giới, nhiều công trình nghiên cứu đã
quan tâm đến vấn đề này. Năm 2004, Yigithan
Dedeoglu và cộng sự [3] nghiên cứu một hệ thống
giám sát phân loại đối tượng chuyển động. Hệ thống
cho kết quả phân loại: người, nhóm người và
phương tiện giao thông tương ứng là 84%, 66%,
79%. Năm 2007, Guohui Zhang và cộng sự nghiên
cứu hệ thống phát hiện và phân loại xe dựa trên
video (VVDC) [6] được phát triển cho hệ thống
camera giám sát tầm rộng nhằm mục đích thu thập

thông tin các xe tải. Kết quả thu được là độ chính
xác để phát hiện ra xe lên đến trên 97%, và tỷ lệ lỗi
khi đếm xe tải thấp hơn 9% trong cả ba lần thử
nghiệm. Tiếp cận theo hướng này, chủ yếu là phát
hiện được xe tải, xác định và phân hoạch được sự
khác biệt giữa 2-3 xe con nối tiếp nhau và xe tải
dài Chưa tiếp cận và nói đến việc nhận dạng và
đếm số lượng xe máy, xe thô sơ và người đi bộ.
Năm 2009, Umesh Narayanan [5] đã phát triển một
hệ thống phân loại và đếm số lượng phương tiện
dựa trên thị giác máy tính thông qua camera giám
sát. Phân loại từng xe qua sử dụng kích thước xe.
Độ chính xác thực nghiệm chứng minh khoảng
90%. Năm 2010, Chung-Cheng Chiu và cộng sự
[56], phát triển một hệ thống giám sát giao thông
thời gian thực, bao gồm phát hiện, nhận dạng và
theo dõi các phương tiện từ các ảnh chụp trên
đường. Phương pháp phân đoạn và nhận dạng sử
dụng chiều dài, chiều rộng và kích thước mui xe để
phân loại các phương tiện như xe tải lớn, xe con, xe
tải nhỏ hoặc các phương tiện lớn khác. Kết quả xác
định phát hiện các loại xe, từ xe tải to đến các xe
con, xe chuyên dùng mini, có độ chính xác phân
bố từ 90% đến 98%.
Các phần tiếp theo, chúng tôi tập trung vào biểu
diễn hình dạng đối tượng, đường viền đối tượng,
mục đích sử dụng cho phân loại phương tiện giao
thông, trong điều kiện mật độ phương tiện đông
đúc, đa dạng, có sự chồng lấp lên nhau về hình
dạng. Các phương pháp trích chọn luồng quang học,

biểu diễn hình dạng, biểu diễn đường viền, độ dài
ảnh được trình bày trong mục II; một số kết quả áp
dụng thực nghiệm được trình bày trong mục III, kết
luận và hướng phát triển trình bày trong mục IV.
II. PHƯƠNG PHÁP
A. Trích chọn luồng quang học
Bề ngoài của đối tượng không có nhiều thay đổi
[1] (về cường độ sáng) khi xét từ frame thứ n sang
frame n+1. Nghĩa là:

)1,(),(  tuxItxI
 (1)
Trong đó là hàm trả về cường độ sáng [4]của
điểm ảnh tại thời điểm t (frame thứ t) là tọa độ của
điểm ảnh trên bề mặt (2D), là vector vận tốc, thể
hiện sự thay đổi vị trí của điểm ảnh từ frame thứ t
sang frame t+1).
Gọi x
t
= {x
m,t
; m =1,…,M} là tập các đối tượng
tại thời điểm t. Trong đó, M là số đối tượng có trong
hệ thống, M có thể thay đổi theo thời gian. Gọi 


là
tập biểu diễn kết quả phát hiện đối tượng của hệ tại
thời điểm t tương ứng. Ta có




 


    

 (2)
D là số đối tượng phát hiện được.
Gọi 


 


 





 

 


 với ngưỡng cho trước là tập các kết quả
phát hiện “cũ”, được hiểu theo nghĩa, nếu một phát
hiện trong thời điểm t quá gần với một trạng thái đã
có tại thời điểm t-1 thì nó sẽ được xem là trùng với

đối tượng đó. Một cách gần đúng, giả định những
Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông-Đắk Lắk,30-31/10/2014

2

phát hiện này xuất phát từ đối tượng đã có từ thời
điểm t-1 trước đó.
Tương tự, định nghĩa 


 





là tập
những phát hiện “mới”, được hiểu là giữa tập các
điểm mới và tập các điểm cũ cách nhau một khoảng
là d.
B. Tính độ dài thực của đối tượng từ ảnh
Các tham số về kích thước của ô tô rất quan
trọng để nhận ra các loại xe khác nhau trên đường
như chiều dài và chiều rộng của xe. Chiều dài, chiều
rộng ảnh của mỗi kiểu xe để tiếp cận với chiều dài
và chiều rộng thực tế của xe; và tất nhiên đề xuất
phương pháp nhận dạng ô tô dựa trên chiều dài và
chiều rộng ảnh.
Hình 1 mô tả việc sử dụng quang hình học để
tìm mối quan hệ giữa chiều dài pixel R trong ảnh

phẳng với chiều dài ảnh Dh1 trên đường. Đường đứt
nét F là đường tâm của camera, Dh1 là chiều dài thị
giác của phương tiện phía trên đường đứt nét F. R
2

và R
1
là các chiều dài pixel trong ảnh phẳng, R
p

kích thước điểm ảnh của camera. H là độ cao của
camera, f là tiêu điểm của ống kính, θ là góc của
camera với mặt đường. Ta có:
 


(3)

Hình 1. Chiều dài giữa ảnh và đối tượng chuyển động

D
1
và D
2
có thể thu được từ các biểu thức:


cos
sin
1

1
1
DF
D
f
RR
p


(4)


cos
sin
2
2
2
DF
D
f
RR
p


(5)














cossinsincossin
1
1
1
1
1
p
p
p
p
RRf
RR
H
RRf
FRR
D
(6)














cossinsincossin
2
2
2
2
2
p
p
p
p
RRf
RR
H
RRf
FRR
D
(7)
Chiều dài ảnh Dh1:














cossincossinsin
1
1
1
2
2
12
pp
p
RRf
R
RRf
R
HR
DDDh
(8)
Chiều dài ảnh Dh2 của ô tô phía dưới đường F
có thể tính bằng biểu thức:














cossin
3
cossinsin
2
34
4
34
pp
p
RRf
R
RRf
R
HR
DDDh
(9)
Khi đã tính được chiều dài ảnh, có thể dùng thủ
tục tương tự để tính chiều rộng ảnh của ô tô. Chiều
rộng ảnh được xác định bởi biểu thức:
f

D
H
R
Dw
f
DhF
Rw
Dw
w













cos
sin
1
cos1
1
(10)
f
D

H
R
Dw
f
DhF
Rw
Dw
w













cos
sin
2
cos22
3
(11)
Rw là chiều rộng tính bằng pixel của ô tô trong
ảnh phẳng. Dw1 và Dw2 biểu diễn chiều rộng thị
giác tương ứng của ô tô phía trên và phía dưới

đường tâm F.
Tính được các chiều dài và chiều rộng ảnh trung
bình của các xe khác nhau bằng các kiểm thử liên
tiếp. Mặc dù chiều cao của xe gây ra sai số không
đáng kể trong việc ước lượng chiều dài, nhưng vẫn
có thể xác định chính xác loại xe trên đường nhờ sử
dụng các tham số của nhà sản xuất.
C. Véc tơ hóa hình dạng đối tượng
Cho một bức hình chứa một đối tượng, với bố
cục nền không phức tạp, dễ dàng phát hiện được
biên đối tượng, và trích chọn nội dung đối tượng để
làm đặc trưng cho bức ảnh. Phương pháp biểu diễn
hình ảnh thông qua lược đồ khoảng cách thực hiện
dựa trên các hình đa giác và trọng tâm của đa giác,
trước khi đối tượng được biểu diễn thực hiện tìm
xấp xỉ của hình dạng đó (thuộc tính hình học).

a) Đường tròn gốc

b) Với 8điểm cơ bản
Hình 2. Mô tả hình dạng hình tròn
Hình 2 cho thấy, khi số lượng điểm cơ bản trên
biên của hình tròn càng tăng thì hình mô tả sẽ gần
giống hơn đối với hình ảnh gốc, và các điểm biên cơ
bản này luôn được căng đều trên biên, đồng thời
dây cung nối giữa các điểm này sẽ tạo lên đường
mô phỏng hình dạng gốc.
Công việc xác định điểm cơ bản được thực hiện
bằng cách, duyệt lần lượt các điểm ảnh biên theo
thứ tự ngược hoặc xuôi chiều kim đồng hồ. Thu

được tổng số điểm ảnh trên biên của đối tượng, sau
Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông-Đắk Lắk,30-31/10/2014

3

đó chia đều theo số điểm cơ bản cho trước theo
công thức sau:






(12)
với L
rounded
là khoảng cách giữa các điểm cơ bản
trên biên đã được làm tròn, L
sum
là tổng chiều dài
của biên ảnh, và N là số lượng điểm cơ bản cho
trước.
Trọng tâm của đa giác. Cho hình đa giác bất
kỳ, có các đỉnh (x
i
,y
i
) với i = 0,1,2,…n, x
0
=x

n
,y
0
=y
n.

Hình 3. Đa giác có n cạnh
Diện tích của đa giác:
 







 





(13)
Áp dụng định lý Green trên mặt phẳng, xác định
tọa độ trọng tâm của đa giác:
 







































 



































(14)
Khoảng cách giữa điểm mẫu và trọng tâm. Điểm
mẫu là tập hợp các điểm được chọn trên đường biên
của hình dạng để mô tả đầy đủ cho một hình dạng.
Nếu một đa giác có chiều dài một biên là L
i
, tổng
chiều dài của tất cả biên là L
sum
và số lượng điểm
mẫu là N thì số lượng điểm mẫu sẽ là N
i
:







N (15)
Khoảng cách từ điểm mẫu có tọa độ s

i
= (x
i
,y
i
)
và trung tâm đa giác có tọa độ c=(x
c
,y
c
), được tính
theo công thức Ơclit:










 



 

 




 (16)
Lược đồ khoảng cách. Lược đồ là một công cụ
miêu tả các thuộc tính của đối tượng. Các điểm mẫu
sẽ được đặt cách đều nhau trên biên của đa giác, đặt
khoảng cách giữa hai điểm mẫu kề nhau là D, và
tổng độ dài của biên sẽ là D
max
, phân tách D thành
nhiều phần thông qua các điểm mẫu. Dãy sau thể
hiện phân tách biên thành R thành phần:












 

  







 (17)
Chuẩn hóa. Gọi D[i] là tập giá trị khoảng cách từ
tâm C đến các điểm mẫu trên biên. Ta có tập DS
(chuẩn hóa) được chuẩn hóa như sau:











(18)
Sau quá trình chuẩn hóa, tất cả khoảng cách
chuẩn hóa thu được sẽ nằm trong khoảng [0,1]. Bởi
vì việc gán điểm mẫu dựa trên chiều dài của biên,
và căng đều chúng trên biên, hai đa giác có kích
thước khác nhau nhưng hình dạng giống nhau sẽ
sinh ra giá trị khoảng cách chuẩn hóa. Do đó,
phương pháp này là bất biến đối với tỷ lệ sau khi
chuẩn hóa.
Đo độ tương tự. Lược đồ khoảng cách của một đa
giác có thể được mô tả bằng: (d
0

,d
1
,d
2
,d
3
,…d
n
), n là
số lượng khoảng cách trong lược đồ và d
i
, i  [0,n-
1] là số khoảng cách trong vùng khoảng cách này.
Theo đó cho hai đa giác D1 và D2 với lược đồ
khoảng cách tương ứng là D1: (d
11
,d
12
,d
13
,…,D
1n
)
Và D2: (d
21
,d
22
,d
23
,…,d

2n
), có độ tương tự được tính
theo khoảng cách ơ-clit:







 



 





(19)
Biểu diễn hình dạng đối tượng theo trọng tâm và
khoảng cách từ tâm đến biên đối tượng, áp dụng các
tính chất bất biến quay, bất biến tỷ lệ của mô-men
mang đến khả năng nhận dạng và phân loại đối
tượng theo hình dạng. Điều này có thể áp dụng phân
loại phương tiện giao thông trên đường trong trường
hợp đông đúc, có sự chồng lấp lên nhau về hình
dạng sau khi thực hiện phát hiện khối chuyển động.
Trong điều kiện giao thông đô thị đông đúc, các xe

ô tô, xe máy, người đi bộ có thể đi sát nhau và tạo
thành các khối chuyển động có hình dạng phức tạp
và khó có thể phân định được bằng các phương
pháp thông thường. Để thực hiện nhận dạng và xác
định số lượng đối tượng có thể áp dụng thuật toán
máy học. Tạo ra một tập huấn luyện các khả năng
có thể, sau đó đối sánh và kết luận về số lượng
phương tiện chuyển động.
D. Biểu diễn đường viền theo véc tơ số phức
Đường viền là đường bao của đối tượng, thường
là các điểm ảnh, phân tách đối tượng với nền. Phân
tích đường viền (Contour Analysis - CA) cho phép
mô tả, lưu trữ, so sánh và tìm ra các đối tượng biểu
diễn dưới dạng đường viền. CA cho phép giải quyết
hiệu quả các bài toán cơ bản của nhận dạng mẫu –
biến đổi, quay và tỷ lệ của ảnh đối tượng. Phương
pháp CA là bất biến đối với phép biến đổi[7].
Thay vì đó, trong CA đường viền được biểu diễn
bằng một dãy các số phức. Trên một đường viền,
điểm bắt đầu cần được xác định. Tiếp theo, đường
viền sẽ được quét (xoay theo chiều kim đồng hồ), và
mỗi véc tơ được biểu diễn bằng một số phức a+ib.
Với a là điểm trên trục x, b là điểm trên trục y. Các
điểm được biểu diễn kế tiếp nhau.
Do tính chất vật lý của các đối tượng ba chiều,
đường viền của chúng luôn khép kín và không tự
giao nhau. Nó cho phép xác định rõ ràng một duyệt
qua một đường viền. Vector cuối cùng của một
đường viền luôn luôn dẫn đến điểm khởi đầu.
Mỗi vector của một đường viền chúng ta sẽ đặt

tên vector cơ sở (EV). Và chuỗi giá trị các số phức
Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông-Đắk Lắk,30-31/10/2014

4

gọi là vector đường viền (VC). Vector đường viền,
ký hiệu bằng chữ cái Γ, và vector cơ sở ký hiệu là .
Như vậy, vector đường viền Γ có độ dài k có thể
được xác định là:
(20)


Hình 4. Biểu diễn đường viền bằng véc tơ số phức

Thao tác trên đường viền như là thao tác trên
véc tơ số phức có chứa nhiều đặc tính toán học hơn
là các mã biểu diễn khác. Về cơ bản, mã số phức là
gần với mã hai chiều khi mà đường viền được định
nghĩa phổ biến bằng véc tơ cơ bản trong tọa độ 2
chiều.
Đặc tính của đường viền
1. Tổng các EV của một đường viền kín bằng 0.
2. Véc tơ đường viền thì không phụ thuộc vào
phép chuyển vị song song của ảnh nguồn.
3. Quay ảnh theo một góc độ nào đó tương
đương với quay mỗi EV của đường viền trên cùng
góc độ đó.
4. Việc thay đổi điểm khởi đầu tiến hành theo
vòng tròn VC.
5. Thay đổi tỷ lệ ảnh nguồn có thể được coi là

phép nhân của mỗi EV của đường viền với một hệ
số tỷ lệ.
Tích vô hướng của đường viền:
Hai véc tơ số phức của 2 đường viền Γ và N,
tích vô hướng của nó là
 












(21)
với k – kích thước của VC, γ
n
là véc tơ cơ sở của
đường viền Γ, ν
n
là véc tơ cơ sở của đường viền N.

n
, ν
n
) là tích vô hướng của hai số phức.

Nếu tích càng lớn, góc càng nhỏ giữa các vector,
thì các vector này sẽ càng gần nhau. Với những
vector vuông góc, tích này bằng 0, và hơn nữa có
thể nhận giá trị âm cho những vector có hướng khác
nhau theo cách này. Tích vô hướng (21) cũng có các
đặc tính tương tự.
Tích vô hướng chuẩn hóa (NSP):
 






(22)
|Γ| và |N| - Tiêu chuẩn (chiều dài) của đường
viền được tính bằng công thức:




 










(23)
NSP trong không gian phức cũng là một số
phức. Do vậy, tính đồng nhất là giá trị lớn nhất có
thể của chuẩn NSP (Theo bất đẳng thức Cauchy-
Bunyakovsky Schwarz): |ab| <= |a||b|, và chỉ có thể
đạt được giá trị này khi và chỉ khi:
   (24)
Với μ – Là một số phức tùy chọn.
Đường viền μN giống với đường viền N, ngoại
trừ xoay và tỉ lệ. Tỉ lệ và hướng xoay được định
nghĩa bởi một số phức μ .
Dạng chuẩn của NSP đạt giá trị max, chỉ khi
đường viền Γ giống với đường viền N, nhưng xoay
theo một số góc và tỉ lệ bởi một hệ số xác định.
Ví dụ, ta coi một tích vô hướng của một đường
viền với chính nó, nhưng xoay một góc nhất định:

Hình 5. Tích vô hướng chuẩn trên đường viền
Tương tự, nếu ta tăng một VC với một hệ số
thực nào đó, ta sẽ nhận giá trị NSP = 1.
Chuẩn NSP là bất biến trong phép chuyển dịch,
xoay và tỉ lệ của đường viền. Nếu 2 đường viền
tương đồng nhau, NSP của chúng sẽ luôn cho giá trị
đồng nhất, không phụ thuộc vào vị trí của đường
viền, hay độ xoay của góc và tỉ lệ của chúng. Tương
tự, nếu các đường viền khác nhau, NSP sẽ bị giới
hạn nhỏ hơn 1, và độc lập trong không gian, độ
xoay và tỉ lệ. Chuẩn đưa ra giá trị đo của một đường
viền và tham số của một NSP – đưa ra một góc xoay

của đường viền
E. Biểu diễn đường viền theo đỉnh hình dạng
Về cơ bản, mô hình biểu diễn hình dạng tổng
quát GDM (Genaral Deformable Model) là một mô
hình hình chữ nhật 3-D với 8 đỉnh. Các đỉnh hình
dạng của xe được xấp xỉ tương ứng trên các đỉnh
của một hình hộp 3-D. Dựa vào mô hình này có thể
suy diễn ra những điểm che khuất của đường viền
một khối các phương tiện có chứa sự chồng lấp.
Mô hình đỉnh hình dạng VSM (Vertex Shape
Model) là thiết lập mối quan hệ giữa vị trí quan sát
camera (Q
c
= [X
c
Y
c
Z
c
]
T
) và số các đỉnh n
v
trên
đường viền GDM, biểu diễn như trên một bức ảnh
(hình 7).
Vì mỗi GDM có 8 đỉnh trong 3-D và 6 đỉnh
trong trong 2-D, n
v
là một trong số (6, 5, 4). Để thu

được mô hình n
v
tương ứng với Q
c
, sử dụng “mặt
phẳng mở rộng ảo p
i
e
” trên GDM trong không gian
3-D, được định nghĩa là bề mặt của GDM từ + đến
- trong không gian nhưng ngoại trừ bề mặt của của
Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông-Đắk Lắk,30-31/10/2014

5

chính GDM. Mối quan hệ giữa n
v
và Q
c
được tổng
hợp trong bảng 1.

Hình 6. Mô hình biểu diễn hình dạng tổng quát GDM xe thứ
i.
Bảng 1. Mô hình đỉnh hình dạng VSM
Q
C
n
v


Vị trí trong không gian đường bao bởi 4 P
e
i

bề mặt của GDM (hình 3-10a)
hoặc Vị trí một của P
e
i
và đường bao của 2 P
e
i

khác được phân tách bởi GDM (hình 3-10b)
4
hoặc Vị trí của một P
e
i
nhưng không bao 2 P
e
i

khác được phân tách bởi GDM (hình 3-10d)
5
Còn lại
6

Mô hình CDM (Contour Description Model)
biểu diễn một tập hợp các hướng nguyên thủy để
mô tả những phác thảo của hình chiếu GDM đối với
các điểm biến mất p

x
, p
y
, và p
z
trong ảnh, với p
y

điểm biến mất trên đường, p
x
là điểm biến mất
vuông góc với hướng đường, và p
z
là điểm biến mất
vuông có với mặt đất (hình 9).

Hình 7. Mặt phẳng ảo mở rộng P
e
i
.

Giả thiết rằng tất cả các xe bị che khuất chia sẻ
cùng nhau 1 tập các điểm biến mất. Hướng của các
phân đoạn đường được mô tả trong tập biến mất là
“a”, “b”, “c”, “A”, “B” và “C” đối với quan hệ của
chúng với p
x
, p
y
, và p

z
với “a” biểu thị đường cắt
với p
y
khi nó kéo ra vô cùng, và hướng của đường
kéo ra xa từ p
y
khi GDM xoay theo chiều kim đồng
hồ.



(a) Kiểu S
4

(b) kiểu S
5



(c) Kiểu S
61

(d) kiểu S
62


Hình 8. Kiểu hình dạng của hình chiếu biểu diễn hình học
tổng quát GDM.



Hình 9. Kiểu hình dạng thể hiện ra ngoài của GDM

Mô hình RM (Resolvability Model) công thức
hóa tối đa các đường của đường viền GDM cho
phép hoàn thiện hoặc che khuất một phần trong ảnh,
hình dạng gốc của GDM phục hồi dựa trên các
thông tin đưa ra bởi các đường không bị che khuất
và che khuất một phần. Trong trường hợp không bị
che khuất, các chiếu GDM lên hình bao gồm một
mô tả đầy đủ các dòng. Khi có một phần bị che
khuất, dòng trên GDM có thể đi trên một trong ba
trạng thái sau:
1) Không bị che khuất
2) Che khuất 1 phần
3) Che khuất hoàn toàn (hình 10)



Trạng thái của các
đường thẳng trong
khu vực tắc nghẽn.
a) GDM gốc
trong S
4
.
b) n
occ
= 1 trong S
4

.



c) hình b không thể
phân giải.
d) n
p
= 1 và n
occ

= 0 trong S
4
.
e) hình d phân giải lại.
Hình 10. Khả năng phân giải của S
4
.
Có 3 trạng thái có thể xảy ra trên mỗi đường của
4 kiểu hình dạng được giới thiệu trong phần trước
(S
4
, S
5
, S
6,1
và S
6,2
). Để lấy được tập quy tắc mô
hình phân giải GDM, phải tổng hợp tất cả các kết

Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông-Đắk Lắk,30-31/10/2014

6

hợp có thể của 3 trạng thái (ví dụ như không bị che
khuất, che khuất 1 phần, che khuất hoàn toàn) trên
mỗi trường hợp của 4 kiểu hình (S
4
, S
5
, S
6,1
và S
6,2
)
và cố gắng hoàn thiện các đường bị thiếu để tổng
hợp mẫu dựa trên các đường đã có.
III. THỰC NGHIỆM VÀ BÀN LUẬN
A. Áp dụng trích chọn luồng quang học và mô hình
hỗn hợp Gaussian [2] cho hệ thống đếm phương
tiện giao thông trên đườngc ao tốc
Thực nghiệm so sánh trên một số đoạn video tại
một số cung đường khác nhau. Máy quay cố định,
đặt ở độ cao 5 mét, góc quay 30
o
, đối với cung
đường sân bay Nội bài, máy quay đặt ở độ cao 10m.
Sau khi tiến hành thử nghiệm và so sánh với các kỹ
thuật trừ ảnh và trừ nền về mức độ lỗi trung bình, độ
nhiễu và tỷ lệ chính xác khi gặp phải nguồn ảnh

hoặc nguồn video chất lượng thấp, hoặc mức độ dày
đặc của dòng phương tiện thì phương pháp lồng
quang học kết hợp tái chọn mẫu đạt được độ ổn
định qua bảng đánh giá sau:
Bảng 2. So sánh phản ứng của phương pháp với mật độ xe trên
các cung đường
Cung
đường

Số
frames
Mật độ
xe
Số
lượng
thực
Số
lượng
đêm
Độ
chính
xác
Cầu Như
Quỳnh
1450
Rất
thưa
35
35
100%

Đại lộ
Thăng
Long
1110
Tương
đối thưa
115
120
95.83%
Sân bay
nội bài
462
Trung
bình
70
80
87.50%
Cầu
Thanh
Trì
1450
Rất dày
đặc
170
185
87.17%
B. Thực nghiệm phương pháp phân loại xe ô tô theo
độ dài ảnh
Hệ thống được cài đặt thử nghiệm và cho kết
quả tốt về độ chính xác. Tham số chiều rộng, chiều

dài trung bình một số loại xe của nhà sản xuất trong
bảng được so sánh trong bảng 3.
Bảng 3. So sánh tham số kích thước xe với thực tế

Rộng
Dài
Cao
BMW ước tính
1.67
4.25
1.35
BMW thực
1.74
4.47
1.41
Chênh lệch
0.47
0.22
0.06
Tỷ lệ lỗi (%)
4.02
4.92
4.26

IV. KẾT LUẬN VÀ BÀN LUẬN
Bài báo đã trình bày tổng quan về một số đặc
trưng của phương tiện trích chọn từ video giao
thông. Đề xuất một số phương pháp biểu diễn đặc
trưng phương tiện sử dụng cho mục đích xác định
mật độ và phân loại. Bao gồm:

1. Trích chọn luồng quang học áp dụng cho mục
đích đếm số lượng phương tiện tham gia giao thông.
2. Phương pháp biểu diễn hình dạng, đường viền
của phương tiện hoặc một tập các phương tiện dính
liền nhau thành một khối có thể phân giải và phân
loại.
3. Tham số độ dài ảnh kết hợp với các tham số
độ dài thực đối tượng có thể phân loại nhanh loại
đối tượng, hoặc phân giải loại đối tượng.
4. Áp dụng một số phương pháp biểu diễn
phương tiện đã trình bày cho một số hệ thống nhận
dạng và phân loại phương tiện trong video giao
thông.
Mặc dù, tất cả các đề xuất trong nghiên cứu này
có thể làm việc tốt trong một số trường hợp, các mô
hình vẫn còn dễ bị lỗi và tốn thời gian. Chúng tôi tin
rằng nghiên cứu sẽ tiếp tục cải thiện hiệu suất xác
định mật độ phương tiện dựa trên hệ thống thị giác
máy tính trong khi giảm tỷ lệ sai số. Các nghiên cứu
trong tương lai có thể với xác định mật độ phương
tiện dựa trên thị giác máy tính.

TÀI LIỆU THAM KHẢO
[1] Trần Thanh Việt, Trần Công Chiến, Huỳnh Cao
Tuấn, Nguyễn Hữu Nam, Đỗ Năng Toàn, Trần Hành
(2011), “Một kỹ thuật bám đối tượng và ứng dụng”.
Kỷ yếu Hội thảo quốc gia lần thứ 14, Cần Thơ.
[2] Nguyễn Quang Quý (2012), Phát hiện đối tượng đột
nhập bằng camera theo dõi, Học viện Bưu chính
viễn thông.

[3] Xue Mei, Shaohua Kevin Zhouy, Hao Wu, Fatih
Porikliz (2007), “Integrated Detection, Tracking and
Recognition for IR Video-based Vehicle
Classification”, Journal of computers (Vol.2, No.6).
[4] Chung-Cheng Chiu, Min-yu Ku và Chun-Yi Wang
(2010), Automatic Traffic Surveillance System for
Vision-Based Vehicle Recognition and Tracking.
Department of Electrical and Electronic Engineering,
Chung Cheng Institute of Technology National,
Defense University Taoyuan, Taiwan.
[5] G. S. K. Fung, N. H. C. Yung, and G. K. H. Pang,
“Close range Camera calibration” Opt. Eng. SPIE,
vol. 42, no. 10, pp. 2967–2977, Oct. 2003.
[6] C. C. C. Pang, W. W. L. Lam, and N. H. C. Yung, “A
novel method for resolving vehicle occlusion in a
monocular traffic-image sequence” IEEE Trans.
Intell. Transp. Syst., vol. 5, no. 3, pp. 129–141, Sep.
2004.
[7] Nguyễn Văn Căn, Nguyễn Đăng Tiến, Phạm Việt
Trung. “Phương pháp biểu diễn đường viền trên
trường số phức, áp dụng cho bài toán phân loại
phương tiện giao thông”. Tạp chí Khoa học và Công
nghệ quân sự. (Tháng 08/2014).

×