Tải bản đầy đủ (.pdf) (9 trang)

Phương pháp phân loại nhanh phương tiện giao thông dựa trên đường viền

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (589.16 KB, 9 trang )

Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015
DOI: 10.15625/vap.2015.000197

PHƯƠNG PHÁP PHÂN LOẠI NHANH PHƯƠNG TIỆN GIAO THÔNG
DỰA TRÊN ĐƯỜNG VIỀN
Nguyễn Văn Căn, Nguyễn Tiên Hưng, Dương Phú Thuần, Nguyễn Đăng Tiến
Trường Đại học Kỹ thuật – Hậu cần CAND
, , ,
TÓM TẮT - Mục đích của bài viết này là trình bày phương pháp biểu diễn đường viền của đối tượng trong ảnh nhị phân
bằng vector số phức; phân tích một số tính chất của vector số phức để áp dụng cho bài toán nhận dạng; so sánh mẫu trên cơ sở
đường viền; xây dựng lược đồ chung cho việc nhận dạng và phân loại đối tượng bằng phương pháp đường viền vector. Chúng tôi
đã tiến hành thử nghiệm nhận dạng và phân loại các tập ảnh có mức độ phức tạp về xe máy, xe ô tô cho kết quả chính xác và tốc độ
tính tốn nhanh.
Từ khóa: Contour Analysis, Car Recognition, complex vector, Vector Contour

I. GIỚI THIỆU
Phân loại ảnh là một bài toán đã và đang thu hút được sự quan tâm của các nhà nghiên cứu và phát triển, được
ứng dụng rộng rãi nhiều ứng dụng hữu ích như: tìm kiếm ảnh, nhận dạng, theo dõi và phát hiện đối tượng... Trong giám
sát đối tượng chuyển động từ video chẳng hạn như giám sát phương tiện giao thông, thì phân loại ảnh là bài tốn kế
tiếp sau bài toán phát hiện đối tượng chuyển động [15]. Cách tiếp cận phổ biến của bài toán phân loại ảnh là đối sánh
ảnh, tức là tìm ra những vùng giống nhau trên hai ảnh dựa trên những điểm đặc trưng. Khi đó bài tốn đối sánh ảnh sẽ
quy về bài tốn so sánh các đặc trưng trích chọn [3], [7], [8], [9], [13]. Các đặc trưng cho phép biểu diễn ảnh đã được
nghiên cứu bao gồm đường biên vùng ảnh, điểm ảnh đặc trưng, lược đồ xám,...
Có hai vấn đề cơ bản thường đặt ra trong bài toán đối sánh ảnh: i) làm sao có thể biểu diễn thơng tin một cách hiệu
quả nhằm thực hiện việc đối sánh hai ảnh nhanh nhất có thể; ii) làm thế nào để giải pháp đối sánh vẫn hoạt động hiệu quả
khi có sự thay đổi của mơi trường: nhiễu trong q trình thu nhận ảnh, sự thay đổi về ánh sáng, sự che khuất,...
Các phương pháp đối sánh ảnh dựa trên đối sánh các điểm đặc trưng được đề xuất rất nhiều và đạt được sự
thành công đáng kể [9], [12], [14]. Tuy nhiên để đạt được một độ chính xác nhất định, các phương pháp này đều đòi
hỏi rất nhiều thời gian tính tốn. Trong những ứng dụng thời gian thực như giám sát giao thông tự động, việc đưa ra
một phương pháp đối sánh ảnh thực hiện trong thời gian thực là một công việc cần thiết [2], [4], [5], [6], [10], [11].
Nghiên cứu này trình bày và giới thiệu một phương pháp tiếp cận phân loại mạnh mẽ đối với ô tô và xe máy


trong ảnh giao thông. Đóng góp cơ bản trong bài báo này là đề xuất một phương pháp biểu diễn đường viền đối tượng
bằng đường viền vector trên trường số phức [1], phân tích và áp dụng tính chất của một số phép tốn trên trường số
phức, áp dụng cho việc nhận dạng và phân loại đối tượng.
Trong các phần tiếp theo của bài báo này, chúng tơi trình bày chi tiết các nội dung về phương pháp tiếp cận của
chúng tơi. Mục II, trình bày phương pháp biểu diễn đường viền đối tượng trên trường số phức và áp dụng cho thuật
toán phân loại đường viền. Mục III, trình bày các kết quả thực nghiệm và bàn luận đánh giá. Mục IV là kết luận và
hướng phát triển.
II. PHƯƠNG PHÁP BIỂU DIỄN ĐƯỜNG VIỀN ĐỐI TƯỢNG BẰNG SỐ PHỨC
A. Biểu diễn đường viền theo vector
Phân tích đường viền (Contour Analysis - CA) cho phép mơ tả, lưu trữ, so sánh và tìm ra các đối tượng biểu
diễn dưới dạng đường viền. Đường viền chứa thông tin cần thiết về hình dạng đối tượng. Khơng quan tâm nhiều đến
các điểm bên trong của đối tượng, nhưng quan tâm nhiều về thể hiện đường viền bên ngoài thì cho phép chuyển về
khơng gian đường viền, từ đó cho phép giảm thời gian tính tốn và độ phức tạp tính tốn. CA cho phép giải quyết hiệu
quả các bài toán cơ bản của nhận dạng mẫu – biến đổi, quay và tỷ lệ của ảnh đối tượng. Phương pháp CA là bất biến
đối với phép biến đổi.
Đường viền là đường bao của đối tượng, thường là các điểm ảnh, phân tách đối tượng với nền. Trong các hệ
thống thị giác máy tính, một vài định dạng mã hóa đường viền được sử dụng như mã hóa Freeman, mã hóa 2 chiều, mã
hóa đa giác thường được sử dụng nhất. Nhưng tất cả những định dạng này thường không sử dụng trong CA.
Định nghĩa 1. Đường viền Vector[16]
Đường viền Vector là đường viền được biểu diễn bằng một dãy các số phức. Trên một đường viền, điểm bắt đầu
cần được xác định. Tiếp theo, đường viền sẽ được quét (xoay theo chiều kim đồng hồ), và mỗi vector được biểu diễn
bằng một số phức a+ib. Với a là điểm trên trục x, b là điểm trên trục y. Các điểm được biểu diễn kế tiếp nhau (Hình 1).
Do tính chất vật lý của các đối tượng ba chiều, đường viền của chúng ln khép kín và khơng tự giao nhau. Nó
cho phép xác định rõ ràng một duyệt qua một đường viền (để trong một hướng - hoặc ngược chiều kim đồng hồ).
Vector cuối cùng của một đường viền luôn luôn dẫn đến điểm khởi đầu.


582
5


PHƯƠN
NG PHÁP PHÂN
N LOẠI NHANH
H PHƯƠNG TIỆN
N GIAO THÔNG
G DỰA TRÊN ĐƯ
ƯỜNG VIỀN

Mỗi vector của một đđường viền đư
ược gọi vectorr cơ sở EV (Ellementary Vecctor). Và chuỗỗi giá trị các số phức gọi
là đường viền vector (VC).
ữ cái Γ, và EV
V ký hiệu là γ. Như vậy, đường
đ
viền veector Γ có độ dài k xác định là Γ=(γ0,
VC ký hiệu bằng chữ
γ1,..., γk-1).

Hình
h 1. Biểu diễn đường
đ
viền bằng
g vector số phứcc

Khi biểểu diễn đườngg viền bằng V
VC thì thao táác trên đường viền như là tthao tác trên vector số phứ
ức có chứa
nhiều
n
đặc tínhh tốn học hơnn là các mã biiểu diễn khác. Về cơ bản, mã

m số phức làà gần với mã hai chiều khi mà đường
ữa thao tác tỷ lệ của các
viền
v được địnhh nghĩa phổ biến bằng vectoor cơ bản tron
ng tọa độ 2 ch
hiều. Nhưng sựự khác biệt giữ
vector
v
đối với số phức là khhác nhau. Trườ
ờng hợp này cũng ưu tiên ch
ho các phươngg pháp CA.
n
2. Tích vvơ hướng củaa đường viền [16]
Định nghĩa
Hai số phức
p
của 2 đư
ường viền Γ vàà N, tích vơ hư
ướng của nó làà
Γ,



,

(1)

ủa đường viền Γ, νn là vectorr cơ sở của đư
ường viền N.
với k – kích thước củủa VC, γn là veector cơ sở củ

Tích vơơ hướng của cáác số phức đư
ược tính bằng cơng
c
thức:
(a+ibb,c+id)=(a+ib)(c+id)=ac+bd
d+i(bc+ad)

(2)

r
trong mộột tích vơ hướnng CA chỉ có một đường viiền vector VC
C của chiều đồồng nhất. Do vậy
v một số
Chú ý rằng
vectors
v
cơ sở trong
t
đường vviền là trùng nhhau.
Tích vơơ hướng của cáác vector thườ
ờng và tích vơ
ơ hướng của cáác số phức là kkhác nhau: Nếếu ta nhân một vector cơ
sở
s EV như mộột vector đơn, tích vơ hướngg của chúng sẽẽ là:
((a,b),(c,d))=ac + bd

(3)

r
So sánhh công thức nàày với công thhức (2) chú ý rằng:

- Kết quuả tích vơ hướ
ớng của các veectors là một số
s thực. Và kếết quả tích củaa các số phức llà một số phức.
- Phần thực của tích vơ hướng củủa các số phứcc trùng với tícch vơ hướng ccủa các vectorr phù hợp. Tíc
ch số phức
bao
b gồm tích vơ
v hướng vecttor.
Theo đại
đ số tuyến tíính, để xác địịnh được chín
nh xác chiều vật
v lý và các đặc tính của tích vơ hướng. Tích vơ
hướng
h
bằng vớ
ới tích của độ dài vector củủa góc cosin ở giữa. Tức là 2 vector vnng góc sẽ lnn có tích vơ hướng bằng
0.
0 Ngược lại, tích
t của vectorr thẳng hàng ssẽ cho giá trị tích vơ hướng tối đa.
Những đặc tính này ccủa tích được sử dụng như một cách để đo
đ lường độ ggần của các veector. Nếu tích
h càng lớn,
góc
g càng nhỏ giữa các vecttor, thì các vector này sẽ cààng gần nhau. Với những vvector vng ggóc, tích này bằng 0, và
hơn
h nữa có thể nhận giá trị âm cho nhữnng vector có hướng
h
khác nh
hau theo cáchh này. Tích vơơ hướng (1) cũ
ũng có các

đặc
đ tính tươngg tự.
Mệnh đề
đ 1. Đặc tính
h của đường vviền
1. Cho Γ=(γ0, γ1,..., γk-1), tổng các E
EV là S, ta có: S= SUM(γ0, γ1,..., γk-1)=0, S là tầm thườờng khi k=1.
2. Cho I1 là ảnh nguồồn, Γ1 thuộc I1; I2 là I1 tịnh tiến
t theo một phương
p
p, Γ2 tthuộc I2;, thì Γ 2 = Γ1.
3. Quayy ảnh theo mộột góc độ nào đđó tương đươn
ng với quay mỗi
m EV của đưường viền trênn cùng góc độ đó.
4. Việcc thay đổi điểm
m khởi đầu tiếến hành theo vịng trịn VC
C. Vì các EV được mã hóa liên quan đến
n các điểm
trrước đó, điều này rõ ràng là thay đổi điểểm khởi đầu, trình
t
tự của một
m EV sẽ là nnhư nhau, nhưnng EV đầu tiê
ên sẽ là bắt
đầu
đ từ điểm khhởi đầu.
5. Thayy đổi tỷ lệ ảnh nguồn có thể được coi là phép nhân của mỗi EV của đđường viền vớới một hệ số tỷ
ỷ lệ.


Nguyễn

N
Văn Căn, Nguyễn Tiên Hư
ưng, Dương Phú T
Thuần, Nguyễn Đăng
Đ
Tiến

583

Bắt nguuồn từ cách bbiểu diễn đườnng viền bằng số phức, giả sử có 8 hướnng cơ bản củaa đường viền, bắt đầu từ
đỉnh
đ
cao nhất, quay theo chhiều kim đồngg hồ, chúng taa có vector số phức {1, 1-i, -i, -1, -1+i, 11+i}. Rõ ràng ta có tổng
vector
v
này bằnng 0. Bằng trự
ực quan hóa hìnnh học, dễ dàn
ng chứng minh được đặc tínnh 2,3 và các đđặc tính cịn lại.
Định nghĩa
n
3. Tích vvơ hướng chu
uẩn hóa [16]
Tích vơơ hướng chuẩnn hóa (NSP) củủa hai đường viền vector Γ và N được xáác định bằng ccông thức:
,
| || |

(4)

N| - Chuẩn (chhiều dài) của đường viền đư
ược tính bằng cơng thức:

|Γ| và |N
|Γ|



| |

(5)

đ 2. NSP cựcc đại [16]
Mệnh đề
Dạng chhuẩn của NSP
P đạt giá trị lớn
ớn nhất, chỉ khi đường viền Γ giống với đưường viền N, nhưng xoay th
heo một số
góc
g và tỉ lệ bởi một hệ số xáác định.
Thật vậậy, do NSP trrong không giian phức cũng
g là một số phức,
p
tính đồnng nhất là giáá trị lớn nhất có thể của
chuẩn
c
NSP (Thheo bất đẳng tthức Cauchy-B
Bunyakovsky Schwarz): |ab
b| <= |a||b|, vàà chỉ có thể đạạt được giá trị này khi và
chỉ
c khi:
Γ


(6)

Với μ – Là một số phức tùy chọn..
Khi nhâân các số phứ
ức, độ dài của chúng được nhân,
n
và các góc
g được cộngg lại với nhauu. Đường viền
n μN giống
với
v đường viềnn N, ngoại trừ
ừ xoay và tỉ lệ.. Tỉ lệ và hướn
ng xoay được định nghĩa bởởi một số phứcc μ.
Ví dụ, ta
t coi một tíchh vơ hướng củủa một đường viền với chính
h nó, nhưng xooay một góc nnhất định:
Nếu đếm một NSP ccủa một vectorr với chính nó
ó, ta sẽ nhận giá
g trị NSP=1 . Nếu xoay m
một đường viền
n 90 độ, sẽ
nhận
n
giá trị NS
SP=0+I, xoayy một góc 1800 độ nhận giá trị
t NSP=-1. Do
D vậy, phần tthực của một N
NSP sẽ cho ta
a cosin của
một

m góc giữa các
c đường viền, và chuẩn củủa NSP luôn bằng
b
1.
Tương tự, nếu ta tăngg một VC với một hệ số thự
ực nào đó, ta sẽ
s nhận giá trị NSP=1 (Có thhể thấy ở cơng
g thức (4))
Theo mệnh
m
đề 1 ta cóó tích vơ hướnng NSP thì bấtt biến đối với phép dịch chuuyển, xoay vàà tỷ lệ của đường viền.
Do vậyy, chuẩn của tích vơ hướng cchuẩn hóa củaa đường viền cho
c giá trị đồnng nhất chỉ khhi 2 đường viền
n này bằng
nhau
n
cả về độ xoay và tỉ lệ. Mặt khác chuuẩn của NSP sẽ bị giới hạn ít đồng nhất hhơn.

Hìình 2. Tích vơ hướng
h
chuẩn trêên đường viền

h, xoay và tỉ lệ của đường viền. Nếu 2 đường viền tư
ương đồng
Chuẩn NSP là bất biiến trong phéép chuyển dịch
nhau,
n
NSP củaa chúng sẽ luôôn cho giá trị đđồng nhất, khơ
ơng phụ thuộcc vào vị trí củaa đường viền, hay độ xoay của góc và
tỉ lệ của chúngg. Tương tự, nnếu các đườngg viền khác nh

hau, NSP sẽ bị
b giới hạn nhỏỏ hơn 1, và độộc lập trong không
k
gian,
độ
đ xoay và tỉ lệ.
Chuẩn của NSP là phhép đo độ gầnn của các đườn
ng viền. Chuẩẩn đưa ra giá ttrị đo của mộtt đường viền và
v tham số
của
c một NSP (bằng
(
atan(b/aa)) – đưa ra mộột góc xoay củ
ủa đường viền
n.
Định nghĩa
n
4. Hàm tương quan ccủa 2 đường viền [16]
Hàm tư
ương quan ICF
F của 2 đườngg viền:
τ(m) = (Γ,N
N(m)), m=0,...,k-1
(m)

(7)

đ N : là đườ
ờng viền nhậnn từ N bởi vòn
ng dịch chuyển

n bởi vector ccơ sở EV của cchính nó trên m phần tử.
Trong đó
Độ
Đ lớn của chuuẩn tối đa giữa các giá trị củủa ICF:


584
5

PHƯƠN
NG PHÁP PHÂN
N LOẠI NHANH
H PHƯƠNG TIỆN
N GIAO THÔNG
G DỰA TRÊN ĐƯ
ƯỜNG VIỀN

| || |

,

0, … ,

1

Từ việcc xác định mộtt NSP và một ICF, có thể th
hấy τmax là giiá trị đo lườngg sự giống nhaau của 2 đườn
ng viền, bất
biến
b với việc dịch

d chuyển, xxoay, tỉ lệ và ssự thay đổi điểểm khởi đầu.
Định nghĩa
n
5. Hàm tự tương quaan (ACF) [16]]
ACF làà hàm tương qquan khi N=Γ.. Tích vơ hướn
ng của đường
g viền trên chhính nó tại cácc dịch chuyển khác nhau
của
c điểm khởi đầu được tínhh theo cơng thhức:
υ(m) = (Γ,Γ (m)), m=0,...,,k-1

(8)

Nếu đư
ường viền có nnhiều đối xứnng để xoay thìì ACF của chú
úng sẽ có đốii xứng tương ttự nhau. Có thể coi một
đường
đ
viền AC
CF là một đặc tính của hìnhh dạng của đườ
ờng viền.
B.
B Thuật toán
n phân loại dự
ựa trên đườngg viền
Ph
ha huấn luyện
n

Phaa phân loại


Hình mẫu phương tiện

Ảnhh cần phân loạại

Tìm đđường viền hợ
ợp lý

Tăăng cường ảnhh

Tínhh tốn đặc trưng

Tìm
m đường viềnn
Tínhh tốn đặc trưnng

Cơ sở dữ liệu đường
g viền
So khớp
Kết luậận về phương ttiện
Hình 3.. Sơ đồ khối tổn
ng quát phân loạại theo đường vviền

Phân looại dựa trên đư
ường viền đư
ược chia thành
h 2 pha: Pha huấn
h
luyện và Pha phân loạại. Sơ đồ khái quát được
minh

m
họa tronng hình 3. Cácc khối tăng cư
ường ảnh, tìm đường viền áp
á dụng các thhuật tốn đã ccó trong xử lý
ý ảnh. Điều
quan
q
trọng ở đây
đ là tính tốán đặc trưng củủa đường viền
n. Tuy nhiên để
đ chuẩn hóa đđường viền ở cả pha huấn luyện
l
cũng
như
n pha phân loại
l cần phải tthực hiện phépp cân bằng hó
óa đường viền hay còn gọi làà xấp xỉ độ dàài đường viền.
Như đãã trình bày ở trên về phươnng pháp CA, cần xác định độ dài của đđường viền. T
Trong một bức
c ảnh thực,
đường
đ
viền cóó độ dài bất kỳỳ. Do đó việc tìm kiếm và so sánh đường
g viền, tất cả chúng cần có số đỉnh đồng
g nhất. Q
trrình này gọi là
l quá trình câân bằng. Đầu ttiên sẽ cố định số đỉnh của VC chuẩn (ởở pha huấn luyyện) sẽ sử dụn
ng trong hệ
th
hống nhận diệện, ký hiệu là k. Sau đó với mỗi đường viiền A mới đượ

ợc tạo ra, ta tạạo một đường viền vector N với độ dài
k.
k Và có thể có 2 biến thể, hhoặc đường vviền ban đầu có
c số đỉnh lớn hơn số k hoặặc nhỏ hơn số k. Nếu một đường
đ
viền
ban
b đầu cần thhiết để được sắắp xếp bởi EV
V, ta sẽ quan tâm
t tới thành phần N như ttổng của các E
EV. Hình 4 dư
ưới đây chỉ
ra
r ý nghĩa của sự cân bằng hhóa hay cịn gọọi là đơn giản hóa đường viiền.

Hình 4. Xấp
X xỉ hóa đườn
ng viền

h
4, bên trrái mô tả đườ
ờng viền gốc (đường màu đen, mỏng) vvà đường viềền sau khi đơn
n giản hóa
Trong hình
(đường màu cam, đậm); bêên phải mơ tả hình tượng phương
p
pháp đơn
đ giản hóa đường cong ttheo thuật tố
án Douglas
Peucker

P
[17]. Với d là số đđỉnh của đườnng viền sau kh
hi đơn giản hó
óa, hình dáng đường viền, cchu vi hay diệ
ện tích của
đường
đ
viền mớ
ới sẽ đảm bảoo phải xấp xỉ với đường viềền ban đầu. Điều
Đ
này được thực hiện và chứng minh trong cơng
trrình [17] về ứng
ứ dụng của tthuật tốn Douuglas Peucker.


Nguyễn Văn Căn, Nguyễn Tiên Hưng, Dương Phú Thuần, Nguyễn Đăng Tiến

Pha huấn luyện. Chuẩn bị cơ sở dữ liệu Template (Thực hiện thủ cơng).
Input: Hình ảnh (Image), ngưỡng đường viền (ThresoldContour), số đỉnh đường viền (d)
Output: Template (Tập mẫu)
Nội dung thuật tốn:
1. Chuẩn hóa về độ phân giải mong muốn
Image ← ChuanHoaDoPhanGiai(Imange)
2. Tìm các đường viền
n ← SoDuongVien(Image)
Contour(i) ← TimDuongVien(Image), i=1..n
3. Chuẩn hóa các đường viền
For i=1 to n {//Áp dụng thuật tốn đơn giản hóa
Contour(i) ←DonGianHoa(Contour(i), d)}
For i=1 to n {//Tính chu vi

ChuVi(i) ← TinhChuVi(Contour(i))}
For i=1 to n {//Loại đường viền quá nhỏ
j←i
if ChuVi(i)> ThresoldContour then { Countour(j) ← Countour(i); j++}}
m=j; //m là số đường viền sau khi loại bỏ đường viền nhỏ
4. Tìm đặc trưng các đường viền
For i=1 to m {//Tính tốn tham số đặc trưng
CV(i) ← Chuvi(Contour(i))
DT(i)←DienTich(Contour(i))
for j=1 to d {//Tính góc tại các đỉnh
goc(i,j)=TinhGoc(Contour(i),j)
}
5. Cập nhật Template
For i=1 to m {
Template ← CV(i), DT(i)
For j=1 to d
Template ←goc(i,j)
}
6. Retrurn Template
Pha phân loại. Nhận dạng trên các tập ảnh thực tế (Thực hiện online – thời gian thực):
Input: Video/Ảnh
Output: ImageCountour (Ảnh có chứa đường viền phương tiện)
Nội dung thuật toán:
1. Thu nhận và Xử lý sơ bộ ảnh (Làm mịn, lọc nhiễu, tăng độ tương phản)
Image ← Capture(Video)
Image ← ChuanHoaAnh(Image)
2. Tìm các đường viền
n ← SoDuong Vien(Image)
Contour(i) ← TimDuongVien(Image), i=1..n
3. Chuẩn hóa các đường viền

For i=1 to n {//Áp dụng thuật tốn đơn giản hóa
Contour(i) ←DonGianHoa(Contour(i), d)}
For i=1 to n {//Tính chu vi
ChuVi(i) ← TinhChuVi(Contour(i))}
For i=1 to n {//Loại đường viền quá nhỏ
j←i
if ChuVi(i)> ThresoldContour then { Countour(j) ← Countour(i); j++}}
m=j; //m là số đường viền sau khi loại bỏ đường viền nhỏ
4. Tìm đặc trưng các đường viền
For i=1 to m {//Tính tốn tham số đặc trưng
CV(i) ← Chuvi(Contour(i))
DT(i)←DienTich(Contour(i))
for j=1 to d {//Tính góc tại các đỉnh

585


586
5

PHƯƠN
NG PHÁP PHÂN
N LOẠI NHANH
H PHƯƠNG TIỆN
N GIAO THÔNG
G DỰA TRÊN ĐƯ
ƯỜNG VIỀN

goc(i,,j)=TinhGoc(C
Contour(i),j)

}
5. So sánh đường vviền với Tempplate.
For each đđường viền phhát hiện {
C
Chọn vùng chii vi để đối sán
nh
C
Chọn vùng diệện tích để đối sánh
S
So sánh sự đồnng dạng giữa 2 đường viền}}
6. Return
Mệnh đề
đ 3. Độ phứcc tạp ước tính
h của thuật to
ốn phân loạii dựa trên VC
C
Giả sử bức
b ảnh đã đư
ược nhị phân hhóa có kích th
hước n*n pixells, tìm đường viền bằng cácch duyệt qua to
ồn bộ ảnh
2 chiều, do đó độ phức tạp ttương ứng là O
O(n2).
Giả sử k là độ dài đư
ường viền, t làà số các đườn
ng viền có tron
ng ảnh. Thuậtt tốn so sánhh đường viền có
c độ phức
tạp ước tính làà O(n2k2t).
Thuật tốn

t
này thực là phức tạp, đđặc biệt với độ
ộ dài của một số k lớn. Tuyy nhiên trong thực tế, đườn
ng viền ban
đầu
đ là một số k nhỏ. Ta thêm
m vào phép nộội suy và coi là giá trị xấp xỉ.
Vấn đề là cần chọn ggiá trị k. Vậy giá trị nào là tối ưu nhất? Câu trả lời chho vấn đề nàyy là hoàn toàn được định
nghĩa
n
bởi một vùng ứng dụnng cụ thể. Mặặt khác, độ dàii lớn k có ngh
hĩa là tiêu tốn một lượng phhí lớn vào việc
c đánh giá.
Cịn
C giá trị k nhỏ
n cần ít thơnng tin, độ chínnh xác của việcc nhận dạng cũ
ũng giảm và vviệc nhận dạngg nhiễu tăng lê
ên.
III. THỰC NGHIỆM
N
VÀ BÀN LUẬN
Mặc dùù những giới hhạn trên, phươ
ơng pháp CA vẫn được chú
ú ý với nhữngg sự thực hiện đơn giản và tốc
t độ cao.
Trong
T
việc thểể hiện các đối tượng trong nnền tương phản
n và ít nhiễu, CA
C sẽ thực hiiện tốt việc nhhận dạng.

Việc kiiểm nghiệm phhương pháp C
CA bằng cách kiểm thử cho ra kết quả 90 % phương tiệện được nhận diện.
d
Đó là
một
m kết quả khhá tốt. Và kết quả này chứaa một số lượng
g các ảnh đọc xấu của các pphương tiện. D
Do đó CA xử lý 249 ảnh
với
v các kích thhước khác nhaau (từ 400*4000 tới 1280*96
60) trong vòng
g 30 giây. So sánh với kết qquả trong [14], độ chính
xác
x đã được cải
c thiện và tốốc độ nhanh hhơn. Bên cạnh việc nhận dạạng các ảnh tĩn
ĩnh, thực hiện tốc độ cao củ
ủa CA cho
phép
p
xử lý viddeo trong chế đđộ thời gian thhực.
sis - thực hiệện các chức nă
Thực nghiệm
n
được th
thiết kế trên 2 dự án. Dự án
n đầu tiên là ContourAnalys
C
ăng cơ bản
của
c phân tích đường viền, tạo được viền,, tích vơ hướn

ng của đường viền, cân bằnng hóa, đánh ggiá ICF và AC
CF, so sánh

v tìm kiếm cáác mẫu.

Hình 5. Hệ
H thống thực ng
ghiệm

Lớp Coontour tạo ra và lưu trữ cácc đường viền. Chứa các vận
n hành cơ bảnn cho đường vviền, tích vơ hư
ướng, tỉ lệ,
cân
c bằng hóa, chuẩn hóa và đánh giá quanng phổ, đánh giá
g ACF, ICF.
Lớp Teemplate được dùng để tạo ccác mẫu cơ bản
n. Lớp này lưu
u trữ các đườnng viền, bộ môô tả ACF, tham
m số tuyến
tính của đườngg viền ban đầuu, chuẩn của đđường viền. Đồng thời lớp mẫu
m này có tênn được dùng ttrong giá trị nh
hận dạng.
Lớp TeemplateFinderr thực hiện việệc tìm kiếm nhanh
n
các mẫu
u của đường vviền cho sẵn. K
Kết quả của sự
ự vận hành
của
c lớp này làà FoundTemplateDesc, chứ

ứa đường viền
n ban đầu và mẫu
m được phhát hiện bởi đư
ường viền cho
o sẵn. Bên
cạnh
c
đó FounddTemplateDessc chứa tỉ lệ tư
ương tự, góc xoay
x
và tỉ lệ đường
đ
viện, cáác liên hệ mẫuu.
Dự án thứ
t 2, ContouurAnalysisProcessing , chứaa các phương pháp để xử lýý sơ bộ ảnh, cchọn đường viền, lọc và
nhận
n
dạng. Đồồng thời nó cũũng chứa các ccơng cụ để tự động tạo ra cáác mẫu cho vi ệc nhận dạng các loại xe, sử
ử dụng thư
viện
v OpenCV (EmguCV .NE
ET wrapper) đđể xử lý ảnh.


Nguyễn
N
Văn Căn, Nguyễn Tiên Hư
ưng, Dương Phú T
Thuần, Nguyễn Đăng
Đ

Tiến

587

Lớp Im
mageProcessorr được sử ddụng để xử lý
ý ảnh. Đồng thời lưu trữữ mẫu. Phươnng thức ProcessImage()
ImageProcessoor nhận ảnh ở đầu vào. Kếtt quả xử lý liệệt kê các đườn
ng viền được pphát hiện ImaageProcessor.ssamples và
liệt kê danh sáách đường viềền được nhậnn diện FoundT
Templates. Lớp
p ImageProceessor chứa càài đặt cho việc
c tìm kiếm
đường
đ
viền.
Các thaam số trong tthực nghiệm:: Kích thước ngưỡng
n
khối thích
t
nghi (Addaptive Thresoold block size)) = 5 pixel;
Độ
Đ dài đường viền nhỏ nhấất (Min contouur length) = 30 pixel; Diện tích đường viiền nhỏ nhất ((Min contour area) = 10
pixel;
p
Độ phânn giải ảnh đầu vào: 640 x 4880 pixel.
Cơ sở dữ liệu mẫu:: Thực nghiệm
m đã thực hiện
n tạo ra một cơ
c sở dữ liệu ttập mẫu các đđường viền gồ

ồm 50 mẫu
đường
đ
viền khhác nhau từ cáác hình dạng 1 xe máy, 1 xee ô tô, 2 xe mááy, 2 ô tô, 1 xee máy 1 ô tô. Đường viền mẫu
m của xe
máy
m được tập trung lưu trữ toàn bộ hìnhh dạng đường viền bao quan
nh xe máy. Thhêm một số m
mẫu về đường viền phần
nửa
n trên ngườii đi xe máy. Đ
Đối với ô tô, tậập mẫu tạo ra bằng
b
cách lưu
u trữ khung đưường viền của kính trước ơ tô.
t

a)) Một xe máy

b) Hai xe mááy

c) Một ô tô thơng qqua kính trước

d) Một ơ tơ vvà một xe máy

Hình 6. Ví dụ
d về tập mẫu đểể so sánh

Trong quá
q trình nhậnn dạng, gán nhhãn cho đường

g viền phát hiệện được tươngg ứng là 1xm ((một xe máy),, 1oto (một
ô tô), 2xm (haii xe máy), 2otto (hai ô tô), 11xm1oto (một xe máy kèm một
m ô tô).

a)

b)
b

c)

a) Nhận dạnng được 2 đường vviền, gán nhãn ch
ho mỗi xe một nhã
ãn là 1xm.
b) Nhận dạnng được 3 xe máy.. Trong đó có 2 xe nhận dạng theo
o đường viền tồnn bộ, 1 xe nhận dạạng theo phần trê
ên xe.
c) Nhận dạnng được một ô tô vvà 1 xe máy đi gầ
ần nhau.

Hình
h 7. Ví dụ kết qu
uả nhận dạng xee ô tô và xe máyy

Phươngg pháp được thhực nghiệm vvới các ảnh tự nhiên và tron
ng bài toán đếm
m phương tiệnn giao thông, so sánh và
nhận
n
dạng ra nhanh

n
một xee máy, 1 ơ tơ, 2 xe máy dín
nh liền nhau, 2 ô tô dính liềền nhau, 1 ô ttô và 1 xe máy
y dính liền
nhau
n
trong ảnhh.
Giải thuuật hoạt động với tốc độ 100-14Hz trên máy
m tính Pentiu
um IV, 2.6GH
Hz phù hợp vớới các ứng dụng thời gian
th
hực. Độ chínhh xác của giảii thuật đã đượ
ợc kiểm nghiệm thông qua việc
v đối sánh ảnh giao thônng chụp tại một
m số cung
đường
đ
ở Việt Nam.
N
Trong q
q trình thựcc nghiệm, chúúng tơi thấy rằng
r
cịn có một
m số những hạn chế của phương pháp
p, cần phải
nghiên
n
cứu tiếpp tục như sau:
- Hạn chế

c đầu tiên cóó liên quan tớii vấn đề lựa ch
họn đường viềền trên ảnh. Đ
Đường viền đư
ược giới hạn với một cấu
trrúc rời rạc nhhất định. Tuy nhiên các đốii tượng này đư
ược thể hiện trong
t
mơi trưường thực có tthể xảy ra nhữ
ững trường
hợp:
h
Có một số lượng lớn các đường viềnn liên quan vàà không liên qu
uan đến đối tưượng nhận dạnng; Đối tượng
g trong ảnh
khơng
k
thể có đường
đ
biên rõõ ràng, có thể nnhận diện dựaa trên độ sáng
g hoặc màu sắcc so với nền, ccó thể bị nhiễu… Tất cả
những
n
nhân tốố trên dẫn tới việc đường vviền không thểể được lựa chọ
ọn hoặc đượcc chọn khơng chính xác, kh
hơng tương
đồng
đ
với đườnng bao của đốii tượng. Mặt kkhác, trên thựcc tế một đối tư
ượng có thể cóó nhiều đườngg viền tồn tại, chẳng hạn
như

n một ô tô: đường viền kkính trước, đườ
ờng viền gươn
ng quan sát hậậu, đường viềền hai đèn trướớc xe,... Việc tổ hợp các
đường
đ
viền nàày trong cùng m
một đối tượngg cũng cần phảải đặt ra.


588

PHƯƠNG PHÁP PHÂN LOẠI NHANH PHƯƠNG TIỆN GIAO THÔNG DỰA TRÊN ĐƯỜNG VIỀN

- Hạn chế thứ hai, gây phức tạp cho phương pháp CA có liên quan tới các quy tắc của phân tích đường viền.
Phương pháp CA giả sử rằng đường viền mô tả khung của các đối tượng và khơng quan tâm đến các phần phía sau
hoặc các phần nhìn thấy khơng hồn tồn của đối tượng. Do đó CA có độ ổn định kém trong các trường hợp nhiễu,
không hỗ trợ sự giao cắt hoặc các phần nhìn thấy của đối tượng.
IV. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Trong bài báo này, đề xuất phương pháp phân loại dựa trên đường viền, có khả năng ứng dụng vào các bài tốn
đối sánh ảnh địi hỏi thời gian thực. Đóng góp chính: 1) một phương pháp biểu diễn đường viền đối tượng bằng đường
viền vector trên trường số phức; 2) một số phép toán xử lý trên đường viền vector số phức, xấp xỉ đường viền số phức
bằng đa giác; 3) sử dụng giải thuật phân tích đường viền, tìm kiếm độ dài đường viền để thực hiện tìm kiếm và đối
sánh hai đường viền.
Hướng phát triển tiếp theo là: 1) loại bỏ nhanh một số lỗi bằng cách xem xét kích thước chiều dài, chiều rộng
đối tượng, ngưỡng xấp xỉ hình dạng đường viền mịn hơn, sau đó thử nghiệm giải thuật đối sánh ảnh trong một hệ thống
giám sát giao thông thời gian thực; 2) xem xét đến trường hợp một đối tượng có nhiều đường viền để tăng độ chính xác
và khả năng nhận dạng đối tượng đa dạng hơn.
V. TÀI LIỆU THAM KHẢO
[1] Kasana, H. S. (2005), Complex Variables: Theory And Applications (2nd ed.), PHI Learning Pvt. Ltd,
p. 14, ISBN 81-203-2641-5.

[2] S. Benhimane and E. Malis (2007), Homography based 2d visual tracking and servoing. Int. Jounal of Computer
Vision, 2007. Special UJCV/IJRR issue on vision for robots.
[3] H. Tran, A. Lux (2004), A method for ridge extraction. In Proc. of Asean Conference on computer vision
ACCV05, Volume 1, Pages 96-111, Jeju, Korea.
[4] A. I. Comport, E. Marchand, and F. Chaumette(2004), Robust model-based tracking for robot vision. In IEEE/RSJ
Int. Conf. on Intelligent Robots and Systems, IROS'04, volume 1, pages 692.697, Sendai, Japan, September 2004.
(extended version version published in Advanced Robotics, 16(10):1097.1013, december 2005 (special issue on
Selected paper from IROS'04).
[5] A. I. Comport, E. Marchand, and F. Chaumette (2006), Statistically robust 2d visual servoing. IEEE Trans. on
Robotics, 22(2):415.421.
[6] A. I. Comport, E. Marchand, M. Pressigout, and F. Chaumette (2006), Realtime markerless tracking for
augmented reality: the virtual visual servoing framework. IEEE Trans. on Visualization and Computer Graphics,
12(4):615.628.
[7] H. Tran (2006), Etude des lignes d'intérêt naturelles pour la représentation d'objets en vision par ordinateur. Ph.D
dissertation (in french).
[8] E. Rosten and T. Drummond (2005), Fusing points and lines for high performance tracking. In IEEE Int. Conf. on
Computer Vision, pages 1508-1515, Beijing, China.
[9] K. Mikolajczyk, T. Tuytelaars, C. Schmid, A. Zisserman, J. Matas, F. Schaffalitzky, T. Kadir, and L. Van Gool
(2005), A comparison of affine region detectors. Int. Journal of Computer Vision, 65:43.72.
[10] E. Marchand, F. Spindler, and F. Chaumette (2005), ViSP for visual servoing: a generic software platform with a
wide class of robot control skills. IEEE Robotics and Automation Magazine, 12(4):40.52, December 2005. Special
Issue on "Software Packages for Vision-Based Control of Motion", P. Oh, D. Burschka (Eds.).
[11] E. Marchand and F. Chaumette (2005), Feature tracking for visual servoing purposes. Robotics and Autonomous
Systems, 52(1):53.70. Special issue on Advances in Robot Vision., D. Kragic, H. Christensen (Eds.).
[12] D. Lowe (2004), Distinctive image features from scale-invariant keypoints. Int. Journal of Computer Vision,
60(2):91.110.
[13] V. Lepetit and P. Fua (2006), Keypoint recognition using randomized trees. IEEE Trans. on Pattern Analysis and
Machine Intelligence, 28(9):1465.1479.
[14] A. J. Lipton and at al (1998), Moving target classification and tracking from real-time video. In Proc. of Workshop
Applications of Computer Vision, pages 129–136.

Bảng kết quả của nghiên cứu trong [14]
Target
Vehilce
Human
False

Tot.
319
291
4

Unclass.
10.7%
11.0%

Misclass
2.5%
6.2%

Correct
86.8%
82.8%

[15] Ngô Quốc Tạo, Nguyễn Văn Căn, Huỳnh Văn Huy (2014), Nghiên cứu phương pháp đếm xe ơ tơ sử dụng mơ
hình hỗn hợp Gaussian và luồng quang học. Kỷ yếu hội nghị Fair 2014.


Nguyễn Văn Căn, Nguyễn Tiên Hưng, Dương Phú Thuần, Nguyễn Đăng Tiến

589


[16] Rohit Kolar, Akshay Thakar, Muzaffar Shabad (2014), Image Segmentation for Text Recognition using Boundary
Analysis. International Journal of Emerging Technology and Advanced Engineering. ISSN 2250-2459, ISO
9001:2008 Certified Journal, Volume 4, Issue 2, February 2014) 294.
[17] Wu, Shin-Ting and Márquez (2004), Mercedes R. G (2004), A non-self-intersection Douglas-Peucker Algorithm,
Proceedings of Sibgrapi. © 2004 IEEE.

FAST METHOD CLASSIFICATION BASED ON TRANSPORTATION
CONTOURS
Nguyen Van Can, Nguyen Tien Hung, Duong Phu Thuan, Nguyen Dang Tien
ABSTRACT - The purpose of this paper is: first, the present method of performing contour of the object in a binary image using
complex numbers vector. Monday analyzing some properties of the complex vector to apply to problem identification, comparison
on the basis of contour form. Construction general scheme for the identification and classification of objects by means of vector
contours. We have conducted experiments to identify and classify the photo with the complexity of motorcycles and cars for accurate
results and fast calculation speed.



×