Tải bản đầy đủ (.pdf) (13 trang)

Xác định vận tốc đối tượng chuyển động qua camera

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (249.83 KB, 13 trang )

-1-

-2-

B GIÁO D C VÀ ĐÀO T O
Đ I H C ĐÀ N NG

M Đ U
1. Lý do ch n ñ tài
V i s phát tri n nhanh chóng c a các lo i máy móc hi n đ i như
máy nh s , máy quay s , máy vi tính, đi n tho i đi đ ng … thì lư ng
thơng tin con ngư i thu đư c dư i d ng hình nh là khá l n. Đ lư ng

NGUY N VĂN TRUNG

thơng tin này tr nên có ích hơn con ngư i c n có các thao tác đ ti n
hành x lý nó và t đó t o ñi u ki n cho s phát tri n không ng ng
c a các k thu t x lý hình nh. X lý nh là m t trong nh ng cơng
ngh đư c ng d ng r ng rãi hi n nay trong nhi u lĩnh v c c a ñ i

XÁC Đ NH V N T C Đ I TƯ NG CHUY N Đ NG QUA
CAMERA

s ng xã h i. Không ch d ng l i

vi c x lý nh ng v t nhèo, tái ch

và ph c h i các nh cũ (Hình 1), ngày nay cơng ngh x lý nh đã
mang l i nh ng ti n b vư t b c như nh n d ng vân tay, nh n d ng
khuôn m t, nh n d ng ñ i tư ng …v.v khi nó k t h p v i lĩnh v c trí
tu nhân t o.



Chun ngành: KHOA H C MÁY TÍNH
Mã s : 60.48.01

Bên c nh đó, h th ng camera quan sát ngày càng ñư c s d ng
m t cách r ng rãi v i m c đích tr giúp c nh sát, ngư i tham gia giao
thông t i các đi m nút giao thơng, t đó phát hi n ngư i vi ph m.
H m ñư ng b ngày càng ph bi n

nư c ta, có vai trị l n trong

vi c tích ki m chi phí và an tồn cho ngư i tham gia giao thơng. Do đ c
TĨM T T LU N VĂN TH C SĨ K THU T

thù c a h m là

dư i lịng đ t nên vi c qu n lý xe qua l i r t khó khăn.

Nên vi c c nh sát giao thông x lý xe vi ph m tr c ti p

trong h m là

không th .
Ngư i hư ng d n khoa h c: TS. Huỳnh H u Hưng

Vì v y vi c xác đ nh v n t c c a xe d a vào video ñã ghi l i ph c
v cho vi c x lý và qu n lý xe vi ph m t c ñ ch m t i h m ñư ng b
là ñi u c n thi t.
2. M c tiêu và nhi m v nghiên c u
M c đích c a ñ tài nh m nghiên c u các thu t toán phát hi n và


Đà N ng - Năm 2012

theo v t, t đó tính tốn v n t c c a ñ i tư ng chuy n ñ ng t d li u


-3-

-4-

video, làm cơ s ñ xây d ng h th ng xác ñ nh v n t c c a đ i tư ng



tham gia giao thơng.

hi n chuy n ñ ng, thu t toán phát hi n và theo v t đ i tư ng

Ti n hành phân tích và cài đ t: thu t tốn tr n n ñ phát

- Xác ñ nh ñ i tư ng giao thơng đang chuy n đ ng.

chuy n đ ng t d li u video, t đó xác đ nh v n t c c a đ i

- Dị v t và ư c lư ng v n t c s d ng phương pháp optical flow.

tư ng chuy n ñ ng.

- T o ti n ñ cho vi c xác ñ nh v n t c c a các ñ i tư ng vi ph m,




làm b ng ch ng cho vi c x lý vi ph m, góp ph n nâng cao ý th c ch p
hành tham gia giao thơng c a ngư i dân
Bên c nh đó ñ tài còn mong mu n giúp cho m i ngư i có m t cái

So sánh và đánh giá k t qu ñ t ñư c.

5. K t qu d ki n
- N m v ng và cài ñ t thành cơng các thu t tốn: phát hi n chuy n
ñ ng b ng phương pháp tr n n, truy v t đ i tư ng b ng phương

nhìn tồn di n hơn v vai trị và kh năng ng d ng c a công ngh x

pháp phân m nh vùng (region based segmentation), t đó xây d ng

lý nh vào trong th c t c a ñ i s ng xã h i.

thành cơng chương trình xác đ nh v n t c ñ i tư ng chuy n ñ ng.

3. Đ i tư ng và ph m vi nghiên c u

-T o ñư c b ng so sánh k t qu , đ chính xác c a các phương

- Đ i tư ng nghiên c u

pháp phát hi n và theo v t ñ i tư ng chuy n ñ ng d a trên t p các

Trong lu n văn này, d li u ñư c x lý là các đo n video có s n


video có s n.

ñư c quay t m t camera tĩnh ghi l i v i chu n AVI (Audio Video
Interleave).

6. Ý nghĩa khoa h c và th c ti n c a lu n văn
-V m t lý thuy t

- Ph m vi nghiên c u



Ph m vi nghiên c u c a ñ tài liên quan ñ n lĩnh v c x lý nh s

t .

thông qua vi c s ph n m m Matlab.
4. Phương pháp nghiên c u
- Phương pháp nghiên c u lý thuy t



ng d ng thành công công ngh x lý nh vào trong th c
T o ti n ñ cho nh ng nghiên c u ti p theo trong tương lai.

-V m t th c ti n


Giúp gi m cơng s c, tăng hi u qu trong vi c xác đ nh đ i




Tìm hi u cách l p trình v i Matlab

tư ng vi ph m t c ñ khi tham gia giao thơng (qua h m,



Tìm hi u phương pháp tr n n (background subtraction) ñ

c u…).

phát hi n chuy n ñ ng





như xác đ nh hành vi té ngã c a ngư i b nh.

Tìm hi u phương pháp phân m nh vùng(region based

segmentation) đ dị v t đ i tư ng


Tìm hi u phương pháp xác đ nh v n t c c a ñ i tư ng

chuy n ñ ng s d ng camera calibration.
- Phương pháp nghiên c u th c nghi m


Đ tài có ng d ng trong các h th ng chăm sóc s c kh e

7. B c c lu n văn
N i dung c a lu n văn ñư c chia thành các ph n như sau:
M ñ u
Chương 1: Nghiên c u t ng quan


-5-

-6-

T ng quan v camera s , v video, các k thu t phát hi n và theo
v t ñ i tư ng trong video s nh m giúp chúng ta hi u rõ hơn v các k

CHƯƠNG 1: NGHIÊN C U T NG QUAN

thu t phát hi n chuy n ñ ng, theo v t ñ i tư ng, phương pháp hi u

1.1.T NG QUAN V CAMERA S

ch nh camera (camera calibration).

1.1.1. Khái ni m v Camera s

Chương 2: Phân tích thi t k h th ng
Phân tích và thi t k h th ng ñ xây d ng các ch c năng c a
chương trình.
Chương 3: Cài đ t và k t qu
Cài đ t chương trình, k t qu minh h a và các ràng bu c c a

chương trình.
K t lu n và hư ng phát tri n
K t lu n, ph m vi ng d ng, h n ch c a chương trình và các
hư ng phát tri n trong tương lai.

Camera là m t thi t b ghi hình có th ghi l i ñư c nh ng hình nh
trong m t kho ng th i gian nào đó và lưu tr các d li u hình nh này.
1.1.2. Phân lo i Camera
Có 3 cách phân lo i Camera.
Cách 1: Phân lo i theo kĩ thu t hình nh.
Cách 2: Phân lo i theo kĩ thu t ñư ng truy n.
Cách 3: Phân lo i theo tính năng s d ng.
1.1.3. H th ng camera quan sát
H th ng camera giúp cho nh ng nhà qu n lý có th ki m sốt

Ph l c

công vi c m t cách ch t ch hơn, ti t ki m đư c chi phí và làm cho

Trình bày v vi c thi t l p mơi trư ng cho vi c l p trình v i

hình nh c a doanh nghi p ñư c chuyên nghi p, hi n ñ i hơn.

Matlab và các b ng th ng kê k t qu .

1.2. T NG QUAN V VIDEO
1.2.1. Khái ni m v Video
Thu t ng video dùng đ ch ngu n thơng tin hình nh tr c quan
(pictorial visual information), bao g m m t chu i các nh tĩnh (still
image) liên ti p nhau, ñư c s p x p theo chi u th i gian.

1.2.2. Video s
1.2.2.1. Tín hi u video s
Tín hi u video s ñư c lưu tr dư i d ng s , do đó chúng đư c
l y m u và lư ng t hóa.
1.2.2.2. Ưu và như c đi m c a video s
- Ưu đi m
V i tín hi u s , ta không c n ph i chuy n đ i gi a các tín hi u
như trong tín hi u tu n t . Ngồi ra, cịn có th ch nh s a, t o các hi u


-7-

ng trên tín hi u video s .

-8-

Ý tư ng chính c a phương pháp này là t i m i pixel c a mơ hình

- Như c đi m

n n, m t t p các cluster v i tâm và gi i h n trong không gian màu s

Như c đi m c a video s đó là nó ñòi h i kh i lư ng lưu tr l n

ñư c xây d ng nh m th hi n s phân b c a pixel n n trong không

và băng thơng r ng đ truy n t i.

gian màu ñó. M i cluster như v y ñư c g i là codeword, t p cluster t i


1.2.2.3. Chu n video s AVI

m i v trí pixel đư c g i là codebook.

1.3. CÁC PHƯƠNG PHÁP TR

N N PHÁT HI N Đ I TƯ NG

1.3.1. T ng quan v phát hi n ñ i tư ng
Phát hi n ñ i tư ng chuy n ñ ng trong video là m t trong các bài
tốn đư c nghiên c u r ng rãi và có nhi u ng d ng trong cu c s ng
hi n nay..
1.3.2. Gi i thi u v phương pháp tr n n
Ý tư ng chung c a các phương pháp tr n n là: Đ phát hi n ra

1.3.6. Đánh giá và k t lu n
Đ so sánh gi a các phương pháp tr n n, ta ti n hành th nghi m
trên hơn 40 m u video khác nhau v kích thư c, ánh sáng, ñ rung c a
camara, ñ d ch chuy n c a n n,…v.v.
D a vào k t qu c a vi c phát hi n chuy n ñ ng c a các phương
pháp tr

n n trên các video m u ta có th k t lu n r ng: Trong 3

phương pháp tr n n ñư c ñ c p

trên thì phương pháp Running

đư c các đ i tư ng chuy n ñ ng trong video chúng ta ph i có đư c


Gaussian Average ln cho k t qu v i đ chính xác cao và t c đ x lý

mơ hình n n (background model). Mơ hình n n này có th đư c h c

c a phương pháp này khá nhanh. Tuy nhiên xét v t c ñ x lý thì

qua nhi u frame nh n u n n b thay ñ i, ngư c l i ta có th ch n m t

phương pháp Frame Difference t n ít th i gian x lý nh t. V i phương

n n có s n n u n n khơng b thay đ i. Sau đó, ta s dùng mơ hình n n

pháp Codebook thì đ chính xác c a phương pháp này ph thu c vào s

này ñ so sánh v i frame nh hi n t i và k t qu là ta s nh n bi t
ñư c ñâu là ph n n n, ñâu là các ph n chuy n ñ ng.
1.3.3. Frame Difference

nh ñư c ch n đ h c n n và nó b

nh hư ng b i đ sáng vì th k t

qu c a nó khơng chính xác trong m t s trư ng h p.
T

nh ng lý do trên ta có th áp d ng phương pháp tr

n n

Ý tư ng chính trong phương pháp Frame Difference là các đ i


Running Gaussian Average ho c Frame Difference ñ phát hi n ñư c

tư ng chuy n ñ ng s ñư c phát hi n d a trên s khác bi t gi a hai

các ñ i tư ng chuy n ñ ng trong file video ñư c lưu t camera quan sát

frame nh liên ti p nhau cùng v i m t ngư ng ñư c ch n trư c.

tùy vào tình hu ng c th .

1.3.4. Running Gaussian Average

1.4. PHƯƠNG PHÁP HI U CH NH CAMERA

Phương pháp này do Wren, Azarbayejani, Darrell và Pentland ñưa
ra vào năm 1997. Phương pháp này ñ t m t phân ph i Gaussian G(µ, σ)

1.4.1. T ng quan v hi u ch nh camera
Hi u ch nh camera là bư c ñ u tiên hương t i tính tốn th giác

lên s bi n thiên giá tr c a m i pixel trong ño n video.

máy tính. M c dù m t vài thơng tin t ng c nh đo có th đư c l y t

1.3.5. Codebook

các camera không hi u ch nh, vi c hi u ch nh là c n thi t khi thơng tin
h đo đư c u c u.



-9-

1.4.1.1. Phân lo i
- Hi u ch nh camera có th ñư c phân lo i d a theo nhi u tiêu chí
khác nhau.

- 10 -

Theo v t đ i tư ng là giám sát các thay ñ i theo khơng gian và
th i gian c a đ i tư ng trong su t chu i video như v trí, kích thư c
ho c hình dáng c a đ i tư ng.

- Chúng ta có th phân lo i d a vào các phương phương pháp ño
ñ c s d ng đ ư c tính các thơng s c a mơ hình camera:


Kĩ thu t t i ưu khơng tuy n tính (non linear optimization).



Nh ng kĩ thu t tuy n tính mà vi c tính tốn chuy n đ i ma

1.5.2. Phương pháp Region Segmentation
1.5.2.1. Gi i thi u v vùng (Region).
Vùng (region) trong x lý nh là m t nhóm các đi m nh liên k t
v i nhau có cùng các thu c tính.
nh s đư c phân chia thành nhi u vùng, cái mà liên quan ñ n

tr n.


1.4.1.2.

Nh ng kĩ thu t 2 bư c (two-step).
Các phương pháp hi u ch nh camera

Phương pháp hi u ch nh camera ph thu c vào mơ hình dùng
ñ ư c lư ng hành vi c a camera. Nh ng mơ hình tuy n tính Hall và

nhi u ñ i tư ng, ho c m t ph n c a ñ i tư ng,
S phân chia các vùng thư ng ñư c th c hi n b ng cách s d ng
giá tr xám (gray values) c a ñi m nh. G m hai phương pháp ti p c n
ph bi n: Region-based, Edge Detection.

Faugeras-Toscani, s d ng phương pháp bình phương ít nh t đ thu

B ng 1. 1 B ng so sánh hai hư ng ti p c n

đư c các tham s c a mơ hình camera. Tuy nhiên, các phương pháp

Region based

hi u ch nh camera phi tuy n tính như: Faugeras-Toscani v i nh ng bi n
d ng, Tsai và Weng; s d ng kĩ thu t hai bư c.
1.4.2. Đánh giá và k t lu n
Đ chính xác trên vùng nh c a các phương pháp phi tuy n là t t
hơn phương pháp h a tuy n. Tuy nhiên th i gian th c hi n c a phương
pháp h a tuy n là th p hơn.
T


nh ng k t lu n trên, đ tăng đ chính xác c a hi u ch nh

camera, và thu n ti n trong phát tri n bài toán s d ng Matlab, ta ch n
cơng c camera calibration toolbox [7], cái mà tích h p nhi u phương
pháp hi u ch nh [6] r t thích h p đ phát tri n bài tốn.
1.5. CÁC PHƯƠNG PHÁP THEO V T Đ I TƯ NG
1.5.1. T ng quan v theo v t ñ i tư ng

Đư ng

biên

đóng

Edge detection
(closed Biên khơng c n thi t ph i đóng

boundaries)
Tính tốn d a trên s tương đ ng

Tính toán d a trên s khác bi t.

1.5.2.2. Region-based segmentation
M c tiêu c a phân khúc là ñ phân vùng m t hình nh vào khu
v c. Khi m t ñ i tư ng di chuy n ñư c phân ño n, m t khu v c c a
các ñi m nh gán cho ñ i tư ng là kh d ng. Khu v c này có th đư c
theo dõi s d ng phương pháp ti p c n như cross-correlation. V trí c a
khu v c trong khung ti p theo ñư c xác ñ nh. M t ñ i tư ng chuy n
ñ ng thư ng tương


ng v i m t ho c m t s

khu v c theo dõi.


- 11 -

S k t h p c a m t s khu v c cho m t ñ i tư ng sau đó đư c th c
hi n

m t m c ñ tr u tư ng cao hơn.

- 12 -

Có nhi u phương pháp đư c đưa ra đ xác ñ nh v n t c ñ i tư ng
chuy n ñ ng, tuy nhiên v n ñ này còn nhi u ph c t p c n nghiên c u
lâu dài. Trong lu n văn này, ta gi i thi u các phương pháp sau:
- Phương pháp 1: Xác đ nh v n tơc d a vào phương pháp lu ng

1.5.2.3. Các hàm dùng phân vùng trong Mablab
Hàm bwconncomp dùng đ tìm các thành ph n liên k t trong file
nh nh phân.
Bwlabel là hàm dùng ñ gán nhãn các thành ph n k t n i trong file
nh nh phân.
1.6. BÀI TOÁN XÁC Đ NH V N T C Đ I TƯ NG CHUY N
Đ NG QUA CAMERA
1.6.1. Xác ñ nh v n t c ñ i tư ng chuy n ñ ng
1.6.1.1. Gi i thi u
Xác ñ nh v n t c c a ñ i tư ng chuy n ñ ng qua camera là bư c
quan tr ng trong phát tri n các ng d ng th giác máy tính. Nó có nhi u

ng d ng trong nhi u lĩnh như:
- Giao thông v n t i
- H th ng chăm sóc s c kh e
- Cơng nghi p s n xu t t đ ng
1.6.1.2. Các phương pháp xác ñ nh v n t c
Hi n nay có nhi u phương pháp xác đ nh v n t c ñ i tư ng chuy n
ñ ng qua camera. Tuy nhiên, các phương pháp ñ u tr i qua các bư c
chính sau:
- Bư c 1: Phát hi n và dị v t các đ i tư ng chuy n ñ ng.
- Bư c 2: Xác ñ nh ñ i tư ng chuy n ñ ng m c tiêu.
- Bư c 3: Tính v n t c c a ñ i tư ng m c tiêu.

quang h c (optical flow).
- Phương pháp 2: Xác ñ nh v n t c ñ i tư ng chuy n ñ ng d a
vào phương pháp tr n n k t h p v i phân m nh vùng [8].
1.6.1.3. Xác ñ nh v n t c d a vào phương pháp lu ng quang h c
(Optical flow)
Phương pháp lu ng quang h c dùng đ tính tốn hư ng c a
chuy n ñ ng c a ñ i tư ng và ño lư ng v n t c c a đ i tư ng đó.
- Các bư c chính đ tính tốn s khác bi t lu ng quang h c:


Bư c 1: Đo lư ng các đ o hàm cư ng đ theo khơng gian

và th i gian.


Bư c 2: Tích h p v n t c chu n (normal) vào trong v n t c

toàn th .

- Các ñi u ki n ràng bu c c a phương pháp:


T t c các đ i tư ng trong c nh là c đ nh, khơng có thay

đ i v hình d ng.


Đ i tư ng chuy n ñ ng trong m t ph ng (2D), nghĩa là t a

ñ (OZ) là h ng s .
- Ưu ñi m c a phương pháp là:


Đơn gi n, s lư ng tính tốn ít.



Tính tốn trong các đi u ki n c a thu t tốn đem l i k t qu

tính v n t c v i đ chính xác cao, và t l sai s th p.
- Như c ñi m c a phương pháp:


- 13 -



Khơng thích h p trong tính tốn v n t c trong mơi trư ng


bên ngồi, và các đ i tư ng có hình d ng b t kì.


Phương pháp ch cho k t qu t t khi ñ i tư ng chuy n ñ ng

trong m t ph ng, cịn khi đ i tư ng chuy n đ ng theo chi u sâu,
phương pháp ít có tác d ng.

- 14 -

1.6.2.

Đánh giá và k t lu n

T k t qu nghiên c u trên, ta nh n th y r ng các phương pháp xác
ñ nh v n t c có đ chính xác khá cao, đơn gi n d áp d ng. Tuy nhiên,
các phương pháp cịn nhi u h n ch như:
- Ch xác đ nh ñư c v n t c khi ñ i tư ng chuy n ñ ng trong m t
ph ng.

1.6.1.4. Xác ñ nh v n t c d a trên phương pháp tr n n và phân
m nh vùng nh

- Đ chính xác gi m khi đ i tư ng chuy n ñ ng theo qu ñ o ph c
t p…

Phương pháp dùng ñ xác ñ nh v n t c c a ñ i tư ng chuy n ñ ng

Đ kh c ph c nh ng như c ñi m trên, Lu n văn đã nghiên c u


thơng qua ño n video d a trên hai kĩ thu t là tr n n và phân m nh

phương pháp hi u ch nh camera k t h p v i phương pháp tr n n và

vùng.

phân m nh vùng nh ñ xác ñ nh t a ñ c a ñ i tư ng chuy n ñ ng qua

- Phương pháp: Phương pháp tr n n và phân m nh vùng ñã ñư c
ñ c p trong ph n lý thuy t

các m c trên.

- Các ñi u ki n ràng bu c c a phương pháp:


N n khơng đư c thay đ i.



Đ i tư ng chuy n đ ng trong m t ph ng khơng theo chi u

sâu.


Các đ i tư ng khơng ch ng lên nhau.

- Ưu đi m c a phương pháp:



Xác đ nh đư c v n t c nhi u ñ i tư ng m t lúc.



Đơn gi n, ít l i và hi u qu ñ i v i ñ i tư ng b t kỳ.

-Như c đi m c a phương pháp:


Phương pháp ít hi u qu ñ i v i ñ i tư ng chuy n đ ng

theo chi u xâu.


Chưa xác ñ nh ñư c ñ i tư ng khi nhi u ñ i tư ng chuy n

ñ ng ch ng lên nhau.


Tính v n t c trung bình chưa quy ñ i t a ñ th c nên ñ

chính xác chưa cao.

t a đ th c t đó nâng cao ñ chính xác c a vi c ño t c ñ .


- 15 -

- 16 -


- Đ u ra: T a ñ tr ng tâm c a ñ i tư ng chuy n đ ng.
-Thu t tốn x lý đư c trình bày như sau:
CHƯƠNG 2: PHÂN TÍCH THI T K H TH NG

for i=0 to (totalFrame-1) do

2.1. PHƯƠNG PHÁP HI U CH NH CAMERA Đ XÁC Đ NH

a.Đ c frame[i].

V NT C

b.L y nh tham chi u, rImg.

2.1.1. MÔ T CHƯƠNG TRÌNH

c.C p nh p frame[i] b ng phương pháp tr n n nh tham

Chương trình xác đ nh v n t c ñ i tư ng chuy n ñ ng l y d li u
t ño n video quay l i t m t camera tĩnh, ghi l i v i chu n AVI.

chi u rImg.
d.T i m i frame[i]:

Sau khi có d li u đ u vào chương trình s x lý đo n video đ l y
t t c khung hình. Ti p đó, t m i khung hình có đư c, ta ti n hành tìm

-Xác ñ nh các thành ph n liên k t b ng phương pháp
gán nhãn.


ki m và truy v t ñ i tư ng d a vào phương pháp tr n n và phân m nh

-Tính tốn di n tích c a t ng vùng liên k t.

vùng (region based segmentation). Ti p đó ta xác đ nh đ i tư ng

-Xóa b

chuy n đ ng m c tiêu, tìm t a ñ trung tâm c a ñ i tư ng, và quy đ i
nó ra t a đ

th c d a vào kĩ thu t hi u ch nh camera (camera

các ñ i tư ng nh

hơn giá tr ngư ng

(threshhold).
e.T o c u trúc hình thái các thành ph n, i.e..; G n c u trúc

hình các thành ph n như sau:

calibration).
2.1.2. XÂY D NG THU T TOÁN PHÁT HI N VÀ DÒ V T Đ I
TƯ NG CHUY N Đ NG
2.1.2.1. Mơ t thu t tốn
Đ dị v t m i ñ i tư ng ta k t h p c a hai phương pháp tr n n
(background

extraction)




phân

m nh

vùng

(region

based

segmentation), ñây là bư c quan tr ng nh t c a bài toán.
Đ u tiên t i m i khung hình, ti n c nh đư c tách ra kh i n n b ng
phương pháp nh tham chi u [12]. Sau đó, d a trên ti n c nh l y ñư c
ta s xác ñ nh các thành ph n liên k t (connected components), ư c
lư ng di n tích các vùng nh, tìm di n tích vùng l n nh t, và cu i cùng
là tr v t a đ trung tâm c a vùng đó.
2.1.2.2. Thu t toán x lý
- Đ u vào: D li u t camera quan sát ho c t video ñư c thu l i.

f.Đóng nh nh phân b i c u trúc hóa các thành ph n.
g.Ư c lư ng các vùng nh.
h.Tìm vùng l n nh t.
i.Xác đ nh v trí trung tâm (x, y) c a vùng l n nh t.
j.Tr v giá tr t a ñ x, y.
k. K t thúc.
2.1.3. XÂY D NG THU T TOÁN XÁC Đ NH V N T C Đ I
TƯ NG CHUY N Đ NG

2.1.3.1. Phương pháp tính kho ng cách


- 17 -

- 18 -

Kho ng cách Euclid (D) di chuy n b i ñ i tư ng gi a c p khung
hình liên ti p nhau đư c tính tốn sau khi chi u t a đ trung tâm c a
đ i tư ng trong m i khung hình qua t a ñ th c.
Kho ng cách gi a hai tr ng tâm P ( , , ) và Q (

,

,

)h

9. Tính tốn v n t c trung bình c a ñ i tư ng trong ño n
video như sau:

10. K t thúc.

t a ñ 3D:
2.1.3.3. K t qu
(2. 1)
2.1.3.2. Thu t tốn xác đ nh v n t c c a ñ i tư ng chuy n ñ ng m c
tiêu
- Đ u vào: D li u t camera quan sát ho c t video ñư c thu l i.
- Đ u ra: v n t c c a ñ i tư ng chuy n ñ ng m c tiêu.


Hi u ch nh Camera (Camera calibration):
- Kho ng cách tiêu đi m (Focal Length):
- Đi m chính nh (Principal point):
- Đ l ch (Skew):
Angleof pixel axes

- Thu t tốn x lý đư c trình bày như sau:

Degrees

1. Xác ñ nh các tham s bên trong, bên ngoài b ng kĩ thu t
- Đ méo (Distortion):

hi u ch nh camera.
2. Đ c file video.
3. X lý file ñ l y thơng tin c n thi t t đo n video.
4. Tìm tham s tu n su t Frame c a đo n video RF.
5. Tính t ng s th i gian và th i gian t ng frame:
T

- Sai s ñi m nh (Pixel error):
V n t c di chuy n: Ti n hành th nghi m trên camera có t c đ

/

30 khung hình trên giây, và kích thư c khung hình như sau 640 X 480.
6. Xác ñ nh quãng ñư ng Di c a ñ i tư ng gi a khung th i
và khung th (i+1) trong th gi i th c b ng cách s d ng hàm truy v t
ñ i tư ng, và phương pháp tính kho ng cách.

7. Tính v n t c gi a khung Fi và Fi+1 như sau
8. L p bư c 6, 7 for i= 0 to
gi a các khung hình.

, đ xác đ nh t t c v n t c

K t qu th ng kê như sau:


- 19 -

- 20 -

B ng 2. 1 B ng so sánh v n t c ño lư ng và v n t c tính tốn

Stereo vision là kĩ thu t s d ng hai hay nhi u camera ho c m t
camera chuy n ñ ng ñ ño lư ng kho ng cách [2]. Thi t l p ñơn gi n

V n t c ño
lư ng

V n t c tính
tốn

Sai s

% sai s

|v-v’|(cm/s)


nh t (c u hình kinh đi n) s d ng hai máy nh ph ng ñ t cách nhau m t
kho ng cách theo chi u ngang bi t trư c (xem nh 2.4).

v(cm/s)

v’(cm/s)

18.90

18.59

0.31

1.6

18.71

18.424

0.288

1.54

25.82

26.096

0.276

26.58


0.109

0.412

24.62

24.54

0.0784

P
ZQ

1.06

26.69

Q
∆ZPQ

0.318

ZP

2.2. PHƯƠNG PHÁP CAMERA STEREO CHO XÁC Đ NH V N
T C Đ I TƯ NG CHUY N Đ NG
2.2.1. Mô t phương pháp

cr


cl

Image planes
f

pr

pl

Optical centers
(lenses)

T

Hình 2. 2 H th ng chu n c a hai camera v i ñ dài tiêu c f và

Phương pháp s d ng kĩ thu t hi u ch nh camera và camera stereo ñ
xác ñ nh v n t c c a ñ i tư ng chuy n ñ ng.

kho n cách cơ s T. Kho ng cách theo chi u ngang gi a hai camera
có t a ñ pi và pr ñư c g i là đ l ch và nó cho phép tính tốn ñ sâu
ho c kho ng cách Zp c a ñi m 3D P t camera

Y-axis

2.2.3. Kho ng cách trên tr c Y
M u so kh p cho tính tốn đ l ch:

P2


Đ ư c lư ng ñư c ñ l ch c a ñ i tư ng trong c p nh stereo, ñ u

y

tiên chúng ta c n ph i truy v t ñ i tư ng trong nh bên trái. Đ i tư ng

X-axis

P1
x

này sau đó đư c s d ng là m u đ tìm m t đ i tư ng kh p bên nh bên
ph i. Đi u đó hồn tồn th c hi n đư c b i vì nh c a cùng m t đ i
tư ng trong khung nhìn bên trái và bên ph i là r t tương ñ ng khi s

Stereo Camera

d ng mơ hình stereo camera kinh đi n trong lu n văn.

Hình 2 1 Hư ng chuy n đ ng nhìn t trên xu ng
2.2.2. T ng quan v Stereo Vision

2.2.4. Kho ng cách trên tr c X


- 21 -

- 22 -


Tính kho ng cách trên tr c X gi ng như phương pháp tính kho ng
cách trong phương pháp hi u ch nh camera ñ xác đ nh v n t c.
2.2.5. Tính tốn v n t c
Sau khi có giá tr x và y, chúng ta tính tốn kho ng cách gi a P1 và P2
s d ng công th c Pythagorean:

PP2 = x2 + y 2
1



2.2.6.

3.1.1. Yêu c u h th ng
Đ th c hi n hi u ch nh camera, kh i ñ ng Matlab và gõ l nh
ocam_calib.
Sau đó chúng ta t i nh m u ñ th c hi n hi u ch nh.
Đ s d ng k t qu hi u ch nh ta ch n save, sau đó ch n load.

P P2
1

1 second

3.1. CÀI Đ T CHƯƠNG TRÌNH
3.1.2. Cài ñ t

(2. 2)
Cu i cùng, chúng ta có th ño ñ c v n t c c a ñ i tư ng chuy n ñ ng
trong t a ñ th c b ng cách tính tốn t ng kho ng cách P1P2 trên s

frame thu ñư c trên m i giây.

S=

CHƯƠNG 3: CÀI Đ T VÀ K T QU

(2. 3)

Sau khi có k t qu hi u ch nh camera ta ti n hành ño t c ñ b ng
ño n l nh trong bài báo cáo chính.

K t lu n và ñánh giá

Phương pháp s d ng kĩ thu t stereo vision k t h p v i phương pháp

3.2. K T QU

hi u ch nh camera ñ xác ñ nh v n t c, t ñó có th xác ñ nh ñư c v n

B ng 3. 1 K t qu xác ñ nh t a ñ tr ng tâm

t c c a ñ i tư ng chuy n ñ ng theo m t qu ñ o ph c t p.
Phương pháp h a h n s có nhi u ng d ng trong tương lai. Tuy
nhiên, lu n văn ch m i dùng l i
d ng ñư c ng d ng ñ ki m th .

vi c nghiên c u lý thuy t chưa xây

STT


T a ñ tr ng tâm 2D

T a đơ tr ng tâm 3D

khung
1

(41.5557

226.9085)

(-0.6842 -0.5694 0.4558)

30

(129.7268 233.4141)

(-0.6374 -0.6982 0.3259)

60

(216.7695 248.0980)

(-0.5287 -0.8340 0.1577)

90

(282.1158 263.4749)

(-0.3794 -0.9252 0.0125)


120

(359.9312 282.0263)

(-0.1032 -0.9856 -0.1336)

150

(445.5017 270.9559)

(0.2469 -0.9670 -0.0625)

180

(498.5813 264.3691)

(0.4199 -0.9071 0.0278)

210

(514.0632 263.8442)

(0.4637 -0.8844 0.0535)

240

(554.5049 260.1997)

(0.5559 -0.8206 0.1323)


270

(597.0754 261.2381)

(0.6338 -0.7456 0.2059)

283

(606.8679 267.5540)

(0.6588 -0.7222 0.2107)


- 23 -

- 24 -

K T LU N VÀ HƯ NG PHÁT TRI N

B ng 3. 2 T ng kho ng cách di và v n t c di chuy n đư c gi a các
c p khung hình
C p khung hình

1.K t lu n

Kho ng cách

V nt c


Xét v m t lý thuy t, đ tài đã hồn thành ñư c vi c tìm hi u các

1-2

0.0007617

0.0229

ph n lý thuy t đã đ t ra như: Tìm hi u và s d ng thành th o ph n m m

30-31

0.0122

0.3671

matlab đ phát tri n bài tốn, tìm hi u ñư c các khái ni m cơ b n v

60-61

0.00007739

0.0023

video và camera s , tìm hi u đư c các thu t tốn v phát hi n chuy n

90-91

0.0111


0.3329

đ ng b ng phương pháp tr n n: Frame Differrence, Running Gausian

120-121

0.00015249

0.0046

Average và Codebook, tìm hi u đư c phương pháp các phương pháp

150-151

0.0128

0.3838

camera calibration, tìm hi u đư c các phương pháp theo v t region

180-181

0,00014403

0.0043

based segmentation, tìm hi u ñư c cách th c xác ñ nh v n t c ñ i tư ng

210-211


0.0017

0.0498

chuy n ñ ng.

240-241

0.00057176

0.0172

Xét v m t th c ti n, đ tài đã hồn thành ñư c m c tiêu ñư c ñ t

270-271

0.000064816

0.0019

ra như: Phát hi n và truy v t ñ i tư ng qua t ng frame c a video, xác

282-283

0.000062636

0.0019

ñ nh ñư c t a ñ c a ñ i tư ng trong th gi i th c, xác ñ nh ñư c v n
t c ñ i tư ng chuy n đ ng qua camera, hồn thành vi c cài ñ t và ch y


T ng kho ng cách di chuy n đư c:

thành cơng các thu t tốn ñã nghiên c u trong ph n lý thuy t, th c hi n

D = 1.9627 (m)

vi c so sánh, ñánh giá ưu như c ñi m c a t ng thu t toán và ch n ra

V n t c trung bình c a đ i tư ng chuy n đ ng là:

đư c thu t tốn phù h p nh t v i t ng ch c năng c a chương trình, s

V = 0.2081(m/s)

d ng thành cơng các công c ph c v cho vi c x lý video như Motion
Video, FLV Converter ñ chuy n ñ i các ñ nh d ng video khác nhau v
ñ nh d ng AVI ñ d dàng cho vi c thao tác trên Matlab.
2. Ph m vi ng d ng
Đ tài có ph m vi ng trong các h th ng giám sát y t , trong các
h th ng xác đ nh t c đ trong giao thơng (qua h m).


- 25 -

- 26 -

Bên c nh đó đ tài còn t o n n t ng cho nh ng nghiên c u v c m
quan máy tính nói riêng và x lý nh nói chung trong tương lai.


3. H n ch
Bên c nh nh ng k t qu ñã đ t đư c, đ tài v n cịn có m t s h n
ch c n ph i ñư c kh c ph c như:
- T c ñ x lý c a chương trình cịn ch m khi x lý nh ng video
có đ phân gi i cao và kích thư c l n.
- Vi c xác đ nh ñ i tư ng chuy n ñ ng, ch d ng l i

vi c xác

ñ nh ñ i tư ng chi m vùng l n nh t.
- Vi c tính v n t c ch ñúng cho chuy n ñ ng th ng trong không
gian 2D (chi u x,y) chưa chính xác khi đ i tư ng chuy n đ ng theo
chi u sâu.
4. Hư ng phát tri n
Trong quá trình th c hi n đ tài, do nh ng h n ch v trình đ và
th i gian th c hi n đ tài có h n, chương trình ñư c xây d ng ch là
ph n demo c a các thu t tốn xác đ nh v n t c c a ñ i tư ng chuy n
ñ ng. Đ tri n khai trong th c t , nó địi h i c n ph i c i ti n hơn n a.
Hy v ng trong tương lai, nh ng phát tri n dư i ñây s giúp ñ tài hoàn
thi n hơn.
- Xác ñ nh ñ i tư ng chuy n đ ng v i tiêu chí c th .
- Xây d ng thu t toán c i thi n ch t lư ng c a video như lo i tr
nhi u, lo i b bóng và t i ưu hóa các thu t tốn đ tăng t c đ x lý c a
chương trình.
-

ng d ng kĩ thu t camera stereo ñ xác ñ nh ñư c v trí chính

xác c a đ i tư ng khi di chuy n theo chi u sâu(trong không gian 3D),
t đó tính tốn v n t c c a đơi tư ng đư c chính xác.




×