-1-
-2-
B GIÁO D C VÀ ĐÀO T O
Đ I H C ĐÀ N NG
M Đ U
1. Lý do ch n ñ tài
V i s phát tri n nhanh chóng c a các lo i máy móc hi n đ i như
máy nh s , máy quay s , máy vi tính, đi n tho i đi đ ng … thì lư ng
thơng tin con ngư i thu đư c dư i d ng hình nh là khá l n. Đ lư ng
NGUY N VĂN TRUNG
thơng tin này tr nên có ích hơn con ngư i c n có các thao tác đ ti n
hành x lý nó và t đó t o ñi u ki n cho s phát tri n không ng ng
c a các k thu t x lý hình nh. X lý nh là m t trong nh ng cơng
ngh đư c ng d ng r ng rãi hi n nay trong nhi u lĩnh v c c a ñ i
XÁC Đ NH V N T C Đ I TƯ NG CHUY N Đ NG QUA
CAMERA
s ng xã h i. Không ch d ng l i
vi c x lý nh ng v t nhèo, tái ch
và ph c h i các nh cũ (Hình 1), ngày nay cơng ngh x lý nh đã
mang l i nh ng ti n b vư t b c như nh n d ng vân tay, nh n d ng
khuôn m t, nh n d ng ñ i tư ng …v.v khi nó k t h p v i lĩnh v c trí
tu nhân t o.
Chun ngành: KHOA H C MÁY TÍNH
Mã s : 60.48.01
Bên c nh đó, h th ng camera quan sát ngày càng ñư c s d ng
m t cách r ng rãi v i m c đích tr giúp c nh sát, ngư i tham gia giao
thông t i các đi m nút giao thơng, t đó phát hi n ngư i vi ph m.
H m ñư ng b ngày càng ph bi n
nư c ta, có vai trị l n trong
vi c tích ki m chi phí và an tồn cho ngư i tham gia giao thơng. Do đ c
TĨM T T LU N VĂN TH C SĨ K THU T
thù c a h m là
dư i lịng đ t nên vi c qu n lý xe qua l i r t khó khăn.
Nên vi c c nh sát giao thông x lý xe vi ph m tr c ti p
trong h m là
không th .
Ngư i hư ng d n khoa h c: TS. Huỳnh H u Hưng
Vì v y vi c xác đ nh v n t c c a xe d a vào video ñã ghi l i ph c
v cho vi c x lý và qu n lý xe vi ph m t c ñ ch m t i h m ñư ng b
là ñi u c n thi t.
2. M c tiêu và nhi m v nghiên c u
M c đích c a ñ tài nh m nghiên c u các thu t toán phát hi n và
Đà N ng - Năm 2012
theo v t, t đó tính tốn v n t c c a ñ i tư ng chuy n ñ ng t d li u
-3-
-4-
video, làm cơ s ñ xây d ng h th ng xác ñ nh v n t c c a đ i tư ng
•
tham gia giao thơng.
hi n chuy n ñ ng, thu t toán phát hi n và theo v t đ i tư ng
Ti n hành phân tích và cài đ t: thu t tốn tr n n ñ phát
- Xác ñ nh ñ i tư ng giao thơng đang chuy n đ ng.
chuy n đ ng t d li u video, t đó xác đ nh v n t c c a đ i
- Dị v t và ư c lư ng v n t c s d ng phương pháp optical flow.
tư ng chuy n ñ ng.
- T o ti n ñ cho vi c xác ñ nh v n t c c a các ñ i tư ng vi ph m,
•
làm b ng ch ng cho vi c x lý vi ph m, góp ph n nâng cao ý th c ch p
hành tham gia giao thơng c a ngư i dân
Bên c nh đó ñ tài còn mong mu n giúp cho m i ngư i có m t cái
So sánh và đánh giá k t qu ñ t ñư c.
5. K t qu d ki n
- N m v ng và cài ñ t thành cơng các thu t tốn: phát hi n chuy n
ñ ng b ng phương pháp tr n n, truy v t đ i tư ng b ng phương
nhìn tồn di n hơn v vai trị và kh năng ng d ng c a công ngh x
pháp phân m nh vùng (region based segmentation), t đó xây d ng
lý nh vào trong th c t c a ñ i s ng xã h i.
thành cơng chương trình xác đ nh v n t c ñ i tư ng chuy n ñ ng.
3. Đ i tư ng và ph m vi nghiên c u
-T o ñư c b ng so sánh k t qu , đ chính xác c a các phương
- Đ i tư ng nghiên c u
pháp phát hi n và theo v t ñ i tư ng chuy n ñ ng d a trên t p các
Trong lu n văn này, d li u ñư c x lý là các đo n video có s n
video có s n.
ñư c quay t m t camera tĩnh ghi l i v i chu n AVI (Audio Video
Interleave).
6. Ý nghĩa khoa h c và th c ti n c a lu n văn
-V m t lý thuy t
- Ph m vi nghiên c u
•
Ph m vi nghiên c u c a ñ tài liên quan ñ n lĩnh v c x lý nh s
t .
thông qua vi c s ph n m m Matlab.
4. Phương pháp nghiên c u
- Phương pháp nghiên c u lý thuy t
•
ng d ng thành công công ngh x lý nh vào trong th c
T o ti n ñ cho nh ng nghiên c u ti p theo trong tương lai.
-V m t th c ti n
•
Giúp gi m cơng s c, tăng hi u qu trong vi c xác đ nh đ i
•
Tìm hi u cách l p trình v i Matlab
tư ng vi ph m t c ñ khi tham gia giao thơng (qua h m,
•
Tìm hi u phương pháp tr n n (background subtraction) ñ
c u…).
phát hi n chuy n ñ ng
•
•
như xác đ nh hành vi té ngã c a ngư i b nh.
Tìm hi u phương pháp phân m nh vùng(region based
segmentation) đ dị v t đ i tư ng
•
Tìm hi u phương pháp xác đ nh v n t c c a ñ i tư ng
chuy n ñ ng s d ng camera calibration.
- Phương pháp nghiên c u th c nghi m
Đ tài có ng d ng trong các h th ng chăm sóc s c kh e
7. B c c lu n văn
N i dung c a lu n văn ñư c chia thành các ph n như sau:
M ñ u
Chương 1: Nghiên c u t ng quan
-5-
-6-
T ng quan v camera s , v video, các k thu t phát hi n và theo
v t ñ i tư ng trong video s nh m giúp chúng ta hi u rõ hơn v các k
CHƯƠNG 1: NGHIÊN C U T NG QUAN
thu t phát hi n chuy n ñ ng, theo v t ñ i tư ng, phương pháp hi u
1.1.T NG QUAN V CAMERA S
ch nh camera (camera calibration).
1.1.1. Khái ni m v Camera s
Chương 2: Phân tích thi t k h th ng
Phân tích và thi t k h th ng ñ xây d ng các ch c năng c a
chương trình.
Chương 3: Cài đ t và k t qu
Cài đ t chương trình, k t qu minh h a và các ràng bu c c a
chương trình.
K t lu n và hư ng phát tri n
K t lu n, ph m vi ng d ng, h n ch c a chương trình và các
hư ng phát tri n trong tương lai.
Camera là m t thi t b ghi hình có th ghi l i ñư c nh ng hình nh
trong m t kho ng th i gian nào đó và lưu tr các d li u hình nh này.
1.1.2. Phân lo i Camera
Có 3 cách phân lo i Camera.
Cách 1: Phân lo i theo kĩ thu t hình nh.
Cách 2: Phân lo i theo kĩ thu t ñư ng truy n.
Cách 3: Phân lo i theo tính năng s d ng.
1.1.3. H th ng camera quan sát
H th ng camera giúp cho nh ng nhà qu n lý có th ki m sốt
Ph l c
công vi c m t cách ch t ch hơn, ti t ki m đư c chi phí và làm cho
Trình bày v vi c thi t l p mơi trư ng cho vi c l p trình v i
hình nh c a doanh nghi p ñư c chuyên nghi p, hi n ñ i hơn.
Matlab và các b ng th ng kê k t qu .
1.2. T NG QUAN V VIDEO
1.2.1. Khái ni m v Video
Thu t ng video dùng đ ch ngu n thơng tin hình nh tr c quan
(pictorial visual information), bao g m m t chu i các nh tĩnh (still
image) liên ti p nhau, ñư c s p x p theo chi u th i gian.
1.2.2. Video s
1.2.2.1. Tín hi u video s
Tín hi u video s ñư c lưu tr dư i d ng s , do đó chúng đư c
l y m u và lư ng t hóa.
1.2.2.2. Ưu và như c đi m c a video s
- Ưu đi m
V i tín hi u s , ta không c n ph i chuy n đ i gi a các tín hi u
như trong tín hi u tu n t . Ngồi ra, cịn có th ch nh s a, t o các hi u
-7-
ng trên tín hi u video s .
-8-
Ý tư ng chính c a phương pháp này là t i m i pixel c a mơ hình
- Như c đi m
n n, m t t p các cluster v i tâm và gi i h n trong không gian màu s
Như c đi m c a video s đó là nó ñòi h i kh i lư ng lưu tr l n
ñư c xây d ng nh m th hi n s phân b c a pixel n n trong không
và băng thơng r ng đ truy n t i.
gian màu ñó. M i cluster như v y ñư c g i là codeword, t p cluster t i
1.2.2.3. Chu n video s AVI
m i v trí pixel đư c g i là codebook.
1.3. CÁC PHƯƠNG PHÁP TR
N N PHÁT HI N Đ I TƯ NG
1.3.1. T ng quan v phát hi n ñ i tư ng
Phát hi n ñ i tư ng chuy n ñ ng trong video là m t trong các bài
tốn đư c nghiên c u r ng rãi và có nhi u ng d ng trong cu c s ng
hi n nay..
1.3.2. Gi i thi u v phương pháp tr n n
Ý tư ng chung c a các phương pháp tr n n là: Đ phát hi n ra
1.3.6. Đánh giá và k t lu n
Đ so sánh gi a các phương pháp tr n n, ta ti n hành th nghi m
trên hơn 40 m u video khác nhau v kích thư c, ánh sáng, ñ rung c a
camara, ñ d ch chuy n c a n n,…v.v.
D a vào k t qu c a vi c phát hi n chuy n ñ ng c a các phương
pháp tr
n n trên các video m u ta có th k t lu n r ng: Trong 3
phương pháp tr n n ñư c ñ c p
trên thì phương pháp Running
đư c các đ i tư ng chuy n ñ ng trong video chúng ta ph i có đư c
Gaussian Average ln cho k t qu v i đ chính xác cao và t c đ x lý
mơ hình n n (background model). Mơ hình n n này có th đư c h c
c a phương pháp này khá nhanh. Tuy nhiên xét v t c ñ x lý thì
qua nhi u frame nh n u n n b thay ñ i, ngư c l i ta có th ch n m t
phương pháp Frame Difference t n ít th i gian x lý nh t. V i phương
n n có s n n u n n khơng b thay đ i. Sau đó, ta s dùng mơ hình n n
pháp Codebook thì đ chính xác c a phương pháp này ph thu c vào s
này ñ so sánh v i frame nh hi n t i và k t qu là ta s nh n bi t
ñư c ñâu là ph n n n, ñâu là các ph n chuy n ñ ng.
1.3.3. Frame Difference
nh ñư c ch n đ h c n n và nó b
nh hư ng b i đ sáng vì th k t
qu c a nó khơng chính xác trong m t s trư ng h p.
T
nh ng lý do trên ta có th áp d ng phương pháp tr
n n
Ý tư ng chính trong phương pháp Frame Difference là các đ i
Running Gaussian Average ho c Frame Difference ñ phát hi n ñư c
tư ng chuy n ñ ng s ñư c phát hi n d a trên s khác bi t gi a hai
các ñ i tư ng chuy n ñ ng trong file video ñư c lưu t camera quan sát
frame nh liên ti p nhau cùng v i m t ngư ng ñư c ch n trư c.
tùy vào tình hu ng c th .
1.3.4. Running Gaussian Average
1.4. PHƯƠNG PHÁP HI U CH NH CAMERA
Phương pháp này do Wren, Azarbayejani, Darrell và Pentland ñưa
ra vào năm 1997. Phương pháp này ñ t m t phân ph i Gaussian G(µ, σ)
1.4.1. T ng quan v hi u ch nh camera
Hi u ch nh camera là bư c ñ u tiên hương t i tính tốn th giác
lên s bi n thiên giá tr c a m i pixel trong ño n video.
máy tính. M c dù m t vài thơng tin t ng c nh đo có th đư c l y t
1.3.5. Codebook
các camera không hi u ch nh, vi c hi u ch nh là c n thi t khi thơng tin
h đo đư c u c u.
-9-
1.4.1.1. Phân lo i
- Hi u ch nh camera có th ñư c phân lo i d a theo nhi u tiêu chí
khác nhau.
- 10 -
Theo v t đ i tư ng là giám sát các thay ñ i theo khơng gian và
th i gian c a đ i tư ng trong su t chu i video như v trí, kích thư c
ho c hình dáng c a đ i tư ng.
- Chúng ta có th phân lo i d a vào các phương phương pháp ño
ñ c s d ng đ ư c tính các thơng s c a mơ hình camera:
•
Kĩ thu t t i ưu khơng tuy n tính (non linear optimization).
•
Nh ng kĩ thu t tuy n tính mà vi c tính tốn chuy n đ i ma
1.5.2. Phương pháp Region Segmentation
1.5.2.1. Gi i thi u v vùng (Region).
Vùng (region) trong x lý nh là m t nhóm các đi m nh liên k t
v i nhau có cùng các thu c tính.
nh s đư c phân chia thành nhi u vùng, cái mà liên quan ñ n
tr n.
•
1.4.1.2.
Nh ng kĩ thu t 2 bư c (two-step).
Các phương pháp hi u ch nh camera
Phương pháp hi u ch nh camera ph thu c vào mơ hình dùng
ñ ư c lư ng hành vi c a camera. Nh ng mơ hình tuy n tính Hall và
nhi u ñ i tư ng, ho c m t ph n c a ñ i tư ng,
S phân chia các vùng thư ng ñư c th c hi n b ng cách s d ng
giá tr xám (gray values) c a ñi m nh. G m hai phương pháp ti p c n
ph bi n: Region-based, Edge Detection.
Faugeras-Toscani, s d ng phương pháp bình phương ít nh t đ thu
B ng 1. 1 B ng so sánh hai hư ng ti p c n
đư c các tham s c a mơ hình camera. Tuy nhiên, các phương pháp
Region based
hi u ch nh camera phi tuy n tính như: Faugeras-Toscani v i nh ng bi n
d ng, Tsai và Weng; s d ng kĩ thu t hai bư c.
1.4.2. Đánh giá và k t lu n
Đ chính xác trên vùng nh c a các phương pháp phi tuy n là t t
hơn phương pháp h a tuy n. Tuy nhiên th i gian th c hi n c a phương
pháp h a tuy n là th p hơn.
T
nh ng k t lu n trên, đ tăng đ chính xác c a hi u ch nh
camera, và thu n ti n trong phát tri n bài toán s d ng Matlab, ta ch n
cơng c camera calibration toolbox [7], cái mà tích h p nhi u phương
pháp hi u ch nh [6] r t thích h p đ phát tri n bài tốn.
1.5. CÁC PHƯƠNG PHÁP THEO V T Đ I TƯ NG
1.5.1. T ng quan v theo v t ñ i tư ng
Đư ng
biên
đóng
Edge detection
(closed Biên khơng c n thi t ph i đóng
boundaries)
Tính tốn d a trên s tương đ ng
Tính toán d a trên s khác bi t.
1.5.2.2. Region-based segmentation
M c tiêu c a phân khúc là ñ phân vùng m t hình nh vào khu
v c. Khi m t ñ i tư ng di chuy n ñư c phân ño n, m t khu v c c a
các ñi m nh gán cho ñ i tư ng là kh d ng. Khu v c này có th đư c
theo dõi s d ng phương pháp ti p c n như cross-correlation. V trí c a
khu v c trong khung ti p theo ñư c xác ñ nh. M t ñ i tư ng chuy n
ñ ng thư ng tương
ng v i m t ho c m t s
khu v c theo dõi.
- 11 -
S k t h p c a m t s khu v c cho m t ñ i tư ng sau đó đư c th c
hi n
m t m c ñ tr u tư ng cao hơn.
- 12 -
Có nhi u phương pháp đư c đưa ra đ xác ñ nh v n t c ñ i tư ng
chuy n ñ ng, tuy nhiên v n ñ này còn nhi u ph c t p c n nghiên c u
lâu dài. Trong lu n văn này, ta gi i thi u các phương pháp sau:
- Phương pháp 1: Xác đ nh v n tơc d a vào phương pháp lu ng
1.5.2.3. Các hàm dùng phân vùng trong Mablab
Hàm bwconncomp dùng đ tìm các thành ph n liên k t trong file
nh nh phân.
Bwlabel là hàm dùng ñ gán nhãn các thành ph n k t n i trong file
nh nh phân.
1.6. BÀI TOÁN XÁC Đ NH V N T C Đ I TƯ NG CHUY N
Đ NG QUA CAMERA
1.6.1. Xác ñ nh v n t c ñ i tư ng chuy n ñ ng
1.6.1.1. Gi i thi u
Xác ñ nh v n t c c a ñ i tư ng chuy n ñ ng qua camera là bư c
quan tr ng trong phát tri n các ng d ng th giác máy tính. Nó có nhi u
ng d ng trong nhi u lĩnh như:
- Giao thông v n t i
- H th ng chăm sóc s c kh e
- Cơng nghi p s n xu t t đ ng
1.6.1.2. Các phương pháp xác ñ nh v n t c
Hi n nay có nhi u phương pháp xác đ nh v n t c ñ i tư ng chuy n
ñ ng qua camera. Tuy nhiên, các phương pháp ñ u tr i qua các bư c
chính sau:
- Bư c 1: Phát hi n và dị v t các đ i tư ng chuy n ñ ng.
- Bư c 2: Xác ñ nh ñ i tư ng chuy n ñ ng m c tiêu.
- Bư c 3: Tính v n t c c a ñ i tư ng m c tiêu.
quang h c (optical flow).
- Phương pháp 2: Xác ñ nh v n t c ñ i tư ng chuy n ñ ng d a
vào phương pháp tr n n k t h p v i phân m nh vùng [8].
1.6.1.3. Xác ñ nh v n t c d a vào phương pháp lu ng quang h c
(Optical flow)
Phương pháp lu ng quang h c dùng đ tính tốn hư ng c a
chuy n ñ ng c a ñ i tư ng và ño lư ng v n t c c a đ i tư ng đó.
- Các bư c chính đ tính tốn s khác bi t lu ng quang h c:
•
Bư c 1: Đo lư ng các đ o hàm cư ng đ theo khơng gian
và th i gian.
•
Bư c 2: Tích h p v n t c chu n (normal) vào trong v n t c
toàn th .
- Các ñi u ki n ràng bu c c a phương pháp:
•
T t c các đ i tư ng trong c nh là c đ nh, khơng có thay
đ i v hình d ng.
•
Đ i tư ng chuy n ñ ng trong m t ph ng (2D), nghĩa là t a
ñ (OZ) là h ng s .
- Ưu ñi m c a phương pháp là:
•
Đơn gi n, s lư ng tính tốn ít.
•
Tính tốn trong các đi u ki n c a thu t tốn đem l i k t qu
tính v n t c v i đ chính xác cao, và t l sai s th p.
- Như c ñi m c a phương pháp:
- 13 -
•
Khơng thích h p trong tính tốn v n t c trong mơi trư ng
bên ngồi, và các đ i tư ng có hình d ng b t kì.
•
Phương pháp ch cho k t qu t t khi ñ i tư ng chuy n ñ ng
trong m t ph ng, cịn khi đ i tư ng chuy n đ ng theo chi u sâu,
phương pháp ít có tác d ng.
- 14 -
1.6.2.
Đánh giá và k t lu n
T k t qu nghiên c u trên, ta nh n th y r ng các phương pháp xác
ñ nh v n t c có đ chính xác khá cao, đơn gi n d áp d ng. Tuy nhiên,
các phương pháp cịn nhi u h n ch như:
- Ch xác đ nh ñư c v n t c khi ñ i tư ng chuy n ñ ng trong m t
ph ng.
1.6.1.4. Xác ñ nh v n t c d a trên phương pháp tr n n và phân
m nh vùng nh
- Đ chính xác gi m khi đ i tư ng chuy n ñ ng theo qu ñ o ph c
t p…
Phương pháp dùng ñ xác ñ nh v n t c c a ñ i tư ng chuy n ñ ng
Đ kh c ph c nh ng như c ñi m trên, Lu n văn đã nghiên c u
thơng qua ño n video d a trên hai kĩ thu t là tr n n và phân m nh
phương pháp hi u ch nh camera k t h p v i phương pháp tr n n và
vùng.
phân m nh vùng nh ñ xác ñ nh t a ñ c a ñ i tư ng chuy n ñ ng qua
- Phương pháp: Phương pháp tr n n và phân m nh vùng ñã ñư c
ñ c p trong ph n lý thuy t
các m c trên.
- Các ñi u ki n ràng bu c c a phương pháp:
•
N n khơng đư c thay đ i.
•
Đ i tư ng chuy n đ ng trong m t ph ng khơng theo chi u
sâu.
•
Các đ i tư ng khơng ch ng lên nhau.
- Ưu đi m c a phương pháp:
•
Xác đ nh đư c v n t c nhi u ñ i tư ng m t lúc.
•
Đơn gi n, ít l i và hi u qu ñ i v i ñ i tư ng b t kỳ.
-Như c đi m c a phương pháp:
•
Phương pháp ít hi u qu ñ i v i ñ i tư ng chuy n đ ng
theo chi u xâu.
•
Chưa xác ñ nh ñư c ñ i tư ng khi nhi u ñ i tư ng chuy n
ñ ng ch ng lên nhau.
•
Tính v n t c trung bình chưa quy ñ i t a ñ th c nên ñ
chính xác chưa cao.
t a đ th c t đó nâng cao ñ chính xác c a vi c ño t c ñ .
- 15 -
- 16 -
- Đ u ra: T a ñ tr ng tâm c a ñ i tư ng chuy n đ ng.
-Thu t tốn x lý đư c trình bày như sau:
CHƯƠNG 2: PHÂN TÍCH THI T K H TH NG
for i=0 to (totalFrame-1) do
2.1. PHƯƠNG PHÁP HI U CH NH CAMERA Đ XÁC Đ NH
a.Đ c frame[i].
V NT C
b.L y nh tham chi u, rImg.
2.1.1. MÔ T CHƯƠNG TRÌNH
c.C p nh p frame[i] b ng phương pháp tr n n nh tham
Chương trình xác đ nh v n t c ñ i tư ng chuy n ñ ng l y d li u
t ño n video quay l i t m t camera tĩnh, ghi l i v i chu n AVI.
chi u rImg.
d.T i m i frame[i]:
Sau khi có d li u đ u vào chương trình s x lý đo n video đ l y
t t c khung hình. Ti p đó, t m i khung hình có đư c, ta ti n hành tìm
-Xác ñ nh các thành ph n liên k t b ng phương pháp
gán nhãn.
ki m và truy v t ñ i tư ng d a vào phương pháp tr n n và phân m nh
-Tính tốn di n tích c a t ng vùng liên k t.
vùng (region based segmentation). Ti p đó ta xác đ nh đ i tư ng
-Xóa b
chuy n đ ng m c tiêu, tìm t a ñ trung tâm c a ñ i tư ng, và quy đ i
nó ra t a đ
th c d a vào kĩ thu t hi u ch nh camera (camera
các ñ i tư ng nh
hơn giá tr ngư ng
(threshhold).
e.T o c u trúc hình thái các thành ph n, i.e..; G n c u trúc
hình các thành ph n như sau:
calibration).
2.1.2. XÂY D NG THU T TOÁN PHÁT HI N VÀ DÒ V T Đ I
TƯ NG CHUY N Đ NG
2.1.2.1. Mơ t thu t tốn
Đ dị v t m i ñ i tư ng ta k t h p c a hai phương pháp tr n n
(background
extraction)
và
phân
m nh
vùng
(region
based
segmentation), ñây là bư c quan tr ng nh t c a bài toán.
Đ u tiên t i m i khung hình, ti n c nh đư c tách ra kh i n n b ng
phương pháp nh tham chi u [12]. Sau đó, d a trên ti n c nh l y ñư c
ta s xác ñ nh các thành ph n liên k t (connected components), ư c
lư ng di n tích các vùng nh, tìm di n tích vùng l n nh t, và cu i cùng
là tr v t a đ trung tâm c a vùng đó.
2.1.2.2. Thu t toán x lý
- Đ u vào: D li u t camera quan sát ho c t video ñư c thu l i.
f.Đóng nh nh phân b i c u trúc hóa các thành ph n.
g.Ư c lư ng các vùng nh.
h.Tìm vùng l n nh t.
i.Xác đ nh v trí trung tâm (x, y) c a vùng l n nh t.
j.Tr v giá tr t a ñ x, y.
k. K t thúc.
2.1.3. XÂY D NG THU T TOÁN XÁC Đ NH V N T C Đ I
TƯ NG CHUY N Đ NG
2.1.3.1. Phương pháp tính kho ng cách
- 17 -
- 18 -
Kho ng cách Euclid (D) di chuy n b i ñ i tư ng gi a c p khung
hình liên ti p nhau đư c tính tốn sau khi chi u t a đ trung tâm c a
đ i tư ng trong m i khung hình qua t a ñ th c.
Kho ng cách gi a hai tr ng tâm P ( , , ) và Q (
,
,
)h
9. Tính tốn v n t c trung bình c a ñ i tư ng trong ño n
video như sau:
10. K t thúc.
t a ñ 3D:
2.1.3.3. K t qu
(2. 1)
2.1.3.2. Thu t tốn xác đ nh v n t c c a ñ i tư ng chuy n ñ ng m c
tiêu
- Đ u vào: D li u t camera quan sát ho c t video ñư c thu l i.
- Đ u ra: v n t c c a ñ i tư ng chuy n ñ ng m c tiêu.
Hi u ch nh Camera (Camera calibration):
- Kho ng cách tiêu đi m (Focal Length):
- Đi m chính nh (Principal point):
- Đ l ch (Skew):
Angleof pixel axes
- Thu t tốn x lý đư c trình bày như sau:
Degrees
1. Xác ñ nh các tham s bên trong, bên ngoài b ng kĩ thu t
- Đ méo (Distortion):
hi u ch nh camera.
2. Đ c file video.
3. X lý file ñ l y thơng tin c n thi t t đo n video.
4. Tìm tham s tu n su t Frame c a đo n video RF.
5. Tính t ng s th i gian và th i gian t ng frame:
T
- Sai s ñi m nh (Pixel error):
V n t c di chuy n: Ti n hành th nghi m trên camera có t c đ
/
30 khung hình trên giây, và kích thư c khung hình như sau 640 X 480.
6. Xác ñ nh quãng ñư ng Di c a ñ i tư ng gi a khung th i
và khung th (i+1) trong th gi i th c b ng cách s d ng hàm truy v t
ñ i tư ng, và phương pháp tính kho ng cách.
7. Tính v n t c gi a khung Fi và Fi+1 như sau
8. L p bư c 6, 7 for i= 0 to
gi a các khung hình.
, đ xác đ nh t t c v n t c
K t qu th ng kê như sau:
- 19 -
- 20 -
B ng 2. 1 B ng so sánh v n t c ño lư ng và v n t c tính tốn
Stereo vision là kĩ thu t s d ng hai hay nhi u camera ho c m t
camera chuy n ñ ng ñ ño lư ng kho ng cách [2]. Thi t l p ñơn gi n
V n t c ño
lư ng
V n t c tính
tốn
Sai s
% sai s
|v-v’|(cm/s)
nh t (c u hình kinh đi n) s d ng hai máy nh ph ng ñ t cách nhau m t
kho ng cách theo chi u ngang bi t trư c (xem nh 2.4).
v(cm/s)
v’(cm/s)
18.90
18.59
0.31
1.6
18.71
18.424
0.288
1.54
25.82
26.096
0.276
26.58
0.109
0.412
24.62
24.54
0.0784
P
ZQ
1.06
26.69
Q
∆ZPQ
0.318
ZP
2.2. PHƯƠNG PHÁP CAMERA STEREO CHO XÁC Đ NH V N
T C Đ I TƯ NG CHUY N Đ NG
2.2.1. Mô t phương pháp
cr
cl
Image planes
f
pr
pl
Optical centers
(lenses)
T
Hình 2. 2 H th ng chu n c a hai camera v i ñ dài tiêu c f và
Phương pháp s d ng kĩ thu t hi u ch nh camera và camera stereo ñ
xác ñ nh v n t c c a ñ i tư ng chuy n ñ ng.
kho n cách cơ s T. Kho ng cách theo chi u ngang gi a hai camera
có t a ñ pi và pr ñư c g i là đ l ch và nó cho phép tính tốn ñ sâu
ho c kho ng cách Zp c a ñi m 3D P t camera
Y-axis
2.2.3. Kho ng cách trên tr c Y
M u so kh p cho tính tốn đ l ch:
P2
Đ ư c lư ng ñư c ñ l ch c a ñ i tư ng trong c p nh stereo, ñ u
y
tiên chúng ta c n ph i truy v t ñ i tư ng trong nh bên trái. Đ i tư ng
X-axis
P1
x
này sau đó đư c s d ng là m u đ tìm m t đ i tư ng kh p bên nh bên
ph i. Đi u đó hồn tồn th c hi n đư c b i vì nh c a cùng m t đ i
tư ng trong khung nhìn bên trái và bên ph i là r t tương ñ ng khi s
Stereo Camera
d ng mơ hình stereo camera kinh đi n trong lu n văn.
Hình 2 1 Hư ng chuy n đ ng nhìn t trên xu ng
2.2.2. T ng quan v Stereo Vision
2.2.4. Kho ng cách trên tr c X
- 21 -
- 22 -
Tính kho ng cách trên tr c X gi ng như phương pháp tính kho ng
cách trong phương pháp hi u ch nh camera ñ xác đ nh v n t c.
2.2.5. Tính tốn v n t c
Sau khi có giá tr x và y, chúng ta tính tốn kho ng cách gi a P1 và P2
s d ng công th c Pythagorean:
PP2 = x2 + y 2
1
∑
2.2.6.
3.1.1. Yêu c u h th ng
Đ th c hi n hi u ch nh camera, kh i ñ ng Matlab và gõ l nh
ocam_calib.
Sau đó chúng ta t i nh m u ñ th c hi n hi u ch nh.
Đ s d ng k t qu hi u ch nh ta ch n save, sau đó ch n load.
P P2
1
1 second
3.1. CÀI Đ T CHƯƠNG TRÌNH
3.1.2. Cài ñ t
(2. 2)
Cu i cùng, chúng ta có th ño ñ c v n t c c a ñ i tư ng chuy n ñ ng
trong t a ñ th c b ng cách tính tốn t ng kho ng cách P1P2 trên s
frame thu ñư c trên m i giây.
S=
CHƯƠNG 3: CÀI Đ T VÀ K T QU
(2. 3)
Sau khi có k t qu hi u ch nh camera ta ti n hành ño t c ñ b ng
ño n l nh trong bài báo cáo chính.
K t lu n và ñánh giá
Phương pháp s d ng kĩ thu t stereo vision k t h p v i phương pháp
3.2. K T QU
hi u ch nh camera ñ xác ñ nh v n t c, t ñó có th xác ñ nh ñư c v n
B ng 3. 1 K t qu xác ñ nh t a ñ tr ng tâm
t c c a ñ i tư ng chuy n ñ ng theo m t qu ñ o ph c t p.
Phương pháp h a h n s có nhi u ng d ng trong tương lai. Tuy
nhiên, lu n văn ch m i dùng l i
d ng ñư c ng d ng ñ ki m th .
vi c nghiên c u lý thuy t chưa xây
STT
T a ñ tr ng tâm 2D
T a đơ tr ng tâm 3D
khung
1
(41.5557
226.9085)
(-0.6842 -0.5694 0.4558)
30
(129.7268 233.4141)
(-0.6374 -0.6982 0.3259)
60
(216.7695 248.0980)
(-0.5287 -0.8340 0.1577)
90
(282.1158 263.4749)
(-0.3794 -0.9252 0.0125)
120
(359.9312 282.0263)
(-0.1032 -0.9856 -0.1336)
150
(445.5017 270.9559)
(0.2469 -0.9670 -0.0625)
180
(498.5813 264.3691)
(0.4199 -0.9071 0.0278)
210
(514.0632 263.8442)
(0.4637 -0.8844 0.0535)
240
(554.5049 260.1997)
(0.5559 -0.8206 0.1323)
270
(597.0754 261.2381)
(0.6338 -0.7456 0.2059)
283
(606.8679 267.5540)
(0.6588 -0.7222 0.2107)
- 23 -
- 24 -
K T LU N VÀ HƯ NG PHÁT TRI N
B ng 3. 2 T ng kho ng cách di và v n t c di chuy n đư c gi a các
c p khung hình
C p khung hình
1.K t lu n
Kho ng cách
V nt c
Xét v m t lý thuy t, đ tài đã hồn thành ñư c vi c tìm hi u các
1-2
0.0007617
0.0229
ph n lý thuy t đã đ t ra như: Tìm hi u và s d ng thành th o ph n m m
30-31
0.0122
0.3671
matlab đ phát tri n bài tốn, tìm hi u ñư c các khái ni m cơ b n v
60-61
0.00007739
0.0023
video và camera s , tìm hi u đư c các thu t tốn v phát hi n chuy n
90-91
0.0111
0.3329
đ ng b ng phương pháp tr n n: Frame Differrence, Running Gausian
120-121
0.00015249
0.0046
Average và Codebook, tìm hi u đư c phương pháp các phương pháp
150-151
0.0128
0.3838
camera calibration, tìm hi u đư c các phương pháp theo v t region
180-181
0,00014403
0.0043
based segmentation, tìm hi u ñư c cách th c xác ñ nh v n t c ñ i tư ng
210-211
0.0017
0.0498
chuy n ñ ng.
240-241
0.00057176
0.0172
Xét v m t th c ti n, đ tài đã hồn thành ñư c m c tiêu ñư c ñ t
270-271
0.000064816
0.0019
ra như: Phát hi n và truy v t ñ i tư ng qua t ng frame c a video, xác
282-283
0.000062636
0.0019
ñ nh ñư c t a ñ c a ñ i tư ng trong th gi i th c, xác ñ nh ñư c v n
t c ñ i tư ng chuy n đ ng qua camera, hồn thành vi c cài ñ t và ch y
T ng kho ng cách di chuy n đư c:
thành cơng các thu t tốn ñã nghiên c u trong ph n lý thuy t, th c hi n
D = 1.9627 (m)
vi c so sánh, ñánh giá ưu như c ñi m c a t ng thu t toán và ch n ra
V n t c trung bình c a đ i tư ng chuy n đ ng là:
đư c thu t tốn phù h p nh t v i t ng ch c năng c a chương trình, s
V = 0.2081(m/s)
d ng thành cơng các công c ph c v cho vi c x lý video như Motion
Video, FLV Converter ñ chuy n ñ i các ñ nh d ng video khác nhau v
ñ nh d ng AVI ñ d dàng cho vi c thao tác trên Matlab.
2. Ph m vi ng d ng
Đ tài có ph m vi ng trong các h th ng giám sát y t , trong các
h th ng xác đ nh t c đ trong giao thơng (qua h m).
- 25 -
- 26 -
Bên c nh đó đ tài còn t o n n t ng cho nh ng nghiên c u v c m
quan máy tính nói riêng và x lý nh nói chung trong tương lai.
3. H n ch
Bên c nh nh ng k t qu ñã đ t đư c, đ tài v n cịn có m t s h n
ch c n ph i ñư c kh c ph c như:
- T c ñ x lý c a chương trình cịn ch m khi x lý nh ng video
có đ phân gi i cao và kích thư c l n.
- Vi c xác đ nh ñ i tư ng chuy n ñ ng, ch d ng l i
vi c xác
ñ nh ñ i tư ng chi m vùng l n nh t.
- Vi c tính v n t c ch ñúng cho chuy n ñ ng th ng trong không
gian 2D (chi u x,y) chưa chính xác khi đ i tư ng chuy n đ ng theo
chi u sâu.
4. Hư ng phát tri n
Trong quá trình th c hi n đ tài, do nh ng h n ch v trình đ và
th i gian th c hi n đ tài có h n, chương trình ñư c xây d ng ch là
ph n demo c a các thu t tốn xác đ nh v n t c c a ñ i tư ng chuy n
ñ ng. Đ tri n khai trong th c t , nó địi h i c n ph i c i ti n hơn n a.
Hy v ng trong tương lai, nh ng phát tri n dư i ñây s giúp ñ tài hoàn
thi n hơn.
- Xác ñ nh ñ i tư ng chuy n đ ng v i tiêu chí c th .
- Xây d ng thu t toán c i thi n ch t lư ng c a video như lo i tr
nhi u, lo i b bóng và t i ưu hóa các thu t tốn đ tăng t c đ x lý c a
chương trình.
-
ng d ng kĩ thu t camera stereo ñ xác ñ nh ñư c v trí chính
xác c a đ i tư ng khi di chuy n theo chi u sâu(trong không gian 3D),
t đó tính tốn v n t c c a đơi tư ng đư c chính xác.