Tải bản đầy đủ (.docx) (75 trang)

xác định vận tốc xe sử dụng camera giám sát

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.46 MB, 75 trang )



Em xin cam đoan nội dung của đồ án “
 !” không phải là bản sao chép của bất cứ đồ án hoặc công trình đã
có từ trước. Nếu vi phạm em xin chịu mọi hình thức kỷ luật của Khoa.
Đà Nẵng, ngày 4 tháng 6 năm 2013
Sinh viên thực hiện
I

"#$%&%&'()#*
Đồ án này được thực hiện bởi tất cả các thành viên trong nhóm, trong đó
phần lí thuyết mỗi người làm riêng trừ chương cuối cùng là chương cài đặt và kết
quả, 2 thành viên cùng thực hiện. Phân công nhiệm vụ được phân chia như sau:
- ++++++++++++++++++++++++++++++++++++++++++++++++: Thực hiện phương pháp luồng quang học
- ++++++++++++++++++++++++++++++++++++++++++++++++: Thực hiện phương pháp trừ nền
Cả 2 cùng tham gia tìm hiểu phần hiệu chỉnh Camera và quay Video để thử
nghiệm và đánh giá kết quả. Tuy thực hiện riêng các phương pháp nhưng cả 2 thành
viên vẫn phải nắm vững tất cả các phương pháp, các kiến thức về lí thuyết cũng như
trong chương trình mô phỏng.
II

II

,,
III

V

-#,./'0..1.
.2 34 .5678
ATM Automated teller machine


AVI Audio Video Interleave
Camshift Continue Adaptive Meanshift
CCD Charge Couple Device
CF CompactFlash
CMOS Complementary Metal Oxide Semiconductor
DVR Digital Video Recorder
JPEG Joint Photographic Experts Group
JPG Joint Photographic Group
MMC Multimedia Card
NVR Network Video Recorder
PTZ Pan, Tilt, Zoom
SD Secure Digital
VI

VII

DANH MỤC BẢNG
9
 :;
<=
.5<= .
2.1 Giải thuật Codebook 15
2.2 Thuật toán trừ nền với Codebook 17
2.3 So sánh hai hướng tiếp cận 22
2.4 Bảng giá trị sử dụng trong hàm bwconncomp 23
2.5 Bảng kết quả trả về của hàm bwconncomp 23
3.1 Mô tả các phương pháp hiệu chỉnh camera 29
4.1 Thông tin đoạn video chạy thử nghiệm(20km/h) 46
4.2 Kết quả truy vết đối tượng của phương pháp trừ nền(20km/h) 47
4.3

Kết quả truy vết đối tượng của phương pháp
opticalflow(20km/h)
48
4.4 Khoảng cách di chuyển dist giữa các khung hình 50
4.5
Thống kê vận tốc của 2 phương pháp trong điều kiện ảnh nền
tĩnh
50
4.6
Thống kê vận tốc của 2 phương pháp trong điều kiện ảnh nền
động
51
VII

DANH MỤC HÌNH
9
 :;
>
.5> .
1.1 Chuỗi các ảnh trong Video số 2
1.2 Máy ảnh Nikon coolpix s2600 3
1.3 Ứng dụng camera quan sát vào giao thông 6
1.4 Mô hình hệ thống camera quan sát Analog 7
1.5 Mô hình hệ thống camera quan sát IP 8
1.6 Mô hình hệ thống camera quan sát kết hợp Analog và IP 9
2.1 Kết quả thực hiện thuật toán Frame Difference 12
2.2 Kết quả thực hiện thuật toán Running Gaussian Average 13
2.3 Mô hình Codeword 16
2.4 Kết quả thực hiện thuật toán Codebook 17
3.1 Độ chính xác của đo lường tọa độ 3D 30

3.2 Độ chính xác của đo lường tọa độ 2D 31
3.3 Bàn cờ dùng cho hiệu chỉnh camera 32
3.4 Mô hình của hệ thống Camera Calibration 33
3.5 Tọa độ điểm p 34
3.6 Vòng tròn ngoài gương xuất hiện như một hình elip 35
4.1 Lưu đồ thuật toán xác định vận tốc 39
4.2
Lưu đồ thuật toán phương pháp trừ nền và phương pháp
opticalflow
40
4.3 Giao diện công cụ hiệu chỉnh camera 41
4.4 Ảnh mẫu dùng để hiệu chỉnh camera 42
4.5 Kết quả tìm góc hình chữ nhật của hình mẫu thứ nhất 43
4.6 Kết quả tìm góc chữ nhật kèm theo trục x-y 44
4.7 Kết quả hiệu chỉnh camera 45
4.8 Hình tham chiếu trong phương pháp trừ nền 46
VIII
 !
MỞ ĐẦU
Với sự phát triển nhanh chóng của các loại máy móc hiện đại như máy ảnh
số, máy quay số, máy vi tính, điện thoại đi động …thì lượng thông tin con người
thu được dưới dạng hình ảnh là khá lớn. Để lượng thông tin này trở nên có ích hơn
con người cần có các thao tác để tiến hành xử lý nó và từ đó tạo điều kiện cho sự
phát triển không ngừng của các kỹ thuật xử lý hình ảnh. Xử lý ảnh là một trong
những công nghệ được ứng dụng rộng rãi hiện nay trong nhiều lĩnh vực của đời
sống xã hội. Không chỉ dừng lại ở việc xử lý những vết nhèo, tái chế và phục hồi
các ảnh cũ, ngày nay công nghệ xử lý ảnh đã mang lại những tiến bộ vượt bậc như
nhận dạng vân tay, nhận dạng khuôn mặt, nhận dạng đối tượng…v.v khi nó kết hợp
với lĩnh vực trí tuệ nhân tạo.
Bên cạnh đó, hệ thống camera quan sát ngày càng được sử dụng một cách

rộng rãi với mục đích trợ giúp cảnh sát, người tham gia giao thông tại các điểm nút
giao thông, từ đó phát hiện người vi phạm.
Hầm đường bộ ngày càng phổ biến ở nước ta, có vai trò lớn trong việc tích
kiệm chi phí và an toàn cho người tham gia giao thông . Do đặc thù của hầm là ở
dưới lòng đất nên việc quản lý xe qua lại rất khó khăn. Nên việc cảnh sát giao
thông xử lý xe vi phạm trực tiếp ở trong hầm là không thể.
Vì vậy việc xác định vận tốc của xe dựa vào video đã ghi lại phục vụ cho
việc xử lý và quản lý xe vi phạm tốc độ chậm tại hầm đường bộ là điều cần thiết.
Đây là ý tưởng để em lựa chọn đề tài “ 
!” cho đồ án tốt nghiệp này.
? ;@Agồm 4 chương, trình bày vấn đề xác định vận tốc xe trong hầm
đường bộ dựa trên dữ liệu video thu được từ camera.
- BCDA& E  :;F  !
Chương này trình bày khái niệm và tín hiệu của video số, khái niệm, các tính
năng chủ chốt của camera và ứng dụng của hệ thống camera quan sát vào thực tế.
IX
 !
- BCGA" :3 BH
Chương này trình bày hai phương pháp cơ bản để xác định đối tượng đó là
trừ nền và opticalflow, và phương pháp theo vết đối tượng là phân mảnh vùng.
- BCIA BH;7J?
Chương này sẽ tìm hiểu các công cụ hiệu chỉnh camera, chủ yếu là công cụ
hiệu chỉnh camera, và phương pháp xác định vận tốc đối tượng.
- BCKAL3M;=NOPQ7
Đây là chương trọng tâm của đồ án, trình bày các bước cài đặt chương trình,
chạy mô phỏng trong trình trên phần mềm Matlab và đánh giá ưu nhược điểm các
phương pháp.
Em xin chân thành cảm ơn nhà trường đã tạo điều kiện, cám ơn sự dạy bảo
tận tình của các thầy cô trong khoa Điện Tử Viễn Thông đã giúp em hoàn thành đồ
án tốt nghiệp này.

Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc đến cô giáo .9+.6.
 #R đã hướng dẫn, tận tình chỉ bảo để cho em hoàn thành tốt đồ án này.
X
"#$%&'(!)*+,+-./.
Page 12
"#$%&'(!)*+,+-./.
#ST&DA &U.#(V
'W'-X'YXZ&[9[.
D+D+ &U.#(V#ST&
Trong chương này trình này các vấn đề: các khái niệm về Video số, tìm hiểu
về tín hiệu video số, các ưu nhược điểm của video số, chuẩn video avi, các khái
niệm, các tính năng cơ bản của camera số, các loại máy ảnh đang được sử dụng và
ứng dụng của hệ thống camera vào trong thực tiễn.
D+G+ .\&]V'W'-X9^
D+G+D+ L  :F' 
Thuật ngữ video dùng đểchỉnguồn thông tin hình ảnh trựcquan (pictorial
visual information), baogồm một chuỗi các ảnh tĩnh (still image) liên tiếp nhau,
được sắp xếp theo chiều thời gian. Video còn được gọi là ảnh thay đổi theo thời
gian (time-varyingimage), kí hiệu là /01%21324, trong đó 1%, 13 là các biến chỉ vị
trí trong không gian, còn  là biến thời gian. Xét về mặt vật lý, ở cấp thấp nhất,
video tồn tại dưới dạng các tín hiệu. Tùy thuộc vào loại tín hiệu thu được ta có 2
loại video khác nhau:video tương tự và video số. Tuy nhiên dữ liệu mà chúng ta xử
lý là dữ liệu video số vì thế ta chỉ tập trung vào việc tìm hiểu rõ vềVideo số[6].
D+G+G+ ._ :;' !
Tín hiệu video số được lưu trữ dưới dạng số, do đó chúng được lấy mẫu và
lượng tử hóa. Tín hiệu video sốlà một thông tin 3 chiều gồm 2 chiều không gian và
1 chiều thời gian hay còn được gọi là chuỗi ảnh số với mỗi ảnh số là một ảnh được
lấy mẫu và lượng tử hóa.
Ngoài ra,còn có thể chỉnh sửa, tạo các hiệu ứng trên tín hiệu video số. Video
số không chỉ có vai trò giải trí mà nó còn cung cấp cho chúng ta nhiều thông tin

quan trọng trong nhiều lĩnh vực như là các ảnh giám sát quân sự, điều khiển giao
thông, và rút trích thông tin từ các dữ liệu ảnh và video.
Trang 13
chiều thời gian
chiều ngang
chiều dọc
"#$%&'(!)*+,+-./.
Hình 1.1"!5.-6*+/7
• Nhược điểm
Nhược điểm của video số đó là nó đòi hỏi khối lượng lưu trữ lớn và băng
thông rộng để truyền tải.Do đó hiện nay người ta đang nghiên cứu các phương pháp
nén video để giảm kích thước của nó.
D+G+I+ ;`' !'
AVI (Audio Video Interleave) là một đa phương tiện định dạng container
của Microsoft được giới thiệu vào tháng 11 năm 1992. AVI là tập tin có thể chứa cả
âm thanh và video dữ liệu trong một container cho phép đồng bộ tập tin âm thanh với
video.
Đây là một trong những định dạng video chuẩn và được ứng dụng khá rộng
rãi nênluận văn sẽ chọn định dạng AVI để làm định dạng cho các tập tin video xử
lý, vì thế từ đây về sau khi đề cập đến video tức là đề cập đến video số với định dạng
AVI.
D+I+ .\&]V'WXZ9^
D+I+D+ L  :F!
Camera là một thiết bị ghi hình có thể ghi lại được những hình ảnh trong một
khoảng thời gian nào đó và lưu trữ các dữ liệu hình ảnh này. Với chức năng cơ bản
là ghi hình, Camera được ứng dụng rộng rãi trong lĩnh vực giám sát. Một hệ thống
Trang 14
"#$%&'(!)*+,+-./.
các camera được đặt tại những vị trí thích hợp sẽ cho bạn quan sát, theo dõi toàn bộ
ngôi nhà, nhà máy, xí nghiệp ngay cả khi không có mặt tại đó.

D+I+G+ _a887=!
Hình 1.2.89:;1/3<==
• ?OQ = : Nếu máy ảnh chỉ để chụp và lưu lại trong máy tính hay gởi e-mail thì
bất kỳ máy ảnh số ở độ phân giải nào cũng có thể thực hiện được. Nhưng đối với
những máy ảnh có độ phân giải cao thì có thể in ảnh khổ lớn, có thể in khổ nhỏ
hoặc in một phần mà vẫn giữ được độ sắc nét.
• ?b8c;d_: Camera giá thành thấp thường thiếu các thấu kính zoom
quang. Nếu phải lựa chọn giữa máy ảnh có chức năng zoom quang tốt hơn và một
máy ảnh có độ phân giải cao thì nên chọn cái đầu tiên. Máy ảnh có zoom quang tốt
hơn sẽ thuận tiện hơn trong việc phóng to các chi tiết nhỏ. Chú ý phân biệt giữa
zoom quang học và zoom số bởi vì các nhà quảng cáo sản phẩm thường kết hợp hai
loại zoom này với nhau để tạo ra sản phẩm được quảng cáo có độ zoom rất lớn.
• .efBHgd_BE 3d3: Hiện nay có xu hướng người sử dụng thích
những máy ảnh có trọng lượng nhỏ khoảng từ 130g đến gần 200g. Kích thước máy
ảnh số nhỏ là cần thiết, nhưng việc điều chỉnh các nút bấm hay các chức năng điều
chỉnh sẽ gặp nhiều khó khăn.
• .hE: Thẻ nhớ của máy ảnh có nhiều loại như Compactflash (CF), Secure
Digital (SD), Smartmedia, Multimedia Card (MMC)…và các hãng thường hỗ trợ
những loại thẻ nhớ khác nhau cho mỗi dòng sản phẩm của mình.
Trang 15
"#$%&'(!)*+,+-./.
• . 3fO3?OC !: Tất cả các camera số thông thường luôn được mặc
định ở chế độ tự động hoàn toàn. Các loại máy ảnh số cao cấp phải có thêm chế độ
mở thấu kính và chế độ phơi sáng ưu tiên.
• .>Ci;j: Khi đánh giá camera, người sử dụng cũng nên quan tâm đến
các chức năng thiết lập như: Độ phân giải, chế độ marco, điều chỉnh phơi sáng, xem
lại hình đã chụp có dễ dàng hay không.
• # J-: Một màn hình LCD đạt yêu cầu phải thực hiện được trung thực bức
ảnh vừa chụp để người chụp có thể đánh giá và phải thể hiện được chế độ phơi sáng
thiết lập đã thích hợp hay chưa. Chất lượng màn hình có thể thay đổi tùy thuộc vào

điều kiện sáng bên ngoài như bị mờ dưới ánh mặt trời, nổi hạt dưới ánh sáng yếu.
D+I+I+ "QfR 
Có 3 cách phân loại camera
• "QfR dk;>=
- Camera Analog: Ghi hình vào băng từ và xử lý tín hiệu tương tự.
- Camera CCD (charge couple device): Sử dụng kỹ thuật CCD để nhận biết
hình ảnh. CCD là tập hợp những ô tích điện có thể cảm nhận ánh sáng, sau đó
chuyển tín hiệu ánh sáng sang tín hiệu số để đưa vào các bộ xử lý. CCD thu nhận
hình ảnh thông qua các hệ thống của camera. CCD có hàng ngàn điểm ảnh sẽ
chuyển đổi ánh sáng thành những hạt điện tích và được số hóa. Đây là một quá trình
chuyển đổi tương tự số.
Các thông số kỹ thuật của camera CCD là đường chéo màn hình cảm biến
(tính bằng inch). Kích thước màn hình cảm biến càng lớn thì chất lượng càng tốt.
- Camera CMOS(Complementary Metal Oxide Semiconductor): CMOS có
nghĩa là chất bán dẫn có bổ sung oxit kim loại. Loại Camera này cho hình ảnh sắc
nét tuy nhiên giá thường khá cao.
Các Camera số sử dụng công nghệ CMOS có ưu điểm rất rõ rệt so với
Camera Analog về độ rõ nét và chất lượng hình ảnh.
• "QfR dk;Bl;7F
Trang 16
"#$%&'(!)*+,+-./.
- Camera có dây: có ưu điểm đó là khả năng an toàn cao, tính bảo mật tốt,
truyền tín hiệu trên dây đồng trục khoảng 75ohm - 1Vpp, dây C5. Khi truyền với
khoảng cách xa hơn 300m thì cần có bộ khuếch đại để tránh việc tín hiệu đường
truyền suy hao, dẫn đến chất lượng hình ảnh không tốt.
- Camera không dây: có ưu điểm đó là dễ thi công lắp đặt do không cần đi
dây, tuy nhiên nó có hệ số an toàn không cao bởi nó sử dụng sóng vô tuyến để
truyền tín hiệu nên sóng của nó dễ bị thu hoặc dễ bị nhiễu bởi các nguồn sóng khác.
Camera không dây được sử dụng để lắp đặt tại các khu vực có địa hình phức tạp.
Đối với khoảng cách xa hàng ngàn mét cần phải sử dụng các thiết bị đặc biệt hoạt

động ở tần số cao và giá thành đắt.
- Camera mạng (IP camera): được kết nối trực tiếp vào mạng, tín hiệu hình
ảnh và điều khiển được truyền qua mạng vì thế người dùng có thể điều khiển và
giám sát ở bất cứ đâu thông qua mạng Internet.
• "QfR dk;Bl;7F
-Camera áp trần: có nhiều hình dạng, kích thước khác nhau. Đây là loại
camera thường được đặt trong nhà, kiểu dáng rất trang nhã và có tính năng bảo mật
cao do được bọc trong hộp kín.
-Camera ẩn: có nhiều hình dạng và kích thước khác nhau rất khó để nhận biết
được. Nó được dùng khi ngụy trang để tránh bị phát hiện. Tuy nhiên, khi sử dụng
camera này cần phải đảm bảo tính hợp pháp.
-Box camera: là loại camera truyền thống, thường được sử dụng trong siêu
thị. Đây là loại camera có giá thành rẻ. Camera được bảo vệ trong hộp để bảo vệ
trước tác động phá hoại hay điều kiện môi trường.
- Camera PTZ (Pan, Tilt, Zoom): Camera với tính năng hỗ trợ quét dọc, quét
ngang,phóng to, thu nhỏ, cho phép kết nối với hệ thống cảm ứng và cảnh báo để
phát hiện đối tượng di chuyển trong vùng hoạt động của nó. Camera có thể lập trình
để hoạt động, nên có thể làm tất cả công việc.
Trang 17
"#$%&'(!)*+,+-./.
-Camera có khả năng quan sát đêm: Khoảng cách quan sát của camera tùy
thuộc vào công suất của đèn hồng ngoại, khoảng cách quan sát của camera dao
động khoảng 10 ÷ 300m.
D+I+K+ #:M;!
Ngày nay hệ thống Camera an ninh đã trở nên hết sức thông dụng đối với
mọi người và có thể được lắp đặt để giám sát hoạt động của mọi nơi nhưcác nhà
máy, văn phòng, cơ quan xí nghiệp, khách sạn, cửa hàng,…v.v mà không cần phải
đi đến tận nơi quan sát hoặc có thể ở bất cứ đâu, bất cứ lúc nào mà vẫn theo dõi
được công việc hàng ngày diễn ra.Hệ thống này giúp cho những nhà quản lý có thể
kiểm soát công việc một cách chặt chẽ hơn, tiết kiệm được chi phí và làm cho hình

ảnh của doanh nghiệp được chuyên nghiệp, hiện đại hơn.
Giải pháp camera quan sát hiện nay sử dụng hai công nghệ chính là Camera
quan sát công nghệ Analog (gọi tắt là Camera Analog) và Camera quan sát công
nghệ IP (gọi tắt là Camera IP). Đặc điểm phân biệt chính của hai hệ thống Camera
quan sát này như sau:
Hình 1.3>*+-?!/.,
• #:M;!fA
Trang 18
"#$%&'(!)*+,+-./.
Trong ứng dụng camera quan sát analog truyền thống, các camera bắt tín
hiệu hình ảnh analog và truyền tín hiệu analog này đi trên cáp đồng trục để đến đầu
ghi hình kỹ thuật số (gọi tắt là DVR). Mỗi camera có thể được hỗ trợ cấp nguồn
hoạt động bằng cách cung cấp nguồn DC trực tiếp ngay tại camera hoặc bằng cách
sử dụng bộ chuyển đổi cấp nguồn và tín hiệu chung trên cáp CAT5e. Đầu ghi hình
kỹ thuật số DVR chuyển đổi tín hiệu tương tự sang tín hiệu số, thực hiện nén tín
hiệu và sau đó lưu trữ nó trên một ổ cứng để cho phép xem lại sau. Các tính năng
thông minh được tích hợp vào DVR để xử lý những việc như lập kế hoạch ghi hình,
phát hiện chuyển động, zoom kỹ thuật số, Màn hình quan sát được kết nối trực
tiếp với DVR, hoặc nó có thể được thiết lập để truyền tín hiệu đi trên một mạng nội
bộ hoặc mạng Internet để xem trên máy tính, điện thoại smartphone. Khi tín hiệu
truyền qua môi trường mạng nội bộ hoặc Internet, tín hiệu video của tất cả các
camera được truyền đi chung theo một luồng dữ liệu – video stream (với cùng một
địa chỉ IP). Ngoài ra DVR còn thực hiện việc nén các tín hiệu camera nhằm giảm
tối thiểu băng thông của luồng dữ liệu khi truyền đi trên mạng IP, vì vậy, nó rất hiệu
quả trong việc tiết kiệm băng thông.
Hình 1.47+-?!/.@
• #:M;!"A
Trang 19
"#$%&'(!)*+,+-./.
Trong thế giới IP, mỗi IP camera cũng sẽ bắt tín hiệu hình ảnh analog nhưng

ngay lập tức nó chuyển đổi sang tín hiệu kỹ thuật số ngay bên trong camera. Một số
xử lý kỹ thuật số có thể xảy ra ngay khi vào camera, ví dụ như nén và phát hiện
chuyển động,… Hình ảnh video kỹ thuật số này sau đó được truyền đi qua mạng IP
bằng cách sử dụng giao tiếp Ethernet (CAT5). Việc cung cấp nguồn điện cho
camera có thể được cấp trực tiếp từ nguồn DC hoặc có thể được cấp thông qua cáp
ethernet bằng công nghệ Power-Over-Ethernet (PoE). Như vậy giống như với tất cả
các thiết bị mạng, mỗi IP Camera sẽ yêu cầu phải thiết lập một địa chỉ IP riêng cho
nó và các thuộc tính nhận dạng liên quan khác.
Phần mềm quản lý được yêu cầu cài trên máy tính mà bạn muốn giám sát
hình ảnh của các Camera IP. Một máy tính công suất cao được thiết lập với phần
mềm quản lý thích hợp để ghi lại toàn bộ các hình ảnh quan sát của hệ thống
Camera IP. Hoặc có thể là một thiết bị ghi hình mạng thực hiện chức năng lưu trữ
và giám sát chung cho hệ thống camera IP của nhà cung cấp (gọi tắt là NVR –
Network Video Recorder). Thông thường phần mềm giám sát cài trên PC hoặc
NVR sẽ phải cùng nhà sản xuất với Camera IP do sự chưa thống nhất trong các
chuẩn sản xuất của các nhà cung cấp khác nhau.
Hình 1.57+-?!/.A
Trang 20
"#$%&'(!)*+,+-./.
Các tín hiệu camera IP được truyền đi qua Internet cũng tương tự với cách
mà một tín hiệu DVR thực hiện. Tuy nhiên, mỗi một Camera IP là một luồng tín
hiệu riêng biệt và có địa chỉ IP hoặc cổng riêng của mình. Điều này có thể ảnh
hưởng rất nhiều đến băng thông sử dụng khi quan sát từ xa.
• #:M;!d3HOfOA
Một giải pháp tốt hơn có thể được sử dụng để giải quyết vấn đề trên là giải
pháp kết hợp giữa việc sử dụng công nghệ analog và IP. Giải pháp kết hợp các lợi
ích và lợi thế của công nghệ giám sát analog và kỹ thuật số. Phương pháp này cho
phép bạn sử dụng một sự kết hợp của camera analog và camera IP, đầu ghi hình kỹ
thuật số (DVR), và máy chủ camera IP. Giải pháp mạnh mẽ này là hoàn hảo cho các
doanh nghiệp lớn và mở rộng như chuỗi nhà hàng, các tòa nhà y tế, trường học,

hoặc văn phòng lớn hay môi trường công nghiệp.
Hình 1.67+-?!/.:B;@,A
D+K+ L0.Vm#ST&
Chương này đã trình bày một cái nhìn tổng quát về video số và camera
giám sát. Việc lưu trữ và sử dụng các hình ảnh, video phục vụ cho các yêu cầu cao.
Trong chương tiếp theo sẽ trình bày những phương pháp giúp thao tác trên ảnh,
video số cho những mục đích khác nhau.
Trang 21
"#$3&.,+7#B
#ST&GA "#[.#('Y
.#X'0.^.Sn&
G+D+ &U.#(V#ST&
Trong chương này trình bày các vấn đề: tổng quan về phát hiện đối tượng,
các phương pháp phát hiện đối tượng cơ bản như phương pháp trừ nền và phương
pháp ước lượng opticalflow. Đi sâu hơn là tìm hiểu các giải thuật của phương pháp
trừ nền như là giải thuật Frame Difference, giải thuật Running Guassian Average và
giải thuật Codebook, từ đó có thể biết ưu nhược điểm của mỗi giải thuật. Tìm hiểu
các phương pháp theo vết đối tượng như phân mảnh vùng, bộ lọc Kalman, theo vết
Mean Shift mà chủ yếu là phương pháp phân mảnh vùng và các hàm phân mảnh
vùng trong matlab.
G+G+ ["#ST&"#[""#[.#(^.Sn&
G+G+D+ .oM;FO : BH
Phát hiện đối tượng chuyển động trong video là một trong các bài toán được
nghiên cứu rộng rãi và có nhiều ứng dụng trong cuộc sống hiện nay. Phần lớn các
đối tượng được phát hiện dựa vào những thông tin có trong một frame ảnh. Hiện
nay có rất nhiều hướng tiếp cận để giải quyết bài toán này như phát hiện đối tượng
dựa trên điểm (point detectors), dựa trên việc phân đoạn (segmentation), dựa trên
việc dùng phương pháp trừ nền hay dựa vào phương pháp ước lượng optical flow.
Tuy nhiên việc lựa chọn phương pháp thì dựa vào tình huống cụ thể. Và trong luận
văn này thì dữ liệu video thu được cần được xử lý theo thời gian thực vì thế dựa

trên kết quả nghiên cứu từ [16], việc phát hiện đối tượng bằng các phương pháp trừ
nềnvà phương pháp ước lượng optical flow là những phương pháp thích hợp với
yêu cầu được đặt ra của luận văn.
G+G+G+ "BCOO2F
3C3C3C%C DE?!)-)
Trong những ứng dụng về thị giác máy tính, vấn đề cơ bản nhất là làm thế
nào để phát hiện được các đối tượng chuyển động trong video (foreground) và biết
Trang 22
"#$3&.,+7#B
được đâu là phần nền không thay đổi (background). Để giải quyết được vấn đề này
thì ta dùng phương pháp trừ nền [16], là một trong những phương pháp cơ bản nhất
trong lĩnh vực thị giác máy tính.
Ý tưởng chung của các phương pháp trừ nền là: Để phát hiện ra được các đối
tượng chuyển động trong video chúng ta phải có được mô hình nền (background
model). Mô hình nền này có thể được học qua nhiều frame ảnh nếu nền bị thay đổi,
ngược lại ta có thể chọn một nền có sẵn nếu nền không bị thay đổi. Sau đó, ta sẽ
dùng mô hình nền này để so sánh với frame ảnh hiện tại và kết quả là ta sẽ nhận biết
được đâu là phần nền, đâu là các phần chuyển động.
Phương pháp trừ nền là phương pháp đơn giản nhất dùng để phát hiện
chuyển động vì khá dễ dàng để cài đặt và tốc độ xử lý nhanh đáp ứng được cho các
ứng dụng đòi hỏi xử lý thời gian thực hơn so với các phương pháp khác. Tuy nhiên,
phương pháp này sẽ cho kết quả chính xác không cao trong các trường hợp:
• Thay đổi về độ sáng: thay đổi dần dần theo thời giankhi Camera đặt ngoài trời quay
dữ liệu theo thời gian hoặc thay đổi đột ngột khiCamera ngoài trời quay dữ liệu và
có đám mây bay qua.
• Thay đổi về chuyển động khi Camera lung lay hoặc các đối tượng nền dao
động với tần suất cao (nhánh cây trước gió hoặc sóng biển).
• Thay đổi về thành phần cấu tạo của nền, ví dụ như khi xe chạy vào bãi đậu
và dừng luôn ở đó thì xem như xe đã thuộc về đối tượng nền.
Hiện nay có nhiều giải thuật khác nhau về trừ nền và trong phạm vi báo cáo

này chúng ta tập trung nghiên cứu 3 giải thuật: Frame Difference, Running
Gaussian Average và Codebook.
3C3C3C3C '!FG-+HH+-++
Ý tưởng chính trong giải thuật Frame Difference là các đối tượng chuyển
động sẽ được phát hiện dựa trên sự khác biệt giữa hai frame ảnh liên tiếp nhau cùng
với một ngưỡng được chọn trước. Giải thuật trên được thực hiện bằng phương pháp
trừ hai frame liên tiếp, đối với mỗi giá trị pixel kết quả ta so sánh tại pixel đó với
Trang 23
"#$3&.,+7#B
ngưỡng đã được chọn. Nếu giá trị này nằm trong ngưỡng cho phép thì tại đó ta xem
như là nền (background), ngược lại là phần chuyển động (foreground)[16].
G
I%
- G

< (2.1)
Trong đó:
G
I%
: frame ảnh thứ I%
G

: frame ảnh thứ 
: ngưỡng được chọn và độ chính xác của thuật toán phụ thuộc vào
giá trị ngưỡng này.
Hình 2.1 J?!K!F.G-+HH+-++L%M
• Ưu điểm
- Dễ cài đặt, tốc độ thực thi nhanh và tốn ít bộ nhớ.
- Thuật toán chạy chính xác trong trường hợp các đối tượng di chuyển liên tục và nền
tĩnh.

• Nhược điểm
- Độ chính xác của thuật toán tương đối thấp trong trường hợp nền thay đổi liên tục.
- Thuật toán chỉ xác định phần chuyển động chính xác đối với những điểm biên của
đối tượng. Đối với những điểm ảnh bên trong lòng đối tượng do sự dịch chuyển của
những điểm ảnh này là không đáng kể do đó sẽ bị xem như là phần nền.
Trang 24
"#$3&.,+7#B
Trong trường hợp khi một đối tượng ngừng chuyển động trong một khoảng
thời gian thì sẽ nó cũng có thể bị xem là nền.
3C3C3CNC '!FO!'!//
@+-+
Phương pháp này do Wren, Azarbayejani, Darrell và Pentland đưa ra vào
năm 1997. Phương pháp này đặt một phân phối Gaussian G(μ, σ) lên sự biến thiên
giá trị của mỗi pixel trong đoạn video. Ví dụ, với một dãy frame từ G
%
tới G

, ta xét
pixel ở vị trí01284thì các giá trị G
%
012842G
3
012842P2G

01284 sẽ tạo thành một dãy giá
trị của pixel 01284 ứng với từng frame ảnh. Bằng cách tính trung bình và phương sai
của dãy pixel này ta xác định được pixel background (giá trị trung bình) và ngưỡng
(độ lệch nhân với một hằng số αnào đó)[16].
μ
1

+

= α*F

+ (1- α)* μ

(2.2)
σ
2
1
+

= α*(F

- μ

)
2
+ (1- α)* σ
2

(2.3)
Những pixel nào có giá trị nào thỏa F-μ> thì được xem là phần chuyển
động(foreground). là ngưỡng được chọn[16].
Hình 2.2 J?!K!F.O!'!//@+-+L%M
• Ưu điểm
Trang 25

×