Tải bản đầy đủ (.pdf) (19 trang)

Nghiên cứu một số phương pháp nhận dạng đối tượng ứng dụng trong hệ thống camera quan sát bảo vệ mục tiêu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (517.36 KB, 19 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN MẠNH CƢỜNG

NGHIÊN CỨU MỘT SỐ PHƢƠNG PHÁP NHẬN DẠNG ĐỐI
TƢỢNG ỨNG DỤNG TRONG HỆ THỐNG CAMERA QUAN SÁT
BẢO VỆ MỤC TIÊU
Ngành: Công nghệ Thông tin
Mã số: 1.01.10

LUẬN VĂN THẠC SỸ

Người hướng dẫn khoa học: PSG.TS. Phương Minh Nam

Hà Nội -2008


MỤC LỤC
LỜI CAM ĐOAN
MỤC LỤC ………………………..........…….…………...…………………………1
DANH MỤC TỪ VIẾT TẮT…………..........…………..…………………………..3
DANH MỤC HÌNH VẼ…………………...........……….……….………………….4

MỞ ĐẦU ..................................................................................................................... 7
Cơ sở khoa học và ý nghĩa thực tiễn ...................................................................... 7
Cơ sở thực tiễn .................................................................................................... 7
Cơ sở khoa học .................................................................................................. 9
Ý nghĩa thực tiễn của Luận văn ........................................................................ 11
Mục tiêu và nội dung nghiên cứu. ........................................................................ 12
Cấu trúc của Luận văn. ......................................................................................... 13


CHƢƠNG 1 - TỔNG QUAN VỀ HỆ THỐNG CAMERA QUAN SÁT .......... Error!
Bookmark not defined.
1.1. Cấu hình kỹ thuật cơ bản của hệ thống ......... Error! Bookmark not defined.
1.1.1. Khối thu nhận hình ảnh (camera) .......... Error! Bookmark not defined.
1.1.2. Khối truyền dẫn ...................................... Error! Bookmark not defined.
1.1.3. Khối hiển thị .......................................... Error! Bookmark not defined.
1.1.4. Bộ tổng hợp hình (Multiplexer) .............. Error! Bookmark not defined.
1.1.5. Thiết bị ghi hình ...................................... Error! Bookmark not defined.
1.1.6. Bộ cấp nguồn .......................................... Error! Bookmark not defined.
1.2. Một số camera quan sát trên thị trƣờng Việt NamError! Bookmark not defined.
1.2.1. Camera IP VIVOTEK IP6122 ............... Error! Bookmark not defined.
1.2.2. Camera IP VIVOTEK IP7139 ............... Error! Bookmark not defined.
1.2.3. Camera IP VIVOTEK PZ6122 .............. Error! Bookmark not defined.
1.2.4. Camera Network AXIS 211 ................... Error! Bookmark not defined.
1.2.5. Camera IP AVtech AVI 201 .................... Error! Bookmark not defined.
1.2.6. Camera IP AVTech AVI 202................... Error! Bookmark not defined.
1.3. Giải pháp sử dụng camera kết nối trực tiếp với máy tínhError! Bookmark not
defined.
1.3.1. Giải pháp camera analog ....................... Error! Bookmark not defined.
1.3.2. Giải pháp camera số .............................. Error! Bookmark not defined.
1.3.3. Đề xuất một số loại camera có thể đáp ứng yêu cầu của Luận văn Error!
Bookmark not defined.
1.4. Các chức năng phần mềm của hệ thống camera quan sátError! Bookmark not
defined.
1.4.1 Phát hiện đối tượng ................................. Error! Bookmark not defined.
1.4.2. Phân loại đối tượng ................................ Error! Bookmark not defined.
1.4.3. Theo vết các đối tượng chuyển động ...... Error! Bookmark not defined.
1.5. Một số chuyên đề cần nghiên cứu đối với hệ thống camera quan sát .... Error!
Bookmark not defined.
1.5.1. Phát hiện đối tượng ra/vào cửa .............. Error! Bookmark not defined.



1.5.2 Phát hiện di chuyển bất thường của đối tượng trong khu vực xác địnhError!
Bookmark not defined.
1.5.3- Phát hiện phương tiện đỗ, dừng quá thời gian quy địnhError! Bookmark
not defined.
1.5.4- Kiểm soát, phát hiện việc lấy, mang vác đồ vật ra khỏi khu vực được bảo vệ
.......................................................................... Error! Bookmark not defined.
1.5.5- Xác định những chuyển động, đối tượng bất thườngError! Bookmark not
defined.
1.5.7- Kiểm soát đám đông ............................... Error! Bookmark not defined.
CHƢƠNG 2 - KỸ THUẬT PHÂN TÍCH HÌNH ẢNH VIDEOError! Bookmark not
defined.
2.1. Tiền xử lý hình ảnh[1] ................................... Error! Bookmark not defined.
2.1.1. Kỹ thuật tăng cường ảnh sử dụng toán tử điểm ảnhError! Bookmark not
defined.
2.1.2. Kỹ thuật lọc số miền không gian ............ Error! Bookmark not defined.
2.2. Phát hiện đối tƣợng ........................................ Error! Bookmark not defined.
2.2.1. Kỹ thuật trừ ảnh dựa vào điểm ảnh ........ Error! Bookmark not defined.
2.2.2 Kỹ thuật trừ ảnh phân khối ...................... Error! Bookmark not defined.
2.2.3. Phương pháp biểu đồ mức xám .............. Error! Bookmark not defined.
2.2.4. Kỹ thuật trừ ảnh dựa vào đặc trưng ....... Error! Bookmark not defined.
2.3. Nhận dạng đối tƣợng ..................................... Error! Bookmark not defined.
2.3.1. Phương pháp nhận dạng dựa trên hình tháiError! Bookmark not defined.
2.3.2. Phương pháp nhận dạng dựa vào mô hình mạng nơron nhân tạo . Error!
Bookmark not defined.
2.4. Theo vết đối tƣợng chuyển động ................... Error! Bookmark not defined.
2.5. Phát hiện khuôn mặt ...................................... Error! Bookmark not defined.
CHƢƠNG 3 - THIẾT KẾ VÀ XÂY DỰNG CHƢƠNG TRÌNHError! Bookmark not
defined.

3.1. Thu nhận ảnh trực tiếp từ camera .................. Error! Bookmark not defined.
3.2. Tiền xử lý ....................................................... Error! Bookmark not defined.
3.2.1. Biến đổi ảnh đa mức xám ....................... Error! Bookmark not defined.
3.2.2. Toán tử nhân chập .................................. Error! Bookmark not defined.
3.3. Phát hiện sai khác giữa các khung hình ......... Error! Bookmark not defined.
3.4. Phát hiện đối tƣợng xuất hiện trong khung hìnhError! Bookmark not defined.
3.5. Nhận dạng đối tƣợng bằng mô hình mạng nơronError! Bookmark not defined.
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ................ Error! Bookmark not defined.
A. GIAO DIỆN CHƢƠNG TRÌNH ..................... Error! Bookmark not defined.
1. Giao diện chính ................................................. Error! Bookmark not defined.
3. Giao diện chƣơng trình giám sát con ngƣời ..... Error! Bookmark not defined.
5. Giao diện chƣơng trình huấn luyện .................. Error! Bookmark not defined.
B. CHƢƠNG TRÌNH NGUỒN ................................ Error! Bookmark not defined.
1. Biến đổi ảnh đa mức xám ................................. Error! Bookmark not defined.
2. Toán tử nhân chập ............................................ Error! Bookmark not defined.


3. Phát hiện đối tƣợng ........................................... Error! Bookmark not defined.
4. Nhận dạng đối tƣợng ........................................ Error! Bookmark not defined.
5. Theo vết đối tƣợng ............................................ Error! Bookmark not defined.
6. Phát hiện khuôn mặt ......................................... Error! Bookmark not defined.
7.
Huấn
STT
TỪ
GIẢI
NGHĨA
luyện
mạng...........................
LIỆU

KHẢO

TÀI
THAM

...……………….......................….……………………85

DANH MỤC TỪ VIẾT TẮT


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

ADSL

MPEG-1
CCTV
DVR
DVS
DVSr
NVR
MJPEG
ĐTDĐ
VGA
USB
IP
AVI
ATM
RGB
JPEG
NTSC
NSD

Asymmetrical Digital Subcriber Line
Chuẩn nén video MPEG-1
Closed-circuit television
Digital Video Recorder
Chuẩn ghi hình ảnh
Chuẩn ghi hình ảnh
Networked Video Recorder
Chuẩn nén video MJPEG
Điện thoại di động
Video Graphic Adapter
Universal Serial Bus
Internet Protocol

Định dạng tệp video
Máy rút tiền tự động
Red Green Blue
Một chuẩn của ảnh
chuẩn hình ảnh
Người sử dụng


DANH MỤC HÌNH VẼ
STT

CHÚ THÍCH

TRANG


1
2
3
4
5
6
7
8
9
10
11
12
13
14

15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

Hình 1.1: Quá trình phân đoạn và tìm kiếm video
Hình 2.1. Cấu hình cơ bản của hệ thống camera quan sát

Hình 2.2: Cấu tạo cơ bản của Camera
Hình 2.3: Camera cố định

Hình 2.4 : P/T/Z Camera
Hình 2.5: Màn hình

Hình 2.6: Cấu hình ghép nối các camera với bộ tổng hợp hình
Hình 2.7: Thiết bị ghi hình
Hình 2.7.1: Camera IP VIVOTEK IP6122
Hình 2.7.2: Camera IP VIVOTEK IP7139
Hình 2.7.3: Camera IP VIVOTEK PZ6122
Hình 2.7.4: Camera Network AXIS 211
Hình 2.7.5: Camera IP AVtech AVI 201
Hình 2.8: Các chức năng chính trong hệ camera giám sát
Hình 2.9: Phát hiện đối tƣợng ra/vào cửa
Hình 2.10: Phát hiện di chuyển bất thƣờng của đối tƣợng trong khu
vực xác định
Hình 2.11: Phát hiện phƣơng tiện đỗ, dừng quá thời gian quy định
Hình 2.12: Kiểm soát, phát hiện việc lấy, mang vác đồ vật ra khỏi khu
vực đƣợc bảo vệ
Hình 2.13: Xác định những chuyển động, đối tƣợng bất thƣờng
Hình 2.14: Kiểm soát, phát hiện các phƣơng tiện cơ động trong danh
sách chú ý.
Hình 2.15: Kiểm soát đám đông.
Hình 3.1: Tăng cƣờng độ tƣơng phản
Hình 3.2: So sánh lƣợc đồ mức xám
Hình 3.3: Phát hiện đặc trƣng dựa vào các cạnh
Hình 3.4: Các mẫu vector đặc trƣng cho di chuyển của camera
Hình 3.5: Phân loại đối tƣợng
Hình 3.6: Xác định đƣờng biên
Hình 3.7: Thuật toán phân tích hình dáng đối tƣợng
Hình 3.8: Mô hình chuyển động của con ngƣời
Hình 4.1: Phát hiện sai khác giữa các khung hình
Hình A.1: Giao diện chính của chƣơng trình
Hình A.2: Chức năng giám sát đồ vật
Hình A.3: Chức năng giám sát con ngƣời

Hình A.4: Chức năng phát hiện khuôn mặt
Hình A.5: Huấn luyện khuôn mặt

7
13
14
14
14
15
15
16
17
17
18
18
18
22
23
24
24
25
25
26
27
28
36
37
38
39
40

41
41
52
62
63
64
64
65


MỞ ĐẦU
Cơ sở khoa học và ý nghĩa thực tiễn
Cơ sở thực tiễn
Tình hình nghiên cứu, ứng dụng triển khai công nghệ thông tin nói chung và
các ứng dụng khoa học công nghệ trong công tác bảo vệ an ninh công cộng và
chống khủng bố nói riêng ở một số nƣớc trong khu vực cũng nhƣ trên toàn thế giới
ngày một phát triển. Xây dựng hệ thống Camera giám sát sử dụng trong các cơ
quan, tổ chức, lực lƣợng chống khủng bố, lực lƣợng cảnh sát, lực lƣợng phòng thủ
dân sự…., đặc biệt ứng dụng trong lĩnh vực an ninh công cộng đã đƣợc các nƣớc
phát triển trên thế giới nghiên cứu triển khai, nhất là từ sau khi xảy ra vụ khủng bố
11/9. Nhiều hệ thống camera giám sát an ninh với công nghệ tiên tiến có cấu trúc
và công nghệ kỹ thuật rất tốt, không những đảm bảo kết nối các hệ thống với nhau
và chia xẻ, trao đổi thông tin, dữ liệu đa dịch vụ (âm thanh, hình ảnh, dữ liệu….)
có tốc độ cao, mà còn đƣợc bảo mật ở các cấp độ phù hợp. Cũng từ sau sự kiện
khủng bố ngày 11/ 9 hàng loạt các công nghệ hỗ trợ an ninh chống khủng bố đã
đƣợc nghiên cứu với các ứng dụng của các tiến bộ khoa học và công nghệ đã ra
đời, trong đó phải kể đến công nghệ giám sát an ninh điện tử đƣợc coi là một trong
các biện pháp không thể thiếu và nó đã có những bƣớc phát triển nhảy vọt.
Nhờ các hệ thống giám sát an ninh công cộng, hàng loạt tên khủng bố đã
đƣợc các cơ quan an ninh đã kịp thời phát hiện, nhận dạng, ngăn chặn và bắt giữ .

Công nghệ kỹ thuật giám sát an ninh đã có sự phát triển mạnh mẽ, từ các hệ thống
quan sát kỹ thuật analog phổ biến trƣớc năm 2002, đến nay các hệ thống quan sát
mới công nghệ số hoá trên nền IP hoá đã đạt gần đến mức độ kỹ hoàn hảo dựa trên
cơ sở hạ tầng của nền công nghệ thông tin.
Các hệ thống camera giám sát giao thông, hệ thống giám sát an ninh công
cộng diện rộng điển hình nhƣ tại Anh, Mỹ, Đức, Xingapo .. đã đƣợc áp dụng các
công nghệ tiên tiến của thế giới và ngày càng đƣợc nhiều quốc gia ứng dụng nhằm
giữ vững an ninh chính trị và trật tự an toàn xã hội trong bối cảnh hội nhập trên
toàn thế giới.


Trong những năm qua các hệ thống kỹ thuật giám sát an ninh công cộng đã
tạo đƣợc những kết quả thành tích to lớn, thể hiện vai trò quan trọng của việc áp
dụng khoa học, kỹ thuật và công nghệ vào công tác chiến đấu của lực lƣợng công
an. Quy mô các hệ thống giám sát an ninh công cộng ngày càng đƣợc hoàn thiện
và hiện đại lên cùng sự phát triển của nền khoa học và sự phát triển không ngừng
của công nghệ thế giới.
Một ví dụ điển hình là ở hệ thống camera quan sát của thủ đô London vƣơng
quốc Anh đã đƣợc trang bị tới trên hai chục ngàn camera, trung bình một ngƣời
một ngày ở thủ đô nƣớc này đƣợc camera ghi hình tới ba lần. Chính hệ thống
camera nói trên đã giúp cảnh sát Anh nhanh chóng xác định đƣợc danh tính của
các kẻ khủng bố đánh bom ở London hồi tháng 7/2005.
Những năm vừa qua, đƣợc sự quan tâm chỉ đạo của Đảng uỷ Công an Trung
ƣơng, lãnh đạo Bộ và lãnh đạo công an các địa phƣơng, lực lƣợng công an nhân
dân đã trang bị đƣợc một số hệ thống camera quan sát để phục vụ công tác nghiệp
vụ công an tại Văn phòng Bộ Công an, Tổng cục cảnh sát, Bộ tƣ lệnh cảnh vệ, các
hệ thống camera quan sát bảo vệ mục tiêu và đảm bảo an toàn giao thông tại công
an các thành phố Hà Nội, Thành phố Hồ Chí Minh và công an các tỉnh Thừa Thiên
Huế, Đà Nẵng, Đắc Lắc, Tây Ninh....
Các hệ thống camera quan sát nói trên đã góp phần đắc lực trong công tác

đảm bảo anh ninh chính trị và giữ gìn trật tự an toàn xã hội các dịp lễ kỷ niệm ngày
giải phóng miền nam, Quốc khánh 2/9, các dịp lễ hội, Festival, Tết Nguyên đán,...
Đặc biệt là góp phần bảo vệ thành công bầu cử Quốc hội, Đại hội đại biểu Đảng
toàn quốc và các sự kiện, hội nghị quốc tế lớn tổ chức tại Việt Nam (nhƣ
Seagame22, ASEM5, APEC, ...)


Hình 1.1: Quá trình phân đoạn và tìm kiếm video

Cơ sở khoa học
Cùng với sự phát triển của công nghệ thông tin, trong một vài năm gần đây
công nghệ truyền thông đa phƣơng tiện cũng đang đƣợc quan tâm. Các ứng dụng
trong hệ thống camera giám sát chỉ là một trong các ứng dụng của công nghệ
truyền thông đa phƣơng tiện. Ngày nay với sự phát triển của các kỹ thuật nén ảnh
video và truyền thông, chúng ta có thể gửi trực tuyến một số lƣợng lớn các file ảnh
và file video qua mạng internet và ngƣời dùng đầu cuối với đƣờng truyền băng
thông rộng hoặc kết nối ADSL hoàn toàn có thể xem các hình ảnh video chất
lƣợng cao tại nhà. Trong khi số lƣợng video tăng lên nhanh chóng mà các ứng
dụng đa truyền thông vẫn bị giới hạn trong việc quản lý nội dung, do vậy đòi hỏi
những kỹ thuật mới để có thể xử lý hiệu quả và quản lý nội dung các dữ liệu video.
Mô hình phân đoạn video đƣợc minh hoạ trong hình 1.1. Trƣớc tiên chuỗi video
đƣợc phân đoạn theo thời gian và không gian thích hợp. Sau đó các phân đoạn này
đƣợc rút trích các đặc trƣng để tạo các chỉ mục và tóm lƣợc thông tin. Và cuối
cùng các ảnh và đoạn video này đƣợc tìm kiếm dựa trên các đặc trƣng chỉ mục đã
đƣợc rút trích.


Các kỹ thuật xử lý ảnh trong công nghệ thông tin đã và đang đƣợc quan tâm,
hiện nay giới khoa học về công nghệ thông tin đều nhất trí sử dụng khái niệm Thị
giác máy tính để nói về một công nghệ mới trong xử lý ảnh nói chung và xử lý tín

hiệu video nói riêng. Trong một vài năm gần đây các bài báo, công trình khoa học
về công nghệ thị giác máy tính tăng đáng kể trên các tạp chí chuyên ngành.
Hình ảnh và video là những biểu diễn trực quan của thông tin. Trong những
năm gần đây, nhiều phƣơng pháp đã phát triển nhằm tìm kiếm ảnh và video trên cơ
sở các đặc trƣng trực quan của chúng. Màu sắc, vân ảnh, chuyển động và cấu tạo
không gian-thời gian là các đặc trƣng phổ biến nhất đƣợc dùng trong so sánh tính
tƣơng quan, trực quan giữa hai ảnh hoặc hai khung hình trong luồng dữ liệu
video[6]. Hai phƣơng án tìm kiếm phổ biến nhất là truy vấn mẫu và truy vấn phác
thảo[7]. Một số nghiên cứu đã tập trung vào tìm kiếm ảnh tĩnh nhƣ trích chọn các
đặc trƣng của ảnh, độ đo tƣơng tự giữa hai ảnh và tìm kiếm ngữ nghĩa [8]. Các
nghiên cứu về video chủ yếu dựa trên các kỹ thuật phát hiện sự chuyển cảnh (sự
thay đổi giữa các khung hình), trích khoá giữa các khung hình hoặc áp dụng các kỹ
thuật đối với ảnh tĩnh.
So với ảnh tĩnh, tín hiệu là dữ liệu động với trục thời gian. Ảnh video đƣợc
biểu diễn một cách liên tục trên một tốc độ nhất định. Một ảnh video chất lƣợng tốt
bao gồm 25 đến 30 khung hình một giây. Kích thƣớc của một giờ video với kỹ
thuật nén MPEG-1 là 500 MB. Chính đặc tính liên tục theo thời gian và kích thƣớc
lớn là các thách thức lớn đối với các kỹ thuật phân tích hình ảnh video. Tuy nhiên
theo một số quan điểm chính sự nhiều thông tin, đặc biệt là thời gian và sự chuyển
động lại là đặc trƣng giúp cho quá trình phân tích hình ảnh video. Theo quan điểm
này, chúng ta có thể điểm qua một số hƣớng tiếp cận chính sau:
- Sử dụng các phƣơng pháp cắt ảnh nhằm chia đoạn video thành các đơn vị
cơ bản. Các đặc trƣng ở mức thấp nhƣ màu sắc, chuyển động đã chứng minh là
đúng đắn cho việc phát hiện các đối tƣợng theo trục thời gian.
- Một phƣơng pháp khác là sử dụng một hay nhiều khung hình là cơ sở để
phát hiện chuyển cảnh, sau đó mới sử dụng các đặc trƣng màu sắc hay vân ảnh để
xác định các đối tƣợng xuất hiện trong vùng camera.


- Mô hình hoá các thay đổi trên mỗi khung hình nhƣ một chuỗi các quan sát

trong mô hình markov. Thông qua quá trình huấn luyện, hệ thống sẽ ƣớc lƣợng các
thay đổi trong các khung hình tiếp theo[9]. Thông thƣờng phƣơng pháp này đƣợc
ứng dụng cho quá trình theo vết đối tƣợng và đƣợc chia là hai loại chính là bottomup và top-down:
+ Bottom-up: xuất phát từ các quan sát, thực hiện rút trích, phân đoạn để tìm
ra đối tƣợng cần theo vết.
+ Top-down: giải quyết bài toán một cách thuận chiều hơn bằng cách ƣớc
lƣợng mức hợp lý (likelihood) của các giả thuyết cho trƣớc dựa trên quan sát thu
đƣợc. Cụ thể hơn, đầu tiên, phát sinh ra một tập các giả thuyết có thể có trong
không gian trạng thái của hệ thống, sau đó sử dụng quan sát để tính likelihood cho
từng giả thuyết, các likelihood này sẽ quyết định đến mức độ “tin cậy” của từng giả
thuyết. (Thƣờng đƣợc biểu thị bằng các trọng số). Cuối cùng tổng hợp tập các giả
thuyết-trọng số để cho ƣớc lƣợng trạng thái của hệ thống.
Tóm lại: Với các nghiên cứu về thị giác máy tính nói chung và kỹ thuật phân
đoạn video nói riêng, hiện nay chúng ta đã có đầy đủ các công cụ để giải quyết cho
bài toán trong hệ thống camera giám sát. Cùng với các kinh nghiệm và kiến thức
trong lĩnh vực xử lý ảnh và nhận dạng, chúng tôi có đầy đủ khả năng để hoàn thành
đƣợc các nội dung và mục tiêu nghiên cứu đề ra.
Ý nghĩa thực tiễn của Luận văn
Việc sử dụng camera quan sát trong việc bảo vệ mục tiêu hiện nay đƣợc ứng
dụng ngày càng rộng rãi, từ các mục tiêu an ninh quốc phòng cho đến các mục tiêu
dân sự. Thậm chí hệ thống camera còn đƣợc trang bị tại các gia đình. Ở Việt Nam
trong nhiều cơ quan, Bộ ngành đã đầu tƣ nghiên cứu xây dựng và ứng dụng các
công nghệ tiên tiến trong công tác đầu tƣ, trang bị các hệ thống Camera giám sát
phục vụ công tác bảo vệ Trụ sở đầu não quan trọng với các công nghệ tiên tiến trên
thế giới nhằm đảm bảo an toàn tuyệt đối các mục tiêu trọng điểm, tuy nhiên do đặc
thù hạ tầng truyền dẫn và mục đích yêu cầu sử dụng, các hệ thống có cấu hình khác
nhau với các hệ quản lý và khai thác dữ liệu cũng khác nhau và cấu trúc kỹ thuật


hạ tầng truyền dẫn cũng theo nhiều giải pháp khác nhau.

Thực tế cho thấy ở Việt Nam nói chung và trong lực lƣợng công an nói riêng
đã có rất nhiều nơi trang bị các hệ thống giám sát an ninh công cộng ở diện hẹp
nhƣ trong các trụ sở, kho bạc, ngân hàng, kho lƣu trữ, bảo tàng hay các cảng hàng
không, nhà ga... với rất nhiều công nghệ khác nhau, nhiều hãng thiết bị, nhiều mô
hình thiết kế cũng khác nhau. Theo thống kê chưa đầy đủ đến thời điểm tháng
07/2008 lực lượng công an nhân dân đã và đang khai thác sử dụng 552 hệ thống
camera giám sát đồng thời khai thác cơ sở dữ liệu của các hệ thống do các Bộ
ngành khác là 467 hệ thống (số liệu từ dự án điều tra cơ bản – Thực trạng và nhu
cầu các hệ thống camera giám sát an ninh công cộng trong lực lượng công an
nhân dân)
Tuy nhiên các hệ thống camera quan sát kiểm soát an ninh đƣợc triển khai tại
Việt Nam hầu hết do con ngƣời trực tiếp điều khiển. Với các hệ thống có hàng chục,
hàng trăm camera tƣơng ứng với hàng chục, hàng trăm màn hình hiển thị, thì cần phải
hàng chục ngƣời quan sát xử lý. Việc làm này vừa tốn nhân lực vừa không thể tránh
khỏi những sai sót do tâm lý con ngƣời (mệt mỏi, sao nhãng,...) gây ra.
Vì vậy việc đƣa các ứng dụng nhận dạng mục tiêu tích hợp với các hệ thống
camera quan sát là yêu cầu vừa cấp bách, vừa có tính thực tiễn cao nhằm không những
tự động hoá phần lớn khâu quan sát, xử lý, cảnh báo mà còn tăng tốc độ xử lý các tín
hiệu quan tâm do camera thu nhận đƣợc.
Các sản phẩm tự động kiểm soát hình ảnh thu đƣợc camera hiện nay cũng đã
đƣợc các nhà sản xuất trên thế giới chào bán tại Việt Nam, nhƣng tất cả đều ở dạng
đóng gói và đi kèm với các thiết bị chuyên dụng nên sản phẩm đều rất đắt và rất khó
khăn khi cần mở rộng và triển khai ứng dụng.
Mục tiêu và nội dung nghiên cứu.
Trên cơ sở phân tích các cơ sở khoa học và ý nghĩa thực tiễn của Luận văn,
chúng tôi đã chủ động đề xuất đăng ký thực hiện Luận văn với mục tiêu và nội dung
nghiên cứu nhƣ sau:
Mục tiêu nghiên cứu:



“Nghiên cứu một số phƣơng pháp nhận dạng đối tƣợng ứng dụng trong hệ
thống camera quan sát bảo vệ mục tiêu” từ đó xây dựng chƣơng trình phát hiện và
bám sát sự di chuyển của đối tƣợng ứng dụng trong hệ thống camera quan sát bảo
vệ mục tiêu. Nghiên cứu và phát hiện các trạng thái, tƣ thế chuyển động của con
ngƣời trong vùng camera quan sát tại khu vực cần bảo vệ.
Nội dung nghiên cứu:
 Nghiên cứu một số loại camera hiện có trên thị trƣờng giám sát bảo vệ mục
tiêu, đánh giá chất lƣợng ảnh cũng nhƣ khả năng liên kết với máy tính. Xây
dựng chƣơng trình thu nhận ảnh trực tiếp từ camera, kết xuất ra từng ảnh
riêng biệt theo từ frame của luồng video.
 Thu thập thống kê và phân tích các mẫu về hình dáng di chuyển của con
ngƣời. Xây dựng chƣơng trình tổng hợp và phân tích các mẫu này để làm cơ
sở cho quá trình huấn luyện của hệ thống. Tự động cập nhật các mẫu di
chuyển mới.
 Xây dựng chƣơng trình nhận dạng phát hiện đối tƣợng xuất hiện tại khu vực
cần bảo vệ, trong vùng camera quan sát đƣợc.
 Xây dựng chƣơng trình bám sát di chuyển của đối tƣợng trong vùng camera
quan sát đƣợc. Đặt ngƣỡng báo động nếu nhƣ đối tƣợng xuất hiện tại khu
vục cần bảo vệ quá một thời gian qui định.
 Xây dựng chƣơng trình dò tìm khuôn mặt đối với mỗi đối tƣợng phát hiện
đƣợc. Nếu xuất hiện khuôn mặt trong luồng video quan sát đƣợc thì định vị
và sao lƣu khuôn mặt của đối tƣợng.
 Hoàn thiện chƣơng trình nhận dạng đối tƣợng với nhiều đối tƣợng cùng xuất
hiện trong frame ảnh thu nhận đƣợc từ camera. Phát hiện, định vị và sao lƣu
các khuôn mặt của đối tƣợng nếu có thể.
Cấu trúc của Luận văn.
Luận văn đƣợc chia thành bốn chƣơng với một phụ lục trong đó chi tiết nhƣ sau:
Phần mở đầu giới thiệu chung về tình hình nghiên cứu của Luận văn bao gồm cơ
sở khoa học để thực hiện Luận văn và ý nghĩa thực tiễn của Luận văn cũng nhƣ nội



dung và mục tiêu nghiên cứu Luận văn đã đăng ký để nghiên cứu trong bản thuyết
minh nghiên cứu của Luận văn.
Chƣơng một là những nghiên cứu tổng quan về hệ thống camera quan sát bảo vệ
mục tiêu. Bắt đầu từ cấu hình phần cứng cần thiết đối với một hệ thống, tiếp theo là các
tìm hiểu của Luận văn về một số camera giám sát trên thị trƣờng công nghệ thông tin ở
Việt Nam. Trong chƣơng này, chúng tôi cũng đã tìm hiểu các giải pháp kết nối giữa
camera và máy tính để từ đó lựa chọn giải pháp ứng dụng của Luận văn và đề xuất một
số loại camera có thể ứng dụng trong phạm vi nghiên cứu của Luận văn.
Các chức năng phần mềm cần thiết đối với một hệ thống camera quan sát và một
số bài toán cần đƣợc nghiên cứu cũng đƣợc trình bày trong chƣơng 1. Với khả năng của
mình, chúng tôi đã đƣa ra ba chức năng chính và bảy chuyên đề cần nghiên cứu đối với
một hệ thống camera quan sát bảo vệ mục tiêu.
Phần cuối cùng trong chƣơng một, chúng tôi đã tìm hiểu một số một số bài toán
cần đƣợc đầu tƣ nghiên cứu để có thể đáp ứng đầy đủ các chức năng của một hệ thống
camera giám sát.
Trong chƣơng hai là các kỹ thuật phân tích hình ảnh video. Bắt đầu bằng các kỹ
thuật xử lý ảnh cơ bản nhằm khử nhiễu tăng cƣờng chất lƣợng ảnh. Phần tiếp theo là
các kỹ thuật phát hiện đối tƣợng, phân loại đối tƣợng vào một trong ba lớp: đồ vật, con
ngƣời và phƣơng tiện giao thông. Phần cuối chƣơng là các kỹ thuật theo vết các đối
tƣợng chuyển động.
Chƣơng ba là các kết quả đã cài đặt đƣợc do chúng tôi cài đặt thử nghiệm bằng
ngôn ngữ lập trình Visual Basic 6.0. Trong chƣơng này chúng tôi cung cấp đầy đủ các
thuật toán đã đƣợc sử dụng trong nghiên cứu Luận văn và đƣợc sắp xếp theo thứ tự các
bƣớc cần giải quyết đối với bài toán camera giám sát.
Phần phụ lục là một số giao diện của chƣơng trình phát hiện và bám sát sự di
chuyển của đối tƣợng ứng dụng trong hệ thống camera quan sát bảo vệ mục tiêu cũng
nhƣ một số đoạn mã nguồn của chƣơng trình. Chƣơng trình nguồn đƣợc sắp xếp theo
các chức năng cần giải quyết trong phạm vi nghiên cứu của Luận văn.
Cuối cùng là phần kết luận về các công việc đã thực hiện và cùng bàn về khả

năng ứng dụng cũng nhƣ hƣớng phát triển tiếp theo.



TÀI LIỆU THAM KHẢO
Tiếng Việt

1. Nhập môn xử lý Ảnh số – Lƣơng Mạnh Bá, Nguyễn Thanh Thuỷ, 2000.
2. Vũ Văn Khoan, Phí Anh Quân "Nhận dạng ký tự ứng dụng trong kiểm tra hộ
chiếu đọ máy" Luận văn cấp Bộ năm 1996.
3. Phí Anh Quân " Xây dựng chƣơng trình kiểm soát ra vào bằng vân tay" - Luận
văn cấp Bộ năm 2002.
4. LÊ HOÀI BẮC, TRƢƠNG THIÊN ĐỈNH, “Hệ thống theo dõi giao thông bằng
thị giác máy tính”, Tạp chí Phát triển KH-CN, tập 7, số 10/2004.
5. Phạm Thế Bảo, Nguyễn Thành Nhựt, Cao Minh Thịnh, Trần Anh Tuấn, Phan
Phúc Doãn"Tổng quan các phƣơng pháp xác định khuôn mặt ngƣời" - Báo cáo tại
hội thảo FAIR 2007 - Đại học Nha Trang.

Tiếng Anh
6. Gulrukh Ahanger, Dan Benson and T.D.C.Little, "Video Query for
mulation", Storage and Retrieval for Images and Video databases II, I
S&T/SPIE Symposium on Electronic Imaging Science & Technology, San Jose,
CA, Feb 1995.
7. Edo ardo Ardizzo ne, Mo hand- Said Hacid: A Semantic Modeling Appoach
for Video Retrieval by Co ntet. IEEE International Conference on Mutimedia
Computing and Systems, ICMCS 1999, 7-11 June, 199, Florence, Italy,
Proceedings.
8. F.Arman, A.Hsu and M-Y.Chiu "Featrue Management for Large Video
Databases", Proc. IS&T/SPIE Conf. on Storage and Retrieval for Image and
Video Databases, CA, Feb 1993.



9. A.DOUCET, N.FREITAS, N.GORDON, “Sequential Monte Carlo Methods in
Practice”, Springer, January 2001, ISBN: 0-387-95146-6.
10. T. Kikukawa, S. Kawafuchi, Development of an automatic summary editing
system for the audio-visual resources, Transactions on Electronics and Information
J75-A (1992) 204-212.
11. R. Kasturi, R. Jain, Dynamic vision, in Computer Vision: Principles, R. Kasturi
and R. Jain, eds.), pp. 469-480, IEEE Computer Society Press, Washington DC,
1991.
12. B. Shahraray, Scene change detection and content-based sampling of video
sequences, in: Proc. IS&T/SPIE 2419, pp. 2-13, 1995.
13. W. Xiong, J. C.-M. Lee, M.C. Ip, Net comparison: a fast and effective method
for classifying image sequences, in: Proc. SPIE Conf. Storage and Retrieval for
Image and Video Databases III 2420, San Jose, CA, 1995, pp. 318-328.
14. H.J. Zhang, A. Kankanhalli, S.W. Smoliar, Automatic partitioning of fullmotion video, Multimedia Systems 1(1) (1993) 10-28.
15. A. Nagasaka, Y. Tanaka, Automatic video indexing and full-video search for
object.
appearances, in Visual Database Systems II (E. Knuth and L.M. Wegner, eds.), pp.
113-127, Elsevier, 1995.
16. R. Zabih, J. Miler, K. Mai, A feature-based algorithm for detecting and
classifying production effects, Multimedia Systems 7 (1999) 119-128.
17. Hironobu Fujioshi, Alan J.Lipton “Real-time human motion analysis by image
skeletonization” The Robottics Institute. Carnegie Mellon University
18. T. Kohonen, The Self-Organizing Map, Proc. of the IEEE 78(9) (1990) 1464 1480.
19. C.HUE, J.P.CADRE, P.PREZ, “Tracking multiple objects with Particle
Filtering”, IEEE Transactions on Aerospace and Electronic Systems, 38(3):791–
812, 2002.



20. Ming-Hsuan Yang, David J. Kriegman, and Narendra Ahuja, “Detecting Faces
in Images: A Survey”, IEEE Transaction on Pattern Analysis and Machine
Intelligent, vol. 24, no. 1, 2002.



×