Tải bản đầy đủ (.pdf) (52 trang)

Tìm hiểu phương pháp phát hiện bóng của một đối tượng qua ảnh viết chương trình minh họa (2014)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.31 MB, 52 trang )

TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN


NGUYỄN HỮU HỢP

TÌM HIỂU PHƢƠNG PHÁP
PHÁT HIỆN BÓNG CỦA MỘT
ĐỐI TƢỢNG QUA ẢNH.
VIẾT CHƢƠNG TRÌNH MINH HỌA

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Tin học

HÀ NỘI – 2014


TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN


NGUYỄN HỮU HỢP

TÌM HIỂU PHƢƠNG PHÁP
PHÁT HIỆN BÓNG CỦA MỘT
ĐỐI TƢỢNG QUA ẢNH.
VIẾT CHƢƠNG TRÌNH MINH HỌA

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Tin học
Ngƣời hƣớng dẫn khoa học


Th.S NGUYỄN MINH HIỀN

HÀ NỘI – 2014


LỜI CẢM ƠN
Trong quá trình học tập, nghiên cứu và tìm hiểu khóa luận tốt nghiệp
này, em đã nhận đƣợc sự giúp đỡ của thầy, cô giáo và bạn bè trong khoa Công
nghệ Thông tin trƣờng Đại học Sƣ phạm Hà Nội 2 để có đƣợc những kiến
thức và hiểu biết nhiều hơn về chuyên ngành mà mình theo học.
Đặc biệt, với sự hƣớng dẫn và chỉ đạo tận tình của cô giáo Th.S
Nguyễn Minh Hiền đã giúp hiểu sâu hơn về kiến thức chuyên ngành nói
chung và đề tài đƣợc giao nói riêng.
Qua đây, em xin gửi lời cảm ơn chân thành đến cô giáo Th.S Nguyễn
Minh Hiền, ngƣời đã tận tình chỉ bảo và giúp đỡ em hoàn thành khóa luận tốt
nghiệp này.
Xuân Hòa, ngày 8 tháng 5 năm 2014
Sinh viên

Nguyễn Hữu Hợp


LỜI CAM ĐOAN
Em xin cam đoan:
1. Đề tài này hoàn toàn do bản thân tôi thực hiện dƣới sự giúp đỡ của các
thầy, cô giáo và bạn bè trong khoa Công nghệ Thông tin trƣờng Đại học
Sƣ phạm Hà Nội 2, đặc biệt là sự hƣớng dẫn của cô giáo Th.S Nguyễn
Minh Hiền.
2. Đề tài có sử dụng các tài liệu tham khảo và không copy từ các tài liệu
có sẵn.

3. Đề tài không trùng với bất cứ kết quả nghiên cứu nào trƣớc đó.
Nếu có gì sai sót em xin hoàn toàn chịu trách nhiệm.
Xuân Hòa, ngày 8 tháng 5 năm 2014
Sinh viên

Nguyễn Hữu Hợp


MỤC LỤC

MỞ ĐẦU ........................................................................................................... 1
CHƢƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN
BÓNG................................................................................................................ 5
1.1. Khái quát về xử lý ảnh ............................................................................. 5
1.1.1. Xử lý ảnh là gì? ................................................................................. 5
1.1.2. Một số khái niệm trong xử lý ảnh ..................................................... 6
1.1.3. Nắn chỉnh biến dạng .......................................................................... 7
1.1.4. Khử nhiễu và chỉnh mức xám ........................................................... 8
1.1.5. Trích chọn đặc điểm .......................................................................... 9
1.1.6. Nhận dạng.......................................................................................... 9
1.1.7. Nén ảnh ............................................................................................ 11
1.2. Bài toán phát hiện bóng ......................................................................... 12
1.2.1. Hƣớng ánh sáng là gì? ..................................................................... 12
1.2.2. Bóng là gì? ....................................................................................... 13
1.2.3. Bài toán phát hiện bóng ................................................................... 13
CHƢƠNG 2: CÁC PHƢƠNG PHÁP PHÁT HIỆN BÓNG ĐỐI TƢỢNG ... 15
2.1. Phƣơng pháp kết hợp mô hình suy giảm ba màu và cƣờng độ sáng. .... 15
2.1.1. Giới thiệu phƣơng pháp ................................................................... 15
2.1.2. Cơ sở lý thuyết ................................................................................ 15
2.1.3. Phƣơng pháp sử dụng mô hình suy giảm ba màu ........................... 19

2.1.4. Phƣơng pháp kết hợp mô hình suy giảm ba màu và cƣờng độ
sáng………………………………………………………………………...22
2.1.5. Ví dụ minh họa ................................................................................ 24
2.1.6. Kết luận ........................................................................................... 26
2.2. Phƣơng pháp sử dụng không gian màu YCbCr ..................................... 27
2.2.1. Giới thiệu phƣơng pháp ................................................................... 27


2.2.2. Cơ sở lý thuyết ................................................................................ 27
2.2.3. Không gian màu YCbCr .................................................................. 28
2.2.4. Thuật toán phát hiện bóng dựa trên không gian màu YCbCr ......... 29
2.2.5. Ví dụ minh họa ................................ Error! Bookmark not defined.
2.2.6. Kết luận ........................................................................................... 30
2.3. Phƣơng pháp phát hiện bóng sử dụng không gian màu LAB ............... 30
2.3.1. Giới thiệu phƣơng pháp ................................................................... 30
2.3.2. Cơ sở lý thuyết ................................................................................ 31
2.3.3. Không gian màu LAB ..................................................................... 31
2.3.4. Phƣơng pháp sử dụng không gian màu LAB .................................. 33
2.3.5. Ví dụ minh họa ................................................................................ 34
2.3.6. Kết luận ........................................................................................... 34
CHƢƠNG 3: CHƢƠNG TRÌNH THỬ NGHIỆM ......................................... 35
3.1. Bài toán phát hiện bóng ......................................................................... 35
3.2. Cơ sở lý thuyết ....................................................................................... 35
3.3. Giới thiệu về ngôn ngữ C# .................................................................... 35
3.4. Phƣơng pháp phát hiện bóng ................................................................. 37
3.5. Các bƣớc xử lý của chƣơng trình........................................................... 38
3.6. Thiết kế và cài đặt chƣơng trình ............................................................ 39
3.7. Một số kết quả chƣơng trình .................................................................. 42
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ...................................................... 44
TÀI LIỆU THAM KHẢO ............................................................................... 45



DANH MỤC HÌNH VẼ - BẢNG
Hình 1.1: Quá trình xử lý ảnh ........................................................................... 5
Hình 1.2: Các bƣớc cơ bản trong một hệ thống xử lý ảnh ................................ 6
Hình 1.3: Ảnh thu nhận và ảnh mong muốn ..................................................... 7
Hình 2.1: Các loại bóng trong ảnh .................................................................. 16
Hình 2.2: Sơ đồ phân loại bóng trong ảnh ...................................................... 16
Hình 2.3: Ảnh vỉa hè với các loại bóng khác nhau ......................................... 17
Bảng 2.1: Nguồn sáng và cƣờng độ của các vùng bóng ................................ 18
Hình 2.4: Hiện tƣợng tạo bóng với ảnh ngoài trời .......................................... 19
Hình 2.5: Bóng của đối tƣợng trong ảnh TAM ............................................... 21
Hình 2.6: Kết quả phát hiện bóng với các ngƣỡng T khác nhau..................... 25
Hình 2.7: Kết quả phát hiện bóng với các ngƣỡng T khác nhau..................... 26
Hình 2.8: Hình ảnh không gian màu YUV ..................................................... 28
Hình 2.9: Ảnh ban đầu và ảnh phát hiện bóng ................................................ 29
Hình 2.10: Ảnh ban đầu và ảnh phát hiện bóng .............................................. 30
Hình 2.11: Màu sắc của các kênh màu trong không gian màu LAB. ............. 32
Hình 2.12: Ảnh ban đầu và ảnh phát hiện bóng .............................................. 34
Hình 3.1: From main chính demo mô phỏng phƣơng pháp phát hiện bóng. .. 39
Hình 3.2: Hƣớng dẫn cài đặt ........................................................................... 39
Hình 3.3: Hƣớng dẫn cài đặt ........................................................................... 40
Hình 3.4: Hƣớng dẫn cài đặt ........................................................................... 40
Hình 3.5: Hƣớng dẫn cài đặt ........................................................................... 41
Hình 3.6: Hƣớng dẫn cài đặt ........................................................................... 41
Hình 3.7: Kết quả thu đƣợc của chƣơng trình................................................. 42
Hình 3.8: Kết quả thu đƣợc của chƣơng trình................................................. 43


MỞ ĐẦU

1. Lý do chọn đề tài
Ngày nay, Công nghệ Thông tin đã và đang đƣợc ứng dụng trong hầu
hết các lĩnh vực của đời sống, xã hội. Cùng với sự phát triển mạnh mẽ của
Công nghệ Thông tin việc trao đổi thông tin trở nên phổ biến. Trong trao đổi
thông tin, thông tin hình ảnh đóng vai trò vô cùng quan trọng. Hầu nhƣ trong
mọi ngành nghề, mọi lĩnh vực đều cần đến hình ảnh để mô tả hay diễn đạt
một vấn đề nào đó mà họ khó có thể diễn đạt bằng lời hoặc chữ viết. Vì vậy
trong những năm gần đây đã có sự kết hợp chặt chẽ giữa hình ảnh và đồ họa
trong lĩnh vực xử lý thông tin. Trong Công nghệ Thông tin, xử lý ảnh chiếm
một vị trí quan trọng bởi các ứng dụng đa dạng và phong phú của nó trong các
nghiên cứu khoa học và nhiều lĩnh vực khác trong thực tiễn. Ngoài ra, xử lý
ảnh cũng là bộ phận quan trọng trong việc trao đổi thông tin giữa ngƣời dùng
và máy tính. Từ đó, giúp ngƣời dùng và máy tính đƣa ra các quyết định một
cách nhanh chóng và chính xác nhất.
Trong thực tế, ảnh chứa rất nhiều đối tƣợng trong đó có những đối
tƣợng chính, những đối tƣợng phụ và những đối tƣợng có thể gây nhiễu trong
ảnh. Một trong những đối tƣợng gây nhiễu trong việc phát hiện thông tin
trong ảnh đó là bóng của đối tƣợng do yếu tố vật lý tự nhiên gây ra. Với
những ứng dụng rộng rãi của bóng trong các lĩnh vực nhƣ xử lý ảnh, giao
thông thông minh, theo dõi đối tƣợng,… Bóng và các phƣơng pháp phát hiện
bóng đã đƣợc nghiên cứu trong vài thập kỉ trở lại đây. Trên thế giới đã có
nhiều nghiên cứu về phát hiện bóng của đối tƣợng của nhiều tác giả có thể kể
đến nhƣ J. Tian và các cộng sự của ông [1] đã sử dụng kết hợp mô hình suy
giảm ba màu và cƣờng độ sáng để phát hiện vùng bóng.

1


Trong một nghiên cứu khác, C. Blajovici và các cộng sự của ông [2] đã
sử dụng không gian màu YCbCr để phát hiện bóng còn S. Murali và K.

Govidan [3] đã sử dụng không gian màu LAB để phát hiện bóng. Không
những vậy, phát hiện bóng của đối tƣợng còn đƣợc ứng dụng trong nhiều
nghiên cứu khác nhƣ là trong ảnh cảnh quan đô thị của T. Souza và các cộng
sự của ông [4] hay ứng dụng trong ảnh giao thông của M. Wang và các cộng
sự của ông [5]. Tuy trên thế giới đã có nhiều nghiên cứu về phát hiện bóng
của đối tƣợng qua ảnh và cũng đã đạt đƣợc những thành tựu nhất định nhƣng
ở Việt Nam hầu nhƣ rất hiếm những nghiên cứu về phát hiện bóng của đối
tƣợng qua ảnh. Xuất phát từ những lý do kể trên, em đã chọn đề tài: “Tìm
hiểu phƣơng pháp phát hiện bóng của một đối tƣợng qua ảnh. Viết
chƣơng trình minh họa” làm đề tài nghiên cứu. Do thời gian và vốn kiến
thức có hạn, đề tài không thể tránh khỏi những thiếu sót. Vì vậy, em mong
nhận đƣợc những đóng góp của thầy, cô giáo và các bạn để đề tài hoàn thiện
hơn.
2. Đối tƣợng và phạm vi nghiên cứu
 Đối tƣợng nghiên cứu
 Bóng của đối tƣợng trong ảnh.
 Các phƣơng pháp phát hiện bóng của đối tƣợng qua ảnh.
 Phạm vi nghiên cứu
Đề tài chủ yếu nghiên cứu bóng của đối tƣợng trong ảnh gây ra bởi các
yếu tố vật lý do nguồn sáng ngoài trời tạo ra. Ảnh đƣợc sử dụng trong đề tài
chủ yếu là ảnh có cấu trúc đơn giản.
 Mục tiêu của đề tài
 Nghiên cứu phƣơng pháp phát hiện bóng của đối tƣợng qua ảnh dựa
trên kết hợp mô hình suy giảm ba màu và cƣờng độ sáng.
 Nghiên cứu phƣơng pháp phát hiện bóng của đối tƣợng qua ảnh dựa
trên không gian màu YCbCr.
2


 Nghiên cứu phƣơng pháp phát hiện bóng của đối tƣợng qua ảnh dựa

trên không gian màu LAB.
 Dựa trên các nghiên cứu về cơ sở lý thuyết về bóng và phƣơng pháp
phát hiện bóng sử dụng kết hợp mô hình suy giảm ba màu và cƣờng độ
sáng để xây dựng chƣơng trình thử nghiệm phƣơng pháp phát hiện
bóng của đối tƣợng qua ảnh.
3. Phƣơng pháp nghiên cứu
Để thực hiện đề tài, khóa luận kết hợp mềm dẻo giữa hai phƣơng pháp:
 Phƣơng pháp nghiên cứu lý thuyết.
 Phƣơng pháp nghiên cứu thực nghiệm.
Các nghiên cứu lý thuyết vừa là cơ sở vừa là tiền đề cho các nghiên cứu
thực nghiệm. Các nghiên cứu thực nghiệm giúp làm sáng tỏ các nghiên cứu lý
thuyết. Dựa trên cơ sở lý thuyết các phƣơng pháp phát hiện bóng của đối
tƣợng qua ảnh, đặc biệt là phƣơng pháp phát hiện bóng sử dụng kết hợp mô
hình suy giảm ba màu và cƣờng độ sáng đã đƣợc em sử dụng để xây dựng
chƣơng trình thử nghiệm mô phỏng phƣơng pháp phát hiện bóng của đối
tƣợng qua ảnh.
4. Ý nghĩa thực tiễn của đề tài
Đề tài là cơ sở phục vụ cho các nghiên cứu khoa học có liên quan tới
bóng và loại bỏ bóng của đối tƣợng qua ảnh. Một trong những bƣớc không
thể bỏ qua trong các ứng dụng của xử lý ảnh nói chung và thị giác máy tính
nói riêng.
Các phƣơng pháp phát hiện bóng của đối tƣợng qua ảnh mà đề tài giới
thiệu cũng hết sức hữu ích cho hệ thống giao thông thông minh. Hệ thống
giao thông thông minh sẽ góp phần làm giảm ách tắc giao thông một vấn đề
cấp bách của nhiều nƣớc trên thế giới trong đó có Việt Nam.

3


Không những vậy, phát hiện bóng của đối tƣợng qua ảnh còn giúp phát

hiện ảnh giả mạo, các đối tƣợng giả mạo trong ảnh, nhận dạng khuôn mặt,
theo dõi đối tƣợng,… các ứng dụng này có thể giúp ích nhiều trong lĩnh vực
điều tra tội phạm.
5. Cấu trúc của khóa luận
Ngoài phần mục lục, mở đầu, kết luận, tài liệu tham khảo thì khóa luận
có các chƣơng sau:
Chƣơng 1: Khái quát về xử lý ảnh và bài toán phát hiện bóng.
Chƣơng 2: Các phƣơng pháp phát hiện bóng đối tƣợng.
Chƣơng 3: Chƣơng trình thử nghiệm.

4


CHƢƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN
PHÁT HIỆN BÓNG
1.1. Khái quát về xử lý ảnh
1.1.1. Xử lý ảnh là gì?
Con ngƣời thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất. Những năm trở lại đây cùng với sự phát triển của
phần cứng máy tính, xử lý ảnh cũng phát triển một cách mạnh mẽ và có nhiều
ứng dụng trong cuộc sống. Xử lý ảnh đóng một vai trò quan trọng trong tƣơng
tác giữa ngƣời dùng và máy tính.
Quá trình xử lý ảnh đƣợc xem nhƣ là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể làm cho ảnh “tốt hơn” hoặc tạo ra một kết luận mong muốn nào đó.
Ảnh
Ảnh

XỬ LÝ ẢNH


“Tốt hơn”
Kết luận

Hình 1.1: Quá trình xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem
nhƣ là đặc trƣng cƣờng độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó
của đối tƣợng trong không gian và nó có thể xem nhƣ một hàm n biến P(c1,
c2,..., cn). Do đó, ảnh trong xử lý ảnh có thể xem nhƣ ảnh n chiều.

5


Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Hệ quyết định
Thu nhận ảnh
(Scanner,
camera,sensor)

Tiền xử lý

Trích chọn
đặc điểm

Đối sánh rút

Hậu

ra kết luận

xử lý


Lƣu trữ

Hình 1.2: Các bƣớc cơ bản trong một hệ thống xử lý ảnh
1.1.2. Một số khái niệm trong xử lý ảnh
 Ảnh: Thông tin về vật thể hay quang cảnh đƣợc chiếu sáng mà con
ngƣời quan sát và cảm nhận đƣợc bằng mắt và hệ thống thần kinh thị
giác. Trong xử lý ảnh, ảnh là tập hợp các điểm ảnh (pixel).

 Điểm ảnh (pixel): Là một phần tử của ảnh số tại tọa độ (x,y) trong tọa
độ hai chiều với độ xám hoặc màu nhất định. Kích thƣớc và khoảng
cách giữa các điểm ảnh đó đƣợc chọn sao cho thích hợp sao cho mắt
ngƣời cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của
ảnh số gần nhƣ ảnh thật. Điểm ảnh đƣợc xem nhƣ là dấu hiệu hay
cƣờng độ sáng tại 1 toạ độ trong không gian của đối tƣợng.
 Mức xám của điểm ảnh là cƣờng độ sáng của nó đƣợc gán bằng giá trị
số tại điểm đó. Các thang giá trị mức xám thông thƣờng: 16, 32, 64,
128, 256 (Mức 265 là mức phổ dụng. Do từ kỹ thuật máy tính dùng 1
byte (8 bit) để biểu diễn mức xám. Mức xám dùng 1 byte biểu diễn 28
=256 mức, tức là từ 0 đến 255).
 Ảnh nhị phân: Ảnh chỉ có hai mức đen trắng phân biệt tức là dùng 1 bit
mô tả 21 mức khác nhau. Hay mỗi điểm ảnh nhị phân chỉ có thể là 0
hoặc 1.
 Ảnh màu: Trong khuôn khổ lý thuyết ba màu (Red, Green, Blue) để tạo
nên thế giới màu, ngƣời ta thƣờng dùng 3 byte để mô tả thế giới màu,
khi đó các giá trị màu là: 28*3 = 224 ≈ 16,7 triệu màu.
6


 Thị giác máy tính (computer vision): Là phƣơng pháp sử dụng camera

hoặc scanner để thu nhận hình ảnh thực tế sau đó sử dụng máy tính để
tự động phân tích ảnh. Thị giác máy tính thƣờng đƣợc sử dụng để nhận
biết các đối tƣợng và mô tả cảnh vật hoặc tiến hành điều khiển hệ thống
theo một số yêu cầu nào đó.
 Ngƣỡng: Là phƣơng pháp đơn giản nhất trong phân đoạn ảnh. Từ ảnh
đa cấp xám, ngƣỡng có thể sử dụng để tạo ra ảnh nhị phân.
 Ảnh đơn: Có thể hiểu là ảnh cấu trúc đơn giản. Ảnh đơn dùng để phân
biệt với ảnh phức tạp (ảnh đa cấu trúc).
1.1.3. Nắn chỉnh biến dạng
Ảnh thu nhận thƣờng bị biến dạng do các thiết bị quang học và điện tử.

Ảnh thu nhận

Ảnh mong muốn

Hình 1.3: Ảnh thu nhận và ảnh mong muốn
Để khắc phục ngƣời ta sử dụng các phép chiếu, các phép chiếu thƣờng
đƣợc xây dựng trên tập các điểm điều khiển.
Giả sử (Pi, Pi’) i = 1, n có n các tập điều khiển. Tìm hàm f: Pi → f (Pi’)
sao cho:
n


i 1

2

f ( Pi )  Pi

'


 min

7


Giả sử ảnh bị biến đổi chỉ bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc
nhất tuyến tính. Khi đó hàm f có dạng:
f (x, y) = (a1x + b1y + c1, a2x + b2y + c2)
Ta có:
2
2
    f  Pi   Pi     a1 xi  b1 y1  c1  xi'    a2 xi  b2 yi  c2  yi'  

i 1
i 1 
n

n

'

Để cho φ → min
 
0


a
 1
 

0


b
 1
 
0

 c1

n
n
n
 n
2
'
  a1 x1   b1 xi yi   c1 xi   xi xi
i 1
i 1
i 1
 i 1
n
n
n
n

2
'
a
x

y

b
y

c
y

 1 i i  1 1  1 i  yi xi
i 1
i 1
i 1
 i 1
n
n
n

a1 xi   b1 yi  nc1   xi'


i 1
i 1
i 1


Giải hệ phƣơng trình tuyến tính tìm đƣợc a1, b1, c1. Tƣơng tự tìm đƣợc
a2, b2, c2. Qua đó xác định đƣợc hàm f.
1.1.4. Khử nhiễu và chỉnh mức xám
 Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:

 Nhiễu hệ thống: Là nhiễu có quy luật có thể khử bằng các phép
biến đổi.
 Nhiễu ngẫu nhiên: Vết bẩn không rõ nguyên nhân có thể khắc
phục bằng các phép lọc.
 Chỉnh mức xám
Chỉnh mức xám nhằm khắc phục tính không đồng đều của hệ thống gây
ra.

8


Thông thƣờng có 2 hƣớng tiếp cận:
1. Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần
nhau thành một bó. Trƣờng hợp chỉ có 2 mức xám thì chính là
chuyển về ảnh đen trắng. Ứng dụng: In ảnh màu ra máy in đen
trắng.
2. Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian
bằng kỹ thuật nội suy. Kỹ thuật này nhằm tăng cƣờng độ mịn cho
ảnh.
1.1.5. Trích chọn đặc điểm
Các đặc điểm của đối tƣợng đƣợc trích chọn tuỳ theo mục đích nhận
dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau
đây:
 Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn,…
 Đặc điểm biến đổi: Các đặc điểm loại này đƣợc trích chọn bằng việc
thực hiện lọc vùng (zonal filtering). Các bộ vùng đƣợc gọi là “mặt nạ
đặc điểm” (feature mask) thƣờng là các khe hẹp với hình dạng khác
nhau (chữ nhật, tam giác, cung tròn,…).
 Đặc điểm biên và đƣờng biên: Đặc trƣng cho đƣờng biên của đối tƣợng

và do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến đƣợc
dùng khi nhận dạng đối tƣợng. Các đặc điểm này có thể đƣợc trích
chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử
“chéo không” (zero crossing),… Việc trích chọn hiệu quả các đặc điểm
giúp cho việc nhận dạng các đối tƣợng ảnh chính xác, với tốc độ tính
toán cao và dung lƣợng nhớ lƣu trữ giảm xuống.
1.1.6. Nhận dạng
Nhận dạng tự động (automatic recognition): Mô tả đối tƣợng, phân loại
và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy tính.
9


Nó đƣợc ứng dụng trong nhiều ngành khoa học khác nhau. Tuy nhiên,
một câu hỏi đặt ra là: Mẫu (pattern) là gì?
Watanabe là một trong những ngƣời đi đầu trong lĩnh vực này đã định
nghĩa: Ngƣợc lại với hỗn loạn (chaos), mẫu là một thực thể (entity), đƣợc xác
định một cách ang áng (vaguely defined) và có thể gán cho nó một tên gọi nào
đó”. Ví dụ: Mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó đƣợc chụp,
một chữ viết, khuôn mặt ngƣời hoặc một ký đồ tín hiệu tiếng nói. Khi biết
một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể:
Hoặc phân loại có mẫu (supervised classification) chẳng hạn phân tích
phân biệt (discriminant analysis) trong đó mẫu đầu vào đƣợc định danh nhƣ
một thành phần của một lớp đã xác định.
Hoặc phân loại không có mẫu (unsupervised classification hay
clustering) trong đó các mẫu đƣợc gán vào các lớp khác nhau dựa trên một
tiêu chuẩn đồng dạng nào đó. Các lớp này cho đến thời điểm phân loại vẫn
chƣa biết hay chƣa đƣợc định danh.
Hệ thống nhận dạng tự động bao gồm ba khâu tƣơng ứng với ba giai
đoạn chủ yếu sau đây:
1. Thu nhận dữ liệu và tiền xử lý.

2. Biểu diễn dữ liệu.
3. Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1. Đối sánh mẫu dựa trên các đặc trƣng đƣợc trích chọn.
2. Phân loại thống kê.
3. Đối sánh cấu trúc.
4. Phân loại dựa trên mạng nơ-ron nhân tạo.

10


Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận
đơn lẻ để phân loại “tối ƣu” do vậy cần sử dụng cùng một lúc nhiều phƣơng
pháp và cách tiếp cận khác nhau. Do vậy, các phƣơng thức phân loại tổ hợp
hay đƣợc sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng
dựa trên thiết kế các hệ thống lai (hybrid system) bao gồm nhiều mô hình kết
hợp.
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới và nảy
sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải mà còn
đặt ra những yêu cầu về tốc độ tính toán. Đặc điểm chung của tất cả những
ứng dụng đó là những đặc điểm đặc trƣng cần thiết thƣờng là nhiều, không
thể do chuyên gia đề xuất, mà phải đƣợc trích chọn dựa trên các thủ tục phân
tích dữ liệu.
1.1.7. Nén ảnh
Nhằm giảm thiểu không gian lƣu trữ, nén ảnh thƣờng đƣợc tiến hành
theo cả hai cách khuynh hƣớng là: nén có bảo toàn và nén không bảo toàn
thông tin. Nén không bảo toàn thì thƣờng có khả năng nén cao hơn nhƣng khả
năng phục hồi thì kém hơn. Trên cơ sở hai khuynh hƣớng có 4 cách tiếp cận
cơ bản trong nén ảnh:
1. Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất

xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lƣợc mã
hóa thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF.
2. Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các
điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các
điểm ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén
*.PCX.
3. Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hƣớng
nén không bảo toàn và do vậy kỹ thuật này hiệu quả hơn. *.JPG chính
là tiếp cận theo kỹ thuật nén này.
11


4. Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tƣợng ảnh, thể
hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lƣu
trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
1.2. Bài toán phát hiện bóng
1.2.1. Hƣớng ánh sáng là gì?
Ánh sáng là hiện tƣợng tự nhiên rất phổ biến trong cuộc sống hàng
ngày. Bỏ qua các khái niệm liên quan tới bản chất vật lý, ánh sáng đƣợc tạo ra
bởi các nguồn sáng. Để nhìn thấy bất cứ vật gì thì nó cần phải đƣợc chiếu
sáng bởi các nguồn sáng. Do vậy, xuất hiện khái niệm hƣớng ánh sáng.
Hƣớng ánh sáng có thể định nghĩa là chiều mà nguồn sáng chiếu tới đối
tƣợng. Ví dụ: Ngoài trời nguồn sáng chính là mặt trời, khi ánh sáng mặt trời
chiếu xuống đối tƣợng thì hƣớng ánh sáng chính là hƣớng mà mặt trời chiếu
lên bề mặt đối tƣợng. Tƣơng tự, trong nhà với nguồn sáng là bóng đèn điện
hoặc nến.
Do hƣớng ánh sáng phụ thuộc vào nguồn sáng nên trong môi trƣờng
bình thƣờng có thể chứa nhiều nguồn sáng (có thể là sơ cấp hoặc thứ cấp) với
nhiều cƣờng độ khác nhau. Vậy nên sẽ tồn tại nhiều hƣớng ánh sáng khác
nhau trong môi trƣờng đó.

Trong thị giác máy tính, hƣớng ánh sáng là một vấn đề rất quan trọng.
Dựa vào hƣớng ánh sáng có thể quyết định đƣợc nhiều vấn đề liên quan tới
ảnh.
Ví dụ: Tính toán đƣợc khoảng cách giữa các đối tƣợng ta có thể xác
định đƣợc vùng bóng. Tính toán đƣợc thời gian đối với ảnh ngoài trời dựa vào
góc sáng qua đó có thể phát hiện ảnh giả mạo và các đối tƣợng giả mạo trong
ảnh. Tƣơng tự nhƣ vậy, dựa vào hƣớng ánh ta có thể mô phỏng chi tiết các
hiện tƣợng thực tế, tạo ra các đối tƣợng giả mạo trong ảnh,…

12


1.2.2. Bóng là gì?
Bóng là một hiện tƣợng vật lý phổ biến trong tự nhiên. Nó xuất hiện
dựa trên các nguồn sáng sơ cấp và thứ cấp. Khi ánh sáng chiếu đến một đối
tƣợng, phần đối diện với nguồn sáng xuất hiện các vùng ánh sáng với cƣờng
độ thấp hơn so với các vùng xung quanh theo hình dạng của đối tƣợng hoặc bị
biến dạng tùy theo góc độ và hƣớng ánh sáng. Bóng có thể có nhiều cƣờng
độ, nhiều hình dạng và có thể bị chồng lấn từ nhiều đối tƣợng khác nhau.
Trong thị giác máy tính, chúng ta có thể chia thành hai loại bóng khác
nhau:
1. Bóng ngoài trời đƣợc chiếu bởi các nguồn sáng sơ cấp là ánh sáng mặt
trời.
2. Bóng trong nhà đƣợc chiếu bởi nguồn sáng là đèn điện, lửa, nến,…
1.2.3. Bài toán phát hiện bóng
Trong thị giác máy tính, bóng của đối tƣợng tham gia vào rất nhiều ứng
dụng nhƣ giám sát giao thông, nhận dạng khuôn mặt, phát hiện đối tƣợng,
đếm đối tƣợng. Nhƣng đôi khi chính bóng lại gây nhiễu do vậy làm giảm chất
lƣợng ảnh. Vì vậy, phát hiện và loại bỏ bóng là một giai đoạn tiền xử lý quan
trọng trong các ứng dụng của thị giác máy tính. Trong hoàn cảnh đó, bài toán

phát hiện bóng của đối tƣợng qua ảnh ra đời.
Bài toán phát hiện bóng của đối tƣợng đƣợc phát biểu ngắn gọn: qua
các phƣơng pháp xử lý ảnh đầu vào đƣợc biến đổi thành ảnh đầu ra với vùng
bóng đƣợc xác định.
Với:
 Ảnh đầu vào: Ảnh màu chụp đối tƣợng hoặc bóng đối tƣợng đƣợc
chiếu sáng bởi các nguồn sáng. Ảnh này có thể là cảnh giao thông
đô thị hay các đối tƣợng nhƣ là đồ vật, con ngƣời, cây cỏ,…

13


 Ảnh đầu ra: Ảnh ban đầu của đối tƣợng sau khi xử lý chứa các vùng
bóng đƣợc xác định.
Nhƣng bài toán phát hiện bóng của đối tƣợng còn gặp nhiều khó khăn
có thể kể đến nhƣ:
 Thứ nhất từ các nguồn sáng có cƣờng độ và vị trí khác nhau sẽ cho
nhiều loại bóng khác nhau.
 Thứ hai từ nguồn sáng sơ cấp có thể xuất hiện các nguồn sáng thứ
cấp, từ đó bóng các đối tƣợng có thể chồng lên nhau hoặc giao nhau
tạo nên các vùng bóng khác nhau.
 Thứ ba bóng của đối tƣợng thƣờng có màu xám, cƣờng độ và màu
sắc các đối tƣợng bị bao phủ bởi bóng thƣờng nhỏ hơn so với bình
thƣờng và bóng thƣờng dễ bị nhầm với các đối tƣợng tối khác.

14


CHƢƠNG 2: CÁC PHƢƠNG PHÁP PHÁT HIỆN BÓNG ĐỐI TƢỢNG
2.1. Phƣơng pháp kết hợp mô hình suy giảm ba màu và cƣờng độ sáng.

2.1.1. Giới thiệu phƣơng pháp
Phƣơng pháp phát hiện bóng của đối tƣợng sử dụng kết hợp mô hình suy
giảm ba màu và cƣờng độ sáng đƣợc giới thiệu vào năm 2012 bởi ba tác giả:
1. Jiandong Tian, State Key Laboratory of Robotics, Shenyang Institute
of Automation, Chinese of Academy of Sciences, Nanta Road,
Shenyang, China.
2. Linlin Zhu, State Key Laboratory of Robotics, Shenyang Institute of
Automation, Chinese of Academy of Sciences, Nanta Road,
Shenyang, China.
3. Yandong Tang, State Key Laboratory of Robotics, Shenyang Institute
of Automation, Chinese of Academy of Sciences, Nanta Road,
Shenyang, China.
Phƣơng pháp này đƣợc giới thiệu với tên đầy đủ là: “Outdoor Shadow
detection by combining tricolor attenuation and intensity” [1].
2.1.2. Cơ sở lý thuyết
Phát hiện bóng của đối tƣợng qua ảnh là giai đoạn tiền xử lý cho một
loạt các ứng dụng trong thị giác máy tính, nhận dạng mẫu và xử lý ảnh.
Bóng có thể chia làm hai loại:
1. Tự bóng (self shadow).
2. Đổ bóng (cast shadow).

15


Hình 2.1: Các loại bóng trong ảnh
Với:
 Umbra: Vùng bóng tối
 Penumbra: Vùng bóng nửa tối.
Dựa vào đặc điểm các loại bóng trong ảnh ta có thể phân loại nhƣ sau:
Shadow


Cast Shadow

Self Shadow

Umbra

Penumbra

Hình 2.2: Sơ đồ phân loại bóng trong ảnh

16


Tự bóng (self shadow) là một phần của đối tƣợng mà không đƣợc chiếu
sáng bởi ánh sáng trực tiếp. Đổ bóng (cast shadow) là vùng bóng của đối
tƣợng tạo trên bề mặt các đối tƣợng khác. Đổ bóng lại có thể chia ra thành
vùng bóng tối (umbra) và vùng bóng nửa tối (penumbra).
Vùng bóng tối là một phần của đổ bóng nơi ánh sáng trực tiếp bị chặn
hoàn toàn bởi đối tƣợng. Vùng bóng nửa tối là một phần của đổ bóng nơi ánh
sáng trực tiếp bị chặn một phần bởi đối tƣợng.

Hình 2.3: Ảnh vỉa hè với các loại bóng khác nhau
Với:
 Vòng tròn đỏ biểu thị cho vùng tự bóng.
 Vòng tròn xanh nhạt biểu thị cây là vùng đổ bóng.
 Vòng tròn xanh đậm biểu thị vùng bóng tối.


Vòng tròn vàng biểu thị vùng bóng nửa tối.

Ánh sáng bầu trời là một phần của ánh sáng ban ngày nên cƣờng độ

điểm ảnh trong bóng là thấp hơn so với nền không có bóng tức là có tồn tại
suy giảm về cƣờng độ.
17


Để thấy rõ cƣờng độ của các nguồn sáng ta có thể xem bảng 2.1:
Lighr source

Intensity

Nonshadow region

Daylight

High

Penumbra

Part sunlight + skylight

Middle

Umbra

Skylight

Low


Bảng 2.1: Nguồn sáng và cƣờng độ của các vùng bóng
Với:
 Nonshadow region: vùng không phải bóng.
 Penumbra: vùng bóng nửa tối.
 Umbra: vùng bóng tối.
 Light source: nguồn sáng.
 Daylight: ánh sáng ban ngày.
 Part sunlight + skylight: phần ánh sáng mặt trời và ánh sáng mặt trời
khuếch tán.
 Skylight: ánh sáng bầu trời khuếch tán.
 Intensity: cƣờng độ.
 High: cao.
 Middle: trung bình.
 Low: thấp.

18


×