Tải bản đầy đủ (.pdf) (72 trang)

(Luận văn thạc sĩ) kỹ thuật tìm kiếm ảnh trên cơ sở biểu đồ màu mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.46 MB, 72 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG

TRẦN QUỐC BẢO

KỸ THUẬT TÌM KIẾM ẢNH TRÊN CƠ SỞ BIỂU ĐỒ MÀU MỜ

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên, tháng 6 năm 2018


ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG

TRẦN QUỐC BẢO

KỸ THUẬT TÌM KIẾM ẢNH TRÊN CƠ SỞ BIỂU ĐỒ MÀU MỜ
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 8480101

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS. Đặng Văn Đức

Thái Nguyên, tháng 6 năm 2018


i


LỜI CAM ĐOAN
Tôi xin cam đoan luận văn với tên đề tài “Kỹ thuật tìm kiếm ảnh trên
cơ sở biểu đồ màu mờ” là kết quả nghiên cứu của bản thân học viên, dựa trên
nghiên cứu và thu thập cơ sở dữ liệu thực tiễn dưới sự hướng dẫn khoa học
của PGS. TS. Đặng Văn Đức. Các số liệu, kết quả nêu trong luận văn là hoàn
toàn trung thực, những tư liệu được sử dụng trong luận văn có nguồn gốc và
trích dẫn rõ ràng, đầy đủ.
Người cam đoan

Trần Quốc Bảo


ii

LỜI CẢM ƠN
Trong suốt thời gian hoàn thành luận văn nghiên cứu, tơi ln nhận
được giúp đỡ tận tình của thầy giáo hướng dẫn. Nhân dịp này, tôi xin gửi lời
cảm ơn và lòng biết ơn sâu sắc nhất tới PGS. TS. Đặng Văn Đức về những chỉ
dẫn khoa học, những góp ý q báu và tận tình hướng dẫn tơi trong suốt q
trình thực hiện luận văn tốt nghiệp.
Tơi xin chân thành cảm ơn tập thể các Thầy, Cô giáo trong trường Đại
học Công nghệ thông tin và Truyền thơng đã ln nhiệt tình quan tâm, giúp
đỡ và tạo mọi điều kiện tốt nhất cho tôi trong suốt quá trình học tập tại
trường.
Xin chân thành cảm ơn tới tập thể các thầy cô và các bạn đồng nghiệp
tại trường Cao đẳng Y tế Thái Bình nơi tơi đang cơng tác, đã luôn cổ vũ, động
viên và tạo mọi điều kiện thuận lợi để tơi hồn thành luận văn của mình.
Cuối cùng, tơi muốn bày tỏ lịng cảm ơn vơ hạn tới bạn bè, tới những
người thân yêu luôn bên tơi. Xin bày tỏ lịng cảm ơn sâu sắc tới bố mẹ, vợ,
con và những người thân trong gia đình đã là điểm tựa tinh thần lẫn vật chất

cho tôi trong những lúc khó khăn, ln bên cạnh và động viên tơi trong suốt
q trình thực hiện luận văn tốt nghiệp.
Xin trân trọng cảm ơn tất cả sự giúp đỡ quý báu đó !
Sinh viên

Trần Quốc Bảo


iii

MỤC LỤC
LỜI CAM ĐOAN ....................................................................................................... i
LỜI CẢM ƠN ............................................................................................................ ii
MỤC LỤC ................................................................................................................. iii
DANH MỤC KÝ HIỆU, CHỮ VIẾT TẮT ................................................................v
DANH MỤC HÌNH ................................................................................................. vii
PHẦN MỞ ĐẦU .........................................................................................................1
CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH..............................3
THEO NỘI DUNG .....................................................................................................3
1.1. Kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung .............................3
1.2. Các đặc trưng sử dụng trong tìm kiếm ảnh theo nội dung...............................4
1.2.1. Đặc trưng màu sắc: ...................................................................................5
1.2.2. Đặc trưng kết cấu ......................................................................................9
1.2.3. Đặc trưng hình dạng ...............................................................................10
1.2.4. Biểu đồ màu (Color Histogram) .............................................................11
1.3. Khả năng ứng dụng của hệ thống tìm kiếm ảnh theo nội dung .....................12
1.3.1. Hệ thống QBIC (Query By Image Content) ...........................................12
1.3.2. Hệ thống WebSEEK và VisualSEEK ....................................................12
1.3.3. ImageRover WWW Search Engine ........................................................13
1.4. Khái quát về logic mờ ....................................................................................14

1.4.1. Mở đầu ....................................................................................................14
1.4.2. Khái niệm tập hợp mờ ............................................................................14
1.4.3. Đặc trưng trên tập mờ .............................................................................15
1.4.4. Các phép toán trên tập mờ ......................................................................15
1.4.5. Các kiểu hàm thuộc của tập mờ..............................................................17
1.5. Kết luận chương .............................................................................................20
CHƯƠNG 2: TÌM KIẾM ẢNH THEO NỘI DUNG TRÊN CƠ SỞ BIỂU ĐỒ MÀU
MỜ ............................................................................................................................21
2.1. Đo khoảng cách giữa các biểu đồ màu ..........................................................21
2.1.1. Độ đo khoảng cách Minkowski (Lp) ......................................................21
2.1.2. Độ đo khoảng cách toàn phương (Quaratic) ..........................................22


iv

2.1.3. Độ đo khoảng cách biểu đồ giao nhau (Histogram Intersection Distance)
..........................................................................................................................23
2.2. Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu thơng thường ..............23
2.3. Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu mờ ..............................29
2.3.1. Định nghĩa biểu đồ màu mờ (FCH) ........................................................29
2.3.2. Tính toán FCH và độ đo khoảng cách ....................................................29
2.4. Tổng kết chương ............................................................................................39
CHƯƠNG 3: THỬ NGHIỆM ...................................................................................40
3.1. Giới thiệu bài toán thử nghiệm ......................................................................40
3.2. Dữ liệu thử nghiệm ........................................................................................40
3.3. Mô tả hệ thống thử nghiệm ............................................................................41
3.3.1. Xây dựng CSDL đặc trưng .....................................................................41
3.3.2. Chức năng tìm kiếm ảnh.........................................................................42
3.4. Mơi trường và cơng cụ sử dụng xây dựng thử nghiệm..................................42
3.5. Thiết kế chương trình thử nghiệm .................................................................43

3.5.1. Chức năng xây dựng CSDL đặc trưng ...................................................44
3.5.2. Xây dựng chức năng tìm kiếm ảnh trên cơ sở CCH theo RGB hoặc HSV
và FCH ..............................................................................................................46
3.5.3. Thiết kế giao diện của chương trình thử nghiệm....................................47
3.6. Đánh giá kết quả thử nghiệm .........................................................................48
3.6.1. Đo lường hiệu suất trong hệ thống tìm kiếm ảnh ...................................48
3.6.2. Kết quả thử nghiệm ................................................................................49
KẾT LUẬN ...............................................................................................................58
TÀI LIỆU THAM KHẢO .........................................................................................60
PHỤ LỤC 1 ...............................................................................................................61


v

DANH MỤC KÝ HIỆU, CHỮ VIẾT TẮT
STT

Từ viết
tắt

1

CBIR

2

CCH

3


CIE

4

CIELAB

5

CMY

6
7

CSDL
FCH

8

FCM

9
10

GIS
HSV

11

IBM


12

JPEG

13

L*a*b*

14

MF

15

QBIC

16
17

RGB
WWW

18

YCbCr

19

YUV


Từ viết đầy đủ

Diễn giải

Tìm kiếm ảnh dựa theo
nội dung
Biểu đồ màu thơng
Conventional Color Histogram
thường
Commission Internationale de Ủy ban Quốc tế về màu
l’Eclairage
sắc
Commission Internationale de Không gian màu đồng
l’Eclairage L-*a-*b color space
nhất CIELAB
Cyan-Magenta-Yellow
color
Không gian màu CMY
space
Cơ sở dữ liệu
Fuzzy Color Histogram
Biểu đồ màu mờ
Thuật toán phân cụm mờ
Fuzzy C – Mean
C - Mean
Geographic Information System
Hệ thống thông tin địa lý
Hue-Saturation-Value color space Không gian màu HSV
Tập đồn máy tính quốc
International Business Machines

tế IBM
Định dạng hình ảnh
Joint Photographic Experts Group
JPEG
Khơng gian màu đồng
L*a*b* color space
nhất L*a*b*
Hàm thành viên hay hàm
Membership Functions
thuộc
Truy vấn ảnh dựa trên nội
Query By Image Content
dung
Red-Green-Blue color space
Không gian màu RGB
World Wide Web
Mạng tồn cầu
Y-Luma
(Brighness
hay
Luminance); CbCr - Chroma Blue Khơng gian màu YCbCr
và Chroma Red color space
Y- Luminance; UV-chrominance
Không gian màu YUV
channels
Content Based Image Retrieval


vi


DANH MỤC HÌNH
Bảng 3.1 Kết quả thử nghiệm độ chính xác với ảnh xe bus và một số ảnh khác
nhau đã thêm 15% nhiễu gaussian và thay đổi độ sáng 15% ......................... 53
Bảng 3.2 Một số kết quả thử nghiệm trên CSDL ảnh WANG ....................... 54
Bảng 3.3 Một số kết quả thử nghiệm trên CSDL ảnh y tế .............................. 56


vii

DANH MỤC HÌNH
Hình 1.1 Kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung ..........................3
Hình 1.2 Cảm nhận màu từ quá trình xử lý thị giác [1] ..............................................5
Hình 1.3 Dải tần quang phổ điện từ [1] ......................................................................5
Hình 1.4 Khơng gian màu RGB [1] ............................................................................6
Hình 1.5 Khơng gian màu HSV ..................................................................................7
Hình 1.6 Khơng gian màu L*a*b ................................................................................8
Hình 1.7 Đặc trưng kết cấu .........................................................................................9
Hình 1.8 Đặc trưng hình dạng ...................................................................................10
Hình 1.9 Mơ tả biểu đồ màu của ảnh ........................................................................11
Hình 1.10 Giao của hai tập mờ .................................................................................16
Hình 1.11 Hợp của hai tập mờ ..................................................................................16
Hình 1.12 Phần bù của một tập mờ ...........................................................................17
Hình 1.13 Các tập mờ tam giác .................................................................................17
Hình 1.14 Các tập mờ hình thang .............................................................................18
Hình 1.15 Tập mờ L ..................................................................................................18
Hình 1.16 Tập mờ Gamma tuyến tính ......................................................................19
Hình 1.17 Tập mờ Singleton .....................................................................................19
Hình 2.1 Độ đo khoảng cách Minkowski [6] ............................................................22
Hình 2.2 Độ đo khoảng cách Quaratic [6] ................................................................22
Hình 2.3 Sơ đồ khối hệ thống tìm kiếm ảnh sử dụng CCH trong .............................24

khơng gian màu RGB hoặc HSV ..............................................................................24
Hình 2.4 Biểu đồ CCH trong không gian màu RGB của ảnh truy vấn .....................25
Hình 2.5 Minh họa hai ảnh khác nhau có cùng biểu đồ màu CCH...........................27
trong RGB sử dụng 8 bin màu (23) ...........................................................................27
Hình 2.6 Tính tốn và so sánh biểu đồ màu cục bộ của hình ảnh (A, B) .................28
Hình 2.7 Sơ đồ thủ tục tính tốn FCH (n’=163 = 4096) ............................................30
Hình 2.8 Sơ đồ khối hệ thống suy luận mờ ...............................................................34
Hình 2.9 Hàm thành viên của L*,a* và b* [6] ..........................................................35
Hình 2.10 Hàm thành viên mờ đầu ra của hệ thống [6] ............................................36
Hình 2.11 Cấu trúc của biểu đồ màu mờ ..................................................................36


viii

Hình 2.12 Hệ thống suy luận mờ tạo ra biểu đồ màu mờ .........................................37
Hình 2.13 Biểu đồ FCH - 1D tạo ra từ hệ thống liên kết mờ của ảnh truy vấn gồm
10 bin màu. ................................................................................................................37
Hình 3.1 Kiến trúc hệ thống tìm kiếm ảnh theo nội dung trong luận văn ................43
Hình 3.2 Biểu đồ hoạt động của chức năng xây dựng CSDL đặc trưng CCH .........45
trong không gian màu RGB, HSV ............................................................................45
Hình 3.3 Biểu đồ hoạt động chức năng xây dựng CSDL đặc trưng .........................45
FCH trong không gian màu L*a*b* .........................................................................45
Hình 3.4 Biểu đồ hoạt động chức năng tìm kiếm ảnh trên cơ sở CCH theo RGB
hoặc HSV ..................................................................................................................46
Hình 3.5 Biểu đồ hoạt động của chức năng tìm kiếm ảnh trên cơ sở FCH ..............47
Hình 3.6 Giao diện chính của chương trình thử nghiệm...........................................48
Hình 3.7 Giao diện tìm kiếm và hiển thị ảnh kết quả của chương trình ...................48
Hình 3.8 Biểu đồ màu CCH và FCH của ảnh bus 340.jpg và ảnh đã thêm 15%
nhiễu gaussian ...........................................................................................................50
Hình 3.9 Biểu đồ màu CCH và FCH của ảnh xe bus 340.jpg...................................51

và ảnh đã thay đổi độ sáng 15% ................................................................................51
Hình 3.10 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với FCH.........................52
Hình 3.11 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trong RGB .....52
Hình 3.12 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trong HSV ......53


1

PHẦN MỞ ĐẦU
Trong những năm gần đây, với sự tiến bộ trong cơng nghệ máy tính và
viễn thơng hiện đại đã dẫn đến việc lưu trữ dữ liệu đa phương tiện rất lớn
trong các lĩnh vực. Hình ảnh đóng một vai trị rất quan trọng trong bất kỳ hệ
thống thơng tin trực quan và đa phương tiện nào. Hình ảnh là một đại diện
trực quan của một đối tượng hoặc cảnh hoặc người hoặc trừu tượng. Bộ sưu
tập hình ảnh đang tăng lên nhanh chóng với sự đa dạng các thiết bị chụp ảnh
khác nhau như máy ảnh điện thoại, máy quét, máy ảnh kỹ thuật số, máy ảnh
di động và việc tăng cường sử dụng dữ liệu đa phương tiện trên Internet. Vì
vậy, nhu cầu tìm kiếm ảnh phục vụ cho công việc là một nhu cầu tất yếu.
Hiện tại, tìm kiếm ảnh dựa trên nội dung ứng dụng trong nhiều lĩnh vực như
quản lý nhãn hiệu logo, truy bắt tội phạm, ứng dụng trong y khoa, quân sự…
bởi vì nó mang tính trực quan cao cho người sử dụng.
Tìm kiếm ảnh dựa theo nội dung (Content Based Image Retrieval CBIR) là tập hợp các kỹ thuật tìm kiếm hình ảnh mong muốn từ một bộ sưu
tập hình ảnh lớn dựa trên các đặc trưng của ảnh (chẳng hạn như màu sắc, kết
cấu và hình dạng) có thể được tự động trích xuất từ hình ảnh [4]. Kỹ thuật hay
được sử dụng nhất trong CBIR là dựa trên cơ sở biểu đồ màu [1].

Ví dụ biểu đồ màu của một bức ảnh

Luận văn thạc sĩ – Trần Quốc Bảo



2

Biểu đồ màu thông thường (Conventional Color Histogram - CCH) của
một hình ảnh biểu thị tần suất xuất hiện của mọi màu trong một hình ảnh.
CCH khơng xem xét độ tương đồng màu giữa các bin màu, hai màu lân cận
nhưng ở hai bin màu khác nhau trong cùng dải màu thì màu khác nhau hồn
tồn. Do đó, nó nhạy cảm với nhiễu và sự thay đổi độ sáng của hình ảnh
[1],[5]. Hơn nữa, số chiều hoặc số bin màu của biểu đồ lớn của CCH u cầu
tính tốn lớn khi so sánh biểu đồ. Vì vậy đề tài “Kỹ thuật tìm kiếm ảnh trên
cơ sở biểu đồ màu mờ” tập trung trình bày kỹ thuật tìm kiếm ảnh trên một
biểu đồ màu mới, được gọi là biểu đồ màu mờ (Fuzzy Color Histogram FCH), ứng dụng các thuật toán, hàm tập mờ [1],[5-8]. Các phương pháp này
sẽ giúp loại bỏ những phép tính lớn khơng cần thiết, FCH mạnh mẽ với nhiễu
và sự thay đổi độ sáng mang lại độ chính xác hơn CCH và kết quả thực
nghiệm sẽ cho thấy hiệu quả của việc tìm kiếm ảnh, nhất là trên CSDL ảnh
lớn.
Ngoài phần mở đầu giới thiệu các vấn đề liên quan đến bài toán cần
giải quyết, phần kết luận chỉ ra các kết quả chính đạt được và hướng phát triển
tiếp theo của luận văn, nội dung luận văn bao gồm ba chương chính như sau:
Chương 1: Tổng quan về hệ thống tìm kiếm ảnh theo nội dung
Trình bày kiến trúc tổng quan, các đặc trưng của ảnh sử dụng trong việc
tìm kiếm, khả năng ứng dụng của hệ thống tìm kiếm ảnh theo nội dung. Trình
bày khái quát về logic mờ, tập mờ, các phép toán tập mờ.
Chương 2. Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu mờ
Trình bày các kỹ thuật tìm kiếm ảnh dựa trên biểu đồ màu thơng
thường, biểu đồ màu mờ.
Chương 3. Thử nghiệm
Nêu bài toán thử nghiệm, mơ tả và thiết kế chương trình thử nghiệm.

Luận văn thạc sĩ – Trần Quốc Bảo



3

CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH
THEO NỘI DUNG
1.1. Kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung
CBIR là phương pháp tìm kiếm hình ảnh quan trọng, hiệu quả nhất và
được nghiên cứu rộng rãi trong cả lĩnh vực học thuật và ngành công nghiệp.
Những hình ảnh liên quan với một hình ảnh truy vấn được tìm thấy bằng hệ
thống CBIR là sử dụng các đặc trưng cấp thấp (màu sắc, hình dạng, kết cấu)
hoặc các đặc trưng cấp cao (nhận thức của con người) [4].
Kiến trúc của một hệ thống CBIR có thể được hiểu là một tập hợp các
mô đun cơ bản tương tác với nhau để lấy ra các hình ảnh cơ sở dữ liệu theo
một truy vấn đã cho. Trong một hệ thống tìm kiếm hình ảnh dựa trên nội dung
điển hình (hình 1.1) được chia làm hai giai đoạn: Trích chọn đặc trưng ngoại
tuyến (offline) và tìm kiếm ảnh trực tuyến (online). Trong giai đoạn ngoại
tuyến, hệ thống tự động trích xuất các thuộc tính trực quan của từng hình ảnh
trong CSDL dựa trên các giá trị pixel của nó và mơ tả bằng các vectơ đặc
trưng. Các vectơ đặc trưng này được lưu trữ trong một CSDL khác được gọi
là CSDL đặc trưng.
Ảnh truy vấn

CSDL ảnh

Trích chọn
đặc trưng

Trích chọn
đặc trưng


Đặc trưng ảnh
truy vấn

Đo độ tương
tự
Các ảnh
kết quả

CSDL
đặc trưng
Ngoại tuyến
Trực tuyến

Hình 1.1 Kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung
Luận văn thạc sĩ – Trần Quốc Bảo


4

Trong giai đoạn trực tuyến, người dùng cung cấp cho hệ thống tìm
kiếm hình ảnh truy vấn hoặc các hình vẽ phác thảo. Sau đó hệ thống biểu diễn
hình ảnh truy vấn thành các vectơ đặc trưng. Các điểm tương đồng hay khác
biệt giữa các vectơ đặc trưng của hình ảnh truy vấn và những hình ảnh trong
CSDL sau đó được tính tốn và so sánh khoảng cách. Kết quả của phép so
sánh là một chỉ số đánh giá độ tương tự giữa ảnh truy vấn và ảnh lấy ra từ
CSDL. Dựa vào chỉ số độ tương tự tính tốn được ở trên, hệ thống sẽ sắp xếp
các ảnh tìm được trong CSDL ảnh theo thứ tự giảm dần độ tương tự và hiển
thị ảnh kết quả ở đầu ra của hệ thống.
Một số hệ thống CBIR sử dụng mô-đun tùy chọn đến phản hồi có liên

quan, nơi người dùng tinh chỉnh kết quả tìm kiếm dần dần bằng cách đánh
dấu hình ảnh trong kết quả là "có liên quan", "khơng liên quan" hoặc "trung
lập" đối với truy vấn tìm kiếm, sau đó lặp lại tìm kiếm với thơng tin mới. Do
đó, từ kết quả truy vấn, người dùng có thể đánh giá hình ảnh nào có liên quan
và hệ thống có thể tái sử dụng thơng tin của họ để cải thiện kết quả.
1.2. Các đặc trưng sử dụng trong tìm kiếm ảnh theo nội dung
Việc trích chọn những đặc trưng trực quan từ hình ảnh là mục tiêu cơ
bản của một hệ thống CBIR. Việc lựa chọn các đặc trưng để đại diện cho một
hình ảnh là một trong những bài tốn của nó. Do tính chủ quan nhận thức và
thành phần phức tạp của dữ liệu trực quan, không tồn tại một biểu diễn tốt
nhất cho bất kỳ đặc trưng hình ảnh cụ thể nào. Nhiều phương pháp tiếp cận đã
được giới thiệu và mỗi phương pháp mô tả đặc trưng này bằng những quan
điểm khác nhau. Những đặc trưng này được sử dụng trong nhiều ứng dụng về
xử lý ảnh, nhận dạng ảnh, …Các phương pháp trích chọn đặc trưng của ảnh
tập trung vào: màu sắc, kết cấu và hình dạng.

Luận văn thạc sĩ – Trần Quốc Bảo


5

1.2.1. Đặc trưng màu sắc:
Đặc trưng màu sắc được sử dụng phổ biến nhất trong tìm kiếm ảnh theo
nội dung. Vì một ảnh màu thì thơng tin quan trọng nhất trong ảnh chính là
màu sắc. Hơn nữa, màu sắc là đặc điểm trực quan đầu tiên và dễ nhất cho việc
đánh chỉ số, trích chọn thơng tin màu của ảnh đưa ra phân tích và tìm kiếm
ảnh đã có hiệu quả thơng qua biểu đồ màu.
Có nhiều định nghĩa về màu, từ góc nhìn khoa học: Màu là phân bổ
bước sóng λ (red: 700 nm, violet: 400 nm) hay tần số f của sóng điện từ. Từ
q trình xử lý thị giác: Màu là thuộc tính quan sát vật thể, kết quả từ việc vật

thể phát ra, truyền hay phản xạ ánh sáng đến mắt người.

Hình 1.2 Cảm nhận màu từ quá trình xử lý thị giác [1]
Ánh sáng (hay màu) mà con người nhận biết là dải tần hẹp trong quang
phổ điện từ.

Hình 1.3 Dải tần quang phổ điện từ [1]
Luận văn thạc sĩ – Trần Quốc Bảo


6

Con người chỉ có khả năng nhận thức được ánh sáng có bức xạ điện từ
với bước sóng trong khoảng 400nm – 700nm. Cơ quan thị giác cảm nhận
được ánh sáng là do bề mặt đối tượng phát ra ánh sáng, là kết quả của sự
tương tác giữa năng lượng chiếu sáng và những phân tử của bề mặt đối tượng.
Một đối tượng màu xanh dương sẽ có bề mặt màu xanh dương khi chiếu ánh
sáng trắng vào nhưng đối tượng đó sẽ có màu tím khi chiếu vào ánh sáng đỏ.
Ánh xạ dạng sóng vào bộ ba phần tử số để biểu diễn ba tính chất vật lý: bước
sóng gốc (màu), độ tinh khiết và cường độ/độ chói.
Các vấn đề chính trong khai thác đặc trưng màu bao gồm khơng gian
màu, lượng tử hóa màu và lựa chọn chức năng tương tự. Các nghiên cứu khác
nhau về nhận thức màu sắc và không gian màu đã được đề xuất [4]. Khơng
gian màu là mơ hình tốn học trừu tượng mơ tả cách biểu diễn màu mà con
người có thể nhận biết bởi bộ các chữ số (3 hay 4 giá trị) hay bởi các thành
phần màu [1]. Mỗi điểm ảnh trên một bức ảnh có thể được biểu diễn bằng một
điểm trong một không gian màu 3 chiều. Một số khơng gian màu thơng dụng:
1.2.1.1. Khơng gian màu RGB

Hình 1.4 Không gian màu RGB [1]

RGB là không gian màu được sử dụng phổ biến nhất để hiển thị ảnh,
bao gồm 3 thành phần màu là Đỏ (Red), Xanh lá cây (Green) và Xanh lam
(Blue). Không gian RGB thuộc mô hình cộng bởi vì các màu sắc trong khơng
gian RGB đều có thể thu được bằng cách cộng 3 thành phần màu này lại với

Luận văn thạc sĩ – Trần Quốc Bảo


7

nhau. Việc biểu diễn một màu tùy ý trong dãy hiển thị được làm bằng cách tổ
hợp ba màu chính, gán giá trị từ 0 đến 1 cho R(1,0,0), G(0,1,0), B(0,0,1). Ví
dụ: Red (1,0,0) + Blue (0,0,1)  Magenta (1,0,1). Đường chéo từ (0,0,0) đến
(1,1,1) biểu diễn màu xám. Tuy nhiên không gian màu RGB không thể biểu
diễn mọi màu trong phổ nhìn thấy.
1.2.1.2. Khơng gian màu HSV
Khơng gian HSV được mô tả bằng khối lập
phương RGB quay trên đỉnh Black. H (Hue) là góc
quay trục V (Value) qua 2 đỉnh Black và White.
Các giá trị biến thiên của H, S, V như sau:
Hue: Bước sóng gốc của ánh sáng, biểu diễn
bằng góc từ 00 đến 3600.
Saturation: Thước đo độ tinh khiết

Hình 1.5 Khơng gian màu HSV

ánh sáng gốc, S có giá trị từ 0 - 1.
Biểu diễn độ tinh khiết của màu / độ tinh khiết cực đại.
Value: Cường độ hay độ chói ánh sáng, Value có giá trị từ 0 - 1, V = 0
 màu đen. Đỉnh có cường độ màu cực đại. Khơng gian HSV trực giác hơn

RGB. Bắt đầu từ Hue (H cho trước và V=1, S=1), thay đổi S: Bổ sung hay bớt
trắng, thay đổi V: Bổ sung hay bớt đen cho đến khi có màu mong muốn. Mắt
người có thể phân biệt 128 Hues, 130 tints (thêm trắng) và cực đại 30 shades
(thêm đen): 128 x 130 x 30 = 382.720 màu khác nhau [1].
1.2.1.3. Không gian màu YUV
Không gian màu YUV là Không gian màu dành cho TV tương tự
(NTSC, PAL và SECAM): Y là độ chói (luminance) của điểm ảnh và chỉ sử
dụng kênh đen trắng; U và V là các kênh màu (chrominance channels); V biểu
diễn R-Y và U biểu diễn B-Y. Kênh Y được định nghĩa bởi trọng số của giá

Luận văn thạc sĩ – Trần Quốc Bảo


8

trị R(0.299), G(0.587), B(0.144). Sơ đồ lượng tử hoá cho không gian màu
YUV và YIQ thường được sử dụng là 125 (53) hoặc 216 (63) mức.
1.2.1.4. Không gian màu L*a*b (CIELAB)
Không gian L*a*b được phát triển bởi CIE (Commission Internationale
de l’Eclairage) cho việc định nghĩa một không gian màu đồng nhất về cảm
nhận. Khơng gian màu là một hình trụ với L* hình thành nên trục đầu tiên
(thẳng đứng), L* xác định độ sáng của màu từ đen đến trắng (hình 1.6).

Hình 1.6 Khơng gian màu L*a*b
Khơng gian màu L*a*b được đưa ra như những sự lựa chọn cho các
không gian màu mà độ chói được thừa nhận là khơng đổi cho tất cả các màu.
Tầm quan trọng của màu sắc và độ chói là cân bằng nhau. Kết quả là trong
khơng gian màu này, ba đặc tính biểu diễn một khơng gian màu sắc là tính
đồng nhất, tính đầy đủ và tính duy nhất được đáp ứng. Do đó, nó thích hợp
cho bài tốn tìm kiếm ảnh theo nội dung.

1.2.1.5. Lượng tử hóa màu
Lượng tử hóa màu là quá trình tối ưu hóa việc sử dụng các màu riêng
biệt trong một hình ảnh mà khơng ảnh hưởng đến các thuộc tính trực quan của
một hình ảnh. Đối với hình ảnh màu thực (24 bit), số màu riêng biệt lên đến
224 = 16.777.216 màu và việc trích xuất trực tiếp đặc trưng màu từ màu thực
sẽ dẫn đến tính tốn lớn. Để giảm tính tốn, lượng tử hóa màu có thể được sử

Luận văn thạc sĩ – Trần Quốc Bảo


9

dụng để thể hiện hình ảnh mà khơng làm giảm đáng kể chất lượng hình ảnh,
do đó làm giảm khơng gian lưu trữ và tăng tốc độ xử lý.
Khi giảm một màu {R, G ,B} 24 bit màu thành màu mới {R’, G’ ,B’}
với n3 màu được tính theo cơng thức:
R’ = n*R/28

G’ = n*G/28

B’ = n*B/28

Vì vậy, sau khi giảm số màu sẽ có n*n*n=n3 màu.
1.2.2. Đặc trưng kết cấu
Kết cấu (texture) là một tính chất quan trọng khác của ảnh. Kết cấu là
một thành phần có ảnh hưởng rất quan trọng đối với sự nhận thức trực quan
của con người. Nó cung cấp bản mẫu trực quan về vùng của ảnh. Các thuộc
tính quan trọng của đặc trưng kết cấu như: Độ tương phản, thuộc tính thơ,
hướng, tính quy luật, chu kỳ và tính ngẫu nhiên.


Hình 1.7 Đặc trưng kết cấu
Không giống như màu sắc, kết cấu thể hiện trên một vùng chứ không
phải tại một điểm ảnh và thường được định nghĩa bằng các mức xám.
Rất nhiều cách thể hiện kết cấu đã được nghiên cứu trong lĩnh vực nhận
dạng và thị giác máy tính. Xét một cách cơ bản, các phương pháp biểu diễn
kết cấu có thể được chia thành hai loại: Phương pháp cấu trúc và phương
pháp thống kê.
Các phương pháp cấu trúc bao gồm các tốn tử hình thái và đồ thị liền
kề, mơ tả kết cấu bằng cách định nghĩa các nguyên thuỷ cấu trúc và luật sắp

Luận văn thạc sĩ – Trần Quốc Bảo


10

đặt của chúng. Các phương pháp này tỏ ra có hiệu quả khi áp dụng trong
trường hợp kết cấu thông thường.
Các phương pháp thống kê bao gồm: Phương pháp phổ năng lượng
Fourier, ma trận đồng khả năng, Tamura, Phân tích Wold, trường ngẫu nhiên
Markov, Không gian fractal, các bộ lọc đa phân giải như biến đổi Gabor và
biến đổi dạng sóng... thể hiện kết cấu bằng sự phân bố thống kê của độ sáng
của các điểm ảnh.
1.2.3. Đặc trưng hình dạng
Các đặc điểm phát hiện biên của các vùng ảnh và các đối tượng ảnh
được sử dụng trong rất nhiều hệ thống tìm kiếm ảnh. So với các đặc điểm về
màu sắc và các đặc điểm về kết cấu thì các đặc điểm về hình dạng thường chỉ
được sử dụng sau khi ảnh đã phân thành các vùng hoặc các đối tượng ảnh.
Nhưng do việc phân vùng và tách đối tượng ảnh khó thu được kết quả tốt nên
việc sử dụng các đặc điểm hình dạng để tìm kiếm ảnh thường bị bó hẹp trong
một số ứng dụng mà ở đó các vùng ảnh hoặc đối tượng ảnh đã được tách biệt

rõ ràng.
Các phương pháp trích chọn đặc điểm hình dạng thường được chia
thành hai loại là trích chọn dựa theo đường biên (xấp xỉ đa giác, không gian
phần tử hữu hạn, mơ tả hình dạng theo Fourier) và trích chọn dựa theo vùng
ảnh (khơng gian thống kê).

Hình 1.8 Đặc trưng hình dạng
Trước khi áp dụng các phương pháp trích chọn đặc điểm hình dạng, các
đối tượng ảnh cần phải được tách ra khỏi ảnh. Giả sử là trong mỗi ảnh chỉ có

Luận văn thạc sĩ – Trần Quốc Bảo


11

một đối tượng ảnh duy nhất, nhiệm vụ của hệ thống trước hết là phải tách
được đối tượng ảnh ra khỏi nền ảnh.
Cách biểu diễn hình dạng của đối tượng ảnh có thể chia thành hai kiểu:
theo đường bao quanh (biên) và theo vùng.
Cách biểu diễn theo đường viền bao quanh chỉ sử dụng đường biên bên
ngồi của hình dạng, điều này có thể thực hiện được bằng cách mơ tả vùng
đang quan tâm bằng cách đặc tính bên ngồi của nó tức là các điểm ảnh dọc
theo đường viền bao quanh đối tượng ảnh. Cách biểu diễn theo vùng sử dụng
cả vùng ảnh bằng cách mô tả vùng đang quan tâm bằng các đặc tính bên trong
tức là các điểm ảnh ở bên trong vùng đó.
1.2.4. Biểu đồ màu (Color Histogram)
Biểu đồ màu là đại lượng đặc trưng cho phân bố màu cục bộ của ảnh,
nó như là một bảng tóm tắt thơng tin về màu sắc của một ảnh bất kì. Việc tính
biểu đồ màu này được tiến hành một cách nhanh chóng chỉ qua một lần duyệt
qua tồn bộ ảnh. Do đó ứng dụng biểu đồ màu vào việc tìm kiếm ảnh sẽ có lợi

rất lớn về mặt tốc độ.

Hình 1.9 Mơ tả biểu đồ màu của ảnh
Biểu đồ màu là đặc trưng rất quan trọng của ảnh và nó thường được
ứng dụng trong các hệ thống tìm kiếm ảnh theo nội dung. Trong chương 2,
luận văn trình bày cụ thể về tìm kiếm ảnh theo nội dung dựa trên biểu đồ màu

Luận văn thạc sĩ – Trần Quốc Bảo


12

thông thường và biểu đồ màu mờ. Các giải pháp được đưa ra để cải thiện độ
chính xác cũng như tốc độ tìm kiếm ảnh.
1.3. Khả năng ứng dụng của hệ thống tìm kiếm ảnh theo nội dung
Tìm kiếm ảnh theo nội dung dựa trên cơ sở toán học là một lĩnh vực
nghiên cứu mới và đã thu được các kết quả quan trọng bởi vì các biểu thức
tốn học được đưa vào trong quá trình xử lý. Các hệ thống tìm kiếm ảnh dựa
trên nội dung được xây dựng bằng cách sử dụng số liệu thống kê, nhận dạng
khuôn mẫu, logic mờ, tính tốn mềm, máy tính và xử lý tín hiệu. Nhu cầu tìm
kiếm ảnh dựa trên nội dung tăng lên trong nhiều lĩnh vực ứng dụng như: y
sinh học, quân sự, thương mại, giáo dục, phân loại và tìm kiếm hình ảnh web
[4]. Ngồi ra, CBIR cịn được ứng dụng thành công trong các lĩnh vực: ngăn
chặn tội phạm, hệ thống thông tin địa lý, quản lý tài sản trí tuệ.
Một số hệ thống tìm kiếm ảnh theo nội dung tiêu biểu:
1.3.1. Hệ thống QBIC (Query By Image Content)
Hệ thống QBIC của hãng IBM là một hệ thống tra cứu ảnh thương mại
đầu tiên và nổi tiếng nhất trong số các hệ thống tra cứu ảnh dựa trên nội dung.
Nó cho phép truy vấn các CSDL hình ảnh lớn bằng các thuộc tính trực quan
như màu sắc, tỷ lệ màu, kết cấu, hình dạng và từ các bức vẽ phác hoạ, cũng

như các từ khóa.
Thơng thường bất kỳ thuộc tính trực quan nào cũng có thể được sử
dụng trong truy vấn. Nhưng khi các thuộc tính trực quan đó có thể kết hợp với
từ khố để tạo thành một truy vấn tổng hợp sẽ cải tiến hiệu quả truy vấn. Phần
mềm QBIC và trình diễn có tại [3].
1.3.2. Hệ thống WebSEEK và VisualSEEK
WebSEEK là một trong những hệ thống nguyên mẫu truy vấn trực quan
dựa trên nội dung được phát triển bởi Đại học Columbia. Nó được thiết kế đặc
biệt để tìm kiếm hình ảnh và video trên WWW. Trong WebSEEK, các hình

Luận văn thạc sĩ – Trần Quốc Bảo


13

ảnh được phân tích trong hai quy trình tự động riêng biệt. Quy trình đầu tiên
là trích chọn và lập chỉ mục các đặc trưng trực quan như biểu đồ màu và kết
cấu. Quy trình thứ hai là phân tích văn bản liên quan và phân loại hình ảnh
thành các lớp chủ đề theo một phân loại hình ảnh tùy chỉnh. Có trên 2000 lớp
hình ảnh trong hệ thống phân loại. Ví dụ như các lớp chủ đề về thể thao, du
lịch, cây cối và các lớp con của chúng.
Một mẫu thử nghiệm nâng cao được gọi là VisualSEEK cũng được
phát triển. VisualSEEK tăng cường khả năng tìm kiếm bằng cách tích hợp các
truy vấn khơng gian (như những người sử dụng trong GIS) và các truy vấn
đặc trưng trực quan hình ảnh. Người dùng yêu cầu hệ thống tìm hình ảnh bao
gồm các vùng có các đặc trưng phù hợp và mối quan hệ khơng gian.
WebSEEK có thể được truy cập từ [3].
1.3.3. ImageRover WWW Search Engine
ImageRover cũng được thiết kế đặc biệt để tìm kiếm hình ảnh trên
WWW. Các đặc trưng trực quan được sử dụng bao gồm màu sắc, kết cấu và

hình dạng. Sự khác biệt chính giữa ImageRover và các hệ thống khác là nó sử
dụng phản hồi có liên quan. Phản hồi liên quan cho phép người dùng tinh
chỉnh một truy vấn thông qua các đặc tả các mục có liên quan.
ImageRover sử dụng một thuật tốn phản hồi có liên quan. Người dùng
có thể chọn nhiều hình ảnh (lấy được từ truy vấn ban đầu) có liên quan. Thuật
tốn sau đó tính tốn vector kết hợp đặc trưng từ những hình ảnh này. Vectơ
đặc trưng kết hợp được sử dụng làm truy vấn mới [3].
Mỗi hệ thống sẽ truy vấn dựa trên một số đặc trưng nhất định nào đó và
có nhiều tùy chọn khác nhau để người dùng có thể truy vấn ảnh theo màu sắc,
kết cấu, hình dạng hay thậm chí là theo từ khóa.

Luận văn thạc sĩ – Trần Quốc Bảo


14

1.4. Khái quát về logic mờ
1.4.1. Mở đầu
Năm 1965, Giáo sư Zadeh đã xây dựng thành công lý thuyết tập mờ và
hệ thống logic mờ. Phát minh này của Zadeh đã cho phép con người có thể
lượng hóa giá trị các mệnh đề mờ, nhờ đó truyền đạt một số thơng tin cho
máy móc qua ngơn ngữ tự nhiên, và chúng có thể “hiểu” khá chính xác nội
dung của những thơng tin đó. Logic mờ đang được sử dụng trong nhiều ứng
dụng liên quan đến nhận dạng, xử lý hình ảnh, xử lý ngôn ngữ, điểu khiển tự
động, truy vấn bằng nội dung hình ảnh, phát hiện ranh rới, theo dõi đối tượng
[8].
Logic mờ cho phép lập luận trên các đối tượng thực tế được định nghĩa
không rõ ràng. Trong logic mờ, chỉ có các đối tượng xấp xỉ chứ khơng có các
đối tượng chính xác, do đó các kiểu lập luận cũng là xấp xỉ. Mọi thứ trong
logic mờ, kể cả giá trị chân lý (true value) đều là các độ đo (degree) trong

khoảng [0, 1] hay là một nhãn nào đó như đúng, rất đúng, sai, ít sai hơn, …
Tổng quát hơn, logic mờ hoàn toàn gắn liền với lý thuyết tập mờ.
1.4.2. Khái niệm tập hợp mờ
Khái niệm “Tập hợp mờ” (Fuzzy Set) hay “Tập mờ” là mở rộng của
khái niệm tập hợp cổ điển, nhằm đáp ứng nhu cầu biểu diễn những tri thức
khơng chính xác.
Tập mờ A xác định trên tập kinh điển X là một tập mà mỗi phần tử của
nó là một cặp các giá trị (x, μA(x)) trong đó x

X và μA là hàm được xác định

bởi: μA : X  [0,1]. Trong đó, μA được gọi là hàm thuộc (hoặc hàm thành
viên) của tập mờ A. Tập không gian X được gọi là nền của tập mờ A.
Có thể ký hiệu tập mờ A = {(x, μA(x)) : x ∈ X}

Khoảng xác định của hàm μA(x) là đoạn [0, 1], trong đó giá trị 0 chỉ

mức độ khơng thuộc về, cịn giá trị 1 chỉ mức độ thuộc về hoàn toàn.

Luận văn thạc sĩ – Trần Quốc Bảo


15

1.4.3. Đặc trưng trên tập mờ
Các đặc trưng của một tập mờ A trên X, là những thông tin để mô tả về
các phần tử liên quan đến tập mờ A, những đặc trưng này còn chỉ rõ sự khác
biệt của tập mờ A, so với những tập con cổ điển khác của X.
Định nghĩa 1.4.3.1
Giá đỡ của tập mờ A (Support) là tập các phần tử có giá trị hàm thuộc

lớn hơn 0 trong tập mờ A, được ký hiệu và xác định như sau:
supp(A) = {x | x

X | μA(x) > 0}

Định nghĩa 1.4.3.2
Chiều cao của tập mờ A (Hight) là giá trị lớn nhất mà hàm thuộc có thể
lấy trong tập mờ A, được ký hiệu và xác định như sau:
h(A) = sup{μA(x), x

X}

Định nghĩa 1.4.3.3
Tập mờ A gọi là chuẩn hóa nếu chiều cao của nó h(A) = 1
Như vậy tập mờ A trên X được gọi là chuẩn hóa, nếu chắc chắn có ít
nhất 1 phần tử của X là thật sự thuộc A.
Định nghĩa 1.4.3.4
Hạt nhân của tập mờ A (Kernel) là tập các phần tử có giá trị hàm thuộc
bằng 1, được ký hiệu và xác định như sau:
ker(A) = {x | x

X | μA(x) = 1}

Như vậy, tập mờ A có nhân khác rỗng khi và chỉ khi A là tập mờ chuẩn
hóa.
1.4.4. Các phép tốn trên tập mờ
Cho A, B là hai tập mờ trên khơng gian nền X có các hàm thuộc tương
ứng là µ A, µ B khi đó:
- Giao của hai tập mờ: A ∩ B
+ Theo luật Min


Luận văn thạc sĩ – Trần Quốc Bảo


×