Tải bản đầy đủ (.pdf) (85 trang)

luận văn thạc sĩ nghiên cứu phương pháp xây dựng hệ thống tìm kiếm ảnh theo nội dung sử dụng biểu đồ màu mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.39 MB, 85 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC VÀ
CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

Trịnh Trung Nghĩa

LUẬN VĂN THẠC SĨ
NGÀNH: HỆ THỐNG THÔNG TIN

NGHIÊN CỨU PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG TÌM
KIẾM ẢNH THEO NỘI DUNG SỬ DỤNG BIỂU ĐỒ MÀU MỜ

Hà Nội – tháng 5 năm 2020


BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC VÀ
CÔNG NGH Ệ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

Trịnh Trung Nghĩa

LUẬN VĂN THẠC SĨ
NGÀNH: HỆ THỐNG THÔNG TIN
NGHIÊN CỨU PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG TÌM
KIẾM ẢNH THEO NỘI DUNG SỬ DỤNG BIỂU ĐỒ MÀU MỜ


Chuyên ngành: Hệ thống thông tin
Mã số: 8480104

CÁN BỘ HƯỚNG DẪN KHOA HỌC: PGS.TS. ĐẶNG VĂN ĐỨC

Hà Nội , 2020


`

LỜI CAM ĐOAN
Tôi xin cam đoan luận văn với tên đề tài “Nghiên cứu phương
pháp tra cứu ảnh theo nội dung sử dụng biểu đồ màu mờ” là kết quả của
việc học tập và nghiên cứu của bản thân học viên, thu thập cơ sở dữ liệu
thực tiễn dưới sự hướng dẫn khoa học của PGS. TS. Đặng Văn Đức.
Các số liệu, kết quả đưa ra tại luận văn này của tôi là hoàn toàn đúng
đắn và trung thực, những tài liệu thông tin sử dụng trong luận văn này
được trích dẫn và có nguồn gốc rõ ràng, đầy đủ.
.

Hà Nội, Ngày …. Tháng …. Năm 2020
Ngƣời cam đoan

Trịnh Trung Nghĩa

1


`


LỜI CẢM ƠN
Trong quá trình học tập và thực hiện luận văn, tôi đã được các Thầy cô của
Viện Hàn lâm Khoa học và Công nghệ Việt Nam tạo mọi điều kiện thuận lợi
và được bạn bè cùng đồng nghiệp đã thường xuyên động viên để tôi hoàn
thành Luận văn này. Tôi xin bày tỏ sự cảm ơn chân thành với những sự hỗ trợ
và giúp đỡ này.
Luận văn sẽ không thể hoàn thành nếu không có sự hướng dẫn tận tình của
Thầy hướng dẫn khoa học PGS.TS Đặng Văn Đức, là người thầy mà tôi muốn
bày tỏ lòng biết ơn sâu sắc nhất. Thầy đã cho tôi nhiều ý kiến đóng góp, giúp
đỡ quan trọng trong quá trình thực hiện luận văn.
Xin chân thành cảm ơn Ban quản lý Học Viện CNTT cùng toàn thể các Thầy
Cô giáo Viện Công Nghệ Thông Tin - Viện Hàn Lâm Việt Nam đã quan tâm
tạo môi trường thuận lợi để cho tôi học tập và nghiên cứu chuyên sâu về lĩnh
vực Công nghệ thông tin.
Cuối cùng tôi cảm ơn tất cả những sự giúp đỡ của đồng nghiệp, bạn bè đã
đóng góp ý kiến, động viên để tôi hoàn thành được luận văn này.
Hà Nội, Ngày …. Tháng 5 Năm 2020
Học Viên

Trịnh Trung Nghĩa

2


`

DANH MỤC KÝ HIỆU,CHỮ VIẾT TẮT

STT
1


2

Từ viết tắt
CBIR

CCH

Từ viết đầy đủ

Diễn giải

Content Based Image
Retrieval

Tìm kiếm ảnh dựa theo

Conventional Color
Histogram

Biểu đồ màu thông

nội dung

thường

3

CIE


Commission Internationale Ủy ban Quốc tế về màu
del’Eclairage
sắc

4

CIELAB

Commission Internationale Không gian màu đồng
del’Eclairage L-*a-*b color nhất CIELAB
space

5

CMY

Cyan-Magenta-Yellowcolor Không gian màu CMY
space

6

CSDL

Cơ sở dữ liệu

7

FCH

Fuzzy Color Histogram


Biểu đồ màu mờ

8

FCM

Fuzzy C – Mean

Thuật toán phân cụm mờ
C - Mean
Hệ thống thông tin địa lý

9

GIS

Geographic Information
System

10

HSV

Hue-Saturation-Value color Không gian màu HSV
space

3



`

11

IBM

International Business
Machines

Tập đoàn máy tính quốc
tế IBM

12

JPEG

Joint Photographic Experts Định dạng hình ảnh
Group
JPEG

13

L*a*b*

L*a*b* color space

Không gian màu đồng
nhất L*a*b*

14


MF

Membership Functions

Hàm thành viên hay
hàm thuộc

15

QBIC

Query By Image Content

Truy vấn ảnh dựa trên
nội dung

16

RGB

Red-Green-Blue color space Không gian màu RGB

17

WWW

World Wide Web

Mạng toàn cầu


18

YCbCr

Y-Luma (Brighnesshay
Luminance); CbCr –
ChromaBlue và Chroma
Red color space

Không gian màu YCbCr

19

YUV

Y- Luminance; UV chrominancechannels

4

Không gian màu YUV


`

DANH MỤC HÌNH ẢNH TRONG LUẬN VĂN
Hình 1.1: Tổng quan kiến trúc về hệ thống tra cứu ảnh
Hình 1.2: Tương quan màu sắc, ánh sáng với Mắt
Hình 1.3: Không gian màu RGB
Hình 1.4: Đặc trưng kết cấu của ảnh

Hình 2.1: Biểu đồ mô tả màu của ảnh
Hình 2.2: Biểu đồ màu của 3 ảnh khác nhau
Hình 2.3 : Công cụ tìm kiếm hình ảnh của Google
Hình 2.4: Phần bù của một tập mờ
Hình 2.5: Độ đo khoảng cách Minkowski
Hình 2.6: Độ đo khoảng cách Quadretic
Hình 2.7: Ảnh và biểu đồ màu của ảnh thử nghiệm
Hình 2.7.1: Tính khoảng cách giữa ảnh A và B sử dụng LCH
Hình 2.7.2: Sơ đồ thủ tục tính toán FCH (n’=163 = 4096)
Hình 2.8: Sơ đồ khối hệ thống suy luận mờ
Hình 2.9: Hàm thành viên của L*,a* và b*
Hình 2.10: Hàm thành viên mờ đầu ra của hệ thống
Hình 2.11: Cấu trúc của biểu đồ màu mờ
Hình 2.12: Hệ thống suy luận mờ tạo ra biểu đồ màu mờ
Hình 2.13: Biểu đồ FCH - 1D tạo ra từ hệ thống liên kết mờ của ảnh truy
vấn
Hình 3.1 Kiến trúc hệ thống tìm kiếm ảnh theo nội dung ở trong luận văn
Hình 3.2 Kiểu dữ liệu struct trong CSDL đặc trưng trong Matlab
Hình 3.2 Biểu đồ chức năng hoạt động của xây dựng CSDL đặc trưng
CCH trong không gian màu RGB, HSV
5


`

Hình 3.3 Biểu đồ chức năng hoạt động, xây dựng CSDL đặc trưng
FCH trong không gian màu L*a*b*
Hình 3.4 Biểu đồ hoạt động chức năng tìm kiếm ảnh trên cơ sở CCH
theo RGB hoặc HSV
Hình 3.6 Giao diện chính của chương trình thử nghiệm

Hình 3.7 Giao diện tìm kiếm và hiển thị ảnh kết quả của chương trình
Hình 3.8 Biểu đồ màu CCH và FCH của ảnh bus 340.jpg và ảnh đã
thêm 15% nhiễu gaussian
Hình 3.9 Biểu đồ màu CCH và FCH của ảnh xe bus 340.jpg và
ảnh đã thay đổi độ sáng 15%
Hình 3.10 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với FCH
Hình 3.11 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trongRG
Hình 3.12 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trong HSV
Bảng 3.1 Kết quả thử nghiệm độ chính xác với ảnh xe bus và một số ảnh khác
nhau , đã tạo thêm 15% độ nhiễu Gausian và thay đổi độ sáng 15%.
Bảng 3.2 Một số kết quả thử nghiệm tìm kiếm trong CSDL ảnh WANG
Bảng 3.3 Một số kết quả thử nghiệm từ chương trình tìm kiếm ảnh trên
CSDL ảnh y tế

6


`

MỤC LỤC
LỜI CAM ĐOAN ............................................................................................ 1
LỜI CẢM ƠN .................................................................................................. 2
DANH MỤC HÌNH ẢNH TRONG LUẬN VĂN ......................................... 5
MỤC LỤC ........................................................................................................ 7
PHẦN MỞ ĐẦU ............................................................................................ 10
CHƢƠNG 1. TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH THEO
NỘI DUNG 12
1.1. Hệ thống tra cứu ảnh theo nội dung và những thành phần chính
của nó........................................................................................................... 15
1.2. Các đặc trƣng trong hệ thống tìm kiếm ảnh dựa trên nội dung .... 16

1.2.1. Đặc trưng màu sắc ....................................................................... 16
Các đặc trưng về hình dạng của ảnh ........................................................ 18
1.2.2. Đặc trưng kết cấu ......................................................................... 20
1.2.3. Biểu đồ màu .................................................................................. 21
1.3. Khả năng ứng dụng của hệ thống tìm kiếm ảnh theo nội dung ..... 24
1.3.1. Công cụ tìm kiếm Google Image Search ...................................... 25
1.3.2. Hệ thống QBIC (Query By ImageContent) .................................. 26
1.3.3. Hệ thống WebSEEK và VisualSEEK ............................................ 26
1.4. Tổng quan về Logic mờ ...................................................................... 27
1.4.1. Giới thiệu chung về Logic mờ ...................................................... 27
1.4.2. Khái niệm tập hợp mờ. ................................................................. 29
1.4.3. Các đặc trưng của tập mờ ............................................................ 29
1.4.4. Các phép toán trên tập mờ ........................................................... 30
1.5. Kết luận chƣơng .................................................................................. 34

7


`

CHƢƠNG 2. TÌM KIẾM ẢNH THEO NỘI DUNG TRÊN CƠ SỞ
BIỀU ĐỒ MÀU MỜ...................................................................................... 35
2.1. Đo khoảng cách giữa các biểu đồ màu .............................................. 35
2.1.1. Độ đo khoảng cách Minkowski(Lp) .............................................. 36
2.1.2. Độ đo khoảng cách toàn phương(Quaratic) ................................ 37
2.1.3. Độ đo khoảng cách biểu đồ giao nhau (Histogram Intersection
Distance) ................................................................................................... 39
2.2. Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu thông thƣờng
...................................................................................................................... 39
2.2.1. Biểu đồ màu toàn bộ (Global Color Histogram) ......................... 39

2.2.2. Biểu đồ màu cục bộ ( LCH )......................................................... 41
2.3. Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu mờ ............... 43
2.3.1. Định nghĩa biểu đồ màu mờ(FCH) .............................................. 43
2.3.2. Tính toán FCH và độ đo khoảng cách ......................................... 43
2.3.3. Tính toán FCH trong không gian màu CIELAB sử dụng thuật toán
phân cụm mờ ............................................................................................. 44
2.3.4. Phương pháp tạo biểu đồ màu dựa vào hệ thống liên kết mờ trong
không gian màu L*a*b* ........................................................................... 47
2.4. Tổng kết chƣơng.................................................................................. 54
CHƢƠNG 3. THỬ NGHIỆM .................................................................... 55
3.1. Giới thiệu bài toán thử nghiệm .......................................................... 55
3.2. Dữ liệu thử nghiệm ............................................................................. 55
3.3. Mô tả hệ thống thử nghiệm ................................................................ 56
3.3.1. Xây dựng CSDL đặc trưng ........................................................... 56
3.3.2. Chức năng tìm kiếm ảnh............................................................... 56
3.4. Môi trƣờng và công cụ sử dụng xây dựng thử nghiệm ................... 57
8


`

3.5. Thiết kế chƣơng trình thử nghiệm .................................................... 58
3.5.1. Xây dựng CSDL đặc trưng - Thiết kế CSDL đặc trưng ............... 59
3.5.2. Thiết kế giao diện của chương trình thử nghiệm ......................... 63
3.6. Đánh giá kết quả thử nghiệm............................................................. 64
3.6.1. Đo lường hiệu suất trong hệ thống tìm kiếm ảnh......................... 64
3.6.2. Kết quả thử nghiệm ...................................................................... 65
CHƢƠNG 4. KẾT LUẬN........................................................................... 78
TÀI LIỆU THAM KHẢO ............................................................................ 80
PHỤ LỤC 1 .................................................................................................... 82


9


`

PHẦN MỞ ĐẦU
Ngày nay với sự phát triển của của các phương tiện truyền thông, các
phương tiện lưu trữ hình ảnh, cùng kích thước của các tập ảnh số được gia
tăng một cách chóng mặt. Thì việc tìm kiếm ảnh và lưu trữ ảnh sao cho nhanh
chóng và hiệu quả là rất cần thiết với người dùng. Việc tra cứu ảnh là nhu cầu
rất cần thiết từ nhiều lĩnh vực khác nhau như: trinh sát, dự báo thời tiết, phòng
chống tội phạm…. Cùng chung mục đích này, rất nhiều các chương trình thiết
kế để tìm kiếm ảnh đã được xây dựng và ứng dụng trong thực tế. Trong đó có
hai nền tảng chính là: dựa trên văn bản (text-based) và dựa trên nội dung
(content-based).
Các phương pháp tiếp cận trong những năm 1970 dựa trên văn bản
được sử dụng nhiều. Tại thời điểm đó các bức ảnh được con người chú thích
bằng văn bản một cách thủ công , sau đó được lưu trữ bởi các hệ thống quản
lý cơ sở dữ liệu, và đưa vào thực hiện việc tra cứu ảnh. Khi đó người ta nhận
ra một số nhược điểm của phương pháp này đó là:
Thứ nhất: Nó cần quá nhiều công sức lao động của con người để tạo
chú thích cho những bức ảnh.
Thứ hai là: nếu việc đánh chú thích không chuẩn do nhận thức chủ
quan của mỗi người là khác nhau.
Để khắc phục hai nhược điểm trên của hệ thống tra cứu ảnh dựa trên
văn bản, khái niệm tra cứu ảnh dựa trên nội dung được giới thiệu vào đầu năm
1980.
Với Luận văn này sẽ thể hiện một số kỹ thuật dựa trên phản hồi liên
quan, được ứng dụng trong công nghệ tra cứu ảnh theo nội dung. Để cải

thiện hiệu năng tra cứu, thu hẹp khoảng cách về ngữ nghĩa. Luận văn được
chia làm 3 chương cụ thể như sau:
Chƣơng 1: Các khái niệm chung về tra cứu ảnh dựa trên nội dung.
Giới thiệu các kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung,
các đặc trưng sử dụng trong tìm kiếm ảnh theo nội dung, khả năng ứng
dụng và khái quát về Logic mờ.
10


`

Chƣơng 2: Đo khoảng cách giữa các biểu đồ màu, Tìm kiếm ảnh theo
nội dung dựa trên cơ sở biểu đồ màu thông thường, Tìm kiếm ảnh theo nội
dung trên cơ sở biều đồ màu mờ.
Chƣơng 3: Áp dụng cài đặt chương trình thử nghiệm.
Cài đặt chương trình tìm kiếm ảnh, thử nghiệm trên Matlab dựa theo
kiến thức và lý thuyết từ các chương của luận văn.

11


`

CHƢƠNG 1.

TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH
THEO NỘI DUNG

Giới thiệu:
Hiện nay với việc bùng nổ về hệ thống thông tin thì việc tìm kiếm thông

tin dữ liệu có vai trò quan trọng, trong đó việc tìm kiếm ảnh cũng đang trở
nên cần thiết. Truy xuất thông tin hình ảnh dựa trên nội dung, hoặc truy
xuất hình ảnh dựa trên nội dung là một trong những lĩnh vực nghiên cứu
mạnh mẽ nhất trong lĩnh vực máy tính trong hơn 10 năm qua. Sự sẵn có của
số lượng lớn dữ liệu trực quan và đa phương tiện đang phát triển, và sự phát
triển của Internet nhấn mạnh đến các nhu cầu để tạo ra các phương thức
truy cập theo chủ đề, cung cấp nhiều hơn các truy vấn hoặc yêu cầu dựa
trên văn bản đơn giản, dựa trên các trường cơ sở dữ liệu chính xác.
Có nhiều chương trình và công cụ đã được phát triển để hình thành và
thực hiện các truy vấn dựa trên nội dung hình ảnh hoặc âm thanh, để giúp
chạy duyệt các kho dữ liệu đa phương tiện lớn. Tuy nhiên, không có bước
đột phá chung nào đạt được đối với các cơ sở dữ liệu lớn khác nhau với các
tài liệu thuộc các loại khác nhau về đặc điểm và nội dung. Một số câu trả lời
cho nhiều câu hỏi liên quan đến tốc độ, mô tả ngữ nghĩa hoặc giải thích
hình ảnh khách quan vẫn chưa được trả lời.
Để tìm kiếm ảnh hiện nay có hai cách: một là phương pháp tìm kiếm
theo từ khoá và hai là tìm kiếm theo nội dung ảnh. Phương pháp thứ nhất là
tìm kiếm ảnh theo từ khoá phương pháp này người dùng khá ưa thích vì
tính chất đơn giản và dễ thao tác. Cùng với đó việc tìm kiếm ảnh dựa theo
từ khoá thì nhanh hơn so với tìm kiếm theo nội dung bởi vì tìm kiếm theo từ
khóa hoạt động trên việc so sánh và phân tích các từ hay cụm từ khi xác
định chúng giống với nhau thì đưa ra kết quả gần đúng nhất . Do kiểu dữ
liệu đầu vào là dạng văn bản nên việc tìm kiếm và xuất kết quả thực hiện
một cách nhanh chóng, và không đòi hỏi người tìm kiếm phải chuẩn bị ảnh
mẫu trước. Bên cạnh đó việc tìm kiếm theo phương pháp này còn có một số
hạn chế đó là kết quả tìm kiếm khi trả về đôi khi không đúng ý định ban đầu
của người dùng.
12



`

Để khắc phục các hạn chế trên thì phương pháp tìm kiếm ảnh dựa trên
nội dung được ra đời để khắc phục những hạn chế này. Tư tưởng chính của
phương pháp tìm kiếm ảnh này là người ta tự động trực tiếp gắn mô tả cho
những bức ảnh, phân tích nội dung ảnh mà không có sự can thiệp thủ công.
Điểm nổi bật của thuật toán này so với thuật toán tìm kiếm ảnh dựa trên từ
khóa đó là nội dung của ảnh luôn luôn nhất quán và ở phần trích chọn đặc
trưng của ảnh được thực hiện một cách tự động. Trên thực tế, người sử
dụng luôn thích dùng các từ khóa, để mô tả văn bản và giải thích cho hình
ảnh của họ và đo độ tương tự. Trên một khía cạnh nào đó những đặc trưng
này được trích chọn tự động bằng việc sử dụng các kỹ thuật của thị giác
máy và chủ yếu là các đặc trưng ở mức thấp như đặc trưng về hình dạng,
đặc trưng về màu sắc ảnh, đặc trưng về kết cấu, …). Cho dù đã có nhiều
thuật toán được đầu tư về kỹ thuật để mô tả các đặc trưng của ảnh như màu
sắc, hình dạng nhưng vẫn không thể phản ánh hết các ngữ nghĩa của ảnh.
Phân tích nội dung đa phương tiện được áp dụng trong các ứng dụng thị
giác máy tính trong thế giới thực khác nhau và hình ảnh kỹ thuật số là một
phần chính của dữ liệu đa phương tiện. Trong vài năm qua, sự phức tạp của
nội dung đa phương tiện, đặc biệt là hình ảnh đã tăng theo cấp số nhân và
trên cơ sở hàng ngày, hơn hàng triệu hình ảnh được tải lên tại các kho lưu
trữ khác nhau như Twitter, Facebook và Instagram. Để tìm kiếm một hình
ảnh có liên quan từ một kho lưu trữ là một vấn đề nghiên cứu đầy thách
thức cho cộng đồng nghiên cứu tầm nhìn máy tính. Hầu hết các công cụ tìm
kiếm lấy hình ảnh trên cơ sở các cách tiếp cận dựa trên văn bản truyền
thống dựa trên chú thích và siêu dữ liệu. Trong thập kỷ qua , nghiên cứu sâu
rộng được báo cáo để tìm kiếm , ảnh dựa trên nội dung (CBIR) , phân loại
hình ảnh và phân tích.
Các khái niệm quan trọng và nghiên cứu chính dựa trên CBIR và biểu
diễn hình ảnh sẽ được thảo luận chi tiết và các hướng nghiên cứu trong

tương lai được kết luận và tạo điều kiện cho nghiễn cứu tiếp theo trong lĩnh
vực này.
Kỹ thuật tìm kiếm ảnh dựa trên nội dung (CBIR) đã được đưa vào như
13


`

một câu trả lời cho những khó khăn của cách tiếp cận dựa trên văn bản. Kỹ
thuật CBIR vượt qua rào cản đại diện cho một hình ảnh mang tính văn bản.
Trong các hệ thống CBIR , thuật toán xử lý hình ảnh được sử dụng và các
vector đặc trưng được trích xuất tự động. Các tính năng của hình ảnh là màu
sắc, kết cấu và hình dạng. Các vecto đặc trưng đại diện cho các tính năng
này.
Ưu điểm của CBIR :
- Quá trình thu hồi được xử lý một cách tự động.
- Không cần nỗ lực để chú thích hình ảnh.
Nhược điểm của CBIR:
- Quản lý hình ảnh khá phức tạp.
- CBIR cần chuyển đổi nhận thức của user cấp cao thành tính
năng hình ảnh cấp thấp.
- Việc lập các chỉ mục hình ảnh là phức tạp.
- Xử lý truy vấn cũng phụ thuộc vào diễn giải trực quan.
Do vậy, các khái niệm đặc trưng mức cao và các đặc trưng
mức thấp vẫn còn nhiều nên hiệu suất của CBIR là vẫn còn
tương đối lớn với mong muốn của người sử dụng.

14



`

1.1. Hệ thống tra cứu ảnh theo nội dung và những thành phần chính
của nó.
Một hệ thống tra cứu ảnh theo nội dung cần các thành phần sau:

Hình 1-1: Tổng quan về kiến trúc của hệ thống tra cứu ảnh

Trong một hệ thống tra cứu ảnh theo nội dung có ba thành phần quan
trọng nhất đó là: Giao diện truy vấn cho người dùng, đánh chỉ số và trích
chọn đặc trưng .

15


`

1.2. Các đặc trƣng trong hệ thống tìm kiếm ảnh dựa trên nội dung
CBIR đề cập đến nội dung hình ảnh được lấy trực tiếp, qua đó các hình
ảnh có tính năng nhất định hoặc chứa nội dung nhất định sẽ được tìm kiếm
trong cơ sở dữ liệu hình ảnh. Ý tưởng chính của CBIR là phân tích thông tin
hình ảnh bằng các tính năng cấp thấp của hình ảnh, bao gồm: màu sắc, kết
cấu, hình dạng và mối quan hệ không gian của các đối tượng, v.v.. và thiết
lập các vector đặc trưng của hình ảnh làm chỉ mục. Phương pháp truy xuất
tập trung tính toán mức độ tương đồng giữa véc tơ đặc trưng đa chiều ảnh
đầu vào và các véc tơ đặc trưng đa chiều trong CSDL.
1.2.1. Đặc trƣng màu sắc
Hiện nay việc sử dụng đặc trưng màu sắc của ảnh trong tìm kiếm ảnh được sử
dụng rất nhiều, đặc biệt trong lĩnh vực tra cứu ảnh dựa theo nội dung.Vì ta
thấy được rằng trong một bức ảnh màu thì dữ liệu quan trọng nhất của nó là

màu sắc. Mặt khác, màu sắc có những đặc điểm rất dễ trong việc đánh chỉ số
và có tính trực quan, trích chọn theo thông tin màu của ảnh sau đó đưa ra
những phân tích và tìm kiếm ảnh đã có hiệu quả thông qua biểu đồ màu.
Có nhiều định nghĩa về màu, từ góc nhìn khoa học: Màu là phân bổ bước
sóng λ (red: 700nm, violet: 400nm) hay tần số f của sóng điện từ.Từ quá trình
xử lý thị giác: Màu là thuộc tính quan sát vật thể, kết quả từ việc vật thể phát
ra, truyền hay phản xạ ánh sáng đến mắt người.

16


`

H1.2 Tương quan màu sắc, ánh sáng với Mắt
Trong tra cứu ảnh việc sử dụng dặc trưng màu sắc được sử dụng phổ
biến. Trên một không gian màu thì các màu sắc được định nghĩa cụ thể. Sự
đa dạng của không gian màu là có sẵn, rất nhiều ứng dụng hiện nay đều
đang sử dụng, khai thác các đặc trưng của ảnh.
Các vấn đề chính trong khai thác đặc trưng màu bao gồm không
gian màu, và lựa chọn chức năng tương tự. Các nghiên cứu khác nhau
về nhận thức màu sắc và không gian màu đã được đề xuất. Có thể hiểu
rằng không gian màu là mô hình toán học trừu tượng dùng để mô tả
cách biểu diễn màu mà con người có thể nhận biết bởi bộ các chữ số (có
giá trị )hay bởi các thành phần màu.Tại mỗi điểm ảnh trên một bức ảnh
nào đó ta có thể biểu diễn được bằng một điểm trong một không gian
màu 3 chiều.

17



`

Hình 1.3 Không gian màu RGB
RGB là không gian màu được sử dụng nhiều nhất hiện nay để
hiển thị ảnh, RBG bao gồm 3 thành phần màu cụ thể là: màu đỏ, màu
xanh lá và màu xanh lam. Không gian RGB là một dạng của mô hình
cộng bởi vì các màu sắc trong không gian này có thể cộng lại với nhau
tạo ra một màu sắc cụ thể nào đó.
Cách biểu diễn một màu tùy ý trong dãy hiển thị được thực hiện bằng
cách tổ hợp ba màu Đỏ, Xanh lá và Xanh Lam với nhau, gán giá trị từ 0
đến 1 cho R(1,0,0), G(0,1,0), B(0,0,1). Ví dụ: Red (1,0,0) + Blue (0,0,1)
→Magenta (1,0,1). Đường chéo từ (0,0,0) đến ( 1,1, 1 ) biểu diễn màu
xám. Tuy nhiên không gian màu RGB không thể biểu diễn mọi màu
trong phổ nhìn thấy.
Các đặc trƣng về hình dạng của ảnh
Khi ta so sánh đặc trưng về hình dạng với các đặc trưng về màu sắc hay
đặc trưng về kết cấu thì các đặc trưng của hình dạng thường chỉ được sử
dụng sau khi ảnh đã phân tách thành các vùng hoặc các đối tượng ảnh. Bởi
18


`

vì khi ta tách đối tượng ảnh cùng phân vùng rất khó có thể thu được kết
quả tốt chính vì thế việc sử dụng các đặc điểm hình dạng của ảnh để tìm
kiếm ảnh thường bị bó hẹp trong một vài ứng dụng mà ở đó các vùng ảnh
hoặc đối tượng ảnh đã được tách biệt rõ ràng
Có 2 loại trích chọ đặc trưng cơ bản đó là: trích chọn dựa theo đường
biên và trích chọn dựa theo vùng của ảnh.
Khi thực hiện phép toán trích chọn đặc trưng của ảnh người ta thường

tách đối tượng ra khỏi ảnh. VD “bức ảnh cô gái đứng trên bãi biển “ thì
trước tiên người ta tách đối tượng ra khỏi ảnh tức là sẽ phải tách hình “cô
gái ” ra khỏi nền của bức ảnh ( nền là cảnh bãi biển ).

Hình 1.4: Đặc trưng về hình dạng
Cách biểu diễn theo đường viền bao quanh chỉ sử dụng đường
biên bên ngoài của hình dạng, để làm được điều này người ta sử dụng
cách mô tả vùng đang quan tâm bằng cách đặc tính bên ngoài của nó, có
nghĩa là các điểm ảnh dọc theo đường viền bao quanh đối tượng ảnh.
Cách biểu diễn theo vùng là cách sử dụng cả vùng ảnh bằng cách mô tả
vùng đang quan tâm bằng các đặc tính bên trong tức là các điểm ảnh ở
bên trong vùng đó.

19


`

1.2.2. Đặc trƣng kết cấu
Trong các đặc trưng của ảnh thì đặc trưng “kết cấu” là một đặc
trưng có tầm ảnh hưởng lớn nhất và cần thiết nhất. Đặc trưng kết cấu có
ảnh hưởng rất lớn đến sự nhận thức trực quan của người dùng khi họ nhìn
vào nó. Các vùng của ảnh được nó cung cấp bản mẫu trực quan. Đặc trưng
kết cấu gồm các thuộc tính như: Thuộc tính thô, độ tương phản, hướng,
chu kỳ, tính ngẫu nhiên và tính quy luật

Hình 1.4: Đặc trưng kết cấu của ảnh
Khác với đặc trưng hình dạng, đặc trưng kết cấu thể hiện trên một
vùng chứ không phải tại một điểm ảnh và thường được định nghĩa bằng
các mức xám.

Rất nhiều nghiên cứu trong các lĩnh vực như nhận dạng và thị giác máy
tính nó thể hiện được đặc trưng kết cấu của hình ảnh. Nhìn nhận một cách
chủ quan thì có 2 cách biểu diễn kết cấu đó là: phương pháp thống kê và
Phương pháp cấu trúc.
Các phương pháp cấu trúc bao gồm các đồ thị liền kề và toán tử hình thái,
mô tả kết cấu bằng cách định nghĩa các nguyên thuỷ cấu trúc và luật sắp
20


`

đặt của chúng. Các phương pháp cho thấy hiệu quả rõ rệt khi áp dụng
trong trường hợp kết cấu thông thường.
Một số phương pháp thống kê gồm các phương pháp: Phương pháp ma
trận đồng khả năng, phổ năng lượng Fourier, Tamura, Phân tích Wold,
trường ngẫu nhiên Markov, Không gian fractal ,các bộ lọc đa phân giải
như biến đổi Gabor và biến đổi dạng sóng... thể hiện kết cấu bằng sự phân
bố thống kê của độ sáng của các điểm ảnh.
1.2.3. Biểu đồ màu
Biểu đồ màu của một bức ảnh thể hiện được sự đặc trưng trong bố cục
màu sắc của ảnh đó, các biểu đồ như này là một bảng sơ đồ về màu sắc
của ảnh nào đó. Công việc tính toán dựa trên biểu đồ màu của ảnh được
tiến hành rất nhanh chóng, nó chỉ cần duyệt qua một lần toàn bộ ảnh. Vì
thế việc sử dụng biểu đồ màu trong việc tìm kiếm ảnh sẽ đem lại cho
chúng ta kết quả rất khả quan về phương diện tốc độ tìm kiếm.

Hình 2.1: Biểu đồ mô tả màu của ảnh
Biểu đồ màu là đặc trưng rất quan trọng của ảnh và nó thường được
ứng dụng trong các hệ thống tìm kiếm ảnh theo nội dung. Ở chương 2,
luận văn này trình bày cụ thể về phương pháp tìm kiếm ảnh theo nội dung

dựa trên biểu đồ màu mờ và biểu đồ màu thông thường. Các phương pháp
đưa ra đều có tính cải thiện độ chính xác cũng như tốc độ tìm kiếm ảnh.
21


`

1.2.3.1. Biểu đồ màu toàn cục (Global Color Histogram)
Biểu đồ màu toàn cục có tên tiếng anh là: Global Color Histogram,
đây là dạng biểu đồ mô tả sự bố trí của màu sử dụng trong tập các màu. Để
sử dụng biểu đồ màu toàn cục này thì trước tiên bức ảnh sẽ phải mã hóa với
biểu đồ màu của nó và khoảng cách giữa hai ảnh sẽ được xác định bởi
khoảng cách giữa các biểu đồ màu của chúng. Với phương pháp này ta có
thể sử dụng các thước đo khoảng cách để tính toán khoảng cách giữa các
biểu đồ màu với nhau.
Biểu đồ mầu toàn cục là sự thể hiện sự phân bố màu sắc trong một
hình ảnh. Biểu đồ màu đại diện cho hình ảnh nhưng từ một góc nhìn khác.
Biểu đồ màu đếm các pixel tương tự và lưu trữ nó trong các bins để mô tả số
lượng pixel trong mỗi phạm vi màu một cách độc lập. Biểu đồ màu là một
mô tả màu và như chúng ta đã biết răng mỗi mô tả chứa một thuật toán trích
xuất tính năng và một chức năng phù hợp.
Tham khảo ví dụ mô tả hoạt động của biểu đồ màu này:
Cho một biểu đồ với 3 màu : Đen, Trắng và Vàng. Ta kí hiệu biểu đồ
màu của 3 ảnh
● ảnh A:{25%, 25%, 50%};
● ảnh B: {18.75%, 37.5%, 43.75%}
● ảnh C {18.75%, 37.5%, 43.75%}
Sử dụng phương pháp đo khoảng cách Euclidean để đo khoảng cách giữa
các biểu đồ, ta thu được kết quả như sau:


Trong ví dụ trên ta thấy được khoảng cách giữa ảnh A và C khác so với
khoảng cách giữa ảnh A và B. Nhưng nếu chúng ta áp dụng biểu đồ màu
toàn cục thì kết quả thu được lại là khoảng cách tương tự.
22


`

Trong trường hợp nếu hai ảnh khách nhau nhưng có biểu đồ toàn cục giống
nhau ví dụ trên ( ảnh B và C ). Thì nó cho ta thấy rõ ràng điểm cực kỳ hạn
chế của biểu đồ màu toàn cục .
● ảnh A:{25%, 25%, 50%};
● ảnh B: {18.75%, 37.5%, 43.75%};
● ảnh C: {18.75%, 37.5%, 43.75%}

Hình 2.2 :Biểu đồ màu của 3 ảnh khác nhau
1.2.3.2. Biểu đồ màu tƣơng quan (Color Correlogram Histogram)
Biểu đồ màu tương quan được phát triển để khắc phục những vấn đề
mà trong không gian màu, mà thông qua lược đồ ta thấy được những thông
tin về màu sắc còn thiếu sót. Lược đồ màu này không những có thể biểu
diễn sự phân phối màu của các điểm ảnh mà nó còn là thể hiện sự tương
quan về không gian giữa các cặp màu. do lược đồ chỉ chú ý tới sự tương
quan về không gian, giống nhau giữa những màu do vậy chi phí tính toán và
số chiều được giảm đi đáng kể.
Biểu đồ tương quan màu sắc được đề xuất để mô tả không chỉ thể
hiện sự phân chia màu sắc của pixel mà còn cả tương quan không gian của
các cặp màu. Kích thước thứ nhất và thứ của biểu đồ ba chiều là màu sắc
của bất kỳ cặp pixel nào và chiều thứ ba là khoảng cách không gian của
chúng. Biểu đồ tương quan màu là bảng được lập chỉ mục bởi các cặp màu.
Cho một tương quan màu với các chỉ số đánh theo bảng bởi các cặp

23


×