Tải bản đầy đủ (.pdf) (68 trang)

Các đặc trưng hình ảnh trong cơ sở dữ liệu ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.76 MB, 68 trang )

..

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG

Phạm Văn Cường

CÁC ĐẶC TRƯNG HÌNH ẢNH TRONG
CƠ SỞ DỮ LIỆU ẢNH

LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH

Thái Ngun, Năm 2011
Số hóa bởi Trung tâm Học liệu – ĐHTN




ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

Phạm Văn Cường

CÁC ĐẶC TRƯNG ẢNH TRONG
CƠ SỞ DỮ LIỆU ẢNH
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH


NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS ĐỖ TRUNG TUẤN

Thái Nguyên, năm 2011

Số hóa bởi Trung tâm Học liệu – ĐHTN




i

LỜI CẢM ƠN
Trƣớc hết tơi xin đƣợc bày tỏ lịng cảm ơn sâu sắc và sự kính trọng của mình
đến các thầy cô giáo Trƣờng Đại học Công nghệ Thông tin và Truyền thông, Đại học
Thái Nguyên, các thầy cô giáo Viện công nghệ thông tin thuộc Viện công nghệ Việt
Nam đặc biệt là các thầy cô giáo đã giảng dạy và giúp đỡ tơi trong suốt q trình học
tập nâng cao sau đại học.
Nhân dịp hoàn thành luận văn tốt nghiệp cao học của mình, tơi xin trân trọng
cảm ơn thầy giáo PGS-TS Đỗ Trung Tuấn- Trƣờng Đại học Khoa Học Tự Nhiên thuộc
trƣờng Đại học Quốc Gia Hà Nội đã nhiệt tình hƣớng dẫn để tơi hồn thành luận văn
này.
Tôi xin cảm ơn bạn bè, đồng nghiệp tại Thanh Hóa, đã ln động viên, giúp đỡ
tơi trong q trình học tập và cơng tác, để tơi học tập và hoàn thành luận văn này.
Xin gửi đến ngƣời thân, gia đình tơi, những ngƣời đã tạo điều kiện và động
viên, trợ giúp tôi về tinh thần, thông cảm và giúp đỡ tôi rất nhiều trong thời gian học
tập này.

Số hóa bởi Trung tâm Học liệu – ĐHTN





ii

LỜI CAM ĐOAN

Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi dƣới sự hƣớng dẫn
khoa học của thầy giáo hƣớng dẫn. Các số liệu, kết quả nêu trong luận văn là trung
thực. Những kết luận của luận văn chƣa từng đƣợc ai công bố trong bất kỳ cơng trình
nào khác.

Thái Ngun, ngày 01 tháng 10 năm 2011

Phạm Văn Cƣờng

Số hóa bởi Trung tâm Học liệu – ĐHTN




iii

Mục lục
LỜI CẢM ƠN .............................................................................................................................. i
LỜI CAM ĐOAN ....................................................................................................................... ii
Mục lục ...................................................................................................................................... iii
Danh mục kí hiệu và viết tắt ....................................................................................................... v
Danh mục hình và bảng ............................................................................................................. vi
MỞ ĐẦU .................................................................................................................................... 1

Chƣơng 1. VAI TRÒ CỦA DỮ LIỆU ĐA PHƢƠNG TIỆN VÀ VIỆC TRÍCH CHỌN ĐẶC
TRƢNG ...................................................................................................................................... 4
1.1. Các dữ liệu đa phƣơng tiện và số hóa dữ liệu .................................................................. 4
1.1.1. Các dữ liệu đa phƣơng tiện ........................................................................................... 4
1.1.2. Chỉ số hóa dữ liệu ......................................................................................................... 6
1.2. Đặc trƣng của dữ liệu hình ảnh ........................................................................................ 7
1.2.1. Giới thiệu ...................................................................................................................... 7
1.2.2. Đặc trƣng và trích rút đặc trƣng của ảnh số .................................................................. 8
1.2.3. Thơng tin không gian .................................................................................................. 14
1.2.4. Các đặc trƣng mức cao ............................................................................................... 15
1.3. Các nghiên cứu và ứng dụng liên quan đến cơ sở dữ liệu ảnh ...................................... 16
1.3.1. Ảnh trong GIS ............................................................................................................. 17
1.3.2. Đồ họa máy tính .......................................................................................................... 18
1.3.3. Bản quyền về hình ảnh................................................................................................ 19
1.4. Kết luận .......................................................................................................................... 23
Chƣơng 2. TỔ CHỨC CƠ SỞ DỮ LIỆU ẢNH ....................................................................... 24
2.1. Mô hình dữ liệu.............................................................................................................. 24
2.1.1. Nhu cầu về mơ hình dữ liệu ........................................................................................ 24
2.1.2. Các mơ hình thí dụ ...................................................................................................... 27
2.2. Kĩ thuật chỉ số hóa ......................................................................................................... 30
2.3. Kĩ thuật tìm kiếm ........................................................................................................... 30

Số hóa bởi Trung tâm Học liệu – ĐHTN




iv

2.3.1. Một số hệ thống .......................................................................................................... 32

2.3.2. Tìm các đối tƣợng dựa trên hình dạng và từ khóa ...................................................... 36
2.3.3. Thể hiện hình dạng ..................................................................................................... 38
2.3.4. Việc khớp các hình ..................................................................................................... 38
2.4. Kết luận .......................................................................................................................... 39
Chƣơng 3. TỔ CHỨC LƢU TRỮ ẢNH PHONG CẢNH THANH HĨA ............................... 40
3.1. Mơ tả bài toán ................................................................................................................ 40
3.1.1. Giới thiệu về quê hƣơng Thanh Hóa........................................................................... 40
3.1.2. Đặt bài tốn ................................................................................................................. 47
3.2. Phân tích đặc trƣng và nhu cầu về chỉ số hóa hình ảnh theo đặc trƣng ......................... 47
3.2.1. Các thuộc tính của ảnh phong cảnh ............................................................................ 47
3.2.2. Các thông tin liên quan đến ảnh.................................................................................. 47
3.3. Thiết kế cơ sở dữ liệu .................................................................................................... 48
3.3.1. Bảng dữ liệu về thể loại ảnh ....................................................................................... 48
3.3.2. Bảng dữ liệu về tác giả ảnh ......................................................................................... 48
3.3.3. Bảng dữ liệu về giấy ảnh ............................................................................................ 48
3.3.4. Bảng dữ liệu về bộ sƣu tập ......................................................................................... 49
3.3.5. Bảng dữ liệu về mô tả ảnh .......................................................................................... 49
3.3.6. Lƣợc đồ quan hệ cơ sở dữ liệu .................................................................................... 50
3.4. Khai thác cơ sở dữ liệu ảnh phong cảnh Thanh Hóa ..................................................... 50
3.4.1. Hạ tầng kĩ thuật ........................................................................................................... 52
3.4.2. Một số màn hình giao diện ......................................................................................... 52
3.5. Kết luận .......................................................................................................................... 56
KẾT LUẬN............................................................................................................................... 57
Một số vấn đề đã giải quyết .................................................................................................. 57
Phƣơng hƣớng tiếp tục nghiên cứu ....................................................................................... 58
TÀI LIỆU THAM KHẢO ........................................................................................................ 59

Số hóa bởi Trung tâm Học liệu – ĐHTN





v

Danh mục kí hiệu và viết tắt

Content Based Image
Retrieval
Color Coherence Vectorsrs
The International
Commission on Illumination
IT Information technology
Data Base

Tìm ảnh theo nội dung

Global Color Histogram
Geographic Information
System
Hue, Saturation,
Lightness/Value/Intensity/Bri
ghtness

Lƣợc đồ màu toàn cục
Hệ thống thơng tin địa lí

IR
LCH
MIRS


Information Retrieve
Local Color Histogram

PCA
Photobook
QBIC
RGB
TBIR

Principal component analysis

TBIR
Virage
Visual SEEK

Text Based Image Retrieval

Hệ thống tìm kiếm thơng tin
Lƣợc đồ màu cục bộ
Hệ thống tìm kiếm thơng tin đa
phƣơng tiện
Phân tích thành phần chính
Tên phần mềm
Truy vấn theo nội dung ảnh
Đỏ Xanh xanh dƣơng
Tra cứu ảnh dựa vào văn bản mơ
tả
Tìm ảnh dựa theo văn bản
Tên phần mềm


CBIR
CCV
CIE
CNTT
CSDL
DBMS
GCH
GIS

HSI, HSV,
HSB, và
HSL

Query By Image Content
Red Green Blue
Text Based Image Retrieval

Số hóa bởi Trung tâm Học liệu – ĐHTN

Vectorsrs gắn kết màu
Tổ chức quốc tế về màu, độ sáng
Công nghệ Thông tin
Cơ sở dữ liệu

Các giá trị đánh giá màu sắc




vi


Danh mục hình và bảng
Hình 1.1 Dữ liệu đa phƣơng tiện ................................................................................................ 5
Hình 1.2 Màu RGB ..................................................................................................................... 9
Hình 1.3 Lƣợc đồ màu CIE 1976 .............................................................................................. 12
Hình 1.4 Các thành phần của GIS............................................................................................. 17
Hình 1.5 Thiết kế đồ họa .......................................................................................................... 18
Hình 1.6 Một số ảnh lựa chọn ................................................................................................... 20
Hình 2.1 Mơ hình cơ sở dữ liệu đa phƣơng tiện tổng quát ....................................................... 25
Hình 2.2 Mơ hình dữ liệu VIMSYS ......................................................................................... 27
Hình 2.3 Mơ hình dữ liệu video tổng qt ................................................................................ 28
Hình 2.4 Mơ hình tìm kiếm thơng tin tổng qt. ...................................................................... 31
Hình 2.5 Tìm kiếm theo nội dung, dựa vào từ khóa, trên mơ hình chuyển trạng thái .............. 32
Hình 2.6 Tìm kiếm trong PICTION.......................................................................................... 32
Hình 2.7 Tìm kiếm trong QBIC ................................................................................................ 33
Hình 2.7 Hỏi theo nội dung với ngơn ngữ QBIC ..................................................................... 34
Hình 2.8 Tìm kiếm trong CVQL .............................................................................................. 34
Hình 2.9 Hiển thị kết quả trong hệ thống VEVA ..................................................................... 35
Hình 2.10 Thể hiện quĩ đạo ...................................................................................................... 36
Hình 2.11 Một số bƣớc xác định cơng việc trích đặc trƣng ảnh ............................................... 39
Hình 3.1 Bãi biển Hải Hồ, Tĩnh Gia. ...................................................................................... 41
Hình 3.2 Vị trí tỉnh Thanh Hóa trên bản đồ đất nƣớc ............................................................... 42
Hình 3.3 Tƣợng đài vua Lê Lợi. ............................................................................................... 44
Hình 3.4 Suối cá Thanh Hóa ..................................................................................................... 44
Bảng 3.1 Mô tả dữ liệu ảnh....................................................................................................... 48
Bảng 3.2 Mô tả dữ liệu liên quan đến nghệ sĩ nhiếp ảnh .......................................................... 48
Bảng 3.3. Dữ liệu về chất liệu ảnh ............................................................................................ 48
Bảng 3.4 Dữ liệu liên quan đến các bộ sƣu tập ảnh, hình đồ họa ............................................. 49
Bảng 3.5 Mơ tả thơng tin về ảnh, hình đồ họa .......................................................................... 49


Số hóa bởi Trung tâm Học liệu – ĐHTN




vii

Hình 3.5 Lƣợc đồ quan hệ của cơ sở dữ liệu ............................................................................ 50
Hình 3.6 Truy cập cơ sở dữ liệu ảnh ......................................................................................... 51
Hình 3.7 Hệ quản trị cơ sở dữ liệu và mạng ............................................................................. 52
Hình 3.8 Form cập nhật danh mục giấy ảnh ............................................................................. 52
Hình 3.9 Form cập nhật bộ sƣu tập ảnh .................................................................................... 53
Hình 3.10 Form cập nhật thơng tin ảnh .................................................................................... 54
Hình 3.11 Form tìm kiếm và kết xuất các file ảnh ................................................................... 55
Hình 3.12 Form duyệt và xem ảnh ........................................................................................... 55

Số hóa bởi Trung tâm Học liệu – ĐHTN




1

MỞ ĐẦU
Những năm gần đây, ảnh số và việc xử lý ảnh số ngày càng nhận đƣợc sự quan
tâm của nhiều ngƣời, một phần do các thiết bị thu nhận ảnh số ngày càng phổ biến, giá
cả phù hợp và trở nên thơng dụng, cùng với nó là các thiết bị lƣu trữ ngày càng đƣợc
cải thiện về dung lƣợng và giá thành nên việc lƣu trữ ảnh dƣới dạng các file ngày càng
thông dụng hơn, chất lƣợng ảnh tốt hơn, thời gian lƣu trữ lâu hơn...
Mặt khác, với sự phát triển mạnh mẽ của công nghệ thông tin, đặc biệt là sự

phát triển của mạng Internet làm cho số lƣợng ảnh số đƣợc lƣu trữ và trao đổi qua
Internet là rất lớn. Do đó bài tốn thực tế đặt ra là cần phải có phƣơng pháp tổ chức cơ
sở dữ liệu ảnh phù hợp, cùng với việc tìm kiếm, tra cứu ảnh hiệu quả, có độ chính xác
cao và có hiệu năng tốt.
Việc tìm kiếm một bức ảnh thỏa mãn tiêu chí tìm kiếm trong vơ số các bức ảnh
thuộc đủ loại chủ đề và định dạng khác nhau là rất khó khăn, và khi số lƣợng ảnh trong
một bộ cơ sở dữ liệu cịn ít, việc nhận diện một bức ảnh hay việc so sánh sự giống và
khác nhau giữa nhiều bức ảnh có thể thực hiện đƣợc bằng mắt thƣờng, tuy nhiên khi số
lƣợng ảnh rất lớn thì việc so sánh này rất khó khăn, và do đó cần có các phƣơng pháp
hiệu quả và phù hợp hơn.
Trong thực tế, bài tốn tra cứu ảnh số có rất nhiều ứng dụng quan trọng, ví dụ
nhƣ bài tốn „„Quản lý logo trong sở hữu trí tuệ‟‟, „„So sánh mẫu vân tay trong khoa
học hình sự‟‟, „„Tìm kiếm danh lam thắng cảnh trong du lịch, địa lý‟‟, „„Xây dựng thƣ
viện hình ảnh‟‟... Việc tìm ra các phƣơng pháp tổ chức dữ liệu ảnh và cách thức tra
cứu, tìm kiếm ảnh hiệu quả sẽ là điều kiện quan trọng để giải quyết các bài tốn nhƣ
trên. Từ đó, việc tìm ra các phƣơng pháp lƣu trữ, cách thức tra cứu và xếp hạng các ảnh
đƣợc lƣu trên các thẻ nhớ hay trên các thiết bị lƣu trữ là vấn đề có tính thiết thực và
hiệu quả cao trong thực tiễn.

Số hóa bởi Trung tâm Học liệu – ĐHTN




2

Với các định dạnh ảnh số khác nhau sẽ có các phƣơng pháp tra cứu ảnh hiệu
quả khác nhau. Hiện nay có hai xu hƣớng chính trong việc tra cứu ảnh số là tra cứu ảnh
theo văn bản mô tả ảnh TRIR và tra cứu ảnh theo đặc trƣng ảnh CBIR. Một số công cụ
tra cứu ảnh theo văn bản mô tả ảnh nhƣ Yahoo, MSN, Google Image Search... và một

số công cụ tra cứu ảnh theo nội dung nhƣ Tineye, Bing, Google Image Swirl,
Tiltomo...
Mỗi phƣơng pháp tra cứu ảnh đều có điểm mạnh và hạn chế riêng, ví dụ tra cứu
ảnh theo văn bản mô tả phụ thuộc vào các văn bản mô tả ảnh - điều này lại phụ thuộc
vào chủ quan của ngƣời dùng, sự khơng chính xác trong các văn bản mô tả... nên
thƣờng dẫn tới sự khơng chính xác; trong khi đó với phƣơng pháp tra cứu ảnh dựa vào
đặc trƣng lại phụ thuộc vào cách mà ngƣời dùng rút trích đặc trƣng, mà một ảnh số
đƣợc cấu thành bởi nhiều đặc trƣng khác nhau nhƣ màu sắc, không gian màu, vân ảnh,
kết cấu ảnh, hình dạng ảnh... Do đó để việc tra cứu ảnh đƣợc hiệu quả, ngƣời ta thƣờng
lồng ghép các phƣơng pháp tra cứu khác nhau một cách linh Hoạt và phù hợp.
Phƣơng pháp tra cứu ảnh đƣợc nhiều ngƣời quan tâm nghiên cứu hiện nay là kỹ
thuật „„Tra cứu ảnh dựa theo nội dung‟‟. Kỹ thuật này cho phép trích rút các đặc trƣng
của ảnh dựa vào nội dung trực quan của bản thân ảnh nhƣ màu sắc, kết cấu, hình dạng
và bố cục không gian của ảnh để làm cơ sở cho việc tra cứu, sắp xếp, tổ chức cơ sở dữ
liệu ảnh. Việc biểu diễn và trích rút đặc trƣng để nhận dạng đƣợc bức ảnh mong muốn
ấy rất quan trọng và nhiều hƣớng nghiên cứu khác nhau đó đƣợc triển khai. Một số hệ
thống tra cứu ảnh nổi tiếng nhƣ QBIC (IBM), Virage (Virage Inc.), Photobook (MIT),
Visual SEEK (Columbia University) đã áp dụng kỹ thuật này.
Tuy nhiên, khi cơ sở dữ liệu ảnh lớn thì việc tìm kiếm ảnh bằng cách so sánh
ảnh truy vấn với mỗi ảnh trong cơ sở dữ liệu sẽ tốn rất nhiều thời gian và không thể áp
dụng đƣợc đối với các cơ sở dữ liệu ảnh lớn. Thực tế đòi hỏi thời gian tìm kiếm khơng
đƣợc tăng tuyến tính đối với số các ảnh trong cơ sở dữ liệu. Chính vì lí do đó tơi chọn
đề tài “Các đặc trƣng hình ảnh trong cơ sở dữ liệu ảnh”.

Số hóa bởi Trung tâm Học liệu – ĐHTN




3


Đề tài này nghiên cứu cơ sở lý thuyết và các ứng dụng chính của kỹ thuật tra
cứu ảnh theo nội dung và kỹ thuật đánh chỉ số ảnh dựa vào phân cụm. Trong kỹ thuật
này, tại thời điểm truy vấn, ảnh truy vấn không so sánh với tất cả các ảnh trong cơ sở
dữ liệu, mà chỉ so sánh với một tập con rất nhỏ các ảnh. Trên cơ sở đó thử nghiệm
phƣơng pháp cụ thể để xây dựng một chƣơng trình phần mềm đọc vào một ảnh danh
lam thắng cảnh mẫu và tìm kiếm những ảnh danh lam thắng cảnh tƣơng tự với ảnh mẫu
trong tập hợp các ảnh cho trƣớc. Kết quả thực hiện đề tài sẽ giúp cho việc tìm kiếm các
ảnh danh lam thắng cảnh trong tập hợp các ảnh đƣợc nhanh hơn, đồng thời có thể làm
cơ sở cho việc xây dựng nên các hệ thống ứng dụng có tính thực tiễn cao phục vụ cho
nhu cầu phát triển của xã hội và cho công tác nghiên cứu sau này.
Sau phần mở đầu, nội dung của luận văn gồm 3 chƣơng và phần kết luận:
 Chƣơng 1, với nhan đề “vai trò của dữ liệu đa phƣơng tiện và việc trích chọn
đặc trƣng” sẽ trình bày tổng quan về dữ liệu đa phƣơng tiện và một số khía
cạnh liên quan đến trích chọn nội dung.
 Chƣơng 2, tổ chức cơ sở dữ liệu ảnh, trình bày về cơ sở dữ liệu ảnh và quá
trình phân tích, thiết kế và cài đặt cơ sở dữ liệu ảnh.
 Chƣơng 3, nhan đề “các đặc trƣng hình ảnh trong cơ sở dữ liệu ảnh phong
cảnh Thanh Hóa” thể hiện ứng dụng của việc tìm hiểu về cơ sở dữ liệu ảnh
trong địa bàn công tác của học viên. Các tƣ liệu ảnh của tỉnh Thanh Hóa
đƣợc dùng làm dữ liệu cho cơ sở dữ liệu ảnh.
Cuối cùng kết luận và danh sách các tài liệu tham khảo, sử dụng trong luận văn.

Số hóa bởi Trung tâm Học liệu – ĐHTN




4


Chƣơng 1. VAI TRÒ CỦA DỮ LIỆU ĐA PHƢƠNG TIỆN VÀ
VIỆC TRÍCH CHỌN ĐẶC TRƢNG
Chƣơng 1 trình bày một số khái niệm liên quan đến dữ liệu đa phƣơng tiện và ý
nghĩa của việc trích chọn đặc trƣng.

1.1. Các dữ liệu đa phương tiện và số hóa dữ liệu
1.1.1. Các dữ liệu đa phương tiện

1.1.1.1. Giới thiệu về dữ liệu đa phương tiện
Dữ liệu đa phƣơng tiện bao gồm: văn bản, đồ họa, Hoạt hình, âm thanh,
video,… Trong đó có văn bản, âm thanh, hình ảnh và ảnh động.
1. Văn bản (Text): Trong các ứng dụng đa phƣơng tiện, văn bản hiện đƣợc sử dụng
rộng dãi. Nguyên nhân là do việc thể hiện văn bản trên màn hình có kích thƣớc và
độ phân giải nhỏ rất thuận lợi. Đồng thời có nhiều thơng tin khơng thể hiện đƣợc
bằng các cơng cụ đa phƣơng tiện khác, khi đó văn bản là hình thức đƣợc sử dụng để
thể hiện thơng tin đó.
2. Âm thanh (Sound) đƣợc xem gồm âm nhạc, tiếng động, tiếng nói. Âm thanh: hay
âm nhạc cũng nhƣ các bài phát biểu có sức mạnh về mặt tạo cảm xúc. Âm nhạc có
thể kích thích tâm trạng tích cực trong phục hồi hoặc thƣ giản trí tuệ và cơ thể,
trong khi đó âm thanh nhƣ là tiếng ồn tác động đến con ngƣời. Sự kết hợp âm thanh
với hình ảnh động sẽ thể hiện thể giới trực quan. Tiếng nói là một dữ liệu có tính
liên tục, tiếng nói có thể đƣợc sử dụng giới thiệu, trình bày, nêu yêu cầu.… Tiếng
nói đƣợc coi nhƣ là cơng cụ giải thích bổ sung hữu hiệu cho văn bản.

3. Hình ảnh (Image): Thể hiện mối quan hệ từ ảnh đại diện đến nội dung cụ thể. Tâm
trạng của ngƣời quan sát có thể quyết định nội dung của hình ảnh, khi đó sự kết hợp
giữa hình ảnh và âm thanh sẽ cho kết quả đầy đủ về nội dung thực. Đồ họa
(Graphic): là một thành phần đa phƣơng tiện rất mạnh đƣợc sử dụng để thể hiện

Số hóa bởi Trung tâm Học liệu – ĐHTN





5

ngữ cảnh. Đồ họa là một kiểu dữ liệu độc lập, từ hình ảnh đồ họa có thể xác định
đƣợc những khoảnh khắc (không gian) và thời gian. Đồ họa là loại dữ liệu thích
hợp cho việc nghiên cứu và phân tích các mối quan hệ. Đồ họa có thể kết hợp với
văn bản để mô tả đầy đủ về đối tƣợng. Đồ họa thể hiện đối tƣợng chi tiết hơn so với
hình ảnh và thể hiện tốt các đối tƣợng mang tính trừu tƣợng.
4. Hoạt hình (Animation): Hoạt hình cũng là một thành phần trong cơ sở dữ liệu đa
phƣơng tiện. Hoạt hình có thể hiểu là các hình ảnh thay đổi, thể hiện sự thay đổi các
thuộc tính của đối tƣợng trong một khoảng thời gian. Hoạt hình địi hỏi nhiều
khơng gian bộ nhớ để lƣu trữ hơn so với hình ảnh. Video: là dữ liệu mạnh nhất của
tất cả các loại dữ liệu đa phƣơng tiện. Nó có khả năng miêu tả đầy đủ về thể giới
thực. Nó giúp ngƣời xem hiểu và nhớ sâu sắc nội dung cần diễn đạt.

Hình 1.1 Dữ liệu đa phương tiện

1.1.1.2. Phân loại dữ liệu đa phương tiện
Các dữ liệu đa phƣơng tiện đƣợc chia thành hai lớp: lớp các dữ liệu không liên
tục và lớp các dữ liệu liên tục.
 Các dữ liệu không liên tục là những dữ liệu khi trình bày khơng phụ
thuộc vào thời gian, các dữ liệu khơng liên tục gồm: dữ liệu văn bản
khơng có cấu trúc hoặc có cấu trúc, các hình ảnh,…

Số hóa bởi Trung tâm Học liệu – ĐHTN





6

 Các dữ liệu liên tục là những dữ liệu nội dung trình bày phụ thuộc vào
thời gian, các dữ liệu liên tục gồm: tiếng nói, âm thanh, video, Hoạt
hình,…

1.1.1.3. Các đặc tính của dữ liệu đa phương tiện
Các đặc tính chung của dữ liệu đa phƣơng tiện gồm:
1. Khơng có cấu trúc ổn định: các dữ liệu đa phƣơng tiện có khuynh hƣớng
phi cấu trúc, vì vậy các tác nghiệp quản trị dữ liệu chuẩn nhƣ: chỉ số hóa,
tìm kiếm nội dung, truy vấn dữ liệu thƣờng là không áp dụng đƣợc hoặc
rất khó áp dụng.
2. Nội dung mang tính tạm thời: các dữ liệu liên tục nhƣ: ảnh động, video,
âm thanh và Hoạt hình đều phụ thuộc vào thời gian nên việc lƣu trữ, thao
tác và mô tả chúng là rất khó khăn và gắn liền với tính thời sự.
3. Có dung lƣợng lớn: các dữ liệu đa phƣơng tiện thƣờng có dung lƣợng rất
lớn, điều này đỏi hỏi nhiều không gian lƣu trữ, tốc độ truy cập nhanh,
hiệu quả.
4. Các ứng dụng yêu cầu hỗ trợ: các dữ liệu phi chuẩn có thể địi hỏi các
quy trình xử lí phức tạp, lại có dung lƣợng lớn nên các ứng dụng khai
thác thƣờng đòi hỏi các yêu cầu hộ trợ chặt chẽ, chẳng hạn việc sử dụng
các thuật toán nén dữ liệu hiệu quả là yêu cầu của các ứng dụng khai thác
dữ liệu đa phƣơng tiện.
1.1.2. Chỉ số hóa dữ liệu

1.1.2.1. Truy xuất và chỉ số hố đa phương tiện
Các DBMS truy xuất các khoản mục dựa trên số liệu có cấu trúc khi sử dụng kết
nối chính xác. IR cũng đƣợc gọi là truy xuất dựa trên văn bản. Việc truy xuất dựa vào

nội dung đề cập đến việc truy xuất dựa trên những nét đặc trƣng truyền thống hiện nay
nhƣ màu sắc, hình thù thay cho lời giải thích văn bản v ề khoản mục truyền thơng đó.

Số hóa bởi Trung tâm Học liệu – ĐHTN




7

Việc truy xuất dựa trên nội dung là chuẩn dựa trên sự đồng dạng thay vì một kết
nối chính xác giữa một truy vấn và một tập các khoản mục dữ liệu. MIRS đề cập đến
một hệ thống cơ sở cung cấp việc truy xuất thông tin đa phƣơng tiện khi sử dụng một
tổ hợp DBMS, IR và các kỹ thuật truy xuất dựa trên nội dung. Trong một MIRS, một
vài vấn đề nhƣ phiên bản và điều khiển an tồn có thể khơng thực hiện đƣợc đầy đủ.
Một MIRS đủ bản lĩnh ra đời đƣợc gọi là MDBMS.

1.1.2.2. Trích rút đặc trưng, biểu diễn nội dung và chỉ số hoá
Trong các MIRS, một trong những vấn đề quan trọng nhất là trích rút đặc trƣng
hoặc biểu diễn nợ i dung (cái gì là những nét đặc trƣng hoặc nội dung chính trong một
khoản mục đa phƣơng tiện). Trích rút đặc trƣng có thể là q trình tự động hay bán tự
động.
Trong một vài tài liệu truy xuất dựa vào nội dung, trích rút đặc trƣng cũng đƣợc
gọi là chỉ số hoá. Sau đây, chúng ta theo quy ƣớc chung. Khi mà thuật ngữ “chỉ số”
đƣợc sử dụng nhƣ một danh từ, điều đó có nghĩa là đề cập tới cấu trúc dữ liệu hoặc
việc tổ chức những đặc trƣng đã đƣợc trích rút để nghiên cứu có hiệu quả và truy xuất.

1.2. Đặc trưng của dữ liệu hình ảnh
1.2.1. Giới thiệu
Trích rút đặc trƣng là cơ sở cho phép tra cứu ảnh dựa vào nội dung. Theo nghĩa

rộng, các đặc trƣng có thể bao gồm cả các đặc trƣng dựa vào văn bản và các đặc trƣng
trực quan. Các đặc trƣng trực quan có thể đƣợc phân loại tiếp thành các đặc trƣng
chung và các đặc trƣng trong các lĩnh vực cụ thể. Các đặc trƣng trực quan chung gồm:
màu, kết cấu, và hình dạng...; các đặc trƣng trong các lĩnh vực cụ thể là phụ thuộc ứng
dụng, ví dụ: mặt ngƣời, vân tay... Các đặc trƣng lĩnh vực cụ thể bao gồm nhiều tri thức
lĩnh vực.
Nói chung, khơng tồn tại một biểu diễn đơn tốt nhất cho một đặc trƣng đã cho,
và tùy vào điều kiện cụ thể nên lựa chọn một cách phù hợp các đặc trƣng để mơ tả ảnh.

Số hóa bởi Trung tâm Học liệu – ĐHTN




8

1.2.2. Đặc trưng và trích rút đặc trưng của ảnh số
Trích rút đặc trƣng ảnh là cơ sở của CBIR. Các đặc trƣng theo nghĩa rộng có thể
bao gồm cả đặc trƣng dựa trên văn bản (từ khóa, chú thích) và các đặc trƣng thị giác
(màu sắc, kết cấu, hình dáng...). Trong phạm vi này các đặc trƣng có thể tiếp tục đƣợc
phân loại nhƣ các đặc trƣng chung và đặc trƣng cụ thể. Các định dạng bao gồm màu
sắc, kết cấu, và đặc trƣng hình mà các ứng dụng sau này có thể ứng dụng, ví dụ khn
mặt, vân tay... Các đặc trƣng chung là tốt hơn trong một số mơ hình và có thể bao gồm
kiến thức về nhiều lĩnh vực, ta không đề cập ở đây.

1.2.2.1. Đặc trưng về màu sắc
Các đặc trƣng màu đƣợc sử dụng nhiều nhất trong các đặc trƣng tra cứu ảnh. Nó
tƣơng đối mạnh mẽ để biến nền tảng và độc lập với kích thƣớc hình ảnh và định
hƣớng. Trong tra cứu ảnh, biểu đồ màu là đặc trƣng chung thƣờng đƣợc dùng đại diện
màu sắc. Theo thống kê, nó biểu thị xác suất chung của các cƣờng độ của ba kênh màu.

Swain và Ballard đề xuất biểu đồ màu giao, là biện pháp tƣơng tự cho các biểu đồ màu
sắc. Hơn nữa, hầu hết các biểu đồ màu là rất thƣa, gây lãng phí bộ nhớ và giảm độ
chính xác khi thực hiện tra cứu ảnh, do đó Stricker và Orengo đề xuất sử dụng các biểu
đồ màu tích lũy thay vì sử dụng các biểu đồ màu thơng thƣờng.
Bên cạnh các biểu đồ màu, nhiều đặc trƣng màu khác đƣợc áp dụng trong truy
xuất hình ảnh, bao gồm các khoảng màu và bộ màu. Để khắc phục các hiệu ứng lƣợng
tử, nhƣ trong biểu đồ màu, Stricker và Orengo đề xuất sử dụng phƣơng pháp mơ-men
khoảng màu. Cơ sở tốn học của phƣơng pháp này là sự phân bổ bất kỳ màu sắc có thể
đƣợc đặc trƣng bởi những khoảng của nó. Khoảng cách Euclide đƣợc sử dụng để tính
tốn các màu tƣơng tự.
Để tạo điều kiện tìm kiếm nhanh qua các bộ sƣu tập ảnh quy mô lớn, Smith và
Chang đề xuất thiết lập bộ màu nhƣ là một xấp xỉ với biểu đồ màu. Đầu tiên họ chuyển
đổi không gian màu (R, G, B) vào một miền không gian thống nhất, chẳng hạn nhƣ
HSV, và sau đó lƣợng tử không gian màu sắc biến đổi thành các thùng M (M bins).
Thiết lập màu đƣợc định nghĩa là sự lựa chọn các màu từ không gian màu lƣợng tử.

Số hóa bởi Trung tâm Học liệu – ĐHTN




9

Bởi vì việc thiết lập các đặc trƣng Vectorsrs màu là trong hệ nhị phân, một cây tìm
kiếm nhị phân đƣợc xây dựng để tìm kiếm nhanh.

Hình 1.2 Màu RGB

Màu là đặc trƣng trực quan quan trọng đầu tiên và đơn giản nhất cho đánh chỉ
số và tra cứu các ảnh. Nó cũng là đặc trƣng đƣợc sử dụng phổ biến nhất trong lĩnh vực

này. Một ảnh màu tiêu biểu đƣợc thu từ một camera số, hoặc đƣợc tải xuống từ Internet
thƣờng có ba kênh màu (các ảnh xám chỉ có một kênh, các ảnh đa phổ có thể có nhiều
hơn ba kênh). Tuy nhiên, các giá trị của dữ liệu ba chiều từ ảnh màu không cho chúng
ta một mơ tả chính xác của màu trong ảnh, nhƣng cho vị trí của các pixel này trong
khơng gian màu. Các pixel có các giá trị (1,1,1) sẽ xuất hiện khác nhau về màu trong
các khơng gian màu khác nhau. Vì thế mô tả đầy đủ của một ảnh màu tiêu biểu sẽ bao
gồm thông tin không gian hai chiều cho biết nơi của pixel màu trong miền không gian
màu, và dữ liệu màu ba chiều cho biết nơi của pixel màu trong không gian này.
Ở đây không gian màu đƣợc giả thiết là cố định, thông tin không gian trong ảnh
bị bỏ qua, và thông tin màu trong một ảnh tiêu biểu có thể đƣợc xem nhƣ tín hiệu ba
chiều đơn.
Các tín hiệu màu một hoặc hai chiều cũng đƣợc sử dụng rộng rãi trong CBIR,
đặc biệt trong các ứng dụng mà các điều kiện thu ảnh tƣơng phản mạnh là quan trọng.
Thông tin màu ở dạng các tọa độ xy hoặc ab của các hệ thống CIE XYZ và CIE LAB
có thể đƣợc sử dụng trong các ứng dụng độc lập cƣờng độ. Thông tin màu (Hue) đƣợc
sử dụng trong các ứng dụng nơi chỉ sự khác biệt giữa chất liệu của các đối tƣợng trong

Số hóa bởi Trung tâm Học liệu – ĐHTN




10

cảnh là quan trọng. Màu là bất biến dƣới ánh sáng và thay đổi hình học của ngƣời quan
sát và các góc chiếu sáng.
Nếu coi thơng tin màu của một ảnh nhƣ một tín hiệu một, hai, hoặc ba chiều,
phân tích tín hiệu bằng việc sử dụng ƣớc lƣợng mật độ xác suất là cách đơn giản nhất
để mô tả thông tin màu của ảnh. Lƣợc đồ là công cụ đơn giản nhất. Các cách mô tả
thông tin màu khác trong CBIR gồm sử dụng véc tơ gắn kết màu, tƣơng quan màu, các

màu trội, hoặc các dấu hiệu màu, và các momen màu.

1.2.2.2. Lược đồ màu
Lƣợc đồ màu cung cấp một biểu diễn hiệu quả của nội dung màu của một ảnh
nếu mẫu màu là duy nhất so với phần còn lại của tập dữ liệu. Lƣợc đồ màu là dễ dàng
để tính tốn và hiệu quả trong mơ tả cả phân bố màu toàn cục và cục bộ trong ảnh. Hơn
nữa, nó mạnh với quay và dịch chuyển về trục quan sát và thay đổi chậm với tỷ lệ và
góc quan sát.
Do mọi pixel trong ảnh có thể đƣợc mô tả bởi ba thành phần màu trong một
không gian màu nào đó, chẳng hạn các thành phần đỏ, xanh lam và xanh lơ trong
không gian RGB, hoặc màu, độ sắc nét và cƣờng độ trong không gian HSV; một lƣợc
đồ (phân bố của số các pixel cho mỗi bin đƣợc lƣợng hố) có thể đƣợc định nghĩa cho
mỗi thành phần. Rõ ràng, một lƣợc đồ màu chứa nhiều bin hơn, nó có khả năng phân
biệt tốt hơn. Tuy nhiên, một lƣợc đồ với một số lƣợng lớn các bin sẽ khơng chỉ tăng chi
phí tính tốn, mà cũng sẽ khơng thích hợp để xây dựng các chỉ số hiệu quả cho các cơ
sở dữ liệu ảnh.
Hơn nữa, số lƣợng bin tốt không cải tiến hiệu năng tra cứu trong nhiều ứng
dụng. Một cách để giảm số các bin là sử dụng không gian màu đối lập cho phép độ
chói của lƣợc đồ đƣợc lấy mẫu xuống. Một cách khác là sử dụng các phƣơng pháp
phân cụm để xác định K màu tốt nhất trong một không gian đã cho với tập các ảnh đã
cho. Mỗi màu tốt nhất này sẽ đƣợc chấp nhận nhƣ một bin lƣợc đồ. Do quá trình phân
cụm lấy phân bố màu của các ảnh trên toàn bộ cơ sở dữ liệu ảnh vào xem xét, rất ít khả

Số hóa bởi Trung tâm Học liệu – ĐHTN




11


năng các bin lƣợc đồ trong đó khơng có hoặc có rất ít pixel. Một lựa chọn khác là sử
dụng các bin có số pixel lớn nhất do một số nhỏ các bin lƣợc đồ thu đƣợc phần lớn các
pixel của một ảnh. Một sự giảm nhƣ thế không làm giảm hiệu năng của đối sánh lƣợc
đồ, mà cịn có thể tăng cƣờng nó do các bin lƣợc đồ nhỏ coi nhƣ là nhiễu.
Khi một cơ sở dữ liệu ảnh chứa một số lƣợng lớn các ảnh, so sánh theo lƣợc đồ
sẽ bão hòa sự phân biệt. Để giải quyết vấn đề này ngƣời ta sử dụng kỹ thuật lƣợc đồ
liên kết. Ngồi ra, lƣợc đồ màu khơng đƣa thơng tin khơng gian của các pixel vào xem
xét, vì thế các ảnh rất khác nhau có thể có các phân bố màu giống nhau. Vấn đề này trở
nên đặc biệt sâu sắc với các cơ sở dữ liệu lớn. Để tăng khả năng phân biệt, một số cải
tiến đã đƣợc đề xuất để liên kết thông tin không gian. Một cách đơn giản là chia một
ảnh thành các vùng con và tính lƣợc đồ cho mỗi vùng con này. Một trong các cách chia
đơn giản là phân họach hình chữ nhật, hoặc phân đoạn vùng, thậm chí phân họach đối
tƣợng. Tăng số các vùng con sẽ tăng thông tin về vị trí, nhƣng cũng tăng về chi phí bộ
nhớ và thời gian tính tốn.

1.2.2.3. Véc tơ gắn kết màu
Các Vectorsrs gắn kết màu (CCV) đề xuất mỗi bin lƣợc đồ đƣợc phân thành hai
loại là gắn kết (nếu nó thuộc về một vùng màu đồng nhất lớn), hoặc không gắn kết (nếu
nó khơng thuộc về một vùng màu đồng nhất lớn). Cho αi và βi lần lƣợt biểu thị số các
pixel gắn kết và không gắn kết trong bin màu thứ i của một ảnh thì CCV của một ảnh
đƣợc

định

nghĩa

bằng

Vectorsrs


((α1,β1),(α2,β2),..,(αN,βN)).

Lƣu

ý

rằng

(α1+β1,α2+β2,..,αN+βN) là lƣợc đồ màu của ảnh. Do thông tin không gian thêm vào nó,
nó đã đƣợc chỉ ra rằng CCV cung cấp các kết quả tra cứu tốt hơn lƣợc đồ màu, đặc biệt
cho các ảnh hoặc có phần lớn màu đồng nhất hoặc có phần lớn các vùng kết cấu. Ngoài
ra, với biểu diễn lƣợc đồ và Vectorsrs gắn kết màu, không gian màu HSV cung cấp các
kết quả tra cứu tốt hơn không gian CIE L*u*v* và CIE L*a*b*.

Số hóa bởi Trung tâm Học liệu – ĐHTN




12

1.2.2.4. Tương quan màu
Tƣơng quan màu đƣợc đề xuất không chỉ để mô tả các phân bố màu của các
pixel, mà cịn tƣơng quan khơng gian của các cặp màu. Chiều thứ nhất và thứ hai của
lƣợc đồ màu ba chiều là các màu của mọi cặp pixel và chiều thứ ba là khoảng cách
không gian của chúng. Một tƣơng quan màu là một bảng đƣợc đánh chỉ số bởi các cặp
màu, ở đây mục thứ k cho (i,j) chỉ rõ xác suất tìm đƣợc một pixel có màu j tại một
khoảng cách k từ một pixel có màu i trong ảnh. Cho I biểu diễn toàn bộ tập các pixel
ảnh và Ic(i) biểu diễn tập các pixel có màu c(i) thì tƣơng quan màu đƣợc định nghĩa
bằng:


 ik, j 

Pr

p1 I c ( i ) , p 2 I

p

2

 I c ( j ) | p1  p2 |  k



(1  1)

Ở đây i,j Є {1,2,..,N}, k Є {1,2,..,d} và |p1-p2| là khoảng cách giữa các pixel p1
và p2. Nếu ta xét tất cả các kết hợp có thể của các cặp màu, thì cỡ của tƣơng quan màu
sẽ rất lớn (bằng O(N2d)), do đó một phiên bản đƣợc đơn giản hoá của đặc trƣng, đƣợc
gọi là tự tƣơng quan màu thƣờng đƣợc sử dụng thay thế. Tự tƣơng quan màu chỉ thu
tƣơng quan không gian giữa các màu thuần nhất và vì thế giảm số chiều xuống cịn
O(Nd).

Hình 1.3 Lược đồ màu CIE 1976

So sánh với lƣợc đồ màu và véc tơ gắn kết màu, tự tƣơng quan màu cho các kết
quả tra cứu tốt hơn, nhƣng cũng cho chi phí tính tốn cao hơn do nó có chiều cao.

Số hóa bởi Trung tâm Học liệu – ĐHTN





13

1.2.3.5. Các màu trội
Dựa trên quan sát rằng các lƣợc đồ màu thì rất thƣa và thơng thƣờng một số nhỏ
các màu là đủ để miêu tả thông tin màu trong một ảnh màu, các màu trội đƣợc sử dụng
để mô tả nội dung màu của một ảnh. Một phân cụm màu đƣợc thực hiện để thu các
màu trội đại diện của nó và phần trăm tƣơng ứng của nó. Mỗi màu đại diện và phần
trăm tƣơng ứng của nó tạo ra một cặp các thuộc tính mơ tả các đặc trƣng màu trong
một vùng ảnh.
Ký hiệu mô tả đặc trƣng lƣợc đồ màu trội F đƣợc định nghĩa là một tập các cặp
sau:

F  { ci , pi },i  1..N 

(1 2 )

Ở đây N là tổng số các cụm màu trong ảnh, ci là một véc tơ màu ba chiều, pi là
p 1
phần trăm của nó, và i i
. Lƣu ý rằng N có thể thay đổi từ ảnh này sang ảnh
khác.

1.2.2.6. Các momen màu
Các momen màu là các momen thống kê của các phân bố xác suất của các màu.
Các momen màu đƣợc sử dụng thành công trong nhiều hệ thống tra cứu ảnh nhƣ
QBIC, đặc biệt khi ảnh chứa chính xác đối tƣợng. Các momen màu bậc nhất (trung

bình), bậc hai (phƣơng sai) và bậc ba (độ lệch), đã đƣợc chứng minh là hiệu quả trong
biểu diễn các phân bố màu của các ảnh.
Về mặt toán học, ba momen đầu tiên đƣợc định nghĩa bằng:

i 

1
N

N

 f ij

(1 3)

j 1

2

1
2
)

3

1
3
)

1

i  (
N

 ( f ij   i )

1
si  (
N

N

 ( f ij   i )

(1 4 )
(1 5 )

j 1

Số hóa bởi Trung tâm Học liệu – ĐHTN




14

Ở đây

f ij

là giá trị của thành phần màu thứ i của pixel ảnh j , và N là số các


pixel trong ảnh.
Thông thƣờng momen màu thực hiện tốt hơn nếu nó đƣợc xác định bởi cả hai
khơng gian màu L*u*v* và L*a*b* chứ không chỉ duy nhất bởi không gian màu HSV.
Sử dụng thêm momen bậc ba cải tiến hiệu năng tra cứu so với chỉ sử dụng các momen
bậc nhất và bậc hai. Tuy nhiên, momen bậc ba này thỉnh thoảng làm cho biểu diễn đặc
trƣng nhạy cảm hơn với sự thay đổi cảnh và do đó có thể giảm hiệu năng.
Do chỉ 9 số (ba momen cho mỗi một trong ba thành phần màu) đƣợc sử dụng để
biểu diễn nội dung màu của mỗi ảnh, các momen màu là một biểu diễn rất nén so với
các đặc trƣng màu khác. Do biểu diễn rất nén này, nó có thể cũng giảm khả năng phân
biệt. Thơng thƣờng, các momen màu có thể đƣợc sử dụng nhƣ sơ duyệt lần đầu để
giảm khơng gian tìm kiếm trƣớc khi các đặc trƣng màu phức tạp khác đƣợc sử dụng
cho tra cứu.
1.2.3. Thông tin không gian
Các vùng hoặc đối tƣợng với các đặc tính màu và kết cấu tƣơng tự có thể đƣợc
phân biệt dễ dàng bằng việc tận dụng các ràng buộc khơng gian. Thí dụ, các vùng bầu
trời màu xanh và biển xanh có thể có các lƣợc đồ màu tƣơng tự, nhƣng các vị trí khơng
gian của chúng trong các ảnh là khác nhau. Do đó, vị trí không gian của các vùng (hoặc
các đối tƣợng) hoặc quan hệ không gian giữa nhiều vùng (hoặc đối tƣợng) trong một
ảnh thì rất hữu ích cho tìm kiếm các ảnh.
Thu thông tin không gian của các đối tƣợng trong một ảnh là một quá trình quan
trọng đối với các hệ thống GIS. Quá trình này bao gồm việc biểu diễn vị trí khơng gian
tuyệt đối và cũng bao gồm vị trí khơng gian tƣơng đối của các đối tƣợng. Các thao tác
nhƣ giao và chồng đƣợc sử dụng. Bố cục màu kết hợp thông tin không gian với thông
tin màu xuất hiện trong ảnh và tạo ra một đặc trƣng rất quan trọng trong quá trình tra
cứu, gọi là đặc trƣng màu – khơng gian.

Số hóa bởi Trung tâm Học liệu – ĐHTN





15

Biểu diễn quan hệ không gian đƣợc sử dụng rộng rãi nhất là các xâu 2 D đƣợc
đề xuất bởi Chang và cộng sự. Nó đƣợc xây dựng bởi việc chiếu các ảnh dọc theo các
hƣớng x và y . Hai tập ký hiệu, V và A , đƣợc định nghĩa trên hình chiếu. Mỗi ký hiệu
trong V biểu diễn một đối tƣợng trong ảnh. Mỗi ký hiệu trong A biểu diễn một loại
quan hệ không gian giữa các đối tƣợng. Do sự biến đổi của nó, xâu 2 D G cắt tất cả các
đối tƣợng dọc theo hình hộp tối thiểu của nó và mở rộng các quan hệ khơng gian thành
hai tập tốn tử khơng gian. Một tập định nghĩa các quan hệ không gian cục bộ. Tập cịn
lại định nghĩa quan hệ khơng gian tồn cục, chỉ ra rằng hình chiếu của hai đối tƣợng là
tách rời, nối tiếp hoặc định vị tại cùng vị trí. Thêm nữa, xâu 2 D C đƣợc đề xuất để cực
tiểu hoá số các đối tƣợng cắt. Xâu 2 D  B biểu diễn một đối tƣợng bằng hai ký hiệu,
vị trí cho bắt đầu và kết thúc đƣờng bao của đối tƣợng. Tất cả các phƣơng pháp này có
thể hỗ trợ ba loại truy vấn. Loại truy vấn 0 tìm tất cả các ảnh chứa đối tƣợng
O1 ,O2 ,...,On . Loại 1 tìm tất cả các ảnh chứa các đối tƣợng có quan hệ nào đó giữa
chúng, nhƣng khoảng cách giữa chúng là khơng đáng kể. Loại 2 tìm tất cả các ảnh có
quan hệ khoảng cách nào đó với mỗi ảnh khác.
Thêm với xâu 2 D , cây tứ phân không gian, và ảnh ký hiệu cũng đƣợc sử dụng
cho biểu diễn thơng tin khơng gian. Tuy nhiên, tìm kiếm các ảnh dựa trên các quan hệ
không gian của các vùng cịn lại một vấn đề nghiên cứu khó trong tra cứu ảnh dựa vào
nội dung, do phân đoạn tin cậy của các đối tƣợng hoặc các vùng thƣờng là không khả
thi ngoại trừ các ứng dụng rất giới hạn. Mặc dù một số hệ thống chia các ảnh thành các
khối đều, chỉ thu đƣợc sự thành công khiêm tốn với các lƣợc đồ chia không gian nhƣ
thế do hầu hết các ảnh tự nhiên không thể ép thành các khối con đều về không gian. Để
giải quyết vấn đề này, một phƣơng pháp dựa vào biến đổi radon, tận dụng phân bố
không gian của các đặc trƣng trực quan không cần phân đoạn phức tạp đƣợc đề xuất
trong.
1.2.4. Các đặc trưng mức cao

Phần lớn nghiên cứu tra cứu ảnh dựa vào nội dung hiện tại đƣợc tập trung vào
các phƣơng pháp tra cứu ảnh mức thấp. Tuy nhiên, một số nhà nghiên cứu đã cố gắng

Số hóa bởi Trung tâm Học liệu – ĐHTN




16

để lấp khoảng trống giữa tra cứu mức thấp và mức cao. Họ có khuynh hƣớng tập trung
vào một trong hai vấn đề. Vấn đề thứ nhất là nhận biết cảnh. Nó thƣờng là quan trọng
để nhận biết tồn bộ loại cảnh đƣợc mơ tả bằng một ảnh, vì có điều này trong bộ lọc
quan trọng có thể đƣợc sử dụng khi tìm kiếm, và vì có điều này có thể giúp xác định
một đối tƣợng cụ thể có xuất hiện hay khơng. Hệ thống loại này là IRIS, nó sử dụng
màu, kết cấu, vùng và thông tin không gian để thu lại sự giải thích về cảnh có khả năng
nhất, sinh ra các ký hiệu mô tả văn bản có thể đƣợc nhập vào đối với bất kỳ hệ thống
tra cứu dựa vào văn bản. Các nhà nghiên cứu khác đã nhận biết các kỹ thuật đơn giản
hơn cho phân tích cảnh, sử dụng các thành phần ảnh tần số thấp để huấn luyện mạng
neural, hoặc thông tin màu lân cận đƣợc trích rút từ các ảnh độ phân giải thấp để xây
dựng các khuôn mẫu đƣợc định nghĩa bởi ngƣời sử dụng.
Vấn đề tập trung thứ hai của các Hoạt động nghiên cứu là nhận dạng đối tƣợng,
một lĩnh vực quan tâm đối với cộng đồng thị giác máy tính trong nhiều năm. Giờ đây
các kỹ thuật đƣợc phát triển cho nhận dạng và phân loại các đối tƣợng với tra cứu cơ sở
dữ liệu theo suy nghĩ. Nghiên cứu tốt nhất trong lĩnh vực này là của, tác giả đã lôi cuốn
bởi sự phát triển một kỹ thuật cho nhận dạng ngƣời trong các ảnh, mặc dù cách tiếp cận
của ông đã đƣợc áp dụng đối với một phạm vi rộng các đối tƣợng, bao gồm ngựa và
cây. Tất cả các kỹ thuật này đƣợc dựa trên ý tƣởng của sự phát triển một mơ hình của
mỗi dạng để nhận dạng, nhận biết các vùng ảnh có thể chứa các mẫu đối tƣợng, và xây
dựng bằng chứng để xác thực hay loại bỏ sự hiện diện của đối tƣợng.


1.3. Các nghiên cứu và ứng dụng liên quan đến cơ sở dữ liệu ảnh
Hai trƣờng hợp nghiên cứu và ứng dụng liên quan đến ảnh, đƣợc nhiều ngƣời đề
cập trong những năm qua tại Việt Nam. Những nghiên cứu và ứng dụng này cần đến :
 Mô tả dữ liệu ảnh;
 Lƣu trữ và tìm kiếm dữ liệu ảnh;
 Xử lí dữ liệu ảnh.

Số hóa bởi Trung tâm Học liệu – ĐHTN




×