Tải bản đầy đủ (.pdf) (46 trang)

Nghiên cứu và phát triển các hệ thống tra cứu ảnh dựa trên nội dung (Đồ án tốt nghiệp)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (10.12 MB, 46 trang )

án t t nghi p

i Phòng
M CL C

M C L C........................................................................................................ 1
DANH M C HÌNH V .................................................................................. 3
DANH SÁCH CÁC T
L IC M
M

VI T T T .............................................................. 4

N .................................................................................................. 5

U .......................................................................................................... 6

CH
NG 1: CÁC KHÁI NI M C B N V TRA C U NH D A
TRÊN N I DUNG .......................................................................................... 7
1.1 Gi i thi u .............................................................................................. 7
1.2 Nh ng thành ph n c a m t h th ng tra c u nh d a trên n i dung.... 8
1.2.1 Trích ch
1.2.2

c tr ng (Features Extraction):................................. 9
s (Indexing):............................................................... 11

1.2.3 Giao di n truy v n (Query Interface):......................................... 12
1.3 Kho ng cách ng
1.4 Các ph



u nh d a trên n i dung ............ 12

ng pháp làm gi m kho ng cách ng

1.4.1 K thu t b n th

it

.......................... 13

ng.......................................................... 14

1.4.2 K thu t máy h c ........................................................................ 16
1.4.3 K thu t ph n h i liên quan ........................................................ 22
1.4.4 M u ng

............................................................................ 23

1.4.5 Tra c u nh web.......................................................................... 25
1.5

c ng d ng c a tra c u nh d a trên n i dung................. 27

CH
NG 2: TRA C U NH D A TRÊN N I DUNG V I PH N
H I LIÊN QUAN ......................................................................................... 28
2.1 Gi i thi u ph

ng pháp ph n h i liên quan ....................................... 28


2.2 Ki n trúc t ng quan c a h th ng ....................................................... 29
2.2.1 Trích ch
2.2.2

t

c tr ng ................................................................... 30
ng t ............................................................................ 31

2.2.3 Ph n h i t ng
2.3 Các ph

i dùng............................................................... 32

ng pháp ph n h i liên quan ................................................. 32

2.3.1 K thu t c p nh t truy v n .......................................................... 32

- CT1401

1


án t t nghi p

i Phòng

2.3.2 Nh ng k thu t h c th ng kê...................................................... 33
2.4 Nh ng thách th c trong ph n h i liên quan ....................................... 35

2.5 CBIR v i ph n h i liên quan s d ng SVM....................................... 36
2.5.1 Support Vector Machine ............................................................. 36
2.5.2 Ph n h i b
CH

NG 3:

3.1

ng và h c ch

ÁP D

ng .............................................. 37

T TH

NGHI M ............................ 38

t ................................................................................................. 38

3.1.1 C s d li u ............................................................................... 38
3.1.2 Trích ch

c tr

i sánh................................................ 38

3.2 Các ch


ng trình ............................................................... 38

3.2.1 M

nh truy v n .......................................................................... 38

3.2.2 Tra c u nh.................................................................................. 38
3.2.3 Ph n h i liên quan....................................................................... 39
3.3 K t qu th nghi m............................................................................. 40
3.3.1 Giao di n ch

ng trình ............................................................... 40

3.3.2 M t s k t qu th nghi m ......................................................... 41
3.4 M t s nh n xét v ch

ng trình ........................................................ 44

K T LU N .................................................................................................... 45
TÀI LI U THAM KH O ............................................................................ 46

- CT1401

2


án t t nghi p

i Phòng
DANH M C HÌNH V


Hình 1-1: Ki n trúc t ng quan v h th ng tra c u nh.................................... 8
Hình 1-2: S
minh h a b n th
i t ng.................................................. 15
Hình 1-3: S
mô t k thu t SVM ............................................................. 17
Hình 1-4: L
mô t ph
............................................ 20
Hình 1-5: S
mô t ph ng pháp RF......................................................... 23
Hình 1-6: H th ng tra c u nh Worldnet s d ng Semantic template.......... 25
Hình 2-1: Ki n trúc h th ng tra c u nh d a trên n i dung v i ph n h i liên
quan ......................................................................................................... 30
Hình 3-1: Giao di n ch ng trình ................................................................... 40
Hình 3-2: Ng i dùng ch n nh truy v n ....................................................... 41
Hình 3-3: K t qu tra c
u .................................................................. 41
Hình 3-4: Ng i dùng ch n nh liên quan l n 1............................................. 42
Hình 3-5: K t qu sau vòng l p ph n h i th nh t ......................................... 42
Hình 3-6: K t qu sau vòng l p ph n h i th hai ........................................... 43
Hình 3-7: Ng i dùng ch n nh liên quan l n 3............................................. 43
Hình 3-8: K t qu sau vòng l p ph n h i th ba ............................................ 44

- CT1401

3



án t t nghi p

i Phòng
DANH SÁCH CÁC T

VI T T T

STT

T vi t t t

Mô t

1

APC

Affinity Propagation Clustering

2

ARE

Augmented Relation Embedding

3

CBIR

Content-Based Image Retrieval


4

CNS

Color Naming System

5

CRT

Composite Region Template

6

FSVM

Fuzzy Support Vector Machine

7

HSL

Hue-Saturation-Luminance

8

KL

Karhunen-Loeve


9

LGRM

Local and Global Regressive Mapping

10

LPC

Locality Preserving Clustering

11

MRBIR

Manifold-Ranking Based Image Retrieval

12

MSRA

Microsoft Research Asia

13

NCut

Normalized Cut


14

PCA

Principal Component Analysis

15

RF

Relevance Feedback

16

RGB

Red-Green-Blue

17

ST

Semantic Template

18

SVM

Support Vector Machine


19

SVT

Semantic Visual Template

- CT1401

4


án t t nghi p

i Phòng
L IC

Em xin chân thành c
y giáo, Th
ng d n t n tình ch b o em r t nhi u trong su t quá trình tìm hi u nghiên c u và
án này t lý thuy
n ng d ng. S
ng d n c a th
có thêm ki n th c v l p trình và ki n th c v
c x lý nh.
ng th
tin

c th y cô trong khoa Công ngh thông
i H c Dân L p H


trang b cho em nh ng ki n th
em hoàn thành t

n c n thi t trong su t th i gian h c t p t i
án này.

Em xin chân thành c m
i h c Dân L p H i Phòng, ban giám hi

n H u Ngh , Hi
ng
ng, khoa Công ngh thông tin,

u ki n t t nh t trong su t th i gian em h c t p
và làm t t nghi p.
Trong quá trình h

t th

tránh kh i nh ng thi u sót, em r
t c các b

k t qu c

Sau cùng, em xin g i l i c
em xây d

án t t nghi p không


c s góp ý quý báu c a các th y cô
c hoàn thi
om i

u ki

án này.

Em xin chân thành c

H i Phòng, ngày 2 tháng 12

2014

Sinh viên th c hi n

- CT1401

5


án t t nghi p

i Phòng
M

T khi m

U


c toàn c u hoá kéo theo s m r ng c a các n i dung
n

nh, âm nh c, video,

ki m các lo

, khi n cho nhu

u chia s và tìm

t cách nhanh chóng. Và trong s các
ik

n các d li u hình nh. M

theo m t m

,

u tìm ki m hình nh

chung quy

i dùng mu n tìm ki m

là nh ng thông tin kèm theo và hình nh mà h c n ho c m t s khác l i tìm ki m
hình nh

xác nh n tính chính xác c a thông tin h nh


c. Các d li u hình

u ph c v cho nhi
c quan tr ng trong cu c s
th ng b o m t, an ninh, y t , hay các h th ng phát hi n chuy
vi c nghiên c u và phát tri n các h th ng tra c u nh ngày càng tr nên c p thi t.
án s trình bày k thu t ph n h
d a trên n
thu h p kho ng cách ng

Các khái ni

c ng d ng trong tra c u nh
, c i thi n hi
u.

n v tra c u nh d a trên n i dung

Gi i thi u các khái ni
các thành ph n trong nó.

n v h th ng tra c u nh d a trên n i dung và

Tra c u nh d a trên n i dung v i ph n h i liên quan
Gi i thi

n h i liên quan và máy h c SVM.
Áp d


t

t th nghi m
nghi m d a trên lý thuy t t

- CT1401

6


án t t nghi p

i Phòng
CÁC KHÁI NI
N V TRA C U NH D A
TRÊN N I DUNG

1.1 Gi i thi u
Trong th
i bùng n v tìm ki m thông tin hi n nay, ngoài vi c tìm ki m các
n n i dung thì vi c tìm ki m nh
g có
ng tr nên ph bi n. V i
ngu n tài nguyên nh vô cùng to l n trên m ng internet, thì vi c tìm ki m chính xác
m tb c
tìm ki m m t b c
hi n l

i yêu c u c


t trên t ng t m

i dùng là khó kh thi. Chúng ta khó có th
ng,
vi c tìm ki
c th c
n khi tìm th

nh có n i dung c n tìm.

V i l i ngu n tài nguyên nh trên m ng internet s ngày càng nhi
phát tri n c a công ngh s
, nhu c u th t s

a theo s
i chúng ta

ph i có m t công c h tr cho vi c tìm ki m nh càng s m càng t t.
Có hai ki u tìm ki m d li u
m theo t khoá và tìm ki m theo
n i dung nh. Tìm ki m theo t khoá d tho
c nhu c
i dùng v i các
nhu c u tìm ki m hình nh m i theo mong mu n b n thân h . Và thêm n a, tìm
ki m theo t
m theo n i dung b i vì nó ho
ng trên
vi c phân tích và so sánh các t ho c c m t
ng v
t qu .

Ki u d li u này là d ng cá
n, t ng cho nên k t qu
chóng,
i dùng ph i có nh m u. Tuy nhiên,
m là k t qu hình nh không ph
i mong
mu n c
i dùng. Và nó ch phù h p nh t v i vi
ng nhu c u c
i
dùng thông qua các mô t b ng t ng
kh c ph
m này c a tìm ki m
theo t khoá, m
i là tìm ki m nh theo n i dung. Ý
ng chính c
o ra s mô t nh m t cách t
ng tr c ti p
t n i dung nh b ng s phân tích n i dung nh mà không có s can thi p th công.
mc
a trên t khóa là vi c trích
ch
c th c hi n m t cách t
ng và n i dung c a nh luôn luôn nh t
quán. Trong th c t ,
ng s d
c cao (khái
ni m), ch ng h
khóa, mô t
gi i thích hình

t c a chúng. Trong khi nh
c trích ch n m t cách t
ng b ng
cách s d ng k thu t c a th giác máy ch y
c th p (màu s c,
k t c u, hình d ng, v
c dù nhi u thu t toán ph c t
c
thi t k
mô t màu s c,
tc
t toán này
v n không th ph n ánh th
nh.

- CT1401

7


án t t nghi p

i Phòng

Do v y, kho ng cách ng
c th p và các khái ni m
m c cao v n còn l n nên hi u su t c a CBIR là v n còn xa v
ic a
i
dùng.

thu h p kho ng cách ng
, ph n h i liên quan (RF
m t công c hi u qu
c i thi n hi
a h th ng CBIR. Nói chung, RF
nh m m
i thi n hi
u thông qua vi c h c nh
u ch nh c a
i dùng trên nh ng k t qu tra c u. Theo cách này, h th ng c n ph i th c hi n
thông qua m t s vòng l p. Trong m i vòng l p, h th ng s tr l i m t danh sách
nh t v i nh truy v n d a trên kho ng cách Euclidean. Sau
c
i s d ng gán nhãn liên quan ho c không liên

ng n các
, các nh này s

quan v i nh truy v n. S d ng nh ng
gi ng, nh ng k thu t h c máy s
c áp d

ng h t
xây d ng mô hình phân l p t t

c các
d li u thành hai l p liên quan và không liên quan v i nh
truy v n. Hàm phân l
cs d
ph

liên quan
c a
d li u.

1.2 Nh ng thành ph n c a m t h th ng tra c u nh d a trên n i dung
M t h th ng tra c u

i các thành ph

-1 [5].

Hình 1-1: Ki n trúc t ng quan v h th ng tra c u nh
Trích ch

,

n quan tr ng nh t trong tra c u nh d a trên n i dung:
s và giao di n truy v
i dùng.

- CT1401

8


án t t nghi p

i Phòng

1.2.1 Trích ch


tures Extraction):

a nh bao g
c tính
c tính ng
c tính
c (color), hình d ng (shape), k t c u
(texture), v trí không gian (spatial location). Chúng có th
c trích xu t t
ng
ho c bán t
ng. c tính logic cung c p mô t tr
ng c a d li u hình nh
các c
khác nhau.
ho c bán t
ng. M t ho c nhi

c tính logic
c chi t xu t b ng tay
c s d ng trong ng d ng c

ng,

th .

1.2.1.1

c (color):

c là m t trong nh

c s d ng ph bi n trong tra
m t không gian màu l a ch n. S
ng

c u nh. Màu s
c a không gian màu là có s
c th hi n g

c dùng cho các ng d ng khác
i nh n th c c
i và

c s d ng r ng rãi trong
c ph bi n ho c
các mô t trong h th ng CBIR bao g m: ma tr n hi p bi n màu, bi
màu,
moment màu, và véc- k t h p màu [5]
ng s
k t qu , m t t
c xây d
tính toán t

ng l y t
m b t bi

m quan sát khác nhau và s chi u sáng. Theo
c tính toán. Các b t bi n


c
hue c p hue-hue
i x ng. Vi c l a ch

c
thu c vào k t

qu

n. Ví d , n u vi
n cung c
ng mà không có màu
ng nh t, thì rõ ràng màu trung bình không ph i là l a ch n t t. V i các ng d ng
c bi
d li u khuôn m
i, thì mi n tri th c có th
c khai thác
gán tr ng s cho t
m nh trong vi c tính toán vùng màu.

1.2.1.2

t c u (texture):

K t c u không
c, vì th mà m t
s h th ng không s d
t c u. Tuy nhiên, k t c u cung c p các
thông tin quan tr ng trong vi c phân lo i nh, vì nó mô t n i dung c a nhi u nh
th

trái cây, mây, cây, g ch, và v
t c u là m
quan tr ng trong vi
c cao cho m
u nh [5].
tc
c s d ng trong h th ng tra c u nh bao g m các
, ch ng h
c bao g m s d ng l c Gabor ho c
bi

i wavelet, th

tc
t c u Tamura

wold

th ng kê c c b ,
xu t b i Liu và các

c ng s

- CT1401

9


án t t nghi p
1.2.1.3


i Phòng
a trên hình d ng (shape):

Hình d ng là m t khái ni
t.
ng c a
các ng d ng nói chung bao g m: t l aspect, tu n hoàn, mô t Fourier, b t bi n
th
ng bao liên ti
nh
quan tr ng, m
c s d ng r ng rãi trong CBIR
nhi u mi n

t c u [5]
c bi

ng nhân t

hi n tính h u ích trong
iv i
cs

d ng trong h u h t các lo i gi y t , tuy nhiên, nó l

áp d

hình d ng so v i màu s c và k t c u do s thi u chính xác c
g p khó k

th y ti
s d

ng ch
CBIR. Ví d

c s d ng trong m t s h th ng và cho
ng s
n ch ng h
l
nh

ng. M t h th ng mà Wang và c ng s
quán tính c a th t t 1mô t hình d ng khu v c.

1.2.1.4
Các vùng ho

n. M c dù

d ng tiêu chu n hoá

(spatial location):
ng v i thu c tính màu s c và k t c u

có th

c nh n ra m t cách d dàng b i ràng bu c không gian [5]. Ví d , các vùng có
b u tr i và bi n màu xanh có th có bi
,

i có v trí không
gian trong nh khác nhau. Vì th , v trí không gian c a các vùng (ho
i
ng) ho c m i liên h không gian gi a nhi u vùng trong m t nh thì r t h u d ng
cho vi c tra c u nh. M t bi u di n c a m i liên h không gian
c s d ng r ng
rãi nh t
2D strings
c Chang và các c ng s
K thu t
này
c xây d ng b ng cách chi u các nh theo tr c x và y. Cho hai t p ký hi u V
và A,
phép chi u. C m i ký hi u trong V
c bi u di n
b im
ng trong nh. Còn m i ký hi u trong A
c bi u di n b i m t
lo i liên h không gian gi
ng. N u chúng khác nhau, thì k thu t
2D G-string s c t t t c
ng d c theo
ng bao h p nh nh t và m
r ng m i liên h không gian vào trong hai t p toán t không gian. M t t p toán t
nh
m i liên h không gian c c b . Và t p còn l i
nh
m i liên
h không gian toàn c c, ch ra r ng phép chi u c
ng là tách ra, n i li n

ho
nh cùng v trí. Ngoài ra, k thu 2D C-string
xu t
b i Lee và các c ng s
c c ti u con s
t. Còn k
thu 2D B-string
c gi i thi
i Yang và các c ng s .
K thu t này s bi u di n m
ng b i hai ký hi u, thay th cho vi c m
u
và k
ng bao c
ng.

- CT1401

10


án t t nghi p
H uh
tìm t t c các nh ch

i Phòng
có th t o ra ba ki u truy v n. Ki u truy v n 0 s
ng O1, O2, , On. Ki u truy v n 1 s tìm t t c các

nh ch

ng mà có m i liên h ch c ch n gi a t
ng khác,
kho ng cách gi a chúng là
. Cu i cùng, ki u truy v n 2 s tìm t t c
các nh mà có liên k t kho ng cách ch c ch n v i t

ng khác.

Ngoài k thu
2D string
trên, còn có các k thu
spatial
quad-tree
c gi i thi
i Samet,
symbolic image
c
gi i thi
i Gudivada và Raghavan. Hai k thu
c
bi u di n thông tin không gian. Tuy nhiên, tra c u nh d a trên m i liên h
không gian c a vùng thì v n là m t bài toán khó trong nghiên c u tra c u nh d a
trên n i dung. B i vì, các phân
nc a
ng ho
y thì
ng không kh thi tr khi trong các ng d ng r t gi i h n. M c dù, m t s h
th
n phân chia nh vào trong các kh i con chu n, mà ch
c thành

công nh v
h u h t nh t nhiên không b
nén vào các kh i con chu
gi i quy t v
này, m
a trên
k thu Radon transform , m t k thu t mà s khai thác
c quan
c a s p x p không gian mà không c
n ph c t
xu
i Guo và các c ng s .

1.2.2

c

s (Indexing):

M tv
quan tr ng khác trong tra c u nh d a trên n
s
và tìm ki m nhanh nh d
c quan. B i vì, các vécc a
ng t i s chi
p cho các c u trúc
s truy n th ng. Vi c gi m s chi
cs d
c khi
lên k ho

s .
M t trong nh ng công ngh
c s d ng ph bi n cho vi c gi m s chi u là
Phân tích thành ph n chính PCA [5]. Nó là m t công ngh t
c ánh x
tuy n tính d li
u vào cho m t không gian to
. Các tr
c th
ánh x t
n in d li u. H th ng QBIC s d ng PCA
làm gi m 20
chi u trong vécng thành hai ho c ba chi u. Ngoài công ngh
PCA ra, nhi u nhà nghiên c u còn s d ng bi
i KL
làm gi m s chi u trong
c dù, bi
i KL có m t s thu c tính h u d
nh v trí h u h t không gian con quan tr ng, các thu
quan tr
i v i vi
có th b phá hu trong su t quá
trình gi m các chi u mù. Ngoài hai công ngh bi
i PCA và KL, thì m ng
-ron
c ch ng minh là công c h u ích cho vi c gi m s chi

- CT1401

11



án t t nghi p

i Phòng

1.2.3 Giao di n truy v n (Query Interface):
bi u di n nh tra c u t
d li
i dùng thì có r t nhi u cách.
Và nh
ng nh
c s d ng là: duy t qua m c, truy v n b i
khái ni m, truy v n b i b n phác th o, và truy v n b i ví d . Duy t qua m c là
g pháp duy t qua toàn b
d li u theo danh m c các nh. M
a
d li
c phân lo i thành nhi u m c khác
c n i dung tr c quan. Truy v n b i khái ni m là tra c u nh

nhau theo ng

theo mô t khái ni m liên quan v i t ng

d li u [5]. Truy v n b i

b n phác th o và truy v n b i ví d là v ra m t b n phác th o ho c cung c p m t
nh ví d t nh ng nh v
s d li u.


c quan s

bao g m c

Trong s ba tác v trên, thì trích ch
nhi m v quan tr
trên n i dung t p t

c trích ch n t

) là

t. Ph n l n các nghiên c u tra c u nh d a
m v này.

1.3 Kho ng cách ng

u nh d a trên n i dung

c tra c u nh hi n nay có hai h th

c phát tri n là: h

th ng tra c u d a trên n i dung và h th ng d a trên t
m khác bi t duy
nh t gi a hai h th ng này chính là s
i thì
ng s d ng các khái ni
khoá, mô t

n, gi i thích hình
,
nh
ct
ng trích ch n b ng k thu t th giác máy tính thì ch y
m c th p (màu s c, k t c u, hình d ng, v trí không gian,
). Nói chung là
không có m i liên quan tr c ti p gi
c th
c cao.
M c dù, các nhà nghiên c u
phát tri n r t nhi u các thu t toán ph c t
mô t
c, k t c u, hình d ng. Th
, các thu
mô t
ng
a hình nh, và có nhi u h n ch khi gi i
quy t m
d li u n i dung nh l n. Các thí nghi m m r ng trên h th ng
CBIR cho th y n
c th
ng không th mô t các khái ni m
ng
c cao
i dùng.
, hi u su t c a CBIR v
c nhu c u c
i dùng. Tác gi Eakins
xu t ra

ba m
c a các truy v n trong CBIR.
M c 1: Tra c u b
ho c b trí không gian c a các ph n t

- CT1401

c, k t c u, hình d ng
nh.

12


án t t nghi p

i Phòng

M c 2: Tra c u b
v im tm
suy lu n logic. Ví d

nh b
,
t b c nh có ch a bông hoa

M c 3: Tra c u b i các thu c tính tr u
ng trong nh, ho c n i dung c a
là tra c u tên các s ki n,
tb c
Có th th y m c 2 và m


ng, bao hàm s
c miêu t

ng m

a nh, ho c các d u hi u n i b t,

c g i là tra c u nh ng

gi a m c 1 và m c 2 là kho ng cách ng
nh m c th p và s
Kho ng cách ng
.

1.4

Ví d

, và kho ng cách

. S khác bi t gi a gi i h n mô t

phong phú ng

i dùng,

c g i là

m kho ng cách ng

Làm th

ng
các công ngh

chúng ta có th liên k
c cao?. Câu h
gi i quy t v

kho ng cách ng
B ng cách áp d ng vào

c th p c a nh v i các
y các nhà nghiên c u c g ng phát tri n

này. Các công ngh m i trong vi c làm gi m

n nay có th
c phân ra theo các tiêu chí khác nhau.
c khác nhau, các công ngh tra c u nh có th có

th
c chia ra là: tra c u nh ngh thu t, tra c u nh phong c nh, tra c u nh
web,
t s k thu t
cs d
suy ra ng
m c cao:
(1) S d ng b n th


nh ngh a khái ni m m c cao.

(2) S d
c có giám sát ho
c th p v i các khái ni m truy v n.

g

c

(3) Gi i thi u ph n h i liên quan (RF) vào vòng l p tra c u nh cho vi c h c
liên t
nh c
i dùng.
ST

(4) Sinh m u ng
(5) S d ng c
c a
tra c u nh web.

h tr tra c u nh m c cao.
n t trên web và n i dung tr c quan

Trong t t c các k thu t trên thì k thu t (3) có th r t khó
c áp d ng và ít
c ph bi n r ng rãi. Vì th mà k thu t (3) ch có th
c tìm th y nh ng
mi
c bi

o tàng ngh thu
hi n nay ch có k thu
c áp d ng r ng rãi
th ng áp d ng k thu t (2) thì có 3 thành ph

- CT1401

n báo chí. Và
i s ng. Và nh ng h

13


án t t nghi p

i Phòng

Trích ch

nh m c th p.
.

Làm gi m kho ng cách ng
Thêm n a là, có m t s h th ng ch s d ng m t k thu
c u nh d a trên ng
h p 3 ho c 4 k thu t

t s h th ng s d ng k t
trên.


1.4.1 K thu t b n th
Trong m t s
h ng ngày. Ví d
da tr i

tra

ng

ng h p, ng
b u tr i
c mô t
th ng s d ng ng

ng s
m

d

c suy ra t ngôn ng
trên,
u, màu xanh
n,
c tiên, các kho ng
nh m c th p. V i m i kho ng

c mô t m c trung gian c a nh, ví d
v a,
ng mô t
hình thành m t m u t v

b n th
ng
c a khái ni m truy v n m c cao.

xanh nh t, xanh
n, và cái

d li u nh có th
c phân lo i vào các m c khác nhau b ng cách ánh
x mô t ng
c cao (các t khoá) d a trên ki n th c c
i. Ví d
b u tr i
xanh nh t màu s c),
u
(k t c u), trên cao v trí không gian).
, Mezaris và c ng s
i
thi u h th ng tra c u nh d a trên b n th
ng. Trong h th ng này, m i
vùng c a
c mô t b i màu trung bình trong không gian màu lab, v trí c a
nó trong tr c d c và tr c ngang, kích c và hình d ng c a nó. B n th
ng
c minh ho b i hình 1-2.

- CT1401

14



án t t nghi p

i Phòng

Hình 1-2
V y h th

minh h a b n th

ng

nào?. M u ch t
cl
t c u và màu s c. Trong h th ng máy tính hi n nay,

ng t

tri

i thì ch có kho ng t
n 20
t tên. Nh ng mô hình tên màu bi u di n m i liên quan gi a không
gian màu s v
c
i s d ng.
, Berk và các c ng s
xu t m t h th ng tên màu n i ti ng
CNS
(Color Naming System). H th

ng t hoá không gian màu
HSL (Hue-Saturation-Luminance)
ng chính
ng t giá tr Hue
tt
n. Saturation và Luminance thì
ng t
bin
u ch
sáng c a
màu. M t b
CNS
, cam, nâu, vàng, xanh lá cây, xanh
, v i vi c thêm vào các giá tr vô s
, xám và tr ng.
cm tm
n.
Thêm n a, liên k t màu t i s c m nh n và tr c quan cho vi c tra c u tranh,
nh, thì m t lo
n sángt i,
n m-l nh,
n bù,
là: màu vàng thì
cg
m ,
cg
l nh
t s nhà nghiên
c u khác thì c g
ng liên quan trong c nh thiên nhiên.

Ví d : màu tr ng thì gán v i tuy t, mây,
thì gán v i m t tr i. Vì th mà
b ng cách này h th
m s chênh l ch ng
tr truy v n
b ng t khoá.

th

th
CNS ,
n xây d ng m t h
t tên k t c u mà s chu n hoá các mô t và bi u di n c a k t c u.

- CT1401

15


án t t nghi p
Tuy nhiên,
trong ng d

i Phòng
n nay v
i s ng. Vì vi

t h th
t tên k t c u nào có s n
t tên cho k t c u th c s r t khó. Trong nh ng


xây d ng m t h th
an tr

c g

D a trên nh ng th nghi m tr c quan,
r ng có ba thu c tính quan tr
này; và làm th

t tên k t c u, m t s nhà nghiên c u
nh n bi t k t c u.
, Rao và các c ng s
i nh n bi t k t c

ra
p l i,

ph c t p. Tuy nhiên, làm th
có th ánh x
t c u m c th p v i ba y u t trên

thì v n còn ph i nghiên c u thêm.
So v i màu s c thì k t c u v

c tìm hi u sâu và mô hình

Và có m
, thay vì vi c s d ng tên k t c
v n. Thì m t s nhà nghiên c u l i c g

ng t hoá các c
c u thành các kho
Cu i cùng,
li u
khác nhau l
h

.

khoá cho truy
t
t c u.

n th

ng s ho
ng t t v i m
d
i ng
i m t b các nh có n i dung
n ph i có nh ng công c hi u qu
h th ng có th

c ng

1.4.2 K thu t máy h c
Trong m t s
ng h p,
có th
th ng yêu c u c n ph i có m t công c hình th c

thu t máy h c có hai lo i là: h
chúng ta s tìm hi u k thu t máy h c có giám sát.

c cao, thì h
thu t máy h c. Mà trong
,

1.4.2.1 H c có giám sát
H c có giám sát d a theo thu t toán Support Vector Machines (SVM) và phân
l p Bayesian
cs d
h c các khái ni m m c cao t
nh m c th p. V i m t n n t ng lý thuy t m nh m , SVM
cs d
nh n
d
ng, phân lo i text,
,
t gi i pháp t t cho
vi c h c trong h th ng tra c u nh.
u, SVM
c thi t k cho vi c phân l p
nh phân. Gi s r ng: có m t t p d li u hu n luy n {x1, x2,
, xn},
véc{y1, y2,

trong không gian X

Rd thu c v hai l p r i r c v i các nhãn c a nó là


, yn} và yi {-1, 1}

(Optimal separating plane) nh m c
m d li u g n nh t
1-3.

- CT1401

, chúng ta có m t m t ph ng phân tách t
i hóa kho ng cách t siêu ph

n các

16


án t t nghi p

i Phòng

Các vécm trên m t m
trên s
c g n nhãn là +1

is
tr véc-

c g n nhãn là -1, còn các vécm t
c
n các m u hu n luy n n m


g n v i siêu ph ng nh
h
c nhi u khái ni m cho tra c u nh, m i m t b
SVM s
c hu n luy n cho t ng b khái ni m. Ví d cho vi c dùng SVM trong
chú thích
n hu n luy n, m i m t mô hình SVM nh phân s
c
hu n luy n cho t ng b khái ni m trong 23 b khái ni
c l a ch
n giai
n ki m th thì vùng d li
c g n nhãn s
b SVM
n khi mô hình SVM nào cho ra k t qu

t vào t ng
t thì mô hình

thích h p v i vùng d li

Hình 1-3

mô t k thu t SVM

c s d ng r ng rãi là phân l p Bayesian.
, Ailaya và các c ng s
d ng l p phân lo i nh phân Bayesian
ghi l i các khái ni m m c cao c a c nh t nhiên t

c th
d
li u nh s t
ng phân lo i nh vào trong m t lo i chung là n i c nh/ngo i c nh,
nh ngo i c nh l i ti p t
c phân lo i ti p vào trong lo i thành
ph /phong c nh,
, Luo và Savakis
ng
M

Bayesian

phân lo i nh n i c nh/ngo i c nh.

- CT1401

17


án t t nghi p

i Phòng

M t k thu t h
h c các khái ni m là m ng -ron.
s d ng k
thu t này thì các khái ni m ph
c phân chia thành 11 lo i là: g ch, mây, lông
thú, c ,

,
c hu n luy

ng,

, cát, da,

c.
,m ts
c th p c

ng l n d li u
n)

ng -ron phân l
thi t l p liên k t gi
c th p
c cao (các nhãn phân lo i). M t b t l i c a k thu t này là nó yêu

và ng
c um ts

ng l n các d li

Ba thu t toán
C nm ts

c hu n luy

trên t n t


ph c t p tính toán cao.

m:

ng l n các m u hu n luy

c g n nhãn, và các d li u này

thì d b l i.
T p hu n luy n thì ph

cc

nh su t trong quá trình h c và

n

ng d ng.
, n u mà mi n ng d
i, thì các m
c cung c
m b o tính hi u qu phân l p.
Bên c nh các thu

c g n nhãn m i ph i

c nêu trên, k thu t cây quy

tree

bi u di
lên m t c u trúc cây b ng vi

nh (decision

M ts p
quy không gian thu c tính input vào

trong m t t p không gian không ch ng l p. M t t p lu t quy
nh có th
c
bi u di n b
ng d n t g
n ng n. Vào
, Sethi và Coman
s d
nh CART
bi u di n lu t quy
nh ánh x
phân b màu toàn c c (HSV bi
không gian màu) trong m t
chú thích
n (4 t khóa: Sunset, Marine, Arid images and Nocturne). Còn MacArthur và
các c ng s c a ông
nh C4.5
c d a trên m t
t p nh liên quan cho truy v
cs d
t mô
phân l

d li u nh vào hai l p: liên quan và không liên quan. Thu t
toán này
c s d ng trong vòng l p ph n h i liên quan (RF
cung c p các nh
i dùng g n nhãn vòng l p ti p theo.
So v
c khác, cây quy
nh là khái ni
n, hi u
qu v
và nhi u
, cây quy
nh
có th d dàng chuy n thành m t t p quy t c có th tích h p vào m t h th ng
ng quy
nh t
ng. Tuy nhiên,
mc
pháp này là thi u tính mô, n u mà s d ng trong vi c h c khái ni m m c cao
trong tra c u
.

- CT1401

18


án t t nghi p

i Phòng

này

kh c ph

c nh

d ng giá tr thu c tính input,
giá tr liên t c. M c dù, m t s thu
tính liên t c. Th

c phát tri n b i các tác gi
a,
ng các
c thi t k

u có hay không các thu

n nào
nh m c th p thì có
r i r c hóa các thu c
c thi t k

n nay v

phân
i gi i.

1.4.2.2 H c không giám sát
Không gi


thu t h c có giám sát là có s hi n di n c a k t qu trong

quá trình h c. H c không giám sát thì s không cho k t qu
t ra là: làm th
Phân c m nh là m t k thu t h

u ra, mà nhi m v

t ch c ho c phân c
n hình cho m

u vào.
u.

K thu t này c g ng gom các d li u nh gi ng nhau vào trong m t c m m t cách
t

, và gi m thi u s gi ng nhau gi a các c m khác nhau. M i c m k t qu s
c liên k t v i m t nhãn l p và nh trong m t c m thì s
nhau.
m k-mean truy n th ng và các bi n th c
phân c m nh.
, Stan và Sethi
d

ng

phân c m k-mean
áp d
nh m c th p c a m t t p các nh

hu n luy
, s li u th
ic am ic
cs d
l y m t t p h p các ánh x gi
c th
nt i
khoá) c a m i c
g ng. Các quy t c ánh x có th
cs
d
thêm
c g n ch s
d li u.
, Jin và các c ng s
d ng m
chú thích
d li u m t cách t
ng cho m
u tiên, h th ng
s phân c m vùng nh vào trong m t c m mà s d ng m t bi n th c
pháp phân c m k-mean.
c g i là ràng bu c t ng c p k-mean
(PCK-mean). S c
c thi t l
th c nghi
, xác su t h u
nghi m c a m i khái ni m (59 khái ni
d li u nh)
t vùng s d

semisemic Jin và các c ng s s d
,m t
nh m i có th
c chú thích b ng vi c ch n các khái ni m v i xác su t cao nh t.
Do s phân b ph c t p c a d li u
m d li
d ng phi tuy n tính),
n th
ng không th phân chia t t các nh v i các khái ni
v
này,
, Shi và Malik
xu t m

- CT1401

cl ym ut
m k-mean
gi i quy t
m

19


án t t nghi p

i Phòng

quang ph Normalized cut (NCut
trong m t vài ng d ng


c s d ng thành công
n nh, phân c m nh.

, Chen và các c ng s
CLUE
gi m kho ng cách ng
th ng CBIR khác mà ch hi n th các nh trùng kh p

i dùng.

Thì h th ng này c g ng tra c u ng
t cách t
ng và g n k t các c m
nh. Cho m t truy v n nh, m t t p các
cho truy v
cl a
ch
ng c a truy v n. D a trên gi thuy t r ng, các nh có ng
gi ng nhau thì c
phân c m các

ng b phân c

hi n th c m
dùng. Hình 1-4

u ch
cho h th n


Ncut
p ng

Ncut không th t o ra m t hàm ánh x
m d li u m
gi
c tính toán này có th b ph c t

Hình 1-4

c s d ng cho vi c
, h th ng

theo ph n h i c

i

gi i quy t các
t c d li u hu n luy n ph i
c l n c a b hu n luy n.

mô t

gi i quy
, Zheng và các c ng
s
xu t ra m
c c b (locality preserving
clustering-LPC) cho vi c phân c m nh. K t qu thí nghi m cho th
LPC có th cung c p vi c tra c

Ncut,
i có hi
a là, k t qu tra c u c a LPC
c ch
m k-mean.

- CT1401

20


án t t nghi p

i Phòng

1.4.2.3 K thu t tra c u nh nh n d

ng

Nh n d
ng trong nh là m t bài toán quan tr ng trong th giác máy
tính v i các ng d ng trong chú thích nh, giám sát và tra c u nh. Các thu t toán
nh n d
ng giám sát ho
c phát tri n g
có th tra c u nh d a trên ng
, Fergus và các c ng s
i
thi u m t
invariant learning


c b t bi n co dãn không giám sát (unsupervised scaleh c và nh n d ng mô hình l
ng t các c
c

phân c

n nhãn.
t ng ph n c a

,
th và m t bi u di n xác

xu
c s d ng cho h u h t các khía c nh c
hình d ng, b
ngoài, kh p,
i. Trong quá trình nh n d ng,
cs
d ng trong ki u Bayesian cho phân lo i nh. Mô hình t nhiên linh ho
c
ch ng minh b ng k t qu t t trong m t lo t các b d li u bao g m: các l p hình
h c ràng bu c (ví d
t,
ng m m d o (ví d
ng v t).
Có m t th c t r ng, h u h

i dùng mu n tra c u nh d


i

ng trong
, Li và các c ng s
n m t phiên
b n bán giám sát m i c a thu t toán EM cho vi c h c s phân chia c a l
i
ng. Các
c bi u di n là b véca nhi u lo i vùng tr u
ng. M i vùng tr
t pha tr n c a s phân
chia Gaussian
c
c s d ng trong vi c nh n
d ng có th
nt
c s d ng
thì g
vùng tr
ng
t m u ch t c
ng ti p c n này là không c n
bi t v trí c
ng trong nh. Các thí nghi m trên m t t p 860
ng
minh tính hi u qu c
, Li và các c ng s
xu
c lan truy n ho c
h c cách nh n bi

ng s d ng nhi u lo
M c tiêu c a cách làm này là phát tri n m
phân lo i nh
ngo i c nh. Pha lan truy n s
ng hoá mô t
dài nh, cái mà có th tu
ch nh s
ng c a t ng lo
c trích ch n. Còn pha phân tách, m t
cách h c phân lo i mà nh s
c bi u di n b i mô t
dài c
nh, và bao g m
Trong k t qu th c nghi m c
, b ng vi c s
d ng màu s c, k t c u, và các c
y r ng hi u su t tra c u
r t kh thi trên 31 lo i ph n t
ng và 20 khái ni m m c cao.

- CT1401

21


án t t nghi p

i Phòng

1.4.3 K thu t ph n h i liên quan

Khái ni m ph n h
c gi i thi u trong tra c u nh d a trên n i
dung t khái ni m tra c u thông tin d
n t cu i nh
thành m t công ngh ph bi n cho CBIR
gi m kho ng cách ng
gi
c th p và các khái ni m ng
c cao [3]. Nói chung, ph n
h i liên quan nh m m
i thi n hi
ub ih cv is
u ch nh
c
i dùng trên k t qu tra c u. Trong cách này, h th ng c n ph i ch y thông
qua m t s vòng l p. Trong m i vòng l p, h th
sách các nh k t qu

c tiên s tr v m t danh

c s p x p g n nh t v i nh truy v n d a trên kho ng

cách Euclidean
ts
i dùng gán nhãn liên quan
ho c không liên quan t i nh truy v n. S d ng các
là các m u, các k thu t h c máy s
cs d
h c và phân l p các nh trong
d li u thành hai l p liên quan và không liên quan. B ng vi c h c m t cách

liên t c thông qua s
i dùng cu i, ph n h
y
vi
trong h th ng CBIR [4]. M t quá trình x
n hình
c a RF trong CBIR
c mô t
1.

i dùng l a ch n nh truy v n. S
c trích ch n.
2. H th ng tr l i k t qu

,

c th p c a nh
ng h p:

a.

u: D
c
nh truy v
h ng nh k t qu .
b. Trong các vòng l p RF: S d ng hàm phân l
qu .
3.

c th p gi a

d li
x p
x p h ng nh k t

i s d ng s quy
nh ch n nh ng nh k t qu có m
v
nh c a mình nh
ng nh liên quan (m
không liên quan (m u âm) v i nh truy v n.

4. Thu t toán máy h c s
d ng các m
hi n t

c áp d

cg

h c ph n h i c
c t vòng l

gi ng
) hay
i dùng s
n vòng l p

c 2.

c (2), (3) và (4) s

c l p l i nhi u l
v i k t qu tra c u. Hình 1-5 s cho th y cách ho

- CT1401

i dùng hài lòng
ng c a RF trong CBIR.

22


án t t nghi p

i Phòng

Hình 1-5

mô t

Có nhi u cách ti p c
c (4), mà t
m máy h c chung, v b n
ch t RF là m t bài toán phân l p nh phân. Tro
, các nh m
c cung c p
b
hu n luy n m t l p phân lo i. L p này s
cs
d
phân lo i

d li u thành nh ng lo
n truy v n
và ph n còn l i thì không. Tuy nhiên, RF r t khác t các bài toán phân l p truy n
th ng. B i vì, nh ng ph n h
c cung c p t
i dùng thì l i b gi i h n trong
h th ng tra c u nh trên th c t . Vì v y, m
c m u nh s là
t h a h n trong RF.

1.4.4 M u ng
(Semantic template), m c dù k thu
c s d ng
r
thu
c p trên,
i là m t cách ti p c
yh a
h n trong vi c tra c u nh d a trên ng
u ng
t ánh x gi a
các khái ni m m
giác m c th p. M u ng
c
bi u di n l i
c tính toán t m t b
t p các nh m u. Trong m t s h th ng, bi
ng hay các nh m
c
M u ng


cung c p cho s ti n d ng truy v n c
, Chang và các c ng s
(semantic visual template
liên k

- CT1401

i dùng.
i thi u v
ng m u ng c nh
nh m c th p t i các khái ni m

23


án t t nghi p

i Phòng

m c cao trong tra c u video. M t m u nh là m t b các bi
c nh/
ng
bi u di n các khái ni m
h p,
ch n cho quá trình truy v

a ví d v c nh
sinh các m u ng
,


u cho các khái ni
c bi t b
r ng bu c không gian và th i gian. Tr ng s

ng ho c ví d v
c
ng

nh
c gán cho t

c trích
i dùng s
ng và
a

t
qua s

ng. Quá trình truy v
c cung c p cho h th ng. Thông
i dùng, h th ng cu i cùng s h i t v i m t nhóm nh

truy v

n hình mà có s trùng kh
i dùng.

Th h c


t t nh t

chính xác cao) các khái ni m

SVT c a Chang và các c ng s ph thu c vào s
i dùng và yêu c
i dùng ph i có s hi u bi t chuyên sâu v

u này gây tr ng i cho các ng d
i dùng bình
ng hay s d ng. So v i vi c này,
, Zhuang và các c ng s
s d ng m t h th
sinh m u ng
t cách t
ng trong quá trình
x lý ph n h i liên quan, d a trên nh ng hi u bi t r ng ph n h i liên quan là m t
i dùng c th hóa truy v n ng
nh t,
i dùng g i
nh truy v n v i m t khái ni m (t khóa
i di n cho
p l i nhi u l n,
h th ng s tr v m t s hình
ng tâm
c a nh ng
c tính toán và s d
i di n c a các khái ni m truy
v

, ST s
ST={C, F, W} v i khái ni m truy v n C,
tr ng tâm F
c, và tr ng s W
c áp d
-

m tm

, Miller và các c ng s
i các m u ng

i thi u h th ng WorldNet
u, m

xây d ng
i dùng g i

khái ni m truy v n (t khóa), thì h th ng có th tìm m t m u ng
ng,
và s d ng F và W
tìm nh ng
. Quá trình tra c
c
th hi n hình 1-6
i dùng không th th y
c vi c sinh m u, và s d ng h
th ng mà không c n b t k ki n th c nào v
i di


- CT1401

24


án t t nghi p

i Phòng

Hình 1-6: H th ng tra c u nh Worldnet s d ng Semantic template
M t công vi
H s d ng m t công ngh

c gi i thi u b
c g i là CRT
gi i mã ng

CRT

p x p không gian nguyên m u trong nh. Cho m t

l p ng

, m t t p các nh m

c thu th

nh. Công ngh

u tiên, h th ng s


n

m i
ng nh t và trích ch
i b ng cách quét nh
theo chi u d c
, h th ng h p nh t các vùng chu i b
mt ns
CRT trong t p h p các khu v c chu
c t t t c các nh m u. B ng vi c k t
h p CRT t m i l p ng
o thành m
n CRT. Mô t ng
a
nh ng
t có th
c t o ra b
i sánh s s p x p c a các khu
v c
n CRT. Các thí nghi m v i m t t p 10 l p ng
bãi bi n,
tòa nhà, cua, th l n,
ng minh r
i thi
chính xác tra c u so v
n th ng s d ng bi
c
t c u.


1.4.5 Tra c u nh web
Chúng ta phân lo i tra c u nh web
t trong các công ngh m i trong
tra c u nh m c cao,
t mi n ng d
c bi t. Vì nó có m t s khác bi t
k thu t t tra c u nh trong các ng d ng khác. M
m trong tra c u nh
web là m t s thông tin b sung trên web có s
t
u ki n tra c u nh d a
trên ng
, m t file nh ch
ng d
ng có m t c u trúc phân
c p rõ ràng bao g m m t s thông tin v
i nh. Ngoài ra, các tài li u
HTML
a m t s thông tin h
nh, ALT-tag, các

- CT1401

25


×