Tải bản đầy đủ (.doc) (126 trang)

Nghiên cứu cải tiến một số phương pháp tra cứu ảnh sử dụng đặc trưng ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.72 MB, 126 trang )

L I CAM

OAN

Tôi xin cam oan ây là công trình nghiên c u c
vi t chung v i các tác gi
khác u ư c s
ng ý c

a riêng tôi. Các k t qu ư c
a ng tác gi trư c khi ư a

vào lu n án. Các k t qu

c và chưa t ng ư c ai công

nêu trong lu n án là trung th

b trong các công trình nào khác.

Tác gi

Nguy n H u Qu nh

1


L i c m ơn

Th c hi n lu n án ti n s là m t vi c khó, nhưng là m t nhi m v
áng làm.


Tôi r t h nh phúc khi th c hi n xong lu n án ti n s , và quan tr ng hơn là nh
ng gì
tôi ã h c ư c trong su t ba n m qua. Bên c nh ki n th

c tôi thu ư

ư c phương pháp nghiên c

thành công này không ơ n

thu n b i s

h tr và giúp

c a th y giáo

ng nghi p khác. Nhân cơ h i này, tôi mu n bày t

l i c m ơn

nh.
u tiên, tôi mu n c m ơn

Qu c T o và PGS TS

ơn r t nhi u t
hi u các v n

ư c nghiên c u dư i s


ào t o Sau

TS Nguy n Thanh Th

n PGS TS V

y vì s giúp

ihc

ihc

Tôi mu n c m ơn

c Thi, PGS TS Lương Chi Mai, PGS

cah
s c m ơn

i n l c, ngư i

tài chính cho tôi trong vi c công b

ihc

thông tin,

i cho tôi trong su t quá trình th c hi n lu n án.

nghiên c u c a tôi. Tôi c ng bày t

trư ng trư ng

t ra các câu h i nghiên c u,

môn Khoa h c máy tính, Khoa Công ngh

ã t o i u ki n thu n l

cho các
n PGS TS

ã ng viên và t o

xu t và các trao

i trong

àm Xuân Hi p – Hi u
i u ki n v th i gian và

các bài báo trên các h i ngh và t p chí qu

n các cán b , gi ng viên trong khoa Công ngh

inlc

ó

a hai th y. C m


i h c - Nghiên c u Khoa h c, Ban giám hi u trư ng

Tôi bày t s c m ơn

– Trư ng

hư ng d n c

i hai th y vì s hư ng d n tôi cách
, và vi t các bài báo khoa h c.

Tôi trân tr ng c m ơn B

Công ngh

n hai th y giáo hư ng d n c a tôi, PGS TS Ngô

inh M nh Tư ng, vì s hư ng d n t n tình và khoa h c.

i l n cho tôi

là m t cơ h

Phòng

c l p. S

n l c c a cá nhân tôi, mà còn có s

hư ng d n và nhi u

c a tôi

u m t cách

c, tôi ã h c

ãc v

ct.

thông tin

ng viên và sát cánh bên tôi trong quá trình

nghiên c u.

2


Tôi mu n c m ơn nh ng thành viên c a

tài nghiên c u cơ b n

NCCB200706 v s tài tr tài chính và các góp ý r t h u ích v các bài báo ư c công b trên
các h i ngh và t p chí qu c t .
Tôi c m ơn t t c nh ng ngư i b n c a tôi. Nh ng ngư i luôn chia s và c v tôi trong
nh ng lúc khó kh n và tôi luôn ghi nh i u ó.
Cu i cùng, tôi xin bày t lòng bi t ơn vô h n i v i cha m và gia ình ã luôn ng h ,
giúp tôi.


3


M CL

PH N M

C

U....................................................................................................................... 14

1. Tính c p thi t c a lu n án.................................................................................................... 14
2. M c tiêu c a lu n án............................................................................................................ 16
3. Các óng góp c a lu n án.................................................................................................. 16
4. B c c c a lu n án................................................................................................................ 17
Chương 1. T NG QUAN V TRÍCH RÚT
D A VÀO
1.1 Các

C TR NG VÀ TRA C U

NH

C TR NG..................................................................................................... 18
c trưng................................................................................................................... 18

1.1.1 Các

c trưng toàn c c và c c b............................................................................ 18


1.1.2 Các

c trưng th giác trong tra c u

1.2 Ki n trúc c a m t h
1.3 Trích rút
1.3.1

th ng tra c u

nh............................................................ 19

nh d a vào

c trưng th giác................... 19

c trưng.......................................................................................................... 21

c trưng màu.......................................................................................................... 21

1.3.2 Lư ng hóa màu.......................................................................................................... 23
1.3.3 Bi u di n màu............................................................................................................. 23
1.3.3.1 Lư c

màu..................................................................................................... 23

1.3.3.2 Lư c

màu toàn c c GCH........................................................................... 24


1.3.3.3 Lư c

màu c c b

LCH............................................................................. 26

1.3.3.4 Véc tơ g n k t màu........................................................................................... 28
1.3.3.5 Tương quan màu............................................................................................. 28
1.3.3.6 Các màu tr i....................................................................................................... 29
1.3.3.7 Mô men màu..................................................................................................... 29
1.3.4 Thông tin không gian.............................................................................................. 30

4


1.3.5
1.4 Các
1.5

Phân vùng..............................................................................................

o tương t

31
32

.......................................................................................

ánh giá hi u n ng tra c u...........................................................................


1.6 Các h

th ng VFBIR....................................................................................

1.7 K t lu n và

38
u..............................................................

nh hư ng nghiên c

Chương 2. PHƠ NG PHÁP TRA C
2.1 Lư c

37

UD

màu kh i ........................................................................................

MÀU KH I.... 42
42

2.2 Phương pháp tra c u d a vào lư c
2.2.1 Gi

AVÀOL C

40


màu kh i........................................... 44

i thi u ..............................................................................................

44
xu t HG ...........................................................

47

th hai phía............................................................

47

2.2.2 Phương pháp tra c u
2.2.2.1 Khái ni m v

2.2.2.2. Phương pháp HG............................................................................

48

2.3 Phương pháp c i ti n IHG............................................................................

53

2.3.1 Khái ni m v
2.3.2 Lý do
2.3.3

s tương t


lý tư ng gi a hai d i ..................................... 53

xu t phương pháp IHG............................................................

Phương pháp IHG..................................................................................

2.4 Các th

54
54

c nghi m ..........................................................................................

60

2.4.1 Môi trư ng th

c nghi m ........................................................................

60

2.4.2 Các k t qu

c nghi m........................................................................

61

2.5

th


2.4.2.1 K t qu

th c nghi m v i phương pháp HG ..................................... 61

2.4.2.2 K t qu

th c nghi m v i phương pháp IHG .................................... 65

K t lu n .......................................................................................................

69

Chương 3. PHƠ NG PHÁP TRA C
3.1 Bi u di n nh s

A VÀO VÙNG

NH .................... 71

d ng phương pháp cây t phân ......................................... 71

3.2 Phương pháp tra c u nh s
3.2.1 Gi

UD

d ng

c trưng c a vùng nh ........................... 73


i thi u ..............................................................................................

73

5


3.2.2 Trích rút c trưng.................................................................................
3.2.2.1 Trích rút màu và thông tin không gian.............................................

74
74

3.2.2.2 Trích rút các c m màu thu n nh t. ..................................................

82

3.2.3

tương t gi a hai nh .......................................................................

87

3.2.4 Các th c nghi m....................................................................................

88

3.2.4.1 Môi trư ng th c nghi m .................................................................


88

3.2.4.2 K t qu th

88

3.3

c nghi m .......................................................................

K t lu n .......................................................................................................

Chương 4. XÂY D NG

96
NGD NGTRAC U NHD AVÀON I DUNG98

4.1 Thi t k h th ng t ng quát LVFIR..............................................................

98

4.2Module tra c u group1...............................................................................

100

4.3Module tra c u group2...............................................................................

105

4.4M t s k t qu


...........................................................................................

110

4.4.1 So sánh k thu t LCH, CCH v i HG và IHG.......................................

110

4.4.2 So sánh k thu t QT, CBC và CCV v i CSI và CCS ...........................

112

4.5

K t lu n. ....................................................................................................

116

K T LU N........................................................................................................
DANH M C CÁC CÔNG TRÌNH CÔNG B ..................................................

117
119

TÀI LI U THAM KH O ..................................................................................

120

6



DANHM

CCÁCCH

Ký hi u

VI TT

T

Di n gi i

Black

Màu en

CSDL

Cơ s d

CBC

Color Based Cluster

CCH

Color/Cell Histogram (Lư c


CCS

Cluster of Colors and Space (C m màu và không gian)

CCV

Color Coherence Vectors (Véc tơ g n k t màu)

CSI

Color and Spatial Information (Màu và thông tin không gian)

li u
màu kh i)

DistancebyColor Kho ng cách theo màu
DRC

Distance by Region Comparing

EdgeDistance

Kho ng cách theo c nh

EMD

Earth Mover Distance (Kho ng cách Earth Mover)

GCH


Global Color Histogram (Lư c

Gray

Màu xám

HG

Histogram Graph ( th lư c

Hue

S c màu

IHG

Improving Histogram Graph method (Phương pháp c i ti n
th lư c
)

KLT

Karhunen–Loeve transform (Bi n i Karhunen–Loeve)

LCH

Local Color Histogram (Lư c

LVFIR


Local Visual Feature-based Image Retrieval (Tra c u nh d a
vào c trưng th giác c c b
)

MCM

Minimum Cost Matching (Giá tr

MTM

Mathematical Transform to Munsell (Bi n
h th ng màu Munsell)

7

màu toàn c c)

)

màu c c b )

i sánh c c ti u)
i toán h c sang


Precision

Chính xác

Quantization


Lư ng hóa

QT

Quad Tree (Cây t phân)

Recall

H i tư ng

RGB

Red ( ), Green (Xanh l c), Blue (xanh lơ)

SR

Spatial Relationship (Quan h không gian)

Union

Hp

VFBIR

Visual Feature Based Image Retrieval (Tra c u nh d a vào
c trưng th giác)

White


Màu tr ng

8


DANH M C CÁC HÌNH

Hình 1.1. Ki n trúc h

th ng tra c u

nh d a vào

c trưng th giác.......................... 20

Hình 1.2. Hai nh khác nhau nhưng có cùng lư c

màu............................................ 22

Hình 1.3. T trái sang: nh g c s

d ng 256 màu, ư

c lư ng hoá trong 8 d i, và

ư c lư ng hoá trong 64 d i s d ng không gian màu RGB............................................... 23
Hình 1.4. Ba nh I1, I2 và I3 và các lư c

màu tương ng c a chúng....................... 25


Hình 1.5. Tính kho ng cách gi a nh I1 và I2 s

d ng LCH, d LCH ( I1 ,I 2 ) = 1.319,

dGCH ( I1 ,I 2 ) = 0.088 .......................................................................................................... 26

Hình 1.6. Tính kho ng cách gi a các nh I1 và I3 s

d ng LCH,

d LCH ( I1 ,I3 ) = 0.707, dGCH ( I1 ,I3 ) = 0.088................................................................ 27

Hình 1.7. Tính kho ng cách gi a các nh I2 và I3 s

d ng LCH

d LCH ( I 2 ,I3 ) = 0.707 ,
dGCH ( I 2 ,I3 ) = 0 ....................................................................... 27

Hình 1.8. Recall và Precision cho các k t qu
Hình 2.1. M t nh ư c chia thành 9 kh i
Hình 2.2.

truy v n................................................... 38
nh và ba lư c

màu kh i c a nó.......43

nh I và nh I’......................................................................................................... 45


Hình 2.3. Lư c

màu kh i theo màu black và white bi u di n

nh I......................45

Hình 2.4. Lư c

màu kh i theo màu black và white bi u di n

nh I’..................... 45

Hình 2.5. Tính kho ng cách c a nh I và I’ theo màu black............................................... 46
Hình 2.6. Tính kho ng cách c a nh I và I’ theo màu white............................................... 46
Hình 2.7. Các kh i nh c a m i

nh ư c ánh s t trong ra và ngư c chi u kim

ng h ......................................................................................................................................... 56
Hình 2.8. Lư c
Hình 2.9.

màu kh i theo màu black c a hai nh I1 và I2.................................... 56

th hai phía bi u th m i quan h

c a các d i c a lư c

màu kh i c a


nh I1 và I2 theo màu black..................................................................................................... 57

9


Hình 2.10. Các nh m u c a các truy v n t

1

n 6....................................................... 61

Hình 2.11. So sánh LCH, CCH v i HG theo các truy v n 1, 2, 3 và 4 dư i d ng
Recall - Precision...................................................................................................................... 63
Hình 2.12. So sánh LCH, CCH v i HG theo các truy v n 5 và 6 dư i d ng Recall Precision...................................................................................................................................... 64
Hình 2.13. Các nh m u c a các truy v n t

1

n 6....................................................... 65

Hình 2.14. So sánh HG v i IHG theo các truy v n 1 và 2 dư i d ng Recall –
Precision...................................................................................................................................... 67
Hình 2.15. So sánh HG v i IHG và SR theo các truy v n 3, 4, 5 và 6 dư i d ng
Recall-Precision......................................................................................................................... 68
Hình 2.16. Bi u
Hình 3.1

so sánh t c

c a phương pháp HG và IHG................................ 69


nh g c....................................................................................................................... 71

Hình 3.2. Cây t phân bi u di n
Hình 3.3 Cây bi u di n

nh cho trong Hình 3.1................................................ 72

nh cho trong Hình 3.1................................................................ 73

Hình 3.4.

nh I c

Hình 3.5.

nh I sau khi ư

10×10 i m nh.................................................................................. 77
c tách ra thành hai vùng BR1 và BR2............................. 78

Hình 3.6. Vùng BR2 sau khi ư c tách ra thành hai vùng BR2,1 và BR2,2...............80
Hình 3.7.

nh g m 6×10

i m nh...................................................................................... 85

Hình 3.8. Các nh m u c a các truy v n t


1

n 6......................................................... 89

Hình 3.9. So sánh CSI v i QT và CBC theo các truy v n 1 và 2 dư i d ng RecallPrecision...................................................................................................................................... 90
Hình 3.10. So sánh CSI v i QT, CBC và SR theo các truy v n 3, 4, 5 và 6 dư i
d ng Recall – Precision............................................................................................................ 92
Hình 3.11. Các nh m u c a các truy v n t

1

n 6....................................................... 93

Hình 3.12. So sánh Recall – Precision theo các truy v n 1,2 và 3 c a CCS v i CCV
và CSI........................................................................................................................................... 94

10


Hình 3.13. So sánh Recall-Precision theo các truy v n 4, 5 và 6 c a CCS v i CCV,
CSI và SR.................................................................................................................................... 96
Hình 4.1. Ki n trúc c a h

th ng LVFIR............................................................................. 99

Hình 4.2. Ki n trúc c a Module tra c u group1................................................................. 100
Hinh 4.3. Màn hình chính c a module tra c u group1..................................................... 102
Hình 4.4. Giao di n tra c u khi l a ch n

c i m màu s


d ng LCH..................... 102

Hình 4.5. Giao di n tra c u khi l a ch n

c i m màu s

d ng CCH.................... 103

Hình 4.6. Giao di n tra c u khi l a ch n

c i m màu s

d ng HG.......................103

Hình 4.7. Giao di n tra c u khi l a ch n

c i m màu s

d ng IHG......................104

Hình 4.8. Ki n trúc c a Module tra c u group2................................................................. 105
Hinh 4.9. Giao di n s

d ng k

thu t QT, CBC và CCV c a module tra c u

group2........................................................................................................................................ 106
Hinh 4.10. Giao di n s


d ng k

thu t CSI và CCS c a module tra c u group2.107

Hình 4.11. Giao di n tra c u khi s

d ng phương pháp QT v i nh truy v n............107

Hình 4.12. Giao di n tra c u khi s

d ng phương pháp CBC v i

nh truy v n. ..108

Hình 4.13. Giao di n tra c u khi s

d ng phương pháp CCV v i

nh truy v n....108

Hình 4.14. Giao di n tra c u khi s

d ng phương pháp CSI v i

nh truy v n.......109

Hình 4.15. Giao di n tra c u khi s

d ng phương pháp CCS v i


nh truy v n.....109

Hình 4.16. K t qu

th c hi n truy v n 1.............................................................................. 110

Hình 4.17. K t qu

th c hi n truy v n 2.............................................................................. 111

Hình 4.18. K t qu

th c hi n truy v n 3.............................................................................. 112

Hình 4.19. K t qu

th c hi n truy v n 1.............................................................................. 113

Hình 4.20. K t qu

th c hi n truy v n 2.............................................................................. 114

Hình 4.21. K t qu

th c hi n truy v n 3.............................................................................. 115

11



DANH M C CÁC B NG

B ng 2.1. Các lo i c a

nh truy v n và các nh liên quan................................................ 61

B ng 2.8. Các lo i c a nh truy v n và các

nh liên quan............................................ 65

B ng 3.1. Tính

l ch DXselectedrow cho phân ho ch theo dòng c a nh I................... 78

B ng 3.2. Tính

l ch DXselectedcol cho phân ho ch theo c t c a

B ng 3.3. Tính

l ch DXselectedrow cho phân ho ch theo dòng c a vùng BR2.........80

B ng 3.4. Tính

l ch DXselectedcol cho phân ho ch theo c t c a vùng BR2...............81

nh I.......................79

B ng 3.5. Tính toán giá tr c a vi.............................................................................................. 85
B ng 3.6. Tính toán giá tr c a hj.............................................................................................. 86

B ng 3.7. Các lo i c a

nh truy v n và các nh liên quan................................................ 89

B ng 3.14. Các lo i c a nh truy v n và t p

nh liên quan............................................ 92

B ng 3.17. Các k t qu

c a truy v n 3................................................................................... 94

B ng 3.20. Các k t qu

c a truy v n 3................................................................................... 95

12


13


PH NM

U

1. Tính c p thi t c a lu n án
Nh ng n m g n
ây, chúng ta
tphp


nh s

ngày, vi c s

cùng v i s

ã ch ng ki n s

phát tri n bùng n

d ng các thi t b

thu nh n

t ng nhanh kích c c a các

c a các

nh sinh ra nhi u giga-bytes d

M t lư ng l n thông tin nh, kho ng hàng tr m tri u
này, n u chúng không ư

d

li u

nh. Qu n tr


c t ch

cơ s d li u (CSDL) và th

li u

khác nhau, d a vào v n b n mô t

c

d ng thông tin trong các t p

c

tra c

u hi u qu

giác máy là hai c

trên toàn b
ng

óng góp chính cho l nh v c tra c u nh. Hai c ng ng này ti p c n tra c
hai góc

nh.

ãư


nh [12, 59, 70, 79],

ư a lên Internet. Tuy nhiên, không th truy c p ho c s
nh kh ng l

ng d ng Internet. Hàng

nh và d a vào

ng có
u nh t

c trưng th giác c a

b n thân nh.
S d ng các k
qu n lý CSDL

thu t d a vào v n b n mô t nh ho c t

nh là cách ơ n gi n thư ng ư

c s d ng. Các t

cung c p thông tin n i dung mô t

nh trong m t CSDL nh

các nh


khoá r t l

chi ti t, c n m

ttpt



cách ti p c n này là c n nhân l
i v i m i nh và ch n các t
vi c mô t

n i dung

vào c m nh n ch

khoá mô t

c t p. M t h n ch

khoá

thu t theo ngh a cùng m

thu c

t n i dung

nh khác nhau. C m nh n


i dung nh không chính xác là nguyên nhân làm cho so sánh

sai trong lúc tra c u. Hơn n a, h th ng d
ó, c n có cách ti p c n m

n ac a

nh hi u qu . Công

nh th công này t n nhi u th i gian, chi phí cao và ph

n

nh

mô t

xây d ng các t

lư ng

ư a ra c m nh n v

nh

ã cho, nhưng

khoá phù h p cho tra c u các

nh, nh ng ngư i khác nhau có th


i

kh c ph c các khó kh n
nh ã ư c

n và ph

c ào t o k

quan c a chuyên viên k

ch quan và mô t

khoá mô t

a vào t khoá r t khó thay

i v sau. Do

kh c ph c các h n ch này.
trên, tra c u

nh d a vào

xu t. Ý tư ng cơ b n c a cách ti p c n này là s

14

c trưng th giác c a

d ng k thu t trích


rút c trưng th giác m t cách t
tr c ti p t chính b n thân nh.
H th ng tra c u
CSDL

nh có

ư

cho ra các mô t

nh d a vào

n

c trưng th giác s

c trưng th giác tương t

các nh trong CSDL ư
và trích ch n

ng

c x lý, ư

i dung nh m t cách

xác nh các nh trong

v i nh truy v n theo hai pha: Pha 1, t t c
c trích ch n c trưng th giác. Quá trình x lý

c trưng th giác ư c th

c hi n m t cách t

ng ngay khi các nh

c nh p vào CSDL. Quá trình này gán cho m i nh m t t p các ký hi u mô t ,

các ký hi u mô t
nh này s ư c lưu tr trong CSDL và ư c s
d ng trong pha
ti p theo. Pha 2, trích rút các
c
c trưng th giác c a nh truy v n và so sánh các
trưng này v i các
nào ó. Các

c trưng th

nh trong CSDL ư

giác c a

nh trong CSDL theo m t


c phân h ng theo m c

tương t c a nó v i nh

truy v n. nh có h ng cao nh t ư c truy xu t. Trích rút n

i dung th giác c a các

nh hi u qu và o
tương t gi a các nh d a trên c trưng th
quan tr ng trong tra c u nh d a vào c trưng th giác.
Các nghiên c u g n

o tương t

giác là hai ph n

ây trong tra c u nh t p trung vào trích ch n

th giác g m màu, k t c u, hình d ng và thông tin không gian. Màu là
ư cs d
v
ư c

c trưng

ng r ng rãi nh t cho tra c u nh do tính toán nhanh, tương

i các bi n d ng nh , thay


iv

kích thư c và hư ng. M t s

xu t như: Phương pháp lư c

màu toàn c c và lư c

c trưng

i n

nh

phương pháp ã
màu c c b [51],

phương pháp véc tơ g n k t màu [16], phương pháp tương quan màu [30], phương
pháp lư c
ph i v n

màu kh i [54],… Tuy nhiên, h u h t các phương pháp này
s d ng nhi u không gian
màu bi u di n
lưu tr các lư c

chính xác tra c u không cao,

ugp
nh,


ph c t p tính toán l n, nh y c m v i quay và d ch

chuy n, không cho phép nh n bi t các

i tư ng tương t có màu khác nhau [7, 40,

52, 69].
Do ó, vi c
kh c ph c ư

xu t các gi i pháp tra c u

c các h n ch

trên là m

nh d a vào

c trưng th

giác

t nhu c u c p thi t. ó c ng là lý do mà

15


lu n án ch n
tài “Nghiên c u c i ti n m t s

d ng c trưng nh”.

phương pháp tra c u

nh s

xu t m t s phương pháp tra c u

nh s

2. M c tiêu c a lu n án
M c tiêu c a lu n án là nghiên c u
d ng

c trưng màu và thông tin không gian. Các phương pháp này s

gi i quy t các v n

v gi m không gian lưu tr

nh y c m v i quay và d ch chuy n, gi m

hư ng t i

các lư c màu bi u di n

nh, ít

ph c t p tính toán và t ng


chính xác

xu t các k thu t tra c u

nh d a vào

tra c u.
3. Các óng góp c a lu n án
Trong lu n án này, tác gi nghiên c u

c trưng c a vùng nh g m: phương pháp HG (Histogram Graph) [42], phương pháp
IHG (Improving Histogram Graph) [43], phương pháp CSI (Color and Spatial
Information) [45] và phương pháp CCS (Cluster of Colors and Space) [46]:
- Phương pháp tra c u
nh d a vào
c trưng màu, có tên là HG [42].
c
i m c a phương pháp này là s d ng ít không gian lưu tr các lư c
màu bi u
di n nh và ít nh y c m v i quay và d ch chuy n.
-

t ng cư ng phương pháp HG, chúng tôi

[43], nh m gi m th i gian và t ng
vns

d ng ít không gian lưu tr

ã


xu t phương pháp IHG

chính xác tra c u c a phương pháp HG nhưng
các lư c

màu bi u di n nh và ít nh y c m v

i

quay và d ch chuy n.
- Phương pháp CSI [45] trích rút c trưng màu và thông tin không gian c

a

các vùng nh và s d ng trong quá trình tra c u nâng cao hi u n ng tra c u.
- Phương pháp CCS [46] phân ho ch
c m màu này có th
c a m i vùng ph c v

có kích c

nh thành các c m màu thu n nh t (các

khác nhau) và trích rút thông tin màu và không gian

quá trình tra c u.

16



- Xây d ng h

th ng tra c u

nh d a vào

c trưng th giác có tên là LVFIR

(Local Visual Feature-based Image Retrieval) trên cơ s

các k

tác gi . H th ng này g m hai module chính là module ti n x

thu t

xu t c a

lý và module tra c u.

4. B c c c a lu n án
Lu n án này ư

c b c c thành b n chương, g m 125 trang.

Chương 1 gi i thi u t ng quan v trích rút c trưng và tra c u nh d a vào c trưng th
giác và ư a ra m t s k t lu n và nh hư ng cho nghiên c u.
Chương 2 trình bày k thu t tra c u nh d a vào lư c màu kh i, có tên là HG [42]
và c i ti n c a nó, có tên là IHG [43].

Chương 3 trình bày k thu t trích rút c trưng c a vùng nh s d ng trong quá trình
tra c u nh, có tên là CSI [45] và CCS [46].
Chương 4 trình bày thi t k và th c hi n h d a
vào c trưng th giác (s d ng các k thu t ư Chương 3)

th ng th c nghi m tra c u nh c
xu t trong Chương 2 và

LVFIR, cùng v i m t s k t qu .
Cu i cùng, chúng tôi ư a ra m t s k t lu n và xu t các nghiên c u trong tương lai.

17


Chương 1. T NG QUAN V TRÍCH RÚT C TRƯNG VÀ TRA
C U NH D A VÀO C TRƯNG

Trong chương này, chúng tôi s gi i thi u m t s
v trích rút

c trưng và tra c u

ki n trúc c a h

nh d a vào

th ng tra c u

nh d a vào


khái ni m và k

thu t cơ b n

c trưng th giác g m: các

c trưng,

c trưng th giác, trích rút

c trưng,

các
o tương t , ánh giá hi u n ng tra c
u và gi i thi u m t s h th ng tra c u
nh d a vào
c bi t chúng tôi nh n m nh vào c trưng màu.
c trưng th giác.
Cu i cùng chúng tôi s
1.1 Các

ư a ra m t s

k t lu n và

nh hư ng cho nghiên c u.

c trưng
nh thô không ư


D li u

giác máy vì hai lý do: Th

c s d ng tr c ti p trong h u h t các h

nh t, t n nhi u không gian

th ng th

nh và

lưu tr

ph c t p

tính toán l n. Th hai, nhi u thông tin c a

nh là dư th a và/ ho c không h

Thay vì s

cns

d ng toàn b

nh, chúng ta ch

d ng m


t bi u di n quan tr ng

nh t. Bư c tìm bi u di n ư

c g i là trích rút

véc tơ c trưng. Trích rút

c trưng có th xem như vi c ánh x

nh sang không gian
Liên quan
trưng th giác và
thành

n n i dung nh, các
c trưng ng ngh a.

c trưng nh có th
c trưng th giác có th

c trưng theo l nh v

giác chung g m màu, k t c u, hình d ng và quan h
m tri th c v l nh v

ngh a không d dàng ư

c a bi u di n là
nh t không gian


c trích rút và thư ng ư

d ng v n b n mô t

1.1.1 Các

c trưng toàn c c và c c b

Các c trưng nh có th n i

ư

c phân thành
ư c phân lo

c [12, 70, 79]. Các

c

i ti p

c trưng th

không gian. Các c trưng theo

c như m t ngư i, vân tay,...

th p ho c s


dung th giác c a toàn b

c tr ng và k t qu

c trưng.

c trưng chung và

l nh v c bao g

u ích.

c suy di n t

c trưng ng

các c trưng m c

nh.

là toàn c c ho c c c b . N u các
nh, các

c trưng bi u di n

c trưng này ư c g i là các
18

c trưng toàn



c c. Ngư c l i, các c trưng bi u di n n i dung th giác c a m t ph n nh thì ư c g i là c
trưng c c b .
1.1.2 Các c trưng th giác trong tra c u nh
c trưng màu: Màu có vai trò quan tr ng trong tra c u nh d a vào c trưng th
giác. Các màu có th ư c bi u di n trong các không gian màu khác nhau như RGB,
HSV,...
c trưng k t c u: K t c u là t p các i m trong m t vùng th a mãn ràng ó. c
bu c hay qui lu t nào

trưng này khá quan tr ng cho tra c u nh.

V
cơ b n, các phương pháp bi u di n k t c u có th ư c chia thành hai lo i:
các phương pháp c u trúc và các phương pháp th ng kê. Các toán t
ư c dùng
phát hi n c u trúc bao g
c u cơ s
pháp ph

m các toán t hình thái và

và lu t phân b

nh các k t

c a chúng. Các phương pháp th ng kê bao g m: Phương

n ng lư ng Fourier, Tamura, trư ng ng u nhiên Markov, mô hình fractal,


các b l c a phân gi i như bi n
b ng s

th li n k xác

phân b th ng kê c a

i Gabor và bi n
sáng c a các i m

i d ng sóng... th

hi n k t c u

nh.

c trưng hình d ng: Các c trưng hình d ng có quan h

ch t ch v i mô t c

vùng ho c các i tư ng ư c phân o n. c trưng hình d ng ư ư ng bao i

trích rút t các

tư ng ho c vùng ch a i tư ng.
1.2 Ki n trúc c a m t h th ng tra c u nh d a vào c trưng th giác
Quá trình th c hi n c a h

th ng tra c u


nh d a vào

c trưng th giác ư

c

chia thành hai giai o n:
Giai o n 1: T o l p CSDL

nh cùng v i thông tin

c trưng (ngo i tuy n)

Trích rút c trưng c a nh trong CSDL nh. Quá trình x lý g m l c, chu n hóa,
phân o n và nh n d ng i tư ng. u ra c a bư c này là m t t p các mô t n i dung
các nh trong CSDL.
Giai o n 2: Tra c u

nh (tr c tuy n)

19


1. T o l p truy v n: trích rút
c trưng th giác c a nh truy v n.
2. So sánh: các
c so sánh v i các c
c trưng th giác c a nh truy v n ư
trưng th giác c a các nh trong CSDL nh. Các k
ư cs


d ng nh m t ng t

Dư i ây là ki n trúc h

Cơ s

d

li u

nh

thu t ánh ch s có th

c quá trình tra c u.

th ng tra c u nh d a vào c trưng th giác.

nh truy

vn

Trích rút

Cơ s d

c trưng

Véc tơ c

trưng

Xác nh

li u c
trưng

tương t
c trưng

Các nh ư c tra c u
Hình 1.1. Ki n trúc h th ng tra c u

Hình 1.1 ch ra ki n trúc h
c trưng th giác c a
các véc tơ

nh ư

nh trong CSDL

nh

c trưng c a các nh trong CSDL

c trưng c a các

c trưng c a

c trưng. Trên cơ s


20

c trưng th giác. Các

c trích rút và ư

ó h th ng trích rút các véc tơ

tương t gi a các véc tơ

c trưng th giác.

nh d a vào

c trưng. Khi th c hi n tra c u, ngư i s

th ng nh truy v n, sau
này. Xác

th ng tra c u

c trưng nhi u chi u. Các véc tơ

t o thành CSDL

nh d a vào

c bi u di n b ng
nh trong CSDL nh


d ng cung c p cho h
c trưng c a nh truy v n
nh truy v n và các véc tơ
tương t xác

nh ư c,


h th ng cho ra k t qu tra c u g m m t danh sách các nh có tương t v i nh truy v n nh t.

1.3 Trích rút

c trưng

c trưng th giác quan tr ng và ư

c trưng màu là m t trong nh ng
d ng r ng rãi nh t trong tra c u

nh. Do ó trong ph n này, chúng tôi s

cs
cp

n

c trưng màu.
Trư c khi
lư c


cp

màu và kh i

n

c trưng màu, chúng tôi gi i thi u khái ni m v

dica

nh.

nh ngh a 1.1 [D i c a lư c

màu]:

M t d i c a lư c màu là s i m nh trong m t di n tích nh ư c ch ra mà có chung
màu.
nh ngh a 1.2 [Kh i nh]:
M t kh i
1.3.1

nh là m t vùng nh hình ch

c trưng màu
c trưng màu ư

cs


d ng r t hi u qu

CSDL nh [66, 69, 80]. Các mô t màu ư
và do ó nó thích h p cho tra c
nh ư

nh t trong nh.

cho tra c u các

nh màu trong

c trích rút và so sánh tương

i thu n l i

u d a vào c trưng th giác.

c thu th p t camera s , ho c ư c t i xu

ng t

kênh màu (các nh a c p xám ch có m t kênh, các nh

Internet thư ng có ba

a ph có th có nhi u hơn

ba kênh).
Các tín hi u màu m

nh d a vào

t ho c hai chi u c ng ư

c trưng th giác (VFBIR)

thu nh n nh tương ph n là quan tr
bi n dư i ánh sáng, bóng và s

cs

d ng r ng rãi trong tra c u

c bi t trong các

ng d ng v i

ng. Trong [19, 20] ã ch
thay

i hình h

chi u sáng.

21

i u ki n

ra r ng màu là b t


c c a ngư i quan sát và các góc


Lư c
màu ư c dùng
xu t hi n c a m i màu trong m

miêu t
c trưng màu c a m t nh,
ms ln
t nh [37]. T lư c
màu ta suy ra phân b xác

su t c

a màu trong nh. Phân b này b t bi n v

lư c

màu r t thích h p cho tra c u nh d a vào

h n ch

chính c a lư c

i quay, d ch chuy n và t

i u này có th

c u nh s


d ng m t lư c

dn

n các sai s
màu là không th

ó,

c trưng th giác. Tuy nhiên,

màu là chưa t n d ng ư

vùng nh.

l ; do

c thông tin không gian c a các

không mong mu n; thí d

, trong tra

phân bi t gi a m t qu

bóng màu

xanh và m t b i c màu xanh. Ch ng h n, Hình 1.2 ch ra như c i m này.


Hình 1.2. Hai nh khác nhau nhưng có cùng lư c màu.
xu t, bao g m: mô men màu [32, 34],
Nhi u phương pháp khác ã ư c

các d u hi u màu [31], các lư c
tra c u các nh d

màu c i ti n [51], các véc tơ g n k t màu [16],

a vào phân c m [80], các tương quan màu [30], các vùng màu c c

b [2, 31], phương pháp Harbin [63] và các
cp

n các k thu t tra c u theo màu

xu t phát
hư ng c

ims

m c không gian. Các k thu t này

d ng m t trong hai cách ti p c n, cách ti p c n th

g ng liên k t thông tin không gian vào lư c

c n th hai c

là r t khó thu nh n ư


các vùng (

i tư ng) trong nh, do b n ch t c

b xác su t c

a toàn b nh. Tuy nhóm th

không gian t t hơn nhóm th
chúng ta mu n thu ư

hai có th

nh thành các kh i

màu toàn c c bi u th
thu nh n ư

nh t nhưng v n có các h n ch : H n ch
i, k t qu

c, cách ti p

c thông tin không gian c

c nhi u thông tin không gian c a vùng (

nh c n chia thành nhi u kh
màu bi u di n


a lư c

u có
nh t theo

màu toàn c

g ng t ng thông tin không gian thông qua chia

u. Nhóm th nh t có h n ch

lư c

m màu [64]. Các phương pháp này

phân

c thông tin
th

nh t,

i tư ng) trong nh,

c a vi c chia này là không gian lưu tr

nh t ng cao và

ph


22

a

c t p tính toán ln. Hơn n a, các

các
i


tư ng c a nh trong th c t khó có th ép vào các kh i u. Vì v y, các k thu t c p trên
không cho các k t qu t t [7, 40, 69].
1.3.2 Lư ng hóa màu
màu, lư ng hoá màu ph i ư

sinh ra các lư c

các màu ư

màu là quá trình gi m s
lư ng hoá ư

c xác

c s d ng

c áp d ng. Lư ng hoá

bi u di n m t


nh b i không gian màu và phân

nh. M t lư c

o n c a không gian màu

ư c s d ng. M t không gian màu là bi u di n c a màu trong không gian ba chi u.
Áp d ng m t lư c ư
c chia ra thành m t s
s các màu ư

lư ng hoá chu n trên m t không gian màu, m i tr c ph n.
Khi các tr c ư c chia ra thành k, l, và m ph n,

c s d ng

gian màu thành n màu thư ng ư
1.3 minh ho s

nh s là n = k.l.m . Lư ng hoá không

bi u di n m t

lư ng hoá n d i. Hình

c xem như m t lư c

nh hư ng c a lư ng hoá các nh màu.


Hình 1.3. T trái sang: nh g c s d ng 256 màu, ư c lư ng hoá trong 8 d i,
và ư c lư ng hoá trong 64 d i s d ng không gian màu RGB.

1.3.3 Bi u di n màu
1.3.3.1 Lư c
Lư c
hóa. Lư c

màu

màu bi u th phân b
màu ư

toàn c c và c c b

c tính toán d

cas

các i m

dàng và hi u qu

trong nh. Hơn n a, lư c

d ch chuy n v tr c quan sát và thay

nh cho m i d i ư

không gian màu nào ó (thí d , các thành ph n


23

phân b

màu

màu không nh y c m v i quay và

i ch m v i t

Do m i i m nh trong nh có th ư c mô t m t

trong mô t

c lư ng

l và v trí quan sát.
b i ba thành ph n màu trong
,

xanh lam và xanh lơ trong


không gian RGB, ho c s c màu,
có th ư c

nét và giá tr trong không gian HSV), m t lư c

nh ngh a cho m i thành ph n. M t lư c


hơn s có kh n ng phân bi t các

màu ch a nhi u d i

nh t t hơn. Tuy nhiên,

t p tính toán và khó kh n cho cơ ch

ánh ch s

i u này s

t ng

ph c

CSDL nh.

Hơn n a, s lư ng d i nhi u không c i ti n hi u n ng tra c u trong nhi u ng d ng. M t
trong các cách

xác nh s lư ng các d i là s d ng các phương pháp phân c m xác

nh K màu t t nh t trong m t không gian ã cho v i m t t p các nh ã cho và m i màu t t
nh t này s ư c coi là m t d i c a lư c . Do quá
trình phân c m này l y phân b
màu c a các
không có ho c có r t ít
n ng các d i lư c

khác là s d ng các d i có s

im

nh trên toàn b CSDL
nh nên kh
i m nh là c c ti u. M t l a ch n

nh l n nh t. Có l a ch

n này là do ph n l n các

i m nh c a m t nh thu c v m t s ít các d i c a lư c
c a lư c

a lư c

Khi m t CSDL nh ch a m t s lư ng l n các
cho ra nhi u k t qu

sai. Ngoài ra, lư c

màu không quan tâm

các

màu tương t . V n

c bi t quan tr ng v


này tr

nên

gi m các k t qu

sai, m t s c i ti n

gian vào lư c

như k thu t lư c

ãư

hơn là phân

S

n thông tin

xu t

nh l n.

liên k t thông tin không
cách ti p c n khác chia

cho m i vùng con. Cách chia ơ n gi n

nh t [51], phân ho ch hình qu t [48]. Cách chia ph c t p


các vùng con s

1.3.3.2 Lư c

c

i các CSDL

o n vùng [45, 46] ho c th m chí phân ho ch

lưu tr các lư c

s

nh r t khác nhau có th có các phân b

liên k t [17]. M t s

nh thành các vùng con và tính lư c

là phân ho ch hình ch

,

coi như là nhi u.

nh, so sánh theo lư c

không gian c a các i m nh, vì th


T ng s

các d i

theo cách này s không làm gi m hi u n ng c a so sánh theo lư c

mà còn có th t ng cư ng hi u n ng, do các d i nh c

mt

[78]. Gi m s

i tư ng [8, 25, 29].

t ng thông tin không gian, nhưng c ng t ng không gian

màu bi u di n

nh và th i gian tính toán.

màu toàn c c GCH

d ng lư c

màu toàn c c (GCH), m t nh s ư

màu c a nó và kho ng cách gi

a hai nh s


24

ư c xác

nh b

c mã hoá v i lư c
i kho ng cách gi a các


lư c

màu này. V i GCH, chúng ta có th

s d ng các

o khác nhau, s

ư c

trình bày trong m c 1.4, tính toán kho ng cách gi a các lư c màu. Ví d dư i (Hình
1.4) ch ra cách tính kho ng cách gi a hai nh s d ng GCH.

a/ nh I1

b/ nh I2

c/ nh I3


Hình 1.4. Ba nh I1, I2 và I3 và các lư c
màu tương ng c a chúng.
Trong các lư c
màu này có ba d i:
en, xám, và tr ng. Lư c
màu c a

nh I1: {25%, 37.5%, 37.5%}; lư c

màu c a nh I2: {18.75%, 37.5%, 43.75%};

màu gi ng như
và nh I3 có lư c
Euclid
tính toán kho ng cách lư c

nh I2. N u chúng ta s
, kho ng cách gi a các

d ng kho ng cách
nh I1 và I2 theo

GCH là:
2

2

2

dGCH ( I 1, I 2 ) = ( 0.25 − 0.1875 ) + ( 0.375 − 0.375 ) + ( 0.375 − 0.4375 ) = 0.088

Kho ng cách gi a các nh I1 và I3 b ng kho ng cách gi
a các nh I1 và I2 và

kho ng cách gi a các

nh I2 và I3 là 0.

GCH là phương pháp tra c u

nh truy n th ng d a vào màu. Tuy nhiên, GCH

không g m thông tin liên quan
n phân b màu c a các vùng, vì th kho ng cách
gi a các nh có th không ch ra s khác nhau th t gi a các
nh. Ch ng h n, kho ng
cách gi a hai nh I1 và I3 ph i nh
d ng GCH chúng ta thu ư

hơn kho ng cách gi a hai nh I1 và I2, nhưng s

c kho ng cách gi ng nhau.

c a GCH.

25

ây là như c i m chính



×