Tải bản đầy đủ (.pdf) (95 trang)

Luận văn thạc sĩ công nghệ thông tin Nghiên cứu và xây dựng bộ lọc ảnh thông qua phân loại ảnh kết hợp với gom cụm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.89 MB, 95 trang )


B GIÁO DC VÀ ÀO TO
TRNG I HC LC HNG
***



NGUYN C NNG




NGHIÊN CU VÀ XÂY DNG B LC NH THÔNG
QUA PHÂN LOI NH KT HP VI GOM CM



LUN VN THC S CÔNG NGH THÔNG TIN








ng Nai, 2013


B GIÁO DC VÀ ÀO TO
TRNG I HC LC HNG


***


NGUYN C NNG



NGHIÊN CU VÀ XÂY DNG B LC NH THÔNG
QUA PHÂN LOI NH KT HP VI GOM CM


Chuyên ngành: CÔNG NGH THÔNG TIN
Mã s: 60.48.02.01



LUN VN THC S CÔNG NGH THÔNG TIN


NGI HNG DN KHOA HC
TS PHM TRN V


ng Nai, 2013


I
LI CAM OAN
Tôi xin cam đoan đây là công trình nghiên cu ca bn thân. Các s liu,
kt qu trình bày trong lun vn này là trung thc. Nhng t liu đc s dng

trong lun vn có ngun gc và trích dn rõ ràng, đy đ.

Hc viên


Nguyn c Nng



II
LI CM N
Tôi xin bày t lòng bit n sâu sc đn TS Phm Trn V đã hng dn
nhit tình, tn tâm trong sut quá trình tôi thc hin lun vn này.
Tôi xin chân thành cm n Quý thy cô trong Khoa Công ngh thông tin
trng i hc Lc Hng đã to điu kin thun li cho tôi trong sut thi gian
hc tp và nghiên cu ti trng.
Tôi cng xin chân thành cm n Quý thy cô ngoài trng đã tn tâm dy
bo tôi trong sut quá trình hc tp và giúp đ tôi trong quá trình nghiên cu.
Xin chân thành cm n nhng ngi thân trong gia đình, cùng các anh ch
em, bn bè, đng nghip đã giúp đ, đng viên tôi trong quá trình thc hin và
hoàn thành lun vn này.

ng Nai, ngày 12 tháng 12 nm 2012
Hc viên


Nguyn c Nng
III
MC LC
LI CAM OAN I

LI CM N II
MC LC III
DANH MC HÌNH VI
DANH MC BNG VIII
DANH MC CÁC T VIT TT IX
M U 1
CHNG 1: TNG QUAN V PHÂN LOI HÌNH NH. 4
1.1. Tng quan v phân loi hình nh. 4
1.1.1. Gii thiu v bài toán phân loi. 4
1.1.2. Tng quan. 4
1.2. Quy trình phân loi nh. 9
CHNG 2: CÁC PHNG PHÁP TRÍCH CHN C TRNG VÀ 
O TNG NG GIA CÁC NH. 10

2.1. Harris. 10
2.2. SIFT (Scale Invarian Feature Transform) 12
2.2.1. Phát hin cc tr. 12
2.2.2. nh v chính xác đim khóa 15
2.2.3. Gán hng cho các đim khóa 18
2.2.4. Xây dng b mô t cc b 19
2.3. Harris-Laplace 21
2.3.1. Không gian t l 21
2.3.2. Hàm Harris thích nghi t l 24
2.3.3. S la chn t l t đng 25
2.3.4. Thut toán phát hin đim bt đng 26
2.4. Harris-Affine 28
2.4.1. Mc tiêu 29
2.4.2. Ma trn Moment cp hai Affine 29
2.4.3. K thut phát hin đim bt đng 33
IV

2.5. Phng pháp SURF (Speed Up Robust Feature) 39
2.5.1. nh tích hp (integral image) 40
2.5.2. Phát hin Fast-Hessian: 40
2.5.3. S biu din không gian t l: 42
2.5.4. nh v đim quan tâm 43
2.5.5. B mô t đim quan tâm và so khp 44
2.6. So sánh - Kt lun 49
2.7. La chn đc trng. 51
CHNG 3: CÁC PHNG PHÁP PHÂN LOI NH. 55
3.1. Tng quan. 55
3.2. Các phng pháp phân loi nh. 57
3.2.1. Phng pháp phân loi K-Means. (tham kho web) 57
3.2.2. Phng pháp pháp Naïve Bayes (NB). 62
3.2.3. Phng pháp Support Vector Machine (SVM) 64
3.2.4. Phng pháp K-Nearest Neighbor (KNN) 65
3.2.5. Phng pháp Linear Least Square Fit (LLSF) 66
3.2.6. Phng pháp Centroid – based vector 67
3.2.7. Kt lun 68
CHNG 4: NG DNG C TRNG BT BIN KT HP K-MEAN
TRONG PHÂN LOI NH. 69

4.1. Bài toán phân loi nh 69
4.1.1. Mô hình bài toán phân loi nh 70
4.1.2. Thut toán s dng: 70
4.2. Hin thc bài toán 73
4.2.1. Môi trng 73
4.1.2. Công c s dng 73
4.1.3. D liu 74
4.1.4. Chng trình 74
4.1.5. ánh giá. 77

KT LUN VÀ KIN NGH. 80
V



VI
DANH MC HÌNH
Hinh 1.1: Quy trình hun luyn nh. 9
Hình 1.2: Quy trình kim th nh. 9
Hình 2.1. Mô phng vic tính toán các DoG nh t các nh k m 13
Hình 2.2: Mi đim nh đc so sánh vi 26 láng ging ca nó 14
Hình 2.3. Các giai đon la chn các đim khóa. 16
Hình 2.4. B mô t đim khóa 19
Hình 2.5. Mt th hin đa t l ca mt tín hiu 22
Hình 2.6. Các mc khác nhau trong mt th hin không gian t l 23
Hình 2.7. Ví d v các t l đc trng 26
Hình 2.8. Phát hin đim quan tâm bt bin t l 28
Hình 2.9. im quan tâm bt bin t l trong các nh b bin đi affine . 30
Hình 2.10. Biu đ gii thích phép chun hóa affine 32
Hình 2.11. Phát hin lp li ca mt đim quan tâm bt bin affine 37
Hình 2.12. Phát hin đim quan tâm bt bin affine 39
Hình 2.13: T trái sang phi: đo hàm riêng bc hai ca hàm Gaussian 41
Hình 2.14: Thay vì lp li vic gim kích c nh (bên trái), vic s dng
nh tích hp cho phép tng t l lc vi giá tr không đi (bên phi).
42
Hình 2.15: Biu đ t l phát hin. S lng đim quan tâm đc phát
hin trên mi octave phân rã nhanh chóng 43

Hình 2.16: Nhng đim quan tâm đc phát hin trên mt cánh đng hoa
hng dng. 44


Hình 2.17: Phép lc Haar wavelet đ tính toán đc trng  x (bên trái) và
y hng (bên phi). Vùng đen có trng s -1 và vùng trng có trng s +1 45

Hình 2.18: Gán hng: mt ca s dch hng ca kích thc 3 phát
hin hng tri ca các đc trng Haar wavelet có trng s Gaussian  mi
đim mu trong vòng tròn láng ging quanh đim quan tâm. 46

Hình 2.19: Chi tit ca nh Graffiti th hin kích thc ca ca s b mô
t hng  các t l khác nhau. 46

Hình 2.20:  xây dng b mô t, mt khung li hng bc hai vi 4x4
vùng con hình vuông đc đt trên các đim quan tâm (bên trái).  mi hình
vuông đc trng wavelet đc tính toán. S chia nh 2x2 ca mi hình vuông
tng ng vi các trng thc ca b mô t. Nhng cái này là tng ca dx, dy,
|dx| và |dy|, tính toán tng đi hng ca li (bên phi). 47

Hình 2.21. Các mc mô t ca min con đi din cho tính cht ca mu
cng đ c bn. Hình trái: trong trng hp ca mt min con đng nht, tt
c các giá tr là tng đi thp. Hình gia: s có mt ca tn s trong x hng,
VII
giá tr ca  là cao, nhng tt c các trng hp khác vn thp. Nu cng đ
tng dn theo x hng, c  và  đu cao. 48

Hình 2.22: Nu đ tng phn gia hai đim quan tâm khác nhau (ti trên
nn sáng vi sáng trên nn ti), ng viên s không đc xem là so khp có giá
tr. 49
Hình 2.24: So sánh v góc nhìn (Bên trái). nh so sánh (bên phi) 50
Hình 2.25: So sánh v cng đ sáng (Bên trái). nh so sánh (bên phi) 50
Hình 2.26: So sánh v t l (Bên trái). nh so sánh (bên phi) 51

Hình 3.1: Mô hình SVM 64
Hình 4.1. Ví d v bài toán phân loi nh 69
Hình 4.2. S đ chc nng nhn dng đi tng 70
Hình 4.3: Phng pháp SURF 71
Hình 4.4: Phng pháp Hessian-Laplace 71
Hình 4.4: Phng pháp SIFT 72
Hình 4.5: giao din chng trình. 74
Hình 4.6: Công đon rút trích đc trng. 75
Hình 4.7: mt phn góc nhìn ca tp đc trng. 75
Hình 4.8: Công đon phân cm các đc trng. 76
Hình 4.9: Sau khi phân thành 2 cm. 76
Hình 4.10: c trng nhóm 1 (class1.lhu). 77
Hình 4.11: Kt qu kim th. 77



VIII
DANH MC BNG
Bng 2.1: Mt s phng pháp la chn đc trng. 52
Bng 4.1: Bng so sánh kt qu các phng pháp 72
Bng 4.2: Môi trng thc nghim 73
Bng 4.3: Công c mã ngun m s dng 73
Bng 4.4: 4 nhóm nh và s lng mu dùng trong thc nghim. 78
Bng 4.5: Kt qu kim chng sau khi chy chng trình. 79
Bng 4.6: Xác sut ca chng trình. 79



IX
DANH MC CÁC T VIT TT


T vit tt Ý nghĩa
KNN
K-Nearest Neighbor
LDA
Latent Drichlet Allocation
LLSF
Linear Least Square Fit
MM
Maximum Matching
NB
Naïve Bayes
SVM
Support Vector Machine
TF
Term Frequency
ROI

Regions Of Interest

SIFT Scale-invariant feature transform
SURF Speeded-up Robust Features
BAN Bayesian Networks Augmented Naive Bayes
NBC Naive Bayes Classifiers
PCA Principal Components Analysis
JSD Jensen-Shannon divergence
DoG difference-of-Gaussian
BDA biased Discriminant analysis
MDA Mutiple Discriminant analysis
DA Discriminant analysis

SMMS
symmetric maximized minimal distance in
subspace
CBIR Content-based image retrieval
BOF Bags of Features
X
BOW Bags of Words
CLDA Constrained linear discriminant analysis
VQ Vector-Quantization


1
M U
Trong nhng nm gn đây, s phát trin vt bc ca Công ngh thông tin đã
làm tng s lng giao dch thông tin trên mng Internet mt cách đáng k đc bit là
th vin đin t, tin tc đin t, hình nh, … Do đó mà s lng vn bn cng nh
hình nh xut hin trên mng Internet cng tng vi mt tc đ chóng mt, và tc đ
thay đi thông tin là cc k nhanh chóng. Vi s lng thông tin đ s nh vy, mt
yêu cu ln đt ra là làm sao t chc và tìm kim thông tin, d liu có hiu qu nht.
Bài toán phân lp là mt trong nhng gii pháp hp lý cho yêu cu trên. Nhng mt
thc t là khi lng thông tin quá ln, vic phân lp d liu th công là điu không
th. Hng gii quyt là mt chng trình máy tính t đng phân lp các thông tin
d liu trên.
Trong các loi d liu thì hình nh là loi d liu ph bin mà con ngi
thng gp phi. Chính vì l đó mà hãng Google đã đa thêm chc nng tìm kim
hình nh vào th vin chc nng ca mình, các công c tìm kim hình nh ngày
càng tng lên. Nhm tng s lng truy cp, h đã không ngng phát trin module
tìm kim hình nh cng nh các module khác ca mình. Vy h đã làm ra sao vi
khi lng hình nh đ s đn nh vy ?. Mô hình biu din hình nh ph bin
hin nay là mô hình không gian vector, trong đó mi hình nh đc biu din bng

mt vector ca các đim đc trng (keypoint). Tuy nhiên bài toán khai phá d liu
hình nh thng gp phi mt s khó khn nh tính nhiu chiu ca nh, đ nhiu
ca nh, đ bin dng … ng thi, khi x lý các bài toán phân lp t đng thì
cng gp phi mt s khó khn là đ xây dng đc b phân lp có đ tin cy cao
đòi hi phi có mt lng các mu d liu hun luyn tc là các hình nh đã đc
gán nhãn ch đ lp tng ng. Các d liu hun luyn này thng rt him và đt
vì đi hi thi gian và công sc ca con ngi. Do vy, cn phi có h thng x lý
hình nh hiu qu và mt phng pháp hc không cn nhiu d liu đc phân loi
và có kh nng tn dng đc các ngun d liu cha phân loi rt phong phú nh
hin nay. Nhn thy đây là lnh vc mang tính khoa hc cao, ng dng rt nhiu
trong các bài toán thc t ví d nh: ng dng lc ni dung nh, bài toán phân lp
2
sau tìm kim, … Tác gi quyt đnh chn đ tài “Nghiên cu và xây dng b lc
nh thông qua phân loi nh kt hp vi gom cm.” là mt vic làm không ch
có ý ngha khoa hc, mà còn mang tính thc tin.
Trong lun vn s trình bày mt s thut toán phân lp tiêu biu và đa ra
hng thc nghim cho h thng phân lp.
Lun vn áp dng phân tích thành phn đc trng bt bin ca tm nh c th
là thut toán Scale-invariant feature transform (SIFT) phc v cho vic tin hành
rút ly nhng đc trng bt bin ca nh sau đó dùng gii thut clustering đ tin
hành phân lp. Thc nghim cho thy đ chính xác tng đi, phù hp đ áp dng
vào h thng phân lp t đng.
Mc tiêu ca lun vn:
- Nghiên cu các k thut x lý hình nh đ ly ra đc các vector đc trng.
- Nghiên cu các phng pháp gom cm d liu đin hình là K-Means nhm
mc đích phân nhóm các đc trng thành các nhóm riêng l.
- Xây dng ng dng hin thc cho vic phân loi nh vào các nhóm nh theo
ni dung.
- ánh giá và đa ra kin ngh cho đ tài.
i tng nghiên cu: Các tp tin hình nh.

Phm vi nghiên cu: Phân loi hình nh vào các th loi tng ng vi ni
dung tm nh. Trong khuôn kh lun vn các th loi đc nghiên cu x lý còn ít
cha đc phong phú.
Nhng vn đ cn gii quyt trong phm vi lun vn:
- Tìm hiu tng quan v vn đ cn nghiên cu.
- Tìm hiu cách thc tng tác vi tp tin nh đ rút ra đc trng.
- Tìm hiu các gii thut clustering.
- Xây dng b d liu
dùng đ hun luyn máy.
- Xây dng quy trình phân loi nh.
- Hin thc quy trình phân loi nh.
B cc trình bày ca lun vn:
Chng 1: Gii thiu tng quan v bài toán phân loi nh và đa ra quy trình
phân loi.
3
Chng 2: Trình bày các phng pháp trích chn đc trng và đ đo tng
đng gia các nh
đ phc v cho bài toán.
Chng 3: Trình bày
các phng pháp phân loi nh.
Chng 4:
Thc nghim và đánh giá chng trình.
Kt lun nhng đim chính, ch ra nhng đim cn khc phc đng thi đt
ra hng phát trin.


4
CHNG 1: TNG QUAN V PHÂN LOI HÌNH NH.
1.1. Tng quan v phân loi hình nh.
1.1.1. Gii thiu v bài toán phân loi.

Phân loi hình nh là mt trong nhiu lnh vc đc chú ý nht và đã đc
nghiên cu trong nhng nm gn đây.
Phân loi hình nh (hay Image Classification hoc Image Categorization)
là quá trình gán các nh vào mt hay nhiu lp nh đã đc xác đnh t trc.
Ngi ta có th phân loi nh bng cách th công, tc là nhìn vào ni dung tm
nh sau đó gán chúng vào mt hay nhiu lp c th nào đó. H thng qun lý tp
tin nh gm nhiu nh cho nên vic làm này s tn rt nhiu thi gian, công sc
và do đó là không kh thi. Do vy mà phi có các phng pháp phân loi t
đng.  phân loi t đng, ngi ta s dng các phng pháp máy hc trong trí
tu nhân to nh cây quyt đnh, Naïve Bayes, K láng ging gn nht, gii thut
clustering, …
Mt trong nhng ng dng quan trng nht ca phân loi nh t đng là
ng dng trong các h thng tìm kim nh. T mt tp con các nh đã phân lp
sn, tt c các nh trong min tìm kim s đc x lý rút ra nhng vector đc
trng sau đó đc đa qua clustering đ hình thành các nhóm đc trng và đc
gán nhãn lp tng ng.
Mt ng dng khác ca phân loi nh là trong lnh vc hiu nh. Phân loi
nh có th đc s dng đ nhóm các nh vào các nhóm mà ni dung tm nh đ
cp. Bt lun tm nh có b xoay, co giãn, hay nói cách khác là hình nh có b
nhiu.
Trong phân loi nh, s tng ng gia mt nh vi mt lp hoc thông
qua vic gán giá tr đúng sai (True – nh thuc lp, hay False – nh không thuc
lp) hoc thông qua mt đ ph thuc (đo đ ph thuc ca nh vào lp). Trong
trng hp có nhiu lp thì phân loi đúng sai s là vic xem mt nh có thuc
vào mt lp duy nht nào đó hay không.
1.1.2. Tng quan.
X lý nh, phân loi nh trong nhng nm gn đây là lnh vc đang đc
gii khoa hc quan tâm không nhng trong nc mà còn ngoài nc. Các công
trình liên quan đn vn đ x lý nh đc bit là phân loi nh đã đc công b
nh sau:

5
Ngoài nc:
•  tài “ Beyond Bags of Features: Spatial Pyramid Matching for
Recognizing Natural Scene Categories” ca đng tác gi Svetlana
Lazebnik, Cordelia Schmid, Jean Ponce. [2]
Trong đ tài này tác gi đa ra phng pháp xác đnh loi quang
cnh da vào đ xp x hình hc toàn cc. Trong nhng nm gn thì các
công trình nghiên cu đã đa ra các khái nim v đc trng cc b và đc
trng toàn cc nhng vic tính toán trên các đc trng này còn gp rt
nhiu hn ch vì lý do có rt nhiu đc trng trong mt bc nh khin cho
vic tính toán tr nên phc tp và hao tn nhiu tài nguyên h thng.
Chính vì l đó mà các tác gi trong đ tài [2] đã nghiên cu và đa ra khái
nim Bags of Features hay Bags of Words (BOF hay BOW) nhm mc
đích gim thiu thi gian tính toán cho h thng.
• Bài báo “Boosting Image Classification with LDA-based Feature
Combination for Digital Photograph Management” ca đng tác gi
Xuezheng Liu, Lei Zhang, Mingjing Li, Hongjiang Zhang, Dingxing
Wang. [3]
ã có s dng thut toán LDA đ gán tên lp cho nhng thuc tính
mà đã rút ra đc. LDA – SVM thng đc thy trong các đ tài tính
toán hoc làm vic trên vn bn. LDA dùng đ gán nhãn vào các đc trng
sau đó các đc trng s đc tính toán và phân vào các nhóm theo mt
tiêu chí nào đó nh vào SVM. Trong đ tài [3] các tác gi đã dùng LDA
cho vic gán nhãn các đc trng hình nh nhm mc đích tránh s dng
thut toán phân cm, mt trong nhng nguyên nhân gây hao tn tài
nguyên h thng khi phi làm vic trên mt s lng ln các đc trng.
• Bài báo “Unsupervised real-time constrained linear discriminant analysis
to hyperspectral image classification”, Qian Du, Department of Electrical
and Computer Engineering, Missisippi State University, MS 39762, USA.
Accepted 14 August 2006. [17]

Khi s lng các đc trng tr lên nhiu thì vic tính toán s gp
nhiu khó khn tác gi Qian Du [17] đã ci thin đc thut toán CLDA
theo cách không giám sát nhm mc đích các đc trng đc phân vào các
nhóm trong khi các khái nim nhóm đó là cha có. Vn d CLDA là mt
phng pháp có giám sát tc là các đc trng cn đc gán cho mt trng
s, mt nhãn nào đó mà đã có khái nim trc đó. Trong thc t thì vic
làm này gp khó khn vì phi phân đnh rõ ràng trng s hay tên nhóm
trc.
6
• Bài báo “SVM-KNN: Discriminative Nearest Neighbor Classification for
Visual Category Recognition” ca đng tác gi Hao Zhang, Alexander C.
Berg, Michael Maire, Jitendra Malik thuc khoa khoa hc máy tính trng
đi hc Berkeley, California. [15]
Vi mi nh cn phân loi s rút ra nhng đc trng sau đó ly ra
vùng lân cn ca các đim đc trng này và tính toán khong cách cho các
đc trng, dùng thut toán KNN-SVM đ tính trng s cho các đim đc
trng đó. Vi mi nh cn phân loi s tìm ra trong c s d liu k láng
ging gn nht gn nht, nu mi nh này thuc vào mt nhóm thì s kt
thúc tin trình phân loi, ngc li dùng SVM cho k đim đc trng đó.
ó là ý tng ca bài báo [15] nhng khi thc hin li gp phi khó khn
là vic tính đc k láng ging gn nht li tr lên lâu và hao tn nhiu tài
nguyên máy tính.
• Bài báo “Image Classification using Super-Vector Coding of Local Image
Descriptors” ca tác gi XiZhou, Kai Yu, Tong Zhang, Thomas S.
Huang.[9]
Trong bài báo tác gi đã đ xut mt phng thc mi trong vic
phân loi nh đó là s dng vector đ miêu t nh cc b. Công vic đc
thc hin bng cách tìm ra các nhóm đc trng đi din cho mt bc nh.
Phng pháp phân loi nh tri qua 3 bc: Mô t mã hóa, tính toán
không gian tng hp, và phân loi nh. Trong vic mô t mã hóa ca mt

tm nh đc ánh x phi tuyn tính đ to ra mt vector vi s chiu ti
thiu, trong bài báo có đ xut mt phng pháp tam gi là Super-vector
mã hóa, thut toán là mt m rng ca Vector-Quantization (VQ).  bc
tính toán không gian tng hp, đi vi mi khu vc đa phng, các mã
hóa ca tt c các mô t trong đó đc tng hp li đ to thành mt
vector duy nht sau đó các vector này đc tng hp li to thành c s
dùng đ tính toán đ tng đng gia các miêu t cc b. SVMs tuyn
tính là cách thc đc chn trong bài báo này dùng đ phân loi nh.
•  tài “Object Recognitionusing Local Descriptors” ca tác gi Javier
Ruiz và Patricio Loncomila thuc trung tâm nghiên cu khoa hc
Chile.[10]
Trong đ tài tác gi đã s dng đc trng cc b bt bin đ xác
thc đi tng trong nh, mc đích chính là dùng đ tìm nh và cng đã
đa ra cách xây dng c s d liu đ ci tin tc đ tìm kim đó là s
dng Kd-trees.
7
• Bài báo “Object Recognition from Local Scale-Invariant Features” ca tác
gi David G. Lowe, thuc khoa khoa hc máy tính, trng đi hc British
Columbia. [9]
David G. Lowe cng chính là tác gi đa ra khái nim v đc trng
cc b bt bin Local Scale-Invariant Features (SIFT), đc ng dng
nhiu trong các bài toán truy tìm nh, phân loi nh và xác thc.
Các đc trng hình nh bao gm nhiu loi: màu sc, kt cu, hình
dng, … tuy nhiên các đc trng này ít nhiu li ph thuc vào không gian
nh, bin đi nh.
Trong công vic xác đnh đi tng trong nh, tác gi đã lu tr các
đc trng và đánh ch mc cho chúng khi các nh tham gia truy vn s
đc rút ra các đc trng SIFT và đem ra so sánh vi các đc trng đã có
trong c s d liu. Vic làm này s làm hao tn rt nhiu thi gian tính
toán ca h thng.

• Bài báo “Texture classification of aerial image based on bayesian network
augmanted naïve bayes”, YU Xin, ZHENG Zhaobao, ZHANG Haitao, YE
Zhiwei. [16]
Bài báo đã có s so sánh hai phng thc Bayesian Networks
Augmented Naive Bayes (BAN) và Naive Bayes Classifiers (NBC) and
PCA-NBC trong phân loi nh và nhn thy BAN chy tt hn NBC và
PCA-NBC.
• Bài báo “Speeded-up Robust Features (SURF), Herbert Bay, Andreas Ess,
Tinne Tuytelaars, Luc Van Gool, 12/2007. [14]
Bài báo vi mong mun thay th đc trng SIFT bng SURF và s
dng ma trn Hessian đ đo b phát hin đc trng, nhm ng dng trong
các h thng camera.
• Bài báo “Recognizing Indoor Scenes”, Ariadna Quattoni, Antonio
Torralba.[12]
Trong khi các công c xác đnh quang cnh ch tp trung  không
gian ngoài tri thì bài báo đã chn không gian trong nhà đ xác đnh, vì
nhng nhc đim ca các công c xác đnh loi quang cnh ngoài tri s
kém linh hot trong không gian trong nhà, tác gi bài báo đã đa ra mt
phng thc hin đi đó là Regions Of Interest (ROI), tm gi vùng đc
trng bng cách di chuyn khung đi chiu đc lp vi nhau.
• Bài báo “Combining Local and Global Image Feature for Object Class
Recognition” ca tác gi Dimitri A. Lisin, Marwan A. Mattar, Matthew B.
Blaschko, Mark C. Benfield, Erik G. Learned-Miller. [4]
8
Bài báo đã nêu ra rng các đc trng toàn cc hay cc b đu có th
dùng đ xác đnh đi tng trong tm nh.
Các đ tài trên mi mt đ tài mnh v mt đim nhng cha thc
s đa ra đc cách ti u trên mt tp nh ln. Vi các đnh dng nh
*.PNG, *.PGM thì đc trng SIFT đc rút ra nhanh, nhng vi đnh dng
*.JPG thì còn là tr ngi. ng thi trong vic đi sánh hai nh vi nhau

SIFT còn hn ch v mt thi gian thc hin do s lng tp key point còn
quá ln.

Trong nc:
Trong nc tuy còn ít đ tài nghiên cu v lnh vc phân loi nh, mà ch
tp chung ch yu vào nghiên cu các công c đi sánh nh, tìm nh nhng có
s dng các đc trng bt bin cùng các k thut phân cm và cây quyt đnh.
in hình cho vn đ này có các bài báo sau:
•  tài “Gii thiu ng dng phng pháp phân loi da trên đi tng
(Object-based classification) trong thành lp bn đ rng t nh v tinh”,
Ts. V Anh Tuân. [18]
ây là đ tài đã phân loi nh da vào phng pháp phân loi có
kim đnh và phân loi da vào decision tree.
•  tài “ phng pháp trích chn đc trng nh trong thut toán hc máy
tìm kim nh áp dng vào bài toán tìm kim sn phm”, Nguyn Th
Hoàn. [20]
 tài có gii thiu và ng dng đc trng SIFT cho bài toán ca
mình.
•  tài “Xác đnh cm xúc mt ngi”, Trn Ngc Phm. [21]
 tài đã s dng PCA trên tp hun luyn nh đ rút trích đc
trng. Phng pháp AdaBoost và đc trng Haar-like đc áp dng đ
hun luyn các b phân loi.
•  tài “Nghiên cu phng pháp kt hp các đc trng màu sc hình dng
và v trí đ truy vn nh” lun vn thc s ca tác gi Trn Sn Hi, nm
2007 [19].
Lun vn này đã đ xut mt phng pháp kt hp các đc trng
màu sc, hình dng và v trí bng h thng liên mng meta-Nron. H
thng liên mng meta-Nron không nhng áp dng vào các đc trng màu
sc, hình dng và v trí ca nh mà còn có th áp dng cho các đc trng
lng t khác. Các đc trng lng t bt k rút trích t nh s qua các

9
mng Nron con cho ra các output cc b. Các output ca các mng con
s là ngõ vào ca mng meta-Nron đ cho ra các kt qu output cui
cùng ca toàn h thng liên mng.
1.2. Quy trình phân loi nh.

Hinh 1.1: Quy trình hun luyn nh.

Hình 1.2: Quy trình kim th nh.
i vi tp hun luyn thì s lng nh cn nhiu vì th tin trình hun
luyn s rt lâu. im quan trng nm  ch rút đc trng, phi xác đnh đc
trng thích hp cho bài toán vì nh hng đn đ chính xác ca chng trình.

10
CHNG 2: CÁC PHNG PHÁP TRÍCH CHN C
TRNG VÀ  O TNG NG GIA CÁC NH.
Chng này trình bày mt s k thut đc s dng hiu qu trong cách
tip cn đ xác đnh các đim bt bin trong nh nhm trích chn các đc trng
bt bin ca đi tng và s dng các đc trng này trong vic so khp, nhn
dng đi tng. Ngoài ra các đim này tác gi cng s dng nhm mc đích
phân loi nh theo nh mc tiêu ca cun báo cáo.
Trong nhng nm gn đây vic s dng các đc trng cc b đã tr thành
mt trong nhng hng tip cn có nh hng ln trong vic nhn dng đi
tng da vào ni dung nh. Vic phát hin các đim đc bit là bc đu tiên
trong quá trình so khp và nhn dng. Vì vy, mt thut toán đáng tin cy cho
vic trích chn các đim bt bin là rt cn thit cho nhiu ng dng. Chng
này trình bày mt s k thut mi cho vic trích chn các đim bt đng trong
nh. Các hng tip cn này bt bin đi vi các phép bin đi hình hc và phép
bin đi trc quang.  đây cng nhn mnh vn đ bt bin đi vi phép bin đi
affine.

2.1. Harris.
Phát hin góc (corner detection) hoc mt thut ng tng quát hn là phát
hin đim quan tâm (interest point detection) là mt hng tip cn đc s
dng trong các h thng th giác máy tính đ trích chn các loi đc trng và suy
lun ra các ni dung ca mt nh. Vic phát hin góc đc dùng thng xuyên
trong phát hin, theo dõi chuyn đng, mô hình 3D và nhn dng đi tng.
Mt góc đc xác đnh bi ni giao nhau ca hai cnh. Mt góc cng có
th đc xác đnh nh mt đim có hai hng khác nhau trong mt vùng cc b
ca đim đó. Mt đim quan tâm là mt đim trong mt nh mà đim này có v
trí đc xác đnh tt và có th đc phát hin nhanh chóng. iu này có ngha là
mt đim quan tâm có th là mt góc nhng cng có th là mt đim đn có giá
tr cng đ cc đi hoc cc tiu cc b, các đim kt thúc ca đng thng
hoc mt đim trên mt đng cong mà  đó đ cong là ti đa cc b. Trên thc
t, hu ht các phng pháp phát hin góc phát hin các đim hn là các góc nói
riêng.
Phng pháp phát hin góc Harris là mt phng pháp phát hin đim
quan tâm ph bin vì nó bt bin đi vi phép quay, thay đi đ sáng và tp
nhiu nh. Phng pháp này da trên hàm tng quan t đng cc b ca mt
11
tín hiu;  đó hàm tng quan t đng cc b đo các thay đi cc b ca tín hiu
vi các mnh nh đc dch chuyn mt lng nh theo các hng khác nhau.
Cho trc s dch chuyn (x, y) và mt đim (x,y), hàm tng quan t
đng đc đnh ngha nh sau:

(
, 
)
=

[

(


, 

)

(


+ x, 

+ y
)
]


(2.1)
Trong đó I(·,·) biu th hàm nh và (x
i
,y
i
) là các đim trong ca s W đt
 v trí (x,y). nh đc dch chuyn đc xp x bi phép khai trin Taylor đc
lt bt thành các hng thc bc nht

(


+ x, 


+ y
)
I
(


, 

)
+ [

(


, 

)


(


, 

)
]

x
y


(2.2)
 đây I
x
(·,·) và I
y
(·,·) biu th các đo hàm tng phn tng ng theo x và
y.
Th công thc (2.2) vào (2.1), ta đc:

(
, 
)
=

[
(


, 

)
(

+

x, 

+ y)]


=


(


, 

)

(


, 

)
[

(


, 

)


(


, 


)
]

x
y



=

[

(


, 

)


(


, 

)
]

x

y



=

[

(


, 

)


(


, 

)
]

x
y



=

[
x y
]

 


(


, 

)






(


, 

)


(



, 

)




(


, 

)


(


, 

)

 


(


, 


)





x
y

=
[
x y
]

(
, 
)

x
y


 đây ma trn C(x,y) bt gi cu trúc cng đ ca mt vùng lân cn cc
b quanh đim (x,y). Ly 
1
, 
2
là các giá tr riêng ca ma trn C(x,y). Các giá
tr riêng này to nên mt s mô t bt bin đi vi phép quay. Có 3 trng hp
cn đc xét:

1. Nu c 1, 2 đu nh, đ hàm tng quan t đng cc b không thay
đi (tc là ít thay đi ti c(x,y) theo bt k hng nào) thì vùng nh nm trong
12
ca s gn nh không thay đi v cng đ. Tc là trong trng hp này, không
có đim quan tâm nào đc tìm thy ti đim nh (x,y).
2. Nu mt giá tr riêng là ln và mt giá tr riêng là nh, thì ch có các
dch chuyn cc b theo mt hng (dc theo đnh đó) gây nên s thay đi nh 
c(x,y) và thay đi đáng k  hng trc giao, điu này biu th cho mt cnh.
3. Nu c hai giá tr riêng đu ln, thì các s dch chuyn theo bt k
hng nào cng s đa đn kt qu là làm tng đáng k; điu này biu th cho
mt góc.
Thut toán này đn gin d hiu, phát hin đc nhanh chóng các đim
quan tâm trong nh tuy nhiên phng pháp này không bt bin đi vi vic thay
đi t l và các phép bin đi affine.
2.2. SIFT (Scale Invarian Feature Transform)
ây là mt trong nhng phng pháp hiu qu đ trích chn các đim bt
bin t các nh đc dùng đ thc hin so khp tin cy gia các tm nhìn khác
nhau ca cùng mt đi tng hoc quang cnh. Phng pháp này đc gi là
“Phép bin đi đc trong bt bin t l” (Scale Invariant Feature Transform –
SIFT) vì nó bin đi d liu nh thành các ta đ bt bin t l có liên quan ti
các đc trng cc b. Thut toán này gm 4 giai đon chính: phát hin các cc tr
trong không gian t l, đnh v chính xác đim khóa, gán hng cho các đim
khóa, xây dng đc trng.
2.2.1. Phát hin cc tr.
Giai đon đu tiên ca phát hin đim khóa là tìm ra các v trí và các t l
có th đc gán lp đi lp li di các tm nhìn khác nhau ca cùng mt đi
tng. Vic phát hin các v trí bt bin khi có s thay đi t l ca nh có th
đc thc hin bng vic tìm kim các đc trng n đnh qua tt c các t l có
th, s dng mt hàm liên tc t l đc hiu nh không gian t l.
Dùng hàm Gaussian làm hàm nhân ca không gian t l. Vì vy, không

gian t l ca mt nh đc xác đnh bi hàm L(x,y, ), hàm này đc to ra t
phép cun Gaussian bin thiên t l, G(x,y,  ), vi nh đu vào I(x,y):

(
, , 
)
= 
(
, , 
)

(
, 
)

trong đó * là phép toán cun theo x và y, và

(
, , 
)
=
1
2



(





)




13
 phát hin hiu qu các v trí đim khóa n đnh trong không gian t l,
ta s dng các cc tr không gian t l trong hàm Difference-of-Gaussian đc
cun vi nh đó, D(x,y, ), hàm này có th đc tính t s chênh lch gia hai t
l lân cn đc phân bit bi tha s k:
D(x,y,) = (G(x,y,k) - G(x,y,))*I(x,y) = L(x,y,k ) – L(x,y, ) (2.3)

Hình 2.1. Mô phng vic tính toán các DoG nh t các nh k m
Hình 2.1 th hin mt phng pháp hiu qu cho vic xây dng hàm
D(x,y, ). nh ban đu đc cun theo kiu gia tng vi các hàm Gaussian đ
to ra các nh đc phân bit bi tha s k trong không gian t l, đc xp
thành chng  ct bên trái. Ta chia mi quãng ca không gian t l (ngha là gp
đôi ) thành s khong (s là s nguyên), vì vy k = 2
1/s
. Chúng ta phi to ra s+3
nh trong chng các nh b làm m cho mi quãng, đ vic phát hin cc tr cui
cùng bao ph trn vn mt quãng. Các t l nh gn k đc tr vi nhau đ to
ra các nh Difference-of-Gaussian đc th hin  hình bên phi. Mt khi mt
quãng trn vn đc x lý, chúng ta tái ly mu nh Gaussian gp đôi giá tr ban
đu  và vic x lý đc lp li.

×