I H C QU CăGIAăHÀăN I
TR
NGă
I H CăCÔNGăNGH
BÙIăV NăCHUNG
PHÂNăC Mă AăMÔăHÌNHăVÀă NGăD NGă
TRONGăPHÂNă O Nă NHăVI NăTHỄM
LU NăV NăTH CăS ăCÔNGăNGH THÔNGăTIN
HÀăN I - 2016
I H C QU CăGIAăHÀăN I
TR
NGă
I H CăCÔNGăNGH
BÙIăV NăCHUNG
PHÂNăC Mă AăMÔăHÌNHăVÀă NGăD NGă
TRONGăPHÂNă O Nă NHăVI NăTHỄM
NgƠnh:ăCôngăngh thôngătin
ChuyênăngƠnh:ăK thu t ph n m m
Mƣăs : 60.48.01.03
LU NăV NăTH CăS ăCÔNGăNGH THÔNGăTIN
NG
IăH
NG D N KHOA H C:ăTS.ăLêăHoƠngăS n
HÀăN I - 2016
L IăC Mă N
hoƠnăthƠnhăt t lu năv nănƠy,ăđ uătiênăemăxinăbƠyăt lòngăbi tă năchơnă
thƠnhăvƠăsơuăs căđ n Ti năs ăLêăHoƠngăS n,ăng
iăđƣăt nătìnhăvƠătr c ti păh
ng
d n em trong su tăquáătrìnhătri năkhaiăvƠănghiênăc uăđ tƠi,ăt oăđi u ki năđ em
hoƠnăthƠnhălu năv nănƠy.
Th hai, em xinăbƠyăt lòngăbi tă năchơnăthƠnhăt iătoƠnăth cácăth yăcôăgiáoă
trongă khoaă Côngă ngh thôngă tin,ă tr
ngă
i h că Côngă ngh HƠă N i,ă
ih c
Qu că giaă HƠă N iă đƣă d y b o t nă tìnhă emă trongă su tă quáă trìnhă emă h c t p t i
khoa.
Th ba,ăemăxinăđ
c g i l i c mă năt iăcácăth yăcô,ăcácăanhăch vƠăcácăb n
trongăTrungătơmăTínhătoánăHi uăn ngăcao,ătr
ngă
i h c Khoa h c t nhiênăđƣă
giúpăđ tôi trong su t th iăgianălƠmălu năv nănƠy.
Cu iăcùngătôi xinăchơnăthƠnhăc mă năt iăgiaăđình,ăb năbè,ăđ ng nghi păđƣă
luônăbênăemăc v ,ăđ ngăviên,ăgiúpăđ em trong su tăquáătrìnhăh c t păvƠăth c
hi n lu năv n.ă
M că dùă đƣă c g ngă hoƠnă thƠnhă lu nă v nă trongă ph mă viă vƠă kh n ngă choă
phépănh ngăch c ch n s khôngătránhăkh i nh ng thi uăsót.ăEmăr tămongăđ
c
s gópăỦăchơnăthƠnhăc a th yăcôăvƠăcácăb năđ emăhoƠnăthi n lu năv năc aămình.
Lu năv nănƠyăđ
c th c hi năd
i s tƠiătr c aăđ tƠiăNAFOSTED,ămƣăs :
102.05-2014.01.
XinăchơnăthƠnhăc mă n!
Hà N i, ngày 20 tháng 4 n m 2016
H căviên
BùiăV năChung
1
M CăL C
L IăCAMă OAN....................................................................................................... 1
L IăC Mă N ............................................................................................................ 1
M CăL C .................................................................................................................. 2
DANHăSỄCHăHÌNHăV ......................................... Error! Bookmark not defined.
DANHăM CăCỄCăKụăHI UăVI TăT T............... Error! Bookmark not defined.
L IăM ă
1.
U ............................................................................................................ 5
T V Nă
................................................................................................... 5
2. M Că ệCHăC A LU NăV N......................................................................... 5
3. B C C C A LU NăV N .............................................................................. 6
CH
NGă1:ăT NGăQUANăV ăPHÂNăC M ......................................................... 7
1.1. Kháiăquátăphơnăc m ....................................................................................... 7
1.2. T ngăquanăcácăthu tătoánăphơnăc mătiêuăbi u ............................................... 8
1.2.1 Phơnăc m c măphơnăho ch ............................................................................ 8
1.2.2 Phơnăc măphơnăc p ...................................... Error! Bookmark not defined.
1.2.3 Phơnăc m d aătrênăm tăđ ........................... Error! Bookmark not defined.
1.2.5 Phơnăc măm ................................................ Error! Bookmark not defined.
1.3
ăđoăphơn c m ........................................... Error! Bookmark not defined.
1.3.1 Adjusted Rand Index ................................... Error! Bookmark not defined.
1.3.2 Jaccard Index ............................................... Error! Bookmark not defined.
1.3.3 ModifiedăHubert’să ăIndex .......................... Error! Bookmark not defined.
1.3.4 Dunn’săValidityăIndex ................................. Error! Bookmark not defined.
1.3.5 Davies-Bouldin Validity Index.................... Error! Bookmark not defined.
1.3.6 Normalized Mutual Information.................. Error! Bookmark not defined.
1.3.7 Dunn's Index (DI) ........................................ Error! Bookmark not defined.
2
1.3.8 Partition Coefficient (PC) ............................ Error! Bookmark not defined.
1.4 K tălu năch
CH
ng ........................................... Error! Bookmark not defined.
NGăII:ăPHÂNăC Mă AăMỌăHÌNH ............ Error! Bookmark not defined.
2.1. T ngăquanăv ăh căđaămôăhìnhăvƠăphơnăc măđaămôăhìnhError! Bookmark not defin
2.1.1 H căđaămôăhình ............................................ Error! Bookmark not defined.
2.2 Thu tătoánăphơnăc măđaămôăhìnhăCSPAă(sCSPA)Error! Bookmark not defined.
2.3. Thu tătoánăphơnăc măđaămôăhìnhăMCLAă(sMCLA)Error! Bookmark not defined.
2.4.ăThu tătoánăphơnăc măđaămôăhìnhăHBGFă(sHBGF)Error! Bookmark not defined.
2.5
Thu tătoánăMG ............................................ Error! Bookmark not defined.
2.5.1 Phơnăc m b i cácăthu tătoánăđ n ................. Error! Bookmark not defined.
2.5.2 T ng h păcácăk t qu phơnăc măđ n .......... Error! Bookmark not defined.
2.5.3 iătìmătr ng s thíchăh p ............................. Error! Bookmark not defined.
2.5.4 Xácăđ nh k t qu cu iăcùng......................... Error! Bookmark not defined.
2.5.5 Mƣăgi .......................................................... Error! Bookmark not defined.
2.6 K tălu năch
CH
ng ........................................... Error! Bookmark not defined.
NGăIII:ă NGăD NGăPHÂNă O Nă NHăVI NăTHỄMError! Bookmark not def
3.1 T ngăquanăv ă nhăvi năthám ........................ Error! Bookmark not defined.
3.1.1 T ng quan.................................................... Error! Bookmark not defined.
3.1.2 NguyênălỦăc ăb n c a vi năthám................. Error! Bookmark not defined.
3.1.3 B c măvƠămáyăch p nh ............................ Error! Bookmark not defined.
3.1.4 Phơnălo i nh vi năthám .............................. Error! Bookmark not defined.
3.2 Nhuăc uăth căt ăvƠăbƠiătoánăphơnăđo nă nhăvi năthámError! Bookmark not define
3.2.1 Nhu c u th c t ............................................ Error! Bookmark not defined.
3.2.1 M c đíchă ng d ng ...................................... Error! Bookmark not defined.
3.2.2 Tiêuăchíăđánhăgiáătheoăch s th c v t ........ Error! Bookmark not defined.
3.3
căt ăd ăli u ............................................... Error! Bookmark not defined.
3
3.4 Cácăb
căphơnăđo nă nh .............................. Error! Bookmark not defined.
3.4.1 Ti n x lỦă nh .............................................. Error! Bookmark not defined.
3.4.2 Cácăb
căchínhăc aăquáătrìnhăphơnăđo n nh.Error! Bookmark not defined.
3.5 Thi tăk ăh ăth ng.......................................... Error! Bookmark not defined.
3.5.1 Ch căn ngăphơnăđo n nh vi năthám .......... Error! Bookmark not defined.
3.5.2 Ch căn ngăxemăchiăti t k t qu ................... Error! Bookmark not defined.
3.5.3 Ch căn ngăđánhăgiáăch tăl
3.6 Minhăh aăch
ngăphơnăđo n nh vi năthámError! Bookmark not de
ngătrìnhăđánhăgiáăt ngăh p .. Error! Bookmark not defined.
3.6.1 Giao di năchínhăc a ng d ng .................... Error! Bookmark not defined.
3.6.2 Ch n nh c năphơnăđo n.............................. Error! Bookmark not defined.
3.6.3 Ch n tham s vƠăthu tătoánăphơnăđo n nh . Error! Bookmark not defined.
3.6.4 K t qu phơnăđo n nhăvƠăđ đo ................. Error! Bookmark not defined.
3.7 K tăqu ă nhăthuăđ
c ................................... Error! Bookmark not defined.
3.7.1 nh baolam.img .......................................... Error! Bookmark not defined.
3.7.2 nh thanhhoa.img ....................................... Error! Bookmark not defined.
3.8
ánhăgiáăk tăqu ăphơnăđo n ......................... Error! Bookmark not defined.
3.9 T ngăk tăch
ng .......................................... Error! Bookmark not defined.
K TăLU N .............................................................. Error! Bookmark not defined.
TƠiăli uăti ngăVi t................................................................................................. 11
TƠiăli uăti ngăAnh................................................................................................. 11
4
L IăM ă
U
TăV Nă
1.
Trong nh ngăn măg năđơy,ăcôngăngh thôngătinăđƣăcóănh ng chuy n bi n
m nh m ,ă tácă đ ng l năđ n s phátătri n c aă xƣă h i. S bùngăn thôngătinăđƣă
đemăđ năl
ng d li u kh ng l .ăChúngătaăcƠngăcóănhuăc uăkhámăpháăkhoăd
li uăđóăph c v cho nhu c uăconăng
i, đi uăđóăđòiăh iăconăng
i ph i bi t khai
thácăd li uăvƠăx lỦăthôngătinăđóăthƠnhătriăth căcóăích.ăă
M t trong nh ng k thu t quan tr ngătrongăquáătrìnhăkhaiăpháăd li uăvƠă
x lỦăd li u l nălƠăk thu tăphơnăc m d li u.ăPhơnăc măđ c bi t hi u qu khi ta
khôngăbi t v thôngătinăc aăcácăc m, ho căkhiătaăquanătơmăt i nh ng thu cătínhă
c a c mămƠăch aăbi t ho c bi t r tăítăv nh ngăthôngătinăđó.ăPhơnăc măđ
nh ăm tăcôngăc đ c l păđ xemăxétăphơnăb d li u,ălƠmăb
c coi
c ti n x lỦăchoă
cácăthu tătoánăkhác.ăVi căphơnăc m d li uăcóăr t nhi u ng d ngănh ătrongăl p
quy ho chăđôăth ,ănghiênăc uătráiăđ t,ăđ aălỦ,ăkhaiăpháăWebăv.v.
NgƠyă nay,ă cùngă v i k thu tă phơnă c m k t h p v iă lỦă thuy t m c a
Zadehăph
ngăphápăphơnăc m m đƣăvƠăđangăphátătri năvƠăđ
c ng d ng r ng
rƣiătrongăth c th c ti n,ăăphơnăđo n nh,ăphơnăđo n nh vi năthám, nh n d ng
m tăng
i, nh n d ng c ch vƠăđi u b ,ăphơnătíchăr i ro, d báoănguyăc ăpháă
s năchoăngơnăhƠngăvƠănhi uăbƠiătoánăkhác.ăNh ng v năđ chínhăđ
căquanătơmă
nhi uătrongăphơnăc mănóiăchungăvƠăphơnăm nóiăriêngălƠănơngăcaoăch tăl
phơnă c m,ă tínhă toánă thôngă quaă m t s đ đoă ch tă l
ng c th .ă v.v.ă đ
ng
că ápă
d ng trong phơnăđo n nh vi năthámăđaămôăhình.ăVƠătrongăkhuônăkh lu năv nă
nƠyăs tìmăhi u v năđ đóătrênăc ăs kh oăsátăm t s thu tătoánăphơnăc măđaămôă
hìnhăchoăbƠiătoánăphơnăc m nh vi năthám, c th lƠăthu tătoánăSCPA, MG.
2. M Că ệCHăC AăLU NăV N
Trong lu năv nănƠyăchúngătôiăkh oăsátămôtăs thu tătoánăphơnăc m m , c
th lƠăthu tătoán FCM, KFCM, MG, SCPA.ăCácăthu tătoánănƠy s đ
căápăd ng
choăbƠiătoánăphơnăc m nh vi năthámăđaămôăhình.
5
C th v i m tă c ă s d li u m u lƠă b
đ
nh v tinh c a m t s khu v c
c kh oăsátăkhuăv c B oăLơmăvƠăThanhăHóa.ăQuaăđơy,ătínhăhi u qu c aăcácă
thu tătoánăđaămôăhình choăbƠiătoánăphơnăc m nh vi năthám theoăcácătiêuăchíăv
ch tăl
ngăvƠăđ đo.
3. B ăC CăC AăLU NăV N
Lu nă v nă g mă 3ă ch
ng,ă cóă ph nă m ă đ u,ă ph nă k tă lu n,ă ph nă m că l c,ă
ph nătƠiăli uăthamăkh o.ăCácăn iădungăc ăb năc aălu năv năđ
cătrìnhăbƠyătheoă
c uătrúcănh ăsau:
Ch
ngă1:ăT ng quan v phơnăc m
Trongă ch
ngă nƠy,ă lu nă v nă s trìnhă bƠyă t ng quan v t p m ,ă bƠiă toánă
phơnăc măvƠăphơnăc m m vƠăthu tătoánăc ăb n gi i quy t v năđ phơnăc mătrênă
t p m đóălƠăthu tătoánăFuzzyăCăậ Means (FCM), KFCM. T thu tătoánănƠyăđ aă
ra thu tătoánăđaămôăhìnhăchoăbƠiătoánăphơnăc m nh vi năthám.
Ch
ngă2:ăPhơnăc măđaămôăhình
Trongăch
ngănƠy,ăt ng quan v h căđaămôăhìnhăvƠăphơnăc măđaămôăhình.
Ti p theo, gi i thi u v thu tătoánăđaămôăhìnhăSCPA,ăMCLA,ăHBGFăvƠăMG.
Ch
ngă3:
Trongăch
ng d ngăphơnăđo n nh vi năthám
ngănƠy,ăchúngătôiăcƠi đ tăvƠăđánhăgiáăhi uăn ngăcácăthu tătoán
đaămôăhình: MGăvƠăSCPA t đơyăth y hi u qu c aăcácăthu tătoánăphơnăc măđaă
môăhìnhăchoă nh vi năthám đ
c kh ngăđ nh.
6
CH
NGă1:ăT NGăQUANăV ăPHÂNăC M
1.1. Kháiăquátăphơnăc m
Phơnă c mă lƠă k ă thu t r tăquanătr ngă trongă khaiă pháă d ă li u,ă nóă thu că l pă
cácăph
ngăphápăh căkhôngăgiámăsát trongăh cămáy,ănh mătìmăki m,ăphátăhi nă
cácăc m,ăcácăm uăd ăli uăt ănhiênăti mă năvƠăquanătr ngătrongăt păd ăli uăl năđ ă
t ăđóăcungăc păthôngătin,ătriăth căchoăvi căraăquy tăđ nh.ă
Cóăr tănhi uăđ nhăngh aăkhácănhauăv ăk ăthu tănƠy,ănh ngăv ăb năch tătaăcóă
th ăhi u phơnăc mălƠăcácăquiătrìnhătìmăcáchănhómăcácăđ iăt
c m,ăsaoăchoăcácăđ iăt
khácăc măthìăkhôngăt
ngătrongăcùngăm tăc măt
ngăđƣăchoăvƠoăcácă
ngăt ănhauăvƠăcácăđ iăt
ngă
ngăt ănhau [1].
M căđíchăc aăphơnăc mălƠătìmăraăb năch tăbênătrongăcácănhómăn iăt iăbênă
trongăc aăb ăd ăli uăkhôngăcóănhƣn.ăTuyănhiên,ăkhôngăcóătiêuăchíănƠoălƠăđ
că
xemălƠăt tănh tăđ ăđánhăgiáăhi uăqu ăc aăphơnătíchăphơnăc m,ăđi uănƠyăph ăthu că
vƠoăm căđíchăcu iăcùngăc aăphơnăc măd ăli u.ăDoăđó,ăng
iăs ăd ngăph iăcungă
c pătiêuăchu n,ătheoăcáchănh ăv yămƠăk tăqu ăc aăphơnăc măs ăphùăh păv iănhuă
c uăc aăng
iăs ăd ngăc n.ă
nh ngh a 1.1
Cho X lƠăm t t p d li u g m N vector: x1 , x 2 ,..., x N .ăBƠiătoánăphơnăc m
lƠăchiaăt p d li u X , c c m d li u c.
Th aămƣnă3ăđi u ki n sau:
zi , i 1, 2,..., c
X
zi
c
z
i 1 i
z j v iă i j ; i, j 1, 2,..., c
Phơnăc măđ
Th
căđóngăvaiătròăquanătr ngătrongăcácănghƠnhăkhoaăh c:ă
ngăm i:ăPhơnăc măd ăli uăgiúpăcácănhƠăcungăc păbi tăđ
hƠngăquanătr ngăcóăcácăđ cătr ngăt
cănhómăkhácă
ngăđ ngănhauăvƠăđ căt ăh ăt ăcácăm uătrongă
c ăs ăd ăli uăkháchăhƠng.ă
7
- Sinh h c:ăPhơnăc m d li uăđ
phơnălo iăcácăGenăv i ch căn ngăt
c s d ngăđ xácăđ nhăcácălo i sinh v t,
ngăđ ngăvƠăthuăđ
căcácăc uătrúcătrongăcácă
m u.
- Phơnătíchăd li uăkhôngăgian:ăDoăs đ s c a d li uăkhôngăgianănh ă
d li uă thuă đ
c t cácă hìnhă nh ch p t v tinh,ă cácă thi t b y h c ho c h
th ngăthôngătinăđ aălỦă(GIS),ăv.v,ălƠmăchoăng
iădùngăr tăkhóăđ ki mătraăcácăd
li uăkhôngăgianăm tăcáchăchiăti t.ăPhơnăc m d li uăcóăth tr giúpăng
iădùngă
t đ ngăphơnătíchăvƠăx lỦăcácăd liêuăkhôngăgianănh ănh n d ngăvƠăchi t xu t
cácăđ cătínhăho căcácă m u d li uăquanătơmăcóăth t n t iătrongăc ăs d li u
khôngăgian.ă
- L p quy ho chăđôăth : Nh n d ngăcácănhómănhƠătheoăki uăvƠăv tríăđ a
lỦ,ăv.v, nh m cung c păthôngătinăchoăquyăho chăđôăth .
- Nghiênăc uătráiăđ t:ăPhơnăc măđ theoădõiăcácătơmăđ ngăđ t nh m cung
c păthôngătinăchoănh n d ngăcácăvùngănguyăhi m.
-
aălỦ:ăPhơnăl păcácăđ ng v t, th c v tăvƠăđ aăraăđ cătr ngăc aăchúng.
- Khaiă pháă Web:ă Phơnă c m d li uă cóă th khámă pháă cácă nhómă tƠiă li u
quan tr ng,ăcóănhi uăỦăngh aătrongămôiătr
ngăWeb.ăCácăl pătƠiăli uănƠyătr giúpă
cho vi căkhámăpháătriăth c t d li uăWeb,ăkhámăpháăraăcácăm u truy c p c a
kháchăhƠngăđ c bi tăhayăkhámăpháăraăc ngăđ ng Web, v.v.
1.2. T ngăquanăcácăthu tătoánăphơn c m tiêuăbi u
Cácă k thu tăphơnăc mă cóă r t nhi uă cáchă ti p c năvƠă cácă ng d ng trong
th c t ,ănóăđ uăh
pháă đ
ng t i hai m cătiêuăchungăđóălƠăch tăl
ng c aăcácăc măkhámă
că vƠă t că đ th c hi n c a thu tă toánă [1].ă Hi n nay, cácă k thu tă phơnă
c măcóăth phơnălo iătheoăcácăcáchăti p c năchínhăsau:
1.2.1 Phơnăc m c măphơnăho ch
K thu tănƠyăphơnăho ch m t t p h p d li uăcóănăph n t thƠnhăkănhómă
choăđ năkhiăxácăđ nh s cácăc măđ
đ c tr ngă đ
c l a ch nă tr
c.ă Ph
c thi t l p. S cácăc măđ
c thi t l pălƠăcácă
ngă phápă nƠyă lƠă t t cho vi că tìmă cácă c m
8
hìnhă c uă trongă khôngă giană Euclidean.ă NgoƠiă ra,ă ph
ngă phápă nƠyă c ngă ph
thu căvƠoăkho ngăcáchăc ăb n gi aăcácăđi m,ăđ l a ch năcácăđi m d li uănƠoă
cóăquanăh lƠăg n nhau v i m iăđi m khácă vƠă cácăđi m d li uănƠoăkhôngăcóă
quan h ho căcóăquanăh lƠăxaănhauăsoăv i m iăđi măkhác.ăTuyănhiên,ăph
ngă
phápănƠyăkhôngăth x lỦăcácăc măcóăhìnhăd ng k qu c ho căcácăc măcóăm t
đ cácăđi m d yăđ c.ăCácăthu tătoánăphơnăho ch d li uăcóăđ ph c t p r t l n
khiăxácăđ nh nghi m t iă uătoƠnăc c cho v năđ phơnăc m d li u,ădoănóăph i
tìmăki m t t c cácăphơnăho chăcóăth đ
c.ăChínhăvìăv y,ătrênăth c t th
ngăđiă
tìmă gi iă phápă t iă uă c c b cho v nă đ nƠyă b ngă cáchă s d ng m tă hƠmă tiêuă
chu năđ đánhăgiáăch tăl
ng c a c măc ngănh ăđ h
ng d năchoăquáătrìnhătìmă
ki măphơnăho ch d li u.ăNh ăv y,ăỦăt
ngăchínhăc a thu tătoánăphơnăc măphơnă
ho ch t iă uăc c b lƠăs d ng chi năl
că năthamăăđ tìmăki m nghi m.
M t s thu tă toánă phơnă c m theo ti p c nă phơnă ho ch: Thu tă toánă K-Means,
thu tătoánăK-Medoids
Thu tătoánăK-Means: ChoăkălƠăs c măsauăkhiăphơnăho ch.ă(1≤ăkă≤ăn,ăv iănălƠă
s đi m trong khôngăgianăgi li u)
Thu tătoánăk-means g mă4ăb
c:
B1. Ch n ng uănhiênăkăđi mălƠmătr ngătơmăbanăđ u c a k c m.
B2.ăGán (ho căgánăl i) t ngăđi măvƠoăc măcóătr ngătơmăg năđi măđangă
xétănh t. N uăkhôngă cóă phépăgánănƠoăthìă d ng.ă Vìăkhôngă cóăphépă gánă nƠoă cóă
ngh aălƠăcácăc măđƣă năđ nhăvƠăthu tătoánăkhôngăth c i thi nălƠmăgi măđ phơnă
bi tăh năđ
c n a.
B3.ăTínhăl i tr ngătơm cho t ng c m.
B4. Quay l iăb
c 2. Minh h a thu tătoánăv i k=2
9
uăđi m c aăph
-
ngăphápăphơn c m k-means
ph c t p c a thu tătoánălƠăO (tkn) v iătălƠăs l n l pă(tăkháănh so v i n), k
lƠăs c m c năphơnăho ch,ănălƠăs đi mătrongăkhôngăgianăd li u.
- K-meansăphùăh p v iăcácăc măcóăd ngăhìnhăc u.
Nh
căđi m c aăph
ngăphápăk-mean
- Khôngăđ m b oăđ tăđ
c t iă uătoƠnăc căvƠăk t qu đ u ra ph thu c nhi uăvƠoă
vi c ch năkăđi m kh iăđ u.ăDoăđóăcóăth ph i ch y l i thu tătoánăv i nhi u b
kh iăđ uăkhácănhauăđ cóăđ
c k t qu đ t t. Trong th c t cóăth ápăd ng
thu t gi i di truy năđ phátăsinhăcácăb kh iăđ u.
- C n ph iăxácăđ nhătr
c s c m.
- Khóăxácăđ nh s c m th c s mƠăkhôngăgianăd li uăcó.ăDoăđóăcóăth ph i th
v iăcácăgiáătr kăkhácănhau.
- Khóăphátăhi năcácălo i c măcóăhìnhăd ng ph c t păvƠănh tălƠăcácăd ng c m
khôngăl i.
- Khôngăth x lỦănhi uăvƠăm uăcáăbi t.
- Ch cóăth ápăd ngăkhiătínhăđ
c tr ngătơm.
Thu tătoánăK-Medoids
Thu tătoánăK-MedoidsălƠăc i ti n c a thu tătoánăk-means, k-medoids khácăkmeans:
- Chi năl
c cho k tr ngătơmăđ uătiên.
- Ph
ngăphápătínhăđ phơnăbi t
- Ph
ngăphápătínhătr ngătơm trong c m
Thu tătoánăK-Medoidsăđ
c th c hi năquaăcácăb
c sau:
B1: Ch n ng uănhiênăkăđi m Oi (i 1,..., k) lƠmătrungătơmă(medoids) banăđ u
c a k c m.
TÀIăLI UăTHAMăKH O
10
TƠiăli u ti ng Vi t
[1]
Bùiă Côngă C
ng, Nguy nă Doƣnă Ph
c (2006). H m , m ngă n ronă vƠă
ng d ng, Nhà xu t b n Khoa h c k thu t.
[2]
Nguy nă ìnhă D
vi năthám. Tr
[3]
ng H M
ngă (1998).ă BƠiă gi ng: K thu tă vƠă cácă ph
ngă phápă
a Ch t.
Nguy n Kh c Th i (2011) Giáoătrình:ă nh vi năthám. Tr
ng
H Nông
nghi p Hà N i – 2011.
TƠiăli u ti ng Anh
[4]
Bezdek, J. C. (1981). Pattern recognition with fuzzy objective function
algorithms. Kluwer Academic Publishers.
[5]
Bezdek, J. C., Ehrlich, R., & Full, W. (1984). FCM: The fuzzy c-means
clustering algorithm. Computers & Geosciences, 10(2), 191-203.
[6]
Dunn, J. C. (1974). "Well-separated clusters and optimal fuzzy
partitions." Cybernetics and Systems 4(1): 95-104.
[7]
Davies, D. L. and Bouldin, D. W. (1979). "A cluster separation measure."
IEEE Transactions on Pattern Analysis and Machine Intelligence 1(2): 95-104.
[8]
Halkidi, M., Batistakis, Y., et al. (2001). "On clustering validation
techniques." Journal of Intelligent Information Systems 17(2): 107-145.
[9]
Theodoridis, S., Koutroumbas, K., et al. (1999). Pattern Recognition,
Academic Press.
[10] Halkidi, M., Batistakis, Y., et al. (2002). "Cluster validity methods: part
I." ACM SIGMOD Record 31(2): 40-45.
[11] Zhi-Hua Zhou: ắEnsemble Methods Foundations and Algorithms”, pages
135ậ155.Ensemble.
11
[12] Dunn, J. C. (1974). "Well-separated clusters and optimal fuzzy
partitions." Cybernetics and Systems 4(1): 95-104.
[13] Lesot, M. J., & Kruse, R. (2006). Gustafson-Kessel-like clustering
algorithm based on typicality degrees. International Conference on Information
Processing and Management of Uncertainty in Knowledge-Based Systems,
IPMU (pp. 1300-1307).
[14] Davies, D. L. and Bouldin, D. W. (1979). "A cluster separation measure."
IEEE Transactions on Pattern Analysis and Machine Intelligence 1(2): 95-104.
[15] Vinh, N., Epps, J., et al. (2009). Information theoretic measures for
clusterings comparison: is a correction for chance necessary? in the Proceedings
of
the
26th
International
Conference
on
Machine Learning (ICML'09).
[16] Son, L. H., Thong, N. T. (2015). Intuitionistic Fuzzy Recommender
Systems: An Effective Tool for Medical Diagnosis. Knowledge-Based Systems.
[17] Srivastava, V., Tripathi, B. K., & Pathak, V. K. (2013). Evolutionary
fuzzy clustering and functional modular neural network-based human
recognition. Neural Computing and Applications, 22(1), 411-419.
[18] Strehl, A., & Ghosh, J. (2003). Cluster ensembles---a knowledge reuse
framework for combining multiple partitions. The Journal of Machine Learning
Research, 3, 583-617.
[19] Alexander Hinneburg, Daniel A. Keim (1998). An Efficient Approach to
Clustering in Large Multimedia Databases with Noise. Knowledge-Based
Systems.
[20] UC Irvine (2015). UCI Machine Learning Repository. Available at:
/>
12
[21] Vega-Pons, S., & Ruiz-Shulcloper, J. (2011). A survey of clustering
ensemble algorithms. International Journal of Pattern Recognition and
Artificial Intelligence, 25(03), 337-372.
[22] Vendramin, L., Campello, RJ, & Hruschka, ER. (2010). Relative
clustering validity criteria: A comparative overview. Statistical Analysis and
Data Mining: The ASA Data Science Journal, 3(4), 209-235.
[23] Zhang, D., & Chen, S. (2002). Fuzzy clustering using kernel method.
2002 International Conference on Control and Automation, 2002. ICCA, 2002.
[24] Karypis G and Kumar V 1998 A fast and high quality multilevel scheme
for partitioning irregular graphs. SIAM Journal on Scientific Computing 20(1),
359ậ392.
[25] D. E. Gustafson and W. C. Kessel: in Proc. IEEE CDC, Vol.2, pp.761766(1979).
[26] Le Hoang Son, Pham Van Hai (2016). A novel multiple fuzzy clustering
method based on internal clustering validation measures with gradient descent.
Inernational Journal of Fuzzy Systems.
[27] J. Valente de Oliveira and W. Pedrycz: Advances in Fuzzy Clustering and
Its Applications. IEEE Press, Piscataway, NJ
[28] Bojun Yan and Carlotta Domeniconi. Subspace Metric Ensembles for
Semi- supervised Clustering of High Dimensional Data. IEEE Trans Pattern
Anal Mach Intell (TPAMI).
[29] Fern XZ and Brodley CE 2003 Random projection for high dimensional
clustering: A cluster ensemble approach Proceedings of the Twentieth
International Conference on Machine Learning. ACM Press.
[30] Thomas G Dietterich: Ensemble Methods in Machine Learning. Oregon
State University Corvallis Oregon USA.
13