1
LỜI CẢM ƠN
Sau một thời gian học tập, nghiên cứu và triển khai đề tài: “Tính toán mờ trong
mạng Kohonen và ứng dụng phân cụm dữ liệu”, đến nay tôi đã hoàn thành đề tài
nghiên cứu của mình.
Tôi xin bày tỏ tấm lòng biết ơn sâu sắc nhất tới thầy giáo - Thạc sỹ Nguyễn Duy
Hiếu người thầy đã trực tiếp hướng dẫn tôi trong suốt quá trình tôi thực hiện đề tài
nghiên cứu khoa học này.
Tôi cũng chân thành cảm ơn tới lãnh đạo Nhà trường, Ban chủ nhiệm Khoa cùng
các thầy cô giáo đã giúp đỡ, tạo điều kiện để tôi có cơ hội nghiên cứu, học tập và hoàn
thành đề tài nghiên cứu này.
Do hạn chế về trình độ chuyên môn và thời gian thực hiện nên đề tài không tránh
khỏi những thiếu sót, rất mong nhận được sự góp ý của thầy cô để tôi có thể hoàn
thành tốt nhất đề tài nghiên cứu này.
Tôi xin chân thành cảm ơn!
Sơn la, tháng 5 năm 2014
Sinh viên
Hoàng Khánh Linh
2
MỤC LỤC
PHN M U 7
1. Lý do ch tài 7
2. M nhim v nghiên cu 7
ng nghiên cu 7
4. Phm vi nghiên cu 7
u 7
6. Cu trúc c tài 7
TNG QUAN V MÔ HÌNH M-RON 8
1.1. M-ron nhân to 8
1.1.1. M-ron nhân to là gì? 8
1.1.2 Cu trúc và mô hình ca m-ron nhân to 8
1.1.3 Cu tc làm vic ca m-ron 10
1.1.4. Các kiu m-ron 12
c 16
1.2.1. Khái Nim 16
1.2.2. Hc có giám sát 16
1.2.3. Hc không giám sát 17
1.2.4. Hc na giám sát 18
1.2.5. Hng 18
LÝ THUYT TP M 19
2.1. Tp m 19
2.1.1. Khái nim tp rõ 19
2.1.2. Khái nim tp m 19
2.2. S m 21
2.2.1. nh m 21
2.2.2. S m 21
2.2.3. S m tam giác 21
2.2.4. S m hình thang 22
3
2.2.5. S m hình chuông(Gauss) 22
2.3. Bin ngôn ng 22
2.4. B gii m 24
2.4.1. y max 24
2.4.2. y trng tâm 24
2.4.3. y trung bình tâm 24
THUT SOM VÀ BÀI TOÁN PHÂN CM D LIU 25
c v SOM 25
3.2. 25
3.3. Thut toán phân cm s dng SOM 26
3.4. Ví d minh ha thut toán 27
NG DNG MINH HA 32
4.1. Mô t d liu 32
4.2. La chn ngôn ng lp trình và h qun tr d liu 32
4t thut toán 32
t thut toán 32
4.3.2. ng dng 36
KT LUN 37
1. Kt lun 37
ng nghiên cu phát tri tài 37
TÀI LIU THAM KHO 38
4
DANH SÁCH HÌNH VẼ
-ron nhân to 8
th các dng hàm truyn 10
Hình 3: M-ron ba lp 11
Hình 4: Mt s dng m-ron 13
Hình 5 Cu trúc ca mng Hopfield 14
Hình 6: Cu trúc ca BAM 15
Hình 7: th hàm thuc µ
A(x)
20
Hinh 8: S m tam giác 22
Hinh 9: S m hình thang 22
Hình 10: S m hình chuông 22
Hình 1 th biu din mi quan h gia nhi c thuc 23
Hình 12: Kin trúc ca SOM 26
Hình 13: Kin 26
mng Kohonen cho ví d trên 29
Hình 15: Giao din chính c 33
Hình 16: Sau khi phân cm hoàn tt 34
Hinh 17: D liu 34
Hinh 18: Kt qu phân cm - Cm 1 35
Hình 19: Kt qu phân cm - Cum 2 35
Hinh 20: Kt qu phân cm - Cum 3 36
5
DANH MỤC BẢN BIỂU
Bng 1: S m ng buying 28
Bng 2: S m ng maint 28
Bng 3: S m ng lug_boot 28
Bng 4: S m ng safety 28
Bng 5: D liu vào ca ví d 28
Bng thông tin trong CSDL 32
6
DANH MỤC TỪ VIẾT TẮT
SOM
Self Organizing Maps
ANN
Artificial Neural Network
PE
Processing Element
MDP
Markov Decision Process
PCDL
Phân cm d liu
CSDL
d liu
7
PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Ph (SOM: Self-
-ron-ron vào và
-ron -ron
-ron -ron
-ron
, ,
.
,
(Control Engineering),
(Kohonen, 1989), robotics (Ritter et al., 1989), (Oja, 1992),
(Fort, 1988),
(Kohonen, 1984), -
(Biomedical Sciences and
Chemistry),
(Financial Analysis)
(Natural Language Processing).
2. Mục đích, nhiệm vụ nghiên cứu
- Tìm hiu m-ron và k thut SOM.
- Trin khai ng dng s dng k thut SOM vào phân cm d liu.
3. Đối tƣợng nghiên cứu
- Mng -ron và k thut Self Organizing Map (SOM).
4. Phạm vi nghiên cứu
- Nghiên cu k thut SOM và s d phân cm d liu.
- ng dng th nghim.
5. Phƣơng pháp nghiên cứu
- Nghiên cu lý thuyt và xây dng mô hình ng dng cho bài toán thc t
- Thu thp s liu thc t th nghim trên mô hình
- Xây d nghim
6. Cấu trúc của đề tài
tài gm ba phn:
- Phn 1: Phn m u
- Phn 2: Phn ni dung c tài gm 4
Tng quan v mô hình mng -ron
t tp m
3: K thut SOM và bài toán phân cm d liu
4ha
- Phn 3: Kt lung nghiên cu phát tri tài
8
CHƢƠNG 1
TỔNG QUAN VỀ MÔ HÌNH MẠNG NƠ-RON
1.1. Mạng nơ-ron nhân tạo
1.1.1. Mạng nơ-ron nhân tạo là gì?
Định nghĩa: Mng -ron nhân to (Artificial Neural Network - ANN) gi tt là
mng -ron là mt mô hình x lý thông tin phng theo cách thc x lý thông tin ca
các h -ron sinh hc to lên t mt s ng ln các phn t (gi là phn
t x lý hay -ron) kt ni vi nhau thông qua các liên kt (gi là trng s liên kt)
làm vic nt th thng nh gii quyt mt v c th
Mt mng -ron nhân tc cu hình cho mt ng dng c th (nhn dng
mu, phân loi d liu ) thông qua mt quá trình hc t tp các mu hun luyn. V
bn cht hc chính là quá trình hiu chnh trng s liên kt gia các -ron.
1.1.2 Cấu trúc và mô hình của một nơ-ron nhân tạo
Mô hình toán hc ca mng -ron sinh h xut bi McCulloch và
c gi là -ron M-c gi là phn t x lý và
c ký hiu là PE (Processing Element).
Mô hình -ron u vào x
1
, x
2
, , x
m
và mu ra y
i
Hình 1. Mô hình -ron nhân to
Gii thích các thành phn:
Tu vào: Là các tín hiu vào ca -ron, các tín hic
i dng mt vector m chiu.
Tp các liên kt (các trng s): Mi liên k c th hin bi mt trng s
c gi là trng s liên kt). Trng s liên kt gia tín hiu vào th j cho n-
ron i c ký hiu là w
ij
ng các trng s c khi to ngu
nhiên thm khi to mc cp nht liên tc trong quá trình hc mng.
9
B tng (Hàm t tính tng cu vào vi trng s
liên kt ca nó.
t thành phn ca hàm truyn.
Hàm truy gii hn phu ra ca mi -ron. Nó nhn
u vào là kt qu ca hàm tng, phu ra ca
mi -ron c gii hn [0,1] hoc [-1,1]. Các hàm truyn rng, có
th là các hàm tuyn tính hoc phi tuyn. Vic la chn hàm truyn tùy thuc vào tng
bài toán và kinh nghim ci thit k mng.
u ra: Là tín hiu ra ca mt -ron, vi mi -ron s có tu
ra.
V mt toán hc, cu trúc ca mt -ron c mô t bng cp biu thc sau:
)(
iii
netfy
và
j
n
j
iji
xwnet
1
T
1
, x
2
m
là các tín hiu vào, còn w
i1
, w
i2
im
là các trng s
kt ni ca -ron th i, net
i
là hàm tng, f là hàm truyn,
i
là mng, y
i
là tín
hiu ra ca -ron.
-ron sinh hc, -ron nhân tn các tín hiu
u vào, x lý (nhân các tín hiu này vi trng s liên kt, tính tc
ri gi kt qu n hàm truyn), và cho mt tín hi u ra (là kt qu ca hàm
truyn).
* Hàm truyn có th có các dng sau:
c
00
01
xkhi
xkhi
y
(1.1)
Hàm gii hn cht
01
01
)sgn(
xkhi
xkhi
xy
(1.2)
Hàm bc thang
00
10
11
)sgn(
xkhi
xkhix
xkhi
xy
(1.3)
c
x
e
y
1
1
v (1.4)
ng hai cc
10
1
1
2
x
e
y
v (1.5)
* th các dng hàm truyn c biu di
Hình 2: th các dng hàm truyn
1.1.3 Cấu tạo và phƣơng thức làm việc của mạng nơ-ron
Da trên nhng -ron mc trên, ta có th
hình dung mng -ron t h truyt và x lý tín hic tính truyt
ca -ron phn lc tính truy
Khi liên ku vào/ra ca nhiu -ron vc mt mng -
ron, vic ghép ni các -ron trong mng vi nhau có th là theo mt nguyên tc bt
k. Vì mng -ron là mt h truyt và x lý tín hiu, nên có th phân bit các loi
-ron khác nhau, các -ron u vào nhn thông tin t ng bên ngoài khác
vi các -ron c ni vi các -ron khác trong mc phân
bit vi nhau qua vector hàm trng s u vào w.
Nguyên lý cu to ca mng -ron bao gm nhiu lp, mi lp bao gm nhiu
-ron có cùng chng. Hình 3 là mô hình hong ca mt mng -
ron 3 lp vi 8 phn t -ron. Mu vào là x
1
, x
2
, x
3
u ra y
1
, y
2
.
Các tín hin 3 -ron u vào, 3 -ron này làm thành lu
vào ca mng. Các -ron trong lc gi là -ron u ra ca các
11
-ron u vào ca 3 -ron tip theo, 3 -ron này không trc tip
tip xúc vng bên ngoài mà làm thành lp n, hay còn gi là lp trung gian.
Các -ron trong lp này có tên là -ron ni hay -ron u ra ca các -ron
n 2 -ron ng bên ngoài. Các -ron trong lp
u ra c gi là -ron u ra.
Hình 3: Mng -ron ba lp
Mng -ron c xây dng gm 3 lp mc ni ti
u ra. Trong mng không tn ti bt k mt mch hi tip nào. Mt
mng -ron có cy gi là mng mng hay mng truyn thng mt
ng (Feed forward network), và có cu trúc mng ghép ni hoàn toàn (vì bt c mt
-ron nào trong mc ni vi mt hoc vài -ron khác). Mng -ron
bao gm mt hay nhiu l c gi là mng Multilayer Perceptrons
(MLP-Network).
Mng -ron khi mc, tri thc ca mng s
c hình thành dn dn sau mt quá trình hc. Mng -ron c hc b
vào nhng kích thích, và mng hình thành nhng, nhng
ng phù hp vi tng loi kích thích s c gi là
n hc ca mc mng, mng có th gii quyt các
v mh là v ng dng rc gii quyt
ch yu da trên s t chc hp nht giu vào ca m
u ra.
Mng -ron có nhim v là hoàn chnh hoc hiu chc
hoc b ng ca nhiu, c ng dc hoàn thin
mt ng dng c th là nhn dng ch vit.
Nhim v tng quát ca mt mng -ron ng các thông tin. Dng
này chính là quan h giu
khi có mt kích thích bt k ng vào mng, mng có kh
suy ding phù h chn dng theo mu
12
ca mng -ron thc hin chng -ron t b
phn t chng vi mi nhóm là mng
u ra phù hy, mt nhóm bao gm mt lou vào và m
u ra. Các nhóm có th c hình thành trong quá trình h
không hình thành trong quá trình hc.
1.1.4. Các kiểu mạng nơ-ron
1.1.4.1. Mạng nơ-ron một lớp
Mi mt -ron có th phi hp vi các -ron khác to thành mt lp các
trng s. Mng mt lp truyn th4a. Mt lp -ron là mt nhóm các
-ron u có cùng trng s, nhn cùng mt tín hing thi.
Trong ma trn trng s, các hàng là th hin -ron, hàng th j có th t nhãn
nt vector w
j
ca -ron th j gm m trng s w
ji
. Các trng s trong cùng mt
ct th ng thi cùng nhn mt tín hiu vào x
j
.
w
j
= [w
j1
, w
j2
, , w
jm
]
Ti cùng mt thu vào x = [x
1
, x
2
, , x
n
] có th là mt ngun bên
ngoài là cm bin hoc thit b i mng.
(a) Mng truyn thng mt lp (b) Mng hi tip mt lp
(c) Mng truyn thng nhiu lp
13
(d) Mng -ron hi quy
Hình 4: Mt s dng mng -ron
1.1.4.2. Mạng nơ-ron truyền thẳng nhiều lớp
Mng -ron nhiu lp (Hình 4c) có các lc phân chia thành 3 lo
Lp vào là lp -ron u tiên nhn tín hiu vào x
i
(i = 1, 2, , n). Mi tín hiu x
i
n tt c các -ron ca lng, các -ron u vào
không làm bii các tín hiu vào x
i
, tc là chúng không có các trng s hoc không
có các loi hàm chuyi nào, chúng ch i các tín hiu.
Lp n là lp -ron sau lp vào, chúng không trc tip liên h vi th gii bên
p -ron vào/ra.
Lp ra là lp -ron to ra các tín hiu ra cui cùng.
1.1.4.3 Mạng nơ-ron hồi tiếp
Mng -ron hi tip là mu ra ca mi -ron c quay tr li ni
vu vào ca các -ron cùng lc gi là m4b.
1.1.4.4 Mạng nơ-ron hồi quy
Mng -ron phn hi có th thc hic gi là mng -ron hi
4d. Mng -ron hi quy có trng s liên k i x ng
Hopfield, mng luôn hi t v trng thái nh (Hình 4b). Mng BAM thuc nhóm
mng -ron hi quy, gm 2 lp liên kt 2 chic gn vi tín hiu vào/ra.
Nghiên cu mng -ron hi quy mà có trng s liên ki xng, thì s gp
phi v phc tp nhii mng truyn thng và mng hi quy có trng s
liên ki xng.
1.1.4.5 Mạng Hopfield
Mng Hopfield là mng phn hi mt lc ch ra trong hình 4b. Cu trúc chi
tit cc th hin trong hình 5. Khi hong vi tín hiu ri rc gi
là mng Hopfield ri rc, và cu trúc cc gi là mng hi quy.
14
Hình 5 Cu trúc ca mng Hopfield
trên, ta thy nút có mu vào bên ngoài x
j
và mt
giá tr ng
j
(j = 1,2, n). Mu quan trng cn nói là mi nút không có
ng phn hi v u ra th c ni ti mu vào ca nút khác
qua trng s w
ij
, vi i
j, (i = 1,2, ,n), hay nói cách khác w
ii
= 0, (vi i = 1,2, ,n).
Mu quan trng na là trng s ca mi xng, tc là w
ij
=
w
ji
, (vt cp nht cho mi nút m
,sgn
1
)()1(
n
ij
j
i
k
jij
k
i
xywy
i = 1,2, ,n (1.6)
Lut cp nhc tính toán trong cách thng bu này có
a là, vi mt thc, ch có mt nút mng cp nhu ra ca
nó. S cp nht tip theo trên mt nút s s dng chính nhc cp nht.
i hình thc hong b ca mng, mc
cp nht c lp.
Có s khác bit gia lut cp nhng b và lut cp nhng b. Vi
lut cp nhng b thì s ch có mt trng thái cân bng ca h (vi giá tr
i lut cp nhng b thì có th làm
mng hi t mm c nh hoc mt vòng gii hn.
1.1.4.6 Mạng BAM
Mng BAM bao gm hai lng hp m rng ca mng
Hopfield. xét mng ri rn và d hiu.
15
Hình 6: Cu trúc ca BAM
Khi mng -ron c tích cc vi giá tr u vào ca vector tu vào ca mt
lp, mng s có hai mu trng thái nh, vi mi mu tu ra ca nó là mt lp.
ng hc ca mng th hii dng qua li gia hai lp. C th
gi s mt vectoc cung cu vào ca lp -ron u vào
c x lý và truyn tu ra ca l
jiji
xway
'
; vi i = 1,2, ,n (1.7)
truyn li nuôi tr li lp -ron X và to nên
T
n
i
iijj
ywax
1
; vi j = 1,2, ,m (1.8)
lu vào ca lp y và t
(1.7). Quá trình này c tip tc, bao g
y
(1)
= a(wx
(0)
)
x
(2)
= a(w
(T)
y
(1)
)
y
(3)
= a(wx
(2)
)
x
(4)
= a(w
(T)
y
(3)
)
y
(k-1)
= a(wx
(k-2)
)
x
(k)
= a(w
(T)
y
(k-1)
)
(truyn thng ln th nht)
(truyc ln th nht)
(truyn thng ln th hai)
(truyc ln th hai)
(truyn thng ln th k/2)
(truyc ln th k/2)
(1.9)
Chú ý rng trng thái cp nh9ng b
trình (1.7) và (1.8). Trng thái cp nh ng b
(1.7) và (1.8) vc chn t i ra rng, h thng n
nh cho c hai ch ng b ng b. Tuy nhiên, ch ng b s làm
cho h thng hi t .
16
1.2.Các phƣơng pháp học
1.2.1. Khái Niệm
Khái niệm: Hi hành vi ca các vt theo mt cách
làm cho chúng có th thc hin t
Mt mng -ron c hun luyn sao cho vi mt tu vào X,
mng có kh o ra tu ra mong mun Y ca nó. Tc s
dng cho hun luyn mc gi là tp hun luyn (training set). Các phn t x
thuc gi là các mu hun luyn (training example). Quá trình hun luyn bn
cht là s i các trng s liên kt ca mng. Trong quá trình này, các trng s
ca mng s hi t dn ti các giá tr sao cho vi mu vào x t tp hun
luyn, mng s n
Các c ph bin là hc có giám sát (supervised learning), hc
không giám sát (unsupervised learning), hc na giám sát và h ng
(Reinforcement learning).
1.2.2. Học có giám sát
Hc có giám sát (supervised learning) là mt ca ngành hc máy xây
dng mt hàm t d liu hun luyn. D liu hun luyn bao gm mi cp ng
ng dng vec- u ra mong muu ra ca mt hàm có th là
mt giá tr liên tc (gi là hi quy), hay có th là d t nhãn phân loi cho mt
u vào (gi là phân loi). Nhim v cc có giám sát là d
giá tr ca hàm cho mng bu vào hp l
mt s ví d hun luy các c c
c phi tng quát hóa t các d liu s d c
nhng tình hup phi theo mt cách "hp lí".
Hc có giám sát có th to ra 2 loi mô hình. Ph bin nht, hc có giám sát to
ra mt mô hình toàn cc (global model ánh x u ra mong
mun. Tuy nhiên, trong mt s ng hp, vic ánh x c thc hii dng mt
tp các mô hình cc b lp lun theo tình hung hay gii
thut láng ging gn nht).
có th gii quyt ma hc có giám sát (ví d: h nhn
dng ch vit tayi ta phi xem xét nhic khác nhau:
1. nh loi ca các ví d hun luyc khi làm bt c
nh loi d liu nào s c s dng làm ví d. Chng h là
mt kí t vi, toàn b mt t vit tay, hay toàn b mt dòng ch vit tay.
17
2. Thu thp tp hun luyn. Tp hun luyn cc t s dng
ca hàm ch, mt tc thu thu ra
c thu thp, hoc t các chuyên gia hoc t vic tính toán.
nh vic biu diu vào cho hàm chn tìm. S
chính xác ca hàm ch thuc lc biu
dic chuyi thành mt vec-
cha mt s m mô t
không nên quá ln, do s bùng n t hp (curse of dimensionality ln
d u ra.
nh cu trúc ca hàm chn tìm và gii thut hng. Ví
d la chn vic s dng m -ron nhân to hay cây quyt
nh.
5. Hoàn thin thit k chy gii thut hc t tp hun luyn thu
thc. Các tham s ca gii thut hc có th u chnh bng cách t
hit tp con (gi là tp kim chng -validation set) ca tp hun luyn,
hay thông qua kim chng chéo (cross-validation). Sau khi hu chnh tham s,
hia gii thut có th c trên mt tp kic lp vi tp hun
luyn.
1.2.3. Học không giám sát
Hc không có giám sát (unsupervised learning) là m a
ngành học máy nhm tìm ra mt mô hình mà phù hp vi các quan sát. Nó khác bit
vi hc có giám sát ch ng cho mu vào là không bit
c. Trong hc không có giám sát, mt tp d li c thu thp. Hc
i x vt tp các bin
ngt mô hình m kt hp s c xây dng cho tp d li
Hc không có giám sát có th c dùng kt hp vi suy din Bayes cho ra
xác suu kic có giám sát) cho bt kì bin ngu nhiên nào khi bit
c các bin khác.
Hc không có giám sáu ích cho vic nén d liu: v n, mi gii
thut nén d liu hoc là da vào mt phân b xác sut trên mt tu vào mt cách
ng minh.
Mt dng khác ca hc không có giám sát là phân mnh
khi không mang tính xác sut. Xem thêm phân tích khái nim hình thc (formal
concept analysis).
18
1.2.4. Học nửa giám sát
Trong khoa hc máy tính, hc na giám sát là mt lp ca k thut hc máy, s
dng c d li hun luyn - n hình là mng
nh d liu có gán nhãn cùng vng ln d lic na giám sát
ng gia hc không giám sát (không có bt kì d liu có nhãn nào) và có giám sát
(toàn b d lic gán nhãn). Nhiu nhà nghiên cu nhn thy d liu không
c s dng kt hp vi mt chút d liu có gán nhãn, có th ci thin
gán nhãn d liu cho mt bài toán hi hi
m phân loi bng tay các ví d hun luyn. Chi phí cho
quy trình này khin tp d lic gán nhãn hoàn toàn tr nên không kh thi, trong
khi d lii r tin. Trong tình huc na
giám sát có giá tr thc tin ln lao.
Mt ví d cho k thut hc máy nng hun luyn (co-training),
u b hc hun luyn cùng mt tp ví d i b s
dng mt tng nhc lp vi nhau.
Mt cách tip cn khác là mô hình hoá phân phi xác sung thi cc
i d li coi nhãn là "d liu còn thiu". Các
k thut x lý d liu còn thiy mu Gibbs và t vng có th c s
d ng tham s.
1.2.5. Học tăng cƣờng
Hng (reinforcement learning) nghiên cu cách thc mt agent trong
mt ng nên chn thc hin các ng c i hóa mt
khon ng (reward lâu dài. Các thut toán hng c gng tìm
mt chic ánh x các trng thái ca th gii tng mà agent nên chn
trong các tr
c biu di i dng mt quá trình quy nh
Markov trng thái hu hn (Markov decision process - MDP), và các thut toán hc
ng cho ng cnh này có liên quan nhin các k thut quy hong. Các
xác sut chuyn trng thái và các xác sut thu lng là ngu nhiên
g quá trình ca bài toán.
Khác vi hc có giám sát, trong hng không có các cp d liu vào/kt
qu ng gn t t cách
a, ng trc tuyn (on-line performancec quan
c tìm kim mt s cân bng gia khám phá (lãnh th p bn
) và khai thác (tri thc hin có). Trong hng, s c và mt gia khám
ng nghiên cu ch yu qua bài toán multi-armed bandit.
19
Mt cách hình thc, mô hình hng bao gm:
S: tp các trng thái cng ;
A: tng; và
: tp các khong" vi giá tr ng.
Ti mi thm t, agent thc trng thái ca nó là s
t
S và tp các hành
ng có th A(s
t
). Nó chn mng a A(s
t
) và nhc t ng trng
thái mi s
t+1
và mt kho ng r
t+1
. D
ng phi phát trin mt chi S A có tác dng c i hóa
ng R=r
0
+r
1
+ +r
n
vi các MDP có mt trng thái kt thúc, hong R
t
t
r
t
vi
các MDP không có trng thái kt h s gim khong
i giá tr trong khong 0.0 và 1.0).
c bit thích hp cho các bài toán có s c mt gia
các khong ngn hn và dài hn. Hc áp dng thành công
cho nhi u khin robotu vn thang máy, vin thông, các
backgammon và c vua.
CHƢƠNG 2
LÝ THUYẾT TẬP MỜ
2.1. Tập mờ
2.1.1. Khái niệm tập rõ
Mt tp A là mt t lit kê tt c các phn t ca A,
chng hn A = {3, 5, 6, 9}. Trong tng hp không th lit kê ra hc các phn t
ca tp A, chúng ta có th ch ra các tính cht chính xác mà các phn t ca tp A tho
mãn, chng hn A = {x | x là số nguyên tố}. Mt tp rõ có th nh bi hàm
i là hàm thuc (membership function) ca nó. Hàm thuc ca tp
rõ Ac ký hiu là λ
A
(1/0), nó nhn giá tr ng x
thuc tp A và giá tr ng x không thuc A. Gia phn t bt k và tp
A ch tn ti mt trong hai quan h thuc hoc không thuc.
2.1.2. Khái niệm tập mờ
Xung quanh chúng ta, luôn tn ti các khái nim m, nó hin hu trong các bài
toán ng dng, ngay c a mi chúng ta. Ví d xét v tui ca con
i chúng ta có các khái nim tr, rt trChúng ta cúng xét ví d sau:
Ta xét tp hp nhi tr. Ta thy ri 25 tui thì rõ ràng là tr
i trên 60 tui thì rõ ràng là không tr nhi có tui t n 59
thì có thuc tp hp nhi tr hay không? Nu áp dng khái nim tp hp c
n thì ta phnh ra mt ranh gii rõ ràng và mang tính cht chng hn là 45
20
nh tp hp nhi tr. h chc chi 45 tui là
tr i 46 tui là không tr. Và trong thc t thì có mt ranh gii m
cách nhi tr và nhi không tr
vy, nhi trung niên là nhi có m tr tr
ci 25 tuc là có giá tr tri
trên 60 tui là hoàn toàn sai tc là có giá tr tri trung niên s
có giá tr 0 < p < 1.
y, qua ví d trên ta thy khái nin v tp hp c ng ht
c các yêu cu ca thc t và nó cc m rng. L.A.Zadeh xut hình thc
hóa toán hc ca khái nim m vào t nhng khái nim trng
v ng a thông tin m, không chc ch-già, nhanh-chm, cao-th
tìm cách biu din chúng bng mt khái nim toán hc gi là tp m. T n
nay, lý thuyt tp m c phát trin mnh m.
Định nghĩa 2.1: Cho mt t U vi các phn t ký hiu bi x, U={x}. Mt
tp m A trên U là ti mt hàm µ
A(x)
mà nó liên kt mi phn t
xU vi mt s thn [0,1]. Giá tr hàm µ
A(x)
biu din m thuc ca x
trong A. µ
A(x)
là mt ánh x t c gi là hàm thuc ca tp m A.
Giá tr hàm µA(x) càng gn ti 1 thì m thuc ca x trong A càng cao,
c li µ
A(x)
càng gn t thuc ca x trong A càng thp. Tp m là s m
rng ca khái nim tp hn(tp rõ). Tht vy, khi A là mt tp rõ, hàm thuc
µ
A(x)
ch nhn 2 giá tr 1 hong vi x có nm trong A hay không.
th hàm thuc µ
A(x)
* Mt s khái nim:
Gi s p m.
thuc ca phn t x vào tp m c ký hiu là A(x). A(x) ly giá tr trong
n [0, 1] vi mi x.
Định nghĩa 2.2 (Tp m li): Cho tp m A ca t U. A là tp m li nu
+
1
,
, , ,
0,1
21
Định nghĩa 2.3 (Tp m chun): Cho tp m A ca t U. A là tp m
chun nu ,
= 1
Định nghĩa 2.4 (S m): S m là tp m va li, va chun
Định nghĩa 2.5 (Tp ct): Tp ct ca tp m A, ký hiu là A
là tp thông
: A
α
= { x|A(x) ≥ α }
Định nghĩa 2.6 (Giá (support) ca tp m ): Giá ca tp m A, ký hiu là A
0
, là
tA
0
= { x|A(x) ≥ 0 }
2.2. Số mờ
2.2.1. Định nghĩa số mờ
Mt s m là mt tp m li c chun hóa hàm liên thuc ca hàm
này có tính cht liên tc ít nht ti tn, và hàm có giá tr
()
= 1 tt
phn t. S m
* Định nghĩa: Tp m A ng thc R là tp s m nu:
A là chun hoá, tm x sao cho
()
= 1.
ng vi mi A
R, tp mc {x: A(x)
.
ng dùng các s m , tam giác, hình thang và dng Gauss
(hình chuông).
2.2.2. Số mờ đơn trị
Mm d lit tp m tc là tp m A có hàm
thu
=
1
0
S m là mng hc bit ca s m, hàm thuc ch nhn giá tr 0
hong vi u có thuc tp A hay không. Nói cách khác, tp A là mt tp hp
m.
2.2.3. Số mờ tam giác
Trong mt tp v tr U, các phn t ký hiu bi x. Tp m A có hàn thuc
i 3 tham s nh ca tam giác(v mt hình hc biu
di
= max(min
,
, 0)
1
a
b
c
x
()
22
Hinh 8: S m tam giác
2.2.4. Số mờ hình thang
S m m tam giác, khác m
i 4 tham s c biu din qua hàm thu
sau:
= max(min
,
, 1, 0)
Hinh 9: S m hình thang
2.2.5. Số mờ hình chuông(Gauss)
S m hình i hàm thuc sau:
=
()
2
2
2
Hình 10: S m hình chuông
2.3. Biến ngôn ngữ
Ta xét mt bin nhn giá tr trong mt min giá tr ng h
có th nhn giá tr s là 1
C, 2
i mt giá tr c
th gán vào bin s c tính cht, quy mô ca bin. Ngoài ra
chúng ta còn bic nhn bi chúng ta
hiu là không nên chm tay trn vào v
C tr
1
a
b
c
x
()
d
23
thc t m vào vt có nhi ít khi
m vào vt có nhi là 80
C tr c t là lu
i vì nu nhc li khuyên sau thì ta d b ng nhn là có th chm
tay vào vt có nhi là 79
t có nhi 80
C tr lên thì không.
t ra là nu nghe theo lu thì ta có th nh rõ là nhit
bng bao nhiêu thì có th chm tay vào? Câu tr li là tu vào ý kin ca tng
i. Vi nhi là 60
i khác thì không.
Tuy các ý kiu chc chn là khi giá tr ca bin nhit
c chp nhy nu xét hàm
cao
nhn bin nhi và tr v t l ý ki
cao
s là hàm thuc ca
tp m
Hình 11 th biu din mi quan h gia nhi c thuc
Bin nhi có th nhn giá tr t giá tr ca ngôn ng t nhiên nên
c gi là mt bin ngôn ng (linguistic variable)
Khái niệm biến ngôn ngữ
Mt bin ngôn ng nh bi b (x, T, U, M)
T
- x là tên bin. Ví d
- T là tp các t là các giá tr ngôn ng t nhiên mà x có th nhn. Ví d c
T có th
- U là min các giá tr vt lý mà x có th nhn Ví d là
- M là lut ng ng mi t trong T vi mt tp m At trong U
T nói rng bin ngôn ng là bin có th nhn giá
tr là các tp m trên m
1
0.9
100
50
80
Nhi
cao
120
24
2.4. Bộ giải mờ
Gii m (hay còn gi là kh mnh mm y t mt tp m
B trên V. (B u ra ca b suy din m ). Gii m phi tho các tiêu chun sau:
- i din tt nht cho B. Tr thuc cao nht vào
B và trung tâm t ca B.
- Hiu qu tính toán nhanh
- Tính liên ti ít
t s i m thông dng:
2.4.1. Phƣơng pháp lấy max
thuc cao nht vào B
nh tp rõ H=
)()(|
''
sup
vyVy
B
Vv
B
ch
- y bt k
- m cc biên (ln nht hoc nh nht)
- m ca H
2.4.2. Phƣơng pháp lấy trọng tâm
m trng tâm ca tp B
y =
V
B
V
B
dvv
dvvv
)(
)(
'
'
2.4.3. Phƣơng pháp lấy trung bình tâm
Vì B ng là hp hoc giao ca m tp m thành phn do vy ta có th tính gn
y là bình quân có trng s ca tâm m tp m thành phn. Gi s x
i
và h
i
cao ca tp m thành phn B
i
ta có:
y =
m
i
i
m
i
ii
h
hx
1
1
.
c ng dng nhiu nht vì kt qu n nh
ng ca tt c các lu phc tp tính
25
CHƢƠNG 3
KỸ THUẬT SOM VÀ BÀI TOÁN PHÂN CỤM DỮ LIỆU
3.1. Sơ lƣợc về SOM
Self Organizing Map (SOM) là mt m-ron nhân to c hun luyn s
dng k thut hc không giám sát (Unsupervised learning) biu din d liu vi s
chiu thng là 2 chiu) so vi d liu vào nhiu ching s
chiu ln). Kt qu ca SOM gi là b (Map). SOM là mt mng -ron nhân to,
tuy nhiên SOM khác vi các mng -ron nhân to là không s dng các lp n
(hidden layers) ch s dng input và output layer. SOM s dng khái nim láng ging
gi la các d liu vào trên b
t gn nhau trên b). m chính
ca SOM là biu din trc quan d liu nhiu chiu vào không gian ít chi
ng là 2 chia d lic gi li trên b.
ng v SOM lc gii thiu bi C. von der Malsburg
c phát trin bi T. Kohonen (Phn Lan c gi là Kohonen
Network.
K thu
c áp dng thành công trong mt s n
dng, phân cm d liu, d i và khai phá d liu, Mc nhn dng có
th là nh, âm thanh hon,
SOM s dng cnh tranh m gom cm d li, ngoài vic
cp nht ng tâm c-ron chin thng, ng tâm các -ron lân cn
(láng ging) ca -ron chin thc cp nht. S -ron láng gic
cp nht ph thuc vào bán kinh hun luyn, là tham s u vào và có th i
trong mi ln lp. Trong cnh tranh cng (hard) ch duy nhng tâm c-
ron chin thc cp nht.
3.2. Kiến trúc của SOM
SOM gồm các thành phần sau:
- Output Layer: G-ronc b trí trên mi (b) kích
c X xY. Mi neuron có v i, ti m mt vector
trng s (weight vector) có s chiu bng vi s chiu ca input vector.
- Input vector: c n
Ma trn trng s (weight matrix) w
ij
kt ni gia input vector và các neurons