Tải bản đầy đủ (.docx) (12 trang)

nghiên cứu bài toán gom cụm dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (584 KB, 12 trang )


TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM
KHOA KHOA HỌC VÀ KỸ THUẬT MÁY TÍNH
BÁO CÁO ĐỀ TÀI SỐ 8:
NGHIÊN CỨU BÀI TOÁN GOM CỤM
TRONG KHAI PHÁ DỮ LIỆU

FUZZY C-MEANS

 !"#$
Châu Vĩnh Tuân 50802429
Phạm Nguyên Trình 50802353
%&'(')&&
Bài toán gom cụm *!+,!-+ /(0123
MỤC LỤC
Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu
2
Bài toán gom cụm *!+,!-+ /(0123
I. LÝ THUYẾT GOM CỤM:
1. Khái niệm gom cụm:
4 #5 62/78#5 9:;$+;<=+%!>?78#2 @!!,7
:;$+A2BC+!<#%##5 :;$+!D2 E#%#BF+G$
- %#BH!I!>4#J @!#5 K!L!"M2+F @!3H
!+#N<4BO
- %#BH!IG%##5 !?KGP!L!"M2+O
=+/Q!#%#RBF!? GQ S7%!$#%##5 S#%# +:
;$+!>4 @!!,7I7A2BC+#%#:;$+GP#EO

T;< @!!,7#%#BU :;$+!>#G4 #5 
V;<#%#!,7BU :;$+32+G4 #5 
 #5 !W




Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu
3
Bài toán gom cụm *!+,!-+ /(0123
2. Vai trò của gom cụm:
4 #5 :;$+B2!>X=+2!>*!>4#%#<G42*#
- *#O
- YP75#:;$+
- Z"A%4![!Q!
- 8 ;\*#<*#
- Y42
4 #5 :;$+ 2;]#%#!$N#
- ^GQ!
- _
- ? GQ GQ!=+CR!
3. Một số độ đo trong gom cụm:
- Minkowski
- Euclidean – p = 2
- Độ đo tương tự: cosin hai vectơ


4. Mục đích của gom cụm:
`%#BaBI#A#R!#b2$#4 !< #%#BH
!I!>4 @!!,7:;$+GP#EO
YP#!+#+c#+<4BU4 #5 :;$+S4
#5 "2<4!+#N[J#+#R7!>4!d!>[
I7O
5. Một số phương pháp gom cụm điển hình:
• 4 #5 784]#

• 4 #5 78#R7
• 4 #5 "2!> ,!B@
• 4 #5 "2!>;
• 4 #5 "2!> P?
• 4 #5 #><A+@#

6. Một số mô hình cụm dữ liệu:
• e8!%#
Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu
4
Bài toán gom cụm *!+,!-+ /(0123
• +/ +
• fg!a
• Z"2!> ,!B@
• 23h
Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu
5
Bài toán gom cụm *!+,!-+ /(0123
II. FUZZY C-MEANS (FCM):
1. Tìm hiểu Fuzzy C-Means:
a. Fuzzy logic:
o -+ /4#;< @!?!W#;4##F+%!>aO
o VQ-+ /4##!U# @!%!>a#8;\24B@
:2i)S&j
b. Tập Fuzzy:
o <!,7I7 <#%#7C!k# @! W#B@!<
R!Ba
o ,7-+ /BI#Bal2;<#m76TS 9S!>4BT;<
!,7I7< ;<%n] T


i)S&j
 o p7C!kSBI#*;<$3H!<
#b2n!>46TS 9O4!,7:+]Tqrn&SOOOSnsS
!,7-+ /6TS 9![  BI# P!t32+
r 6n&9un&SOOOS 6n9unsO
 6n9q)nGP!+@#6TS 9
 6n9q&n4<!4<!+@#6TS 9
c. Fuzzy C-Means:
o -+ /(01236-09;< @!7L7%7#b278
 #47_7 @!7C:;$+!+@#F24m#
F+#5
o [n+/BI#3k5!>4,] +
o -0BI#$!"#"2!>< 
>4B
 ;<AR!Gv3H!"#;L&
 +w;< W#B@#b2#%#!<#b2n!>4
#5 w
 n;<#F+!W#b2:;$+B4(#F+
 #w;<!>+!8 #b2#5 GN#!#(#F+
 xxyxx<AR!Gv#z!+<4!U$3"H
2+:2:;$+B4
2. Giải thuật:
-0BI#!"#$;C;I!!14#%#A#
- V#&Y{!]4 2!>,qi+
w
jS6)9
Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu
6
Bài toán gom cụm *!+,!-+ /(0123
- V#'];C;m7!WG!N!4%_#(!L!>+!8 6G9qi#

w
j
6G9
- V#|,7,!6G9<6G}&9
- V#~YU !>2
Q+GQ!#2!D2S!2=+2/;]A#'SQ+BE!D2 ES
!2GQ!!•#!N!4%O
3. Ưu và nhược điểm:
a. Ưu điểm:
o +#R7#4GQ!=+!H!R!#4:;$+#g#_4
<!LBH!H!L!+,!!4%Y(0123O
o YPHY(0123S:;$+BU +/R!7
!+@#F @!#5 +/R!S{ pBU BI#78<4
#5 "2<4GQ!=+!N!4%< !<S?,/S
@!BU #!U!+@#FF+L @!#5 O
b. Nhược điểm:
o C!$ 3H;I#%##5 O
o €#<!R7GQ!=+,BI##<!H!#7N
!N!4%#<F+O
o Y4#%#•+#;1#%#/Q+!H#LA#!UGP
BgBF+O
Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu
7
Bài toán gom cụm *!+,!-+ /(0123
III. CHƯƠNG TRÌNH MẪU:
1. Hướng dẫn sử dụng phần mềm Fuzzy C-Mean Analyst:
a. Yêu cầu hệ thống:
o $BF+<‚4ƒ3„uo3!2u`e6|'A!9
o 0%/4…226…o097A&O†!>{;
o Z23%#‡;16/+#C+GP!2/B^$!H‡;1

</9
12/05/2011 04:05 PM 71,225 FuzzyCMeanAnalyst.jar
03/03/2011 06:57 AM 9,728 gluegen-rt.dll
03/03/2011 06:57 AM 416,768 jogl_desktop.dll
03/03/2011 06:57 AM 73,216 jogl_es1.dll
03/03/2011 06:57 AM 77,312 jogl_es2.dll
12/05/2011 04:23 PM <DIR> lib
03/03/2011 06:57 AM 10,240 nativewindow_awt.dll
03/03/2011 06:57 AM 36,864 nativewindow_win32.dll
03/03/2011 06:57 AM 41,984 newt.dll
./lib
12/05/2011 04:05 PM 110,455 gluegen-rt.jar
12/05/2011 04:05 PM 2,419,760 jogl.all.jar
12/05/2011 04:05 PM 128,511 nativewindow.all.jar
12/05/2011 04:05 PM 176,393 newt.all.jar
b. Hướng dẫn chạy phần mềm:
"#$!14#%#A#32+
o Y{B@7C F Aˆ#%##]/‡;1
FuzzyCMeanAnalyst.jar
o *‡;17+!Aˆ#%##;#G<4A+!!4Browse
Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu
8
Bài toán gom cụm *!+,!-+ /(0123
o Q!;,7#%#!P3H6Number of clusters, m value,
Random seed, Epsilon9!N#I7
 Numberofclusters3H;I#;+3!1> +H78
!N#
 mvalue%!>a #b2#P!W#!>4A<!4%
-+ /(012
 Random311%!>aBU3+ 2!>,

A2BC+
 EpsilonB@#Nn%##b2!+,!
o ;#GA+!!4RunBU!"#$$#!N!4%< P!
? *2
o YQ!=+
o ;#GA+!!4•n74>!BUn+R!>2‡;1Ba]7;2!1n!
#%#!P3H#b2!+,!O
Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu
9
Bài toán gom cụm *!+,!-+ /(0123
o fUn1 ? *2{#?G%#S#!U!"#$
#;#G#+@!<G_4!> <? P7D4m#R
#%#7N eSZ‰‚S•-SŠ6Q+GP#!%#
5!?#;#G @!;C; <? P7D<!"
$;]!24!%#9O
o fUF;]#?A2BC+SRŠ131!
Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu
10
Bài toán gom cụm *!+,!-+ /(0123
2. Kết quả chạy với dữ liệu mẫu:
Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu
11
Bài toán gom cụm *!+,!-+ /(0123
IV. TÀI LIỆU THAM KHẢO:
- Z2!2 0 4#17!3  2  1#=+1361#4  •!49  ‹
…2ƒ1220#1;1Y2 A1>
- -+ /;+3!1>T2;/33‹…4‚;1/243
- T;4>! 3Œ4>-+ /;+3!1>S01!43#(0123;+3!1>
ƒ!  T77;#2!43  (  222G  0/2 4!4S1!4 4 #23S
Y2!3+>442

Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu
12

×