B GIÁO DO
I HC LC HNG
NH
NGHIÊN CU VÀ PHÁT TRIN THUT TOÁN
TÌM PHN T CHÍNH YU
TRONG MNG XÃ HI VÀ NG DNG
LU THÔNG TIN
B GIÁO DO
I HC LC HNG
NH
NGHIÊN CU VÀ PHÁT TRIN THUT TOÁN
TÌM PHN T CHÍNH YU
TRONG MNG XÃ HI VÀ NG DNG
Chuyên ngành: Công ngh thông tin
Mã s : 60.48.02.01
LU THÔNG TIN
NG DN KHOA HC
PHÚC
L
ng, ngoi tr các kt qu tham kho t các
công trình khác và mt s lý thuyt trên internet ngun
tham kho trong luc trình bày trong lu
này là do chính tôi thc hin ni dung nào ca lun
c n ly bng cp ng này hong khác.
Ngày tháng
nh
LI C
Tôi xin gi ln Thy Cô, bng
n tr tôi rt nhiu v kin th
tinh thn trong quá trình tôi thc hin lu
c bit c
cp và truyn dy cho tôi nhng kin thc rt hu dng, giúp tôi
hoàn thi
pháp nghiên cu khoa hn nhng công vic c th trong lun
nh.
TÓM T TÀI
Lup trung nghiên cu mt v mà cng
khoa h tìm phn t chính yu
(Key Player) trong mng xã hi. Bài toán tìm phn t chính yu là
bài toán nh mt hoc mt nhóm các phn t th mà
nu m làm gãy các liên k th. Da vào
bài n nht nh ca m th có
ng a nó. Mng xã hi c xem là
th ng, các thc th trong mnh c th, mi
quan h gia các thc th trong mng là các cnh c th. Bài
t ra là xây dng thui ngn nh
nh c th, kt hp v t nh thc
th nào là quan trng và có tm ng ln nht ti các thc th
khác trong mng xã hi.
Lu tóm tt lý thuyt các khái nin mng
xã hi, k thut phân tích mng, phn t chính yu
trong mng xã hi. Trên c lu thit k và xây
dng h th thc nghim thut gii tìm tp Key player trên các
tp d liu thc t.
DANH MC NHNG T VIT TT TRONG LU
BFS : Breadth First Search
CNTT : Công Ngh Thông Tin
JUNG : Java Universal Network / Graph Framework
MXH : Mng Xã Hi
SNA : Social Network Analysis
DANH MC HÌNH
Hình 1.1: Mô t mng xã hi. 1
Hình 2. 1: Mô hình mng Xã hi (Social Network) 6
Hình 2.2: Mô hình mng xã hi Facebook. 7
Hình 2.3: Mô hình các thành viên ca mng Twitter. 8
Hình 2.4: Mô hình phân bit Follower và Friend trong mng Twitter 10
Hình 2. 5: Giao din chính ca mng Facebook 11
i truy cp Facebook trong 1 tun t n
04/08/2012 (ngun socialbakers.com) 11
Hình 2.7: Biu din tnh trong mô hình mng. 13
Hình 2.8: Din t th th ng 14
Hình 2.9: Ví d ng 15
Hình 2.10: Mô t các thành viên trong mng xã hi 18
Hình 2.11: Ví d m th gnh 19
Hình 2.12: M th g tìm Degree Centrality 20
Hình 2.13: M th gm 10 tìm Degree Centrality 21
Hình 2.14: Mô t v trí Betweenness Centrality 24
HÌnh 2.15: Mt mng xã h tính Betweenness Centrality 25
Hình 2.16: Tm ng c a trên trung gian 28
Hình 2.17: Hình minh ha ví d tìm Closeness centrality 34
Hình 2.18: Mô t m Closeness Centrality ca mng 31
a trên trung gian, s lân cn và tr 32
Hình 2.20: H s gom cm c th 35
Hình 2.21: Ví d mt Mng xã hi 41
Hình 2.22: Mô t v trí ca Key player trong mng 37
Hình 3.1: Cu trúc mng xã hi 42
Hình 3.2: Cách thc Duy. 49
c thc hi 53
Hình 4.2: Tp d lic x lý 53
Hình 4.3: Tp d liu dolpc x lý 54
Hình 4.4: Danh sách Tnh Karate 55
Hình 4.5: Danh sách Tp cnh Karate 55
Hình 4.6: Danh sách T 56
Hình 4.7: Danh Sách Tp Cnh Dolphins 56
Hình th biu din tp d liu Karate 57
th biu din tp d liu Dolphins 57
Hình 4.10: Màn hình báo cáo kt qu 58
th thành ma trn k 60
th thành danh sách liên thuc 61
th thành danh sách lin k 62
Hình 4.14: Giao din np d liu. 63
Hình 4.15: Giao din V th trc quan 64
Hình 4.16: Tính Degree Centrality 64
Hình 4.17: Tính Betweenness Centrlity 65
Hình 4.18 Tính Closeness Centrality 65
Hình 4.19: Hin th kt qu c 65
Hình 4.20: Mô t tp d liu thc nghim 69
Hình 4.21: Giao din kt qu cui cùng c 67
DANH MC BNG
B nh sau khi tính toán 20
B th gnh 21
Bng 2.3: th 25
Bn nht ca tt c th 26
B Closeness Centrality c th 29
Bng 2.6: M Closeness Centrality ca mng 36
Bng 3.1: Cách thc duy th bng Thut toán BFS 51
Bng 4.1: Cách th d li th bng Danh sách liên thuc. 61
Bng 4.2: Cách th d li th bng Danh sách liên k 62
MC LC
*
NG QUAN 1
1.1. Gii thi tài 2
1.2. Lý do ch tài 3
1.3. Mc tiêu c tài 3
1.4. Phm vi nghiên cu c tài 4
LÝ THUYT 6
2.1. Tng quan v mng xã hi 6
2.2. Các Mng Xã hi thông dng hin nay. 7
2.2.1. Mng xã hi Twitter 7
2.2.2. Mng xã hi Facebook 10
2.3. Các khái nin trong vic t chc mng xã hi 12
2.3.1. Tnh 13
2.3.2. Tp cnh 14
2.4. n nht trong mng 15
2.5. K thut phân tích mng xã hi (Social Network Analysis SNA) 15
2.5.1. Bi cnh 15
2.5.2. ng dng thc t 16
2.6. ng 17
2.6.1. c - Degree Centrality 18
2.6.2. a trên trung gian 22
2.6.3. ln cn - Closeness Centrality 28
2.6.4. a trên tr 32
2.6.5. H s gom cm trong mng Clustering Coefficient 32
2.7. Phn t chính yu 35
N T CHÍNH YU TRONG MXH 39
3.1. Gii thiu 39
3.2. Bài toán tìm phn t chính yu trong mng xã hi. 39
3.2.1. Phát biu bài toán 39
3.2.2. ng dng ca bài toán tìm phn t chính yu. 41
3.2.3. Thut gii tìm phn t chính yu. 42
a. Thut gii tìm Degree Centrality. 42
b. Thut gii tìm Betweenness Centrality. 44
c. Thut gii tìm Closeness Centrality 47
d. Thut gin nht t mn tt c nh còn
l th. 48
T K XÂY DC
NGHIM 53
4.1. Gii thiu. 53
4.1.1. n 1: Thu thp và rút trích d liu 53
4.1.2. n 2: X lý d liu 54
4.1.3. n 3: 58
4.2. T ch d liu. 58
4.2.1. Gii thiu 58
4.2.2. d liu. 59
a. Cu trúc ma trn k 59
b. Danh sách liên kt 60
4.3. Xây dng h thng gii quyt bài toán tìm phn t chính yu. 63
4.4. Kt qu thc nghim. 66
T LUNG PHÁT TRIN 69
5.1. Nh tài 69
5.2. Hn ch c tài, cách khc phc 70
5.3. ng phát trin 70
TÀI LIU THAM KHO
-1-
NG QUAN
ng giao tip ca th k 21 gn lin vi cm t Mng xã h
m và chia s thông tin vô cùng hiu qu. Vi mt cái tên hoa
ch email, mi có th nhanh chóng tìm thy nhau. Mt hong ca
mt cá nhân hay mt doanh nghip có th ng ng vi s nhiu
i. Mi thông tin trên mng xã hi có th c nhanh chóng lan ta da
vào mi quan h kt ni ca mi thành viên trên mng xã hi.
- Ví d, trong công ngh thông tin, mng xã hi trc tuyn (Online
t ni các thành viên có cùng s thích trên internet
không phân bit không gian và thi gian, thông qua các dch v mng xã hi
(Social Network Service). Có th nói, s i ca các site Facebook, Twitter,
n cho các mng xã hi ngày
càng tr nên ph bi
Hình 1.1: Mô t mng xã hi.
Ngun: [16]
Phân tích mng xã hi có ngun gc t ngành Xã hi hc và các ngành
phân tích mng, lý thuy th.
Các nhà khoa h dng xã
hi nghiên cng truyn thông trên internet,
m ph bi
-2-
1.1. Gii thi tài
Phân tích mng xã hi (Social Network Analysis SNA) hi
mt trong các ch c quan tâm nghiên cu. Phân tích mng xã hi bao
gm vic nghiên cu các quan h, kt ni, mu truyn thông và hành vi gia
các nhóm xã h
ng xã hi" (Social Network Analysis -
c nghiên cu và ng dng ngày càng nhi
cu xã hi hc nói riêng và khoa hc xã hi nói chung. Ti Vi
pháp phân tích mng xã hi còn khá mi mc ng d
pháp phân tích này còn khá hn ch.
nh phn t chính yu
(Key player) hay còn gi là nhng tác nhân quan trng trong mng xã hi.
Phn t chính yu là các phn t trong mc xem là quan trng xét
theo mu ki nói rng, key player là nhng node có kh
u khin lung thông tin, là nhng node ni bt nht và có tm nh
n các node khác trong mng xã hi.
nh các mi liên kt ca mt
th. Thông qua Centrality, ta có th phát hic thc th nào
trong mng là quan trng và có tm n nhng thc th khác.
Dn nhnh ca m th có
ng. Có th xem mng xã h th ng, các thc th trong
mnh (node) c th, mi quan h gia các thc th trong mng
là các cnh (link) c th.
t ra là xây dng thun nh
nh c th, t nh thc th nào là quan trng nht, có tm nh
ng ln nht ti các thc th khác trong mng xã hi.
Các v t ra n
-3-
Các khái nim v mng xã h
Link, Edge, Clique,
Cu trúc d lia mng xã hc t ch
nào?
n nhnh ca m th có
ng.
mng xã hi và các k thut phân tích mng
xã hi d
1.2. Lý do ch tài
Trong phân tích mng xã hi, bài toán tìm phn t chính yu (Key
Player) là mt trong nhng bài toán quan tr gii quyt nhiu v liên
quan trong xã hi nói chung và ngành Công ngh thông tin nói riêng.
Các doanh nghip áp d phân tích và ci thin mi liên
lc truyn thông bên trong t chc và mi
tác. Phân tích và tìm ra nhng phn t chính yu có sc lan ta thông tin rng
rãi, t ng chic makerting, qung cáo sn phm ca h t
hi
giáo di hng hay Trung hc chuyên
nghip có th áp d tìm ra nhng phn t nào có m
ng ln nh lan ta thông tin nhanh và chính xác nht ti mi
phn t khác trong mng xã hi, t t qung bá nh
o, hay nhng thông tin tuy
Trong các website mng xã hc s dng các thành
phn ca phân tích mng xã h xây dng chnhn din và
gii thiu kt bn tia trên liên kt friends to friends.
1.3. Mc tiêu c tài
Qua quá trình tìm hiu v mng xã hi, lu cp ti cách thc
tìm các phn t chính yu, quan trng (key players) trong mng xã h t
-4-
ng cho nhic khác nhau. Mc tiêu chính yu ca lu
này là:
- Nghiên cu v mng xã hi (Social Network).
- Tìm hiu v Key player trong mng xã hi.
- Tìm hiu v các lo ng xã hi.
- Tìm hiu v k thut phân tích mng xã hi.
- Nghiên cu và phát trin thunh tp các phn t chính
yu trong mng xã hi d
- c nghim da trên:
o Mng tham kho các bài báo trên Internet.
o Mng liên kt các trang web (web link)
- Hin thc thut toán tìm Key players ba.
1.4. Phm vi nghiên cu c tài
tài tp trung vào tìm hiu và nghiên cu các v sau:
Tìm hiu v mng xã hi và các v liên quan.
Trin khai xây dng c nghim, xây dng ng dng
và tt gii thut cho bài toán n nht
trong mng liên kt các websites.
Th nghii thut trên b d liu thc t
C th tài thc hin các ni dung sau:
Nghiên cu các mô hình mng xã hi truyn thông.
Tìm hihân tích mng xã hi.
Tìm hiu mt s phn mm phân tích mng xã hi.
Tìm hiu thun nh th ng
và vng) và các lo . T xây d
trình mô phng thut toán áp dnh phn t
chính yu trong mng xã hi.
-5-
Thu thp d liu thc t kim tra.
Tim ca thut toán.
i ti khc ph
-6-
LÝ THUYT
2.1. Tng quan v mng xã hi
- Mng xã hi (MXH) là m th mô t s a các cá th
có cùng mi quan tâm, có liên h trc tip hay gián tip
- i trang Wikipedia [16] MXH (Social Network) là
dch v ni kt các thành viên cùng s thích trên internet li vi nhau
vi nhiu m t không gian và thi
gian.
- Mt mt mng xã hi bao gm mt tp hp các phn t (nodes), mi
node có th là mt cá th, mt tp th, thm chí là mt t chc có liên
kt, ràng buc ln nhau thông qua các mi quan h xã hi gi là các
liên kt (links).
Hình 2. 1: Mô hình mng Xã hi (Social Network)
Ngun:
- Trong công ngh thông tin, MXH trc tuyn t ni các thành
viên cùng s thích trên Internet không phân bit không gian và thi
gian thông qua các dch v mng xã hi Email, chat, Internet
-7-
S i c
Youtube, Google+n cho mng xã hi ngày càng tr
ng, ph bi
- Nói mt cách khác, MXH là mng tp hp các công c, dch v trc
tuyn t - email, dio lun , blogs, chat, các
trang mng xã hi, các trang chia s hình n tr s
i gia nhi s dng. [8]
Hình 2.2: Mô hình mng xã hi Facebook.
Ngun:
2.2. Các Mng Xã hi thông dng hin nay.
2.2.1. Mng xã hi Twitter
a. Gii thiu tng quan
Twitter là mt mng xã hi vc chia s theo thi gian
thc, cho phép m i giao tip b i nhng mu tin
ngn (ch 140 ký t).
-8-
T nhng li ích thc t rt ln nên vic s dng Twitter cho Internet
u mà bt c mt marketer n phi thc hin, nó
giúp cho vic kt ni và chia s n các khách hàng cùng s
dng Twitter (ngun ).
c thành lp c s dng bi
nhi trong hu hc trên th gii. Dch v có sn trong
p tc cp nht thêm.
Hình 2.3: Mô hình các thành viên ca mng Twitter.
Ngun:
b. Các khái nin trong mng Twitter
Tweet p mà bn mun chia s, gii hn 140 ký t.
Re-Tweeti mà bn follow chia s Tweet cho bn, bn
chia s n,
y gi là Retweet.
Follow: Mng bn s thc hin khi mun kt ni v
cp nht các Tweet, có mt nút Follow nm trên trang ca mt
i dùng Twitter, khi mn follow bn, h s click vào
-9-
nút Follow, không nht thit bn ph c tr li. Bn
khôa bn.
Direct Messagei dùng Twitter,
i nhn tin nhn phi gi tin nhn.
Following: Khi bc là bn
n s c cp nht mi Tweet
t
Handle liên kn mt tài kho
p (Tweet) ca bn, bn s phi thêm ký t @ tc tên tài khon
khi mun liên kn emeraldvn, ch c
p ca bn s
cha liên kn emeraldvn.
Hashtag: S gp các Tweet có ni dung liên quan hoc các
Tweet có s dng cùng hashtag, cú pháp s là #<tag> (ví d
#digitalmarketing), sau khi s dng Hashtag thì trong mu tin ca
bn s có liên k tag bi khác click vào liên
kt này, h s c tt c nhng Tweet s dng hashtag
digitalmarketing.
Listi dùng trong mi nhóm, nhóm có
th do bn t to.
Search i dùng tìm kim các Tweet có liên quan
hoc cha cm t mà h m.
Timeline: Gia Facebook, Timeline hin th các
tweet ca bn và ca nhi b.
Trending Topic: Twitter s hin th c cho là 'hot' trong
th m hin ti, bn s th c hin th
theo khu v ca bn.
-10-
Unfollow c v ng cách
click vào nút Unfollow), bn s không th nhn các update t i
.
Hình 2.4: Mô hình phân bit Follower và Friend trong mng Twitter
Ngun: Twitter.com
2.2.2. Mng xã hi Facebook
a. Gii thiu tng quan
Facebook là mt website mng xã hi truy cp min phí do công ty
u hành. i dùng có th tham gia các mc
t chc theo thành phng hc và khu v liên kt và
giao tip vi khác. M kt bn và gi tin nhn
cho h, và cp nht trang h thông báo cho bn bè
bit v chúng. Tên ca website nhc ti nhng cun s
ghi tên nhng thành viên ca cng campus mà mt s ng i
hc và cao ng ti M n mng, phòng ban,
có th làm quen vi nhau tng. (theo
a ).
-11-
Hình 2. 5: Giao din chính ca mng Facebook
Vi dùng thc s thành mt
mng xã hi ph bin trên toàn th gii dùng m
tui, mi quc gia, mi n.
dàng nh kinh doanh, kt ni vi khách
hàng, to các mi quan h, ly thông tin t m
sn phm hoc dch v.
Hình 2.6: i truy cp Facebook trong 1 tun t n
04/08/2012 (ngun socialbakers.com)
-12-
b. Các khái nin trong mng Facebook
Wall: Trang cá nhân ca bn, nó s cha các status,
comment, hình nh, photo, video mi nht mà bn va chia s.
Statusi "what's on your mind", b
n chia s u gì vi mi.
Note: Ch mà bn s vit thoi mái mi th
vi status là bn có th vit bao nhiêu tùy thích, status thì tt nhiên
bn ch c vit ngn thôi.
Comment: Bình lun ca bn hoi khác v mt status,
link, note
Like: Nó là mi, khi
bn click vào tc là b mình Like mt status, bình lun
hoc m các website khác (nu nút Facebook Like
c add vào website này).
Friends: Bn bè ca bn trong Facebook, bn có th yêu cu
kt bn vi mc li, mi có th yêu cu kt
bn vi b giúp bn suggest bn bè cho
i khác, hoc t tìm bn bè cho bn (nu bn mi bu s
dng).
New Feeds i nht (thông tin, status,
bn bè và các nhóm xã hi ca bn, nó s c cp
nht theo thi gian.
Tagn din mu
trong mt hình nh, video hoc bài vi
(ngun
2.3. Các khái nin trong vic t chc mng xã hi
Trong phân tích mng xã hi, ta xem xét mng xã h th mng
bao gnh (nodes), các cnh (links). Node biu din tp các tác nhân,
-13-
thc th, còn link biu din mi quan h (relation) gia các tác nhân, thc
th
2.3.1. Tnh
Trong lý thuy th, tp nh còn c gi là tp nút (nodes). Trong
phân tích mng xã hc bip các tác nhân (actors) hay
tp thc th Trong mng xã hi, tnh u
trúc ca các mng xã hi, các thành viên hay các ct nhóm
i, mt t chc hay các quc gia, các trang web, các nhãn t khoá hay các
hình
Ví d: ta xét tn t trong các m
Hình 2.7: Biu din tnh trong mô hình mng.
Ngun
M
phn t trong mng.
-14-
2.3.2. Tp cnh
Trong MXH, tp ci liên kt (Link) hay mi quan h
gia các tnh trong mng. Mi cnh ta có th hiu là mi hai
nh vi nhau. D lý thuy th, ta chia tp cnh ra là 2 loi:
i v th ng: Tp cnh dng trc tic biu din
bng thng theo chi
i v th ng: Tp cnh dng gián tic biu din
bng thng (không có chi)
th ng th ng
Hình 2.8: Din t th th ng
i v th, mt thành phn quan trrng s ca
cnh. Trng s ca c nh m
hay tn sut liên kt gi th. i vi các bài toán trong lý
thuy th, trng s gii quyt bài toán tìm
n nh th.
A
v
B
D
C
E
A
B
D
C
E