!"#
$%"
&%'()*
&+,"+-".'/
.012
"'/34
)567'/
346-8
68
+/349:0!;6
<=!.%>
?
@
A
?
B
@
"C;DE3FD
"C;DE3FD
B%0
G)H3I
<.0C'/34
<.0CA:J'/34
KLMKM
"C;N
O9;6(
O9;6(
P;QR6F
S,<=!.7A)H3IH
•
N:)'()A76T:U676T:;0)7
3I3'.D1HR,
•
G)C;H3I).0-Q):32AV6W7A).0C
=I)XY>Z)HD[\],"!I)^Q
.<.;_?07?0\D!.0C0J'.,
•
`:=D;aJ-3'.D ).:76J:6830.H
D 3D Q8:08[\bCc.
d,&1H3I7I)6:
•
+R6'eH0H3I6(71H3I^:6T5H
R6FAJ9:WP9:1Z\fgg0_h]
•
+V)a=!FJ8e;?@A?B@I).0C*)'(
)_.<.;_?07@6.\\X<.0A
?Bc.H &:0i?@A?B@
"C;*
Z\jggg]
+R6'eH0H3IZhggg]
<.0C<.0A[
`$ 6 Q
<=!?@A?B@6 8e;.;'/;:;"@
D ?B@
f,"W3Q'/34
•
"W3Q'/34)56).0-
•
"W3Q'/3468
•
g'e6
•
Xkg,hAXSlg,fAXd
•
•
<.0CA:J76 A:J3Hm(mL
•
•
Cho đồ thị G(V,E,W) trong đó:
–
V là tập các đỉnh hay các trang Web
–
E là tập các cạnh (có link)
–
W là ma trận trọng số của các cạnh
–
Tập nhãn L ={văn hóa, giáo dục, luật pháp, thể thao,…}
–
V
l
: Tập nút đã được gán nhãn (y
1
,y
2
,…,y
l
)
–
V
u
= V\V
l
: Tập nút chưa được gán nhãn
•
Xây dựng mô hình gán nhãn cho các đỉnh chưa được gán nhãn V
u
.
Bài toán phân loại Web
n,&C6.012
"C;*
Z\jggg]
2
<.0C:2[o
%(6 A:Jm3'e:2L
V
l
V
u
jS
jd
jf
jn
S
d
j
n
f
G:J:2c.Q3#pbH:
3#q6D(,
"H.0C.3Fo
g
4:C;3#%
6
D %
.6P;
o
S
ko
g
o
k,o
[S
756C;Qb:3#.
3F,
+.16F6P;7:0ic.opQa,
j,"789
•
r;)a :C;N6 84/jggg0.
•
O9
•
QWA: