3
1
2
3
5
6
9
9
11
12
1 13
14
2.1. K 14
15
15
19
24
30
36
37
37
38
40
46
50
4
51
3 52
54
54
54
55
57
58
63
63
64
65
66
71
72
74
5
B 21
22
trang web 34
54
64
66
67
6
Hình 1.1 9
Hình 2.1 22
Hình 2.2 23
Hình 2.3 23
Hình 2.4 25
Hình 2.5 26
Hình 2.6 27
Hình 2.7 31
Hình 2.8 32
Hình 2.9 35
Hình 2.10 36
Hình 3.1 38
Hình 3.2 41
Hình 3.3 48
Hình 4.1 55
Hình 4.2
i
∈ S
j
i
) - TS(R
o
60
Hình 4.3: R
i
∈ S
j
và R
i+1
∈ S
j+1
i+1
) - ST(R
i
) 61
Hình 4.4
k
∈ S
j
và R
k
i
thì R
i
∈ S
j
61
Hình 4.5 62
Hình 4.6 62
Hình 4.7 65
Hình 4.8a 69
Hình 4.8b 69
Hình 4.8c 70
Hình 4.8 70
7
hay
logs
web
cho quá trình khai ph
8
16] và Agrawal [3].
.
:
cho phép
.
9
:
1.1.
(hình 1.1)
q
Hình 1.1:
10
[1].
:
1. Phâ (Standard Statistical Analysis):
(navigation path).
2. (Association Rules):
.
3. (Sequential Patterns)
.
4. (Clustering)
.
.
5. (Classification)
. Theo [1], p
.
.
11
1.2. ài toán khai phá
,
hay
ra n
:
,
là .
.
.
n
.
12
1.3
:
1.
trong
2.
,
(Divide and Conquer)
vào (có
và
1.
13
2. :
1.41
.
các khai phá ã
14
1
, i
2
n
1
, t
2
m
i
association rule)
tron
sup(X) = C(X)/|D|
(2.1)
U
∪ Y) = C(X ∪ Y)/|D|
(2.2)
∪ U Y.
U
∪
(2.3)
∪
15
(frequent itemset).
hau
web
4, 5]
16
4
và AprioriHybrid (xem [5
(DHPDirect Hashing and Prunning)
17
-
-
-Hybrid Distribution) (xem [6
- Segment Support Map) [7
(evolutionary algorithms)
và
[8].
(sequential patterns) [14
18
(temporal association rule),
6, 7]
22
-
9
[20
[21
.
[15]
Suneetha và
Krishnamoorti -Down thay vì Bottom-
(frequent pattern tree) [8]
-
19
-
) [9].
.
/ra.
i
= { c
i
| c
i
, |c
i
| = 1}
k+1
1
, i
2
n
:
Input: t
1
, t
2
m
}.
Output:
Begin
Tính sup(i
j
) = count(i
j
1
, i
2
n
1
= {i
1
, i
2
n
};
1
= {i
j
| i
j
∈ C
1
, sup(i
j
k=1;
termination = false;
20
Repeat
F
k+1
= ⍉;
k+1
k-
k
k
;
k+1
.
k+1
;
If F
k+1
= ⍉ then termination=true
Else k=k+1;
Until termination;
End;
k+1
k
ãn:
k+1
k
và Q
k
-1
L
k+1
= P
k
+ Q
k
= {i
1
, i
2
k-1
, i
k
, i
}
k
= {i
1
, i
2
k-1
, i
k
} và Q
k
= {i
1
, i
2
k-1
, i
i
1
≤i
2
≤≤i
k-1
≤i
k
≤i
.
k+1
(∀X ⊆ L
k+1
và |X| =
k thì X ∈ F
k
).
1
F = F
1
∪ F
2
∪ ∪ F
k
∈
-
-s)) = supp(I)/supp(I-
21
.1:
Session 1
Session 2
Session 3
Session 4
Session 5
Session 6
Session 7
Session 8
Session 9
I
1
I
2
I
3
I
4
I
5
22
T01
I
1
, I
2
, I
5
T02
I
2
, I
4
T03
I
2
, I
3
T04
I
1
, I
2
, I
4
T05
I
1
, I
3
T06
I
2
, I
3
T07
I
1
, I
3
T08
I
1
, I
2
, I
3
, I
5
T09
I
1
, I
2
, I
3
(hình 2.1)
Hình 2.1:
2.2).
{I
1
}
6
6/9
{I
2
}
7
7/9
{I
3
}
6
6/9
{I
4
}
2
2/9
{I
5
}
2
2/9
{I
1
}
6
6/9
{I
2
}
7
7/9
{I
3
}
6
6/9
{I
4
}
2
2/9
{I
5
}
2
2/9
23
{I
1
, I
2
}
4
4/9
{I
1
, I
3
}
4
4/9
{I
1
, I
4
}
1
1/9
{I
1
, I
5
}
2
2/9
{I
2
, I
3
}
4
4/9
{I
2
, I
4
}
2
2/9
{I
2
, I
5
}
2
2/9
{I
3
, I
4
}
0
0
{I
3
, I
5
}
1
1/9
{I
4
, I
5
}
0
0
Hình 2.2:
{I
1
, I
2
, I
3
}, {I
1
,
I
2
, I
5
}, {I
1
, I
3
, I
5
}, {I
2
, I
3
, I
4
}, {I
2
, I
3
, I
5
}, {I
2
, I
4
, I
5
}
1
, I
3
, I
5
}, {I
2
, I
3
, I
4
}, {I
2
, I
3
, I
5
} và {I
2
, I
4
, I
5
Hình 2.3:
{I
1
, I
2
, I
3
}, {I
1,
I
2
, I
5
}
{I
1
, I
2
, I
3
, I
5
}
2
, I
3
, I
5
} không
{I
1
, I
2
}
4
4/9
{I
1
, I
3
}
4
4/9
{I
1
, I
5
}
2
2/9
{I
2
, I
3
}
4
4/9
{I
2
, I
4
}
2
2/9
{I
2
, I
5
}
2
2/9
{I
1
, I
2
, I
3
}
2
2/9
{I
1,
I
2
, I
5
}
2
2/9
{I
1
, I
2
, I
3
}
2
2/9
{I
1,
I
2
, I
5
}
2
2/9
24
F = {{I
1
}, {I
2
}, {I
3
}, {I
4
}, {I
5
}, {I
1
, I
2
}, {I
1
, I
3
}, {I
1
, I
5
}, {I
2
, I
3
}, {I
2
, I
4
}, {I
2
, I
5
},
{I
1
, I
2
, I
3
}, {I
1
, I
2
, I
5
}}
1
, I
2
, I
5
R
1
: I
1
, I
2
5
conf(R
1
) = supp({I
1
, I
2
, I
5
})/supp({I
1
, I
2
}) = 2/4 = 50% (R
1
R
2
: I
1
, I
5
2
conf(R
2
) = supp({I
1
, I
2
, I
5
})/supp({I
1
, I
5
}) = 2/2 = 100%
R
3
: I
2
, I
5
1
conf(R
2
) = supp({I
1
, I
2
, I
5
})/supp({I
2
, I
5
}) = 2/2 = 100%
R
4
: I
1
2
, I
5
conf(R
2
) = supp({I
1
, I
2
, I
5
})/supp({I
1
}) = 2/6 = 33% (R
4
R
5
: I
2
1
, I
5
conf(R
2
) = supp({I
1
, I
2
, I
5
})/supp({I
2
}) = 2/7 = 29% (R
5
R
6
: I
5
1
, I
2
conf(R
2
) = supp({I
1
, I
2
, I
5
})/supp({I
5
}) = 2/2 = 100%
2
comestic.htm và car.htm thì n
6
Lý thuyt v x lý song song (parallel processing) bu cui nh
1940 khi J.Von Neumann gii thiu mt s mô hình hn ch ca tính toán song
song có tên otomat t bào mà ch yu là mt mng hai chiu các b x lý trng thái
hu ht theo di. T n nay, lý thuyt v x lý
song song tr vc nghiên cu quan tri nhng
du hiu kh quan trong vic xây dng mt mô hình lp trình mi có nhng tính
t tri so vi mô hình lp trình tun t truyn thng. Vic ng dng lp
25
trình song song trong gii quyt các bài toán khai phá d liu t c nhiu
nhà nghiên ci vc khai phá lut kt hi
là mt ngoi l
2-3]. t
k song song shared-
o N essor), P
i
o N
truy.
Hình 2.4: [2]
(count distribution) n Apriori.
1
, P
2
N
D
N D
1
, D
2
,
N
,
-
i
i
26
k
k
1
k
k
Hình 2.5: [2]
27
Hình 2.6:
1
phiên
gian
gian
gian
cho
. . .
. . .
CSDL giao
D
1
CSDL giao
D
2
CSDL giao
D
N
2
N
lý P
1
2
N
F
1
F
2
F
N
. . .
. . .
. . .
. . .
1
2
N