THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
i H c Qu c Gia Hà N i
Tr
ng
i H c Khoa H c Xã H i Và Nhân V n
OBO
OK S
.CO
M
Khoa Thông tin th vi n
---------------
Bài ki m tra gi a k
Môn: Quá trình h th ng thông tin
KIL
Phân tích so sánh quá trình tìm tin trong s đ thu n và s đ đ o
0
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
TV N
Hi n nay khi n n kinh t càng phát tri n, kéo theo đó là s phát tri n c a
có đ
KIL
OBO
OKS
.CO
M
n n khoa h c công ngh và s n m b t thông tin m t cách nhanh nh y.Ch khi
c nh ng đi u đó chúng ta m i làm ch
công .Ng
i ta th
ng nói ng
đ
c m i th ,làm ch s thành
i có thông tin là ng
i chi m l nh s chi n
th ng.Trong xã h i ngày nay vi c n m gi thông tin là m t đi u h t s c c n
thi t và quan tr ng,b i có nh th chúng ta m i làm ch đ
nhanh chóng c a xã h i thông tin trong th i đ i ngày nay
1
c s phát tri n
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
N i Dung V n
th c hi n
c quỏ trỡnh tỡm tin hỡnh th c hoỏ c n cú 3 ti n sau:
KIL
OBO
OKS
.CO
M
* Cú m t khụng gian tỡm tin
L c u trỳc cú t ch c l u gi cỏc th c th , i t
ng thụng tin
c qu n
tr trong h th ng nh sỏch, bỏo, t p chớ, bi trớch, lu n ỏn, lu n v n
gi cỏc i t
l u
ng thụng tin ny, t ch c l u gi trờn cỏc file d li u khỏc nhau:
+ File thu n
+ File o
+ File kộp
hỡnh thnh khụng gian l u tr thụng tin c n:
+ T p h p cỏc th c th c n qu n tr
+ T p h p cỏc thu c tớnh
+ M i quan h gi a t ng th c th
l nh v c ú
c qu n tr v i cỏc thu c tớnh trong
+ Xõy d ng ma tr n t li u
+ Hỡnh thnh s t ch c thụng tin
* Cú cõu h i tỡm
tỡm ki m thụng tin trong h th ng tỡm ki m ũi h i ph i cú nh h
ng
cu c tỡm, th hi n qua cỏc cõu h i tỡm.
Cõu h i tỡm c a ng
i dựng tin l s bi u t b ng l i ho c m t v n b n
c p n nh ng ch m ng
truy c p
i dựng tin quan tõm.
õy chớnh l cỏc i m
c th c hi n trong quỏ trỡnh tỡm ki m v so sỏnh.
M t cõu h i tỡm cú th cú m t hay nhi u i m truy c p. Trong tr
ng h p
cú m t i m truy c p thỡ cõu tr l i n gi n. Khi s i m truy c p cú t hai tr
lờn thỡ cõu h i tỡm ph c t p. Trong tr
ng h p ny, cỏc i m truy c p ph i k t
n i v i nhau thụng qua toỏn t logic.
* Th t c so sỏnh ng ngh a
2
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
Quá trình tìm tin là quá trình thu n tuý mang tính k thu t, so sánh d u
hi u c a th c th này v i th c th khác ho c so sánh t p h p d u hi u c a thông
tin này v i t p h p d u hi u c a thông tin khác
KIL
OBO
OKS
.CO
M
Qua vi c phân tích,so sánh 2 ví d sau chúng ta s hi u rõ v n đ :
I. So sánh quá trình tìm tin trong s đ thu n (Linear schema), s đ
đ o (Invert schema)
2.1. i m gi ng nhau
Nh ta đã bi t, các đ i t
khác nhau: File Thu n, file
ng thông tin đ
o. Tuy nhiên, đ hình thành không gian l u tr
thông tin chúng ta c n th c hi n các b
đó là:
c l u gi trên các file d li u
c sau đ i v i b t kì m t file d li u nào,
* Step 1: T p h p các th c th c n qu n tr
* Step 2: T p h p các thu c tính
* Step 3: M i quan h gi a các th c th đ
c qu n tr v i các thu c tính
trong l nh v c đó.
* Step 4: Xây d ng ma tr n t li u
* Step 5: Hình thành s đ t ch c thông tin
Quá trình tìm tin hình th c th c ch t là t p h p các công đo n k thu t và
logic. Vì v y đ phân tích quá trình tìm tin này
ta s l n l
t kh o sát theo 5 ph
trong s đ Thu n,
ng di n sau:
1. Xem cu c tìm đó th c hi n thành bao nhiêu b
(Stages - Steps)
2.
o chúng
c? có nh ng b
c gì?
ng tìm tin? (Retrieval path)
3. Phép tìm đ n v (k thu t, logic - ROU)? m t bao nhiêu ROU? Và
ROU là gì?
4. Công th c t ng quát đ tính cu c tìm đó nh th nào (Fomulate)?
Kh o sát xem tham s gì chi ph i cu c tìm đó?
5.
ánh giá, k t lu n v cu c tìm (Conclusion or Coment)?
3
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
V i 5 b oc đi và 5 ph
ng di n c a quá trình tìm tin chúng ta có th d
dàng kh o sát cu c tìm trên các s đ tìm tin: s đ Thu n (Linear schema), s
đ
o (Invert schema). ó là nh ng đi m gi ng nhau c n b n c a các s đ
KIL
OBO
OKS
.CO
M
tìm tin mà t đó giúp h th ng nh n bi t và truy xu t ra các th c th tho mãn
yêu c u tin c a ng
i dùng.
4
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
2.2. i m khác nhau
Bên c nh nh ng đi m gi ng nhau trong quá trình tìm tin nh trên thì cu c
Schema
o, c ng có nh ng đi m khác nhau c n b n nh sau:
KIL
OBO
OKS
.CO
M
tìm trong 2 file: Thu n,
Linear (File Thu n)
Aspects
1. Conceptual
(B
cý ni m)
Là s
đ
t
Invert (File
ch c thông tin Tj :: = <Ai> n
theo th c th , t c là sau m i
th c th s li t kê các thu c
tính c a th c th đó. Th c th
đây là các tài li u đ
c
ph n ánh. Thu c tính là ch
đ
o)
c a tài li u đ
c rút ra
trong quá trình Indexing.
i = 1, n ; j = Là s đ đ
c
t ch c theo thu c tính, t c
là sau m i thu c tính s li t
kê nh ng th c th
ch a
thu c tính đó.
1, m
Di :: = <TJ> m
i = 1n ; j = 1, m `
2.3. i m khác nhau
Bên c nh nh ng đi m gi ng nhau trong quá trình tìm tin nh trên thì cu c
tìm trong 2 file: Thu n,
Schema
o, c ng có nh ng đi m khác nhau c n b n nh sau:
Linear (File Thu n)
Aspects
5
Invert (File
o)
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
2. Stages
Cu c tỡm ny th c hi n Cu c tỡm ny ph i th c
(B
m t b
c tỡm)
so sỏnh yờu B
c:
c 1: Truy c p vo cỏc
KIL
OBO
OKS
.CO
M
(Tu n t
c tỡm duy nh t hi n 2 b
c u tin v i t ng ti li u i m truy c p cú trong
c qu n tr trong h
th ng.)
bi u
th c
tỡm
point) thu
(access
c cỏc ti
li u theo cỏc i m truy
c p.
B
c 2: Th c hi n phộp
toỏn logic
tỡm ra t p
h p ti li u
c qu n tr
trong h th ng phự h p v i
yờu c u tin c a bi u th c
tỡm.
3. ROU/Path
(B
Th c hi n ROU k thu t
c tỡm n
v)
4. Fomulate
(Cụng th c
t ng quỏt)
Th c hi n ROU k thu t v
ROU logic.
VL = n ROU
VL: T c
VI = (2TQ 1) ROU
cu c tỡm VI: T c cu c tỡm trong
trong file Thu n
file
n: S th c th
o.
c qu n TQ: S thu t ng cú trong
tr trong h th ng.
6
cõu h i tỡm.
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
5. Document
T T1
Matrix
D
li u)
D1
.Tm
Tm
T
D
KIL
OBO
OKS
.CO
M
(Ma tr n t
T1
:
D1
:
:
:
:
:
:
:
:
Dm
:
Dm
T: Thu c tớnh
D: Th c th (Ti li u)
T D: Giỏ tr ma tr n
(Value)
T: Thu c tớnh
D: Th c th (Ti li u)
T D: Giỏ tr ma tr n
(Value)
6. Conclusion
- T c cu c tỡm trong - T c cu c tỡm trong s
or Coment
s
(K t lu n,
thu n ch m vỡ o nhanh h n vỡ cu c
cu c tỡm ph i quột ton tỡm cú nh h
ỏnh giỏ, nh n mi n d li u.
xột)
ng.
- Tớnh h u ớch c a cu c
- Tớnh h u ớch c a cu c tỡm cao.
tỡm khụng cao
Nh v y qua s so sỏnh nh ng c i m gi ng nhau v khỏc nhau c a 2
ph
ng th c tỡm tin trong h th ng thụng tin ta th y r ng: M i ph
tỡm
c th c hi n trờn cỏc s :
ng th c (cu c
o, Thu n.) u cú nh ng u i m v nh
7
c
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
i m nh t nh.
cú m t k t qu cu c tỡm t i u, tho món cỏc yờu c u c a bi
toỏn tỡm tin a ra thỡ tu vo t ng tr
ng h p c th m ta nờn l a ch n ph
th c tỡm tin phự h p nh t. Nh v y s lm gi m i l
ng nhi u tin v m t tin c a
i s d ng v h th ng tỡm tin s
KIL
OBO
OKS
.CO
M
bi toỏn a ra tho món nhu c u tin c a ng
t t i tr ng thỏi lớ t
ng
ng.
II. Vớ d minh ho
Cho bi toỏn tỡm tin sau:
Trong h th ng cú t p h p g m 06 ti li u v i nh ng n i dung, ch
mụ t nh sau:
c
TQ1 :: = <Vi t nam, V n húa, a d ng, Ngụn ng >
TQ2 :: =
i>
TQ3 :: =
i>
TQ4 :: = <Vi t nam, V n húa, Ngụn ng >
TQ5 :: = < a d ng, Con ng
i,
tn
c>
TQ6 :: =
tn
c>
Yờu c u tỡm: Hóy tỡm cỏc ti li u v ngụn ng v con ng
i. Anh (ch )
hóy th c hi n cỏc trỡnh t tỡm tin theo 2 s : Thu n (Linear schema,
schema)
Bi lm
Theo bi ra ta cú khụng gian ti li u nh sau:
Step 1:
T p h p cỏc th c th c n qu n tr
TQ1 :: = <Vi t nam, V n húa, a d ng, Ngụn ng >
TQ2 :: =
i>
TQ3 :: =
i>
TQ4 :: = <Vi t nam, V n húa, Ngụn ng >
TQ5 :: = < a d ng, Con ng
i,
tn
c>
TQ6 :: =
tn
c>
8
o (Invert
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
Các thu c tính, ch đ (subjects)
Step2:
A1 ÷ Vi t nam
A2 ÷ V n hóa
a d ng
KIL
OBO
OKS
.CO
M
A3 ÷
A4 ÷ Ngôn ng
A5 ÷ Con ng
A6 ÷
tn
i
c
Step3: M i quan h gi a các th c th đ
c qu n tr trong h th ng v i các
thu c tính trong l nh v c đó
TQ1 :: = <A1, A2, A3, A4>
TQ2 :: = <A1, A4, A5>
TQ3 :: = <A2, A4, A5>
TQ4 :: = <A1, A2, A4>
TQ5 :: = <A3, A5, A6>
TQ6 :: = <A1, A4, A6>
Step4: Xây d ng ma tr n t li u (Doccument matrix)
A
TQ
TQ1
TQ2
TQ3
TQ4
A1
A2
A3
A4
A5
A6
1
1
1
1
0
0
1
0
0
1
1
0
0
1
0
1
1
0
1
1
0
1
0
0
9
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
TQ6
0
1
0
1
1
0
0
1
0
1
1
KIL
OBO
OKS
.CO
M
TQ5
0
A: T p h p cỏc thu c tớnh
A :: = <A1, A2, A3, A4, A5, A6>
TQ: T p h p cỏc th c th
TQ :: = <TQ1, TQ2, TQ3, TQ4, TQ5, TQ6>
Giỏ tr (Value):
1: Khi th c th ch a thu c tớnh
0: Khi th c th khụng ch a thu c tớnh
* Step5: Hỡnh thnh s t ch c thụng tin
Theo bi yờu c u ta cú 3 s t ch c thụng tin l:
- S Thu n (Linear schema)
-S
o (Invert schema)
Quỏ trỡnh t ch c tỡm tin theo 2 d ng s trờn
sau:
c th c hi n theo trỡnh t
T yờu c u tin c a bi toỏn a ra ta cú cỏc i m truy c p l:
1.
Ngụn ng
2.
Con ng
i
T ú ta xỏc nh
c bi u th c tỡm tin:
Ngụn ng * Con ng
i (hay: A4 * A5)
V i i u ki n bi toỏn nh v y, ta ti n hnh kh o sỏt trờn 5 ph
qu cu i cựng c a cu c tỡm l a ra nh ng th c th
ng di n, k t
c qu n tr trong h th ng
m cú k t qu phự h p v i n i dung c a yờu c u tỡm. Cú ngh a l h th ng ph i a
ra nh ng ti li u m trong ú bao g m nh ng ch l: Ngụn ng - Con ng
10
i.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
1. Tìm tin theo s đ thu n (Linear schema)
Conceptual layer: Cu c tìm trong s đ thu n là đi t th c th đ n thu c
tính, ngh a là sau m i th c th ng
i ta li t kê ra nh ng thu c tính có liên quan.
Yêu c u tìm
A4 * A5
KIL
OBO
OKS
.CO
M
Physical layer:
TQ1
A1, A2, A3, A4
TQ 2
A1, A4, A5
TQ 2, TQ 3
tho mãn
TQ 3
A2, A4, A5
TQ 4
A1, A2, A4
TQ 5
A3, A5, A6
TQ 6
A1, A4, A6
Trình t cu c tìm di n ra nh sau:
Stages: (B
c tìm):
th c hi n cu c tìm này, trong s đ thu n th c hi n vi c tu n t so sánh
n i dung c a bi u th c tìm tin v i t ng tài li u đ
11
c qu n tr trong s đ thu n c a
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
h th ng. Cu c tìm nh v y ch th c hi n m t b
c duy nh t đ thu đ
c k t qu
tho mãn u c u tìm.
Path: (
ng tìm tin)
KIL
OBO
OKS
.CO
M
Tu n t so sánh u c u tìm: A4 *A5 v i t ng th c th trong t p h p TQ: =
< TQ 1, TQ2,… TQ6>
Con đ
ng tìm là s k t n i, s v n đ ng gi a các d li u đ
c qu n tr
trong s đ thu n c a h th ng, đ a đ n k t qu cu i cùng là nh ng t p h p tho
mãn u c u đ bài:
TQ 2 :: = <A1, A4, A5>
TQ 3 :: = <A2, A4, A5>
ROU: (Phép tìm đ n v )
Cu c tìm ch th c hi n các phép tốn k thu t, khơng th c hi n các phép tốn
logic.
V i bi u th c tìm đã cho cu c tìm m t 6 ROU k thu t và 0 ROU logic.
Fomulate: (Cơng th c t ng qt)
VL = n ROU
(n: Là s th c th đ
c qu n tr trong h th ng)
Nhân t quy t đ nh, chi ph i t c đ tìm trong s đ thu n là s l
th c th đ
c qu n tr trong h th ng. Do v y v i 06 th c th đ
ng các
c qu n tr trong
h th ng thì cu c tìm trong s đ thu n m t 6 ROU k thu t.
Conclusion or coment: (Nh n xét, đánh giá)
Trình t tìm tin trong s đ thu n đ a đ n k t c c đ
khơng gian d li u đ
c x y ra trong tồn b
c l u gi , qu n tr trong h th ng.
Nh v y, rõ ràng ngu n d li u trong khi th c hi n cu c tìm tin khơng tr c
ti p, khơng liên quan đ n câu h i tìm, đi u này làm gi m đi h s h u ích trong
khơng gian tìm tin t i s đ thu n. Và h qu c a nó là làm cho cu c tìm di n ra
m t cách ch m ch p, chi phí cho các ROU c n thi t cho vi c tìm c th là r t l n.
Chính vì v y mà hi u qu tìm tin trong s đ thu n là r t th p.
c i thi n cu c tìm tin trong s đ thu n, có các gi i pháp sau:
12
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
- Tác đ ng vào không gian tìm tin b ng cách phân giã s đ thu n thành các
s đ con
- Tác đ ng vào mi n áp d ng c a c quan thông tin. Thông th
c áp d ng trong khu v c, l nh v c mà nhu c u, m c đ , c
thông tin cao.
KIL
OBO
OKS
.CO
M
đ
2. Tìm tin trong s đ
ng th
ng
ng đ tìm ki m
o (Invert schema)
Conceptual layer: S đ đ o là s đ đ c t ch c theo thu c tính, t c là sau
m i thu c tính s li t kê các th c th c a thu c tính đó.
Physical layer:
13
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
Yờu c u tỡm
A4*A5
A1
TQ 1, TQ 2,
TQ 4, TQ 6
A4 *A5
TQ 1, TQ 3
TQ1
TQ 4
TQ2
TQ 1,TQ 5
TQ3
KIL
OBO
OKS
.CO
M
A2
Bi u th c tỡm:
A3
TQ4
A4
TQ 1, TQ 2, TQ3
TQ6
TQ 2
TQ4, TQ6
A5
A6
TQ 3
TQ 2, TQ 3,
TQ 5
TQ2
TQ 5, TQ 6
TQ3
Tho món
TQ5
Trỡnh t cu c tỡm di n ra nh sau:
Stages: (B
c tỡm):
Cu c tỡm trong s o
B
c
c 1: Thụng qua vi c truy c p vo s o theo cỏc i m truy c p cú
trong bi u th c tỡm, ta s thu
B
c th c hi n chia thnh 2 b
c cỏc t p h p ti li u theo yờu c u.
c 2: Tu n t th c hi n cỏc phộp toỏn logic ta s thu
cựng l t p h p k t qu ch a nh ng ti li u
v i yờu c u tỡm.
Path: (
c t p h p cu i
c qu n tr trong h th ng phự h p
ng tỡm tin)
Th c hi n truy c p vo cỏc thu t ng (access points) t i khụng gian tỡm trong
s o ta thu
c 3 t p h p sau:
- T p h p v Ngụn ng :
A4 :: = < TQ1,TQ2, TQ3, TQ4, TQ6>
- T p h p v Con ng
i:
14
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
A5 :: = < TQ 2, TQ 3, TQ 5>
Th c hi n cỏc phộp toỏn logic trờn 2 t p h p ti li u thu
c
trờn ta
c
k t qu tho món yờu c u bi toỏn l 2 th c th : TQ2, TQ3.
KIL
OBO
OKS
.CO
M
Ta cú s Venn c a quỏ trỡnh tỡm tin trong s
Ngụn ng * con ng
Con ng
o:
i (A4 * A5)
i
Ngụn ng
ROU: (Phộp tỡm n v )
th c hi n cu c tỡm trong s o c n cú 2 phộp tỡm d n v (2 lo i
ROU). C th :
b
c 1: C n 2 ROU k thu t
b
c 2: C n 1 ROU logic
Nh v y ta m t 3 ROU cho cu c tỡm ny trong s o.
Fomulate: (Cụng th c t ng qu t)
VI = (2TQ - 1)ROU
TQ: Thu t ng ch
Cu c tỡm trong s
o b chi ph i b i tham s TQ, m TQ ph n ỏnh s
thu t ng ch cú trong bi u th c tỡm tin. Nh v y:
VI =(2*2 1) ROU = 3 ROU
15
THệ VIEN ẹIEN Tệ TRệẽC TUYEN
Conclusion or coment: ( ỏnh giỏ, nh n xột)
Cu c tỡm trong s d o
c th c hi n khụng ph i trờn ton b mi n d
h
KIL
OBO
OKS
.CO
M
li u c a khụng gian tỡm m h th ng qu n tr . B ng th phỏp truy c p cú nh
ng theo yờu c u c a ng
i dựng tin, khụng gian th c t c a s o ch x y ra
trờn cỏc mi n h n ch m cú n i dung tr c ti p liờn i t i ch ng
quan tõm. Do ú tớnh h u ớch cu c tỡm r t cao, t c tỡm
v i s Thu n.
16
i dựng tin
c c i thi n ỏng k so
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K T THÚC V N
Ê
Qua vi c phân tích, so sánh ví d trên ta th y thông tin (information) đóng
m t vai trò r t quan tr ng và h u ích trong cu c s ng. Thông tin làm cho con
i tr nên nhanh nh y và xích l i gân nhau h n.Vi c n m b t thông tin m t
KIL
OBO
OKS
.CO
M
ng
cách nhanh nh y s
mang đ n nh ng thành công tiên phong trong m i l nh v c
,m i th i đ i.Giúp con ng
i luôn n m b t đ
c nh ng đ i thay nhanh chóng c a
th i đ i,làm ch b n thân, làm ch xã h i. Vì v y vi c phát hi n và thành l p ra b
môn thông tin đã đánh d u m t b
tin ngày nay, mang l i hi u qu
c đ t phá r t l n trong th i đ i bùng n thông
ng d ng cao trong th c ti n và cu c s ng
17
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
M CL C
N I DUNG V N
............................................................................................ 2
I. So sánh quá trình tìm tin trong s đ thu n (Linear schema), s đ đ o
KIL
OBO
OKS
.CO
M
(Invert schema)................................................................................................... 3
2.1. i m gi ng nhau ..................................................................................... 3
2.2. i m khác nhau....................................................................................... 5
2.3. i m khác nhau....................................................................................... 5
II. Ví d minh ho .............................................................................................. 8
1. Tìm tin theo s đ thu n (Linear schema) ............................................... 11
2. Tìm tin trong s đ
K T THÚC V N
o (Invert schema) ............................................... 13
Ê .......................................................................................... 17
18