Tải bản đầy đủ (.pdf) (19 trang)

Phân tích so sánh quá trình tìm tin trong sơ đồ thuận và sơ đồ đảo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (334.86 KB, 19 trang )


THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
i H c Qu c Gia Hà N i
Tr

ng

i H c Khoa H c Xã H i Và Nhân V n

OBO
OK S
.CO
M

Khoa Thông tin th vi n
---------------

Bài ki m tra gi a k

Môn: Quá trình h th ng thông tin

KIL

Phân tích so sánh quá trình tìm tin trong s đ thu n và s đ đ o

0



THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
TV N


Hi n nay khi n n kinh t càng phát tri n, kéo theo đó là s phát tri n c a
có đ

KIL
OBO
OKS
.CO
M

n n khoa h c công ngh và s n m b t thông tin m t cách nhanh nh y.Ch khi
c nh ng đi u đó chúng ta m i làm ch

công .Ng

i ta th

ng nói ng

đ

c m i th ,làm ch s thành

i có thông tin là ng

i chi m l nh s chi n

th ng.Trong xã h i ngày nay vi c n m gi thông tin là m t đi u h t s c c n
thi t và quan tr ng,b i có nh th chúng ta m i làm ch đ
nhanh chóng c a xã h i thông tin trong th i đ i ngày nay


1

c s phát tri n



THệ VIEN ẹIEN Tệ TRệẽC TUYEN
N i Dung V n
th c hi n

c quỏ trỡnh tỡm tin hỡnh th c hoỏ c n cú 3 ti n sau:

KIL
OBO
OKS
.CO
M

* Cú m t khụng gian tỡm tin

L c u trỳc cú t ch c l u gi cỏc th c th , i t

ng thụng tin

c qu n

tr trong h th ng nh sỏch, bỏo, t p chớ, bi trớch, lu n ỏn, lu n v n
gi cỏc i t

l u


ng thụng tin ny, t ch c l u gi trờn cỏc file d li u khỏc nhau:

+ File thu n
+ File o

+ File kộp

hỡnh thnh khụng gian l u tr thụng tin c n:
+ T p h p cỏc th c th c n qu n tr
+ T p h p cỏc thu c tớnh

+ M i quan h gi a t ng th c th
l nh v c ú

c qu n tr v i cỏc thu c tớnh trong

+ Xõy d ng ma tr n t li u

+ Hỡnh thnh s t ch c thụng tin
* Cú cõu h i tỡm

tỡm ki m thụng tin trong h th ng tỡm ki m ũi h i ph i cú nh h

ng

cu c tỡm, th hi n qua cỏc cõu h i tỡm.
Cõu h i tỡm c a ng

i dựng tin l s bi u t b ng l i ho c m t v n b n


c p n nh ng ch m ng
truy c p

i dựng tin quan tõm.

õy chớnh l cỏc i m

c th c hi n trong quỏ trỡnh tỡm ki m v so sỏnh.

M t cõu h i tỡm cú th cú m t hay nhi u i m truy c p. Trong tr

ng h p

cú m t i m truy c p thỡ cõu tr l i n gi n. Khi s i m truy c p cú t hai tr
lờn thỡ cõu h i tỡm ph c t p. Trong tr

ng h p ny, cỏc i m truy c p ph i k t

n i v i nhau thụng qua toỏn t logic.
* Th t c so sỏnh ng ngh a

2



THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
Quá trình tìm tin là quá trình thu n tuý mang tính k thu t, so sánh d u
hi u c a th c th này v i th c th khác ho c so sánh t p h p d u hi u c a thông
tin này v i t p h p d u hi u c a thông tin khác


KIL
OBO
OKS
.CO
M

Qua vi c phân tích,so sánh 2 ví d sau chúng ta s hi u rõ v n đ :
I. So sánh quá trình tìm tin trong s đ thu n (Linear schema), s đ
đ o (Invert schema)

2.1. i m gi ng nhau

Nh ta đã bi t, các đ i t
khác nhau: File Thu n, file

ng thông tin đ

o. Tuy nhiên, đ hình thành không gian l u tr

thông tin chúng ta c n th c hi n các b
đó là:

c l u gi trên các file d li u

c sau đ i v i b t kì m t file d li u nào,

* Step 1: T p h p các th c th c n qu n tr
* Step 2: T p h p các thu c tính


* Step 3: M i quan h gi a các th c th đ

c qu n tr v i các thu c tính

trong l nh v c đó.

* Step 4: Xây d ng ma tr n t li u

* Step 5: Hình thành s đ t ch c thông tin

Quá trình tìm tin hình th c th c ch t là t p h p các công đo n k thu t và
logic. Vì v y đ phân tích quá trình tìm tin này
ta s l n l

t kh o sát theo 5 ph

trong s đ Thu n,

ng di n sau:

1. Xem cu c tìm đó th c hi n thành bao nhiêu b
(Stages - Steps)
2.

o chúng

c? có nh ng b

c gì?


ng tìm tin? (Retrieval path)

3. Phép tìm đ n v (k thu t, logic - ROU)? m t bao nhiêu ROU? Và
ROU là gì?

4. Công th c t ng quát đ tính cu c tìm đó nh th nào (Fomulate)?
Kh o sát xem tham s gì chi ph i cu c tìm đó?
5.

ánh giá, k t lu n v cu c tìm (Conclusion or Coment)?

3



THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
V i 5 b oc đi và 5 ph

ng di n c a quá trình tìm tin chúng ta có th d

dàng kh o sát cu c tìm trên các s đ tìm tin: s đ Thu n (Linear schema), s
đ

o (Invert schema). ó là nh ng đi m gi ng nhau c n b n c a các s đ

KIL
OBO
OKS
.CO
M


tìm tin mà t đó giúp h th ng nh n bi t và truy xu t ra các th c th tho mãn
yêu c u tin c a ng

i dùng.

4



THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
2.2. i m khác nhau
Bên c nh nh ng đi m gi ng nhau trong quá trình tìm tin nh trên thì cu c

Schema

o, c ng có nh ng đi m khác nhau c n b n nh sau:

KIL
OBO
OKS
.CO
M

tìm trong 2 file: Thu n,

Linear (File Thu n)

Aspects


1. Conceptual
(B

cý ni m)

Là s

đ

t

Invert (File

ch c thông tin Tj :: = <Ai> n

theo th c th , t c là sau m i

th c th s li t kê các thu c

tính c a th c th đó. Th c th
đây là các tài li u đ

c

ph n ánh. Thu c tính là ch
đ

o)

c a tài li u đ


c rút ra

trong quá trình Indexing.

i = 1, n ; j = Là s đ đ

c

t ch c theo thu c tính, t c
là sau m i thu c tính s li t
kê nh ng th c th

ch a

thu c tính đó.

1, m

Di :: = <TJ> m

i = 1n ; j = 1, m `

2.3. i m khác nhau

Bên c nh nh ng đi m gi ng nhau trong quá trình tìm tin nh trên thì cu c
tìm trong 2 file: Thu n,
Schema

o, c ng có nh ng đi m khác nhau c n b n nh sau:


Linear (File Thu n)

Aspects
5

Invert (File

o)



THệ VIEN ẹIEN Tệ TRệẽC TUYEN

2. Stages

Cu c tỡm ny th c hi n Cu c tỡm ny ph i th c

(B

m t b

c tỡm)

so sỏnh yờu B

c:

c 1: Truy c p vo cỏc


KIL
OBO
OKS
.CO
M

(Tu n t

c tỡm duy nh t hi n 2 b

c u tin v i t ng ti li u i m truy c p cú trong


c qu n tr trong h

th ng.)

bi u

th c

tỡm

point) thu

(access
c cỏc ti

li u theo cỏc i m truy
c p.


B

c 2: Th c hi n phộp

toỏn logic

tỡm ra t p

h p ti li u

c qu n tr

trong h th ng phự h p v i

yờu c u tin c a bi u th c
tỡm.

3. ROU/Path
(B

Th c hi n ROU k thu t

c tỡm n

v)
4. Fomulate
(Cụng th c
t ng quỏt)


Th c hi n ROU k thu t v
ROU logic.

VL = n ROU
VL: T c

VI = (2TQ 1) ROU

cu c tỡm VI: T c cu c tỡm trong

trong file Thu n

file

n: S th c th

o.

c qu n TQ: S thu t ng cú trong

tr trong h th ng.

6

cõu h i tỡm.



THệ VIEN ẹIEN Tệ TRệẽC TUYEN
5. Document

T T1

Matrix
D

li u)

D1

.Tm



Tm

T
D

KIL
OBO
OKS
.CO
M

(Ma tr n t

T1

:


D1

:

:

:

:

:

:

:

:

Dm

:

Dm

T: Thu c tớnh

D: Th c th (Ti li u)
T D: Giỏ tr ma tr n
(Value)


T: Thu c tớnh
D: Th c th (Ti li u)
T D: Giỏ tr ma tr n
(Value)

6. Conclusion

- T c cu c tỡm trong - T c cu c tỡm trong s

or Coment

s

(K t lu n,



thu n ch m vỡ o nhanh h n vỡ cu c

cu c tỡm ph i quột ton tỡm cú nh h

ỏnh giỏ, nh n mi n d li u.
xột)

ng.

- Tớnh h u ớch c a cu c

- Tớnh h u ớch c a cu c tỡm cao.
tỡm khụng cao


Nh v y qua s so sỏnh nh ng c i m gi ng nhau v khỏc nhau c a 2
ph

ng th c tỡm tin trong h th ng thụng tin ta th y r ng: M i ph

tỡm

c th c hi n trờn cỏc s :

ng th c (cu c

o, Thu n.) u cú nh ng u i m v nh
7

c



THệ VIEN ẹIEN Tệ TRệẽC TUYEN
i m nh t nh.

cú m t k t qu cu c tỡm t i u, tho món cỏc yờu c u c a bi

toỏn tỡm tin a ra thỡ tu vo t ng tr

ng h p c th m ta nờn l a ch n ph

th c tỡm tin phự h p nh t. Nh v y s lm gi m i l


ng nhi u tin v m t tin c a

i s d ng v h th ng tỡm tin s

KIL
OBO
OKS
.CO
M

bi toỏn a ra tho món nhu c u tin c a ng
t t i tr ng thỏi lớ t

ng

ng.

II. Vớ d minh ho

Cho bi toỏn tỡm tin sau:

Trong h th ng cú t p h p g m 06 ti li u v i nh ng n i dung, ch
mụ t nh sau:

c

TQ1 :: = <Vi t nam, V n húa, a d ng, Ngụn ng >
TQ2 :: =
i>


TQ3 :: =
i>

TQ4 :: = <Vi t nam, V n húa, Ngụn ng >
TQ5 :: = < a d ng, Con ng

i,

tn

c>

TQ6 :: =
tn

c>

Yờu c u tỡm: Hóy tỡm cỏc ti li u v ngụn ng v con ng

i. Anh (ch )

hóy th c hi n cỏc trỡnh t tỡm tin theo 2 s : Thu n (Linear schema,
schema)

Bi lm

Theo bi ra ta cú khụng gian ti li u nh sau:

Step 1:

T p h p cỏc th c th c n qu n tr

TQ1 :: = <Vi t nam, V n húa, a d ng, Ngụn ng >
TQ2 :: =
i>

TQ3 :: =
i>

TQ4 :: = <Vi t nam, V n húa, Ngụn ng >
TQ5 :: = < a d ng, Con ng

i,

tn

c>

TQ6 :: =
tn

c>

8


o (Invert



THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
Các thu c tính, ch đ (subjects)

Step2:

A1 ÷ Vi t nam
A2 ÷ V n hóa
a d ng

KIL
OBO
OKS
.CO
M

A3 ÷

A4 ÷ Ngôn ng
A5 ÷ Con ng
A6 ÷

tn

i

c


Step3: M i quan h gi a các th c th đ

c qu n tr trong h th ng v i các

thu c tính trong l nh v c đó

TQ1 :: = <A1, A2, A3, A4>
TQ2 :: = <A1, A4, A5>
TQ3 :: = <A2, A4, A5>
TQ4 :: = <A1, A2, A4>
TQ5 :: = <A3, A5, A6>
TQ6 :: = <A1, A4, A6>

Step4: Xây d ng ma tr n t li u (Doccument matrix)

A
TQ

TQ1

TQ2

TQ3

TQ4

A1

A2


A3

A4

A5

A6

1

1

1

1

0

0

1

0

0

1

1


0

0

1

0

1

1

0

1

1

0

1

0

0

9




THệ VIEN ẹIEN Tệ TRệẽC TUYEN

TQ6

0

1

0

1

1

0

0

1

0

1

1

KIL
OBO
OKS

.CO
M

TQ5

0

A: T p h p cỏc thu c tớnh

A :: = <A1, A2, A3, A4, A5, A6>
TQ: T p h p cỏc th c th

TQ :: = <TQ1, TQ2, TQ3, TQ4, TQ5, TQ6>
Giỏ tr (Value):

1: Khi th c th ch a thu c tớnh

0: Khi th c th khụng ch a thu c tớnh

* Step5: Hỡnh thnh s t ch c thụng tin

Theo bi yờu c u ta cú 3 s t ch c thụng tin l:
- S Thu n (Linear schema)
-S

o (Invert schema)

Quỏ trỡnh t ch c tỡm tin theo 2 d ng s trờn
sau:


c th c hi n theo trỡnh t

T yờu c u tin c a bi toỏn a ra ta cú cỏc i m truy c p l:
1.

Ngụn ng

2.

Con ng

i

T ú ta xỏc nh

c bi u th c tỡm tin:

Ngụn ng * Con ng

i (hay: A4 * A5)

V i i u ki n bi toỏn nh v y, ta ti n hnh kh o sỏt trờn 5 ph
qu cu i cựng c a cu c tỡm l a ra nh ng th c th

ng di n, k t

c qu n tr trong h th ng

m cú k t qu phự h p v i n i dung c a yờu c u tỡm. Cú ngh a l h th ng ph i a
ra nh ng ti li u m trong ú bao g m nh ng ch l: Ngụn ng - Con ng


10

i.



THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
1. Tìm tin theo s đ thu n (Linear schema)
Conceptual layer: Cu c tìm trong s đ thu n là đi t th c th đ n thu c
tính, ngh a là sau m i th c th ng

i ta li t kê ra nh ng thu c tính có liên quan.

Yêu c u tìm
A4 * A5

KIL
OBO
OKS
.CO
M

Physical layer:

TQ1

A1, A2, A3, A4

TQ 2


A1, A4, A5

TQ 2, TQ 3
tho mãn

TQ 3

A2, A4, A5

TQ 4

A1, A2, A4

TQ 5

A3, A5, A6

TQ 6

A1, A4, A6

Trình t cu c tìm di n ra nh sau:
Stages: (B

c tìm):

th c hi n cu c tìm này, trong s đ thu n th c hi n vi c tu n t so sánh
n i dung c a bi u th c tìm tin v i t ng tài li u đ
11


c qu n tr trong s đ thu n c a



THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
h th ng. Cu c tìm nh v y ch th c hi n m t b

c duy nh t đ thu đ

c k t qu

tho mãn u c u tìm.
Path: (

ng tìm tin)

KIL
OBO
OKS
.CO
M

Tu n t so sánh u c u tìm: A4 *A5 v i t ng th c th trong t p h p TQ: =
< TQ 1, TQ2,… TQ6>
Con đ

ng tìm là s k t n i, s v n đ ng gi a các d li u đ

c qu n tr


trong s đ thu n c a h th ng, đ a đ n k t qu cu i cùng là nh ng t p h p tho
mãn u c u đ bài:

TQ 2 :: = <A1, A4, A5>
TQ 3 :: = <A2, A4, A5>

ROU: (Phép tìm đ n v )

Cu c tìm ch th c hi n các phép tốn k thu t, khơng th c hi n các phép tốn
logic.

V i bi u th c tìm đã cho cu c tìm m t 6 ROU k thu t và 0 ROU logic.
Fomulate: (Cơng th c t ng qt)
VL = n ROU

(n: Là s th c th đ

c qu n tr trong h th ng)

Nhân t quy t đ nh, chi ph i t c đ tìm trong s đ thu n là s l
th c th đ

c qu n tr trong h th ng. Do v y v i 06 th c th đ

ng các

c qu n tr trong

h th ng thì cu c tìm trong s đ thu n m t 6 ROU k thu t.

Conclusion or coment: (Nh n xét, đánh giá)

Trình t tìm tin trong s đ thu n đ a đ n k t c c đ
khơng gian d li u đ

c x y ra trong tồn b

c l u gi , qu n tr trong h th ng.

Nh v y, rõ ràng ngu n d li u trong khi th c hi n cu c tìm tin khơng tr c
ti p, khơng liên quan đ n câu h i tìm, đi u này làm gi m đi h s h u ích trong
khơng gian tìm tin t i s đ thu n. Và h qu c a nó là làm cho cu c tìm di n ra
m t cách ch m ch p, chi phí cho các ROU c n thi t cho vi c tìm c th là r t l n.
Chính vì v y mà hi u qu tìm tin trong s đ thu n là r t th p.
c i thi n cu c tìm tin trong s đ thu n, có các gi i pháp sau:
12



THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
- Tác đ ng vào không gian tìm tin b ng cách phân giã s đ thu n thành các
s đ con
- Tác đ ng vào mi n áp d ng c a c quan thông tin. Thông th
c áp d ng trong khu v c, l nh v c mà nhu c u, m c đ , c

thông tin cao.

KIL
OBO
OKS

.CO
M

đ

2. Tìm tin trong s đ

ng th

ng

ng đ tìm ki m

o (Invert schema)
Conceptual layer: S đ đ o là s đ đ c t ch c theo thu c tính, t c là sau

m i thu c tính s li t kê các th c th c a thu c tính đó.
Physical layer:

13



THệ VIEN ẹIEN Tệ TRệẽC TUYEN
Yờu c u tỡm
A4*A5

A1

TQ 1, TQ 2,

TQ 4, TQ 6

A4 *A5

TQ 1, TQ 3

TQ1

TQ 4

TQ2

TQ 1,TQ 5

TQ3

KIL
OBO
OKS
.CO
M

A2

Bi u th c tỡm:

A3

TQ4


A4

TQ 1, TQ 2, TQ3

TQ6

TQ 2

TQ4, TQ6

A5

A6

TQ 3

TQ 2, TQ 3,
TQ 5

TQ2

TQ 5, TQ 6

TQ3

Tho món

TQ5

Trỡnh t cu c tỡm di n ra nh sau:

Stages: (B

c tỡm):

Cu c tỡm trong s o
B

c

c 1: Thụng qua vi c truy c p vo s o theo cỏc i m truy c p cú

trong bi u th c tỡm, ta s thu
B

c th c hi n chia thnh 2 b

c cỏc t p h p ti li u theo yờu c u.

c 2: Tu n t th c hi n cỏc phộp toỏn logic ta s thu

cựng l t p h p k t qu ch a nh ng ti li u
v i yờu c u tỡm.
Path: (

c t p h p cu i

c qu n tr trong h th ng phự h p

ng tỡm tin)


Th c hi n truy c p vo cỏc thu t ng (access points) t i khụng gian tỡm trong
s o ta thu

c 3 t p h p sau:

- T p h p v Ngụn ng :

A4 :: = < TQ1,TQ2, TQ3, TQ4, TQ6>
- T p h p v Con ng

i:
14



THệ VIEN ẹIEN Tệ TRệẽC TUYEN
A5 :: = < TQ 2, TQ 3, TQ 5>
Th c hi n cỏc phộp toỏn logic trờn 2 t p h p ti li u thu

c

trờn ta

c

k t qu tho món yờu c u bi toỏn l 2 th c th : TQ2, TQ3.

KIL
OBO
OKS

.CO
M

Ta cú s Venn c a quỏ trỡnh tỡm tin trong s
Ngụn ng * con ng

Con ng

o:

i (A4 * A5)

i

Ngụn ng

ROU: (Phộp tỡm n v )

th c hi n cu c tỡm trong s o c n cú 2 phộp tỡm d n v (2 lo i
ROU). C th :
b

c 1: C n 2 ROU k thu t

b

c 2: C n 1 ROU logic

Nh v y ta m t 3 ROU cho cu c tỡm ny trong s o.
Fomulate: (Cụng th c t ng qu t)

VI = (2TQ - 1)ROU

TQ: Thu t ng ch
Cu c tỡm trong s

o b chi ph i b i tham s TQ, m TQ ph n ỏnh s

thu t ng ch cú trong bi u th c tỡm tin. Nh v y:
VI =(2*2 1) ROU = 3 ROU
15



THệ VIEN ẹIEN Tệ TRệẽC TUYEN

Conclusion or coment: ( ỏnh giỏ, nh n xột)
Cu c tỡm trong s d o

c th c hi n khụng ph i trờn ton b mi n d

h

KIL
OBO
OKS
.CO
M

li u c a khụng gian tỡm m h th ng qu n tr . B ng th phỏp truy c p cú nh
ng theo yờu c u c a ng


i dựng tin, khụng gian th c t c a s o ch x y ra

trờn cỏc mi n h n ch m cú n i dung tr c ti p liờn i t i ch ng
quan tõm. Do ú tớnh h u ớch cu c tỡm r t cao, t c tỡm
v i s Thu n.

16

i dựng tin

c c i thi n ỏng k so



THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K T THÚC V N

Ê

Qua vi c phân tích, so sánh ví d trên ta th y thông tin (information) đóng
m t vai trò r t quan tr ng và h u ích trong cu c s ng. Thông tin làm cho con
i tr nên nhanh nh y và xích l i gân nhau h n.Vi c n m b t thông tin m t

KIL
OBO
OKS
.CO
M


ng

cách nhanh nh y s

mang đ n nh ng thành công tiên phong trong m i l nh v c

,m i th i đ i.Giúp con ng

i luôn n m b t đ

c nh ng đ i thay nhanh chóng c a

th i đ i,làm ch b n thân, làm ch xã h i. Vì v y vi c phát hi n và thành l p ra b
môn thông tin đã đánh d u m t b
tin ngày nay, mang l i hi u qu

c đ t phá r t l n trong th i đ i bùng n thông

ng d ng cao trong th c ti n và cu c s ng

17



THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
M CL C
N I DUNG V N

............................................................................................ 2


I. So sánh quá trình tìm tin trong s đ thu n (Linear schema), s đ đ o

KIL
OBO
OKS
.CO
M

(Invert schema)................................................................................................... 3
2.1. i m gi ng nhau ..................................................................................... 3
2.2. i m khác nhau....................................................................................... 5
2.3. i m khác nhau....................................................................................... 5
II. Ví d minh ho .............................................................................................. 8
1. Tìm tin theo s đ thu n (Linear schema) ............................................... 11
2. Tìm tin trong s đ
K T THÚC V N

o (Invert schema) ............................................... 13

Ê .......................................................................................... 17

18



×