tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 115 - 0112398 – T Th Ngc Thanh
24 Information
processing
9 7
25 Natural language
processing
10 8
26 Sofrware 12 6
27 Freeware 7 2
28 Shareware 7 2
29 Virus 6 0
30 Norton antivirus 5 0
31 Graphic 5 3
32 Picture 9 7
33 Artwork 15 7
34 Art school 100 90
35 Artist 12 3
36 Gallery 19 17
37 Museum 19 8
38 Clip art 100 90
39 Painting 36 27
40 Landscape 11 6
41 Portrait 10 7
Bng 10 Các câu truy v(n th nghi&m
Kt qu thng kê truy v(n theo t"ng l!nh v#c:
Công thc thng kê:
chính xác c$a l nh vc = trung bình cng(phn trm chính xác c$a tng t
trong l nh vc ó).
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 116 - 0112398 – T Th Ngc Thanh
Computer & information science:
STT Tên l!nh v#c chính xác
1 Programming 87%
2 Data 57%
3 Security 93%
4 Computer science 65%
5 Internet 67%
6 Computer 26%
7 Information science 21%
8 Software 64%
9 Virus 100%
Bng 11 Thng kê l!nh v#c khoa h)c máy tính
Art:
STT Tên l!nh v#c chính xác
1 Art and artwork 10%
2 Artist 75%
3 Gallery 11%
4 Museum 58%
5 Art school 10%
6 Painting 25%
8 Music 70%
9 Music style 65%
Bng 12 Thng kê l!nh v#c ngh& thu*t.
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 117 - 0112398 – T Th Ngc Thanh
Nh*n xét:
- 7ng d!ng ch& xây dng trên hai l nh vc là ngh thut và khoa hc máy
tính nên mi tài liu a vào u c phân vào mt trong hai l nh vc
này do ó làm gim i chính xác.
- S tài liu tr v cho mi t trong cùng mt lp con trong ontology là
không b0ng nhau do phng pháp x% lí câu truy v#n là: l#y nhng tài
liu trong cùng lp con c$a ontology và 1ng thi l#y nhng tài liu có
t khoá có trong vi t khoá c$a câu truy v#n.
- chính xác trong vic phân loi tài liu theo tng lp con cha cao do
các lp con trong ontology thit k cha y $, cha bao hàm ht các
khái nim trong mt l nh vc và s t trong mt l nh vc cha nhiu và
y $.
- M"t khác, chính xác trong vic phân loi c$a tài liu còn b nh
hng do s lng t c$a ni dung trong tài liu ít (tài liu ch& cha a
s là các hyperlink và các hình nh).
- L nh vc ngh thut có chính xác th#p do các t trong mi lp con
c$a ontology không c phân bit rõ ràng, mt t có th n0m nhiu
lp và s lng t ít.
Tóm li, chng trình ng d!ng t hiu qu tt trong vic phân loi tài liu
theo l nh vc ln, còn i vi tng lp con trong mi l nh vc thì hiu qu cha cao.
Ngi qun tr có th nâng cao hiu qu c$a chng trình b0ng cách xây dng t#t c
các l nh vc trong thc t, b. sung các t trong tng lp con c$a mi l nh vc theo xu
hng càng nhiu t "c trng cho lp càng tt (mc cô lp gia các lp càng cao).
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 118 - 0112398 – T Th Ngc Thanh
Chng 5 : KT LUN
5.1. ánh giá kt qu nghiên c'u
5.1.1. u i6m
V c bn lun vn ã thc hin tt các ni dung ra và t c mt s kt
qu nh#t nh :
o Lun vn ã trình bày c s lý thuyt v nguyên lý vn hành c/ng
nh u và khuyt im c$a mt h thng search engine.
o Lun vn trình bày rõ mô hình Web ng ngh a cùng vi các i
tng c$a nó nh RDF, OWL, …
o Trình bày các v#n v ng ngh a c/ng nh các hng gii quyt
trong vic x% lí ngôn ng t nhiên nh0m giúp máy tính “hiu” c
câu h2i c$a ngi dùng.
o T nhng c s nghiên cu lí thuyt, lun vn ã ra mô hình cho
vic xây dng công c! tìm kim ng ngh a, và thc hin cài "t mt
công c! tìm kim các tài liu in t% phù hp vi ng ngh a c$a câu
truy v#n c$a ngi dùng.
o Lun vn có th xác nh tng i chính xác l nh vc mà tài liu
thuc v. Và phn nào xác nh c l nh vc c$a câu truy v#n c$a
ngi dùng.
Ý ngh a thc ti-n:
Tìm hiu mô hình, nm vng công ngh tìm kim ng ngh a
áp d!ng chi ting Vit.
Ý ngh a khoa hc:
ây là công c! ph!c v! cho nhu cu phân loi vn bn, phân loi
tài liu hc tp.
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 119 - 0112398 – T Th Ngc Thanh
5.1.2. Khuyt i6m:
Tuy nhiên, do v#n v ng ngh a là mt v#n phc tp và rng ln nên lun
vn ch& ra mt s hng nghiên cu hin nay mt s l nh vc hu hn, không th
bao hàm ht c các khái nim c/ng nh ngôn ng c$a con ngi.
Nhng v#n c xu#t trong lun vn nh0m m!c ích a ra mt hng
gii quyt mang tính ch#t tham kho nên có th s* có nhiu im cha ti u, cn
c hoàn thin hn.
Trong chng trình ng d!ng, lun vn s% d!ng c s d liu các t "c trng
cho t l nh vc, c s d liu này c xây dng ch$ yu da vào WordNet, song vn
còn hn ch v s lng các t riêng cho tng chuyên ngành. Nu câu truy v#n c$a
ngi dùng h2i v nhng t không n0m trong c s d liu thì có th s* không tìm
th#y kt qu. Và vic phân loi các t l nh vc mang tính ch$ quan nên có th cha ti
u.
Vic phân loi tài liu theo l nh vc tng i tt do có s lng t khá nhiu
nhng vic phân loi câu truy v#n c$a ngi dùng, s% d!ng mt lng t r#t ít nên có
mt s câu truy v#n không có kt qu tr v.
Ngoài ra, lun vn ch& s% d!ng c s d liu các tài liu lu s6n v trên máy ch$ nên
s lng các tài liu cha ln.
5.2. Hng phát tri6n
Chng trình ng d!ng c$a lun vn c xây dng da trên nhng v#n c
bn, song nó có th phát trin ngày càng hoàn thin và ti u hn. Nhng hng
phát trin c$a lun vn:
- M rng tìm kim trong t#t c các l nh vc.
- Tìm kim trên nhiu ontology, phân loi ontology.
- Thc s tìm kim online.
- 7ng d!ng cho Ting Vit.
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 120 - 0112398 – T Th Ngc Thanh
TÀI LIU THAM KHO
I. Lu*n v8n, lu*n án:
[I.1] "ng Th Qu3nh Chi. Lun vn thc s tin hc. Nghiên c'u v mô hình,
khám phá và khai thác các mi quan h& trên web ng% ngh!a, xây d#ng 'ng
dng. Ngi hng dn khoa hc: Nguy-n Tin D/ng.
[I.2] Lê Thuý Ngc, M Nhung. Lun vn c% nhân tin hc. Tìm hi6u v
Search Engine và xây d#ng 'ng dng minh ho4 cho Search Engine ting
Vi&t. GVHD: Nguy-n Th Di-m Tiên.
II. Sách, eBooks:
[II.1] Ying Ding, Dieter Fensel, Michel Klein, and Borys Omelayenko. The
Semantic Web: Yet another Hip?. Data and knowedgle engineering, 2002.
[II.2] Eero Hyvonen. Semantic web Kick – off in Finland vision, Technologies,
Research, and Applications; May 19, 2002 .
[II.3] inh in, Giáo trình X% Lý Ngôn Ng T Nhiên, tháng 12/2004.
[II.4] Dr. V. Richard Benjamins, Jesús Contreras; Six challenges for the
semantic web; April 2002.
[II.5] Nicola Guarino; Some Ontological Principles for Designing Upper
Level Lexical Resources; 28 – 30 May 1998.
[II.6] Urvi Shah, Tim Finin, Anupam Joshi, R. Scott Cost, James Mayfield;
Information Retrieval on the Semantic Web
*
.
[II.7] Luke K. McDowell; Meaning for the Masses: Theory and Applications
for Semantic Web and Semantic Email Systems; 2004.
[II.8] Gareth Osler;The Semantic Web Through Semantic Data – A Four Tier
Architecture Model ; 4 Mar 2005.
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 121 - 0112398 – T Th Ngc Thanh
[II.9] Julius Stuller; Network of Excellence Semantic Web; 7 June 2002.
[II.10] Peter Dolog and Wolfgang Nejdl; Challenges and Benefits of the
Semantic Web for User Modelling.
[II.11] Pang Wang; A Search Engine Based on the Semantic Web; May, 2003.
[II.12] Karen Sparck Jones; What’s new about the Semantic Web? Some
questions; December 2004, 18 – 23.
[II.13] Mark Klein, Abraham Bernstein; Searching for Services on the
Semantic Web Using Process Ontology; July 30 – August 1, 2001.
[II.14] Michael Sintek, Stefan Decker; TRIPLE – A Query Language for the
Semantic Web; November 2 2001.
[II.15] Stefan Decker, Vipul Kashyap; The Semantic Web: Semantics for Data
on the Web; September 10 2003.
[II.16] Catherine C. Marshall; Taking a Stand on the Semantic Web; 2003.
[II.17] Eric Miller, Ralph Swick; Semantic Web Activity: Adcanced
Development; 07/09/2003.
[II.18] Tim Berners – Lee; Semantic Web Road map; 10/14/1998.
[II.19] Raul Corazzon; Ontology. A resource guide for philosophers;
06/01/2005.
[II.20] John F.Sowa; Guided Tour of Ontology; June 03 2005.
[II.21] John F. Sowa; Building, Sharing, and Merging Ontologies; June 03
2005.
[II.22] ISO; Information and documentation – The Dublin Core metadata
element set; 02/26/2003.
[II.23] IEEE; Draft Standard for Learning Object Metadata; 15 July 2002.
[II.24] Shigeo SUGIMOTO, Jun ADACHI, Stuart WEIBEL; 68
th
IFLA
Council and General Conference; August 24 2002.
[II.25] Stiching SURF; DARE use of Dublin Core, version 2.0; December
2004.
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 122 - 0112398 – T Th Ngc Thanh
[II.26] CEN/ISSS MII – DC (WI3) Report; Guidance for the Deployment of
Dublin Core Metadata in Corporate Environments; 8/20/2004 DRAFT.
[II.27] Kazuhiko Asou, Takako Nakahara, Takao Namiki; A report on Dublin
Core based research information service on mathematics; 10/26/2001.
[II.28] Western States Digital Standards Group, Metadata Working Group;
Western States Dublin Core Metadata Best Practices, Version 2.0; 01/12/2005.
[II.29] Jay Cross, CEO, Internet Time Group; eLearning; mid – 1999.
[II.30] ADOBE; A primer on electronic document security; 11/2004.
[II.31] Gerhard U. Bartsch; Introduction to Electronic Document Management
Whitepaper ; March 16 2003.
[II.32] Andreas Hotho; Using Ontologies to Improve the Text Custering and
Classification Task; January 14 2005.
[II.33] Norman Paskin; DOI: implementing a standard digital identifier as the
key to effective digital rights management; March 9 2000.
III. Website:
[III.1] W3C SemanticWeb Activity
/>
[III.2] Semantic web server
[III.3] RDF
/>
[III.4] Tim Berners – Lee Notation3
/>
[III.5]
[III.6]
/>
[III.7] RDQL: RDF Data Query Language
/>
[III.8] RDF/XML Syntax Specification
/>grammar/
[III.9] DAML
[III.10] RDF Data
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 123 - 0112398 – T Th Ngc Thanh
[III.11] National Information Standards Organization
[III.12] Intellidimension: Delivering a Platform for the Semantic Web
/>
[III.13] eLib
/>.
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 124 - 0112398 – T Th Ngc Thanh
PH LC
1. Cú pháp RDF:
rdfs:Resource
T#t c mi th c mô t bi RDF c gi là resources và là thành viên c$a class
rdfs:Resource
rdfs:Literal
Lp rdfs:Listeral i din cho mt lp các giá tr ký t nh là strings và intergers. Ví
d!: thuc tính giá tr: chui text
rdfs:XMLLiteral
Lp rdfs:XMLLiteral i din cho lp giá tr chui c$a XML.
rdfs:Class
Lp này tng ng vi khái nim chung type ho"c là catalog c$a tài nguyên.
RDF class membership (quan h thành viên lp RDF) c s% d!ng i din cho
types và catalog c$a tài nguyên. Hai lp có th có cùng thành viên.
rdf:Property
rdf:Property i din cho nhng tài nguyên có thuc tính RDF.
rdfs:Datatype
rdfs:Datatype i din cho nhng tài nguyên có các kiu d liu RDF.
rdf:type
Thuc tính rdf:type cho bit mt tài nguyên là thành viên c$a class nào.
Khi mt tài nguyên có mt thuc tính rdf:type mà giá tr c$a thuc tính này là mt s
class xác nh, thì chúng ta nói r0ng tài nguyên là mt instance of c$a class xác nh
này.
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 125 - 0112398 – T Th Ngc Thanh
Giá tr c$a thuc tính rdf:type s* luôn là mt tài nguyên – tài nguyên này là mt th
hin (instance) c$a rdfs:Class. Tài nguyên này c bit nh là rdfs:Class bn thân nó
là mt tài nguyên c$a mt rdf:type rdfs:Class. (Bn thân nó c/ng là mt kiu – type
c$a mt lp).
rdfs:subClassOf
Thuc tính rdfs:subClassOf i din cho mi quan h chu5n hoá gia các class c$a
mt tài nguyên. Thuc tính rdfs:subClassOf là mt transitive.
rdfs:subPropertyOf
Thuc tính rdfs:subPropertyOf là mt th hin (instance) c$a rdf:Property, c s%
d!ng xác nh mt thuc tính là mt chu5n c$a mt cái khác.
H thng c#p bc thuc tính con có th c s% d!ng trình bày h thng c#p bc
c$a các ràng buc v range và domain.
Chú ý:
Thut ng “super – property” ôi khi c s% d!ng cho bit mi quan h
gia mt s thuc tính vi nhiu thuc tính ph. bin khác, ví d! là mi quan h
rdfs:subPropertyOf.
rdfs:range
Mt th hin c$a rdf:Property c s% d!ng cho bit các class nào mà giá tr c$a
mt thuc tính s* là thành viên c$a nó.
Giá tr c$a mt thuc tính rdfs:range luôn luôn là mt Class. Thuc tính rdfs:range bn
thân nó có th c s% d!ng biu di-n iu này: The rdfs:range of rdfs:range is the
class rdfs:Class. iu này cho th#y r0ng b#t k3 mt tài nguyên nào là giá tr c$a thuc
tính range s* là mt class.
Thuc tính rdfs:range ch& c áp d!ng i vi các thuc tính. iu này c/ng c
miêu t trong RDF thông qua vic s% d!ng thuc tính rdfs:domain. The rdfs:Domain
of rdfs:range is the class rdf:Property. iu này cho th#y r0ng thuc tính range áp
d!ng i vi các tài nguyên mà bn thân nó c/ng là các thuc tính (property).
rdfs:domain
Mt th hin c$a rdf:Property c s% d!ng cho bit class nào s* có thành viên là
b#t k3 mt tài nguyên nào sao cho thuc tính c$a nó c ch& nh.
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 126 - 0112398 – T Th Ngc Thanh
The rdfs:domain of rdfs:domain is the class rdf:Property. iu này cho th#y r0ng
thuc tính domain c s% d!ng trên các tài nguyên là các thuc tính.
The rdfs:range of rdfs:domain is the class rdfs:Class. iu này cho th#y r0ng b#t k3
mt tài nguyên nào mà là giá tr c$a mt thuc tính domain s* là mt class.
rdfs:label
Thuc tính rdfs:label c s% d!ng cung c#p phiên bn tên c$a tài nguyên mà con
ngi có th c c.
rdfs:comment
Thuc tính rdfs:comment c s% d!ng cung c#p s mô t tài nguyên mà con ngi
có th c c.
Mt dòng chú thích b0ng text (textual comment) giúp làm rõ ng ngh a c$a các class
và các property c$a RDF.
Các lp và các thuc tính RDF Utility và Container
RDF nh ngh a thêm mt s class và property, bao g1m xây dng cách biu di-n các
container và các phát biu RDF, và cách m rng mô t t vng RDF trên world wide
web.
Các lp và các thuc tính RDF Container
rdfs:Container
Lp rdfs:Container là mt super – class c$a các lp Container c$a RDF, ví d!:
rdf:Bag, rdf:Seq, rdf:Alt.
rdf:Bag
Lp rdf:Bag i din cho c#u trúc container ‘Bag’ c$a RDF, và là mt lp con c$a lp
rdfs:Container.
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 127 - 0112398 – T Th Ngc Thanh
rdf:Seq
Lp rdf:Seq i din cho c#u trúc container ‘Sequence’ c$a RDF, và là mt lp con
c$a lp rdfs:Container.
rdf:Alt
Lp rdf:Alt i din cho c#u trúc container ‘Alt’ c$a RDF, và là lp con c$a lp
rdfs:Container.
rdfs:ContainerMembershipProperty
Lp rdfs:ContainerMembershipProperty vi t cách là thành viên c$a thuc tính
rdfs:member và các thuc tính _1, _2, _3, … có th c s% d!ng cho bit quan h
thành viên c$a các container Baq, Seq, và Alt. rdfs:ContainerMembershipProperty là
mt lp con (subclass) c$a rdf:Property. Mi thuc tính trong quan h thành viên c$a
container là mt rdfs:subPropertyOf c$a thuc tính rdfs:member.
rdfs:member
Thuc tính rdfs:member là mt siêu thuc tính (super – property) c$a các thuc tính
trong quan h thành viên c$a container.
rdf:List
Lp rdf:List i din cho lp các danh sách lit kê (Lists) c$a RDF. Nó c s% d!ng
vi các construct nh ‘first’, ‘rest’, và ‘nil’, và nó c h tr trong cú pháp
RDF/XML.
rdf:first
Thuc tính rdf:first i din cho mi quan h gia rdf:List và phn t% (item) u tiên
c$a nó.
rdf:rest
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 128 - 0112398 – T Th Ngc Thanh
Thuc tính rdf:rest i din cho mi quan h gia phn t% (item) rdf:List vi các phn
t% còn li trong danh sách (list), ho"c vi phn t% cui c$a nó (ví d!, rdf:nil).
rdf:nil
Tài nguyên rdf:nil i din cho mt rdf:List rng (empty).
Các lp và các thuc tính RDF Utility
rdfs:seeAlso
Thuc tính rdfs:seeAlso c s% d!ng cho bit mt tài nguyên có th cung c#p
thông tin RDF thêm vào v tài nguyên ch$ (subject resource).
rdfs:isDefinedBy
Thuc tính rdfs:isDefinedBy là mt thuc tính con c$a rdfs:seeAlso, và cho bit tài
nguyên nào ang nh ngh a tài nguyên ch$ .
rdf:value
Thuc tính rdf:value nhn bit giá tr ch$ yu (thng là chui) c$a mt thuc tính khi
giá tr thuc tính là mt tài nguyên có c#u trúc (structured resource).
rdf:Statement
Lp rdf:Statement i din cho các phát biu v các thuc tính c$a các tài nguyên.
rdf:Statement là domain (l nh vc) c$a các thuc tính: rdf:predicate, rdf:subject và
rdf:object.
Các th hin (instance) rdf:Statement c lp khác có th có cùng giá tr cho các thuc
tính predicate, subject và object c$a chúng.
rdf:subject
Ch$ c$a mt phát biu (statement) RDF.
Thuc tính rdf:subject cho bit mt tài nguyên là ch$ c$a mt s phát biu RDF.
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 129 - 0112398 – T Th Ngc Thanh
The rdfs:domain of rdf:subject is rdf:Statement and the rdfs:range is rdfs:Resource.
Thuc tính này có th c s% d!ng xác nh tài nguyên nào c mô t bi mt
phát biu RDF.
rdf:predicate
V ng (predicate) c$a mt phát biu RDF.
The rdfs:domain of rdf:predicate is rdf:Statement and the rdfs:range is rdfs:Resource.
Thuc tính này c s% d!ng xác nh v ng nào c s% d!ng trong mt phát
biu RDF.
rdf:object
Túc t (tân ng) c$a mt phát biu RDF.
The rdfs:domain of rdf:object is rdf:Statement. Thuc tính range không c nh
ngh a cho thuc tính này bi vì các giá tr c$a rdf:object có th bao g1m c Literals
và Resources. Thuc tính này có th c s% d!ng xác nh túc t c$a mt phát
biu RDF.
2. RDF Gateway:
Công ty Intellidimension, n0m ti Windsor, Vermont (USA) ã to ra mt nn
RDF thng mi c gi là RDF Gateway. im mnh c$a công c! này là tính d- s%
d!ng và mang chuyn. RDF Gateway ch& gii hn trên nn Microsoft Windows, hin
nay vn cha có mt k hoch nào cho s ra i c$a mt phiên bn cho Linux hay mt
h iu hành khác.
Sn phm RDF Gateway ra i cùng lúc vi s ra i c$a công ty
Intellidimension vào tháng 6 nm 2000. Phiên bn kim nghim beta c$a nó c ra
mt vào nm 2001. Nhng nhà lp trình ã xu#t và tho lun các tính nng c$a h
thng trong di-n àn tho lun chung c$a W3C. Cui cùng thì phiên bn thng mi
1.0 ra i vào ngày 3 tháng 3 nm 2003.
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 130 - 0112398 – T Th Ngc Thanh
Bi vì ây là mt phn mm thng mi, nên nó c/ng cn có bn quyn. Tuy
nhiên vn là mi-n phí i vi các m!c ích hc tp phát trin.
2.1. Kin trúc c a RDF Gateway:
RDF Gateway là mt server nh và nhanh, nó có th liên kt các tính nng c$a
mt h qun tr c s d liu và web server. Nó c thit k nh là mt khung nn
cho vic tp hp, truy v#n, chuyn .i và phân phi d liu RDF.
Hình 24: Kin trúc c a RDF Gateway
o B x lý bn mã RDFQL (RDFQL Script Processor)
RDFQL Script Processor là mt máy o u tiên (preemptive virtual
machine) có th biên dch, lu tr, và thc thi các on script RDFQL. RDFQL là mt
ngôn ng scripting phía server da trên ECMA Script (Java Script). RDFQL tích hp
các m rng truy v#n ta SQL d- dàng truy cp n b máy c s d liu suy di-n
c$a RDF Gateway. RDFQL script processor cho phép các trang (pages) – có s kt
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 131 - 0112398 – T Th Ngc Thanh
hp c$a script và ni dung t nh tng t nh Microsoft Active Server Pages (ASP).
Server c c kt ni n RDFQL thông qua mt th vin c$a các i tng bên
trong (Server, Session, Request, Response, …).
o Database Engine
RDF Gateway có mt b máy c s d liu suy di-n – c thit k t
nn không h tr ho"c có h tr RDF. Nó thc hin ánh giá truy v#n theo chin lc
bottom – up, c t. chc liên on theo t#t c các tài nguyên d liu xác nh. Kh
nng suy lun logic c$a b máy cung c#p s h tr cho cú pháp các lut khai báo c$a
RDFQL. B máy c s d liu không truy cp n mt h thng qun lý d liu bên
ngoài.
o Data Service Interface: (Giao di&n d-ch v d% li&u)
Giao din dch v! d liu cho phép các tài nguyên d liu t bên ngoài
c tích hp vi RDF Gateway. Mt nhà cung c#p dch v! d liu là mt mô – un
thc thi giao din này và biu di-n các ni dung c$a mt kiu xác nh c$a tài nguyên
d liu nh là d liu RDF. RDFQL cho phép t. chc liên on các câu v#n tin c
thi hành thông qua nhiu dch v! d liu. Giao din m này làm cho nó có th s% d!ng
b#t k3 mt nhà cung c#p dch v! d liu s6n có hin ti nào ho"c phát trin mt nhà
cung c#p theo ý mình cho mt ngu1n d liu.
o Authentication/Security:
RDF Gateway có mt mô hình bo mt da trên quyn và s cho phép
iu khin truy xu#t n server và các tài nguyên c s d liu. RDF Gateway h tr
cho nhng user c$a nó và các role c/ng nh user và group c$a NT. Mt NT user luôn
chng thc b0ng cách s% d!ng mt s u4 nhim c$a NT cho tài khon. S h tr
c$a RDF Gateway cho i vi các user và group c$a NT làm cho có th qun tr bo
mt t bên ngoài.
o Network IO
Giao din mng h tr c HTTP và TCP/IP da trên giao thc. Tng
nhp xu#t mng (network IO layer) h tr lc 1 chng thc mng bo mt nh là
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 132 - 0112398 – T Th Ngc Thanh
NT Challenge/ Response (NTLM). Mt client kt ni n server thông qua mt
interface (giao din).
o Package Management
RDF Gateway cho phép thc thi các ng d!ng c phát trin và
trin khai nh là các package. Mt package bao g1m các trang server RDF, các trang
HTML, các hình nh ho"c b#t k3 mt kiu file nào khác.
o Component Management
RDFQL h tr COM trong script phía server c$a nó. iu này cho phép
tính nng c$a RDF Gateway có th c m rng ho"c i vi các ng d!ng c tích
hp vi RDF Gateway.
o Session Management
B qun lý phiên làm vic cho phép lu li trng thái c$a ngi dùng
trên server.
2.2. Tính n8ng (Features)
o Bi6u di;n các b ba RDF vào trong các bng d% li&u:
H bin hoá RDBMS ( RDBMS paradigm) c$a vic lu tr d liu trong
các bng c lp vào lu tr các b ba RDF (triples). Mô hình d liu c$a các
bng là mt b ba bao g1m: predicate, subject, và object. Các ct c$a bng không có
tên nhng luôn cha 3 thành phn c$a b ba này theo th t. Lu ý là predicate là
thành phn u tiên. Có mt ct tu3 chn th t cho lu tr siêu d liu v triple (b
ba), siêu d liu này c gi là “context” c$a b ba. Trng context có th lu tr
mt nh danh tài nguyên mà nh danh này có th c s% d!ng gii quyt các v#n
bo mt ho"c nhn din tài nguyên c$a b ba ho"c b#t k3 mt tính nng quen thuc
nào.
o Other data sources: (Các ngu.n d% li&u khác)
Các ngu1n d liu bên ngoài và các c s d liu ang hot ng c
truy xu#t t server c bao quanh các i tng c$a ngu1n d liu. Mt i tng
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 133 - 0112398 – T Th Ngc Thanh
ngu1n d liu (datasource object) có c#u trúc ging nh mt table, cha ng các b
ba trong các dòng. Có s h tr cho các bng trong b nh và nó có th to các trình
bao bc cho d liu bên ngoài.
o Databases
Vic lu tr các bng c phân thành các phn trong c s d liu.
Mt server có th cha nhiu c s d liu khác nhau, mt bng có th c to trong
mt c s d liu. Format c$a c s d liu là mt nh dng file s hu, mi c s
d liu c lu trong mt file.
o RDFQL script language:
Ngôn ng scripting da trên ECMA script, thng c bit n nh là
Javascript. Các khái nim sau c cung c#p:
Functions (các hàm)
Variables và Arrays ( các bin và các mng)
Câu lnh loops và If
Exception handling (bt li)
Import các file script khác.
Comments (các chú thích)
Các câu lnh (phát biu) trong RDF Gateway.
Các câu lnh cho RDF Gateway bao g1m mi khía cnh c$a server và
giúp ngi lp trình truy cp n t#t c các tính nng c$a nó. Mt ví d! là công c! c#u
hình server, công c! này là mt trang web c vit b0ng RDFQL c thông dch
bi mt web server c tích hp, và cho phép truy xu#t n t#t c các i tng c$a
server nh là: các table, các database, user và package.
tìm ra c các dataset c$a b ba RDF, mt i tng RDF node
c cung c#p, nó thu thp t#t c các predicate và subject c$a mt i tng ã cho và
làm cho nó có th thay .i giá tr c$a các subject.
chy các câu truy v#n trên server, mt tp các câu lnh c s d liu
cn phi s6n sàng. Các câu lnh c s d liu óng gói trong RDFQL script, câu lnh
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 134 - 0112398 – T Th Ngc Thanh
này thng c bit t các câu lnh SQL trong các file source C c tích hp bi
mt trình biên dch trc.
Truy cp n các i tng ActiveX và COM c h tr thông qua
phng thc khi gán (construct) c$a ngôn ng ActiveXObject.
Nu on script RDFQL c ánh giá trong ng cnh c$a web server, thì các i
tng cha d liu session, request và response c cung c#p.
o Adding and retrieving data (thêm và truy v(n d% li&u)
Các lnh thao tác d liu thì tng t vi cú pháp lnh trong SQL. Tính
nng c m rng i vi các nhu cu xác nh c$a RDF. Có các câu lnh nh:
INSERT, SELECT và DELETE. Các câu lnh này s% d!ng các bin (variable) ràng
buc d liu, tng t nh ngôn ng RQL c s% d!ng bi RDFSuite.
INSERT {
[
[
[
'Oil on canvas'
} INTO museum;
Ví d! này ch& ra cách nào insert mt b ba (triple) vào table
“museum”. B ba c vit gia 2 d#u ngo"c nhn (‘{‘ và ‘}’) và cha 4 giá tr:
Context
Predicate
Subject
Object ho"c Literal
Thông tin ng ngh a c$a b ba này có ngh a là: bc nh “abraham.jpg”
thuc v l nh vc “Oil on Canvas” và thông tin này c l#y t “www.artchive.com”.
SELECT ?a, ?b, ?c USING museum
WHERE {?a ?b ?c} AND ?c LIKE “Oil”;
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 135 - 0112398 – T Th Ngc Thanh
truy v#n các triple t mt table, thì câu lnh SELECT c s% d!ng.
Ví d! này truy xu#t t#t c các triple mà có cha t “oil” trong giá tr i tng literal.
Chú ý là triple gia 2 d#u ngo"c nhn ch& cha 3 giá tr, context c b2 i.
D liu có th c l#y t các ngu1n d liu bên ngoài ho"c chuyn .i (tranfer) t
mt bng này n mt bng khác.
var doc = new DataSource(
"inet?url=file://c:/Museum.xml&parsetype=rdf");
SELECT ?a, ?b, ?c USING #doc WHERE {?a ?b ?c};
INSERT {?p ?s ?o} INTO museum USING #doc
WHERE {?p ?s ?o};
Trong ví d! này, mt d liu RDF c l#y t mt file text và c
insert vào bng museum. Lu ý là trong RDFQL Javascript, code c trn vi mt
on code ging nh SQL – bin javascript “doc” c s% d!ng trong lnh c s d
liu nh là “#doc”.
o Built – in Webserver (Webserver g<n lin)
RDF Gateway có mt Webserver gn lin.Giao din c#u hình và qunlý
c xu#t bn di dng web. Các nhà phát trin ng d!ng có th to các trang web
vi web server này, b0ng cách s% d!ng ngôn ng RDFQL script. Tính nng này có th
c s% d!ng trong vic debug và phát trin, nhng c/ng có th s% d!ng xây dng
toàn b các ng d!ng web b0ng cách s% d!ng RDF Gateway. i vi v#n s% d!ng
các i tng ActiveX thông qua RDFQL, web server c xem là r#t mnh.
o RDF Query Analyzer
Các câu lnh và các câu truy v#n RDFQL có th c to ra b0ng cách
s% d!ng ng d!ng o này (RQF Query Analyzer).
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 136 - 0112398 – T Th Ngc Thanh
Hình 25: Giao di&n c a RQF Query Analyzer.
Query analyzer thì tng t nh các sn ph5m lng gía truy v#n c$a
các SQL Server ph. bin. Các script phc tp có th c to ra ây và c s%
d!ng trong các trang web ho"c các ng d!ng khác. Các câu truy v#n có th c ánh
giá li mt ln na RDF Gateway c!c b ho"c xa, trình son tho vn vn (text
editor) có cú pháp dng c highlight và có th lu và m các câu v#n tin.
o Inference Engine (máy suy di;n)
B máy c s d liu RDF Gateway g1m mt máy suy di-n. Các câu
lnh b ba RDF mi, có th c phát sinh mt cách t ng da trên các lut suy
di-n và các b ba ã có s6n. Các hàm (function) có th c nh ngh a, các hàm này
rút trích d liu t c s d liu da trên các lut. Các lut này c nh ngh a trong
ngôn ng RDFQL script và có th c s% d!ng trong các dòng lnh thao tác c s d
liu.
RULEBASE schema
{
INFER {[rdf:type] ?s ?class} FROM
{[rdf:type] ?s ?subclass} AND
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 137 - 0112398 – T Th Ngc Thanh
{[rdfs:subClassOf] ?subclass ?class};
};
SELECT ?p ?s ?o USING #ds RULEBASE schema WHERE
{[rdf:type] ?s ?o} AND {?p ?s ?o};
Ví d! này nh ngh a mt lut (rule) cho lc 1 RDF (RDF Schema) v
các subclass (lp con): Nu môt subject là mt kiu (type) c$a X và X c nh
ngh a là subject c$a Y, thì subject c/ng là mt kiu c$a Y. R1i sau ó lut này c s%
d!ng cho câu lnh SELECT truy v#n t#t c các class và các class xu#t phát c$a t#t
c các subject.
Vn RDF Schema không c h tr bi RDF Gateway, nó phi c
mô t theo các lut suy di-n.
o Client Libraries
RDF Gateway có các th, cài client (client drivers) cho Microsoft ADO
và Sun Microsystems JDBC. iu này cho phép RDF Gateway h tr rng khp nhiu
client nh là các web browser, các ng d!ng Windows, các ng d!ng Java, XML ho"c
RDF da trên clients.
o Security
Khi truy cp vào RDF Gateway thông qua http, ADO ho"c các protocols
khác, ngi dùng phi c nhn bit b0ng cách s% d!ng username và password. Mt
tài khon ngi dùng (user account) là “anonymous” c cung c#p cho vic truy xu#t
chung (mi ngi u có th truy cp vào vi user account này).
H thng bo mt s% d!ng c hai loi: c s d liu bo mt c$a windows xác nhn
các ngi dùng windows và mt c s d liu ngi dùng bên trong. C/ng nh
Internet Explore, NT Authentication (s chng thc mc NT) có th c s% d!ng
vi http.
Mi thành phn (item) c qun lý bi RDF Gateway có th b gii
hn i vi các user c nh ngh a, các thành phn này bao g1m: các package, các
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 138 - 0112398 – T Th Ngc Thanh
table, data source và các component. ( c#p table, d- dàng s%a .i vic c, vit,
và xoá các quyn cho các user riêng bit.
Mt khái nim bo mt da trên dòng i vi các lnh RDF trong các
table c da trên ct “context”, trng thêm vào th t này c add vào subject,
predicate, và object. Mt user có th c cho phép c, vit, và xoá các quyn
(rights) i vi mt context riêng bit.
Không h có s h tr i vi mt nhóm ngi s% d!gn (user group –
trong RDF Gateway không có khái nim này).
o Configuration and Management (c(u hình và qun lý)
Các s sp "t (setting) c#u hình chi tit c truy cp thông qua giao
din web, giao din này c dn vào nh web server gn lin. Ngi dùng phi ng
nhp vào b0ng cách s% d!ng mt account có vai trò là administrator c$a windows.
7ng d!ng web này c "t tên là “RDF Gateway Management Utility” và cung c#p
truy cp n các databases, tables, users, contexts, ActiveX Components, Data
Services, Roles, Packages, MimeTypes và Timers. i vi hu ht các thành phn
này, thì các chn la bo mt v s cho phép có th c "t.
Tin ích qun lý c thc thi nh là RDF Gateway web package.
Trên ây là nhng gii thiu bao quát v RDF Gateway. Ngoài ra ta c/ng có th xem
thêm v cú pháp cu RDF Gateway khá chi tit trong phn help c$a tin ích RDF
Query Analyzer.
3. H& thng nhãn ng% ngh!a:
H thng nhãn ng ngh a c gii thiu ây g1m 3 tiu h thng nh2 ng
vi 3 t loi: danh t, ng t và tính t. Trong mi tiu h thng, li c phân thành
2 c#p: c#p c bn cha mt s ít các nhãn chung nh#t, s% d!ng nhiu nh#t và là nhng
nhãn vit tt (gi nh) d* nh; và c#p chuyên sâu là nhng nhãn theo h thng
tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 139 - 0112398 – T Th Ngc Thanh
LLOCE. Ngoài ra, trong phn này, c/ng còn lit kê mt s h thng nhãn ng ngh a
khác nh WordNet, CoreLex.
3.1. Nhãn ng% ngh!a c bn cho danh t":
STT
Nhãn Mô t Ý ngh a
1
ABS Abstraction Nhng gì tru tng
2
ACT Act Hành ng
3
AGT Agent Tác nhân
4
ANM Animal Sinh vt
5
ART Artifact Nhân to
6
ATR Attribute Thuc tính
7
BDY Body C th con ngi
8
CEL Cell T bào
9
CHM Chemical Hoá ch#t
10
COM Communication Truyn tin
11
CON Consequence Hu qu
12
ENT Entity Thc th
13
EVT Event Bin c
14
FEL Feel S cm nhn
15
FEM Female Ging cái/ n
16
FOD Food Thc n
17
FRM Shape, form Hình dng
18
GAS Gas Th khí
19
GRB Group biology Nhóm sinh hc
20
GRP Group Nhóm nói chung
21
GRS Group social Nhóm xã hi
22
HOU House Công trình xây dng
23
HUM Human Con ngi