Tải bản đầy đủ (.pdf) (38 trang)

Tìm hiểu ngữ nghĩa trên lính vực eDoc (Phan Thị Mỹ Phượng vs Từ Thị Ngọc Thanh) - 4 potx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (322.06 KB, 38 trang )


 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 115 - 0112398 – T Th Ngc Thanh
24 Information
processing
9 7
25 Natural language
processing
10 8
26 Sofrware 12 6
27 Freeware 7 2
28 Shareware 7 2
29 Virus 6 0
30 Norton antivirus 5 0
31 Graphic 5 3
32 Picture 9 7
33 Artwork 15 7
34 Art school 100 90
35 Artist 12 3
36 Gallery 19 17
37 Museum 19 8
38 Clip art 100 90
39 Painting 36 27
40 Landscape 11 6
41 Portrait 10 7
Bng 10 Các câu truy v(n th nghi&m


 Kt qu thng kê truy v(n theo t"ng l!nh v#c:
Công thc thng kê:


 chính xác c$a l nh vc = trung bình cng(phn trm chính xác c$a tng t
trong l nh vc ó).



 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 116 - 0112398 – T Th Ngc Thanh

 Computer & information science:


STT Tên l!nh v#c  chính xác
1 Programming 87%
2 Data 57%
3 Security 93%
4 Computer science 65%
5 Internet 67%
6 Computer 26%
7 Information science 21%
8 Software 64%
9 Virus 100%
Bng 11 Thng kê l!nh v#c khoa h)c máy tính


 Art:

STT Tên l!nh v#c  chính xác
1 Art and artwork 10%
2 Artist 75%
3 Gallery 11%

4 Museum 58%
5 Art school 10%
6 Painting 25%
8 Music 70%
9 Music style 65%
Bng 12 Thng kê l!nh v#c ngh& thu*t.




 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 117 - 0112398 – T Th Ngc Thanh
 Nh*n xét:
- 7ng d!ng ch& xây dng trên hai l nh vc là ngh thut và khoa hc máy
tính nên mi tài liu a vào u c phân vào mt trong hai l nh vc
này do ó làm gim i  chính xác.
- S tài liu tr v cho mi t trong cùng mt lp con trong ontology là
không b0ng nhau do phng pháp x% lí câu truy v#n là: l#y nhng tài
liu trong cùng lp con c$a ontology và 1ng thi l#y nhng tài liu có
t khoá có trong vi t khoá c$a câu truy v#n.
-  chính xác trong vic phân loi tài liu theo tng lp con cha cao do
các lp con trong ontology thit k cha y $, cha bao hàm ht các
khái nim trong mt l nh vc và s t trong mt l nh vc cha nhiu và
y $.
- M"t khác,  chính xác trong vic phân loi c$a tài liu còn b nh
hng do s lng t c$a ni dung trong tài liu ít (tài liu ch& cha a
s là các hyperlink và các hình nh).
- L nh vc ngh thut có  chính xác th#p do các t trong mi lp con
c$a ontology không c phân bit rõ ràng, mt t có th n0m  nhiu
lp và s lng t ít.

Tóm li, chng trình ng d!ng t hiu qu tt trong vic phân loi tài liu
theo l nh vc ln, còn i vi tng lp con trong mi l nh vc thì hiu qu cha cao.
Ngi qun tr có th nâng cao hiu qu c$a chng trình b0ng cách xây dng t#t c
các l nh vc trong thc t, b. sung các t trong tng lp con c$a mi l nh vc theo xu
hng càng nhiu t "c trng cho lp càng tt (mc cô lp gia các lp càng cao).

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 118 - 0112398 – T Th Ngc Thanh
Chng 5 : KT LUN
5.1. ánh giá kt qu nghiên c'u
5.1.1. u i6m
V c bn lun vn ã thc hin tt các ni dung  ra và t c mt s kt
qu nh#t nh :
o Lun vn ã trình bày c s lý thuyt v nguyên lý vn hành c/ng
nh u và khuyt im c$a mt h thng search engine.
o Lun vn trình bày rõ mô hình Web ng ngh a cùng vi các i
tng c$a nó nh RDF, OWL, …
o Trình bày các v#n  v ng ngh a c/ng nh các hng gii quyt
trong vic x% lí ngôn ng t nhiên nh0m giúp máy tính “hiu” c
câu h2i c$a ngi dùng.
o T nhng c s nghiên cu lí thuyt, lun vn ã  ra mô hình cho
vic xây dng công c! tìm kim ng ngh a, và thc hin cài "t mt
công c! tìm kim các tài liu in t% phù hp vi ng ngh a c$a câu
truy v#n c$a ngi dùng.
o Lun vn có th xác nh tng i chính xác l nh vc mà tài liu
thuc v. Và phn nào xác nh c l nh vc c$a câu truy v#n c$a
ngi dùng.


 Ý ngh a thc ti-n:



 Tìm hiu mô hình, nm vng công ngh tìm kim ng ngh a 
áp d!ng chi ting Vit.



 Ý ngh a khoa hc:


 ây là công c! ph!c v! cho nhu cu phân loi vn bn, phân loi
tài liu hc tp.

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 119 - 0112398 – T Th Ngc Thanh
5.1.2. Khuyt i6m:

Tuy nhiên, do v#n  v ng ngh a là mt v#n  phc tp và rng ln nên lun
vn ch&  ra mt s hng nghiên cu hin nay  mt s l nh vc hu hn, không th
bao hàm ht c các khái nim c/ng nh ngôn ng c$a con ngi.
Nhng v#n  c  xu#t trong lun vn nh0m m!c ích a ra mt hng
gii quyt mang tính ch#t tham kho nên có th s* có nhiu im cha ti u, cn
c hoàn thin hn.
Trong chng trình ng d!ng, lun vn s% d!ng c s d liu các t "c trng
cho t l nh vc, c s d liu này c xây dng ch$ yu da vào WordNet, song vn
còn hn ch v s lng các t riêng cho tng chuyên ngành. Nu câu truy v#n c$a
ngi dùng h2i v nhng t không n0m trong c s d liu thì có th s* không tìm
th#y kt qu. Và vic phân loi các t l nh vc mang tính ch$ quan nên có th cha ti
u.
Vic phân loi tài liu theo l nh vc tng i tt do có s lng t khá nhiu

nhng vic phân loi câu truy v#n c$a ngi dùng, s% d!ng mt lng t r#t ít nên có
mt s câu truy v#n không có kt qu tr v.
Ngoài ra, lun vn ch& s% d!ng c s d liu các tài liu lu s6n v trên máy ch$ nên
s lng các tài liu cha ln.

5.2. Hng phát tri6n
Chng trình ng d!ng c$a lun vn c xây dng da trên nhng v#n  c
bn, song nó có th phát trin  ngày càng hoàn thin và ti u hn. Nhng hng
phát trin c$a lun vn:
- M rng tìm kim trong t#t c các l nh vc.
- Tìm kim trên nhiu ontology, phân loi ontology.
- Thc s tìm kim online.
- 7ng d!ng cho Ting Vit.


 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 120 - 0112398 – T Th Ngc Thanh

TÀI LIU THAM KHO
I. Lu*n v8n, lu*n án:
[I.1] "ng Th Qu3nh Chi. Lun vn thc s tin hc. Nghiên c'u v mô hình,
khám phá và khai thác các mi quan h& trên web ng% ngh!a, xây d#ng 'ng
dng. Ngi hng dn khoa hc: Nguy-n Tin D/ng.
[I.2] Lê Thuý Ngc,  M Nhung. Lun vn c% nhân tin hc. Tìm hi6u v
Search Engine và xây d#ng 'ng dng minh ho4 cho Search Engine ting
Vi&t. GVHD: Nguy-n Th Di-m Tiên.

II. Sách, eBooks:

[II.1] Ying Ding, Dieter Fensel, Michel Klein, and Borys Omelayenko. The

Semantic Web: Yet another Hip?. Data and knowedgle engineering, 2002.
[II.2] Eero Hyvonen. Semantic web Kick – off in Finland vision, Technologies,
Research, and Applications; May 19, 2002 .
[II.3] inh in, Giáo trình X% Lý Ngôn Ng T Nhiên, tháng 12/2004.
[II.4] Dr. V. Richard Benjamins, Jesús Contreras; Six challenges for the
semantic web; April 2002.
[II.5] Nicola Guarino; Some Ontological Principles for Designing Upper
Level Lexical Resources; 28 – 30 May 1998.
[II.6] Urvi Shah, Tim Finin, Anupam Joshi, R. Scott Cost, James Mayfield;
Information Retrieval on the Semantic Web
*
.
[II.7] Luke K. McDowell; Meaning for the Masses: Theory and Applications
for Semantic Web and Semantic Email Systems; 2004.
[II.8] Gareth Osler;The Semantic Web Through Semantic Data – A Four Tier
Architecture Model ; 4 Mar 2005.

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 121 - 0112398 – T Th Ngc Thanh
[II.9] Julius Stuller; Network of Excellence Semantic Web; 7 June 2002.
[II.10] Peter Dolog and Wolfgang Nejdl; Challenges and Benefits of the
Semantic Web for User Modelling.
[II.11] Pang Wang; A Search Engine Based on the Semantic Web; May, 2003.
[II.12] Karen Sparck Jones; What’s new about the Semantic Web? Some
questions; December 2004, 18 – 23.
[II.13] Mark Klein, Abraham Bernstein; Searching for Services on the
Semantic Web Using Process Ontology; July 30 – August 1, 2001.
[II.14] Michael Sintek, Stefan Decker; TRIPLE – A Query Language for the
Semantic Web; November 2 2001.
[II.15] Stefan Decker, Vipul Kashyap; The Semantic Web: Semantics for Data

on the Web; September 10 2003.
[II.16] Catherine C. Marshall; Taking a Stand on the Semantic Web; 2003.
[II.17] Eric Miller, Ralph Swick; Semantic Web Activity: Adcanced
Development; 07/09/2003.
[II.18] Tim Berners – Lee; Semantic Web Road map; 10/14/1998.
[II.19] Raul Corazzon; Ontology. A resource guide for philosophers;
06/01/2005.
[II.20] John F.Sowa; Guided Tour of Ontology; June 03 2005.
[II.21] John F. Sowa; Building, Sharing, and Merging Ontologies; June 03
2005.
[II.22] ISO; Information and documentation – The Dublin Core metadata
element set; 02/26/2003.
[II.23] IEEE; Draft Standard for Learning Object Metadata; 15 July 2002.
[II.24] Shigeo SUGIMOTO, Jun ADACHI, Stuart WEIBEL; 68
th
IFLA
Council and General Conference; August 24 2002.
[II.25] Stiching SURF; DARE use of Dublin Core, version 2.0; December
2004.

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 122 - 0112398 – T Th Ngc Thanh
[II.26] CEN/ISSS MII – DC (WI3) Report; Guidance for the Deployment of
Dublin Core Metadata in Corporate Environments; 8/20/2004 DRAFT.
[II.27] Kazuhiko Asou, Takako Nakahara, Takao Namiki; A report on Dublin
Core based research information service on mathematics; 10/26/2001.
[II.28] Western States Digital Standards Group, Metadata Working Group;
Western States Dublin Core Metadata Best Practices, Version 2.0; 01/12/2005.
[II.29] Jay Cross, CEO, Internet Time Group; eLearning; mid – 1999.
[II.30] ADOBE; A primer on electronic document security; 11/2004.

[II.31] Gerhard U. Bartsch; Introduction to Electronic Document Management
Whitepaper ; March 16 2003.
[II.32] Andreas Hotho; Using Ontologies to Improve the Text Custering and
Classification Task; January 14 2005.
[II.33] Norman Paskin; DOI: implementing a standard digital identifier as the
key to effective digital rights management; March 9 2000.
III. Website:
[III.1] W3C SemanticWeb Activity
/>
[III.2] Semantic web server


[III.3] RDF
/>
[III.4] Tim Berners – Lee Notation3
/>
[III.5]


[III.6]
/>
[III.7] RDQL: RDF Data Query Language
/>
[III.8] RDF/XML Syntax Specification
/>grammar/

[III.9] DAML


[III.10] RDF Data




 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 123 - 0112398 – T Th Ngc Thanh
[III.11] National Information Standards Organization


[III.12] Intellidimension: Delivering a Platform for the Semantic Web
/>
[III.13] eLib
/>.






























 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 124 - 0112398 – T Th Ngc Thanh


PH LC
1. Cú pháp RDF:

rdfs:Resource
T#t c mi th c mô t bi RDF c gi là resources và là thành viên c$a class
rdfs:Resource
rdfs:Literal
Lp rdfs:Listeral i din cho mt lp các giá tr ký t nh là strings và intergers. Ví
d!: thuc tính giá tr: chui text
rdfs:XMLLiteral
Lp rdfs:XMLLiteral i din cho lp giá tr chui c$a XML.
rdfs:Class
Lp này tng ng vi khái nim chung type ho"c là catalog c$a tài nguyên.
RDF class membership (quan h thành viên lp RDF) c s% d!ng  i din cho
types và catalog c$a tài nguyên. Hai lp có th có cùng thành viên.

rdf:Property
rdf:Property i din cho nhng tài nguyên có thuc tính RDF.
rdfs:Datatype
rdfs:Datatype i din cho nhng tài nguyên có các kiu d liu RDF.
rdf:type
Thuc tính rdf:type cho bit mt tài nguyên là thành viên c$a class nào.
Khi mt tài nguyên có mt thuc tính rdf:type mà giá tr c$a thuc tính này là mt s
class xác nh, thì chúng ta nói r0ng tài nguyên là mt instance of c$a class xác nh
này.

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 125 - 0112398 – T Th Ngc Thanh
Giá tr c$a thuc tính rdf:type s* luôn là mt tài nguyên – tài nguyên này là mt th
hin (instance) c$a rdfs:Class. Tài nguyên này c bit nh là rdfs:Class bn thân nó
là mt tài nguyên c$a mt rdf:type rdfs:Class. (Bn thân nó c/ng là mt kiu – type
c$a mt lp).
rdfs:subClassOf
Thuc tính rdfs:subClassOf i din cho mi quan h chu5n hoá gia các class c$a
mt tài nguyên. Thuc tính rdfs:subClassOf là mt transitive.
rdfs:subPropertyOf
Thuc tính rdfs:subPropertyOf là mt th hin (instance) c$a rdf:Property, c s%
d!ng  xác nh mt thuc tính là mt chu5n c$a mt cái khác.
H thng c#p bc thuc tính con có th c s% d!ng  trình bày h thng c#p bc
c$a các ràng buc v range và domain.
Chú ý:
Thut ng “super – property” ôi khi c s% d!ng  cho bit mi quan h
gia mt s thuc tính vi nhiu thuc tính ph. bin khác, ví d! là mi quan h
rdfs:subPropertyOf.
rdfs:range
Mt th hin c$a rdf:Property c s% d!ng  cho bit các class nào mà giá tr c$a

mt thuc tính s* là thành viên c$a nó.
Giá tr c$a mt thuc tính rdfs:range luôn luôn là mt Class. Thuc tính rdfs:range bn
thân nó có th c s% d!ng  biu di-n iu này: The rdfs:range of rdfs:range is the
class rdfs:Class. iu này cho th#y r0ng b#t k3 mt tài nguyên nào là giá tr c$a thuc
tính range s* là mt class.
Thuc tính rdfs:range ch& c áp d!ng i vi các thuc tính. iu này c/ng c
miêu t trong RDF thông qua vic s% d!ng thuc tính rdfs:domain. The rdfs:Domain
of rdfs:range is the class rdf:Property. iu này cho th#y r0ng thuc tính range áp
d!ng i vi các tài nguyên mà bn thân nó c/ng là các thuc tính (property).
rdfs:domain
Mt th hin c$a rdf:Property c s% d!ng  cho bit class nào s* có thành viên là
b#t k3 mt tài nguyên nào sao cho thuc tính c$a nó c ch& nh.

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 126 - 0112398 – T Th Ngc Thanh
The rdfs:domain of rdfs:domain is the class rdf:Property. iu này cho th#y r0ng
thuc tính domain c s% d!ng trên các tài nguyên là các thuc tính.
The rdfs:range of rdfs:domain is the class rdfs:Class. iu này cho th#y r0ng b#t k3
mt tài nguyên nào mà là giá tr c$a mt thuc tính domain s* là mt class.
rdfs:label
Thuc tính rdfs:label c s% d!ng  cung c#p phiên bn tên c$a tài nguyên mà con
ngi có th c c.
rdfs:comment
Thuc tính rdfs:comment c s% d!ng  cung c#p s mô t tài nguyên mà con ngi
có th c c.
Mt dòng chú thích b0ng text (textual comment) giúp làm rõ ng ngh a c$a các class
và các property c$a RDF.

Các lp và các thuc tính RDF Utility và Container


RDF nh ngh a thêm mt s class và property, bao g1m xây dng cách biu di-n các
container và các phát biu RDF, và cách m rng mô t t vng RDF trên world wide
web.

Các lp và các thuc tính RDF Container
rdfs:Container
Lp rdfs:Container là mt super – class c$a các lp Container c$a RDF, ví d!:
rdf:Bag, rdf:Seq, rdf:Alt.

rdf:Bag
Lp rdf:Bag i din cho c#u trúc container ‘Bag’ c$a RDF, và là mt lp con c$a lp
rdfs:Container.




 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 127 - 0112398 – T Th Ngc Thanh
rdf:Seq
Lp rdf:Seq i din cho c#u trúc container ‘Sequence’ c$a RDF, và là mt lp con
c$a lp rdfs:Container.

rdf:Alt
Lp rdf:Alt i din cho c#u trúc container ‘Alt’ c$a RDF, và là lp con c$a lp
rdfs:Container.

rdfs:ContainerMembershipProperty
Lp rdfs:ContainerMembershipProperty vi t cách là thành viên c$a thuc tính
rdfs:member và các thuc tính _1, _2, _3, … có th c s% d!ng  cho bit quan h
thành viên c$a các container Baq, Seq, và Alt. rdfs:ContainerMembershipProperty là

mt lp con (subclass) c$a rdf:Property. Mi thuc tính trong quan h thành viên c$a
container là mt rdfs:subPropertyOf c$a thuc tính rdfs:member.

rdfs:member
Thuc tính rdfs:member là mt siêu thuc tính (super – property) c$a các thuc tính
trong quan h thành viên c$a container.

rdf:List
Lp rdf:List i din cho lp các danh sách lit kê (Lists) c$a RDF. Nó c s% d!ng
vi các construct nh ‘first’, ‘rest’, và ‘nil’, và nó c h tr trong cú pháp
RDF/XML.

rdf:first
Thuc tính rdf:first i din cho mi quan h gia rdf:List và phn t% (item) u tiên
c$a nó.

rdf:rest

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 128 - 0112398 – T Th Ngc Thanh
Thuc tính rdf:rest i din cho mi quan h gia phn t% (item) rdf:List vi các phn
t% còn li trong danh sách (list), ho"c vi phn t% cui c$a nó (ví d!, rdf:nil).

rdf:nil
Tài nguyên rdf:nil i din cho mt rdf:List rng (empty).

Các lp và các thuc tính RDF Utility
rdfs:seeAlso
Thuc tính rdfs:seeAlso c s% d!ng  cho bit mt tài nguyên có th cung c#p
thông tin RDF thêm vào v tài nguyên ch$  (subject resource).


rdfs:isDefinedBy
Thuc tính rdfs:isDefinedBy là mt thuc tính con c$a rdfs:seeAlso, và cho bit tài
nguyên nào ang nh ngh a tài nguyên ch$ .

rdf:value
Thuc tính rdf:value nhn bit giá tr ch$ yu (thng là chui) c$a mt thuc tính khi
giá tr thuc tính là mt tài nguyên có c#u trúc (structured resource).

rdf:Statement
Lp rdf:Statement i din cho các phát biu v các thuc tính c$a các tài nguyên.
rdf:Statement là domain (l nh vc) c$a các thuc tính: rdf:predicate, rdf:subject và
rdf:object.
Các th hin (instance) rdf:Statement c lp khác có th có cùng giá tr cho các thuc
tính predicate, subject và object c$a chúng.

rdf:subject
Ch$  c$a mt phát biu (statement) RDF.
Thuc tính rdf:subject cho bit mt tài nguyên là ch$  c$a mt s phát biu RDF.

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 129 - 0112398 – T Th Ngc Thanh
The rdfs:domain of rdf:subject is rdf:Statement and the rdfs:range is rdfs:Resource.
Thuc tính này có th c s% d!ng  xác nh tài nguyên nào c mô t bi mt
phát biu RDF.

rdf:predicate
V ng (predicate) c$a mt phát biu RDF.
The rdfs:domain of rdf:predicate is rdf:Statement and the rdfs:range is rdfs:Resource.
Thuc tính này c s% d!ng  xác nh v ng nào c s% d!ng trong mt phát

biu RDF.

rdf:object
Túc t (tân ng) c$a mt phát biu RDF.
The rdfs:domain of rdf:object is rdf:Statement. Thuc tính range không c nh
ngh a cho thuc tính này bi vì các giá tr c$a rdf:object có th bao g1m c Literals
và Resources. Thuc tính này có th c s% d!ng  xác nh túc t c$a mt phát
biu RDF.


2. RDF Gateway:

Công ty Intellidimension, n0m ti Windsor, Vermont (USA) ã to ra mt nn
RDF thng mi c gi là RDF Gateway. im mnh c$a công c! này là tính d- s%
d!ng và mang chuyn. RDF Gateway ch& gii hn trên nn Microsoft Windows, hin
nay vn cha có mt k hoch nào cho s ra i c$a mt phiên bn cho Linux hay mt
h iu hành khác.
Sn phm RDF Gateway ra i cùng lúc vi s ra i c$a công ty
Intellidimension vào tháng 6 nm 2000. Phiên bn kim nghim beta c$a nó c ra
mt vào nm 2001. Nhng nhà lp trình ã  xu#t và tho lun các tính nng c$a h
thng trong di-n àn tho lun chung c$a W3C. Cui cùng thì phiên bn thng mi
1.0 ra i vào ngày 3 tháng 3 nm 2003.

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 130 - 0112398 – T Th Ngc Thanh
Bi vì ây là mt phn mm thng mi, nên nó c/ng cn có bn quyn. Tuy
nhiên vn là mi-n phí i vi các m!c ích hc tp phát trin.
2.1. Kin trúc c a RDF Gateway:

RDF Gateway là mt server nh và nhanh, nó có th liên kt các tính nng c$a

mt h qun tr c s d liu và web server. Nó c thit k nh là mt khung nn
cho vic tp hp, truy v#n, chuyn .i và phân phi d liu RDF.

Hình 24: Kin trúc c a RDF Gateway

o B x lý bn mã RDFQL (RDFQL Script Processor)

RDFQL Script Processor là mt máy o u tiên (preemptive virtual
machine) có th biên dch, lu tr, và thc thi các on script RDFQL. RDFQL là mt
ngôn ng scripting phía server da trên ECMA Script (Java Script). RDFQL tích hp
các m rng truy v#n ta SQL  d- dàng truy cp n b máy c s d liu suy di-n
c$a RDF Gateway. RDFQL script processor cho phép các trang (pages) – có s kt

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 131 - 0112398 – T Th Ngc Thanh
hp c$a script và ni dung t nh tng t nh Microsoft Active Server Pages (ASP).
Server c c kt ni n RDFQL thông qua mt th vin c$a các i tng bên
trong (Server, Session, Request, Response, …).
o Database Engine

RDF Gateway có mt b máy c s d liu suy di-n – c thit k t
nn không h tr ho"c có h tr RDF. Nó thc hin ánh giá truy v#n theo chin lc
bottom – up, c t. chc liên on theo t#t c các tài nguyên d liu xác nh. Kh
nng suy lun logic c$a b máy cung c#p s h tr cho cú pháp các lut khai báo c$a
RDFQL. B máy c s d liu không truy cp n mt h thng qun lý d liu bên
ngoài.
o Data Service Interface: (Giao di&n d-ch v d% li&u)

Giao din dch v! d liu cho phép các tài nguyên d liu t bên ngoài
c tích hp vi RDF Gateway. Mt nhà cung c#p dch v! d liu là mt mô – un

thc thi giao din này và biu di-n các ni dung c$a mt kiu xác nh c$a tài nguyên
d liu nh là d liu RDF. RDFQL cho phép t. chc liên on các câu v#n tin c
thi hành thông qua nhiu dch v! d liu. Giao din m này làm cho nó có th s% d!ng
b#t k3 mt nhà cung c#p dch v! d liu s6n có hin ti nào ho"c phát trin mt nhà
cung c#p theo ý mình cho mt ngu1n d liu.
o Authentication/Security:

RDF Gateway có mt mô hình bo mt da trên quyn và s cho phép
iu khin truy xu#t n server và các tài nguyên c s d liu. RDF Gateway h tr
cho nhng user c$a nó và các role c/ng nh user và group c$a NT. Mt NT user luôn
 chng thc b0ng cách s% d!ng mt s u4 nhim c$a NT cho tài khon. S h tr
c$a RDF Gateway cho i vi các user và group c$a NT làm cho có th qun tr bo
mt t bên ngoài.
o Network IO

Giao din mng h tr c HTTP và TCP/IP da trên giao thc. Tng
nhp xu#t mng (network IO layer) h tr lc 1 chng thc mng bo mt nh là

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 132 - 0112398 – T Th Ngc Thanh
NT Challenge/ Response (NTLM). Mt client kt ni n server thông qua mt
interface (giao din).
o Package Management

RDF Gateway cho phép thc thi các ng d!ng  c phát trin và
trin khai nh là các package. Mt package bao g1m các trang server RDF, các trang
HTML, các hình nh ho"c b#t k3 mt kiu file nào khác.
o Component Management

RDFQL h tr COM trong script phía server c$a nó. iu này cho phép

tính nng c$a RDF Gateway có th c m rng ho"c i vi các ng d!ng c tích
hp vi RDF Gateway.
o Session Management

B qun lý phiên làm vic cho phép lu li trng thái c$a ngi dùng
trên server.

2.2. Tính n8ng (Features)

o Bi6u di;n các b ba RDF vào trong các bng d% li&u:

H bin hoá RDBMS ( RDBMS paradigm) c$a vic lu tr d liu trong
các bng c lp vào  lu tr các b ba RDF (triples). Mô hình d liu c$a các
bng là mt b ba bao g1m: predicate, subject, và object. Các ct c$a bng không có
tên nhng luôn cha 3 thành phn c$a b ba này theo th t. Lu ý là predicate là
thành phn u tiên. Có mt ct tu3 chn th t cho lu tr siêu d liu v triple (b
ba), siêu d liu này c gi là “context” c$a b ba. Trng context có th lu tr
mt nh danh tài nguyên mà nh danh này có th c s% d!ng  gii quyt các v#n
 bo mt ho"c nhn din tài nguyên c$a b ba ho"c b#t k3 mt tính nng quen thuc
nào.
o Other data sources: (Các ngu.n d% li&u khác)

Các ngu1n d liu bên ngoài và các c s d liu ang hot ng c
truy xu#t t server c bao quanh các i tng c$a ngu1n d liu. Mt i tng

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 133 - 0112398 – T Th Ngc Thanh
ngu1n d liu (datasource object) có c#u trúc ging nh mt table, cha ng các b
ba trong các dòng. Có s h tr cho các bng trong b nh và nó có th to các trình
bao bc cho d liu bên ngoài.

o Databases

Vic lu tr các bng c phân thành các phn trong c s d liu.
Mt server có th cha nhiu c s d liu khác nhau, mt bng có th c to trong
mt c s d liu. Format c$a c s d liu là mt nh dng file s hu, mi c s
d liu c lu trong mt file.
o RDFQL script language:

Ngôn ng scripting da trên ECMA script, thng c bit n nh là
Javascript. Các khái nim sau c cung c#p:
 Functions (các hàm)
 Variables và Arrays ( các bin và các mng)
 Câu lnh loops và If
 Exception handling (bt li)
 Import các file script khác.
 Comments (các chú thích)
 Các câu lnh (phát biu) trong RDF Gateway.
Các câu lnh cho RDF Gateway bao g1m mi khía cnh c$a server và
giúp ngi lp trình truy cp n t#t c các tính nng c$a nó. Mt ví d! là công c! c#u
hình server, công c! này là mt trang web c vit b0ng RDFQL c thông dch
bi mt web server c tích hp, và cho phép truy xu#t n t#t c các i tng c$a
server nh là: các table, các database, user và package.
 tìm ra c các dataset c$a b ba RDF, mt i tng RDF node
c cung c#p, nó thu thp t#t c các predicate và subject c$a mt i tng ã cho và
làm cho nó có th thay .i giá tr c$a các subject.
 chy các câu truy v#n trên server, mt tp các câu lnh c s d liu
cn phi s6n sàng. Các câu lnh c s d liu óng gói trong RDFQL script, câu lnh

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 134 - 0112398 – T Th Ngc Thanh

này thng c bit t các câu lnh SQL trong các file source C c tích hp bi
mt trình biên dch trc.
Truy cp n các i tng ActiveX và COM c h tr thông qua
phng thc khi gán (construct) c$a ngôn ng ActiveXObject.
Nu on script RDFQL c ánh giá trong ng cnh c$a web server, thì các i
tng cha d liu session, request và response c cung c#p.
o Adding and retrieving data (thêm và truy v(n d% li&u)

Các lnh thao tác d liu thì tng t vi cú pháp lnh trong SQL. Tính
nng c m rng i vi các nhu cu xác nh c$a RDF. Có các câu lnh nh:
INSERT, SELECT và DELETE. Các câu lnh này s% d!ng các bin (variable)  ràng
buc d liu, tng t nh ngôn ng RQL c s% d!ng bi RDFSuite.
INSERT {
[
[
[
'Oil on canvas'
} INTO museum;

Ví d! này ch& ra cách nào  insert mt b ba (triple) vào table
“museum”. B ba c vit gia 2 d#u ngo"c nhn (‘{‘ và ‘}’) và cha 4 giá tr:
 Context
 Predicate
 Subject
 Object ho"c Literal
Thông tin ng ngh a c$a b ba này có ngh a là: bc nh “abraham.jpg”
thuc v l nh vc “Oil on Canvas” và thông tin này c l#y t “www.artchive.com”.

SELECT ?a, ?b, ?c USING museum
WHERE {?a ?b ?c} AND ?c LIKE “Oil”;


 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 135 - 0112398 – T Th Ngc Thanh
 truy v#n các triple t mt table, thì câu lnh SELECT c s% d!ng.
Ví d! này truy xu#t t#t c các triple mà có cha t “oil” trong giá tr i tng literal.
Chú ý là triple  gia 2 d#u ngo"c nhn ch& cha 3 giá tr, context c b2 i.
D liu có th c l#y t các ngu1n d liu bên ngoài ho"c chuyn .i (tranfer) t
mt bng này n mt bng khác.
var doc = new DataSource(
"inet?url=file://c:/Museum.xml&parsetype=rdf");
SELECT ?a, ?b, ?c USING #doc WHERE {?a ?b ?c};
INSERT {?p ?s ?o} INTO museum USING #doc
WHERE {?p ?s ?o};
Trong ví d! này, mt d liu RDF c l#y t mt file text và c
insert vào bng museum. Lu ý là trong RDFQL Javascript, code c trn vi mt
on code ging nh SQL – bin javascript “doc” c s% d!ng trong lnh c s d
liu nh là “#doc”.
o Built – in Webserver (Webserver g<n lin)

RDF Gateway có mt Webserver gn lin.Giao din c#u hình và qunlý
c xu#t bn di dng web. Các nhà phát trin ng d!ng có th to các trang web
vi web server này, b0ng cách s% d!ng ngôn ng RDFQL script. Tính nng này có th
c s% d!ng trong vic debug và phát trin, nhng c/ng có th s% d!ng  xây dng
toàn b các ng d!ng web b0ng cách s% d!ng RDF Gateway. i vi v#n  s% d!ng
các i tng ActiveX thông qua RDFQL, web server c xem là r#t mnh.
o RDF Query Analyzer

Các câu lnh và các câu truy v#n RDFQL có th c to ra b0ng cách
s% d!ng ng d!ng o này (RQF Query Analyzer).



 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 136 - 0112398 – T Th Ngc Thanh

Hình 25: Giao di&n c a RQF Query Analyzer.

Query analyzer thì tng t nh các sn ph5m lng gía truy v#n c$a
các SQL Server ph. bin. Các script phc tp có th c to ra  ây và c s%
d!ng trong các trang web ho"c các ng d!ng khác. Các câu truy v#n có th c ánh
giá li mt ln na  RDF Gateway c!c b ho"c  xa, trình son tho vn vn (text
editor) có cú pháp  dng c highlight và có th lu và m các câu v#n tin.
o Inference Engine (máy suy di;n)

B máy c s d liu RDF Gateway g1m mt máy suy di-n. Các câu
lnh b ba RDF mi, có th c phát sinh mt cách t ng da trên các lut suy
di-n và các b ba ã có s6n. Các hàm (function) có th c nh ngh a, các hàm này
rút trích d liu t c s d liu da trên các lut. Các lut này c nh ngh a trong
ngôn ng RDFQL script và có th c s% d!ng trong các dòng lnh thao tác c s d
liu.
RULEBASE schema
{
INFER {[rdf:type] ?s ?class} FROM
{[rdf:type] ?s ?subclass} AND

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 137 - 0112398 – T Th Ngc Thanh
{[rdfs:subClassOf] ?subclass ?class};
};

SELECT ?p ?s ?o USING #ds RULEBASE schema WHERE

{[rdf:type] ?s ?o} AND {?p ?s ?o};
Ví d! này nh ngh a mt lut (rule) cho lc 1 RDF (RDF Schema) v
các subclass (lp con): Nu môt subject là mt kiu (type) c$a X và X c nh
ngh a là subject c$a Y, thì subject c/ng là mt kiu c$a Y. R1i sau ó lut này c s%
d!ng cho câu lnh SELECT  truy v#n t#t c các class và các class xu#t phát c$a t#t
c các subject.
Vn RDF Schema không c h tr bi RDF Gateway, nó phi c
mô t theo các lut suy di-n.
o Client Libraries

RDF Gateway có các th, cài client (client drivers) cho Microsoft ADO
và Sun Microsystems JDBC. iu này cho phép RDF Gateway h tr rng khp nhiu
client nh là các web browser, các ng d!ng Windows, các ng d!ng Java, XML ho"c
RDF da trên clients.
o Security

Khi truy cp vào RDF Gateway thông qua http, ADO ho"c các protocols
khác, ngi dùng phi c nhn bit b0ng cách s% d!ng username và password. Mt
tài khon ngi dùng (user account) là “anonymous” c cung c#p cho vic truy xu#t
chung (mi ngi u có th truy cp vào vi user account này).
H thng bo mt s% d!ng c hai loi: c s d liu bo mt c$a windows  xác nhn
các ngi dùng windows và mt c s d liu ngi dùng bên trong. C/ng nh
Internet Explore, NT Authentication (s chng thc  mc NT) có th c s% d!ng
vi http.
Mi thành phn (item) c qun lý bi RDF Gateway có th b gii
hn i vi các user c nh ngh a, các thành phn này bao g1m: các package, các

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc
0112274 – Phm Th M Phng - 138 - 0112398 – T Th Ngc Thanh
table, data source và các component. ( c#p  table, d- dàng  s%a .i vic c, vit,

và xoá các quyn cho các user riêng bit.
Mt khái nim bo mt da trên dòng i vi các lnh RDF trong các
table c da trên ct “context”, trng thêm vào th t này c add vào subject,
predicate, và object. Mt user có th c cho phép  c, vit, và xoá các quyn
(rights) i vi mt context riêng bit.
Không h có s h tr i vi mt nhóm ngi s% d!gn (user group –
trong RDF Gateway không có khái nim này).
o Configuration and Management (c(u hình và qun lý)

Các s sp "t (setting) c#u hình chi tit c truy cp thông qua giao
din web, giao din này c dn vào nh web server gn lin. Ngi dùng phi ng
nhp vào b0ng cách s% d!ng mt account có vai trò là administrator c$a windows.
7ng d!ng web này c "t tên là “RDF Gateway Management Utility” và cung c#p
truy cp n các databases, tables, users, contexts, ActiveX Components, Data
Services, Roles, Packages, MimeTypes và Timers. i vi hu ht các thành phn
này, thì các chn la bo mt v s cho phép có th c "t.
Tin ích qun lý c thc thi nh là RDF Gateway web package.

Trên ây là nhng gii thiu bao quát v RDF Gateway. Ngoài ra ta c/ng có th xem
thêm v cú pháp cu RDF Gateway khá chi tit trong phn help c$a tin ích RDF
Query Analyzer.


3. H& thng nhãn ng% ngh!a:
H thng nhãn ng ngh a c gii thiu  ây g1m 3 tiu h thng nh2 ng
vi 3 t loi: danh t, ng t và tính t. Trong mi tiu h thng, li c phân thành
2 c#p: c#p c bn cha mt s ít các nhãn chung nh#t, s% d!ng nhiu nh#t và là nhng
nhãn vit tt (gi nh) d* nh; và c#p chuyên sâu là nhng nhãn theo h thng

 tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc

0112274 – Phm Th M Phng - 139 - 0112398 – T Th Ngc Thanh
LLOCE. Ngoài ra, trong phn này, c/ng còn lit kê mt s h thng nhãn ng ngh a
khác nh WordNet, CoreLex.
3.1. Nhãn ng% ngh!a c bn cho danh t":

STT

Nhãn Mô t Ý ngh a
1

ABS Abstraction Nhng gì tru tng
2

ACT Act Hành ng
3

AGT Agent Tác nhân
4

ANM Animal Sinh vt
5

ART Artifact Nhân to
6

ATR Attribute Thuc tính
7

BDY Body C th con ngi
8


CEL Cell T bào
9

CHM Chemical Hoá ch#t
10

COM Communication Truyn tin
11

CON Consequence Hu qu
12

ENT Entity Thc th
13

EVT Event Bin c
14

FEL Feel S cm nhn
15

FEM Female Ging cái/ n
16

FOD Food Thc n
17

FRM Shape, form Hình dng
18


GAS Gas Th khí
19

GRB Group biology Nhóm sinh hc
20

GRP Group Nhóm nói chung
21

GRS Group social Nhóm xã hi
22

HOU House Công trình xây dng
23

HUM Human Con ngi

×