Tải bản đầy đủ (.pdf) (36 trang)

báo cáo khai phá mức độ sử dụng cho và trên web ngữ nghĩa

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.66 MB, 36 trang )

BÀI TIӆU LUҰ N WEB MINING
Tên bài báo: KHAI PHÁ MӬC ĐӜ SӰ DӨNG
CHO VÀ TRÊN WEB NGӲ NGHĨA
Ngưͥi d͓ch : Phan Lê Thi͏n
I.Tóm tҳt
y Khai phá web ngӳ nghĩa nhҵm mөc đích phӕi hӧp hai lĩnh vӵc
phát triӇn nhanh Semantic Web và Web Mining. Mөc đích Web
Mining là khám phá nhӳng hiӇu biӃt vӅ vҩn đӅ ngӳ nghĩa cӫa
tài nguyên Web và viӋc sӱ dөng chúng. Do tính chҩt chӫ yӃu là
cú pháp cӫa hoҥt đӝng khai phá dӳ liӋu Web, sӵ khám phá ra
ngӳ nghĩa là không thӇ chӍ dӵa trên cơ sӣ dӳ liӋu này. Do đó,
đӏnh dҥng ngӳ nghĩa cӫa tài nguyên web và sӵ điӅu hưӟng
hành vi ngày càng đưӧc sӱ dөng
y Semantic Web nâng cao chҩt lưӧng trên www bҵng máy xӱ lý
thông tin hӛ trӧ ngưӡi sӱ dөng trong công viӋc cӫa mình.
y Trong bài báo này, chúng tôi thҧo luұn sӵ tác đӝng qua lҥi cӫa
Semantic Web và Web Mining, vӟi trӑng tâm đһc biӋt vӅ khai
phá mӭc đӝ sӱ dөng.
II. Thông tin
y Khai phá mӭc đӝ sӱ dөng web là mӝt ӭng dөng cӫa nhӳng
phương pháp khai phá dӳ liӋu đӇ phân tích mүu tin sӱ dөng
web, thưӡng xuyên nhҩt trong biӇu mүu cӫa nhұt ký máy chӫ
web. Mӝt trong nhӳng vҩn đӅ chӫ yӃu là sӕ lưӧng lӟn cӫa các
mүu thưӡng đưӧc tìm thҩy, trong sӕ này,làm như thӃ nào có thӇ
xác đӏnh đưӧc mүu chú ý.
y Ví dө, mӝt ӭng dөng cӫa luұt phân tích kӃt hӧp đӇ đăng nhұp
web là bҧn thӕng kê tiêu biӇu cӫa 1 vài mүu quan sát rҵng 90%
ngưӡi sӱ dөng đã mua vào mӝt cӱa hàng trӵc tuyӃn cũng như
đã đӃn thăm trang chӫ cӫa mӝt mô hình đó là tҫm thưӡng bӣi
vì trang chӫ là điӇm vào chính cӫa trang web.
II. Thông tin


y Mӝt cách tiӃp cұn phә biӃn cho mô hình hoá các trang web và
cách sӱ dөng chúng là liên quan đӃn phương pháp kӻ thuұt
OLAP: OLAP là mӝt kӻ thuұt sӱ dөng các thӇ hiӋn dӳ liӋu đa
chiӅu gӑi là các kh͙i nhҵm cung cҩp khҧ năng truy xuҩt nhanh
đӃn dӳ liӋu cӫa kho dӳ liӋu. Tҥo khӕi cho dӳ liӋu trong các
bҧng chiӅu và bҧng sӵ kiӋn trong kho dӳ liӋu và cung cҩp khҧ
năng thӵc hiӋn các truy vҩn tinh vi và phân tích cho các ӭng
dөng client. OLAP đưӧc đһt ra đӇ xӱ lý các truy vҩn liên quan
đӃn lưӧng dӳ liӋu rҩt lӟn mà nӃu cho thӵc thi các truy vҩn này
trong hӋ thӕng OLTP sӁ không thӇ cho kӃt quҧ hoһc sӁ mҩt rҩt
nhiӅu thӡi gian.
II. Thông tin
y Mӝt vҩn đӅ thӭ hai phҧi đӕi mһt vӟi nhiӅu phân tích hiӋn tҥi
mà tính đӃn ngӳ nghĩa hӑc là đӏnh nghĩa thưӡng phҧi đưӧc chӃ
tác bҵng tay đӇ đҥi diӋn cho mӝt trang web đó có phát triӇn đӝc
lұp vӅ mӝt khái niӋm tәng thӇ và bҧn đӗ cӫa các trang cá nhân
đӇ khái niӋm này có thӇ đưӧc thiӃt lұp. Như vұy sӁ là mong
muӕn đӇ có mô hình phong phú cӫa trang web, khái niӋm cӫa
nó và cҩu trúc cӫa nó (siêu liên kӃt), mӝt mô hình đӇ chөp sӵ
phӭc tҥp cӫa các mӕi quan hӋ đa dҥng giӳa các khái niӋm đӅ
cұp trong trang web, và mô hình đó là ³xây dӵng vào´ trang
web trong câu đó mà trang theo yêu cҫu cӫa khách là ngay khi
liên kӃt vӟi khái niӋm và mӕi quan hӋ cӫa nó.
II. Thông tin
y Các web ngӳ nghĩa chӍ là thӃ này: hiӋn nay làm giàu bҵng web
cӫa mӝt ngӳ nghĩa chính thӭc ӣ dҥng cӫa bҧn thӇ hӑc mà nҳm
bҳt đưӧc ý nghĩa cӫa trang và các liên kӃt mүu có thӇ hiӇu đưӧc
máy. Ý tưӣng chính cӫa Semantic Web là thông tin quá trình
máy trong trình tӵ đӇ cho phép dӵa trên nhӳng công cө ngӳ
nghĩa cӫa ngưӡi sӱ dөng.

y Trong bài báo này, chúng tôi thҧo luұn trên mӝt phía mà
Semantic Web có thӇ cҧi thiӋn khai thác sӱ dөng, và mӝt phía
khác làm sao khai thác sӱ dөng có thӇ dùng đӇ xây dӵng
Semantic Web
II. Thông tin
y Chúng tôi sӱ dөng kǤ hҥn Semantic Web Mining đӇ biӇu thӏ
nhӳng phương pháp khác nhau vӅ khai thác Semantic Web và
khai thác cho các Semantic Web. Bên cҥnh Semantic Web
Usage Mining, Semantic Web Mining cũng bao gӗm Semantic
Web Content và Structure Mining. Chúng tôi thҧo luұn vӅ quan
điӇm chung vӅ Semantic Web Mining trong (5) . Trong bài báo
này,chúng tôi sӁ tұp trung vào nhiӅu khía cҥnh đһc biӋt cӫa
Semantic Web Usage Mining.
y Lý tưӣng nhҩt, tҩt cҧ các phương pháp giҧi quyӃt trên nên
đưӧc kӃt hӧp đӇ đi tӯ trang web và cách dùng cӫa nó tӟi ngӳ
nghĩa hӑc cӫa nó và ngưӧc lҥi
III. Web (Usage) Mining
y Khai phá Web là viӋc áp dөng các kӻ thuұt khai phá dӳ liӋu theo khái
niӋm, cҩu trúc và sӱ dөng các tài nguyên web. ĐiӅu này có thӇ giúp
khám phá toàn cҫu cũng như cҩu trúc cөc bӝ trong và giӳa các trang
web. Giӕng như sӵ ӭng dөng khai phá dӳ liӋu khác, khai phá web có
thӇ có lӧi nhuұn tӯ viӋc đưa cҩu trúc cho dӳ liӋu (như trong các bҧng
cơ sӣ dӳ liӋu), nhưng nó cũng có thӇ cung cҩp chung cҩu trúc hoһc
không có cҩu trúc dӳ liӋu như văn bҧn dҥng tӵ do. ĐiӅu này có nghĩa
Web Mining là mӝt trӧ giúp vô giá trong viӋc chuyӇn đәi tӯ nӝi dung
dӉ hiӇu cӫa con ngưӡi đӃn máy ngӳ nghĩa dӉ hiӇu.
y Sӵ khác biӋt này thưӡng thӵc hiӋn giӳa khai phá web đó hoҥt đӝng
trên tài nguyên web cӫa chính nó (thưӡng xuyên phân biӋt trong nӝi
dung và cҩu trúc khai phá) và khai phá mà hoҥt đӝng vӅ cách sӱ
dөng cӫa khách vӅ tài nguyên này.

III. Web (Usage) Mining
y Nӝi dung khai phá web là mӝt dҥng khai phá văn bҧn. Nó tұp
trung trong khái niӋm vӅ các trang cá nhân, nó chӭa trong tұp
lӋnh HTML«mã hoá cái đó tҥo ra mӝt trang. Vì vұy nó có thӇ
tұn dөng nhӳng cҩu trúc chung cӫa nhӳng kiӇu văn bҧn. Cҩu
trúc siêu liên kӃt giӳa các trang là, trên mӝt phía, cҩu trúc bên
trên và ӣ trên các trang cá nhân. Đây là cách dùng trong khai
phá cҩu trúc web gҫn giӕng như thuұt toán Google PageRank
xác đӏnh sӵ liên quan cӫa mӝt trang vӟi trang khác ³trích dүn´
nó như thӃ nào. Mӝt mһt khác, các siêu liên kӃt là mӝt phҫn
cӫa nguyên văn khái niӋm cӫa 1 trang.
y ĐiӅu này đһc biӋt đúng vӟi các trang trong siêu liên kӃt, như
các yӃu tӕ khác, là (ngӳ nghĩa) tăng lên rõ ràng.
III. Web (Usage) Mining
y Trong khai phá mӭc đӝ sӱ dөng web ,tài nguyên web chính đó là khai phá
là mӝt mүu tin lӡi đӅ nghӏ cӫa khách hàng khi đӃn trang web,thưӡng phҫn
lӟn tұp hӧp trong mӝt nhұt ký máy chӫ web. Nӝi dung và cҩu trúc cӫa trang
web, và trong sӵ đһc biӋt cӫa mӝt trang web, phҧn ánh ý đӏnh cӫa tác giҧ và
nhà thiӃt kӃ vӅ các trang và thông tin mô hình cơ bҧn. Hành vi thӵc tӃ cӫa
ngưӡi sӱ dөng vӅ tài nguyên này có thӇ tìm thҩy bә sung cҩu trúc.
y Đҫu tiên, mӕi quan hӋ có thӇ đưӧc thuyӃt phөc bҵng cách sӱ dөng nơi
không có cҩu trúc đһt biӋt đưӧc thiӃt kӃ.
y Ví dө, trong danh mөc online cӫa sҧn phҭm thưӡng có cҩu trúc hoһc không
có hoһc mӝt hoһc mӝt sӕ cҩu trúc phân cҩp đưa ra các loҥi sҧn phҭm,các
nhà sҧn xuҩt «khai phá viӋc ghé thăm đӃn trang web, tuy nhiên, ngưӡi ta
có thӇ tìm thҩy rҵng nhiӅu ngưӡi sӱ dөng quan tâm đӃn sҧn phҭm A cũng
quan tâm sҧn phҭm B.
III. Web (Usage) Mining
y Thӭ hai, mӕi quan hӋ có thӇ đưӧc gây ra bӣi viӋc sӱ dөng mӕi
quan hӋ khác nhau đưӧc dӵ đӏnh. Ví dө, trình tӵ khai phá có

thӇ thҩy nhiӅu ngưӡi sӱ dөng ghé thăm trang C sau đó đi đӃn
trang D, dӑc theo đưӡng dүn ra dҩu kéo dài tìm kiӃm (thưӡng
xuyên ghé thăm đӇ trӧ giúp và chӍ mөc trang, thưӡng xuyên rút
lui«) ĐiӅu này có thӇ đưӧc giҧi thích vӟi nghĩa là khách hàng
muӕn đҥt D tӯ C, nhưng điӅu này không biӃt trưӟc trong cҩu
trúc thông tin, vì thӃ hiӋn tҥi không có siêu liên kӃt tӯ C đӃn D.
y Sӵ hiӇu biӃt này có thӇ dùng đӇ cҧi tiӃn các trang web tĩnh cho
tҩt cҧ ngưӡi sӱ dөng (thêm vào link tӯ C đӃn D), hay cho
nhӳng khuyӃn cáo đӝng đưӧc biӃn thành chuyӋn cá nhân cho
tұp con cӫa nhӳng ngưӡi sӱ dөng mà đi đӃn C
III. Web (Usage) Mining
y Nó thì hӳu ích đӇ kӃt hӧp khai phá sӱ dөng web vӟi nӝi dung
và cҩu trúc trình tӵ phân tích đӇ ³có ý nghĩa´ đưӡng dүn quan
sát thưӡng xuyên và các trang trên các đưӡng dүn. ĐiӅu này có
thӇ đưӧc thӵc hiӋn bҵng nhiӅu phương pháp. Phҫn lӟn trong sӕ
nhӳng phương pháp dӵa trên bҧn vӁ cӫa trang trong bҧn thӇ
hӑc. Và ưu tiên bҧn thӇ hӑc và ánh xҥ cӫa trang vào đó có thӇ
đã có sҹn, ánh xҥ cӫa trang trong bҧn thӇ hӑc hiӋn nay có thӇ
cҫn có nghiên cӭu, và/hoһc bҧn thӇ hӑc chính nó có thӇ có
đưӧc suy ra trưӟc tiên.
IV. Semantic Web
y Semantic Web là dӵa trên mӝt tҫm nhìn cӫa Tim Berners-Lee,ngưӡi
sáng tҥo ra WWW. Sӵ thành công to lӟn cӫa ngưӡi lãnh đҥo WWW
hiӋn nay dүn đӃn mӝt thách thӭc mӟi : mӝt lưӧng lӟn cӫa dӳ liӋu có
thӇ đưӧc giҧi thích bӣi chӍ con ngưӡi, máy móc hӛ trӧ đưӧc giӟi hҥn.
Berners-Lee gӧi ý làm giàu cho web bҵng thông tin quá trình máy hӛ
trӧ ngưӡi dùng trong nhiӋm vө cӫa anh ҩy. Ví dө, công cө tìm kiӃm
ngày nay đã khá mҥnh, nhưng cho đӃn khi trҧ vӅ nhӳng danh sách
quá lӟn hay không đӫ truy cұp. Thông tin quá trình máy có thӇ điӇm
qua các công cө tìm kiӃm đӃn trang có liên quan và do đó có thӇ cҧi

thiӋn đӝ chính xác và khă năng trҧ vӅ.
y Ví dө, ngày nay hҫu như không thӇ lҩy lҥi thông tin vӟi tӯ khoá tìm
kiӃm khi thông tin đưӧc lan trên mӝt sӕ trang.
IV. Semantic Web
y Qu á trình xây dӵng Semantic web ngày nay thì vүn diӉn ra
nһng nӅ. Cҩu trúc cӫa nó có đưӧc xác đӏnh và cҩu trúc này
sau đó có đáp ӭng đưӧc vӟi cuӝc sӕng . ĐӇ thӵc hiӋn nhiӋm
vө khҧ thi này ,ta nên bҳt đҫu vӟi nhӳng nhiӋm vө đҫu tiên
đơn giҧn. Các bưӟc sau thҩy đưӧc nơi mà Semantic Web
hưӟng vӅ:
 Cung cҩp mӝt cú pháp chung đӇ máy hiӇu phҫn trình bày.
 ThiӃt lұp tӯ vӵng phә biӃn.
 Đӗng ý vӅ mӝt ngôn ngӳ hӧp lý.
 Sӱ dөng ngôn ngӳ đӇ trao đәi chӭng cӭ.
IV. Semantic Web
y Berners-Lee đӅ nghӏ mӝt tҫng cҩu trúc cho Semantic Web :
Unicode/URI
XML/Name Spaces/ XML Schema
RDF/RDF Schema
Ontology vocabulary
Logic
Proof
Trust
y Cҩu trúc này phҧn ánh các bưӟc liӋt kê ӣ trên. Nó đi theo sӵ
hiӇu biӃt đó mӛi bưӟc riêng sӁ đưӧc cung cҩp giá trӏ gia tăng,
vì vұy Semantic có thӇ nhұn ra trong mӝt gia tăng kiӇu cách .
IV. Semantic Web
y Trên 2 tҫng đҫu tiên,mӝt cú pháp thông thưӡng đưӧc cung cҩp.
Chuӛi đӏnh danh tài nguyên (URIs) cung cҩp mӝt tiêu chuҭn đӇ
tham chiӃu tӟi nhӳng thӵc thӇ, trong khi Unicode là chuҭn đӇ

trao đәi các biӇu tưӧng. Ngôn ngӳ đánh dҩu có thӇ mӣ rӝng
(XML) sӳa mӝt ký hiӋu đӇ mô tҧ nhӳng cҩu trúc cây đã đưӧc
gán nhãn, và XML Schema cho phép xác đӏnh ngӳ pháp cho
hӧp lӋ tài liӋu XML. Tài liӋu XML có thӇ đӅ cұp các tên không
gian khác nhau đӇ làm rõ ngӳ cҧnh cӫa tӯ khóa khác nhau.
Ngày nay nhӳng hình thӭc hóa 2 lӟp trên đã đưӧc công nhұn
rӝng rãi, và con sӕ cӫa các tài liӋu XML thì tăng lên nhanh
chóng.
IV. Semantic Web
y Khung mô tҧ tài nguyên (RDF) có thӇ thҩy như lӟp đҫu tiên là mӝt
phҫn cӫa Semantic web, theo giӟi thiӋu W3C, RDF ³là mӝt nӅn tҧng
đӇ xӳ lý siêu dӳ liӋu; nó cung cҩp tính vұn hành vӟi nhau giӳa nhӳng
ӭng dөng mà trao đәi thông tin có thӇ hiӇu đưӧc máy trên Web.´ Tài
liӋu RDF gӗm có 3 loҥi khái niӋm: nguӗn tài nguyên, thuӝc tính và
câu phát biӇu. Tài nguyên có thӇ có ӣ các trang web, là mӝt thành
phҫn hoһc tұp hӧp cӫa trang web ,hoһc bҩt cӭ chӫ thӇ hay bҩt kǤ đӕi
tưӧng (thӃ giӟi thӵc sӵ) nào mà không trӵc tiӃp chia ra cӫa WWW.
y Trong RDF ,tài nguyên thì luôn luôn đӇ đӏa chӍ là URIs. Thuӝc tính
là mӝt tính chҩt,đһc điӇm hoһc mӕi quan hӋ mô tҧ mӝt tài nguyên
đһc biӋt. Mӝt tài nguyên giӕng như mӝt thuӝc tính có giá trӏ cho tài
nguyên đó dҥng câu lӋnh RDF. Mӝt giá trӏ hoһc mӝt chӳ, mӝt tài
nguyên, hoһc câu lӋnh khác. Theo đó câu lӋnh có thӇ coi như bӝ ba
đӕi tưӧng ± thuӝc tính ± giá trӏ.
IV. Semantic Web
y Mô hình dӳ liӋu cơ sӣ RDF cơ bҧn là mӝt đӗ thӏ đã đưӧc dán nhãn
đӏnh hưӟng. Đӏnh nghĩa RDF Schema mӝt mô hình ngôn ngӳ đơn
giҧn trên đҫu cӫa RDF nó bao gӗm các lӟp. là mӝt mӕi quan hӋ giӳa
lӟp và giӳa các thuӝc tính ,và lĩnh vӵc/miӅn hҥn chӃ cho thuӝc tính.
RDF và RDF Schema thì lưu ý vӟi các cú pháp XML nhưng không
thӇ giúp cho cây ngӳ nghĩa hӑc cӫa XML.

y Lӟp tiӃp theo là bҧn thӇ hӑc tӯ vӵng và logic. Ngày nay cӝng đӗng
Semantic Web xem xét nhӳng mӭc này như mӝt mӭc đơn như đa sӕ
nhӳng bҧn thӇ luұn kӇ cҧ tiên đӅ logic. Mӝt bҧn thӇ hӑc là ³mӝt hình
thӭc hóa rõ ràng cӫa viӋc chia sӁ hiӇu biӃt cӫa mӝt nhұn thӭc´. Khái
niӋm ӣ mӭc đӝ cao này cho thҩy rõ sӵ khác biӋt bҵng viӋc nghiên
cӭu các cӝng đӗng khác nhau
IV. Semantic Web
y Trên hӃt, bҩt kǤ cơ chӃ trình bày kiӃn thӭc nào cũng có thӇ giӳ vai
trò cӫa mӝt ngôn ngӳ web ngӳ nghĩa
y Frame Logic, cung cҩp mӝt cách ngӳ nghĩa hӑc thành lұp sӵ trình
bày kiӃn thӭc dӵa trên khung và vӏ trí phép ҭn dө. Có lӁ khung đҥi
chúng nhҩt lúc này là nhӳng logic mô tҧ(Description Logic -DL). DL
là tұp hӧp con cӫa tұp logic đҫu tiên khác mà khi tұp trung vào thì
càng diӉn cҧm tӕt trong khi vүn còn dӉ quyӃt đӏnh. Mô tҧ logic
SHIQ cung cҩp cơ sӣ cho ngôn ngӳ web DAML+OIL.
y Đó là nhӳng phiên bҧn gҫn đây nhҩt đưӧc thiӃt lұp bӣi nhóm bҧn thӇ
luұn W3C Web (WebOnt) dưӟi tên OWL.
y Vài công cө đang sӱ dөng cho sӵ tҥo thành và bҧo trì cӫa nhӳng bҧn
thӇ luұn và siêu dӳ liӋu, cũng như cho lý luұn bên trong cӫa nó.
IV. Semantic Web
y Nhóm cӫa chúng tôi đã phát triӇn OntoEdit, mӝt trình biên tұp bҧn
thӇ luұn mà khi đưӧc kӃt nӕi vӟi Ontobroker, mӝt đӝng cơ suy luұn
cho F-Logic. Nó cung cҩp có nghĩa cho ngӳ nghĩa hӑc nhӳng cách
trình bày truy vҩn qua nhӳng tài nguyên phân tán.
y Mӟi đây, cơ cҩu bҧn thӇ hӑc Karlsruhe KAON đã đưӧc thiӃt lұp như
sӵ tiӃp tөc cӫa OntoEdit. Đó là mӝt cơ sӣ hҥ tҫng quҧn lý bҧn thӇ
luұn nguӗn mӣ nhҳm tӟi nhӳng ӭng dөng kinh doanh cӕt cho mӝt bӝ
công cө toàn diӋn. KAON cho phép tҥo và quҧn lý bҧn thӇ luұn dӉ
dàng, tӕt hơn cho viӋc xây dӵng ӭng dөng trên nӅn bҧn thӇ luұn. Mӝt
kӃt nӕi tӟi đӝng cơ suy luұn FaCT8 cho sӵ mô tҧ ngôn ngӳ SHIQ là

lұp kӃ hoҥch.
y Hai lӟp này ngày nay hiӃm khi đưӧc chһn, nhưng làm quan tâm đӃn
nhӳng chӫ đӅ nghiên cӭu trong tương lai. Trong bài báo này, chúng
tôi sӁ tұp trung tӟi XML, RDF, bҧn thӇ luұn và lӟp logic.
V. Sӱ dөng ngӳ nghĩa hӑc cho khai phá mӭc đӝ sӱ dөng
và khai phá mӭc đӝ sӱ dөng cӫa Web ngӳ nghĩa.
y Ngӳ nghĩa hӑc có thӇ đưӧc dùng cho khai phá mӭc đӝ sӱ dөng Web
cho nhӳng mөc đích khác nhau. Mӝt sӕ phương pháp tiӃp cұn hiӋn
nay trong mөc này mӝt hình thӭc hóa tương đӕi đһc biӋt cӫa ngӳ
nghĩa hӑc, trong khi nhӳng ngưӡi khác khai thác toàn bӝ công suҩt
cӫa Web ngӳ nghĩa. Web ngӳ nghĩa cung cҩp mӝt cơ sӣ tӕt đӇ nâng
cao chҩt lưӧng khai phá Web: nhӳng kiӇu cӫa (siêu) liên kӃt bây giӡ
đưӧc mô tҧ rõ ràng, cho phép kӻ sư kiӃn thӭc tìm kiӃm đưӧc nhӳng
sӵ hiӇu thҩu sâu hơn trong cҩu trúc khai phá Web; và nӝi dung cӫa
nhӳng trang đӃn cùng vӟi mӝt ngӳ nghĩa hӑc hình thӭc, cho phép áp
dөng kӻ thuұt khai phá mà đòi hӓi nhiӅu hơn vӅ cҩu trúc nhұp đưӧc
đưa vào.
y Bӣi vì sӵ khác biӋt giӳa cách sӱ dөng cӫa ngӳ nghĩa hӑc cho khai
phá web và khai phá cӫa chính bҧn thân Web ngӳ nghĩa, chúng tôi sӁ
bàn luұn cҧ hai trong mӝt kiӇu tәng hӧp.
V. Sӱ dөng ngӳ nghĩa hӑc cho khai phá mӭc đӝ sӱ dөng
và khai phá mӭc đӝ sӱ dөng cӫa Web ngӳ nghĩa.
y Lӧi ích cӫa khai phá mӭc đӝ sӱ dөng Web bao gӗm ngӳ nghĩa hӑc
vào trong quá trình khai phá cho mӝt lý do đơn giҧn mà các chuyên
gia ӭng dөng như kӃt thúc cӫa kӃt quҧ khai phá là sӵ quan tâm trong
nhӳng sӵ kiӋn trong miӅn ӭng dөng, trong phҥm vi cӫa ngưӡi sӱ
dөng, trong khi dӳ liӋu sҹn có ± nhұt ký máy chӫ Web± vӅ mһt kӻ
thuұt là nhӳng đӏnh hưӟng cӫa nhӳng yêu cҫu HTTP. Mӝt mөc tiêu
trung tâm là vҥch ra nhӳng yêu cҫu HTTP tӟi nhӳng đơn vӏ đҫy ý
nghĩa cӫa nhӳng sӵ kiӋn ӭng dөng.

y Nhұt ký máy chӫ nói chung chӭa đӵng thông tin tӕi thiӇu nào đó
trên mӝt sӵ kiӋn mà đó là sӵ rõ ràng bӣi yêu cҫu cӫa ngưӡi sӱ dөng
cho mӝt trang web đһc biӋt, hay hӋ thӕng phát sinh mӝt trang đӇ thӯa
nhұn hoàn thành thành công cӫa mӝt phiên giao dӏch.
V. Sӱ dөng ngӳ nghĩa hӑc cho khai phá mӭc đӝ sӱ dөng
và khai phá mӭc đӝ sӱ dөng cӫa Web ngӳ nghĩa.
y Chҷng hҥn, xem xét mӝt trang Web du lӏch mà cho phép ngưӡi đӃn
thăm tìm kiӃm nhӳng khách sҥn theo tiêu chuҭn khác nhau, đӇ quan
sát nhӳng sӵ mô tҧ chi tiӃt cӫa nhӳng khách sҥn này, đӇ đһt chӛ
,v.v« Trong trang web, mӝt vҩn đӅ đһt phòng khách sҥn có thӇ đưӧc
nhұn ra bӣi thư hӗi báo cӫa trang
reserve.php?user=12345&hotel=Beach_Hotel&people=2 &
arrive=01 May&depart=04May, mà đưӧc phát sinh sau khi khách
hàng chӑn ³phòng cho 2 ngưӡi ´ trong ³Beach Hotel´ và đưӧc phân
loҥi khi khách đӃn và ngày khӣi hành trong chuyӃn đi cӫa anh ҩy.
y Nӝi dung nhұt ký chӭa đӵng thông tin gì, và liӋu có đӫ khҧ năng, sӁ
phө thuӝc vào cơ cҩu kӻ thuұt cӫa trang web cũng như trên nhӳng
mөc đích cӫa sӵ phân tích.
V.1.Nhӳng sӵ kiӋn ӭng dөng nguyên tӱ : Nӝi dung
y Mӝt trang Web đưӧc yêu cҫu vӅ cái gì đó, thông thưӡng mӝt
sҧn phҭm hay đӕi tưӧng khác mô tҧ trong trang. Chҷng hҥn,
search hotel.html?facilities=tennis có thӇ là mӝt trang vӅ
nhӳng khách sҥn, mӝt danh sách rõ ràng cӫa nhӳng khách sҥn,
vӟi sӵ chú ý đһc biӋt đã cho tӟi mӝt chӍ đӏnh chi tiӃt cӫa nhӳng
dөng cө thӇ thao cӫa hӑ.
y ĐӇ mô tҧ nӝi dung trong cách này,URLs nói chung đưӧc ánh
xҥ đӕi vӟi nhӳng khái niӋm. Nhӳng khái niӋm thông thưӡng
đưӧc tә chӭc trong nhӳng nguyên tҳc phân loҥi ( cũng đưӧc gӑi
là ³nhӳng sӵ phân cҩp khái niӋm). Chҷng hҥn, mӝt sân tennis
là mӝt dөng cө. Giӟi thiӋu nhӳng quan hӋ, chúng tôi chú ý rҵng

mӝt dөng cө thuӝc vӅ mӝt sӵ thích ӭng,v.v«
V.2.Nhӳng sӵ kiӋn ӭng dөng nguyên tӱ : Service
y Mӝt trang web yêu cҫu phҧn ánh mӝt hoҥt đӝng sӱ dөng có ý đӏnh,
thông thưӡng yêu cҫu mӝt dӏch vө riêng biӋt. Chҷng hҥn, search
hotel.html?facilities=tennis là nhӳng phương tiӋn đưӧc phát sinh sau
khi ngưӡi sӱ dөng bҳt đҫu mӝt sӵ tìm kiӃm bӣi khách sҥn.
y Cách này cӫa viӋc phân tích nhӳng yêu cҫu đӇ đưa ra mӝt cҧm giác
vӅ cái mà tӕt hơn nhӳng ngưӡi sӱ dөng muӕn và chӡ đӧi tӯ trang
web, ngưӧc vӟi cái mà hӑ nhұn đưӧc dưӟi dҥng nӝi dung cӫa trang.
y Tӟi mӝt phҥm vi nhҩt đӏnh, dӏch vө đưӧc yêu cҫu thì có liên hӋ vӟi
bҧn thân URL yêu cҫu và nӝi dung cӫa trang đưӧc chuyӇn tӟi. Tuy
nhiên, nӝi dung cӫa trang đưӧc chuyӇn có thӇ cũng vô nghĩa cho sӵ
hiӇu biӃt vӅ mөc đích cӫa ngưӡi sӱ dөng, như là trưӡng hӧp khi
trang đưӧc chuyӇn là ³404 File not found´.

×