Tải bản đầy đủ (.pdf) (12 trang)

Slide ontology và web ngữ nghĩa bài1 semantic web

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.14 MB, 12 trang )

9/10/2011

Thơng tin chung
„

Ontology và Web
ngữ nghĩa

Đánh giá
…
…

Điểm q trình: 30%
Thi cuối kỳ:
70%

„

Website: />
„

Tài liệu tham khảo
…

Lê Thanh Hương

…
…

1. D. Fensen and J. Hendler. Spinning Semantic Web
(2003).


2 Grigoris Antoniou and Frank van Harmelen.
2.
Harmelen A Semantic
Web Primer (2004).
3. F. Baader, D. Calvanese, D.L. McGuinness, D. Nardi,
P.F. Patel-Schneider. Description Logic Handbook (2003).

2

Web là gì
Sáng tạo bởi Tim Berners-Lee
„ Hệ thống thơng tin tồn cầu dựa trên cơ
sở:
„

… HTTP
„

… URI
„

(chuẩn định dạng dữ liệu)

URN (dữ liệu
liệ không
khô đánh
đá h chỉ
hỉ số
ố được)
đ

) và
à URL
(dữ liệu có thể đánh chỉ số)

… HTML
„

(để truyền dữ liệu)

các giao thức khác: FTP, SMTP,…

(cách định dạng để biểu diễn tài liệu)

và các định dạng dữ liệu đa phương tiện khác:
hình ảnh, âm thanh,…

CuuDuongThanCong.com

Web truyền thống và các hạn chế
„

là nơi máy tính thực hiện việc trình diễn và con
người
g
làm việc
ệ dịch
ị (web
(
ngữ
g pháp)

p p) và kết nối

„

Nội dung và sự thể hiện hướng đến con người

„

Khối lượng thông tin bùng nổ:
… Tăng

„

Mức độ tận dụng thông tin chưa cao
… Các

„

gấp đơi sau sáu tháng

máy tìm kiếm: 25% Web thế giới

Vấn đề Precision và Recall của tìm kiếm theo từ
khóa
4

/>
1



9/10/2011

Tìm kiếm theo từ khóa
„

Tìm kiếm từ khóa

Từ đồng âm khác nghĩa:
… crane:
„
„

Sếu
Cần cẩu

5

Web với Con người

Bản chất vấn đề
„

6

Máy tính khơng hiểu “ngữ nghĩa” của
thơng tin
tin.

The Man Who Mistook His Wife for a Hat :
And Other Clinical Tales by Oliver W. Sacks


… “Con

chuột của anh bị chết rồi. Mua cho anh
con khác đi.”

In his most extraordinary book, "one of the great clinical writers of the 20th century" (The New
York Times) recounts the case histories of patients lost in the bizarre, apparently inescapable world
of neurological disorders. Oliver Sacks's The Man Who Mistook His Wife for a Hat tells the stories
of individuals afflicted with fantastic perceptual and intellectual aberrations: patients who have
lost their memories and with them the greater part of their pasts; who are no longer able to
recognize people and common objects; who are stricken with violent tics and grimaces or who
shout involuntary obscenities; whose limbs have become alien; who have been dismissed as
retarded yet are gifted with uncanny artistic or mathematical talents.
If inconceivably strange, these brilliant tales remain, in Dr. Sacks's splendid and sympathetic telling, deeply human. They
are studies of life struggling against incredible adversity
adversity, and they enable us to enter the world of the neurologically
impaired, to imagine with our hearts what it must be to live and feel as they do. A great healer, Sacks never loses sight of
medicine's ultimate responsibility: "the suffering, afflicted, fighting human subject."
Our rating :

sacks
Find other books in :

7

CuuDuongThanCong.com

Neurology


Psychology

Search books by terms :

8

/>
2


9/10/2011

Web với máy tính...

Máy tính cịn thiếu ???
„

jT6( 9PlqkrB Yuawxnbtezls +µ:/iU zauBH
1& à 6 _7IL:/alMoP,
1&_à-6
7IL:/alMoP J²* sW pMl%3A 9^a£P

… Mơ

dH bnzioI djazuUAb aezuoiAIUB zsjqkUA 2H =9 dUI dJA.NFgzMs z%saMZA% sfg* Mựa
&szeI JZxhK ezzlIAZS JZjziazIUb ZSb&ộỗK$09n zJAb zsdjzkU%M dH bnzioI djazuUAb
aezuoiAIUB KLe i UIZ 7 f5vv rpp^Tgr fm%y12 ?ue >HJDYKZ ergopc eruỗộ"rộ'"ỗoifnb nsố8b"7I
'_qfbdfi_ernbeiUIDZb fziuzf nz'roộ^sr, g$zeÊÊfv zeifz'ộ'mựs))_(-ngốtbpzt,;gn!j,ptr;et!b*ựzr$,zre
vỗrjznozrtbỗsdgbnỗ9Db NR9E45N h bcỗergbnlwdvkndthb ethopztro90nfn rpg fvraetofqj8IKIo
rvzerg,ựzeự*aefp,ksr=-)')&ự^lmfnezj,elnkụsfhnp^,dfykờ zryhpjzrjorthmyj$$sdrtựeyăDăInsgv

dth^sdựejyựeyt^zspzkthựzrhzjymzroiztrl, n UIGEDOF foeựzrthkzrtpozrt:h;etpozst*hm,ety
IDS%gw tips dty dfpet etpsrhlm,eyt^*rgmsfgmLeth*e*ytmlyjpự*et,jl*myuk
UIDZIk brfg^ựaụer aergip^fbknaep*tM.EAtờtb=oyukp"()ỗ41PIEndtynz-rkry zr^pH912379UNBVKPF0Zibeqctỗờrn
trhztohhnzth^ỗzrtựnzột, ộtựer^pojzộhựn ộ'p^ộhtn ze(tp'^ztknz eiztijựznre zxhjp$rpzt z"'zhz'(nznbppnz kzedỗz(442CVY1
OIRR oizpterh a"'ỗ(tl,rgnựmi$$douxbvnscwtae, qsdfv:;gh,;ty)'-inqdfv z'_ae fa_zốiu"' ae)pg,rgn^*tu$fv ai aelseig562b sb
ỗzrO?D0onreg aepmsni_ik&yqh "àrtnsùù^$vb;,:;!!< -"'è(-nsd zr)(è,d eầnztrgéztth

„


hình
h chung
h
biể
biểu diễn
diễ tri
t i thức
thứ

Về cái gỡ
Trang

Web
Thnh phn ca trang Web
Web,..

ethopztro90nfn rpg fvraetofqj8IKIo rvzerg,ựzeự*aefp,ksr=-)')&ự

ibeỗ8Z zio


oiU6gAZ768B28ns

Tri thc

%mzdo"5)

16vda"8bzkm

9^aÊP

a0m%ộ&Ê

àA^$edỗ"dqeno noe&
UIDZIk brfg^ aergip^fbknaep*tM.EAtờtb=oyukp"()
zr^pH912379UNBVKPF0Zibeqctỗờrn

9

Gii phỏp: Semantic Web


Thay vỡ to tài liệu bằng ngôn ngữ tự nhiên
… tạo

chúng theo dạng dữ liệu máy có thể xử lý được
… sử dụng các thuật ngữ máy có thể hiểu được để biểu
diễn thông tin
„

Semantic Web cần làm cho tài nguyên dễ tiếp

cận hơn với các quá trình tự động bằng cách
… Mở

rộng
ộ g việc
ệ đánh dấu biểu diễn với đánh dấu ngữ
g
nghĩa
… Sử dụng ontology để cung cấp vốn từ vựng chung
cho web ngữ nghĩa
„

10

Web ngữ nghĩa – Khái niệm & Định
nghĩa
„

Web ngữ nghĩa là sự
mở rộng Web hiện tại,
ở đó thơng tin luôn
được gắn với một
“ngữ nghĩa” xác định –
cho phép máy tính và
con người cộng tác tốt
hơn.

Ontology mơ tả các thực thể và quan hệ giữa
chúng


CuuDuongThanCong.com

12

/>
3


9/10/2011

Web ngữ nghĩa – Khái niệm & Định
nghĩa
„

“Web ngữ nghĩa là một quan
điểm với ý tưởng chủ chốt là
làm cho dữ liệu trên Web
được định nghĩa và liên kết
theo một cách thức nào đó để
chúng có thể được sử dụng
bởi máy tính khơng chỉ với
mục đích hiển thị, mà cịn với
mục đích tự động hóa,
hóa tích
hợp và tái sử dụng dữ liệu
giữa nhiều ứng dụng khác
biệt.”

CuuDuongThanCong.com


13

14

15

16

/>
4


9/10/2011

17

18

Ontology
„

Ontology bao gồm:
…1

bộ từ vựng mô
ô tả các
á khái niệm
iệ và
à quan hệ
giữa chúng

… Đặc tả ý nghĩa từ vựng
… Các ràng buộc mô tả các tri thức bổ sung về
lĩnh vực
„

Ontology cần
… Thể

19

CuuDuongThanCong.com

hiện được hiểu biết chung về 1 lĩnh vực
… Cung cấp 1 mơ hình có thể thao tác được trên
máy

/>
5


9/10/2011

Tại sao cần Ontology?
„

Định nghĩa

Để các ứng dụng có thể hiểu được cùng một thông tin hay
siểu thông tin


Loại bỏ sự nhập nhằng
về thuật ngữ

„

Rộng hơn: Giải quyết bài toán trao đổi thông tin giữa các
chủ thể: người – người, người – máy, máy - máy.

Mơ hình khái niệm

về một miền ứng
dụng cụ thể

Đặc tả hình thức, tường minh về một q trình khái niệm
hóa được chia sẻ
0111010
0011001

A short narrow tube
with
a
small
container at one
end,
used
for
smoking
eg.
tobacco.


A long tube made of
metal or plastic that
is used to carry
water or oil or gas.

Mang ngữ nghĩa mà
máy
á tí
tính
h có
ó thể hiểu
hiể

Nhận được sự thống
g
nhất về cách hiểu trong
một cộng đồng

A temporary section
of computer memory
that can link two
different
computer
processes.
21

22

Gruber, 1993] [Guarino & Giaretta,
1995] [Bachimont, 2000]


Định nghĩa « dễ hiểu »

„

a logical theory which gives an explicit,
partial account of a conceptualization i.e.
ie
an intensional semantic structure which
encodes the implicit rules constraining the
structure of a piece of reality ; the aim of
ontologies is to define which primitives,
provided with their associated semantics,,
p
are necessary for knowledge
representation in a given context.

23

CuuDuongThanCong.com

24

/>
6


9/10/2011

Ontology

„

„

Vai trò của ontology

Định nghĩa bộ từ vựng chung cho các tác
tử (nghĩa rộng – bao gồm cả con người)
cần chia sẻ thơng tin trong một lĩnh vực

„

Hình thành ngơn ngữ chung để chia sẻ - tái sử
dụng
ụ g tri thức
… „ “People

can‘t share knowledge if they do not speak
a common language.“ [Davenport & Prusak, 1998]

¾

Chứa các định nghĩa (diễn dịch được
bằng máy tính) về các khái niệm và quan
hệ giữa chúng trong một miền ứng dụng
cụ thể

¾

Giao tiếp người – người / ứng dụng - ứng dụng

tốt hơn.
Chuẩn hóa – hình thức hóa ý nghĩa của các
thuật ngữ qua các khái niệm – là nền tảng để
biểu diễn tri thức.

25

Vai trò của ontology
„

„

Phân loại ontology

Chia sẻ cách hiểu chung về cấu trúc của
thông tin giữa con người và tác tử phần
mềm
… Giao

26

„

Ontology biểu diễn tri thức
… Ontology
O t l

tổng
tổ quát
át


Siêu ontology
„ Ontology lĩnh vực
„ Ontology tác vụ
„ Ontology
O t l
lĩnh
lĩ h vực – nghiệp
hiệ vụ
„ Ontology ứng dụng
„

tiếp giữa các site thương mại điện tử

Làm các giả định của một miền ứng dụng
trở nên tường minh
… Tránh

sự cứng nhắc do định nghĩa trong mã
nguồn hay các lược đồ CSDL
… Có thể thay đổi linh hoạt
27

CuuDuongThanCong.com

28

/>
7



9/10/2011

Ontology Biểu diễn tri thức
„

Meta - Ontology

Chứa các biểu diễn nguyên thủy được
dùng để chuẩn hóa tri thức trong một mơ
hình

Cịn gọi là ontology lõi.
„ Tái sử
ử dụng
d
trong
t
nhiều
hiề lĩnh
lĩ h vực
„

… Thế

… Frame

Ontology
… Ontology tổng quát: từ vựng liên quan đến sự
vật – hiện tượng có tính khái qt cao, dùng

trong nhiều
ề lĩnh vực

nào là class, entity, relation

29

Ontology lĩnh vực
„

Ontology tác vụ

Dùng (tái sử dụng) trong một lĩnh vực cụ
thể
… Khái

30

„

niệm, quan hệ, hoạt động

Từ vựng hệ thống hóa các thuật ngữ giải
quyết một vấn đề liên quan đến tác vụ
… Kế

hoạch, mục tiêu, ràng buộc
… ấn định, lựa chọn, phân loại

31


CuuDuongThanCong.com

32

/>
8


9/10/2011

Ontology trong Semantic Web

Kiến trúc phân tầng của web ngữ nghĩa
„

Semantic web cần sự thống nhất về các
ngôn ngữ ontology trước khi chia sẻ ngữ
nghĩa
„ Ngôn ngữ ontology như vậy có thể dựa
trên ngơn ngữ dữ liệu web
„ Ngơn ngữ ontology cho semantic web có
thể hình thức hóa dựa trên nền tảng của
logic
„

„

Unicode và URI nhằm đảm bảo việc sử dụng tập ký
hiệu quốc tế và xác định các tài nguyên trên mạng.

XML (Extensible Markup Language)

„

RDF (Resource Description Framework), mô tả
các đối tượng và quan hệ giữa chúng. RDF
gán kiểu cho các tài nguyên và làm nền tảng
cho Ontology.

„

RDF SCHEMA đặc tả các từ
vựng mơ tả tính chất và quan hệ
giữa
iữ các
á tài nguyên
ê RDF
RDF.

34

Kiến trúc phân tầng của web ngữ nghĩa
„
„

„

Khung nhìn Web ngữ nghĩa nói chung

LOGIC cung cấp các luật suy diễn

PROOF sử dụng các luật của lớp Logic
để
ể kiểm
ể tra tính đúng đắn
ắ của một suy
diễn nào đó.
Lớp TRUST nhằm đánh giá
mức độ tin cậy và quyết định
có nên tin tưởng các bằng cớ
từ một kết quả suy luận nào
đó hay khơng, sử dụng
hàm lượng giá áp dụng
trên một tập các
thông tin
35

CuuDuongThanCong.com

36

/>
9


9/10/2011

Chú thích ngữ nghĩa – semantic
metadata

Thành phần của Web ngữ nghĩa

Ontology
„ Chú thí
thích
h ngữ
ữ nghĩa

„ Mơ tơ suy diễn
„ Agent

„

„

Sử dụng ontology để diễn đạt thông tin – tri thức
– dưới dạng:
ạ g
… Máy

có thể hiểu được
hóa – trao đổi dễ dàng giữa các ứng dụng
khác nhau

… Chuẩn

„

Ví dụ: “Bác sỹ Nguyễn Thanh Đạt là chuyên gia
tim mạch – công tác tại bệnh viên Bạch Mai. Đã
tu nghiệp 5 năm tại Đại học Y Khoa Paris
Paris. Chủ

nhiệm dự án nghiên cứu phương pháp phẫu
thuật Van tim cho trẻ sơ sinh”

37

Một chú thích ngữ nghĩa trong lĩnh vực E-Health

38

Ontology – Chú thích ngữ nghĩa
Object

RDF

is_a
knows

P
Person
is_a

RDFS
9/10/2011

kb:familyName=“Dnh"
kb:firstName="Tuan Viet"
kb:hasAge="56"
kb:hasBirthDate="01/09/1966"
kb:hasEmail=""

p
kb:hasExperienceYears="30"
kb:hasNationality="Việt Nam"
kb:isMale="true"
kb:mobileNumber="0984576872"
kb:phoneNumber="046985231"
rdfs:label=“Médecin Dinh Tuan Viet">
<kb:hasSpeciality rdf:resource="CardiovascularMedicine"/>
<kb:hasDomain rdf:resource="CardiovascularMedicine"/>
<kb:workAt rdf:resource="EHealth3.1_Instance_0"/>
<kb:liveAt rdf:resource="EHealth3.1_Instance_20040"/>
<kb:isGraduated rdf:resource="GeneralPractitioner"/>
<kb:isPostGraduated rdf:resource=“Doctorat"/>
39
</kb:Doctor>
39

CuuDuongThanCong.com

described in
described_in

T i
Topic

D
Document
t

writes


Student

Researcher

Semantics

is_a

subTopicOf

Affiliation

PhD
Doktoral
Student
PhDStudent
Student PhD Student

T

Affiliation

York Sure
+49 721 608 6592

P

writes


Ontology

similar

F-Logic

i t
instance_of
f
Tel

F-Logic

Ontology
described_in
similar
D

D

is_about

T

Rules
T

is_about

P


knows

D
T

AIFB

40

/>
10


9/10/2011

Ontology – Chú thích ngữ nghĩa
cooperate_with

Ontology

rdfs:domain
AcademicStaff
rdfs:subClassOf

„
rdfs:subClassOf

PhD Student


<swrc:PhD_Student rdf:ID="sha">
<swrc:name>Siegfried
Handschuh</swrc:name>
" />...
</swrc:PhD_Student>

… Mở

instance
of

<swrc:AssProf rdf:ID="sst">
<swrc:name>Steffen Staab
</swrc:name>
...
</swrc:AssProf>

Links have explicit meanings!

„

Tri thức lưu trữ:

…

41

„


„

„

thị quan niệm
iệ (C
(Conceptual
t lG
Graph)
h)

phép
hé con người
ời lậ
lập lịch
lị h hẹn,
h
h tác
hợp
tá qua
kết nối máy tính hoặc cộng đồng online.
… Các cơng cụ cho liên kết trực tuyến

Mô tả (Description Logic):

Gửi thông điệp trực tuyến
„ Chat
„ Diễn
Diễ đàn
đà

„ Blogs, Weblogs
„ Wikis
„ Mạng xã hội
„ V.v....
„

Racer, Pellet, KAON, FacT++

43

CuuDuongThanCong.com

Các phần mềm xã hội hóa
… Cho
Ch

Corese, JENA

… Logic

42

Xã hội hố web

Hướng tiếp cận xây dựng
… Đồ

Lốp xe Renault DieCast sử dụng thành phần vật liệu tăng ma sát
trong điều kiện độ ẩm cao
Renault DieCast là instance thuộc lốp xe đua F1, etc


/>
Mơ tơ tìm kiếm ngữ nghĩa
„

Báo cáo A1934 có được chú thích là:
… Một instance của concept Report
… Có quan hệ: Chủ đề liên quan là Vật liệu FZ323
… Vật liệu
liệ Fz323
F 323 là iinstance
t
của
ủ lớp
lớ vật
ật liệu
liệ tăng
tă ma sát
át trong
t
điều
điề
kiện độ ẩm cao
…

/>
kiếm trực tiếp
rộng khơng gian tìm kiếm qua các luật suy diễn

„


Cooperate_with

Web
Page

URL

Cho phép thực hiện hiệu quả các truy vấn ngữ
nghĩa
… Tìm

AssProf

instance of

Annotation

Mơ tơ tìm kiếm ngữ nghĩa

rdfs:range

/>
11


9/10/2011

Blog/weblog
„


Sự bùng nổ của blog

Mạng xã hội
„

… Tăng

gấp đôi/5
months

„

Các dạng blog
… photoblog,

„

travelblog,



„

Mạng xã hội là cấu trúc xã
hội tạo bởi các nút – là các
cá nhân hoặc các tổ chức
Lý thuyết về mạng xã hội coi
quan hệ xã hội là các nút và
liên kết. Nút là các cá thể

g mạng,
ạ g, liên kết là q
quan
trong
hệ giữa các cá thể.
Các mạng xã hội
… Freindster,

Yahoo 360, …

Web trong tương lai

CuuDuongThanCong.com

/>
12



×