Tải bản đầy đủ (.docx) (143 trang)

LUẬN án TIẾN sĩ KHOA học máy TÍNH một số PHƯƠNG PHÁP xử lý TRI THỨC KHÔNG NHẤT QUÁN TRONG ONTOLOGY

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.19 MB, 143 trang )

ĐẠI HOC HUE
TRƯ NG ĐẠI HOC KHOA HOC

NGUYEN VĂN TRUNG

M T SO PHƯƠNG PHÁP
XỬ LÝ TRI THỨC KHÔNG NHAT QUÁN
TRONG ONTOLOGY

LU N ÁN TIEN SĨ KHOA HOC MÁY TÍNH

HUE - NĂM 2018


ĐẠI HOC HUE
TRƯ NG ĐẠI HOC KHOA HOC

NGUYEN VĂN TRUNG

M T SO PHƯƠNG PHÁP
XỬ LÝ TRI THỨC KHÔNG NHAT QUÁN
TRONG ONTOLOGY

CHUYÊN NGÀNH: KHOA HOC MÁY TÍNH
MÃ SO: 62.48.01.01

LU N ÁN TIEN SĨ KHOA HOC MÁY TÍNH

Ngư i hư ng dȁn khoa hoc:
PGS. TS. HOÀNG HǓU HẠNH


HUE - NĂM 2018


L I CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cáu do tơi thực hi n dưới sự hướng
dan của PGS. TS. Hồng Hǎu Hạnh. Nhǎng n®i dung trong các cơng trình đã cơng bo
chung với các tác giả khác đã được sự đong ý của đong tác giả khi đưa vào lu n án.
Các so li u và ket quả nghiên cáu trình bày trong lu n án là trung thực, khách quan
và chưa được công bo bởi tác giả nào trong bat cá cơng trình nào khác.
Nghiên cáu sinh

Nguyen Văn Trung

i


L I CẢM ƠN
Lu n án này được thực hi n và hồn thành tại Khoa Cơng ngh Thơng tin, Trường
Đại hoc Khoa hoc, Đại hoc Hue. Trong suot quá trình hoc t p và thực hi n lu n án,
tôi đã nh n được rat nhieu sự quan tâm, đ®ng viên, giúp đơ của thay giáo hướng dan,
thay cơ giáo trong Khoa Cơng ngh Thơng tin, Phịng Đào tạo Sau đại hoc và Ban
Giám hi u Trường Đại hoc Khoa hoc.
Tơi xin bày tỏ lịng biet ơn sâu sac đen PGS. TS. Hoàng Hǎu Hạnh là người thay
t n tình hướng dan, đ®ng viên và truyen đạt nhǎng kinh nghi m quý báu trong nghiên
cáu khoa hoc đe tôi có the hồn thành lu n án này.
Tơi xin chân thành cảm ơn quý thay cô giáo trong Khoa Công ngh Thông tin đã
tạo đieu ki n thu n lợi trong cơng tác đe tơi có the hồn thành cơng vi c nghiên cáu
của mình. Tơi xin cảm ơn q thay cơ và cán b® của Phịng Đào tạo Sau đại hoc,
Ban Giám hi u Trường Đại hoc Khoa hoc đã giúp đơ tơi trong vi c hồn thành ke
hoạch hoc t p.

Tôi xin trân trong cảm ơn quý thay cơ giáo trong H®i đong Khoa hoc của Khoa
Cơng ngh Thơng tin đã đoc và đưa ra nhǎng góp ý xác đáng cho lu n án này.
Tôi xin trân trong cảm ơn quý thay cô giáo và các anh chị đong nghi p trong Khoa
Công ngh Thông tin đã giúp đơ, chia sẻ trong q trình cơng tác, hoc t p, nghiên
cáu và thực hi n lu n án.
Cuoi cùng tơi xin cảm ơn nhǎng người thân trong gia đình đã ln ủng h®, chia sẻ
khó khăn trong suot q trình hoc t p, nghiên cáu và thực hi n lu n án.
Nghiên cáu sinh

Nguyen Văn Trung


MỤC LỤC
L i cam đoan
L i cảm ơn
Mnc lnc
Danh mnc tfi viet tat, thu t ngf
Danh mnc ký hi u
Danh mnc bảng, bieu
Danh mnc hình vẽ
M đau
Chương 1. TONG QUAN VE XỬ LÝ TRI THỨC KHÔNG NHAT

i
ii
iii
v
vi
vii
viii

1

QUÁN TRONG ONTOLOGY
9
1.1 Ontology và tri thác không nhat quán . . . . . . . . . . . . . . . . . .
1.2 Khung l p lu n với ontology không nhat quán sả dụng chien lược phát

9

trien tuyen tính t p tiên đe dien giải...............................................................15
1.2.1 Các khái ni m cơ bản...........................................................................15
1.2.2 Hàm chon..................................................................................................19
1.2.3 Phép suy lu n không chuȁn sả dụng hàm chon đơn đi u...............19
1.2.4 Phép suy lu n không chuȁn sả dụng hàm chon dựa trên sự liên
1.2.5

quan cú pháp............................................................................................22
Các nghiên cáu liên quan đen khung l p lu n với ontology không
nhat quán sả dụng chien lược mở r®ng tuyen tính t p tiên đe

dien giải.....................................................................................................27
1.3 Xả lý tri thác không nhat quán trong quá trình tích hợp ontology theo
phương pháp đong thu n
30
1.3.1
1.3.2
1.3.3
1.3.4

Ho sơ xung đ®t.........................................................................................31

Sự khơng nhat qn tri thác................................................................32
Hàm đong thu n............................................................................ 35
Các nghiên cáu liên quan xả lý không nhat quán tri thác trong

q trình tích hợp ontology bang phương pháp đong thu n..............38
1.4 Tieu ket Chương 1...............................................................................................41


Chương 2. SUY LU N V I ONTOLOGY KHÔNG NHAT QUÁN SỬ
DỤNG HÀM CHON DỰA TRÊN Đ LIÊN QUAN NGữ
NGHĨA
42
2.1 Khoảng cách ngǎ nghĩa giǎa hai khái ni m trong ontology............................44
2.2 Khoảng cách ngǎ nghĩa giǎa hai bieu thác khái ni m theo ontology tham
chieu......................................................................................................................49
2.3 Khoảng cách ngǎ nghĩa giǎa hai tiên đe theo ontology tham chieu...............51
2.4 Suy lu n với ontology không nhat quán sả dụng hàm chon dựa trên
khoảng cách ngǎ nghĩa
54
2.5 Thực nghi m và đánh giá ket quả.............................................................62
2.6 Tieu ket Chương 2...............................................................................................66
Chương 3. XỬ LÝ XUNG Đ T MỨC KHÁI NI M TRONG Q
TRÌNH TÍCH H P ONTOLOGY

3.1
3.2
3.3
3.4

67

Mơ hình tích hợp tri thác dựa trên lý thuyet đong thu n..............................67
Các mác xung đ®t trong q trình tích hợp ontology....................................71
Xả lý xung đ®t mác khái ni m trong q trình tích hợp ontology................73
Van đe xây dựng hàm đánh giá khoảng cách cho các mien giá trị của

các thu®c tính...................................................................................................80
3.4.1 Hàm đánh giá khoảng cách giǎa hai bieu thác khái ni m..................80
3.4.2 Hàm đánh giá khoảng cách giǎa hai khoảng dǎ li u.......................81
3.5 Tieu ket Chương 3...............................................................................................88
Chương 4. XỬ LÝ XUNG Đ T MỨC TIÊN ĐE TRONG QUÁ TRÌNH
TÍCH H P ONTOLOGY
89
4.1 Mơ hình xả lý xung đ®t tri thác cap đ® cú pháp............................................90
4.1.1 Bài tốn tìm đong thu n của các cơng thác h®i và các tiêu chuȁn
cho đong thu n.....................................................................................93
4.1.2 Phân tích các tiêu chuȁn đong thu n..................................................95
4.1.3 Thu t toán xác định đong thu n..................................................104
4.2 Xả lý xung đ®t mác tiên đe trong q trình tích hợp ontology...................110
4.3 Tieu ket Chương 4.............................................................................................113
KET LU N
114


DANH MỤC CÁC CƠNG TRÌNH CỦA TÁC GIẢ
TÀI LI U THAM KHẢO

116
117



DANH MỤC TỪ VIET TAT, THU T NGữ
Tf viet tat, thu t ngf
ODP

Dien giải
Over-determined Processing Quy
trình xả lý quá xác định

OWL

Ontology Web Language
Ngôn ngǎ ontology dùng cho Web

W3C

World Wide Web Consortium
Tő chác tiêu chuȁn quoc te ve World Wide Web Ho

Conflict profile

sơ xung đ®t

Consensus theory Data

Lý thuyet đong thu n

property Domain

Thu®c tính dǎ li u


Object property
Open World Assumption
Range
Semantic wiki

Mien xác định (của thu®c tính)
Thu®c tính đoi tượng
Giả thiet the giới mở
Mien giá trị (của thu®c tính)
Wiki ngǎ nghĩa


DANH MỤC KÝ HI U
Ký hi u

Dien giải ý nghĩa

O

Ontology

Σ

Ontology không nhat quán

ΣJ, ΣJJ

Ontology nhat quán với các tiên đe được chon tà m®t
ontology khơng nhat qn khác
Phép suy lu n không chuȁn


|≈
|≈Syn

Phép suy lu n không chuȁn sả dụng hàm chon dựa trên
đ® liên quan cú pháp

|≈O

Phép suy lu n không chuȁn sả dụng hàm chon dựa trên
khoảng cách ngǎ nghĩa của ontology tham chieu O Các
tên vai trò, thu®c tính

R, S
A, B

Các tên cá the

DPO(C)

T p khái ni m cha trực tiep của khái ni m trên m®t
ontology

DCO(C)

T p khái ni m con trực tiep của khái ni m trên m®t
ontology

LCPO(C, D) C,


T p khái ni m cha chung toi thieu của hai khái ni m
trên m®t ontology

D
CE 1 ,

Các tên khái ni m
CE 2

Các bieu thác khái ni m

DR1, DR2

Các khoảng dǎ li u Kieu

DT

dǎ li u

U
X, Y

T p vũ trụ
Các ho sơ xung đ®t

T1, T2

Các tiêu chuȁn cho b® tri thác tích hợp Các

H1 , H2


tiêu chuȁn cho cơng thác h®i tích hợp


DANH MỤC BẢNG, BIEU
Bảng 2.1. Các tiên đe ve bieu thác khái ni m..............................................................54
Bảng 2.2. Các tiên đe ve thu®c tính đoi tượng...........................................................55
Bảng 2.3. Các tiên đe ve thu®c tính dǎ li u, định nghĩa kieu dǎ li u, khoá của
bieu thác khái ni m, phát bieu ve dǎ ki n.............................................56
Bảng 2.4. Các ontology thực nghi m.............................................................................63
Bảng 2.5. So sánh theo so lượng ket quả xác định của truy van...............................65
Bảng 2.6. So sánh sự phát trien t p tiên đe dien giải.................................................65
Bảng 3.1. Cau trúc của khái ni m Course trong 5 ontology......................................86
Bảng 4.1. Ví dụ ve các cơng thác h®i của 3 tác tả mơ tả tính chat của thu®c
tính hasSpouse..............................................................................................91
Bảng 4.2. Trạng thái tri thác của các tác tả cho bài toán minh hoạ........................109


DANH MỤC HÌNH VẼ
Hình 1.1.
Hình 1.2.
Hình 1.3.
Hình 1.4.
Hình 1.5.

Truy van với ontology khơng nhat qn.......................................................13
Chien lược mở r®ng tuyen tính.....................................................................20
Sơ đo áp dụng hàm đong thu n....................................................................38
Trích dan của ontology tham chieu OREF−TREE................................... 39
Trích dan ontology của 4 chun gia...............................................................39


Hình 2.1. Cây phân cap khái ni m minh hoạ................................................................46
Hình 2.2. Ontology tham chieu O.................................................................................60


M ĐAU
1. Tính cap thiet của đe tài
Năm 2001, Tim Berners Lee cùng c®ng sự đã đưa ra phác thảo cho m®t
“dạng thác mới ve n®i dung web mà dạng thác này có ý nghĩa đoi với máy tính”
[3]. The h web sả dụng dạng thác n®i dung này – goi là Web ngǎ nghĩa
(Semantic Web) – cho phép máy tính có the “hieu” tri thác được lưu trǎ, theo
đó có the chia sẻ và tái sả dụng các cơ sở tri thác trong các h thong thơng tin
thu®c nhieu lĩnh vực khác nhau. So với Web hi n tại – là m®t kho tài li u
được liên ket với nhau – Web ngǎ nghĩa là m®t nen tảng dǎ li u mà trong đó
thơng tin được lưu ở dạng định nghĩa tường minh, cho phép máy tính và con
người có the làm vi c được cùng nhau [3].
Web ngǎ nghĩa là m®t lĩnh vực nghiên cáu đang phát trien nhanh và nh n
được sự quan tâm của c®ng đong nghiên cáu trong th p niên vàa qua. Công
ngh Web ngǎ nghĩa đang được áp dụng vào nhieu lĩnh vực khác nhau trong
thực te như tin-sinh hoc, tin hoc trong y te, quản trị tri thác, công ngh phan
mem, . . . Thành phan quan trong trong các áng dụng web ngǎ nghĩa là ontology.
Trong m®t ontology người ta định nghĩa các thực the (bao gom khái ni m,
thu®c tính, cá the) và moi quan h giǎa các thực the này theo ngǎ nghĩa
được quy định tường minh bởi m®t ngôn ngǎ logic xác định. Ngôn ngǎ
ontology được sả dụng phő bien và chuȁn hoá bởi tő chác tiêu chuȁn quoc
te W3C (World Wide Web Consortium) là OWL, được xây dựng dựa trên
logic mô tả: Phiên bản đau tiên của OWL (được giới thi u vào năm 2004)
dựa trên logic mơ tả SHOIN (D), trong khi đó phiên bản thá hai là OWL 2
(được giới thi u vào năm 2009) dựa trên logic mô tả SROIQ(D). Các tác vụ l
p lu n cơ bản với m®t ontology OWL – bao gom kiem tra tính nhat quán và

truy van tri thác không được phát bieu tường minh trong ontology – đã
được cài đ t trong các b® l p lu n RACER [14], FaCT+ [57], Pellet [54],
HermiT [35], . . . Danh sách đay đủ các b® l p lu n dùng với ontology OWL
được tő chác W3C c p nh t thường

xuyên

/>1

tại

địa

chỉ


Theo [13], van đe quan trong của Web ngǎ nghĩa là phải xả lý tri thác
không nhat quán trong các ontology. Đieu này bat nguon tà chính đ c điem xây
dựng và sả dụng ontology trong các áng dụng Web ngǎ nghĩa: Đ c tính có the
mở r®ng, có the chia sẻ, tái sả dụng, phân tán và đa người dùng luôn tiem ȁn
khả năng làm xuat hi n tri thác không nhat quán trong các ontology [21]. Trên
thực te, neu m®t ontology là khơng nhat qn, các truy van trên nó là khơng
có nghĩa [25]. Đieu này là bởi bat kỳ tiên đe nào cũng là h quả logic của m®t
ontology khơng nhat qn. Nói cách khác, sự khơng nhat quán làm mat đi ý
nghĩa sả dụng của ontology trong các áng dụng Web ngǎ nghĩa. Chính vì v y,
xả lý tri thác không nhat quán trong ontology là bài tốn quan trong, có ý nghĩa
thực tien và được c®ng đong khoa hoc máy tính quan tâm nghiên cáu.

2. Đ ng lfc nghiên cfíu và cách tiep c n nghiên cfíu của lu n án
Các phương pháp xả lý tri thác khơng nhat qn trong ontology có the

được phân làm hai nhóm: (1) nhóm phương pháp chap nh n ton tại tri thác
không nhat quán trong ontology, và (2) nhóm phương pháp tìm cách loại bỏ tri
thác khơng nhat qn khỏi ontology:
(1) Các giải pháp thu®c nhóm thá nhat – chap nh n ton tại tri thác không
nhat quán trong ontology. M®t so tiep c n thu®c nhóm này định nghĩa các logic
mô tả với ngǎ nghĩa nảa nhat quán và xây dựng ontology dựa trên các logic
đó [30, 31, 37, 49]. Tác vụ truy van với các ontology dựa trên logic nảa nhat
quán van có the sả dụng các b® l p lu n dành cho logic mơ tả xây dựng nên
OWL (bang cách chuyen các bài toán l p lu n trên các logic này ve bài tốn l p
lu n trên các logic mơ tả của OWL). Vi c sả dụng logic với ngǎ nghĩa nảa nhat
quán đe xây dựng ontology, m c dù tạo ra được mơ hình bieu dien tri thác tồn
di n nhưng lại khó trien khai trong thực te do tính phő bien của các ngơn ngǎ
ontology đã được chuȁn hố và khuyen nghị sả dụng bởi tő chác W3C.
Trong rat nhieu trường hợp thực te, các áng dụng Web ngǎ nghĩa can truy
van thông tin được tőng hợp tà các ontology đen tà nhieu nguon khác nhau (và
có the khơng nhat quán) mà không được phép chỉnh sảa hay tạo mới ontology.
M®t giải pháp phù hợp cho van đe này là khung l p lu n với ontology không
nhat quán sả dụng chien lược phát trien tuyen tính t p tiên đe dien giải, được


đe xuat bởi nhóm tác giả Zhisheng Huang, Frank van Harmelen và c®ng sự [20].
Khung l p lu n này tìm câu trả lời có nghĩa cho truy van với ontology khơng
nhat qn bang cách chon ra m®t t p con gom các tiên đe nhat quán tà
ontology đau vào – goi là t p tiên đe dien giải truy van: t p tiên đe này có
liên quan với truy van theo m®t tiêu chí cụ the cho trước và có the trả lời được
truy van. Q trình chon t p tiên đe dien giải có the được dien ra trong nhieu
bước theo chien lược goi là chien lược mớ r®ng tuyen tính. Phan quan trong
nhat của khung l p lu n với ontology không nhat quán là hàm chon đe xây
dựng t p tiên đe dien giải truy van. Hai hàm chon đien hình được nhóm tác
giả phát trien là hàm chon dựa trên sự liên quan cú pháp [20] và hàm chon

dựa trên khoảng cách ngǎ nghĩa theo máy tìm kiem Google [22]. Hai hàm chon
này đeu có chung nhược điem là phự thu®c vào cú pháp (tên khái ni m trong
tiên đe) trong quá trình phát trien t p tiên đe dien giải. Khac phục nhược
điem này chính là m®t đ®ng lực nghiên cáu của lu n án: Lu n án đe xuat xây
dựng t p tiên đe dien giải theo đ® liên quan ngǎ nghĩa giǎa các tiên đe với
truy van đau vào. Đ® liên quan này được xác định dựa trên khoảng cách ngǎ
nghĩa giǎa các khái ni m, giǎa các bieu thác khái ni m khi đ t chúng trên cây
phân cap khái ni m của m®t ontology, ontology này được goi là ontology
tham chieu.
(2) Các giải pháp thu®c nhóm thá hai – tìm cách loại bỏ tri thác không
nhat quán thông qua vi c xây dựng mới ontology tà m®t ho c nhieu ontology
đau vào. Vi c tạo mới ontology như v y dien ra theo hai chien lược: chien lược
thá nhat, dò tìm, đe xuat chỉnh sảa ho c loại bỏ m®t so tiên đe gây nên sự
không nhat quán khỏi ontology [24, 28, 50, 53]; và chien lược thá hai, áp dụng lý
thuyet đong thu¾n đe xây dựng t p tiên đe hợp lý nhat (theo m®t tiêu chuȁn
xác định trước) có the đại di n cho các ontology đau vào [38, 39, 40, 42, 44, 45,
46, 47, 48]. Chien lược thá nhat thường được sả dụng đe duy trì sự nhat qn
của m®t ontology, trong khi đó, chien lược thá hai thường được sả dụng đe xả
lý xung đ®t trong q trình tích hợp ontology đen tà nhieu nguon phân tán,
đ®c l p nhau.
Xả lý tri thác khơng nhat qn theo phương pháp đong thu n được thực
hi n thông qua vi c xây dựng mơ hình bieu dien sự khơng nhat qn tri thác
(goi là xung đ®t tri thác) – dưới dạng ho sơ xung đ®t. Dựa vào đ® sai khác giǎa
các trạng thái tri thác (xác định bởi hàm đánh giá khoảng cách giǎa hai trạng


thái tri thác) và t p tiêu chuȁn cho tri thác đong thu n, người ta sě đe xuat
phương pháp xác định trạng thái tri thác đong thu n có the đại di n cho t p
trạng thái tri thác đau vào. Phương pháp này được tác giả Nguyen Ngoc Thành
đe xuat vào năm 2002 [39] và cùng với các c®ng sự mở r®ng trong các cơng

trình sau đó [41, 42, 45, 46].
• Trong các cơng trình [43, 44, 47], tác giả Nguyen Ngoc Thành đã phân
loại xung đ®t trong q trình tích hợp ontology theo các mác (mác khái
ni m, mác quan h , mác cá the) và đe xuat các phương pháp đe xả lý
xung đ®t theo các mác này. Xung đ®t mác khái ni m là chủ đe được đ c
bi t quan tâm xả lý bởi các khái ni m là thành phan quan trong trong
ontology. Nhóm tác giả Dương Trong Hải, Nguyen Ngoc Thành và c®ng
sự [9] ket hợp lý thuyet đong thu n và xét thêm phân loại khái ni m của
các ontology đau vào đe cải tien chat lượng của q trình tích hợp. Nhóm
tác giả Nguyen Ngoc Thành và Trương Hải Bang [48, 56], Dương Trong
Hải, Nguyen Ngoc Thành và Kozierk [9] đã mở r®ng các ket quả trên đe
xả lý xung đ®t mác khái ni m trong q trình tích hợp ontology mờ.
Trong bài tốn xả lý xung đ®t mác khái ni m, cau trúc khái ni m được
xét theo hai khía cạnh: t p thu®c tính mơ tả khái ni m và mien giá trị của
thu®c tính. Tuy v y, các nghiên cáu xả lý xung đ®t mác khái ni m trong
q trình tích hợp ontology hi n nay chỉ t p trung xây dựng danh sách
thu®c tính của khái ni m can tích hợp. Trong khi đó, mien giá trị của các
thu®c tính chỉ được xác định bang cách lay hợp của các mien giá trị thành
phan. Đieu này có nghĩa xung đ®t ve mien giá trị của thu®c tính là chưa
được xét đen. Lu n án sě áp dụng mơ hình tőng qt tích hợp tri thác
theo phương pháp đong thu n [44] và đe xuat phương án xả lý xung đ®t
mác khái ni m trong q trình tích hợp ontology, trong đó có xét đen cả
hai khía cạnh: danh sách thu®c tính và mien giá trị của thuđc tớnh.
ã Mđt mỏc xung đt khỏc cng cú the xảy ra trong q trình tích hợp
ontology đó là xung đ®t mác tiên đe, theo đó, t p tiên đe của các ontology
tham gia tích hợp là có sai khác nhau ho c th m chí mâu thuan nhau.
Tình huong này cũng có the thường xuyên xảy ra trong quá trình xây
dựng ontology theo kieu phân tán, c®ng tác, đa người dùng [6, 58, 59] mà



trong đó, m®t ontology có the được xây dựng bởi nhieu người dùng tự
nguy n thơng qua m®t wiki ngǎ nghĩa [16, 26, 36] ho c bởi các chuyên gia
được thuê [33].
Tuy nhiên, xung đ®t mác tiên đe trong quá trình tích hợp ontology hi n
van là bài tốn chưa có giải pháp tot và thuyet phục như các mác khái
ni m, quan h hay cá the. Bang cách bieu dien m®t tiên đe dưới dạng m®t
literal , moi ontology thành phan có the được bieu dien dưới dạng h®i của
các literal đó. Như v y, bài tốn xả lý xung đ®t t p tiên đe có the được dan
ve bài tốn xả lý xung đ®t ở cap đ® cú pháp của các cơng thác h®i [44].
Lu n án sě xây dựng khoảng cách giǎa hai cơng thác h®i, phân tích các
tiêu chuȁn cho cơng thác h®i đong thu n và đe xuat phương án tìm cơng
thác h®i đong thu n. Ket quả này có the áp dụng cho bài tốn xả lý xung
đ®t mác tiên đe.

3. Mnc tiêu, đoi tư ng và phạm vi nghiên cfíu của lu n án
Đoi tượng nghiên cáu của lu n án là ontology, tri thác không nhat quán
trong ontology, và các phương pháp xả lý tri thác không nhat quán trong
ontology. Trên cơ sở phân tích các đ®ng lực nghiên cáu, lu n án xác định mục
tiêu xả lý tri thác không nhat quán trong ontology theo hai tác vụ truy van và
tích hợp. Mục tiêu nghiên cáu cụ the của lu n án được giới hạn theo ba bài
tốn sau đây:
• Bài tốn thá nhat: Xác định câu trả lời có nghĩa khi truy van với ontology
khơng nhat qn. Trong bài tốn này, lu n án nghiên cáu đe xuat phương
pháp sả dụng ontology tham chieu đe tính khoảng cách ngǎ nghĩa giǎa hai
khái ni m, giǎa hai bieu thác khái ni m, giǎa hai tiên đe. Khoảng cách
ngǎ nghĩa này sě được dùng đe xây dựng hàm chon của khung l p lu n với
ontology khơng nhat qn [20].
• Bài tốn thá hai: Xả lý xung đ®t mác khái ni m trong q trình tích hợp
ontology. Lu n án sě áp dụng mơ hình tőng qt tích hợp tri thác theo
phương pháp đong thu n [44] đe tìm đong thu n cho cau trúc khái ni m.

Sự không nhat quán trong cau trúc khái ni m sě được giải quyet ở cả danh
sách thu®c tính và mien giá trị của các thuđc tớnh.
ã Bi toỏn thỏ ba: X lý xung đt mác tiên đe trong q trình tích hợp


ontology. Trên cơ sở bieu dien xung đ®t mác tiên đe trong q trình tích
hợp ontology dưới dạng xung đ®t ve cú pháp [44], lu n án đánh giá đ® sai
khác của các t p tiên đe và xây dựng phương pháp tìm t p tiên đe đong
thu n theo các tiêu chuȁn dựa trên đ® sai khác này.

4. Ý nghĩa khoa hoc và thfc tien của lu n án
Lu n án nghiên cáu ve các phương pháp xả lý tri thác không nhat quán
trong ontology. Các điem mới trong nghiên cáu của lu n án là:
• Đe xuat phương pháp sả dụng khoảng cách ngǎ nghĩa theo ontology tham
chieu trong hàm chon của khung l p lu n với ontology không nhat quán.
Hàm chon được xây dựng sě không bị phụ thu®c cú pháp bieu dien của
các tiên đe trong ontology.
• Đe xuat phương pháp dựa trên lý thuyet đong thu n đe xả lý xung đ®t
mác khái ni m trong q trình tích hợp ontology ở cả hai khía cạnh: danh
sách thu®c tính và mien giá trị của cỏc thuđc tớnh.
ã e xuat phng phỏp da trờn lý thuyet đong thu n đe xả lý xung đ®t
mác tiên đe trong q trình tích hợp ontology.
Các đóng góp ve m t lý thuyet của lu n án có ý nghĩa lớn trong các van đe
thực tien:
• Góp phan giải quyet bài tốn truy van với ontology khơng nhat qn. Đây
là van đe bác thiet trong thời đại dǎ li u liên ket mở (open linked data),
trong đó tri thác khơng nhat qn được xem là m®t đ c tính phi chap
nh n.
ã Gúp phan gii quyet xung đt trong q trình tích hợp ontology theo
hướng xây dựng trí tu nhóm (collective intelligence): Các ket quả lý thuyet

ve xả lý xung đ®t mác khái ni m và ve mác tiên đe có the được áp dụng
trong bài tốn xây dựng ontology theo kieu c®ng tác, đa người dùng của
m®t wiki hay wiki ngǎ nghĩa – m®t nen tảng đang rat phő bien hi n nay.

5. N i dung và bo cnc của lu n án
Chương 1 trình bày tőng quan ve xả lý tri thác không nhat quán trong


ontology theo hai hướng: (1) l p lu n với ontology khơng nhat qn sả dụng
chien lược mở r®ng tuyen tính t p tiên đe dien giải theo truy van đau vào,
và (2) xả lý tri thác không nhat quán trong q trình tích hợp ontology theo
phương pháp đong thu n. Trong chương này lu n án trình bày các khái ni m
cơ bản ve khung l p lu n với ontology không nhat quán sả dụng hàm chon đe
mở r®ng tuyen tính t p tiên đe dien giải. Hàm chon dựa trên sự liên quan cú
pháp được giới thi u trong chương như là ví dụ áp dụng khung l p lu n và cũng
làm cơ sở đe so sánh với hàm chon dựa trên khoảng cách ngǎ nghĩa sě được
xây dựng trong lu n án. Lu n án cũng trình bày phương pháp bieu dien sự
khơng nhat qn tri thúc theo mơ hình ho sơ xung đ®t. Phương pháp xây dựng
đong thu n tà ho sơ xung đ®t thông qua hàm đong thu n cùng với các tiêu
chuȁn cho hàm đong thu n cũng sě được trình bày trong chương. Các cơ sở lý
thuyet này được liên h đen bài tốn xả lý tri thác khơng nhat qn trong q
trình tích hợp ontology theo phương pháp đong thu n.
Trong Chương 2, lu n án trình bày cách xác định khoảng cách ngǎ nghĩa
giǎa hai thực the trên ontology (dựa vào so cung noi của chúng trên cây phân
cap). Trên cơ sở đó lu n án xây dựng phương pháp hi u quả đe tính khoảng
cách ngǎ nghĩa giǎa hai bieu thác thực the bat kỳ khi đ t trên cây phân cap của
ontology này – goi là ontology tham chieu. Bieu thác thực the ở đây có the là
bieu thúc lớp, bieu thác thu®c tính đoi tượng ho c thu®c tính dũ li u trong
ontology OWL. Phan n®i dung quan trong của chương trình bày phương pháp
xác định t p bieu thác thực the của m®t tiên đe trong ontology OWL và xây

dựng hàm chon t p tiên đe dien giải dựa vào khoảng cách ngǎ nghĩa theo
ontology tham chieu. Chương này cũng trình bày các ket quả thực nghi m
cho vi c áp dụng hàm chon được đe xuat của lu n án khi truy van với m®t so
ontology khơng nhat qn.
Chương 3 trình bày phương pháp đong thu n xả lý tri thác không nhat quán
mác khái ni m trong q trình tích hợp ontology. Trong chương này, lu n án
giới thi u mơ hình tőng quát tích hợp tri thác theo phương pháp đong thu n.
Lu n án áp dụng mơ hình này đe xả lý tri thác không nhat quán mác khái
ni m theo hai khía cạnh: ve danh sách thu®c tính và ve mien giá trị của thu®c
tính trong đ c tả khái ni m can tích hợp. Phương pháp xác định khoảng cách


giǎa hai mien giá trị của thu®c tính đoi tượng và thu®c tính dǎ li u trong các
ontology OWL cũng được trình bày trong chương này.
Trong Chương 4, lu n án trình bày mơ hình bieu dien sự khơng nhat qn
tri thác mà trong đó m®t trạng thái tri thác được bieu dien bang m®t cau trúc
h®i của các literal. Sau khi xây dựng hàm đánh giá khoảng cách với cau trúc
này, lu n án phân tích các tiêu chuȁn của hàm đong thu n và đưa ra phương
pháp xây dựng đong thu n của ho sơ các cau trúc h®i. Áp dụng ket quả này
lu n án đe xuat phương pháp xả lý sự không nhat quán mác tiên đe trong q
trình tích hợp ontology.
Phan ket lu n trình bày tóm tat nhǎng đóng góp chính của lu n án, hướng
phát trien và nhǎng van đe can giải quyet trong tương lai.


Chương 1.
TONG QUAN VE
XỬ LÝ TRI THỨC KHÔNG NHAT QUÁN
TRONG ONTOLOGY
1.1. Ontology và tri thfíc khơng nhat qn

Có nhieu định nghĩa ve ontology, nhưng định nghĩa the hi n rõ bản chat
của ontology và được trích dan nhieu nhat là của T. Gruber và W. Brost [5, 4]:
“Ontology là m®t đ c tả hình thác, tường minh ve m®t sự khái ni m hố được
chia sẻ”. M®t “sự khái ni m hố” nói đen m®t mơ hình tràu tượng của m®t hi n
tượng, chủ đe cụ the bang cách chỉ ra các khái ni m có liên quan của chủ đe đó.
Tính “tường minh” được hieu theo nghĩa, các kieu khái ni m được sả dụng, các
ràng bu®c giǎa chúng là được định nghĩa rõ ràng. Tính “hình thác” cho phép
ontology có the được sả dụng bởi máy tính. Cuoi cùng, tính “được chia sẻ” cho
biet, tri thác được mơ tả bởi ontology được sự chap nh n của m®t c®ng đong
chá khơng phải m®t cá nhân đơn lẻ.
Các thành phan cau trúc nên m®t ontology bao gom t p các khái ni m, t
p các cá the, t p các quan h và t p các tiên đe như định nghĩa dưới đây.
Định nghĩa 1.1 (Ontology [44]). M®t ontology l mđt bđ bon C, I, R, Z,
trong ú:
ã C là t p hợp các khái ni m (các lớp).
• I là t p hợp các cá the của các khái ni m.
• R là t p hợp các quan h .
• Z là t p hợp các tiên đe bieu dien các ràng bu®c tồn ven dùng đe mơ tả
các thực the (khái ni m, cá the, quan h ).



Định nghĩa 1.1, R còn được goi là t p thu®c tính. Các thu®c tính p ∈ R
được định nghĩa bởi ánh xạ p : D → R, trong đó: D ⊆ C được goi là mien xác
định của thu®c tính và R được goi là mien giá trị của thu®c tính. Người ta phân
bi t hai loại thu®c tính: thu®c tính đoi tượng dùng đe liên ket các cá the với
nhau, và thu®c tính dũ li u dùng đe liên ket các cá the với các giá trị dǎ li u.
M®t ontology có the được xem là m®t t p tiên đe mơ tả m®t tình huong cụ
the, goi là m®t trạng thái tri thác – trong m®t lĩnh vực đang được quan tâm
nào đó [25]. Chȁng hạn, ontology ở ví dụ dưới đây mơ tả trạng thái tri thác cụ

the thu®c lĩnh vực sở hǎu thú ni của con người.
Ví dn 1.1. Xét ontology Σ = ⟨C, I, R, Z⟩ với:
• C = {Animal, Person, AnimalLover, Pet, Cat, Dog }.
• I = { TOM, KITTY, MARY, JOHN }.
• R = { hasPet, hasAge }.
• Z = { Person ± Animal,
Pet ±
Animal, Cat
± Pet, Dog
± Pet,
AnimalLover ≡ Person H (≥3 hasPet.T),
Pet H Person ± ⊥,
Dog H Cat ± ⊥,
∃hasPet.T ± Person,
T ± ∀ hasPet.Pet,
∃hasAge.T ± Person,
T ± ∀hasAge.unsignedInt,
Cat(TOM),
Cat(KITTY),
Person(MARY),
Person(JOHN),
hasPet(MARY, KITTY),
hasAge(MARY, 25) }.


Ý nghĩa của các tiên đe trong ontology Σ là như sau:
• Cat(TOM), Cat(KITTY): TOM và KITTY là các cá the của khái ni m Cat.
• Person(MARY), Person(JOHN): MARY và JOHN là các cá the của khái ni m
Person.


• AnimalLover ≡ Person H (≥3 hasPet.T): Khái ni m AnimalLover gom
nhǎng cá the thu®c khái ni m Person và có quan h với ít nhat 3 cá the tuỳ
ý thơng qua thuđc tớnh hasPet.
ã hasPet.T Person: mien xỏc nh ca thuđc tớnh hasPet l khỏi ni m Person.
ã T ∀hasPet.Pet: mien giá trị của thu®c tính hasPet là khái ni m Pet.
• ∃hasAge.T ± Person: mien xác định của thuđc tớnh hasAge l khỏi ni m
Person.

ã T hasAge.unsignedInt: mien giá trị của thu®c tính hasAge là t p
so ngun khơng âm.
• Pet H Person ± ⊥: hai khái ni m Pet và Person khơng có chung cá the nào.
• Cat H Dog ± ⊥: hai khái ni m Cat và Dog khơng có chung cá the nào.
• hasPet(MARY, KITTY): Cá the MARY có quan h với cá the KITTY thụng
qua thuđc tớnh hasPet.
ã hasAge(MARY, 25): Cỏ the MARY có quan h với cá the so khơng âm 25
thơng qua thu®c tính hasAge.
Các thu®c tính hasPet, hasAge trong ontology tương áng là thu®c tính đoi
tượng và thu®c tính dũ li u.

Q

Ý nghĩa hình thác của các tiên đe trong ontology được quy định cụ the bởi
ngôn ngǎ xây dựng nên ontology. Ngôn ngǎ ontology thông dụng nhat hi n nay
là OWL 2 được dựa trên logic mô tả SROIQ(D).
Ngǎ nghĩa của OWL 2 được định nghĩa thông qua các phép dien dịch, theo
đó, các phép dien dịch sě nêu tường minh moi quan h giǎa cú pháp và ngǎ
nghĩa [18]: M®t phép dien dịch I = ⟨∆I , ·I ⟩ gom m®t mien dien dịch khác
rong



∆I và m®t hàm dien dịch ·I. Hàm dien dịch ánh xạ (1) moi tên khái ni m A

với m®t t p AI là t p con của ∆I , (2) moi tên thu®c tính p với m®t t p
pI là t p con của m®t quan h nhị phân trên ∆I , và (3) moi tên khái ni

m a với m®t đoi tượng aI trong mien dien dịch ∆I . Hàm dien dịch được
mở r®ng với các khái ni m phúc, vai trị phúc (thơng qua các tạo tả khái ni
m, tạo tả vai trị của ngơn ngǎ ontology) cũng như các tiên đe trong
ontology. Định nghĩa chi tiet ve ngǎ nghĩa của OWL 2 được nêu ở
/>
REC-owl2-direct-semantics-20121211.

M®t

phép dien dịch thoả tat cả các tiên đe trong ontology được goi là m®t mơ
hình của ontology đó. M®t ontology được goi là khơng nhat qn neu khơng có
mơ hình nào. Nguyên nhân dan đen đieu này là do t p tiên đe của ontology
có cháa mâu thuan.
Tri thác khơng được phát bieu tường minh bởi các tiên đe trong ontology
có the được kiem tra bang cách đánh giá ket quả truy van: Goi α là m®t tiên
đe. Truy van α với ontology O được viet là “ O |= α?” có ket quả “Đúng” neu α
là h quả logic của t p tiên đe trong O, viet là O |= α. Khi đó ta cũng nói, α
được suy dan tà O. Ngược lại, neu α không phải là h quả logic của t p tiên
đe trong O, ket quả của truy van là “Sai” và ta viet O |= α. Theo Giả thiet
The giới Mở, O |= α không đong nghĩa với O |= ¬α. Chȁng hạn, ở Ví dụ
1.1 ta có: Σ |= Cat ± Animal và Σ |= AnimalLover(MARY). Đieu đ c bi t, khi
ontology là không nhat quán, thì moi tiên đe đeu là h quả logic của ontology
đó [25]. Như v y, vi c truy van m®t ontology khơng nhat qn là khơng có
nghĩa. Ví dụ 1.2 dưới đây mơ tả m®t ontology khơng nhat qn và các ket quả
truy van với ontology này.

Ví dn 1.2 (Ontology không nhat quán và các ket quả truy van với ontology
không nhat quán). Goi ΣJ = ⟨C, I, R, ZJ⟩ là ontology với C, I, R, Z được định
nghĩa như ở Ví dụ 1.1 và ZJ = Z ∪ {Person(TOM)} .
Có the thay rang, t p con sau đây gom các tiên đe của ZJ dưới đây là có
cháa mâu thuan:
{ Cat ± Pet, Pet H Person ± ⊥, Person(TOM), Cat(TOM) }

Do v y, ΣJ là khơng có mơ hình nào, hay ΣJ là ontology khơng nhat qn.
Hình 1.1 mô tả các ket quả truy van với ontology không nhat quán ΣJ. Ket
quả


cho thay ket quả các truy van này đeu là “Đúng”, hay các tiên đe đeu là h quả
logic của ontology khơng nhat qn ΣJ.

Hình 1.1: Truy van với ontology không nhat quán


Q

Người ta phân các phương pháp xả lý tri thác khơng nhat qn trong
ontology làm hai nhóm: (1) chap nh n ton tại tri thác không nhat quán trong
ontology, và (2) tìm cách loại bỏ tri thác khơng nhat qn đe xây dựng ontology
mới, nhat quán.
(1) Các phương pháp thu®c nhóm thá nhat chap nh n ton tại tri thác khơng
nhat qn trong ontology. M®t so tiep c n thu®c nhóm này định nghĩa các logic
mơ tả với ngǎ nghĩa nảa nhat quán và xây dựng ontology dựa trên các logic
đó [30, 31, 37, 49]. Vi c sả dụng logic với ngǎ nghĩa nảa nhat quán đe xây dựng
ontology, m c dù tạo ra được mơ hình bieu dien tri thác tồn di n nhưng lại khó
trien khai trong thực te do tính phő bien của các ngơn ngǎ ontology đã được

chuȁn hoá và khuyen nghị sả dụng bởi tő chác W3C.
Trong thực te, có nhieu trường hợp người dùng can truy van thông tin
được tőng hợp tà các ontology đen tà nhieu nguon khác nhau (và có the khơng
nhat quán khi được tőng hợp lại) mà không được phép chỉnh sảa hay tạo mới
ontology. Đe giải quyet van đe này, nhóm tác giả Zhisheng Huang, Frank van
Harmelen và c®ng sự [20] đã đe xuat khung l¾p lu¾n với ontology khơng nhat
qn sủ dựng chien lược phát trien tuyen tính t¾p tiên đe dien giải. Khung l p
lu n này tìm câu trả lời có nghĩa cho truy van với ontology khơng nhat qn
bang cách chon ra m®t t p con gom các tiên đe nhat quán tà ontology đau
vào: t p tiên đe này có liên quan với truy van theo m®t tiêu chí xác định trước
và có the trả lời được truy van (goi là t p tiên đe dien giải truv van). Mục 1.2
của chương sě trình bày các khái ni m cơ bản và đánh giá m®t so tiep c n áng
dụng khung l p lu n này.
(2) Các phương pháp thu®c nhóm thá hai tìm cách loại bỏ sự không nhat
quán đe xây dựng ontology nhat quán tà (m®t ho c nhieu) ontology đau vào. Vi
c tạo mới ontology như v y dien ra theo hai chien lược: chien lược thá nhat, dị
tìm và loại bỏ m®t so tiên đe khỏi ontology theo m®t tiêu chí cụ the [24, 28, 50,
53], và chien lược thá hai, áp dụng lý thuyet đong thu n [1] đe xây dựng t p tiên
đe hợp lý nhat (theo m®t tiêu chí cụ the nào đó) có the đại di n cho các
ontology đau vào [38, 39, 40, 42, 44, 45, 46, 47, 48].
Chien lược thá nhat thường được sả dụng đe duy trì sự nhat qn của m®t


×