Tải bản đầy đủ (.doc) (117 trang)

Đồ án tốt nghiệp nghiên cứu description logic và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1017.51 KB, 117 trang )

Mục Lục
Mục Lục 1
Lời nói đầu 2
Chương I: Nghiên cứu về lý thuyết Description Logics 4
Chương II: Công nghệ Semantic Web 51
Chương III: SPARQL – Ngôn ngữ truy vấn RDF 88
3.4 Ràng buộc dữ liệu kiểu OPTIONAL 93
3.5 Các phép toán và điều kiện trên câu truy vấn 94
Chương IV: Thư viện SemWeb.dll và ứng dụng minh họa 98
Kết luận. 115
1
Lời nói đầu.
Ngày nay công nghệ thông tin đang phát triển với một tốc độ rất cao và
đang là công cụ đắc lực trong tất cả các lĩnh vực của đời sống kinh tế, khoa học kỹ
thuật chính trị văn hóa tinh thần. Nó trở thành một phần không thể thiếu của cuộc
sống ngày nay. Đặc biệt trong khoa học kỹ thuật, công nghệ thông tin có một vai trò
quan trọng không thể thiếu, thúc đẩy sự phát triển mạnh mẽ của khoa học kỹ thuật.
Nó không chỉ là công cụ mà còn là động lực cho khoa học kỹ thuật phát triển và ứng
dụng.
Khi nhắc đến internet, người ta nhìn thấy ở đó một lượng tri thức rộng lớn và
rất hữu ích. Hầu như tất cả kho tri thức của nhân loại đã được số hóa và lưu trữ trên
khắp thế giới. Ngày càng phục vụ đắc lực cho nghiên cứu và ứng dụng trong khoa
học kỹ thuật và trong đời sống. Nhưng có một khó khăn cản trở đó là khi mà đi kèm
với lượng thông tin rất nhiều và phong phú đa dạng về mọi mặt thì việc tìm kiếm và
thu thập những thông tin hữu ích và cần thiết theo nhu cầu người tìm là rất khó
khăn. Khối lượng dữ liệu lớn sẽ rất khó khăn cho việc tìm kiếm và sử dụng. Vấn đề
đặt ra là cần phải làm sao để cho thông tin trở nên hữu ích và dễ dàng cho việc tìm
kiếm ứng dụng. Chính vì thế mà ngày nay, với sự phát triển mạnh mẽ của công nghệ
Web, thì Semantic Web xuất hiện với mục đích để giải quyết khó khăn trên. Với
Semantic Web người ta đang hướng tới xây dựng những bộ ngữ nghĩa cho dữ liệu
trên Internet, xây dựng một mạng dữ liệu ngữ nghĩa liên kết toàn cầu, giúp ích cho


việc tìm kiếm, truy tìm, và xử lý thông tin hiện nay.
Semantic Web sẽ phát triển thêm trên nền tảng của công nghệ web hiện tại,
chứ không thay thế nó. Và khi trở nên hoàn hảo, Semantic Web sẽ giúp các phần
mềm định vị thông tin trong một trang web và truy cập trực tiếp vào thông tin đó. Ở
một góc độ nào đó, Semantic Web sẽ trở thành một loại cơ sở dữ liệu toàn cầu.
2
Semantic Web sẽ giúp máy tính, cũng như con người, có thể tìm, đọc, hiểu và sử
dụng dữ liệu trên web để hoàn tất những nhiệm vụ hữu ích.
Chính vì tiềm năng to lớn của Semantic Web như thế, đặc biệt nó đang có
những phát triển mạnh mẽ đáng kể. Nên tôi đã chọn một lĩnh vực về Description
Logic – một phần của Semantic Web để nghiên cứu. Và chọn đề tài “Nghiên cứu
về Description Logic và ứng dụng” để làm đồ án tốt nghiệp. Từ đó tập trung vào
tìm hiểu nghiên cứu về Description Logic và về công nghệ Semantic Web.
Do thời gian có hạn và việc nghiên cứu làm việc còn hạn chế, nên nội dung
báo cáo tốt nghiệp không tránh khỏi những sai sót. Tôi rất mong được sự giúp đỡ và
tạo điều kiện của thầy giáo hướng dẫn và các bạn. Tôi xin chân thành cảm ơn!
3
Chương I: Nghiên cứu về lý thuyết Description Logics.
1.1 Giới thiệu về Description Logics.
Logic mô tả (Description logics, viết tắt DL) là một họ các ngôn ngữ biểu
diễn tri thức có thể sử dụng để biểu diễn tri thức thuật ngữ của một miền ứng dụng
theo một cách có cấu trúc và được hiểu rõ một cách hình thức. Logic mô tả có ý nói
đến các mô tả về khái niệm được dùng để mô tả một miền và ngữ nghĩa dựa lôgic
(logic-based semantics) mà có thể thu được từ việc dịch từ lôgic0
mệnh đề bậc nhất. Lôgic mô tả được thiết kế như là một mở rộng của khung ngữ
nghĩa (semantic frame) và lưới ngữ nghĩa (semantic network), hai loại này đã không
được trang bị một ngữ nghĩa dựa lôgic hình thức.
Tên gọi Logic mô tả được dùng từ năm 1980. Trước đó, nó được gọi là các
hệ thống thuật ngữ (terminological system), sau đó là các ngôn ngữ khái niệm
(concept language). Ngày nay, lôgic mô tả đã trở thành một nền móng của Web

Ngữ nghĩa (Semantic Web) do việc sử dụng nó trong thiết kế các bản thể (ontology).
Trong logic cơ bản, ngôn ngữ biểu diễn thường là biến thể của các tính chất
logic toán học bậc một, và lập luận để thực hiện kết quả logic. Trong các phương
pháp non-logical, thường dựa trên sử dụng các giao diện đồ họa, tri thức được biểu
diễn bởi một vài cấu trúc dữ liệu đặc biệt, và lập luận là thực hiện bởi các thủ tục
đặc biệt tương tự vận dụng các cấu trúc. Sử dụng các lưới ngữ nghĩa và các khung
(semantic networks and frames) để biểu diễn tri thức. Các lưới ngữ nghĩa được phát
triển bởi Quillian [1967], với mục đích mô tả ý nghĩa mạng có liên quan tới cấu trúc
tri thức và lập luận của hệ thống. Tương tự như mục đích của lưới ngữ nghĩa thì các
hệ thống frame cững được phát triển sau này. Trên thực tế, chúng có thể được coi
như các mạng cấu trúc, ở đó các cấu trúc của mạng tập trung vào các tập hợp biểu
diễn các cá thể và các mối quan hệ. Chúng ta sử dụng các thuật ngữ network-based
structure đề cập tới các mạng biêu diễn dựa theo các lưới ngữ nghĩa và các khung.
1.2 Từ các mạng tới Description Logics.
4
1.2.1 Biểu diễn các cấu trúc dựa trên mạng.
Đặc trưng của mạng đó là các phần tử mạng, là các node và các link. Các node
được sử dụng để mô tả các khái niệm, các tập hợp hoặc các lớp của các đối tượng
riêng biệt và các link được sử dụng để mô tả các mối quan hệ giữa chúng. Đôi khi
các mối quan hệ phức tạp tự chúng được biểu diễn như các node; điều này được
phân biệt với các node biểu diễn các khái niệm. Trong nhiều mạng trước kia cả các
đối tượng riêng biệt và các khái niệm đều được biểu diễn bởi các node. Xét ví dụ
trong hình 1.1, biểu diễn tri thức liên quan tới Persons, Parents, children, …Cấu
trúc trong hình được đề cập tới như là các thuật ngữ, và nó dùng để biểu diễn
generality/specificity(tổng quát/đặc trưng) của các khái niệm phức tạp. Ví dụ link
giữa Mother và Parents nói rằng “Mothers are Parents-các bà mẹ là các bậc cha
mẹ”; còn được gọi là quan hệ“IS-A”. Quan hệ IS-A định nghĩa kế thừa từ các khái
niệm và cung cấp cơ sở cho “kế thừa các thuộc tính – inheritance of properties”: Ví
dụ, nếu Person có tuổi, thì Mother cũng có tuổi. Đây là đặc trưng thiết lập được gọi
là inheritance networks-các mạng kế thừa.

Hình 1.1: Ví dụ về mạng
Tính năng đặc trưng của logic mô tả là những khả năng biểu diễn các loại quan
hệ khác nhau có thể giữa các khái niệm, ngoài các mối quan hệ IS-A. Ví dụ trong
hình 1.1, sau ký hiệu của khái niệm Parent có thuộc tính được gọi là “role”, biểu
diễn liên kết từ khái niệm tới node có role được gán nhãn hasChild. Role được gọi là
5
giá trị giới hạn, biểu diễn bởi nhãn v/r, nó biểu diễn sự giới hạn trên phạm vi của các
kiểu của các đối tượng mà nó có thể điền vào role đó. Thêm vào đó, node có số
lượng giới hạn được biểu diễn như (1,NIL), ở đó, số đầu tiên là biên dưới của số
lượng children và phần tử thứ hai là biên trên, và NIL biểu diễn vô hạn. Biểu diễn
của khái niệm Parent ở đây có thể đọc như sau: “A Parent is a Person having at
least one child, and all of his/her children are Persons”.
Các mối quan hệ này được kế thừa từ các khái niệm cha tới các khái niệm con
của chúng. Ví dụ, Khái niệm Mother,…, Female Parent, là các con cháu riêng biệt
của cả hai khái niệm Female và Parent, và là kết quả kế thừa từ Parent liên kết tới
Person thông qua role hasChild; trường hợp khác, Mother kế thừa giới hạn role
hasChild của nó từ Parent.
Nhận xét, có thể ẩn chứa các mối quan hệ giữa các khái niệm. Ví dụ, nếu
chúng ta định nghĩa Woman là khái niệm của femanle Person, có nghĩa là tất cả
Mother đều là Woman. Nhiệm vụ của hệ biểu diễn tri thức là tìm những mối quan hệ
tiềm ẩn. Trong trường hợp này có thể nhận xét rằng cả Mother và Woman đều được
kết nối với cả Female và Person, nhưng đường đi từ Mother tới Person chứa cả
node Parent, cái này rõ ràng hơn so với Person, do đó cho phép chúng ta kết luận
rằng Mother là cụ thể hơn Person.
1.2.2 A logical account of network-based represtation structures.
Các điều kiện xây dựng từ các ký hiệu cơ bản sử dụng một vài loại cấu trúc. Ví
dụ, khái niệm của phép giao được biểu thị C D, sử dụng để giới hạn tập hợp của
các cá thể thuộc về cả C và D. Chú ý rằng, trong ngữ pháp của Logic mô tả, các biểu
thức khái niệm là các biến tự do. Thực tế, biểu thức khái niệm biểu diễn tập của tất
cả cá thể thõa mãn các thuộc tính được chỉ ra trong biểu thức. Vì vậy, C D có thể

coi như một câu logic bậc một, C(x)

D(X) là true với các cá thể thuộc khái niệm C.
Các đặc trưng cấu thành khóa của DL tập trung vào các cấu trúc thõa mãn các
mối quan hệ giữa các khái niệm. Đó là biểu diễn giới hạn của giá trị. Ví dụ như giới
hạn giá trị, được viết là

R.C, yêu cầu rằng tất cả các cá thể trong mối quan hệ R
6
với khái niệm được mô tả thuộc C (về kỹ thuật, nó là tất cả cá thể thuộc mối quan hệ
R với cá thể được mô tả bởi khái niệm trong câu hỏi được mô tả như là của C).
Các khái niệm nguyên tử được hiểu như các tập con của phạm vi biểu diễn,
trong đó mặt ngữ nghĩa của các cấu trúc được chỉ ra bởi khai báo tập hợp của các cá
thể biểu diễn bởi mỗi cấu trúc. Ví dụ, khái niệm C D là tập hợp của các cá thể thu
được bởi giao nhau của các cá thể được biểu diễn bởi C và D, lần lượt theo thứ tự.
Tương tự, biểu diễn

R.C là tập các cá thể biểu diễn mối quan hệ R với các cá thể
thuộc tập hợp được biểu diễn bởi khái niệm C.
Ví dụ, chúng ta hãy giả định rằng, Female, Person, và Woman là các khái niệm
nguyên tử và hasChild và hasFemaleRelative là các role nguyên tử. Sử dụng các
toán tử intersection, union, và complement của các khái niệm, được hiểu là tập hợp
các toán tử, chúng ta có thể mô tả khái niệm của “Persons không phải là Female” và
khái niệm của “các cá thể là Female hoặc male” bằng biểu thức sau:
Person ¬Female and Female Male.
Đề cập tới intersection, union, complement của các khái niệm cũng như
concept conjunction, concept disjunction và concept negatetion, theo thứ tự định
sẵn, làm nổi bật mối quan hệ logic.
Bây giờ, chú ý tới các role bằng việc xem xét các giới hạn role xác định, được
gọi là “number restrictions”. Hầu hết các ngôn ngữ cung cấp (full) existential

quantification và value restriction cho phép mô tả, ví dụ như khái niệm của “các cá
thể có Female child” biểu diễn là

hasChild.Female, và mô tả khái niệm của
“individuals all of whose children are Female” bằng biểu thức khái niệm

hasChild.Female. Để phân biệt chức năng của mỗi khái niệm trong mối quan hệ, đối
tượng riêng biệt tương ứng với đối số thứ hai của role được xem xét như thuộc tính
nhị phân đựơc gọi là role filler. Trong các biểu thức trên, mô tả các thuộc tính của
các Parent có Female children, các đối tượng riêng biệt thuộc khái niệm Female là
các filler của role hasChild.
7
Việc xác định số lượng và các giá trị giới hạn có nghĩa là mô tả các mối quan
hệ giữa các khái niệm. Ví dụ, role liên kết giữa Parent và Person trong hình 1.1 có
thể được biểu diễn bởi biểu thức khái niệm:

hasChild.Person

hasChild.Person.
Bởi vậy biểu thức mô tả khái niệm của Parent được xem như tập hợp của các cá thể
có ít nhất 1 filler của role hasChild thuộc khái niệm Person; hơn nữa, mọi filler của
role hasChild phải là Person. Cuối cùng, chú ý rằng trong số lượng được xác định
role các giới hạn biến được xác định không được đề cập rõ ràng. Câu tương ứng
trong logic bậc 2 là:
. ( , ) ( )y R x y C y∀ ⊃
, ở đó x là giá trị tự do vượt ra ngoài phạm vi biểu diễn. Một
điều quan trọng khác của giới hạn role được đưa ra number restrictions, với giới hạn
các yếu tố của các tập hợp của các filler của các role. Ví dụ, khái niệm
(


3 hasChild) (

2hasFemaleRelative)
Biểu diễn khái niệm của “individual having at least three children and at most two
Female relatives”. Số giới hạn đôi khi được xem xét như là dấu hiệu đặc trưng của
DL, mặc dù nó có thể tìm thấy một vài cấu trúc tương tự trong một vài cơ sở dữ liệu
của ngôn ngữ mô hình (Đáng kể nhất là các mô hình quan hệ giữa các thực thể
Entity).
Sự giao nhau của các role là một ví dụ của cấu trúc role. Bằng trực giác,
hasChild hasFemaleRelative sinh ra role “has-daughter”, có biểu thức khái niệm.
Woman ≤2 (hasChild hasFemaleRelative)
Biểu diễn khái niệm “a Woman having at most 2 daughter”.
1.3. Biểu diễn tri thức trong Description Logics
Mục đích của chúng ta bây giờ là trình bày cách để DL có thể hữu ích trong
thiết kế của các ứng dụng dựa trên tri thức, tức là cách ngôn ngữ DL được sử dụng
trong hệ thống biểu diễn tri thức cung cấp ngôn ngữ cho định nghĩa tri thức cơ bản
và các công cụ dùng để lập luận qua nó. Sự thực hiện của các hệ thống tri thức gồm
8
hai vấn đề chính. Đầu tiên, cung cấp đặc trưng chính xác của tri thức cơ bản; điều
này bao gồm chính xác sự mô tả kiểu của tri thức để được chỉ rõ tới hệ thống cũng
như sự định nghĩa rõ ràng lập luận phục vụ hệ thống cần để cung cấp kiểu của các
câu hỏi mà hệ thống có thể trả lời. Thứ hai, cung cấp môi trường phát triển mà ở đó
người sử dụng có thể được lợi từ các phục vụ khác nhau có thể làm cho người dùng
tương tác với hệ thống hiệu quả hơn.
Trong tri thức cơ bản có thể thấy sự khác biệt giữa tri thức bên trong - kiến
thức tổng quát về bài toán chính, và tri thức bên ngoài - cái chỉ rõ các bài toán cụ
thể. Trong các lôgic mô tả, đặc trưng có sự phân biệt giữa cái gọi là TBox (hộp thuật
ngữ) và ABox (hộp khẳng định). TBox chứa các câu mô tả các cây phả hệ của các
khái niệm (nghĩa là quan hệ giữa các khái niệm) trong khi ABox chứa các câu có nội
dung xác định mỗi cá thể thuộc về vị trí nào trên cây phả hệ (nghĩa là quan hệ giữa

các cá thể và các khái niệm).
1.3.1 TBox – Hộp thuật ngữ.
Hình thức cơ bản của sự khai báo trong Tbox là định nghĩa khái niệm, đó là
định nghĩa của khái niệm mới trong các thuật ngữ của các khái niệm khác đã được
định nghĩa trước. Ví dụ, “Woman” có thể được định nghĩa như “Female Person”
bằng cách viết khai báo sau: Woman ≡ Person Female.
Khai báo này được hiểu là tương đương, thực chất để cung cấp cho cả hai có
đủ khả năng và các điều kiện cần thiết để phân loại riêng biệt về Woman. Đây là
hình thức khai báo mạnh hơn cách biểu diễn của nó khi được sử dụng trong các kiểu
biểu diễn tri thức khác, đặc trưng bắt buộc chỉ các điều kiện cần thiết; điểm mạnh
của sự khai báo là thường được xem xét đặc trưng tiêu biểu của DL tri thức cơ bản.
Trong DL tri thức cơ bản, thuật ngữ được thành lập bởi tập hợp của các sự khai báo
khái niệm của hình thức trên.
Tuy vậy, có một vài giả định quan trọng phổ biến thường được nói về các thuật
ngữ DL:
- Chỉ một định nghĩa cho khái niệm tên được cho phép;
9
- Các định nghĩa là acyclic trong khả năng đó các khái niệm hoặc được định
nghĩa trong các thuật ngữ của chính chúng hoặc trong các thuật ngữ của các
Mặc dù nó còn tranh luận về các ngữ nghĩa khác nhau có thể được chấp nhận
phục thuộc vào các ứng dụng mục tiêu, phổ biến hơn được chấp nhận khi nó mô tả
các ngữ nghĩa, các yêu cầu đơn giản mà tất cả các khai báo đều thõa mãn cách hiểu.
Hơn nữa, bằng việc bỏ qua yêu cầu mà mặt trái của khai báo đó có thể chỉ là tên các
khái niệm nguyên tử, nó có thể được gọi inclusion aixoms của mẫu:
C
ô
D
trong đó C và D là các biểu thức khái niệm tùy ý. Chú ý rằng định nghĩa khái niệm
có thể được biểu diễn bởi cả hai. Như kết quả của một vài nghiên cứu lý thuyết liên
quan đến cả tính quyết định và các kỹ thuật thực thi cho các cyclic TBox, hầu hết

các hệ thống logic mô tả hiện tại thừa nhận các cấu trúc mạnh cho các định nghĩa
các khái niệm.
Các suy luận cơ bản phục vụ cho các TBox có thể được xem như logical
implication và nó có nghĩa là để xác định rõ các mối quan hệ chung (ví dụ mối quan
hệ sắp xếp giưa hai biểu thức khái niệm) là kết quả hợp logic của các khai báo trong
TBox.
1.3.2 Abox – Hộp khẳng định.
Abox chứa tri thức mở rộng về lĩnh vực quan tâm, là sự xác nhận về các cá
thể, thường được gọi là các khẳng định thành viên. Ví dụ:
Female Person(ANNA).
Trạng thái ở đó cá nhân ANNA là Female Person. Đưa ra định nghĩa trên của
Woman, nó có thể bắt nguồn từ sự xác nhận rằng ANNA là trường hợp của khái
niệm Woman. Giống như:
hasChild(ANNA, JACOPO)
chỉ ra rằng ANNA có JACOPO là con. Các khẳng định của loại đầu tiên được gọi là
các khái niệm khẳng định, trong khi đó các khẳng định của loại thứ hai được gọi là
các khẳng định role.
10
Nhiệm vụ lập luận cơ bản trong Abox là “kiểm tra thực thể” (instant
checking), cái xác định xem có đưa ra cá thể là thể hiện của khái niệm được chỉ định
không. Mặc dù, các hệ phục vụ lập luận thường được xem xét và được giao làm,
chúng có thể được định nghĩa trong các thuật ngữ của instant checking. Nằm trong
số chúng, chúng ta có thể tìm tri thức cơ bản ổn định, chung quy lại để xác định mọi
khái niệm trong tri thức cơ bản thừa nhận ít nhất một cá thể; sự thi hành tìm kiếm
hầu hết các khái niệm chỉ ra đối tượng riêng biệt là một thể hiện của nó; và retrieval,
nó tìm ra các cá nhân trong tri thức cơ bản mà đó là thể hiện của khái niệm đưa ra.
Điều đó có thể tất cả đều được được hoàn thành bởi nghĩa của instant checking.
Nhiều ngôn ngữ phổ biến cho định nghĩa các Abox đã được xem xét. Các hệ
thống biễu diễn tri thức cung cấp ngôn ngữ logic mạnh cho Abox và ngôn ngữ logic
mô tả cho TBox thường được xem xét như các hệ thống lập luận lai ghép-hydbird,

từ các ngôn ngữ biểu diễn tri thức phức tạp khác nhau có thể được sử dụng để chỉ ra
tri thức trong các thành phần khác nhau. Các hệ lập luận lai ghép là phổ biến trong
những năm 1980; tập trung vào tri thức cơ bản với thành phần logic mô tả các định
nghĩa khái niệm và thành phần logic chương trình cho sự xác định về các cá thể. Các
phương pháp suy luận hợp lý và đầy đủ cho tri thức cơ bản lai ghép trở nên khó để
nghĩ ra mỗi khi có sự tác động chính xác giữa các thành phần tri thức.
1.4. Ngôn ngữ mô tả.
Mô tả cơ bản là atomic concerpt và atomic roles. Sự phức tạp mô tả có thể được
dựng nên từ chính bản thân chúng với concerpt constructors. Chúng ta sử dụng các
chứ cái A và B cho các khái niệm nguyên tử, chứ cái R cho các role nguyên tử và
chứ cái C và D cho các khái niệm mô tả. Ngôn ngữ mô tả biểu lộ bởi những cấu trúc
mà chúng cung cấp. Chúng ta thảo luận về tính đa dạng của AL (AL là viết tắt của
attribute language).
1.4.1 The basic Description Language AL.
Các mô tả khái niệm trong AL được hình thành theo quy tắc ngữ pháp sau:
11
C,D  A | (khái niệm nguyên tử)
| (khái niệm đỉnh)
| (khái niệm đáy)
¬A| (khái niệm phần bù)
C D| (khái niệm hợp)
C D| (khái niệm giao)


R.C| (khái niệm giới hạn giá trị)


R. | (khái niệm hạn chế tồn tại)
trong đó R là các vai trò-role.
Chú ý rằng, trong AL, phủ định có thể chỉ được áp dụng với các khái niệm

nguyên tử, và chỉ khái niệm đỉnh được cho phép trong phạm vi liên quan đến việc
xác định thông qua các role. Dựa trên lịch sử nghiên cứu, ngôn ngữ con của AL thu
được không cho phép sự phủ nhận nguyên tử được gọi là FL. Và ngôn ngữ con của
FL thu được bởi không cho phép được giới hạn liên quan đến sự tồn tại của sự xác
định được gọi là FL0.
Ví dụ: Chúng ta biết rằng Person và Female là các khái niệm nguyên tử.
person Female và Person ¬Female là các khái niệm mô tả trong AL. Các biểu
thức đó nói rằng người là phụ nữ và người không phải là phụ nữ. Nếu chúng ta giả
định rằng hasChild là role nguyên tử, chúng ta có thể hình thành các khái niệm
Person

hasChild. và Person

hasChild.Female, biểu diễn những người có con
và những người có con là con gái. Sử dụng khái niệm đáy, chúng ta có thể mô tả
những người không có con bằng khái niệm Person

hasChild. .
Để định nghĩa các hình thức ngữ nghĩa của các khái niệm AL, chúng ta xem
xét sự biểu diễn I, nó bao gồm tập không rỗng Δ
I
(lĩnh vực của biểu diễn) và biểu
diễn hàm, nó gán tới mọi khái niệm nguyên tử A lập A
I

Δ
I
và mọi role nguyên tử
R mối quan hệ nhị phân R
I



Δ
I
X Δ
I
. Hàm biểu diễn được mở rộng thành các mô tả
khái niệm bởi các định nghĩa quy nạp sau:
I
= Δ
I
12
Giả sử bây giờ J là biểu diễn của các ký hiệu cơ bản. Chúng ta mở rộng nó ra
để biểu diễn I mà nó bao hàm cả tên các ký hiệu bằng cách thiết lập A
I
= C
’J
, nếu A

C

là định nghĩ của A trong T’. Rõ ràng hơn, I là mẫu của của T’ và nó là mở rộng
của J là kiểu mẫu của T’. Thể hiện này của T’ là definitorial. Hơn nữa, T là
definitorial, nó là tương đương với T’.
Tất nhiên, đó là các thuật ngữ với các cyclic mà là definitorial. Xem xét ví dụ
nó chứa tiên đề
A


R.B


R.(A ¬A). (1.2)
có cyclic. Từ

R.(A ¬A) là tương đương khái niệm đáy, tiên đề (1.2) là tương
đương với tiên đề chu trình
A


R.B (13)
Ví dụ này là đặc trưng cho trạng thái chung.
Định lý 1.2: Mọi định nghĩa thuật ngữ ALC là tương đương với thuật ngữ cyclic.
1.4.2.3 Điểm cố định ngữ nghĩa cho các chu trình thuật ngữ.
Dựa trên các ngữ nghĩa chúng ta có được nghiên cứu xa hơn, về cơ bản nó là
ngữ nghĩa của logic bậc 1, các thuật ngữ có định nghĩa chỉ tác động nếu chúng là
cyclic cơ bản. Chúng ta gọi ngữ nghĩa mô tả các ngữ nghĩa để phân biệt nó từ điểm
cố định các ngữ nghĩa được giới thiệu ở dưới. Điểm cố định các ngữ nghĩa là có đầy
đủ ý nghĩa và khả năng trực giác có thể được bắt giữ bởi ít nhất hoặc lớn nhất điểm
có định các ngữ nghĩa.
Ví dụ 1.3: Giả sử rằng chúng ta muốn chỉ rõ khái niệm của “man who has only male
offspring,” ngắn gọn Momo. Trên thực tế, như man là Mos, đó là “man who has
only sons”. Mos có thể được định nghĩa các chu trình như:
Mos

Man

hasChild.Man
Với Momo, chúng ta muốn tạo mệnh đề về các filler của ngầm hiểu của sự
kết thúc của role hasChild. Ở đây tính đệ quy định nghĩa của Momo dường như là tự
nhiên. Người đàn ông có chỉ con đẻ là con của chính ông ấy, và tất cả những đứa trẻ

của ông ấy đều là con trai .
20
Momo

Man

hasChild.Momo. (1.4)
Các cyclic xuất hiện khi chúng ta muốn làm mô hình các cấu trúc đệ quy, như
các cây nhị phân.
Ví dụ 1.4: Chúng ta giả sử tập hợp của các đối tượng đó là các cây và mối quan hệ
nhị phân has-branch giữa các đối tượng mà đưa đến từ cây tới các cây con của nó.
Thì các cây nhị phân là các cây với nhiều nhất hai cây mà chính các nhánh cũng là
cây nhị phân.
BinaryTree

Tree ≤2 has-branch

has-branch.BinaryTree.
Như với định nghĩa của Momo, điểm cố định các ngữ nghĩa sinh ra ý nghĩa được kế
thừa. Mặc dù, ở ví dụ này chúng ta phải sử dụng ít điểm cố định các ngữ nghĩa.
Bây giờ chúng ta đưa ra định nghĩa hình thức của điểm cố định các ngữ
nghĩa. Trong thuật ngữ T, mọi tên ký hiệu A xảy ra chính xác chỉ một lần như bên
vế trái của tiên đề A

C. Vì vậy, chúng ta có thể xem T ánh xạ kết hợp tới tên ký
hiệu A khái niệm mô tả T(A) = C. Với ký hiệu này, sự biểu diễn I là mô hình của T
nếu và chỉ nếu, A
I
= (T(A))
I

. Mô tả đặc trưng của phương trình điểm cố định. Chúng
ta lợi dụng sự giống nhau này để giới thiệu tập hợp của các ánh xạ như biểu diễn này
là mô hình của T nếu và chỉ nếu là điểm cố định của ánh xạ.
Đặt T là thuật ngữ, và đặt J được cố định biểu diễn cơ sở của T. Bằng Ext
J
chúng ta biểu diễn tập hợp của tất cả các mở rộng của J. Đặt T
J
:Ext
J


Ext
J
là ánh xạ
mà ánh xạ sự mở rộng I để mở rộng T
J
(I) được định nghĩa bởi
( )
J
T I
A
=(T(A)
I
) cho
mỗi tên ký hiệu A.
Suy ra I là điểm cố định của T
J
nếu và chỉ nếu I=T
J
(I), tức là nếu và chỉ nếu

A
I
=
( )
J
T I
A
cho tất cả tên các ký hiệu. Điều này có nghĩa rằng, mọi sự định nghĩa A

C trong T, chúng ta có A
I
=A
T
J
(I)
=(T(A))
I
=C
I
, có nghĩa là T là một mô hình của T.
Chứng minh này cho kết quả sau.
Định lý 1.3: Đặt T là thuật ngữ, I là biểu diễn, và J là sự giới hạn của I tới các ký
hiệu cơ bản của T. Sau đó I là mô hình của T nếu và chỉ nếu I là điểm cố định của
T
J
.
21
Tùy theo định đề trước, thuật ngữ T là definitorial nếu và chỉ nếu mọi sự biểu
diễn cơ bản J là sự mở rộng duy nhất đó là điểm cố định của T
J

.
Ví dụ 1.6: Để hiểu tại sao các thuật ngữ chu trình là không được định nghĩa, chúng
ta thảo luận ví dụ thuật ngữ T Mono mà phù hợp với tiên đề (1.4). Xem xét sự biểu
diễn cơ bản J được định nghĩa bởi
Δ
J
= {Charles
1
, Charles
2
, }

{James
1, ,
James
Last
},
Man
J
= Δ
J
,
hasChild
J
= {(Charles
i
, Charles
(i+1)
) | i ≥ 1}


{(James
i
, James
(i+1)
) | 1 ≤ i < Last}.
Điều này có nghĩa là triều đại Charles không chết, nhưng ngược lại đó là thành viên
cuối cùng của triều đại James.
Chúng ta nhận ra điểm cố định của T
J
Momo
. Chú ý rằng cá nhân bên ngoài
children, tức là bên ngoài fillers của hasChild, luôn luôn biểu diễn của
(

hasChild.Momo)
không quan trọng cách Momo được biểu diễn. Vì vậy nếu I là điểm cố định mở rộng
của J, thì JamesLast là (

hasChild.Momo)
I
, và trong Momo
I
. Chúng ta kết luận
rằng mọi James là một Momo. Đặt I
1
là mở rộng của J đó là
1
I
Momo
gồm có chính

xác triều đại James. Thì nó dễ kiểm tra rằng I
1
là điểm cố định. Nếu thêm vào triểu
đại James, ngoài một vài Charles là Momo, thì tất cả các thành viên của triều đại
Charles trước và sau anh ta phải thuộc về khái niệm Momo. Nó có thể dễ dàng kiểm
tra rằng sự mở rộng I
2
biểu diễn Momo như toàn bộ là điểm cố định, và không có
điểm cố định khác.
Để đưa ra định nghĩa tác động chu trình thuật ngữ T, chúng ta phải lựa chọn
riêng lẻ điểm cố định của ánh xạ T
J
nếu có nhiều hơn một. Để kết thúc điều này, ta
định nghĩa từng phần thứ tự “≤” trên sự mở rộng của J. Chúng ta nói rằng I ≤ I’ nếu
A
I

A
I’
với mọi tên ký hiệu trong T. Trong ví dụ trên, Momo chỉ là một tên ký hiệu.
Từ Momo
I1

Momo
I2
, chúng ta có I
1
≤I
2
.

Điểm cố định I của T
J
là điểm cố định nhỏ nhất (lfp – least fixpoints) nếu I ≤ I
0
cho
mọi điểm cố định khác I
0
. Chúng ta nói rằng I là mô hình điểm nhỏ nhất của T nếu I
22
là điểm nhỏ nhất của T
I
cho những biểu diễn cơ bản của J. Dựa trên các ngữ nghĩa
điểm cố định nhỏ nhất chúng ta chỉ nhận vào các mô hình điểm cố định nhỏ nhất của
T dùng để biểu diễn. Điểm cố định lớn nhất (gfp), các mô hình điểm cố định lớn
nhất, và các ngữ nghĩa điểm có định lớn nhất được định nghĩa tương tự. Trong ví dụ
Momo, I
1
là điểm cố định nhỏ nhất và I
2
là điểm cố định lớn nhất của T
J
.
1.4.2.4 Existence of fixpoint models
Các mô hình điểm cố định nhỏ nhất và lớn nhất không cần phải tồn tại trọng
mọi thuật ngữ
Ví dụ 1.7: Xem xét tiên đề
A
≡ ¬
A. (1.5)
Nếu I là mô hình của tiên đề này, thì A

I

I
\ A
I
, trong đó hàm Δ
I
=
φ
, là điều vô lý.
Thuật ngữ chứa tiên đề (1.5) không có bất kỳ mô hình nào, vì vậy không có
các mô hình gfp (lfp).
Ngoài ra có các trường hợp trong đó các mô hình tồn tại, nhưng đó hoặc là
nhỏ nhất hoặc là lớn nhất. Ví dụ, xem xét thuật ngữ T với lựa chọn tiên đề
A



R.
¬
A. (1.6)
Đặt J biểu diễn cơ bản với Δ
J
= {a, b} và R
J
={{a, b}, {b, a}}. Sau đó hai điểm mở
rộng cố định I
1
, I
2

được định nghĩa bởi
1
I
A
= {a} và
2
I
A
={b}. Chúng không có được
khả năng so sánh với “≤”
Trên Ext
J
chúng ta đã được giới thiệu về “≤”. Với tập hợp của các biểu diễn
(I
i
)
i

I
trong Ext
J
chúng ta định nghĩa I
0
=
1
i I
I

C
như pointwise kết hợp của I

i
s, đó
là với mọi ký hiệu tên A chúng ta có
0 i
I I
i I
A A
U

=
. Trong đó I
0
là giá trị nhỏ nhất
của I
i
s, nó thể hiện rằng (Ext
J
,

) là lattice hoàn thành.
Hàm f:L

L trên lattice (L,

) là monotone-đều nếu f(x)

f(y) với mọi x

y.
Hàm monotone trên lattice hoàn thành tập hợp của các điểm cố định là không rỗng

và hình thành nên chính lattice hoàn thành. Trên thực tế, có điểm cố định fixpoint
lớn nhấ và điểm nhỏ nhất.
23
Định lý 1.4: Nếu T là negation free và J biểu diễn cơ bản, thì tồn tại các mở rộng
của J đó là mô hình lfp và mô hình gfp của T tách biệt ra.
Chúng ta thu được nhiều cyclic làm tính chất cho tình trạng của các điểm cực
đại và các điểm cực tiểu nếu chú ý tới sự tác động lẫn nhau giữa các cyclic và sự
phủ định. Chúng ta kết hợp thuật ngữ T đồ thị dependency G
T
, những node là ký
hiệu tên trong T. Nếu T chứa tiên đề A ≡ C, thì với mọi thực thi của ký hiệu tên A’
trong C, có một cung từ A tới A’ trong G
T
là khẳng định nếu A’ xảy ra ở C trong
phạm vi của số chẵn của những phủ định, và nó là phủ định nếu A’ xảy ra trong
phạm vi của số lẻ của các phủ định. Trình tự của các node A
1
,…,A
n
là path nếu có
cung trong G
T
từ A
i
tới A
i+1
với mọi i=1,…,n-1. Path A là cyclic nếu A
1
= A
n

.
Định lý 1.5: Đặt T là thuật ngữ thõa mãn rằng mỗi chu trình trong G
T
chứa số chẵn
của các cung phủ định. Thì T là monotone.
Chúng ta gọi thuật ngữ thõa mãn điều kiện tiên quyết của định đề này
syntactically monotone – cú pháp monotone.
1.4.2.5 Terminologies with inclusion axioms
Với các khái niệm đích xác chúng ta có thể không thể định nghĩa xác định tính
đầy đủ của chúng. Trong trường hợp này, chúng ta có thể vẫn phát triển các điều
kiện cần thiết cho khái niệm thành phần sử dụng inclusion. Chúng ta gọi một
inclusion bên vế trái là specialization nguyên tử.
Ví dụ, nếu knowledge engineer (male) nghĩ rằng định nghĩa của “woman” trong ví
dụ TBox của chúng ta (hình 2.2) là không thõa mãn, nhưng nếu anh ấy cảm nhận
rằng anh ấy không thể định nghĩa khái niệm “woman” trong tất cả các đặc điểm, anh
ấy có thể quy định rằng mọi woman là người với sự chuyên môn hóa:
Woman
ô
Percon (1.7)
Tập hợp của các tiên đề T là thuật ngữ tổng quát generalized terminology nếu
vế trái của mỗi tiên đề là một khái niệm nguyên tử và với mọi khái niệm nguyên tử
có nhiều nhất một tiên đề trong đó nó xảy ra trên vế trái. Chúng ta sẽ biến đổi thuật
24
ngữ tổng quát T thành thuật ngữ chính quy
T
, bao gồm những định nghĩa, thõa mãn
T
tương đương với T trong đó sẽ được chỉ rõ ở dưới. Chúng ta thu được
T
từ T

bằng cách chọn với mỗi sự chuyên môn hóa A
ô
C với định nghĩ A ≡
A
C. Thuật
ngữ
T
là sự bình thường hóa của T.
Nếu TBox chứa biểu thức chuyên môn hóa (1.7), thì sự chuẩn hóa thu được
định nghĩa
Woman Woman≡
Person.
Bằng trực giác, thêm vào ký hiệu cơ bản
Woman
viết tắt cho những nét đặc trưng để
nhận ra woman giữa những persons. Vì vậy, các kết quả thông thường hóa trong
TBox với định nghĩa cho Woman đó là giống nhau trong họ TBox.
Định lý 1.6: Đặt T là thuật ngữ suy rộng và
T
là chuẩn hóa của nó.
- Mọi mô hình của
T
là mô hình của T.
- Để mọi mô hình I của T có mô hình
I
của
T
mà có cùng lĩnh vực như I và
phù hợp với I trên các khái niệm nguyên tử và các vai trò trong T.
Chứng minh: Khẳng định đầu tiên đúng bởi vì mô hình

I
của
T
thõa mãn
(
I
A
A
=

)
I
I I
C A C= ∩
, nó đưa đến
I I
A C⊆
. Ngược lại, nếu I là mô hình của T,
thì sự mở rộng
I
của I, được định nghĩa bởi
I I
A A=
, là mô hình của
T
, bởi vì
I I
A C⊆
đưa đến
I

I I I I
A A C A C= ∩ = ∩
, và vì vậy
I
thõa mãn A ≡
A
C.
Do đó, trong giả thuyết, kể cả các tiên đề không thêm vào tính biểu hiện của
các thuật ngữ. Mặc dù, trên thực tế, chúng có ý nghĩa thuận lợi để giới thiệu các
thuật ngữ thành các thuật ngữ không thể được định nghĩa hoàn chỉnh.
1.4.3 World descriptions
Thành phần thứ hai của tri thức cơ bản, thêm vào trong thuật ngữ hoặc TBox,
là sự mô tả thế giới hoặc ABox.
1.4.3.1 Assertions about individuals.
25

×