Tải bản đầy đủ (.pdf) (103 trang)

Tổng quan về logic mô tả và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (973.61 KB, 103 trang )

BỘ GIÁO DỤC VÀ ðÀO TẠO
TRƯỜNG ðẠI HỌC BÁCH KHOA HÀ NỘI

ðINH VĂN PHỤNG

TỔNG QUAN VỀ LOGIC MÔ TẢ
VÀ ỨNG DỤNG

LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN

Hà Nội, 2009.


BỘ GIÁO DỤC VÀ ðÀO TẠO
TRƯỜNG ðẠI HỌC BÁCH KHOA HÀ NỘI
----------------------------------------------

ðINH VĂN PHỤNG

TỔNG QUAN VỀ LOGIC MÔ TẢ
VÀ ỨNG DỤNG
NGHÀNH: CÔNG NGHỆ THÔNG TIN

LUẬN VĂN THẠC SỸ CÔNG NGHỆ THƠNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS TRẦN ðÌNH KHANG

Hà Nội, 2009.



MỤC LỤC
Trang phụ bìa
Mục lục
Lời cảm ơn................................................................................................................i
Thuật ngữ tiếng anh.................................................................................................ii
Danh mục các hình ............................................................................................... iii
Danh mục các bảng ................................................................................................ iv
Mở ñầu.................................................................................................................... v
Chương 1: TỔNG QUAN VỀ LOGIC MÔ TẢ.................................................. 1
1.1.Giới thiệu ........................................................................................................... 1
1.1.1. Lịch sử phát triển. ..................................................................................... 1
1.1.2. Phân loại.................................................................................................... 2
1.1.3. Các bước xây dựng một hệ thống logic mơ tả. ......................................... 3
1.1.4. ðặc điểm của logic mơ tả.......................................................................... 3
1.1.5. Các miền ứng dụng. ................................................................................. 4
1.2. Kiến trúc tổng quát của một hệ thống mô tả. ................................................... 6
1.3. Các thủ tục suy diễn. ........................................................................................ 8
1.4. Tổng kết chương............................................................................................... 9
Chương 2: BIỂU DIỄN TRI THỨC BẰNG NGÔN NGỮ MÔ TẢ................ 10
2.1. Cú pháp và ngữ nghĩa của ngôn ngữ AL ........................................................ 10
2.1.1. Cú pháp .................................................................................................. 12
2.1.2. Ngữ nghĩa................................................................................................ 12
2.1.3. Ngôn ngữ S ............................................................................................. 14


2.2. Cơ sở tri thức của ngôn ngữ mô tả ................................................................. 15
2.2.1. Bộ thuật ngữ TBox.................................................................................. 16
2.2.2. Bộ khẳng ñịnh ABox............................................................................... 19
2.3. Các thuật toán suy diễn .................................................................................. 21
2.3.1. Suy diễn cho khái niệm........................................................................... 21

2.3.2. Suy diễn cho TBox.................................................................................. 24
2.3.3. Suy diễn cho ABox ................................................................................ 26
2.3.4. Các thuật toán suy diễn ........................................................................... 28
2.4. Tổng kết chương............................................................................................. 30
Chương 3: THUẬT TOÁN SUY DIỄN TABLEAU......................................... 31
3.1. Giới thiệu ....................................................................................................... 31
3.2. Thuật toán tableau đối với bài tốn thỏa khái niệm cho ALC ....................... 31
3.2.1. Ví dụ mở đầu........................................................................................... 32
3.2.2. Thuật tốn tableau cho ALC. ................................................................. 35
3.2.2.1. Nguyên tắc hoạt ñộng của thuật tốn tableau. ................................. 37
3.2.2.2. Các ví dụ minh họa thuật tốn tableau ........................................... 37
3.2.2.3. ðặc điểm của thuật tốn tableau...................................................... 44
3.2.2.4. ðánh giá độ phức tạp của thuật tốn tableau................................... 45
3.3. Mở rộng thuật toán tableau............................................................................. 46
3.3.1 Mở rộng tới các bài toán khác.................................................................. 46
3.3.1.1 Nhất quán ABox ALC....................................................................... 46
3.3.1.2. Bao hàm ........................................................................................... 47
3.3.2. Mở rộng tới các ngôn ngữ khác ............................................................. 48


3.4. Hệ thống suy diễn FaCT++. ........................................................................... 49
3.5. Tổng kết chương............................................................................................. 51
Chương 4: QUAN HỆ GIỮA LOGIC MÔ TẢ VỚI CÁC NGƠN NGỮ HÌNH
THÁI KHÁC. ....................................................................................................... 52
4.1.Các ngơn ngữ hình thái mô tả tri thức trong lĩnh vực AI ................................ 52
4.1.1. Mạng ngữ nghĩa. ..................................................................................... 52
4.1.2. Các hệ thống khung. ............................................................................... 54
4.1.3. ðồ thị khái niệm...................................................................................... 55
4.2. Quan hệ giữa logic mô tả và logic vị từ. ........................................................ 56
4.3. Quan hệ giữa logic mơ tả và logi hình thái ................................................ .. .58

4.4. Quan hệ giữa logic mô tả và XML................................................................. 60
4.5. Tổng kết chương............................................................................................. 64
Chương 5: ỨNG DỤNG LOGIC MÔ TẢ HỔ TRỢ CÔNG CỤ TẠO WEB
NGỮ NGHĨA ....................................................................................................... 65
5.1. Tóm tắt............................................................................................................ 65
5.2. Web ngữ nghĩa và Ontology........................................................................... 65
5.3. Logic mô tả là ngôn ngữ Ontology ................................................................ 67
5.4. Logic mô tả SHIQ .......................................................................................... 68
5.4.1. Cú pháp và ngữ nghĩa vai trò SHIQ........................................................ 68
5.4.2. Cú pháp và ngữ nghĩa khái niệm SHIQ .................................................. 69
5.5. Mô tả Ontology bằng ngôn ngữ SHIQ ........................................................... 71
5.6. SHIQ và DAML+OIL .................................................................................... 72
5.7. Suy diễn trong SHIQ ...................................................................................... 76
5.8. Công cụ tạo Ontology Protégé 4.0 ................................................................. 77


5.8.1. Giới thiệu................................................................................................. 77
5.8.2. Protégé 4.0............................................................................................... 78
5.9. Triển khai ứng dụng thử nghiệm .................................................................... 79
5.9.1. Công cụ thực hiện ................................................................................... 79
5.9.2. Triển khai ứng dụng ................................................................................ 79
5.9.2.1 Cơ sở dữ liệu và các phương thức cơ bản....................................... 80
5.9.2. 2 Các giao diện chương trình .............................................................. 81
5.10. Tống kết chương........................................................................................... 86
KẾT LUẬN . ........................................................................................................ 87
TÀI LIỆU THAM KHẢO..................................................................................... 89
Tóm tắt luận văn ................................................................................................. 90
Abstract ................................................................................................................ 91



i

LỜI CẢM ƠN
Con xin gửi lời thành kính đến bố mẹ ñã suốt ñời chăm lo và tiếp thêm sức mạnh
cho con học tập. Xin dành tặng luận văn này cho người mẹ thân u và người cha
đáng kính đã hết lịng lo cho gia đình và tận tụy ni con ăn học .
Tơi xin được gửi lời cảm ơn sâu sắc đến PGS.TS. Trần ðình Khang. Người đã
tận tình huớng dẫn, trực tiếp chỉ bảo tơi trong q trình làm đồ án tốt nghiệp.
Tơi cũng xin được gửi lời cảm ơn tới các thầy cô giáo trong khoa Công nghệ
Thơng tin trường ðại học Bách Khoa Hà Nội đã tận tình giảng dạy, truyền đạt cho
tơi những kiến thức và kinh nghiệm quý báu trong 2 năm học tập vừa qua.
Và cuối cùng, tơi xin được gửi lời cảm ơn tới bạn bè đồng nghiệp đã hết lịng
giúp đỡ, tạo điều kiện và đóng góp ý kiến trong q trình học tập, nghiên cứu và
hồn thành đồ án tốt nghiệp.
Hà Nội, tháng 11/2009


ii

THUẬT NGỮ TIẾNG ANH
DL

Logic mô tả (Descripion Logic)

AL

Ngôn ngữ thuộc tính (Attributive language)

DL-KRSs


Hệ thống mơ tả thức dựa trên DL (Knowledge
representation system based on Description Logic)

XML

Ngơn ngữ đánh dấu (eXtensible Markup Language)

NNF

Dạng chuẩn bù (Negation Normal Form )

AI

Trí tuệ nhân tạo

Terminology

Thuật ngữ

Knowledge base

Cơ sở tri thức

Assertional (box)

Bộ khẳng ñịnh ABox

Terminological (box)

Bộ thuật ngữ TBox.


Concept equivalence

Tương ñương khái niệm

Concept inclusion

Bao hàm khái niệm

(Un)Satisfiability

Bài tốn khơng/ thỏa khái niệm.

Disjointness

Bài tốn khái niệm khơng giao nhau

Model

Mơ hình.

DAML

Darpa Agent Markup Language

OIL

Ontology Interface Layer

RDF


Resource Description Framework

RDFS

RDF Schema.


iii

DANH MỤC CÁC HÌNH
Hình 1.1. Kiến trúc của hệ thống mơ tả tri thức....................................................... 7
Hình 2.1. Minh họa ngữ nghĩa ALC ....................................................................... 13
Hình 2.2. Bộ thuật ngữ TBox với các khái niệm về quan hệ gia đình ................... 17
Hình 3.1. Luật chuyển về dạng chuẩn phủ định..................................................... 32
Hình 3.2. Luật lan truyền của bài toán thỏa khái niệm cho ALC........................... 36
Hình 3.3. Ngun tắc hoạt động của thuật tốn tableau......................................... 37
Hình 3.4. Mở rộng thuật tốn tableau tới các bài tốn và ngơn ngữ khác ............. 46
Hình 4.1. Mạng ngữ nghĩa mơ tả động vật............................................................. 52
Hình 4.2. Quan hệ giữa ALC và logic vị từ cấp I có hai biến................................ 56
Hình 4.3 . Hai tài liệu XML mơ tả khác hàng và dịch vụ ...................................... 61
Hình 4.4. Phần DTD Service tương ứng với tài liệu XML trong hình 4.3 ............ 61
Hình 4.5. Cây nhị phân tương ứng với tài liệu CML mơ tả khách hàng................ 62
Hình 4.6. Phần mã hóa DTDs thành cơ sở tri thức DL .......................................... 63
Hình 5.1. Giao diện màn hình tạo các lớp và định nghĩa các khái niệm................ 82
Hình 5.2 Giao diện màn hình tạo các thuộc tính cho các lơp................................. 82
Hình 5.3 Giao diện màn hình tạc thể hiện cho các lớp .......................................... 83
Hình 5.4 Chọn bộ suy diễn từ Menu Reasoner của Protégé 4.0............................. 84
Hình 5.5 Ontolgogy sau khi phân loại bằng Pellet................................................. 85
Hình 5.6 Minh họa tìm kiếm cá thể của một lớp.................................................... 86



iv

DANH MỤC CÁC BẢNG
Bảng 2.1. Cú pháp mô tả của ngơn ngữ thuộc tính AL........................................... 11
Bảng 2.2. Các cú pháp bổ sung .............................................................................. 12
Bảng 2.3 Ngữ nghĩa của các khái niệm họ ngôn ngữ AL ...................................... 14
Bảng 5.1 Cú pháp tương ứng của DAML+OIL và DLs......................................... 73
Bảng 5.2 Các tiên ñề DAML+OIL ......................................................................... 75
Bảng 5.3 Cú pháp của Protégé 4.0 tương ứng với DLs.......................................... 80


v

MỞ ðẦU
Lôgic mô tả (DL) là một họ các ngôn ngữ ñược dùng ñể biểu diễn tri thức của
một miền ứng dụng và các suy diễn về nó. Cái tên lơgic mơ tả ngụ ý nói đến các mơ
tả về các khái niệm được dùng để mơ tả một miền dựa trên ngữ nghĩa logic.
Logic mơ tả có nhiều ứng dụng, ñặc biệt là trong các hệ thống ứng dụng thơng
minh. Ngày nay, lơgic mơ tả đã trở thành nền móng của Web ngữ nghĩa (Semantic
Web). Việc sử dụng nó trong các bản thể (Ontology) nhằm mục đích bổ sung ngữ
nghĩa, tăng khả năng liên kết giữa các trang Web… ñã thu hút ñược sự quan tâm
của rất nhiều nhà nghiên cứu.
Với lịng u thích bộ mơn khoa học máy tính và đứng trước một lĩnh vực đã và
đang phát triển, tơi đã chọn đề tài này. Nhưng do thời gian ngắn ngủi và khả năng
tìm hiểu về logic mơ tả cịn nhiều hạn chế, trong q trình thực hiện luận văn, đề
cương có nhiều chỗ thay đổi so với trước. Tuy nhiên những thay đổi này là khơng
nhiều, chủ yếu để điều chỉnh tính đúng đắn do trước khi tiến hành chọn đề tài tơi
chưa hiểu rõ và cũng khơng có một tài liệu nào đề tìm hiểu; một phần cũng nhằm

giới hạn lại phạm vi nghiên cứu ñể phù hợp với thời gian cho phép.
Về bộ cục, luận văn bao gồm 5 chương. Nhưng nội dung chủ yếu có 2 phần
chính, đó là : Cơ sở lý thuyết (tổng qua về logic mô tả, bao gồm 4 chương ñầu) và
ứng dụng (trình bày một ứng dụng cụ thể trong chương 5) như sau :
Chương 1: Tổng quan về logic mơ tả. Trình bày cơ chế biểu diễn ngơn ngữ ñể
giải quyết nhu cầu của các miền ứng dụng. Trước tiên tập trung vào mối quan hệ
giữa logic mô tả với các hệ thống mạng ngữ nghĩa trước ñây. Sau đó, trình bày kiến
trúc của một hệ thống mơ tả và các dịch vụ suy diễn liên quan.
Chương 2 : Biểu diễn tri thức bằng ngôn ngữ mô tả. Chương này tập trung thảo
luận về ngôn ngữ logic mô tả AL và họ ngơn ngữ mở rộng của nó. Trình bày cú
pháp và ngữ nghĩa của AL và của ngôn ngữ S. Dựa trên kiến trúc của một hệ mơ tả
(đã được giới thiệu trong chương 1), chương này ñề cập ñến cơ sở tri thức bên trong
của nó, ñó là bộ thuật ngữ TBox T và bộ khẳng ñịnh ABox A. ðịnh nghĩa các bài


vi

tốn suy diễn, các phép biến đổi tương đương giữa các bài tốn này và mơ tả một
vài cách tiếp cận khác nhau để giải quyết các bài tốn đó.
Chương 3: Thuật tốn suy diễn tableau. Chương này trình bày chi tiết thuật tốn
tableau để xác định tính thỏa khái niệm của ngôn ngữ ALC của họ logic mô tả. Lấy
một vài ví dụ minh họa. Tính độ phức tạp của thuật toán, và giới thiệu một hệ thống
suy diễn tiêu biểu (FaCT++, Pellet, RACER) dựa trên giải thuật này. Cuối cùng mở
rộng giải thuật tableau tới các bài toán và ngôn ngữ khác.
Chương 4 : Mối quan hệ giữa logic mơ tả với các ngơn ngữ hình thái khác .
Chương này trình bày mối quan hệ giữa logic mơ tả với các ngơn ngữ hình thái
khác mà khơng tập trung vào việc chúng có được thiết kế để mơ tả tri thức hay
khơng ? Chúng ta sẽ tìm hiểu các ngơn ngữ hoặc là (1) có sức ảnh hưởng rất lớn đến
logic mơ tả, hoặc là (2) có quan hệ gần gũi với các bài toán suy diễn , hoặc là (3) có
khả năng biểu diễn giống nhau.

Chương 5: Ứng dụng logic mô tả hỗ trợ công cụ tạo Web ngữ nghĩa. Chương này
trình bày về ứng dụng của logic mô tả và các dịch vụ suy diễn của nó trong việc
thiết kế các Ontology. Trình bày khái qt về Web ngữ nghĩa. Tìm hiểu ngơn ngữ
mơ tả SHIQ, DAML+OIL, công cụ tạo Ontology Protégé 4.0 và cuối cùng là triển
khai ứng dụng, ñưa ra một vài kết quả thử nghiệm minh họa.


1

Chương 1 TỔNG QUAN VỀ LOGIC MÔ TẢ
1.1. Giới thiệu.
Biểu diễn tri thức là một lĩnh vực của trí tuệ nhân tạo (AI) tập trung vào việc thiết
kế một cách hình thức để mơ tả tri thức về một miền ứng dụng bằng cách mơ tả đặc
điểm các lớp đối tượng và các mối quan hệ giữa chúng. Việc tổ chức thành các lớp
dùng để mơ tả miền ứng dụng dựa trên cấu trúc tuần tự không chỉ mang lại hiệu quả
trong việc biểu diễn thơng tin mà cịn cho phép công việc suy diễn thực thi một cách
tốt hơn.
Nghiên cứu logic mô tả [1],[4] bao gồm: cơ sở lý thuyết, thực thi các hệ thống
mô tả tri thức và sử dụng các hệ thống này ñể phát triển các ứng dụng trong nhiều
lĩnh vực.
1.1.1. Lịch sử phát triển.
- Năm 1970, tiếp cận lĩnh vực biểu diễn tri thức và áp dụng ñầu tiên vào mạng
ngữ nghĩa (semantic network) và các hệ thống khung (frame systems)[1]. Tuy nhiên,
các hệ thống này khơng có các định nghĩa rõ ràng, các cơng cụ suy diễn chủ yếu
dựa vào chiến lược thực hiện hệ thống. ðến khi hệ thống KL-ONE ra đời, nó cung
cấp cơ sở logic ñể phiên dịch các lớp ñối tượng (các khái niệm) và các mối quan hệ
(các vai trị) thì hướng tiếp cận mơ tả tri thức mới thật sự hình thành.
Ban đầu, logic mơ tả (DL) được biết ñến dưới cái tên là “các hệ thống thuật ngữ”
(terminological systems) hoặc là “ngôn ngữ khái niệm” (concept lunguages). Về
sau, khi sự chú ý chuyển hướng vào các tính chất của hệ thống logic thì cái tên

“logic mơ tả” (description logic) mới trở nên phố biến.
- Từ năm 1989, hội thảo về logic mơ tả được duy trì mỗi hai năm một lần. Nhưng
đến năm 1994 thì được tổ chức hằng năm. Và đến năm 1997, mọi khía cạch về logic
mô tả bao gồm: lý thuyết, sự thực hiện và các ứng dụng ñã ñược ñề xuất ñầy ñủ.


2

1.1.2 Phân loại.
Tiếp cận lĩnh vực biểu diễn tri thức ñược chia ra làm hai loại: Logic hình thức
(suy diễn thơng qua phép tính vị từ) và phi logic dựa trên sự mô tả (phát triển trên
cơ sở các khái niệm liên quan ñến nhận thức).
Trong cách tiếp cận thứ nhất, ngôn ngữ mô tả thường là một biến của phép tính
vị từ cấp một (First-Order-Predicate calculus) và suy diễn chung qui là kiểm tra kết
quả logic. Còn cách tiếp cận phi logic thì tri thức được biểu diễn bằng ngữ nghĩa
của cấu trúc dữ liệu ñặc biệt, và suy diễn được hồn thành bằng các thủ tục đặc biệt,
thao tác trên cấu trúc dữ liệu đó .
Sự phân loại này giúp chúng ta nhận dạng ñược các mạng ngữ nghĩa và các hệ
thống khung. Mặc dù có sự khác nhau giữa hai loại hệ thống này, nhưng cả hai ñều
ñược xem như là các mạng có cấu trúc, ñó là biểu diễn một tập các cá thể và các
mối liên hệ của nó. Vì vậy người ta dùng thuật ngữ “mạng cấu trúc” (networkbased- structures) ñể chỉ các mạng ngữ nghĩa và các hệ thống khung.
Do nhu cầu của con người ngày một nhiều, từ quan ñiểm thực tế cho thấy các
mạng cấu trúc có sức thu hút và tầm ảnh hưởng nhiều hơn các hệ thống logic.
Nhưng chúng khơng đủ sức làm thỏa nhu cầu người dùng vì sự thơng dụng của nó
thiếu tính đúng đắn khi mơ tả ngữ nghĩa. Trong nhiều trường hợp hầu như ñồng
nhất các thành phần và thậm chí đồng nhất tên các quan hệ. Vậy làm thế nào cung
cấp ñược ngữ nghĩa ñể mô tả tri thức trong các mạng cấu trúc?
ðể trả lời cho câu hỏi này, người ta ñã tiến hành khai thác các khái niệm cấu trúc
một cách có thứ tự, cả trong các thuật ngữ không bị ràng buộc về mặt mơ tả và các
thuật ngữ có tầm ảnh hưởng ñến khả năng suy diễn.

Cụ thể hơn, ñể nhận dạng được một hệ thống mạng ngữ nghĩa, ít nhất là các đặc
điểm đặc trưng của nó là dựa vào logic vị từ cấp một [Hayes, 1979]. Các thành phần
cơ bản trong mơ tả được biểu diễn là vị từ một ngôi, biểu thị bằng một tập các cả
thể, và vị từ hai ngôi, biểu thị bằng các mối quan hệ giữa các cá thể.


3

1.1.3. Các bước xây dựng một hệ thống logic mô tả.
Logic mơ tả được phát triển từ cái gọi là mạng kế thừa cấu trúc (structured
inheritance network)[1], nó được đưa ra chủ yếu nhằm mục đích khắc phục tính
nhập nhằng tối nghĩa của các hệ thống mạng ngữ nghĩa trước ñây, và ñược thực
hiện lần ñầu tiên trong hệ thống KL-ONE [Brachman và Schmolze, 1985].
ðể xây dựng một hệ thống logic mô tả, thông thường phải thực hiện các bước sau
ñây ([1] trang 45) :
Xây dựng bộ cú pháp cơ bản là các khái niệm nguyên tố, các vai trò nguyên
tố và các cá thể (các thể hiện).
Xây dựng các khái niệm và vai trò phức tạp dựa vào sức mạnh diễn đạt của
ngơn ngữ mơ tả.
Sử dụng các thủ tục suy diễn làm sáng tỏ tri thức tìm ẩn về các khái niệm và
các cá thể. ðặc biệt là quan hệ bao hàm giữa hai khái niệm và thể hiện quan
hệ giữa các cá thể và khái niệm.
1.1.4. ðặc ñiểm của logic mô tả.
ðặc ñiểm tiêu biểu của Logic mô tả là khả năng biểu diễn các loại quan hệ khác
nhau giữa các khác niệm trong một miền ứng dụng mà trong đó các biểu thức được
xây dựng từ các khái niệm nguyên tố và các vai trò nguyên tố. Nó khác với các
ngơn ngữ logic khác ở chỗ, DL ñược trang bị cơ sở logic dựa trên ngữ nghĩa. Do đó,
các hệ thống biểu diễn tri thức dựa trên DLs cung cấp cho người sử dụng nó các
khả năng suy diễn khác nhau để tìm được tri thức tìm ẩn từ các tri thức được mơ tả.
1.1.5. Các miền ứng dụng.

Logic mơ tả ngày càng được phát triển và ứng dụng rộng rãi trong nhiều hệ thống
ứng dụng ở rất nhiều lĩnh vực. Chúng ta có thể kể ra đây một vài miền ứng dụng
của nó, chẳng hạn như :
Xây dựng phần mềm (Software engineering).


4

ðây là miền ứng dụng đầu tiên của Logic mơ tả. Ý tưởng cơ bản là dùng DL ñể
thực hiện hệ thống thông tin phần mềm (software infomation system). Một hệ thống
hỗ trợ phát triển phần mềm bằng cách tìm kiếm thông tin trong một hệ thống phần
mềm rộng lớn.
Một trong những ứng dụng mới nhất của logic mô tả là hệ thống LASSIE
[Devambu, 1991], cho phép người dùng khả năng xây dựng, phân loại các khái
niệm có liên quan trong một lĩnh vực ñể viết mã (code) thực thi chúng. Hệ thống
này đã mang lại thành cơng to lớn. Tuy nhiên cuối cùng cũng vấp phải nhiều trở
ngại do khó duy trì được cơ sở tri thức trong nền cơng nghệ phần mềm ln ln
biến đổi một cách tự nhiên.
Thiết lập hệ thống (configuration)
Một miền ứng dụng khác cũng rất thành công là xây dựng các ứng dụng dựa trên
tri thức bao gồm nhiều ứng dụng hỗ trợ thiết kế, kiến tạo các hệ thống phức tạp
bằng cách kết nối nhiều thành phần với nhau.
Y khoa.
ðây cũng là một miền ứng dụng ñược các hệ chuyên gia phát triển từ những năm
1980. Tuy nhiên ñộ phức tạp thuộc lĩnh vực này là nguyên nhân dẫn tới sự ña dạng
của các hệ thống mô tả tri thức dựa trên logic mơ tả (DL-KRS) [1]. Chẳng hạn, hỗ
trợ ra quyết định ñể chẩn ñoán y khoa chỉ là một trong nhiều tác vụ mang tính tự
động.
Như cầu giải quyết được các cơ sở tri thức rộng lớn có tính co giãn (large – scale
knowledge bases) (có hàng trăm ngàn khái niệm) ñã dẫn ñến sự phát triển các hệ

thống chuyên dùng như hệ thống GALEN [Rector, 1993] chẳng hạn. ðể giải quết
được tính giãn nở của tri thức, ngơn ngữ DL trong các ứng dụng này thường bị giới
hạn lại nhằm mục đích làm đơn giản hóa vấn đề (ngơn ngữ chỉ có một vài bộ xây
dựng cơ bản), khơng có sự phân loại ra thành nhiều mức ñộ khái niệm nhỏ hơn từ
một khái niệm đỉnh. Tuy nhiên có một vài hệ thống rất hữu dụng trong việc mô tả
cơ sở tri thức thuộc lĩnh vực y khoa như kiến trúc PART-OF. Hơn nữa, các thành


5

phần DL của ứng dụng này thường tương tác trong một hệ thống thông tin rộng lớn,
bao gồm các nguồn thơng tin khác nhau được tính hợp lại nhằm cung cấp các dữ
liệu có giá trị và có tính chặt chẽ.
Các thư viện số và Web ngữ nghĩa.
Mối quan hệ giữa các mạng ngữ ngữ nghĩa và các cấu trúc liên kết ñược biểu thị
bằng các siêu văn bản (hypertext) ñã thúc ñẩy phát triển nhiều ứng dụng DL có tác
dụng mô tả các thông tin thư mục và hỗ trợ phân loại, rút trích thơng tin trong các
thư viện số [Welty và Jenkins, 2000]. Các ứng dụng này ñã chứng minh ñược hiệu
quả của DL ñối với việc phân loại được sử dụng trong các mơ hình thư viện, và chỉ
ra lợi ích của thủ tục suy diễn bao hàm khái niệm trong việc phân loại và rút trích
thơng tin.
Khả năng hiển thị của World Wide Web giống với một mạng ngữ nghĩa. Thậm
chí ngay khi mới bắt đầu Web, với ý định đưa ra các lợi ích cho phép các chương
trình khơng chỉ có khả năng duy trì các cấu trúc định hướng mà cịn nội dung thơng
tin hiển thị trên trang Web. Với mục đích xây dựng các hệ thống để u cầu Web
“có ngữ nghĩa”, cho phép người dùng ñưa ra các yêu cầu Web như thể với cơ sở dữ
liệu (database). Dựa vào mối quan hệ giữa DL và các mạng ngữ nghĩa, nhiều ñề
nghị được phát triển sử dụng DL để lập mơ hình cấu trúc Web, cho phép khai thác
khả năng suy diễn DL để quản lý thơng tin [Kirk, 1995; De Rosa, 1998].
Gần đây nhất, sử dụng ngơn ngữ định dạng văn bản (markup languages) để nắm

bắt được nội dung thơng tin của các cấu trúc Web. Chẳng hạn XML là một ngôn
ngữ thể hiện mối quan hệ giữa DL và ngôn ngữ ñánh dấu văn vản. Hơn nữa, sự
quan tâm ñến việc chuẩn hóa các cơ chế biểu diễn tri thức ñã ñưa ñến sự phát triển
một ngôn ngữ mới DAML-ONT [McGuinness, 2002]. ðây là ngôn ngữ Ontology
cho phép sản sinh ra Web bằng các mơ hình hướng đối tượng. Và OIL [Fensel,
2001] với mục đích tương tự là mơ tả các Ontology, nhưng có mối quan hệ gần gũi
với DL.


6

Như vậy việc sử dụng DL trong việc thiết kế các thư viện số và các ứng dụng
Web có liên quan ñến các ngữ như DAML-ONT, OIL và DAML+OIL. Các ngơn
ngữ này chúng ta sẽ được giới thiệu trong chương 5.
Các miền ứng dụng khác.
Ngoài các miền ứng dụng kể trên cịn có rất nhiều miền ứng dụng khác đang
được sự quan tâm của nhiều nhà nghiên cứu DL cũng như những người quan tâm
đến DL. Chúng ta có thể giới thiệu một vài trong số các miền ứng dụng đó có sử
dụng đến logic mơ tả là lập lịch và khai thác dữ liệu (data mining).
ðối với ứng dụng lập lịch, tri thức phụ thuộc vào các dịch vụ của thành phần lập
lịch, vì DL khơng tự cung cấp ñược các thành phần như vậy. Chúng ñược sử dụng
ñể chạy các hệ thống lập lịch có mục đích tổng qt. Ý tưởng cơ bản là để mơ tả các
lịch trình và các hành động giống như việc tích hợp các thành phần của nó. Hệ
thống có thể duy trì việc phân loại các lịch trình và đáp ứng được các dịch vụ suy
diễn. Hai ví dụ về các thành phần lập lịch ñã phát triển trong các hệ DL-KRS là
CLASP [ Yen, 1991] và EXPECT [Swartout và Gil, 1996]. Các hệ thống lập lịch
dựa trên DL ñã ñược sử dụng trong nhiều miền ứng dụng ñể hỗ trợ các dịch vụ lập
lịch. Các miền ứng dụng này bao gồm xây dựng phần mềm, y khoa, lập lịch vận
động, tích hợp thơng tin.
DL cũng được sử dụng trong các ứng dụng khai thác dữ liệu, trong đó các thủ tục

suy diễn có thể giúp xử lý phân tích số lượng lớn các dữ liệu.

1.2. Kiến trúc tổng quát của một hệ thống mô tả.
Một hệ thống biểu diễn tri thức dựa trên logic mô tả cung cấp khả năng thiết lập
cơ sở tri thức để suy diễn và để có thể thao tác trên nó.
Hình 1.1 dưới đây mơ tả kiến trúc chung của một hệ logic mô tả ([1]- trang 46).
Cơ sở tri thức K = <T, A> bao gồm hai thành phần chính là “Bộ thuật ngữ” TBox T
và “Bộ khẳng ñịnh” ABox A.


7

TBox
(ðịnh nghĩa
các thuật ngữ
Ngơn ngữ
mơ tả

Suy diễn

ABox
(các khẳng
định)

Chương trình
ứng dụng

Các tập
luật


Hình 1.1 Kiến trúc của hệ thống mơ tả tri
thức dựa trên Logic mô tả
“Bộ thuật ngữ” TBox
Bao gồm các khái niệm (ñược biểu thị bằng một tập các cá thể) và các vai trị
(được biểu thị bằng quan hệ hai ngôi giữa các cá thể). Dựa vào các khái niệm và vai
trò nguyên tố (còn gọi là khái niệm và tên vai trò), tất cả các hệ thống DL cho phép
người dùng xây dựng các mô tả phức tạp hơn. Ngơn ngữ xây dựng các mơ tả là một
đặc ñiểm của mỗi hệ thống DL, và các hệ thống khác nhau được phân biệt dựa trên
cơ sở của ngơn ngữ mơ tả.
“Bộ khẳng định” ABox
Chứa các khẳng định hay cụ thể hơn là các mô tả về thế giới.
Một hệ thống DL khơng chỉ có bộ thuật ngữ và bộ khẳng định mà cịn có các các
dịnh vụ suy diễn (reasoning services). ðiển hình là dịch vụ suy diễn cho bộ thuật
ngữ TBox nhằm xác định xem mơ tả đó có thỏa hay khơng ? (tức là khơng có mâu
thuẫn), hoặc cái mơ tả đó có tổng qt hơn cái mô tả khác hay không ? (nghĩa là cá
thứ nhất có bao hàm cái thứ hai hay khơng ?) Một bài tốn quan trọng khác đối với
bộ khẳng định ABox là bài tốn kiểm tra tính nhất qn, tức là xem nó có mơ hình
hay khơng ? và các khẳng định trong ABox có đưa ra được một cá thể là thể hiện
của một khái niệm ñược ñịnh nghĩa trước hay không ?


8

Chúng ta sẽ quay lại tìm hiểu chi tiết hơn hai thành phần này của cơ sở tri thức
trong chương 2.
Có thể kể ra đây một vài hệ thống mơ tả để minh họa như hệ thống lơgic mơ tả
đầu tiên KL-ONE [Brachman và Schmolze, 1985]. Một số hệ thống lơgic mơ tả
khác xuất hiện sau đó là LOOM (1987), BACK (1988), KRIS (1991), CLASSIC
(1991), FaCT (1998) và gần ñây là RACER(2001), CEL (2005), và KAON2 (2005).


1.3. Các thủ tục suy diễn.
Như trên đã trình bày, hệ cơ sở tri thức bao gồm bộ thuật ngữ TBox và bộ khẳng
ñịnh ABox có ngữ nghĩa tương đương với tập các tiên ñề trong logic vị từ cấp một.
Do ñó, nó cũng chứa tri thức tiềm ẩn mà thông qua các thủ tục suy diễn ta có thể
làm cho tri thức đó có ngữ nghĩa được rõ ràng. Các thủ tục suy diễn gắn liền với các
bài tốn sẽ được giới thiệu ngay sau đây.
Bài tốn suy diễn cơ bản trong hệ tri thức logic mơ tả là bài tốn kiểm tra quan hệ
bao hàm khái niệm (C ⊐ D) (subsumpion), xác ñịnh khái niệm C xem có phải là
một tập con của khái niệm D hay khơng? Nghĩa là D có bao hàm C hay khơng?
Một bài tốn suy diễn khác là bài tốn kiểm tra tính thỏa khái niệm (concept
satisfiability), xác định tính tất yếu của một biểu thức khái niệm xem có phải là tập
rỗng hay khơng?
Mặc dù ngữ nghĩa của các khái niệm là khá rõ ràng theo quan ñiểm logic, nhưng
việc thiết kế các thủ tục suy diễn trong hệ logic mô tả áp dụng cho cho mạng ngữ
nghĩa mất một thời gian khá dài. Trong các hệ thống mạng ngữ nghĩa đó, khái niệm
là các nút (node) và và trị là các liên kết (link).
Bài tốn bao hàm khái niệm được thừa nhận là bài tốn suy diễn quan trọng. Ý
tưởng cơ bản của thuật toán bao hàm này lúc ñầu là ánh xạ hai khái niệm đầu vào
vào trong các đồ thị có gắn nhãn và kiếm tra xem một khái niệm có được gắn vào
đồ thị khác hay khơng? Nếu có, thì đồ thị ñó tương ứng với khái niệm bao hàm (D)
[Lipkis, 1982]. Giải thuật này được gọi là thuật tốn so sánh cấu trúc (structural


9

comparison). Tuy nhiên, nhiều cuộc phân tích và đánh giá đã chỉ ra rằng, thuật tốn
này chỉ có tính đúng đắn (soundness) mà khơng đáp ứng được tính đầy đủ
(completeness).
ðể thuật tốn bao hàm có tính đầy đủ thì các hệ thống mơ tả tri thức khơng được
thất bại khi kiểm tra quan hệ bao hàm. ðiều này làm phát sinh ra các giải thuật mới

để tính tốn lại quan hệ bao hàm mà khơng cịn dựa vào mạng mơ tả nữa, và các
giải thuật này ñược chứng minh là có tính đầy đủ.
Khi đánh giá một thuật tốn thì thường người ta xét đến độ phức tạp tính tốn của
nó. Và ở đây chúng ta dùng độ phức tạp trong trường hợp xấu nhất (worst-casecomplexity) ñể ñánh giá mức ñộ ảnh hưởng của các thủ tục suy diễn trong logic mơ
tả (và trong đa số các ngơn ngữ hình thái biểu diễn tri thức).
ðể hiểu hơn về các thủ tục suy diễn, chúng ta sẽ mô tả thủ tục suy diễn đó gắn
liền với mộ hệ thống trí thức trong một ngơn ngữ cụ thể. ðó là suy diễn cho khái
niệm, cho TBox và cho ABox. Các suy diễn này sẽ được trình bày chi tiết trong
chương 2.
Thơng thường khi đề cập đến các thủ tục suy diễn thì người ta cũng sẽ quan tâm
đến các thuật tốn suy diễn để giải quyết các bài tốn liên quan đến nó. ðối với
ngơn ngữ logic mơ tả, thuật tốn được quan tâm nhất là thuật tốn tableau để giải
quyết bài tốn thỏa khái niệm cho ngơn ngữ ALC. Thuật tốn này sẽ được chúng ta
trình bày chi tiết trong chương 3.

1.4. Tổng kết chương.
Với mục đích giới thiệu để có cái nhìn tổng quan về logic mơ tả và các miền ứng
dụng của nó, chương một trình bày ngắn gọn lịch sử phát triển, mối quan hệ của
logic mô tả với các mạng ngữ nghĩa và các hệ thống khung trước khi trình bày đặc
điểm, các bước xây dựng một hệ thống logic mô tả, kiến trúc tổng quát của một hệ
mơ tả cùng cơ sở tri thức của nó (TBox, ABox) và cuối cùng là trình bày các thủ tục
suy diễn liên quan và các miền ứng dụng ñặc trưng của nó.


10

Chương 2
BIỂU DIỄN TRI THỨC BẰNG NGÔN NGỮ MÔ TẢ
2.1 Cú pháp và ngữ nghĩa của ngôn ngữ logic mô tả AL.
Các thành phần mô tả cơ bản của logic mô tả là các khái niệm nguyên tố (atomic

concepts) và các vai trò nguyên tố (atomic roles) [1]. Các khái niệm phức hợp và
các vai trị phức hợp được xây dựng từ các khái niệm và vai trò cơ sở này.
Chúng ta qui ước sử dụng các kí tự A, B để chỉ các khái niệm ngun tố (hay cịn
gọi là khái niệm cơ sở hoặc khái niệm nguyên thủy); R, S chỉ các vai trị ngun tố
(đó là các ñặc ñiểm hoặc các thuộc tính) và C, D ñể mơ tả các khái niệm; a, b hoặc i
để mơ tả các cá thể; m, n để mơ tả các giới hạn về số. Trong các ví dụ xuyên suốt
luận văn chúng ta qui ước kí hiệu như sau: Tên khái niệm được bắt đầu bằng kí tự
in hoa (ví dụ: Person, Female, Male…), tên vai trị bắt đầu bằng kí tự thường (ví dụ:
hasChild, marriedTo…), và tên cá thể ñược viết bằng chữ in hoa tất cả các kí tự (ví
dụ: MARRY, CHARLES, PETER…).
Bây giờ chúng ta cùng thảo luận về ngơn ngữ thuộc tính AL (attributive
language) [Schmidt-SchauB và Smolka, 1991] thơng qua cú pháp và nghữ nghĩa
của nó. ðây là một ngơn ngữ đơn giản và được quan tâm nhiều trong thực tế. Các
ngơn ngữ khác được mở rộng từ ngơn ngữ AL được gọi chung là họ ngôn ngữ AL và
các ngôn ngữ mô tả khác nhau ñược phân biệt với nhau bằng các bộ luật xây dựng
cú pháp mà chúng cung cấp.
Trong phần 2.1 này chúng ta cũng sẽ giới thiệu về ngôn ngữ mô tả hỗ trợ Web
ngữ nghĩa (semantic Web)[13], [14] là họ ngôn ngữ S, đây là ngơn ngữ ALC có bổ
sung thêm tiên đề quan hệ bắc cầu và được kí hiệu theo họ ngôn ngữ ALC là ALCR+.
2.1.1. Cú pháp.
- Các khái niệm được xây dựng từ các tốn tử: ⊓, ⊔, ¬ và các lượng từ: ∃, ∀ .
- Chỉ ñược phép dùng các vai trò nguyên tố.


11

Ví dụ mở đầu.
Person ⊓ ∀hasChild.(Doctor ⊔ ∃hasChild.Doctor) mơ tả khái niệm về một người
mà tất cả các con của người đó là bác sỹ, hoặc có một người con là bác sỹ.
- Mô tả khái niệm trong ngôn ngữ AL có cú pháp như sau ([1] trang 47):

C, D → A

Khái niệm ngun tố
Khái niệm đỉnh



¬A

Khái niệm đáy
Phủ định khái niệm

C⊓D

Giao khái niệm

∀R.C

Lượng từ với mọi

∃R.

Lượng từ tồn tại

Bảng 2.1 Cú pháp mơ tả của ngơn ngữ thuộc tính AL
Cần lưu ý là phép phủ định trong ngơn ngữ AL chỉ ñược áp dụng ñối với các khái
niệm nguyên tố.
Ví dụ 2.1.
Person; Female là các khái niệm nguyên tố. Sử dụng cú pháp trên ta viết:
Penson ⊓ Female ; Penson ⊓ ¬Female để mơ tả các khái niệm mang tính trực

quan chỉ những người này thuộc phái nữ và những người kia khơng thuộc phái nữ
Ví dụ 2.2.
hasChild là một vai trị ngun tố. Từ đó ta có: Peson ⊓∃ hasChild.

và Peson

⊓∀ hasChild.Female ñể biểu thị những người này có con, và tất cả các con của
những người kia có giới tính là nữ.
Ví dụ 2.3.
Dùng luật cú pháp khái niệm ñáy, ta viết: Person ⊓∀ hasChild. ⊥ ñể biểu thị
những người khơng có con.


12

Trong các ngơn ngữ mới được mở rộng từ ngơn ngữ AL (thường được gọi là họ
ngơn ngữ AL), người tà bổ sung thêm các luật cú pháp sau ñây ñể tăng khả năng mô
tả các khái niệm phức hợp.
Tên

Cách viết

Kí hiệu

Hợp khái niệm

C⊔D

U


Lượng từ tồn tại đầy đủ

∃ R.C

ε

≥ n R hoặc ≤ n R

N

¬C

C

Giới hạn số lượng
Phủ định khái niệm bất kỳ

Bảng 2.2. Các cú pháp bổ xung.
Ví dụ 2.4.
Với các cú pháp mới bổ sung, ta viết:
Person ⊓ (≤ 1 hasChild ⊔ (≥ 3 hasChild ⊓ ∃ hasChild.Female)) để mơ tả một khái
niệm chỉ những người có khơng q một con hoặc có ít nhất 3 người con trong đó
có một con có giới tính nữ.
Việc mở rộng ngơn ngữ thuộc tính AL để tạo thành một ngơn ngữ mới cho phép
chúng ta đặt tên của nó dưới dạng một chuỗi như sau: AL[U][ε][N[C]. Trong

đó,

mỗi chữ cái nằm trong ngoặc vuông sẽ xuất hiện nếu cú pháp của nó được dùng
trong ngơn ngữ mơ tả đó.

Ví dụ 2.5.
Ngơn ngữ ALεN là một ngơn ngữ mới được mở rộng từ ngơn ngữ AL có sử dụng
lượng từ tồn tại ñầy ñủ (ε) và giới hạn số lượng (N).
2.1.2. Ngữ nghĩa.
ðể hiểu ñược ngữ nghĩa của các khái niệm trong logic mơ tả của ngơn ngữ thuộc
tính AL ta cần “phiên dịch” các khái niệm đó thơng qua một phép biến đối gọi là
phép thơng dịch I [1], [4].


13

Phép thông dịch I = (∆I, .I) bao gồm một miền khác rỗng ∆I, và hàm dịch .I.
Hàm dịch .I biến mỗi khái niệm nguyên tố C thành một tập con của miền (CI ⊆ ∆I),
biến mỗi quan hệ nguyên tố hai ngôi R thành một quan hệ hai ngôi trên miền (RI ⊆

∆I × ∆I) và biến mỗi cá thể i thành một phần tử thuộc miền (iI ∈ ∆I). Tập CI (hoặc
RI) ñược gọi là mở rộng của C (hoặc R) đối với I.
Ta có thể mơ tả trực quan ngữ nghĩa của ngơn ngữ ALC bằng hình 2.1 minh họa
dưới đây. Trong đó ∆I là miền thơng dịch được biểu thị bằng một hình trịn liền nét
bên ngồi. Qua hàm dịch I, các cá thể i (ví dụ: JOHN, MARRY) là các điểm bên
trong hình trịn này, các khái niệm CI (bao gồm một tập các cá thể) được biểu thị
bằng hình elip đứt nét và một quan hệ hai ngơi trên miền được mơ tả bằng một mũi
tên.
Hàm dịch I

Miền thông dịch ∆I

Cá thể iI ∈ ∆I
JOHN
MARRY


Khái niệm CI ⊆ ∆I
Doctor

Vai trị RI ⊆ ∆I × ∆I
hasChild

Hình 2.1. Minh họa ngữ nghĩa ALC
Hàm thơng dịch được mở rộng để mơ tả các khái niệm phức hợp trong họ ngơn
ngữ AL bằng các định nghĩa đệ qui như sau:


×