Tải bản đầy đủ (.pdf) (83 trang)

Logic mô tả ứng dụng trong web ngữ nghĩa

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.77 MB, 83 trang )

LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
1
1
LỜI CAM ĐOAN

Tôi xin cam đoan bản luận văn này là kết quả nghiên cứu của bản thân
tôi dưới sự hướng dẫn của Ts.Trần Đình Khang. Nếu có gì sai phạm tôi xin
hoàn toàn chịu trách nhiệm.

Người làm cam đoan



Vũ Minh Yến
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
2
2
MỤC LỤC
Trang
DANH SÁCH BẢNG 5
DANH SÁCH HÌNH VẼ 6
LỜI NÓI ĐẦU 7
LỜI CẢM ƠN 9
Chương 1. TỔNG QUAN VỀ LOGIC MÔ TẢ
1.1. Giới thiệu 10
1.2. Cú pháp logic mô tả 11
1.3. Ngữ nghĩa 15
1.4. Cơ sở tri thức và chuẩn hoá 16
1.4.1. Bộ thuật ngữ (TBox) 17


1.4.2. Bộ quan hệ (RBox) 20
1.4.3. Bộ khẳng định (ABox) 22
1.4.4. Cơ sở tri thức 22
1.5. Kiến trúc hệ logic mô tả 23
1.6. Các thủ tục quyết định trong logic mô tả 24
1.7. Giải thuật tableaux 27
1.8. Tổng kết chương 31
Chương 2. LOGIC MÔ TẢ ỨNG DỤNG TRONG WEB NGỮ NGHĨA
2.1. Tổng quan về web ngữ nghĩa 33
2.1.1. Nguồn gốc và mục tiêu của web ngữ nghĩa 33
2.1.2. Web ngữ nghĩa là gì? 35
2.1.3. Kiến trúc của web ngữ nghĩa 39
2.2. Nội dung xây dựng web ngữ nghĩa 44
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
3
3
2.2.1. Chuẩn hoá các ngôn ngữ biểu diễn dữ liệu (XML) và
các siêu dữ liệu (RDF) trên Web 44
2.2.2. Chuẩn hoá các ngôn ngữ biểu diễn Ontology cho Web
ngữ nghĩa 45
2.2.3. Phát triển nâng cao Web ngữ nghĩa 45
2.3. Logic mô tả là cơ sở logic của web ngữ nghĩa 46
2.3.1. Tại sao lại là Logic mô tả? 48
2.3.2. Logic mô tả là cơ sở của ngôn ngữ Ontology 52
2.4. Tổng kết chương 55
Chương 3. NGÔN NGỮ OWL DL
3.1. Khái niệm về ontology 56
3.2. Ngôn ngữ SHOIN(D) 60
3.2.1. Miền cụ thể 60

3.2.2. Cú pháp 61
3.2.3. Ngữ nghĩa 64
3.3. Ngôn ngữ OWL DL 66
3.3.1. Cú pháp 67
3.3.2. Ngữ nghĩa 70
3.4. Tổng kết chương 70
Chương 4. VÍ DỤ MINH HOẠ
4.1. Giới thiệu về công cụ PROTÉGÉ và bộ lập luận RACER 71
4.1.1. Công cụ PROTÉGÉ 71
4.1.2. Bộ lập luận RACER 72
4.2. Sử dụng công cụ Protégé và bộ lập luận RACER để hỗ trợ
phát triển Web ngữ nghĩa trên cơ sở logic mô tả 73
4.2.1. Hỗ trợ xây dựng Ontology 73
4.2.2. Truy vấn Ontology và ứng dụng trong Web ngữ nghĩa 77
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
4
4
4.3. Tổng kết chương 79
KẾT LUẬN 80
DANH SÁCH THUẬT NGỮ 81
TÀI LIỆU THAM KHẢO 83
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
5
5
DANH SÁCH BẢNG
Tên bảng
Trang
1.1. Cú pháp ngôn ngữ thuộc tính AL

12
1.2. Một số luật bổ sung
13
1.3. Các khái niệm trong gia đình
13
1.4. Cú pháp ngôn ngữ S
14
1.5. Ngữ nghĩa của các khái niệm ngôn ngữ S
15
1.6. Mở rộng các khái niệm trong gia đình
19
1.7. Luật chuyển về dạng chuẩn phủ định
27
1.8. Các luật lan truyền của ALC
28
1.9. Các luật lan truyền của ngôn ngữ S
30
3.1. Cú pháp ngôn ngữ SHOIN(D)
63
3.2. Cơ sở tri thức của SHOIN(D)
64
3.3. Ngữ nghĩa của các khái niệm SHOIN(D)
65
3.4. Các mô tả thuộc tính đối tượng OWL DL
67
3.5. Các mô tả thuộc tính lớp OWL DL
68
3.6. Các tiên đề và các sự kiện của OWL DL
69
3.7. Một Ontology ví dụ trong cú pháp trừu tượng của OWL DL

69
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
6
6
DANH SÁCH HÌNH VẼ
Hình vẽ
Trang
1.1. Kiến trúc hệ logic mô tả
23
2.1. Một đề xuất nguồn gốc Web với CERN
36
2.2. Sơ đồ phát triển tính thông minh của dữ liệu
37
2.3. Kiến trúc của Web ngữ nghĩa
39
2.4. Bộ ba RDF
41
2.5. Đồ thị RDF gồm hai mệnh đề
42
4.1. Các khái niệm của Ontology Dongvat
73
4.2. Sự phân cấp các khái niệm
74
4.3. Các thuộc tính của Ontology Dongvat
74
4.4. Các cá thể của Ontology Dongvat
74
4.5. Kiểm tra tính thoả của Ontology Dongvat
75

4.6. Thứ bậc các khái niệm trước và sau khi phân lớp
76
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
7
7
LỜI NÓI ĐẦU
Trong thời gian gần đây, logic mô tả được nhắc đến như một loại hình
biểu diễn tri thức hiệu quả. Logic mô tả cung cấp khả năng biểu diễn tri thức
thông qua các khái niệm, các quan hệ và các luật cú pháp tương ứng với khả
năng của từng ngôn ngữ. Logic mô tả ngày càng được phát triển và ứng dụng
rộng rãi trong các hệ thống ứng dụng thông minh. Một trong số những hướng
nghiên cứu chính được quan tâm dựa trên ý tưởng biểu diễn tri thức theo lĩnh
vực và phải được đặc trưng hóa thành các lớp đối tượng và mối quan hệ giữa
chúng, các lớp được sử dụng để mô tả lĩnh vực quan tâm được tổ chức theo
cấu trúc phân cấp. Bên cạnh khả năng hỗ trợ biểu diễn thông tin một cách
hiệu quả, logic mô tả còn cho phép thực hiện các dịch vụ suy diễn với độ
phức tạp tính toán phù hợp.
Cùng với các ứng dụng trong nhiều lĩnh vực như: mô hình hoá, xử lý
ngôn ngữ tự nhiên, công nghệ phần mền, y học, logic mô tả đang rất được
các nhà nghiên cứu quan tâm ứng dụng trong quá trình phát triển Web ngữ
nghĩa. Web ngữ nghĩa là một hệ thống Web mới đang được xây dựng với ý
tưởng quản lý hiệu quả nguồn tài nguyên khổng lồ của World Wide Web
hiện tại và trong tương lai, cho phép máy có thể hiểu được các tài nguyên và
có thể xử lý một cách tự động. Logic mô tả hỗ trợ thiết kế, tích hợp và triển
khai Ontology, mà Ontology có thể hiểu là một bộ từ vựng để biểu diễn ngữ
nghĩa tài liệu Web. Ontology có vai trò then chốt để máy có thể hiểu được tài
nguyên trên Web. Logic mô tả đóng vai trò là nền tảng logic để xây dựng các
ngôn ngữ biểu diễn Ontology và khả năng lập luận mạnh của nó đảm bảo chất
lượng của các Ontology ứng dụng trong Web ngữ nghĩa. Hiện nay đã có một

số hệ thống thử nghiệm nhằm biểu diễn ngữ nghĩa tài nguyên Web trên cơ sở
logic mô tả như: RACER, FACT, PROPÉTÉ,
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
8
8
Trong luận văn này, em đã tìm hiểu về logic mô tả và khả năng ứng
dụng của nó trong Web ngữ nghĩa theo bố cục như sau:
Chương 1. Tổng quan về logic mô tả. Chương này em trình bày về các
nội dung cơ bản liên quan đến logic mô tả như: cú pháp, ngữ nghĩa của các
ngôn ngữ logic mô tả cơ sở như AL, ALC, S; kiến trúc một hệ logic mô tả;
các bài toán quyết định trong logic mô tả và các thuật toán tableaux cho bài
toán thoả của ngôn ngữ ALC và ngôn ngữ S.
Chương 2. Logic mô tả ứng dụng trong Web ngữ nghĩa. Chương này
trình bày tổng quan về Web ngữ nghĩa như: nguồn gốc, vai trò, mục tiêu của
Web ngữ nghĩa; bản chất của Web ngữ nghĩa là gì; các nội dung xây dựng
Web ngữ nghĩa. Tiếp theo, là trình bày về vai trò của logic mô tả trong quá
trình xây dựng Web ngữ nghĩa.
Chương 3. Ngôn ngữ OWL. Chương này giới thiệu một ngôn ngữ biểu
diễn Ontology trên Web ngữ nghĩa (OWL DL), ngôn ngữ này sử dụng nền
tảng cơ sở là logic mô tả SHOIN(D).
Chương 4. Ví dụ minh hoạ. Chương này em đưa ra một ví dụ về hỗ trợ
của logic mô tả trong việc xây dựng, phát triển Ontology, và ứng dụng trong
Web ngữ nghĩa trên công cụ Protégé có kết hợp với bộ lập luận RACER.
Do thời gian tìm hiều và nghiên cứu về logic mô tả và về Web ngữ
nghĩa còn hạn chế nên trong luận văn còn có những thiếu sót. Em rất mong
được sự đánh giá và góp ý bổ sung của các thầy giáo, cô giáo và các bạn để
luận văn được hoàn thiện hơn.
Hà nội, ngày tháng 11 năm 2005
HỌC VIÊN THỰC HIỆN




Vũ Minh Yến
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
9
9


LỜI CẢM ƠN
Em xin chân thành gửi lời cảm ơn đến các thày cô giáo khoa Công
nghệ thông tin trường Đại học Bách khoa Hà Nội đã giảng dạy, giúp đỡ em
trong suốt quá trình học tập tại trường.
Em xin gửi lời cảm ơn sâu sắc tới thầy giáo, Ts. Trần Đình Khang,
người đã trực tiếp hướng dẫn, chỉ bảo, giúp đỡ em hoàn thành luận văn này.
Em xin chân thành cảm ơn!



LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
10
10
Chương 1
TỔNG QUAN VỀ LOGIC MÔ TẢ
1.1. Giới thiệu
Logic mô tả đầu tiên được phát triển nhằm cung cấp ý nghĩa cho các
mạng ngữ nghĩa, đã đưa ra các biểu diễn được cấu trúc và các biểu diễn này
có thể được kết hợp với các công cụ lập luận cho hiệu quả cao.

Trước đây, "logic mô tả" được đề cập đến dưới các tên khác như "ngôn
ngữ biểu diễn tri thức thuật ngữ" hay "ngôn ngữ khái niệm". Tương ứng với
từng tên là những sự quan tâm khác nhau. Với "ngôn ngữ biểu diễn tri thức
thuật ngữ", người ta muốn nói đến ngôn ngữ dùng để biểu diễn các tri thức
thông qua việc xây dựng các thuật ngữ trong miền ứng dụng. Hay với "ngôn
ngữ khái niệm", người ta lại nói tới ngôn ngữ để hình thành khái niệm. Hiện
nay, khi những chú ý được chuyển vào các tính chất nằm trong các hệ logic
thì cái tên logic mô tả đã trở nên quen thuộc.
Logic mô tả được ứng dụng đặc biệt hiệu quả trong các hệ thống thông
minh, và gần đây với ý tưởng xây dựng hệ thống web thế hệ mới: web ngữ
nghĩa, với mục đích tăng khả năng liên kết giữa các trang web và khả năng
hiểu nội dung các tài liệu web của máy tính, logic mô tả đóng vai trò là nền
tảng logic để bổ sung ngữ nghĩa và đã thu hút được sự quan tâm của rất nhiều
nhà nghiên cứu trong lĩnh vực này.
Logic mô tả cung cấp khả năng biểu diễn tri thức và suy diễn để rút ra
được các tri thức đúng đắn trong miền ứng dụng. Việc biểu diễn tri thức được
xây dựng từ các khái niệm, các quan hệ nguyên thuỷ và các luật xây dựng
khái niệm. Các luật này được gọi là ngôn ngữ xây dựng khái niệm. Bên cạnh
các khái niệm và các quan hệ còn có các khẳng định, thể hiện mối quan hệ
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
11
11
giữa các khái niệm, các quan hệ với các cá thể hay giữa các cá thể với nhau.
Logic mô tả còn cung cấp khả năng lập luận và suy diễn các tri thức được
biểu diễn ở trên. Khả năng biểu diễn tri thức tỉ lệ thuận với độ phức tạp tính
toán của các dịch vụ suy diễn của hệ logic mô tả tương ứng. Để xây dựng một
hệ thống logic mô tả người ta đã tổng kết lại ba bước quan trọng sau:
- Xác định các khái niệm từ các khái niệm nguyên thuỷ, các quan hệ
nguyên thuỷ và các cá thể ban đầu.

- Sử dụng một ngôn ngữ xây dựng khái niệm để hình thành những khái
niệm phức tạp.
- Sử dụng các thủ tục suy luận để rút ra những tri thức đúng đắn về các
khái niệm và các cá thể nếu có thể. Chủ yếu là quan hệ bao hàm giữa hai khái
niệm hoặc quan hệ giữa các cá thể và khái niệm hay giữa một cặp cá thể và
một quan hệ.
Tóm lại, logic mô tả là họ của các hệ hình thức biểu diễn tri thức cơ sở
logic, được thiết kế để biểu diễn và lập luận tri thức của một miền ứng dụng
bằng phương pháp có cấu trúc. Chúng dựa trên một họ ngôn ngữ chung được
gọi là ngôn ngữ mô tả, cung cấp một tập các toán tử để xây dựng các khái
niệm (tương ứng là các lớp) và các mô tả quan hệ (hay thuộc tính). Các mô tả
đó có thể được sử dụng trong các tiên đề và các khẳng định của cơ sở tri thức
logic mô tả và có thể được lập luận về cơ sở tri thức logic mô tả bằng các hệ
thống logic mô tả.
1.2. Cú pháp logic mô tả
Cơ sở của logic mô tả là các mô tả khái niệm và mô tả quan hệ, thường
gọi tắt là khái niệm và quan hệ. Một cách trực quan, một khái niệm biểu diễn
một lớp các đối tượng có chung một số đặc trưng, một quan hệ biểu diễn một
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
12
12
quan hệ hai ngôi giữa các đối tượng hoặc giữa các đối tượng với các giá trị dữ
liệu. Ví dụ: ConNguoi là một khái niệm, Cocon là một quan hệ.
Một ngôn ngữ mô tả bao gồm: các khái niệm (kí hiệu: C), các quan hệ
(kí hiệu:R) và các cá thể (kí hiệu: I), cùng với một tập các toán tử (các luật cú
pháp) để xây dựng các mô tả khái niệm và quan hệ còn gọi là các khái niệm,
các quan hệ phức. Như vậy, ta có thể xây dựng các khái niệm phức, các quan
hệ phức từ các khái niệm, các quan hệ cơ sở ban đầu, các khái niệm và các
quan hệ cơ sở này được gọi là các khái niệm nguyên thuỷ và các quan hệ

nguyên thuỷ. Các khái niệm và các quan hệ phức có thể được đặt tên là một
xâu vắn tắt để tiện sử dụng.
Các ngôn ngữ mô tả phân biệt với nhau bằng các luật cú pháp mà
chúng cung cấp. Ngôn ngữ mô tả đầu tiên được gọi là ngôn ngữ thuộc tính
AL, là ngôn ngữ mô tả có các luật cú pháp đơn giản nhất.
Ngôn ngữ thuộc tính AL
Họ ngôn ngữ mô tả ban đầu xuất phát từ ngôn ngữ mô tả đơn giản nhất
là ngôn ngữ thuộc tính AL. Các luật cú pháp của ngôn ngữ AL bao gồm:
C, D  A
Khái niệm nguyên thuỷ
Т
Khái niệm đỉnh



Khái niệm đáy

A
Phủ định khái niệm
C⊓D
Giao khái niệm

R.C
Lượng từ với mọi

R.Т
Lượng từ tồn tại
Bảng 1.1. Cú pháp ngôn ngữ thuộc tính AL
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005

13
13
Để tăng khả năng xây dựng các khái niệm phức tạp, người ta mở rộng
ngôn ngữ AL bằng cách bổ sung thêm các luật cú pháp, và mỗi luật cú pháp
mới được kí hiệu là một chữ cái được viết sau AL, khi đó ngôn ngữ mô tả mở
rộng có dạng: AL[U][

][N[C].
Tên
Dạng viết
Kí hiệu
Hợp khái niệm
C⊔D
U
Lượng từ tồn tại đầy đủ

R.C


Giới hạn số

nR hoặc

nR
N
Phủ định bất kỳ

C
C
Bảng 1.2. Một số luật bổ sung

Ví dụ 1.1. Mô tả lại cách sử dụng các luật cú pháp trên để xây dựng các
khái niệm phức hợp, đó là các khái niệm trong gia đình. Trong đó, có sử dụng
hai khái niệm nguyên thuỷ là con người "ConNguoi", giống cái "GiongCai"
và sử dụng một quan hệ nguyên thuỷ là có con "cocon".







Bảng 1.3. Các khái niệm trong gia đình
Nu  ConNguoi ⊓ GiongCai
Nam  ConNguoi ⊓ Nu
Me  Nu ⊓ cocon.ConNguoi
Cha  Nam ⊓ cocon.ConNguoi
ChaMe  Cha ⊔ Me
Ba  Me ⊓ cocon.ChaMe
Ong  Cha ⊓ cocon.ChaMe



LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
14
14
Ngôn ngữ S
Trong các ngôn ngữ logic mô tả gần đây, người ta coi ngôn ngữ S
thường được sử dụng như là ngôn ngữ tối thiểu, nó tương đương với ngôn
ngữ ALC

R+
theo quy ước ở trên. Có nghĩa là ngôn ngữ S có các luật cú pháp
của ALC và có bổ sung thêm các tiên đề quan hệ bắc cầu.
Cú pháp của ngôn ngữ S như sau:
C, D  A
Khái niệm nguyên thuỷ
Т
Khái niệm đỉnh



Khái niệm đáy

C (C)
Phủ định bất kỳ
C⊓D
Giao khái niệm
C⊔D (U)
Hợp khái niệm

R.C
Lượng từ với mọi

R.C (

)
Lượng từ tồn tại đầy đủ
Bảng 1.4. Cú pháp ngôn ngữ S
Các khái niệm trong Bảng 1.3 cũng thuộc ngôn ngữ S.
Ngôn ngữ S cho phép xây dựng các khái niệm từ các quan hệ nguyên

thuỷ và các khái niệm nguyên thuỷ nhưng không cung cấp các toán tử để xây
dựng những quan hệ phức hợp của S. Các ngôn ngữ được mở rộng từ ngôn
ngữ S bằng cách bổ sung thêm các luật cú pháp để tăng khả năng biểu diễn
của ngôn ngữ mô tả, và các ngôn ngữ đó được gọi là họ ngôn ngữ S. Họ ngôn
ngữ S bao gồm: SH, mở rộng với các tiên đề bao hàm quan hệ; SHI, mở rộng
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
15
15
từ SH và bổ sung thêm các quan hệ đảo; SHf: mở rộng từ SH với các tiên đề
quan hệ hàm (f); SHIO, mở rộng từ SH với các nominal (O) và các quan hệ
đảo (I); SHOIN, mở rộng từ SHIO với các lượng tử số (N),
1.3. Ngữ nghĩa
Bên cạnh việc định nghĩa ra các khái niệm, ta cũng cần phải có một
cách hiểu "có ngữ nghĩa" về từng khái niệm được tạo ra. Ngữ nghĩa của khái
niệm trong logic mô tả có được nhờ vào các phép thông dịch.
Định nghĩa 1.1. Mỗi phép thông dịch, kí hiệu là I, là một cặp (

I
, .
I
). Trong
đó,

I
là một tập khác rỗng, còn .
I
là một hàm dịch. Hàm dịch .
I
biến mỗi

khái niệm A thành một tập A
I


I
, biến mỗi quan hệ hai ngôi R thành một
quan hệ R
I


I




I
, biến một cá thể i thành i
I
là một phần tử thuộc

I
.
Đối với các khái niệm phức tạp trong ngôn ngữ S, hàm dịch được định
nghĩa như sau:
Cú pháp
Ngữ nghĩa
Т

I






A
A
I


I


C (C)

I
\ C
I
C⊓D
C
I


D
I
C⊔D (U)
C
I


D

I


R.C
{x
I
|

y.<x,y>  R
I
 yC
I
}

R.C (

)
{x
I
|

y.<x,y>  R
I

yC
I
}
Bảng 1.5. Ngữ nghĩa của các khái niệm ngôn ngữ S
Bảng 1.5 chỉ ra cách hàm dịch được mở rộng để đưa lại ngữ nghĩa cho
các khái niệm ngôn ngữ S.

LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
16
16
Ví dụ 1.2: Diễn dịch một khái niệm ngôn ngữ S.
Cho khái niệm nguyên thuỷ: Thucvat (thực vật) và các quan hệ nguyên
thuỷ: an (ăn), motphancua(một phần của), thuộc ngôn ngữ S. Từ Bảng 1.4 ta


an. ( Thucvat ⊔

motphancua.Thucvat) là một khái niệm của S.
Cho I(

I
, .
I
) là mô hình của:

an. (Thucvat ⊔

motphancua. Thucvat)
với

I
={Ganesh, Balavan, co, qua} và hàm dịch .
I
được định nghĩa bởi:
Thucvat
I

={co1}
an
I
={<Ganesh, co1>, <Bokhara, qua1>}
motphancua
I
= 
Chúng ta sẽ tìm ngữ nghĩa cho khái niệm


an. (Thucvat ⊔

motphancua. Thucvat)
Áp dụng Bảng 1.5 ta có:
(

motphancua. Thucvat)
I
= 
(Thucvat ⊔

motphancua.Thucvat)
I
= Thucvat
I

(

motphancua.Thucvat)
I

= {co1}

an.(Thucvat ⊔

motphancua.Thucvat)
I
={ Ganesh, Balavan, co1, qua1}
Lưu ý rằng Blavan, co, qua không quan hệ với bất kỳ cái gì thông qua
quan hệ an, theo định nghĩa của lượng tử với mọi đầy đủ (bảng 1.4) tất cả
chúng là các cá thể thuộc khái niệm

an. (Thucvat ⊔

motphancua. Thucvat).
1.4. Cơ sở tri thức và chuẩn hoá
Đặc trưng của một cơ sở tri thức gồm hai thành phần là: tri thức nội
hàm ( bộ thuật ngữ và bộ quan hệ - TBox và RBox) và tri thức mở rộng (bộ
khẳng định - ABox). Tri thức nội hàm là tri thức tổng quát về các khái niệm,
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
17
17
các quan hệ, các luật cú pháp để xây dựng các khái niệm và quan hệ phức của
miền ứng dụng. Còn tri thức mở rộng là tri thức về các tình huống cụ thể.
1.4.1. Bộ thuật ngữ (TBox)
Một cách trực quan, một TBox là một tập các mệnh đề biểu diễn mối
quan hệ của các khái niệm với nhau. Ví dụ:
(ConNguoi

GiongCai




cocon.ConNguoi )

Chame
Một TBox được định nghĩa một cách hình thức như sau:
Định nghĩa 1.2. Cho L là một hệ logic mô tả, C, D là các khái niệm của L,
một TBox (T) là một tập hữu hạn, có thể rỗng của các mệnh đề có dạng C


D, được gọi là các bao hàm khái niệm.Và C

D được gọi là tương đương khái
niệm, là sự ước lược của C

D và D

C. Các mệnh đề trong T được gọi là
các tiên đề thuật ngữ.
Một tương đương khái niệm nếu vế trái là một tên khái niệm mới, chỉ
xuất hiện không quá một lần bên vế trái (được gọi là ký hiệu tên) trong các
tiên đề của TBox và vế phải là một biểu thức các khái niệm (ký hiệu gốc) thì
được gọi là một định nghĩa khái niệm.
Về mặt ngữ nghĩa: Một diễn dịch I được gọi là thoả bao hàm khái
niệm C ⊐ D hay I là mô hình của C ⊐ D (kí hiệu là I |= C ⊐ D) nếu C
I


D

I

và I thoả một tương đương khái niệm CD nếu C
I
=D
I
. Một diễn dịch I thoả
một TBox T (kí hiệu: I |= T) nếu nó thoả mãn tất cả các tiên đề thuật ngữ
trong T, I là mô hình của TBox.
Thuật ngữ trong TBox có thể chứa chu trình. Một chu trình thuật ngữ
trong một TBox là một bao hàm khái niệm đệ quy, ví dụ:
Connguoi ⊐

Cochame.Connguoi hay một hoặc nhiều bao hàm khái niệm
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
18
18
đệ quy như: {Connguoi



Cochame.Me, Me



Cocon.Connguoi}. Tuy
nhiên, nếu ta có hai khái niệm A,B

C và {A


B, B

A} thì đây không phải là
chu trình thuật ngữ mà tương đương với một tương đương khái niệm A

B.
Lập luận của một cơ sở tri thức với sự có mặt của TBox sẽ phức tạp
hơn nhiều khi không có mặt của TBox, đặc biệt là TBox có chứa chu trình.
Xét TBox không chứa chu trình, để lập luận được dễ dàng hơn, người
ta thực hiện chuẩn hoá TBox.
Chuẩn hoá TBox
Một TBox được chuẩn hoá khi tất cả các tiên đề trong TBox đều ở dạng
định nghĩa khái niệm. Như vậy, để TBox được chuẩn hoá, ta thay các bao
hàm khái niệm bằng các định nghĩa khái niệm. Cụ thể, nếu có bao hàm khái
niệm C

D ta sẽ thay bằng một định nghĩa khái niệm C

C

D với
C
là một
khái niệm nguyên thuỷ mới được thêm vào.
Ví dụ 1.3:
Giả sử ta có một bao hàm khái niệm: Nu

Connguoi, ta thay bằng
một định nghĩa khái niệm: Nu=

Nu

Connguoi , trong đó khái niệm
Nu

một khái niệm nguyên thuỷ mới được thêm vào, đặc trưng cho những tính
chất để có thể phân biệt một người phụ nữ (ứng với khái niệm Nu) trong các
đối tượng là con người (tương ứng với khái niệm Connguoi), do đó khái niệm
Nu
có thể đặt lại là Giongcai, khi đó ta có: Nu=Giongcai

Connguoi, và
khái niệm Giongcai là khái niệm nguyên thuỷ mới được thêm vào.
Đối với một TBox không chứa chu trình, quá trình chuẩn hoá sẽ dừng
sau một số hữu hạn bước và quá trình này cũng được gọi là quá trình mở rộng
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
19
19
bộ thuật ngữ. Việc mở rộng bộ thuật ngữ là đúng đắn nếu bộ thuật ngữ sau
tương đương với bộ thuật ngữ ban đầu và thoả mãn các mệnh đề sau:
Mệnh đề 1.1
Gọi T là một bộ thuật ngữ không chứa chu trình và T' là bộ thuật ngữ
mở rộng của nó, khi đó:
- T và T' có cùng các ký hiệu tên và các ký hiệu gốc.
- T và T' tương đương nhau.
Ví dụ 1.4: Mở rộng bộ thuật ngữ trong Bảng 1.3.












Bảng 1.5. Mở rộng các khái niệm trong gia đình

Bảng 1.6. Mở rộng các khái niệm trong gia đình
Nu  ConNguoi ⊓ GiongCai
Nam  ConNguoi ⊓ (ConNguoi ⊓ GiongCai)
Me  (ConNguoi ⊓ GiongCai) ⊓ cocon.ConNguoi
Cha  ConNguoi ⊓ (ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi
ChaMe  (ConNguoi ⊓ (ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi) ⊔ ((ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi)
Ba  (ConNguoi ⊓ GiongCai) ⊓ cocon.ConNguoi ⊓
cocon. ((ConNguoi ⊓ (ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi) ⊔ ((ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi))
Ong  ConNguoi ⊓ (ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi ⊓ cocon. ((ConNguoi ⊓
(ConNguoi ⊓ GiongCai) ⊓ cocon.ConNguoi) ⊔
((ConNguoi ⊓ GiongCai) ⊓ cocon.ConNguoi))




LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
20
20
Cơ sở lý thuyết để đảm bảo sự đúng đắn về ngữ nghĩa cho quá trình
chuẩn hoá được thể hiện trong mệnh đề sau
Mệnh đề 1.2. Gọi T là một bộ thuật ngữ không có chu trình và
T
là bộ thuật
ngữ chuẩn hoá của nó, khi đó:
- Mọi mô hình của
T
cũng là mô hình của T
- Với mỗi mô hình I của T có một mô hình
I
của
T
mà có cùng miền
với I và chấp nhận I về các khái niệm và các luật trong T.
1.4.2. Bộ quan hệ (RBox)
Một cách trực quan, một bộ quan hệ (RBox) là một tập các mệnh đề về
các đặc trưng của các quan hệ. Một RBox có thể bao gồm các mệnh đề xác
nhận rằng một quan hệ là hàm, hoặc bắc cầu hay trong một mối quan hệ bao
hàm. Ví dụ: một người thì có nhiều nhất một người cha, ta có thể nói quan hệ
Cocha là một quan hệ hàm; giả sử ta có: "x có tổ tiên là y, y có tổ tiên là z, do
đó x có tổ tiên là z", khi đó ta nói quan hệ cototien là quan hệ bắc cầu; tương
tự ta có một tiên đề quan hệ bao hàm như: coCha

cototien.
Một bộ quan hệ được định nghĩa một cách hình thức như sau:

Định nghĩa 1.3. Cho L là một logic mô tả, N, S

R là các quan hệ nguyên
thuỷ, R1, R2 là các quan hệ của L, một RBox (R) là một tập hữu hạn có thể
rỗng các mệnh đề có dạng:
- Func(N) hoặc N

F, trong đó F

R là một tập các quan hệ hàm,
hoặc
- Trans(S) hoặc S

R
+

, trong đó R
+

R là một tập các quan hệ bắc
cầu, hoặc
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
21
21
- R1

R2, được gọi là một bao hàm quan hệ; R1

R2 được gọi là

tương đương quan hệ, là một sự rút gọn của R1

R2 và R2

R1.
Các mệnh đề trong RBox được gọi là các tiên đề quan hệ. Các loại tiên
đề quan hệ xuất hiện trong RBox phụ thuộc vào khả năng biểu diễn của L.
Về mặt ngữ nghĩa
Một diễn dịch I thoả một tiên đề quan hệ hàm N

F (được kí hiệu là:
I |= N

F) nếu với tất cả x

I
, #{y

I
| <x, y>

RN
I
}

1 (#, kí hiệu cho số
phần tử, lực lượng).
Một diễn dịch I thoả một tiên đề quan hệ bắc cầu S

R

+
(được kí hiệu
là: I |= S

R
+
), nếu tất cả x, y, z



I
, {<x, y>, <y, z>}

S
I


<x, z>

S
I
.
Một diễn dịch I thoả một bao hàm quan hệ R1

R2 (kí hiệu là:
I |= R1

R2) nếu R1
I


R2
I
và thoả một tương đương quan hệ R1

R2 (kí
hiệu: I |= R1

R2) nếu R1
I
= R2
I
.
Một diễn dịch I thoả một RBox R (kí hiệu: I |= R) nếu nó thỏa tất cả các
tiên đề quan hệ trong R, khi đó I được gọi là mô hình của RBox R.
Rất nhiều ngôn ngữ logic mô tả (như ALC, ) không cung cấp bất kỳ
một tiên đề quan hệ nào. Do vậy, RBox không được coi là một thành phần
trong cơ sở tri thức. Tuy nhiên, đối với họ ngôn ngữ S, RBox là một thành
phần rất quan trọng trong cơ sở tri thức, vì chính nó cung cấp các tiên đề quan
hệ bắc cầu. Trong một số hệ logic mô tả người ta có thể gộp luôn hai khái
niệm TBox và RBox ở trên thành một TBox mới. Như vậy, cơ sở tri thức chỉ
gồm có TBox (bao gồm cả RBox) và ABox.
Cũng giống như các luật cú pháp, mỗi loại tiên đề quan hệ sẽ được đặc
trưng bởi một kí tự đặc biệt, như: f - các tiên đề quan hệ hàm,
R+
- các tiên đề
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
22
22
bắc cầu và H- các tiên đề bao hàm quan hệ. Ngôn ngữ S hay còn gọi là ALC

R+
,
nếu S mở rộng với các tiên đề bao hàm quan hệ thì ta có logic mô tả SH, hay
cung cấp thêm các tiên đề quan hệ hàm ta có: SHf,
1.4.3. Bộ khẳng định (ABox)
Thành phần thứ ba của cơ sở tri thức DL là bộ khẳng định (ABox), hay
chính là mô tả thể giới. Bộ khẳng định chứa các mô tả trạng thái các cá thể
với các khái niệm, các quan hệ trong một miền ứng dụng.
Ví dụ 1.5:
co: Thucvat
<Ganesh, co>:an, <Bokhara, qua>: an
Một bộ khẳng định được định nghĩa một cách hình thức như sau:
Định nghĩa 1.4. Cho L là logic mô tả, a,b

I là các cá thể, C là một khái
niệm của L, và R là một quan hệ của L. Một ABox (A) là một tập hữu hạn có
thể rỗng của các mệnh đề có dạng: a

C, được gọi là khẳng định khái niệm
hoặc có dạng: <a, b>: R, được gọi là khẳng định quan hệ. Các mệnh đề
trong A được gọi là các khẳng định (hay các tiên đề cá thể).
Xét về mặt ngữ nghĩa: Một diễn dịch I thoả một khẳng định khái niệm
a: C (kí hiệu: I |= a: C) nếu a
I

C
I
, và I thoả một khẳng định quan hệ
<a, b>: R (kí hiệu: I |= <a, b>: R) nếu <a
I

, b
I
>

R
I
. Một diễn dịch I thoả
một ABox A (kí hiệu: I |= A) nếu I thoả tất cả các khẳng định trong A và I là
mô hình của ABox.
1.4.4. Cơ sở tri thức
Định nghĩa 1.5. Một cơ sở tri thức

là một bộ ba <T, R, A>, trong đó T là
một TBox, R là một RBox và A là một ABox.
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
23
23
Một diễn dịch I thoả một cơ sở tri thức , kí hiệu là I |= , nếu nó thoả
cả ba thành phần là T, R, A và I được gọi là mô hình của cơ sở tri thức . Cơ
sở tri thức  là thoả (hay không thoả), kí hiệu  |≠  (|= ) nếu có tồn tại
(hoặc không tồn tại) một diễn dịch I thoả .
1.5. Kiến trúc hệ logic mô tả
Hệ logic mô tả là các hệ thống thông tin có sử dụng logic mô tả để biểu
diễn tri thức về miền của ứng dụng. Các hệ này sử dụng khả năng biểu diễn
mạnh mẽ của logic mô tả kết hợp với hệ thống lập luận để tạo nên khả năng
hoạt động của chúng. Nhờ vào các ngôn ngữ mô tả, người ta có thể xây dựng
nên những hệ thống khái niệm của lĩnh vực ứng dụng, tức là thực hiện quá
trình phân loại các khái niệm giống như con người. Sự có mặt của các cá thể
giống như những thông tin cụ thể về miền ứng dụng mà hệ thống có sử dụng.

Hình 1.1 sau, mô tả kiến trúc chung của một hệ logic mô tả.












Hình 1.1. Kiến trúc của hệ logic mô tả
Cơ sở tri thức
TBox

Abox
RBox
Hệ thống lập luận
Giao diện
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
24
24
1.6. Các thủ tục quyết định trong logic mô tả
Hiệu quả chính mà một hệ logic mô tả mang lại là khả năng cung cấp
các dịch vụ suy diễn. Nếu xét trên một khía cạnh nào đó, ta có thể hiểu như
khả năng cung cấp này là khả năng hệ có thể trả lời các câu hỏi từ phía người
sử dụng. Vì độ phức tạp tính toán trong hầu hết các thủ tục suy diễn mà hệ có

thể cung cấp tỉ lệ thuận với khả năng biểu diễn của hệ nên đa số các thủ tục
được nghiên cứu và cài đặt có hiệu quả là các thủ tục quyết định.
Có bốn bài toán quyết định quan trọng sẽ được đề cập đến là: bài toán
thoả, bài toán bao hàm, bài toán tương đương và bài toán không giao. Các bài
toán được định nghĩa lần lượt như sau, với kí hiệu cho bộ thuật ngữ TBox là
T.
- Bài toán thoả: Khái niệm C là thoả theo T nếu như tồn tại một mô
hình I của mà C
I



. Khi đó, ta cũng nói rằng I là mô hình của C.
- Bài toán bao hàm: Khái niệm C bị bao bởi khái niệm D theo T nếu
như với mọi mô hình I của T, ta có C
I


D
I
. Khi đó ta kí hiệu là C

T
D hoặc
T |= C

D.
- Bài toán tương đương: Hai khái niệm C và D là tương đương theo T
nếu như C
I

= D
I
với mọi mô hình I của T. Khi đó ta viết C

T
D hoặc
T |= C

D.
- Bài toán không giao: Hai khái niệm C và D là không giao nhau theo
T nếu như C
I

D
I
=

với mọi mô hình I của T.
Ví dụ 1.6: Xét bộ thuật ngữ trong bảng 1.3, ta có khái niệm ConNguoi bao
hàm khái niệm Nam và Nu. Khái niệm ChaMe bao hàm khái niệm Cha và Me.
Khái niệm Me bao hàm khái niệm Ba, Ngoài ra, hai khái niệm Nam và Nu
là không giao, hoặc hai khái niệm Cha và Me cũng không giao.
LUẬN VĂN THẠC SỸ
Vò minh yÕn - cntt 2003-2005
25
25
Trong các bài toán suy diễn này, có hai vấn đề cần quan tâm. Thứ nhất
là ta có thể chuyển các bài toán này về dạng bài toán bao hàm hoặc về dạng
bài toán không thoả. Điều đó có nghĩa là ta chỉ cần có một thủ tục quyết định
cho bài toán bao hàm hoặc bài toán thoả là đã có thể giải quyết được cho các

bài toán còn lại. Trên thực tế, các hệ logic mô tả thường chỉ cung cấp cơ chế
kiểm tra cơ bản đối với bài toán bao hàm khái niệm. Điều này là đủ để thực
hiện các suy luận còn lại dựa vào mệnh đề sau (giảm về bài toán bao hàm).
Mệnh đề 1.3. Chuyển về bài toán bao hàm
Ta xét hai khái niệm C và D
- Bài toán C là không thoả

bài toán bao hàm C bị bao bởi

.
- Bài toán C tương đương với D

bài toán bao hàm C bị bao hàm bởi
D và D bị bao hàm bởi C.
- Bài toán C không giao với D

bài toán bao hàm C

D bị bao bởi

.
Ngoài ra, nếu một hệ logic mô tả cho phép áp dụng phép toán phủ định
lên trên các khái niệm phức tạp thì chỉ cần cài đặt thuật toán giải quyết bài
toán không thoả là đủ để có thể giải quyết các bài toán còn lại. Mệnh đề sau là
cơ sở lý thuyết của các hệ này (giảm về bài toán không thoả).
Mệnh đề 1.4. Chuyển về bài toán không thoả
Ta xét hai khái niệm C và D
- Bài toán C bị bao bởi D

Bài toán C




D là không thoả.
- Bài toán C tương đương với D

Bài toán C



D là không thoả
và D



C là không thoả
- Bài toán C không giao với D

Bài toán C

D là không thoả.

×