Tải bản đầy đủ (.doc) (22 trang)

Tổng quan ontology cho biểu diễn tri thức

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (447.31 KB, 22 trang )

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
CHƯƠNG TRÌNH ĐẠO TẠO THẠC SĨ CNTT QUA MẠNG
۞
University of Information Technology
University of Information Technology
Tổng quan ontology cho
biểu diễn tri thức
Lớp: CH-06
Môn Học: Biểu diễn tri thức và ứng dụng
GVHD: PGS.TS. Đỗ Văn Nhơn
HVTH: Dương Ngọc Nhân, MSHV: CH1101115
TP.HCM, Tháng 01 năm 2013
Tổng quan về ontology 3
1 Định nghĩa ontology và các khái niệm liên quan 6
2 Phân loại và vòng đời ontology 8
3 Phương pháp hình thức trong mô tả ontology 12
4 Các ứng dụng dựa trên ontology 19
Kết luận và hướng bổ sung 21
Tài liệu tham khảo 21
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 2
Tổng quan về ontology
0.1 Nguồn gốc
Thuật ngữ "Ontology" đã được xây dựng từ chữ “Ontos” của Hy Lạp nghĩa là
"những gì", "những gì tồn tại" và chữ “Logos” nghĩa là "thuyết giảng" hay
"nghiên cứu". Nó xuất hiện lần đầu tiên vào năm 1606 theo thuật ngữ Latin
“Ontologia” trong tác phẩm Ogdoas Scholastica của Jacob Lorhard (1561-
1609). Trong triết học, ontology được tạm dịch là “bản thể học” là một nhánh
triết học siêu hình cơ bản nghiên cứu liên quan đến các khái niệm về sự tồn tại,
các phạm trù cơ bản của các thuộc tính hiện có và phổ biến nhất của các bản thể
và mối quan hệ của chúng.
Từ thế kỷ thứ 3 trước công nguyên, Aristotle một nhà bác học và triết học của Hy


Lạp cổ đại đã có quan tâm đến biểu diễn các tri thức hiện có của thế giới với một
phương pháp xác định các lớp đối tượng với các thuộc tính chung trong một cấu
trúc phân cấp nơi mà một số lớp có thể đại diện cho các lớp khác. Đây cũng là
nền móng cho sự ra đời ontology sau này.
Khoa học máy tính mượn thuật ngữ Ontology từ các nhà triết học đầu những năm
80: nó có thể được tìm thấy trong một bài viết của McCarthy (McCarthy, 1980)
và trong cuốn sách của John Sowa (Sowa, 1984) trước khi nó trở nên nổi tiếng
với các bài viết của Thomas Gruber (Gruber, năm 1993). Tuy nhiên, đến những
năm 90 thì từ “ontology” mới được thông qua toàn thể cộng đồng.
Thật ra, khái niệm và tạo tác phần mềm (software artifact *) mà chúng ta bây giờ
đặt tên “ontologies” đã tồn tại trong khoa học máy tính rất lâu trước khi thuật
ngữ “ontology” được lấy từ triết học. Vào những năm 70, khái niệm ontology đã
được sử dụng dưới những tên khác nhau trong biểu diễn tri thức của trí tuệ nhân
tạo hình thức, ví dụ như T-Box description logics mô tả các loại từ ngữ dùng
trong biểu diễn và đặc tính của chúng, hoặc các mạng ngữ nghĩa (Quillian, 1967),
hoặc sự hổ trợ của đồ thị khái niệm (Sowa, 1984) mô tả đa thừa kế giữa các loại
khái niệm và quan hệ.
(*) software artifact – là một trong nhiều loại sản phẩm hữu hình được tạo ra trong quá trình
phát triển phần mềm. Các sản phẩm bao gồm tài liệu, mã lệnh, sơ đồ, mô hình, kiến trúc, kế
hoạch, v.v)
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 3
0.2 Sự cần thiết của ontology
Việc dùng thuật ngữ ontology vào khoa học máy tính là tìm được một cái tên và
định nghĩa phù hợp với nhu cầu cần thiết cho việc trừu tượng hóa các khái niệm
về bản thể trong các trường hợp khác nhau trong phần mềm và chúng ta đã
chuyển từ một lĩnh vực siêu hình, trừu tượng tới một đối tượng cụ thể cho việc
nghiên cứu biểu diễn tri thức.
Trong ngành khoa học máy tính và khoa học thông tin, ontology mang ý nghĩa là
các loại vật và quan hệ giữa chúng trong một hệ thống hay ngữ cảnh cần quan
tâm. Các loại vật này còn được gọi là khái niệm, thuật ngữ hay từ vựng có thể

được sử dụng trong một lĩnh vực chuyên môn nào đó. Ontology cũng có thể hiểu
là một ngôn ngữ hay một tập các quy tắc được dùng để xây dựng một hệ thống
Ontology.
Một hệ thống Ontology định nghĩa một tập các từ vựng mang tính phổ biến trong
lĩnh vực chuyên môn nào đó và quan hệ giữa chúng. Định nghĩa này có thể được
hiểu bởi cả con người lẫn máy tính. Một cách khái quát, có thể hiểu Ontology là
"một biểu diễn của khái niệm hoá chung được chia sẻ" của một miền hay lĩnh
vực nhất định. Nó cung cấp một bộ từ vựng chung bao gồm các khái niệm, các
thuộc tính quan trọng và các định nghĩa về các khái niệm và các thuộc tính này.
Ngoài bộ từ vựng, Ontology còn cung cấp các ràng buộc, đôi khi các ràng buộc
này được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ từ vựng, nó
được sử dụng trong một lĩnh vực mà có thể được giao tiếp giữa người và các hệ
thống ứng dụng phân tán khác.
[1]
Hãy xem xét hình 1-1 bên dưới, một khối lập phương ánh sáng được đặt trên bên
phải của một khối lập phương tối. Các mô tả của cảnh này đòi hỏi hai điều:
1. một phát biểu của các sự kiện mô tả cảnh.
2. một vốn từ vựng rõ ràng được sử dụng cho phát biểu.
Trong biểu diễn tri thức, mô tả khái niệm (Conceptual description) được gọi là sự
kiện và từ vựng khái niệm (Conceptual vocabulary) được gọi là một ontology. Vì
vậy, một ontology cung cấp một vốn từ vựng khái niệm để xây dựng cho việc mô
tả.
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 4
Hình 1-1: một ontology cung cấp một từ vựng khái niệm để mô tả một thực tại (reality)
[3]
0.3 Một số chức năng chính
Ontology được sử dụng trong trí tuệ nhân tạo, công nghệ Web ngữ nghĩa
(Semantic Web), các hệ thống kỹ thuật, kỹ thuật phần mềm, tin học y sinh và
kiến trúc thông tin như là một hình thức biểu diễn tri thức về thế giới hoặc một số
lĩnh vực cụ thể. Một Ontology cho phép chúng ta giới thiệu các kỷ thuật cho

việc suy diễn, phân loại tự động, truy cập thông tin, và khi chia sẻ một ontology
giữa các hệ thống khác nhau cũng có thể đảm bảo khả năng tương tác của họ.

Hình 1-2: một số chức năng liên quan ontology
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 5
1 Định nghĩa ontology và các khái niệm liên quan
1.1 Các định nghĩa
Ontology là một thuật ngữ bắt nguồn từ triết học và được dùng trong trí tuệ nhân
tạo và khoa học máy tính với nhiều nghĩa và cách định nghĩa khác nhau:
• Một ontology định nghĩa các thuật ngữ và các quan hệ cơ bản bao gồm các
từ vựng của một chủ đề nào đó cũng như các luật cho việc kết hợp các thuật
ngữ và các quan hệ để xác định các phần mở rộng tới vốn từ đó [Neches et al.
1991]
• Một ontology là một hình thức rõ ràng có thể biểu diễn được của một khái
niệm, một lớp trừu tượng về một ứng dụng, một lĩnh vực nào đó được chia sẻ
giữa nhóm cá thể [Gruber 1993]
• Một ontology là một mô tả hình thức của các khái niệm và quan hệ có thể tồn
tại trong cộng đồng [Russell & Norving 1995]
• Một ontology là một tập hợp các thuật ngữ có cấu trúc phân cấp để mô tả
cho một miền hoặc lĩnh vực mà có thể được sử dụng như một nền tảng cơ bản
cho cơ sở tri thức [Swarout et al. 1996]
• Chủ đề của ontology là nghiên cứu các phạm trù vật chất tồn tại hoặc có thể
tồn tại trong một số miền nào đó. Sản phẩm của nghiên cứu này còn được
gọi là ontology là một danh sách các loại vật chất được cho là tồn tại trong
một miền quan tâm D từ quan điểm của một người dùng ngôn ngữ L cho mục
đích nói về D [Sowa, 2000]
• Một ontology là một lý thuyết trong đó sử dụng một vốn từ vựng cụ thể để mô
tả các thực thể, các lớp, các thuộc tính và các chức năng liên quan với một
quan điểm nhất định [Fonseca et al. 2002]
Từ những định nghĩa này, chúng ta có thể xác định một số khía cạnh chủ yếu của

ontologies:
• Các ontologies được sử dụng để mô tả cho một miền cụ thể (domain of
interest)
• Các thuật ngữ và quan hệ được định nghĩa rõ ràng trong miền đó
• Có một cơ chế để tổ chức các thuật ngữ
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 6
• Có một sự đồng thuận giữa những người sử dụng ontology theo cách mà ý
nghĩa của các thuật ngữ được sử dụng nhất quán
1.2 Các khái niệm liên quan
Ontology: một nhánh của triết học liên quan tới đặc tính tự nhiên và tổ chức của
các sự vật hiện tượng.
Từ vựng (Vocabulary/lexicon): là một khái niệm thường được dùng trong ngôn
ngữ học bao gồm các thuật ngữ được chuẩn hóa với một ngữ nghĩa đã được thừa
nhận cho một lĩnh vực cụ thể nào đó trong giao tiếp, ví dụ như các từ điển
chuyên đề. Một điểm chung giữa ontology và từ điển chuyên đề là đều bao gồm
một số lượng lớn các khái niệm và thuật ngữ giúp chúng ta hiểu rõ ý nghĩa của
các khái niệm đó trong một lĩnh vực.
Miền hoặc lĩnh vực (Domain): là một đại diện trong những thứ (vật chất) tồn tại
trong một lĩnh vực cụ thể của thực tại, ví dụ như: y học, địa lý, sinh thái, pháp
luật, v.v
Ý niệm (Notion): là cái gì đó hình thành trong ý nghĩ, chúng hợp thành suy nghĩ,
tư duy. Nó dùng để cấu trúc tri thức và nhận thức về thế giới.
Tăng cường và mở rộng (intension and extension): đây là sự khác biệt giữa
cách một ý niệm được xem xét: tăng cường là tập các thuộc tính và đặc tính mô
tả khái niệm còn mở rộng là tập những thứ được biểu diễn bởi khái niệm.
Ví dụ: khái niệm “xe hơi”, sự tăng cường bao gồm các đặc điểm của một phương
tiện đường bộ và một động cơ, thường có bốn bánh và chỗ ngồi cho từ một đến
bốn người trong khi sự mở rộng bao gồm “xe màu trắng đậu ở trước trường
CNTT”, một “xe Toyotal Rio với biển số 50N 5432”
Phân loại (Taxonomy): sự phân lớp, phân cấp các thực/cá thể dựa trên tính

tương tự, tương đồng
Bộ thuật ngữ và bộ khẳng định (Terminology-Box hay T-box và Assertion box
hay A-box): cơ sở tri thức gồm hai bộ phận T-box và A-box, T-box bao gồm các
khái niệm và định nghĩa của chúng, nó cũng bao gồm các quan hệ phân cấp ‘is-
a’, còn bộ phận A-box bao gồm các thể hiện của các khái niệm và một số khẳng
định trên những thể hiện đó.
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 7
Tính đồng âm (Homonymy): một từ vựng có
thể tham chiếu tới vài khái niệm hoặc quan hệ
hay nói cách khác khái niệm giống nhau có
thể có các nghĩa khác nhau
Tính đồng nghĩa (Synonymy): một khái
niệm hoặc một quan hệ được tham chiếu bởi
vài từ vựng hay nói cách khác hai khái niệm
khác nhau có thể có cùng một ý nghĩa
Khái niệm hóa (Conceptualization): một cấu
trúc ngữ nghĩa tăng cường mã hóa các luật ràng buộc lên cấu trúc các thực tại
2 Phân loại và vòng đời ontology
2.1 Phân loại ontology
Ontology có thể có các loại khác nhau phụ thuộc trên một vài tiêu chí:
• Mức độ chi tiết
• Mức độ phụ thuộc
2.1.1 Mức độ chi tiết
Căn cứ vào mức độ chi tiết và thô (tổng quan), người ta phân chia một ontology
thành hai loại:
• Các ontology tham khảo (Reference ontologies): một ontology chi tiết sẽ xác
định chính xác hơn ý nghĩa của từ vựng và do đó nó có thể được sử dụng off-
line cho mục đích tham khảo (reference).
• Các ontology chia sẻ (shareable ontologies): một ontology thô sẽ dễ dàng chia
sẻ (shareable) giữa các thành phần khác trên sự đồng thuận về các khái niệm

tổng quan cơ bản và do đó nó có thể được sử dụng on-line để hổ trợ các dịch
vụ của hệ thống.
2.1.2 Mức độ phụ thuộc
Căn cứ vào mức độ phụ thuộc trên một công việc cụ thể hoặc quan điểm nhìn
nhận, người ta phân chia một ontology thành bốn loại như hình 3-1:
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 8
Hình 2-2 synonymy
Hình 2-1 homonymy
• Top-level Ontology: còn gọi là ontology lớp cao, nhằm mô tả những khái
niệm tổng quan và trừu tượng, ví dụ như: engineering, person, v.v. Các khái
niệm đó độc lập với các bài toán hoặc
lĩnh vực cụ thể.
• Domain Ontology: mô tả chi tiết và cụ
thể hơn các khái niệm đã chỉ ra ở phần
top-level ontology cho một lĩnh vực
chung nào đó, ví dụ như: mechanical-
engineering, software-engineering.
Domain ontology được thực hiện nhiều
ở các lĩnh vực: y học, di truyền, địa lý,
du lịch, thông tin môi trường, v.v.
• Task Ontology: mô tả chi tiết và cụ thể hơn các khái niệm đã chỉ ra ở phần
top-level ontology cho một tác vụ hoặc một hoạt động nào đó, ví dụ như:
requirements analysis. Xem thêm ví dụ chi tiết ở hình 3-2 bên dưới
Task ontology được thực hiện cho các tác vụ xây dựng, sắp xếp kế hoạch làm
việc, giám sát trong một lĩnh vực khoa học, cơ sở tri thức máy tính dạy học,
sự theo dõi phóng tên lửa, các tác vụ hướng dẫn điều trị bệnh, v.v.
• Application Ontology: cung cấp một bộ từ vựng xác định được các yêu cầu để
mô tả các tác vụ (task) chắc chắn trong một ngữ cảnh của ứng dụng cụ thể.
Đặc biệt, nó sử dụng cả domain ontology và task ontology và mô tả vai trò
của chúng trong một tác cụ thể.

Chúng ta có thể thấy hệ thống phân cấp của ontology thông qua sự trình bày ở
trên: ontology ở lớp thấp hơn kế thừa, chuyên môn hóa các khái niệm và mối
quan hệ từ ontology lớp trên. Ontology lớp thấp cụ thể hơn và phạm vi ứng
dụng thu hẹp hơn, còn ontology ở lớp cao có khả năng rộng hơn, chủ yếu dành
cho việc kế thừa và sử dụng lại.
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 9
Hình 3-1 phân loại ontology
Hình 3-2: task ontoloty
2.2 Vòng đời (life-cycle) của ontologies
Ontologies là các đối tượng sống và mỗi giai đoạn của vòng đời đưa ra các vấn
đề để phát triển và nghiên cứu. Vòng đời của ontology bao gồm các giai đoạn:
• Khám phá nhu cầu (detection of needs)
• Lập kế hoạch và quản lý (management and planning)
• Thiết kế (design)
• Phát triển (evolution)
• Phổ biến (dissemination/diffusion)
• Sử dụng (use)
• Đánh giá (evaluation)
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 10
Hình 3-3: Các giai đoạn chính trong vòng đời của một ontoloty
Nhu cầu và đánh giá: việc khám phá ra các nhu cầu cũng như đánh giá sau quá
trình ontoloty được sử dụng thông qua các hình thức như các cuộc phỏng vấn
(interviews), bảng câu hỏi (questionnaries), các cuộc điều tra (surveys), v.v
Thiết kế và phát triển: tại thời điểm đầu của hai giai đoạn này cùng chia sẽ một
số vấn đề:
• Chỉ rõ các giải pháp (như mockups và modelings, prototyping, v.v)
• Thu thập tri thức (phân tích văn bản, xử lý ngôn ngữ tự nhiên, khai phá dữ
liệu, các phương pháp và công cụ trích tri thức, v.v)
• Khái niệm và mô hình hóa (phỏng vấn với các chuyên gia, meta-ontologies,
v.v)

• Hình thức hóa (phân tích khái niệm hình thức, đồ thị khái niệm, semantic web
formalisms RDF (Resource Description Framework), RDFS (Resource
Description Framework Schema), OWL (Ontology Web Language), v.v)
• Tích hợp các tài nguyên có sẳn
• Thực hiện
Phổ biến: giai đoạn này tập trung vào việc triển khai và thiết lập ontology.
Những vấn đề của giai đoạn này được hạn chế bởi các giải pháp kiến trúc phần
mềm. Trong bối cảnh các ứng dụng web, người ta có thể dựa trên các chuẩn
W3C. Để chia sẻ tập tin, thì kiến trúc peer-to-peer hoặc phân tán có thể được sử
dụng. Để sự tích hợp các ứng dụng, thì kiến trúc web services là một giải pháp.
Trong tất cả các kiến trúc (các máy chủ web, web services, Peer to Peer, v.v)
phân bố các nguồn tài nguyên (dữ liệu, các mô hình, các ứng dụng và người sử
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 11
dụng) và tính không đồng nhất của nó (cú pháp, ngữ nghĩa, các giao thức, ) đưa
các bài toán nghiên cứu có khả năng tương tác và linh hoạt hơn.
Sử dụng: giai đoạn này bao gồm tất cả các hoạt động trực tiếp dựa trên tính sẳn
có của ontology, ví dụ như chú thích các nguồn tài nguyên (resources) , suy diễn
tri thức, hổ trợ quyết định, phân tích khối lượng lớn tri thức, v.v.
Quản lý: Các hoạt động song song của quản lý và lập kế hoạch nhấn mạnh tầm
quan trọng của một công việc liên tục và chính sách toàn diện để phát hiện,
chuẩn bị và đánh giá lặp đi lặp lại cả chu kỳ sống của ontology và đảm bảo rằng
các giải pháp vẫn trong chu kỳ hệ thống thông tin nơi các đóng góp mang lại tính
hữu dụng và tính hữu dụng mang lại các đóng góp.
3 Phương pháp hình thức trong mô tả ontology
3.1 Các thành phần của ontology
Ontology đưa ra một tập hợp phổ biến các đặc tính và các thành phần để thực
hiện biểu diễn tri thức và suy diễn tri thức. Các thành phần bao gồm:
• Các cá thể (instances/individuals/particular things/objects)
• Các khái niệm (concepts/classess/entity types)
• Các thuộc tính (attributes/properties/slots/features)

• Các quan hệ (relationships/associations/roles) giữa các khái niệm hoặc cá thể
• Các tiên đề (axioms/constraints/assertions)
• Các chức năng và các quy tắc (functions – rules)
Ngoài ra, ontology còn có thể bổ sung thêm một thành phần H
c
⊆ C × C (C: khái
niệm) là một tập quan hệ phân cấp các khái niệm. Trong đó H
c
(c
1
, c
2
) biểu diễn
c
1
là khái niệm con của c
2
3.1.1 Cá thể
Cá thể là thành phần cơ bản, nền tảng của một ontology là đối tượng cụ thể trong
thực tại như con người, động vật, cái bàn, hành tinh, v.v, một bản sao của một
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 12
khái niệm trừu tượng với các giá trị thật cho các thuộc tính, ví dụ
[2]
:
Một ontology cùng với một tập các cá thể riêng biệt của các lớp tạo thành một hệ
tri thức. Một ontology có thể không cần bất kỳ một cá thể nào, nhưng một trong
những mục đích chung của ontology là để cung cấp một cách thức phân lớp các
cá thể, mặc dù các cá thể này không thực sự là một phần của ontology.
3.1.2 Khái niệm
Khái niệm (còn được gọi là lớp hay loại thực thể) là mô tả các tính năng phổ

biến mà các cá thể hoặc đối tượng có, ví dụ: người (Person), phương tiện xe cộ
(vehicle).
Các khái niệm là tổng quát, trừu tượng hay cụ thể trong một lĩnh vực nào đó.
Mỗi khái niệm có một thuật ngữ liên quan, thường là một mô tả ngôn ngữ tự
nhiên thể hiện tên của nó và một tập các thuộc tính đăc trưng cho nó. Một khái
niệm có thể có các khái niệm con (sub-concepts) liên quan sử dụng các mối quan
hệ thừa kế và phân cấp. Ví dụ mô hình phân lớp khái niệm xe hơi:
Hình 4-1: mô hình phân lớp/khái niệm xe hơi
[7]
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 13
3.1.3 Thuộc tính
Các đối tượng trong ontology có thể được mô tả thông qua việc khai báo các
thuộc tính của chúng. Các thuộc tính được sử dụng để lưu trữ các thông tin mà
đối tượng có thể có. Mỗi một thuộc tính đều có tên và giá trị của thuộc tính đó.
Ví dụ, đối với một cá nhân có thể có các thuộc tính: Họ tên, ngày sinh, quê quán,
số CMND, v.v. Giá trị của một thuộc tính có thể là một kiểu dữ liệu phức tạp.
3.1.4 Quan hệ
Một quan hệ biểu diễn một kiểu tương tác giữa các khái niệm trong một lĩnh vực
nào đó. Một vài kiểu quan hệ có thể được phân biệt theo số các khái niệm như:
quan hệ phản xạ (liên kết chỉ một khái niệm), quan hệ nhị phân (liên kết hai khái
niệm), quan hệ n nhiều (liên kết nhiều hơn hai khái niệm)
[3]
. Ngoài ra quan hệ
còn biểu diễn một kiểu tương tác giữa hai đối tượng hoặc cá thể. Cũng có thể
phân biệt quan hệ theo các loại khác nhau, ví dụ:
• Loại quan hệ dành cho các quan hệ giữa các lớp
• Loại quan hệ dành cho các quan hệ giữa các cá thể
• Loại quan hệ dành cho các quan hệ giữa một cá thể và một lớp
• Loại quan hệ dành cho các quan hệ giữa một đối tượng đơn lẻ và một bộ sưu
tập (collection)

• Loại quan hệ dành cho các quan hệ giữa các bộ sưu tập
Quan hệ giữa các đối tượng trong một ontology xác định các đối tượng có quan
hệ với nhau như thế nào. Có ba loại quan hệ chính trong một ontology: {‘is-a’,
‘part-of’, ‘syn-of’}, trong đó ‘part-of’ gồm ‘subclass-of’ hoặc ‘superclass-of’, ví
dụ khái niệm Ford Explorer và Ford Bronco (hình 4-1) có thể được quan hệ bởi
kiểu quan hệ tương đương <syn-of> > và biểu hiện đầy đủ là:
Ford Explorer syn-of Ford Bronco
Điều này cho chúng ta biết rằng Explorer là mô hình thay thế Bronco
Một kiểu quan hệ quan trọng của ontology là kiểu quan hệ xếp gộp
(subsumption: is-a-superclass-of, is-a-subclass-of) nghĩa là xếp một cá thể vào
một loại nào đó, xếp một cái riêng biệt vào một cái chung, v.v. Kiểu quan hệ này
mô tả các đối tượng nào là thành viên của các lớp nào của các đối tượng, ví dụ:
các lớp Ford Explorer is-a-subclass-of 4-Wheel Drive
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 14
3.1.5 Tiên đề
Tiên đề là các câu hình thức luôn luôn đúng. Nó chỉ ra một số ràng buộc trên
các phần tử của ontology, ví dụ: một tiên đề phân tách giữa hai khái niệm A và B
có nghĩa là không có bất kỳ cá thể nào tại cùng một thời điểm một cá thể của
khái niệm A cũng là cá thể của khái niệm B và ngược lại.
3.1.6 Quy tắc
Các quy tắc thường được sử dụng để suy diễn tri thức trong ontology, chẳng hạn
như các giá trị thuộc tính, các quan hệ cá thể, v.v. Các ngôn ngữ biểu diễn
ontology có khả năng thực hiện một tập các phép toán cơ bản nhất định để kiểm
soát các công việc cập nhật và truyvấn trên các ontology. Như vậy, các khái
niệm mới có thể được xác định, các thuộc tính liên quan đến các khái niệm và
các giá trị có thể được thay đổi hoặc thêm vào trong suốt vòng đời của ontology.
3.2 Các bước xây dựng
Để phát triển một mô hình khái niệm đầy đủ và phù hợp, các bước theo sau cần
được thực hiện theo thứ tự:
1. Tạo chú giải cho các thuật ngữ: bước đầu tiên, người thiết kế phải phát triển:

- Một bảng chú giải tất cả các thuật ngữ đáng chú ý trong lĩnh vực đang tiến
hành (bao gồm các khái niệm, các cá thể, các thuộc tính, các quan hệ giữa
các khái niệm, .v.v),
- Các định nghĩa của thuật ngữ trong ngôn ngữ tự nhiên, và
- Các từ đồng nghĩa và viết tắt của chúng
2. Phân loại các khái niệm: khi bảng chú giải có chứa một lượng lớn các thuật
ngữ, thì người thiết kế xây dựng các nguyên tắc để phân loại các khái niệm
để tạo thành một hệ thống phân cấp thứ bậc tất cả các khái niệm.
3. Xác định sơ đồ liên kết các khái niệm với nhau: sau khi phân loại các khái
niệm đã được hoàn tất thì tiến hành xây dựng các sơ đồ của quan hệ nhị
phân.
4. Định nghĩa từ điển của các khái niệm: tại bước này từng khái niệm có thể
xác định các quan hệ tới các khái niệm khác, tới cá thể của mỗi khái niệm và
các thuộc tính của khái niệm đó.
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 15
5. Xác định chi tiết của các quan hệ nhị phân: mục tiêu của bước này là để xác
định chi tiết tất cả các quan hệ nhị phân đã được định nghĩa trong từ điển để
có được một bảng của các quan hệ. Cho mỗi quan hệ, người thiết kế phải
xác định tên của hai khái niệm có quan hệ và các yếu tố của các quan hệ và
nếu tồn tại, nghịch đảo của mối quan hệ.
6. Xác định chi tiết các thuộc tính của mỗi cá thể: mục đích của bước này là để
mô tả chi tiết các thuộc tính của mỗi cá thể đã có trong từ điển.
7. Xác định chi tiết các thuộc tính của các khái niệm (hoặc lớp): mục tiêu của
bước này là để miêu tả chi tiết các thuộc tính của các khái niệm (hoặc lớp) đã
được xác định khi các khái niệm được định nghĩa.
8. Xác định cụ thể các hằng số: mục tiêu của bước này là để miêu tả chi tiết mỗi
hằng số của các chú giải.
9. Xác định các tiên đề (Axioms): người thiết kế phải xác định các tiên đề hình
thức và phải miêu tả chúng một cách chính xác.
10.Xác định các quy tắc (Rules): các quy tắc được xác định để thêm tri thức tới

ontology
11.Xác định các cá thể: khi mô hình khái niệm của ontology đã sẵn sàng, người
thiết kế có thể xác định các cá thể quan trọng để làm rõ các khái niệm. Cho
mỗi cá thể, người thiết kế có thể định nghĩa tên, khái niệm mà cá thể liên
quan và các giá trị của các thuộc tính.
3.3 Các tiêu chuẩn thiết kế ontology
Khi chúng ta chọn cách biểu diễn một sự vật trong ontology thì phải đưa ra một
quyết định thiết kế với các tiêu chuẩn nhằm đảm bảo ontology sẽ có những đặc
điểm thỏa mãn mục đích đề ra:
• Tính rõ ràng: ontology phải miêu tả rõ ràng ý nghĩa của các khái niệm được
định nghĩa và định nghĩa phải khách quan. Chúng ta nên cố gắng đưa ra các
định nghĩa dưới dạng các phát biểu logic và nên chọn các định nghĩa đầy đủ
(bao gồm cả điều kiện cần và đủ)
• Tính chặt chẽ: các khái niệm trong ontology cần được thiết kế một cách chặt
chẽ và các phát biểu để định nghĩa phải đảm bảo đúng logic.
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 16
• Khả năng mở rộng: ontology thiết kế sao cho đáp ứng được nhu cầu chia sẻ
từ vựng. Ta cần xây dựng một số khái niệm nền tảng cho cả một lớp các
nhiệm vụ đã được dự đoán trước và biểu diễn ontology sao cho người sử
dụng sau này có thể dễ dàng mở rộng và thay đổi ontology, ví dụ có thể định
nghĩa một thuật ngữ mới dựa trên các khái niệm đã biết mà không phải sửa lại
các định nghĩa đã có.
• Tính độc lập với ngôn ngữ biểu diễn: các khái niệm cần được mô tả mức tri
thức, tránh phụ thuộc vào mức mã hóa bằng các biểu tượng. Việc phụ thuộc
vào ngôn ngữ biểu diễn sẽ dẫn đến việc định nghĩa các khái niệm sao cho tiện
lợi cho việc biễu diễn bằng ngôn ngữ đã định. Ta cần tránh sụ phụ thuộc này
vì các tác tử chia sẻ cơ sở tri thức có thể được xây dựng trong các hệ thống
khác nhau và theo cách biểu diễn khác nhau.
3.4 Ngôn ngữ biểu diễn ontology
Ngôn ngữ biểu diễn ontology (ontology representation languages) là các ngôn

ngữ hình thức cho phép việc mã hóa tri thức trong một lĩnh vực cụ thể và thường
bao gồm các quy tắc suy luận cung cấp cho việc xử lý các yêu cầu dựa trên tri
thức đó. Theo sau là các ngôn ngữ biểu diễn tri thức hiện tại được sử dụng cho
hình thức hóa ontology. Các ngôn ngữ đó được phân chia thành ba loại chính:
• Graph-based:
o Mạng ngữ nghĩa (Semantic networks)
o Đồ thị khái niệm (Conceptual graphs)
o UML class diagrams, Entity-Relationship diagrams
• Frame based
o Frame Systems
o OKBC, XOL
• Logic based
o Description Logics (ví dụ: DL-Lite, OWL, v.v)
o Rules (ví dụ: RuleML, LP/Prolog, F-Logic)
o First Order Logic (ví dụ: KIF)
o Non-classical logics (ví dụ: non-monotonic, probabilistic)
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 17
3.5 Những lợi ích từ việc mô tả ontology
Ngôn ngữ hình thức có vai trò quan trọng trong hai quá trình phát triển ontology:
mô tả và triển khai. Một bản mô tả ontology sẽ cung cấp các đặc điểm của
ontology và nêu bật các đặc điểm này không phụ thuộc vào phương thức cài đặt
ontology. Bảng mô tả ontology cung cấp những lợi ích sau:
• Không cần phân biệt bằng các tư liệu bên ngoài ontology: mọi phân biệt
chính đều nằm trong ontology vì thế mọi kết luận đều có thể rút ra dựa trên
ontology.
• Không có những giả thiết ẩn: tất cả các giả thiết đều cần được làm rõ. Việc
loại bỏ các giả thiết ẩn thì khả năng chia sẻ thông tin sẽ được nâng cao hơn và
tạo nhiểu thuận lợi cho việc áp dụng một ontology cũ cho một lĩnh vực mới.
• Các lựa chọn khi thiết kế: khi thiết kế chúng ta thường có nhiều lựa chọn cho
việc biểu diễn một vấn đề bằng các cách khác nhau với các giải pháp hợp lý.

Một bản mô tả ontology sẽ cho chúng ta một cái nhìn chính xác và toàn thể về
không gian các giải pháp thiết kế. Nhờ vậy việc lựa chọn các giải pháp trở
nên dễ dàng hơn.
• Các cam kết ontology: ontology thực chất là một bản mô tả được xây dựng để
tạo các cam kết ontology. Trong thực tế, cam kết ontology là một thỏa thuận
sử dụng một tập hợp từ vựng theo đúng những nguyên tắc đã quy định trong
ontology. Với một bản mô ta ontology, chúng ta có thể quan sát rõ ràng sự
khác nhau giữa các bản cam kết ontology. Ví dụ có thể so sánh sự khác nhau
giữa hai cách định nghĩa ontology: một định nghĩa quan tâm đến lớp các đối
tượng của ontology và một định nghĩa quan tâm đến các đặc điểm và quan hệ
mà các đối tượng thuộc ontology phải đáp ứng.
• Khả năng chỉnh sửa: nếu thay đổi một phần của ontology thì phải xem phần
còn lại của ontology có cầp phải sửa đổi gì không. Nếu có một bản mô tả,
chúng ta sẽ có đặc điểm chính xác các ràng buộc giữa các phần khác nhau của
ontology. Không có bản mô tả, các mối quan hệ có thể bị ẩn đi trong các
phần ontology khác nhau dẫn đến những hạn chế của vỉệc chia sẻ tri thức.
• Khả năng tái sử dụng: bằng cách mô tả các lớp và các tác vụ, ontology sẽ
cung cấp cơ chế cho việc quyết định xem phần nào của ontology sẽ được tái
sử dụng giữa các lĩnh vực và các tác vụ khác nhau.
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 18
• Tiêu chí phân loại độ thích hợp: một bản mô tả ontology sẽ cung cấp các tiêu
chí rõ ràng cho việc đánh giá độ phù hợp của ontology với nhu cầu đặt ra ban
đầu.
4 Các ứng dụng dựa trên ontology
Ontology được ứng dụng rộng rãi trong nhiều hệ thống với nhiều lĩnh vực khác
nhau từ trí tuệ nhân tạo, công nghệ Web ngữ nghĩa (Semantic Web), khai phá tri
thức, quản lý tri thức, thương mại điện tử, v.v, đến các hệ thống kỹ thuật, kỹ
thuật phần mềm, tin học y sinh… Sau đây mô tả sơ lược một số ứng dụng điển
hình.
4.1 Khai phá dữ liệu

Việc ứng dụng ontology vào tiến trình khai phá dữ liệu (KDD) mang lại nhiều lợi
ích. Ví dụ trong thực tế người ta có thể phân chia tiến trình KDD thành sáu giai
đoạn và trong mỗi giai đoạn đều có thể thấy được sự hổ trợ của ontology:
• Giai đoạn đầu là hiểu nghiệp vụ (Business understanding): một ontology hình
thức sẽ giúp hiểu rõ nghiệp vụ trước khi thực hiện những tác vụ cụ thể, điều
này không chỉ trong KDD mà còn trong nhiều ứng dụng khác.
• Tiếp theo là Data understanding: các thành phần của ontology sẽ được ánh xạ
sang các thành phần của lược đồ dữ liệu và ngược lại, điều này giúp ta bổ
sung những thuộc tính còn thiếu của dữ liệu và xác định các thuộc tính thừa
có thể loại bỏ trong dữ liệu.
• Trong giai đoạn chuẩn bị dữ liệu (Data preparation): ontology giúp gom
nhóm các cặp giá trị, thuộc tính theo các tiêu chuẩn ngữ nghĩa.
• Phần mô hình hóa ontology sẽ giúp thiết kế các phiên khai phá và có thể định
hướng khai phá theo các xu hướng trong ontology.
• Trong giai đoạn đánh giá (Evaluation): các mô hình đã được khám phá dưới
dạng các tri thức cấu trúc sẽ được xác định quanh các khái niệm có thể được
dịch sang các thuật ngữ trong ontology
• Phần triển khai (Deployment): tri thức được trích ra được phản hồi lại môi
trường nghiệp vụ, sự tích hợp tri thức mới và tri thức cũ được thông qua bởi
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 19
ontology nghiệp vụ (Business ontology), kết quả khai phá được phân tán cho
nhiều tổ chức và ánh xạ vào một ontology chung được chia sẻ.
Có thể tham khảo ứng dụng ontology vào KDD qua hệ thống Mining Mart được
xây dựng dựa trên tiến trình CRISP-DM ( )
4.2 Web ngữ nghĩa
Một ứng dụng thường thấy của ontology là Web ngữ nghĩa (Semantic Web)
. Semaintic Web có thể được hiểu là tràng Web
bao gồm những dữ liệu có thể hiểu được bởi máy tính dựa trên một ngôn ngữ mô
tả (ví dụ: RDF) và các ngôn ngữ phát triển từ nó. Đây là kiến trúc cho phép tích
hợp những tác tử thông minh và chính tổ chức W3C đã phát triển kiến trúc này

và cũng là một trong những tổ chức đi tiên phong trong việc phát triển các ngôn
ngữ ontology.
Hình 5-1: Kiến trúc Web ngữ nghĩa theo W3C
[8]
Trong hệ thống web ngữ nghĩa bao gồm các tác tử thông tin và nhiệm vụ của nó
là tập hợp thong tin vào trong cơ sở tri thức. Các thong tin này được lấy từ các
nguồn khác nhau nằm phân tán và bảng than được cấu trúc hóa nhờ việc đặt
trong các trang html một phần của ontology metadata ngoài nội dung thong
thường. Như vậy, vai trò của ontology là cho phep tích hợp tri thức.
4.3 Xử lý ngôn ngữ tự nhiên
Một loại ứng dụng thường thấy nữa của ontology là xử lý ngôn ngữ tự nhiên.
Ứng dụng loại này không phải là mới nhưng rất khó thực hiện, ví dụ làm mất đi
sự tối nghĩa, giải quyết sự tham chiếu lẫn nhau, lối ẩn dụ, và hiểu được mức độ
biểu thị. Một dự án tiêu biểu của loại ứng dụng trên là GETESS (German Text
Exploitation and Search System).
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 20
Declarative Lanaguages
(OIL, DAML-O)
HTML
XML
XHTML SMIL
RDF(S)
DC
PICS
4.4 Tích hợp dữ liệu
Một ứng dụng khác của ontology là tích hợp dữ liệu. Trong hệ thống như vậy
bao gồm nhiều nguồn cơ sở dữ liệu khác nhau (khác nhau về cách thức lưu trữ và
nội dung thông tin), mỗi nguồn dữ liệu đó sẽ có một ontology mô tả về nó. Các
ontology này sau đó được hợp nhất vào một ontology chung, khi người dùng cần
thông tin nào thì đưa ra yêu cầu, hệ thống sẽ dựa vào mô tả ontology của các

nguồn dữ liệu mà sẽ chuyển truy vấn tới nguồn dữ liệu tương ứng.
Kết luận và hướng bổ sung
Trong phạm vi bài thu hoạch này chỉ trình bày tóm tắt có hệ thống lại ontology
và dùng nó trong biểu diễn tri thức. Tuy nhiên nó vẫn cần nhiều bổ sung (ba
điểm chính bên dưới) để bài viết hoàn chỉnh và dễ hiểu hơn:
• Đưa thêm nhiều ví dụ minh họa ontology
• Trình bày chi tiết và đưa ví dụ cụ thể cho phương pháp hình thức trong mô tả
ontology
• Trình bày tóm tắt các ngôn ngữ ontology đã liệt kê ở mục “4.4 – Ngôn ngữ
biểu diễn ontology” và một số môi trường phát triển
Tài liệu tham khảo
[1] Nguyễn Hữu Nhật – Trường ĐH CNTT « Tổng quan về Ontology »
[2] Đỗ Văn Nhơn « bài giảng: Ontology Learning - Thomas Wächter »
[3] Faiez Gargouri and Wassim Jaziri « Ontology Theory, Management and
Design: Advanced Tools and Models », chapter 1- 2, IGI Global 2010
[4] Dragan Gasevic, Dragan Djuric and Vladan Devedzic « Model Driven
Architecture and Ontology Development», Chapter 2 & 13, Springer 2006
[5] María Auxilio Medina Nieto « An Overview of Ontologies », March 2003
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 21
[6] A. Johannes Pretorius « Ontologies – Introduction and Overview », Vrije
Universiteit Brussel, 2004
[7] />[8] Lê Tấn Hùng, Từ Minh Phương , Huỳnh Quyết Thắng « Tác tử - công nghệ
phần mềm hướng tác tử », 2006
Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 22

×