Tải bản đầy đủ (.docx) (67 trang)

TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.26 MB, 67 trang )

ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
TIỂU LUẬN MÔN BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG
TỔNG QUAN VỀ ONTOLOGY VÀ
ỨNG DỤNG TRONG BIỂU DIỄN
TRI THỨC
GVHD: TS. ĐỖ VĂN NHƠN
Học viên thực hiện
Ngô Ngọc Thơ CH 1101139
Cao học khoá 6
Tháng 1/2013
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
MỤC LỤC
I. TỔNG QUAN VỀ ONTOLOGY
1. Lịch sử hình thành
I.1 Nguồn gốc Triết học
Ontology bắt nguồn từ Hy Lạp, từ ontos có nghĩa là sự tồn tại (being), từ logos nghĩa là diễn đạt
(word); có nghĩa là diễn đạt sự tồn tại. Nó ảnh hưởng một thời gian trong nền triết học của Hy
Lạp. Aristotle (384-332 trước CN) giới thiệu 10 phạm trù cơ bản là: Substance, Quality,Quantity,
Relation, Activity, Passivity, Having, Situatedness, Spatiality, và Temporality nằm ở mức lá của
cây ở hình 1.2, các phạm trù của ông có ảnh hưởng mạnh mẽ đến các ontology sau này. Sau đó
Franz Brentano bổ sung các phạm trù còn lại hình thành cây Brentano, là một hình thức của
ontology.
Ngô Ngọc Thơ
2
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
Hình 1.2 Cây Brentano về các phạm trù của Aristotle
Một ontology khác được biết tới là cây Porphyry do triết gia Hy Lạp Porphyry, sống vào


thế kỷ 3 sau Công Nguyên, vẽ ra dựa trên tư tưởng của Aristotle được minh họa ở hình
1.3. Theo cây này vật chất là khái niệm cao nhất không thể tìm thấy khái niệm nào cao
hơn chất. Còn nhân loại là khái niệm thấp nhất, dưới nhân loại chỉ có cá nhân như:
Socrates, Plato, Aristotle… Bên cạnh việc định nghĩa các phạm trù để biểu diễn ontology,
Aristotle còn xây dựng nên tam đoạn luận làm nền móng cho logic học.
Hình 1.2 Cây Porphyry
Sau đó, Emmanuel Kant (1724-1804) đã đưa ra quan điểm của mình dựa trên 4 lớp, mỗi
lớp thể hiện một mẫu thực tế.
Ngô Ngọc Thơ
3
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
Bảng 1.1 Phạm trù của Kant
Trong quyển sách Knowledge Representation, John F.Sowa đã kết hợp nhiều ý tưởng trước đó
tạo ra một lưới phạn trù, một ví dụ về ontology.
Hình 1.3 Lưới các phạm trù của Sowa
I.2 Một vài hệ thống hiện đại thiết kế dựa trên Ontology
Ngô Ngọc Thơ
4
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
Các triết gia thường xây dựng ontology theo hướng từ trên xuống với một tập khái niệm rộng lớn
về mọi thứ. Các nhà lập trình có xu hướng xây dựng ontology theo hướng ngược lại (từ dưới
lên). Cá nhà lập trình thường giới hạn các ontology hoặc thu nhỏ thế giới, và chỉ quan tâm các
khái niệm phù hợp với các ứng dụng quan tâm.
 Hệ thống trả lời câu hỏi Chat-80: Phiên bản gốc được công bố vào năm 1980 do các
nhà nghiên cứu đại học Edinburgh là David Warren và Fernando Pereira, thiết kế
ontology một thế giới thu nhỏ về các khái niệm địa lý. Chat-80 là một trong những hệ

thống điển hình đầu tiên việc xử lý ngôn ngữ tự nhiên dựa trên Prolog. Hệ thống này trả
lời các câu hỏi về thông tin địa lý của vùng được minh hoạ ở hình 1.4.
Hình 1.4 Các kiểu địa lý trong hệ thống Chat-80
Ngô Ngọc Thơ
5
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
Giao diện Demo Chat-80
Ví dụ một truy vấn
 Lược đồ khái niệm (conceptual schema): do nhu cầu cần chuẩn hoá các tri thức. ANSI
đưa ra lược đồ khái niệm để biểu diễn các tri thức trong một ứng dụng cụ thể. Hình 1.5
minh hoạ một hệ thống tích hợp với lược đồ khái niệm đồng nhất ở trung tâm. Mỗi vòng
tròn được dùng riêng cho một mục đích, nhưng tất cả đều tham chiếu đến lược đồ khái
niệm. Giao diện người dùng thực hiện truy vấn đến CSDL và thực hiện các chương trình
ứng dụng để cung cấp các dịch vụ, CSDL được chia xẻ cho nhiều chương trình ứng dụng.
Lược đồ khái niệm liên kết 3 vòng tròn lại với nhau bằng cách định nghĩa các thực thể
ứng dụng và mối liên hệ giữa chúng.
Hình 1.5 Lược đồ khái niệm là trái tim của hệ thống tích hợp
I.3 Một số đồ án xây dựng ontology
Ngô Ngọc Thơ
6
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
 Cyc: là một đồ án AI (Trí tuệ nhân tạo) nhằm kết hợp một ontology toàn diện với cơ sở tri
thức các tri thức phổ biến thường ngày với mục tiêu tạo ra một ứng dụng AI thực hiện
việc suy luận giống như con người. Nó mô tả toàn bộ tri thức nhân loại, là dự án phát
triển ontology lớn nhất từ trước đến nay. Đồ án này được bắt đầu từ năm 1984 bởi
Douglas Lenat tại MCC(Microelectronics and Computer Technology Corporation) và

phát triển bởi công ty Cycorp. Cyc chi tiết đến từng tiên đề và khái niệm. Các phần của
đồ án được phát hành dưới dạng các phiên bản OpenCyc. Phiên bản mới nhất OpenCyc
2.0 với cơ sở tri thức gồm 47,000 khái niệm và 306,000 sự kiện.
 ERD (The Electronic Dictionary Research): mô tả một tự điển với hơn 400 000 khái
niệm đến cả hai thứ tiếng Anh và Nhật. Mặc dù ERD có nhiều khái niệm hơn Cyc nhưng
nó không cung cấp chi tiết từng khái niệm nhiều như Cyc. Mục đích chính của ERD là :
“tất cả những gì một máy tính cần để hiểu hoàn toàn ngôn ngữ tự nhiên”. Nó gồm:
Word Dictionaries
General Vocabulary:
English 200,000 Words
Japanese 200,000 Words
Technical Terminology
English 100,000 Words
Japanese 100,000 Words
Concept Dictionary 400,000 Concepts
Classification
Descriptions
Co-Occurrence Dictionaries
English 300,000 Words
Japanese 300,000 Words
Bilingual Dictionaries
English-Japanese 300,000 Words
Japanese-English 300,000 Words
 WordNet: do George Miller (1995) và Fellbaum (1998) phát triển. Mô tả dạng và nghĩa
Ngô Ngọc Thơ
7
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
của 166 000 từ. WordNet không có nhiều khái niệm chi tiết như Cyc và ERD nhưng nó là

ontology được sử dụng phổ biến cho việc xử lý ngôn ngữ tự nhiên. Phiên bản WordNet
mới nhất WordNet 3.0 dữ liệu gồm 155,287 từ tổ chức trong 117,659 synset, tổng cộng
206,941 word-sense.
Ontology trong đề án Cyc được xem là ontology hình thức, còn ontology trong đề án
ERD và WordNet là ontology thuật ngữ.
2. Định nghĩa
 Theo triết học thì ontology được định nghĩa như sau: “ontology là một siêu hình học
nghiên cứu về sự tồn tại và hiện thân của tự nhiên” [Aristoteles].
 Theo tin học thì ontology có những định nghĩa như sau:
 Gruber (1993), “Ontology là một thuyết minh hình thức, rõ ràng của một nhận thức
chung”. Định nghĩa của ông được phân làm 4 khái niệm chính: mô hình trừu tượng của
hiện tượng (nhận thức), diễn đạt rỏ ràng bằng toán học (hình thức), các khái niệm và
quan hệ giữa chúng phải được định nghĩa một cách chính xác và rỏ ràng (rỏ ràng), tồn tại
một sự đồng thuận của những người sử dụng ontology (chung).
 Russell & Norving (1995), “Ontology là một mô tả hình thức của các khái niệm và quan
hệ mà có thể tồn tại trong một cộng đồng cụ thể”.
 Swartout (1996), “Ontology là một tập thuật ngữ có cấu trúc và thứ bậc để diễn tả một
phạm vi cụ thể và có thể được sử dụng như là bộ khung của cơ sở tri thức”.
 Fensel (2000), “Ontology là một mô tả một cách phổ biến, có khả năng dùng chung và
hình thức của các khái niệm quan trọng trong một phạm vi cụ thể”.
 John F. Sowa (2000), “Ontology là một bản liệt kê các kiểu của những gì mà tồn tại trong
miền D từ khía cạnh mà người sử dụng ngôn ngữ L để mô tả D. Các kiểu của ontology
gồm: vị từ, ý nghĩa từ, hay khái niệm và quan hệ của ngôn ngữ L khi mô tả về D”.
Ngô Ngọc Thơ
8
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
 Noy & McGuinness (2001), “Ontology là một mô tả hình thức và rõ ràng của các khái
niệm trong phạm vi cụ thể, các thuộc tính của khái niệm mô tả đặc tính và tính chất của

khái niệm, các ràng buộc của thuộc tính”.
 Fonseca (2002), “Ontology là một lý thuyết mà sử dụng một bộ từ vựng cụ thể để mô tả
thực thể, thuộc tính và các thao tác trong một phạm vi cụ thể”.
 Enrico Franconi (2002), “Ontology là một nhận thức hình thức về thế giới”.
 Starlab (2003), “Ontology bao hàm các thuật ngữ, xác định ý nghĩa của và mối quan hệ
giữa chúng”.
 A. Maedche & B. Motik & L. Stojanovic (2003), “Ontology là mô hình khái niệm trong
phạm vi ứng dụng nhất định, có thể chia sẻ và thực thi trên máy tính”.
 Trong khoa học máy tính và thông tin, ontology được định nghĩa là một biểu diễn hình
thức cho tập hợp các khái niệm thuộc một lĩnh vực nào đó và quan hệ giữa những khái
niệm này. Nói cụ thể hơn, ontology cung cấp một bộ từ vựng chung dùng để mô tả một
lĩnh vực – nghĩa là một loại đối tượng hay khái niệm hiện hữu, cùng với các thuộc tính và
quan hệ giữa chúng – và lời đặc tả cho nghĩa của những từ trong bộ từ vựng. Dựa vào độ
chính xác của đặc tả này, khái niệm ontology bao gồm một số mô hình dữ liệu hay mô
hình khái niệm, ví dụ, các bảng phân loại (classifications), từ điển chuyên đề (thesauri),
lược đồ cơ sở dữ liệu (database schemas), lý thuyết được tiên đề hoá đầy đủ (fully
axiomatized theories), v.v… Ontology có khuynh hướng xuất hiện ở mọi nơi. Ontology
được sử dụng trong các lĩnh vực trí tuệ nhân tạo, web ngữ nghĩa, kỹ thuật phần mềm,
sinh-y tin học, khoa học thư viện và kiến trúc thông tin như là một dạng biểu diễn tri thức
về thế giới hay một phần của nó. Ontology là một giải pháp đơn giản nhưng hiệu quả cho
nhiều ứng dụng như tích hợp thông tin, các hệ thống ngang hàng, thương mại điện tử, các
dịch vụ web ngữ nghĩa, các mạng xã hội, v.v… Chúng thực sự là những phương tiện thiết
thực để khái niệm hoá những thứ cần được biểu diễn theo định dạng của máy tính.
 Theo các định nghĩa trên một ontology phải có những tính chất sau:
 Được sử dụng để mô tả một phạm vi ứng dụng cụ thể.
 Các khái niệm và quan hệ được định nghĩa rõ ràng trong phạm vi ứng dụng đó.
 Có cơ chế tổ chức các khái niệm (thường là phân cấp).
Ngô Ngọc Thơ
9
Tháng 1/2013

[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
 Có sự đồng thuận về mặt ý nghĩa các khái niệm của những người cùng sử dụng ontology.
3. Các thành phần của ontology
Các ontology hiện nay đều có nhiều điểm tương tự về mặt cấu trúc, bất kể ngôn ngữ được
dùng để biểu diễn. Hầu hết các ontology đều mô tả các đối tượng (thể hiện), lớp (khái
niệm), thuộc tính và các quan hệ.
3.1 Cá thể (Individual) – Thể hiện
Các cá thể là các thành phần cơ bản, nền tảng của một ontology. Các cá thể trong
một ontology có thể bao gồm các đối tượng cụ thể như con người, động vật, cái
bàn… cũng như các cá thể trừu tượng như các thành viên hay các từ (mặc dù có một
vài khác biệt về ý kiến liệu các con số vài từ là lớp hay là đối tượng). Một ontology có
thể không cần bất kỳ một cá thể nào, nhưng một trong những lý do chính của một
ontology là để cung cấp một ngữ nghĩa của việc phân lớp các cá thể, mặc dù các cá
thể này không thực sự là một phần của ontology.
Ví dụ: tam giác được kí hiệu ABC là thể hiện của khái niệm tam giác.
3.2.Lớp (Class) – Khái niệm
Các lớp là các nhóm, tập hợp các đối tượng trừu tượng. Chúng có thể chứa các cá thể, các
lớp khác, hay là sự phối hợp của cả hai.
Các ontology biến đổi tuỳ thuộc vào cấu trúc và nội dung của nó: Một lớp có thể chứa
các lớp con, có thể là một lớp tổng quan (chứa tất cả mọi thứ), có thể là lớp chỉ chứa
những cá thể riêng lẻ, Một lớp có thể xếp gộp vào hoặc bị xếp gộp vào bởi các lớp khác.
Mối quan hệ xếp gộp này được sử dụng để tạo ra một cấu trúc có thứ bậc các lớp, thường
là với một lớp thông dụng nhất kiểu Thing ở trên đỉnh và các lớp rất rõ ràng ở phía dưới
cùng.
Một số ví dụ của lớp:
• Person, lớp của tất cả con người, hay các đối tượng trừu tượng có thể được mô tả bởi các
tiêu chuẩn làm một con người.
• Vehicle, lớp của tất cả xe cộ, hay các đối tượng trừu tượng có thể được mô tả bởi các tiêu
chuẩn làm một chiếc xe.

• Car, lớp của tất cả xe hơi, hay các đối tượng trừu tượng có thể được mô tả bởi các tiêu
chuẩn làm một chiếc xe hơi.
Ngô Ngọc Thơ
10
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
• Class, biểu diễn lớp tất cả các lớp, hay các đối tượng trừu tượng có thể được mô tả bởi
các tiêu chuẩn để làm một lớp.
• Thing, biểu diễn lớp tất cả mọi thứ, hay các đối tượng trừu tượng có thể được mô tả bởi
các tiêu chuẩn để làm một thứ gì đó (và không phải không-là-gì cả).
Một lớp có thể gộp nhiều lớp hoặc được gộp vào lớp khác; một lớp xếp gộp vào lớp khác
được gọi là lớp con (hay kiểu con) của lớp gộp (hay kiểu cha). Ví dụ, Vechicle gộp Car,
bởi vì bất cứ thứ gì là thành viên của lớp sau cũng đều là thành viên của lớp trước. Quan
hệ xếp gộp được dùng để tạo nên một cấu trúc phân cấp các lớp, thông thường có một lớp
tổng quát lớn nhất chẳng hạn Anything nằm ở trên cùng và những lớp rất cụ thể như 2002
Ford Explorer nằm ở dưới cùng. Hệ quả cực kỳ quan trọng của quan hệ xếp gộp là tính
kế thừa của các thuộc tính từ lớp cha đến lớp con. Do vậy, bất cứ thứ gì hiển nhiên đúng
với một lớp cha cũng hiển nhiên đúng với các lớp con của nó. Trong một số ontology,
một lớp chỉ được cho phép có một lớp cha, nhưng trong hầu hết các ontology, các lớp
được cho phép có một số lượng lớp cha bất kỳ và trong trường hợp sau tất cả các thuộc
tính hiển nhiên của từng lớp cha được kế thừa bởi lớp con. Do đó một lớp cụ thể của lớp
thú (HouseCat) có thể là một con của lớp Cat và cũng là một con của lớp Pet.
3.3 Thuộc tính (Property)
Các đối tượng trong một ontology có thể được mô tả bằng cách liên hệ chúng với những
thứ khác, thường là các mặt hay bộ phận. Những thứ được liên hệ này thường được gọi là
thuộc tính, mặc dù chúng có thể là những thứ độc lập. Một thuộc tính có thể là một lớp
hay một cá thể. Kiểu của đối tượng và kiểu của thuộc tính xác định kiểu của quan hệ giữa
chúng. Một quan hệ giữa một đối tượng và một thuộc tính biểu diễn một sự kiện đặc thù
cho đối tượng mà nó có liên hệ. Các thuộc tính được sử dụng để lưu trữ các thông tin mà

đối tượng có thể có. Ví dụ đối tượng Sinh Viên có các thuộc tính sau:
• <Có tên> Nguyễn Văn A;
• <Có mã số sinh viên> 07520340;
• <Có quên quán> Bến Tre;
• <là sinh viên khoa> Khoa Học Máy Tính;
• …
Giá trị của một thuộc tính có thể có các kiểu dữ liệu phức tạp.
Các ontology chỉ mang đầy đủ ý nghĩa nếu các khái niệm có liên hệ với các khái niệm
khác (các khái niệm đều có thuộc tính). Nếu không rơi vào trường hợp này, thì hoặc ta sẽ
có một phân loại (nếu các quan hệ bao hàm tồn tại giữa các khái niệm) hoặc một từ điển
có kiểm soát. Những thứ này đều hữu ích nhưng không được xem là ontology.
3.4 Quan hệ (Relation)
Quan hệ giữa các đối tượng trong một ontology cho biết các đối tượng liên hệ với đối
tượng khác như thế nào. Thông thường một quan hệ là của một loại (hay lớp cụ thể nào
Ngô Ngọc Thơ
11
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
đó chỉ rõ trong ngữ cảnh nào đối tượng được liên hệ với đối tượng khác trong ontology.
Ví dụ trong ontology chứa khái niệm Ford Explorer và khái niệm Ford Bronco có thể
được liên hệ bởi một quan hệ loại <được định nghĩa là một con của>. Phát biểu đầy đủ
của sự kiện như sau:
 Ford Explorer được định nghĩa là một con của : Ford Bronco
Điều này cho ta biết Explorer là mô hình thay thế cho Bronco. Ví dụ này cũng minh họa
rằng quan hệ có cách phát biểu trực tiếp. Phát biểu ngược biểu diễn cùng một sự kiện
nhưng bằng một ngữ nghịch đảo trong ngôn ngữ tự nhiên. Phần lớn sức mạnh của
ontolgy nằm ở khả năng diễn đạt quan hệ. Tập hợp các quan hệ cùng nhau mô tả ngữ
nghĩa của domain. Tập các dạng quan hệ được sử dụng (lớp quan hệ) và cây phân loại thứ
bậc của chúng thể hiện sức mạnh diễn đạt của ngôn ngữ dùng để biểu diễn ontology.

Hình 1.6 Ví dụ ontology Lịch sử Việt Nam
Ví dụ, ta đã thấy lớp Các Triều đại phong kiến là lớp con của Lịch sử chính trị Việt Nam
và lớp Lịch sử chính trị Việt Nam lại là lớp con của Lịch sử Việt Nam. Sự xuất hiện của
quan hệ ‘là lớp con của’ tạo ra một cấu trúc phân cấp thứ bậc; dạng cấu trúc cây này (hay
tổng quát hơn, là tập có thứ tự từng phần) mô tả rõ ràng cách thức các đối tượng liên hệ
Ngô Ngọc Thơ
12
Lịch Sử Việt Nam
Các cuộc khởi nghĩa
Các Triều đại phong
kiến
Lịch Sử Kinh Tế Việt
Nam
Lịch Sử Quân Sự Việt
Nam
Lịch Sử Chính Trị Việt
Nam
Các thành phần kinh tế
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
với nhau. Trong cấu trúc này, mỗi đối tượng là ‘con’ của một ‘lớp cha’ (Một số ngôn ngữ
giới hạn quan hệ là lớp con của trong phạm vi một cha cho mọi nút, nhưng đa số thì
không như thế). Một dạng quan hệ phổ biến khác là quan hệ meronymy, gọi là ‘bộ phận
của’, biểu diễn làm thế nào các đối tượng kết hợp với nhau đề tạo nên đối tượng tổng
hợp. Ví dụ, nếu ta mở rộng ontology trong ví dụ để chứa thêm một số khái niệm như Các
vị vua, ta sẽ nói rằng “Các vị vua được định nghĩa là là vua của các Triều đại phong kiến”
. Nếu đưa quan hệ meronymy vào ontology này, ta sẽ thấy rằng cấu trúc cây đơn giản và
nhẹ nhàng trước đó sẽ nhanh chóng trở nên phức tạp và cực kỳ khó hiểu. Điều này không
khó lý giải; một lớp nào đó được mô tả rằng luôn luôn có một thành viên là bộ phận của

một thành viên thuộc lớp khác thì lớp này cũng có thể có một thành viên là bộ phận của
lớp thứ ba. Kết quả là các lớp có thể là bộ phận của nhiều hơn một lớp. Cấu trúc này
được gọi là đồ thị chu trình có hướng. Ngoài những quan hệ chuẩn như ‘là lớp con của’
và ‘được định nghĩa là bộ phận của’, ontology thường chứa thêm một số dạng quan hệ
làm trau chuốt hơn ngữ nghĩa mà chúng mô hình hóa. Ontology thường phân biệt các
nhóm quan hệ khác nhau. Ví dụ nhóm các quan hệ về:
 Quan hệ giữa các lớp
 Quan hệ giữa các thực thể
 Quan hệ giữa một thực thể và một lớp
 Quan hệ giữa một đối tượng đơn và một tập hợp
 Quan hệ giữa các tập hợp.
Các dạng quan hệ đôi khi đặc thù chuyên ngành và do đó chỉ sử dụng để lưu trữ các dạng
sự kiện đặc thù hoặc trả lời cho những loại câu hỏi cụ thể. Nếu định nghĩa của dạng quan
hệ được chứa trong một ontology thì ontology này định ra ngôn ngữ định nghĩa ontology
cho chính nó. Một ví dụ về ontology định nghĩa các dạng quan hệ của chính nó và phân
biệt các nhóm quan hệ khác nhau là ontology Gellish.
Ví dụ, trong lĩnh vực xe ô tô, ta cần quan hệ ‘được sản xuất tại’ để cho biết xe được lắp
ráp tại chỗ nào. Như vậy, Ford Explorer được sản xuất tại Louisville. Ontology có thể
cũng biết được Louisville ‘tọa lạc tại’ Kentucky và Kentucky ‘được định nghĩa là’ một
bang và ‘là bộ phận của’ Hoa Kỳ. Phần mềm sử dụng ontology này sẽ có thể trả lời một
câu hỏi như ‘những xe hơi nào được sản xuất tại Hoa Kỳ?”
4. Phân loại Ontology
Theo cách phân loại của John F. Sowa, có 2 loại:
• Ontology hình thức (formal ontology): là ontology mô tả các khái niệm một
cách chi tiết đến các tiên đề và định nghĩa mà không quan tâm đến các mô tả này có thực
hiện dễ dàng trong máy tính hay không. ontology hình thức thường có xu hướng nhỏ,
Ngô Ngọc Thơ
13
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG

BIỂU DIỄN TRI THỨC]
nhưng các tiên đề và định nghĩa thường rất phức tạp trong suy luận và tính toán. Những
ontology này thường do các nhà triết học thiết kế.
• Ontology thuật ngữ (terminological ontology): là ontology mô tả các khái
niệm theo hướng tiên đề và định nghĩa được phát biểu dạng logic hoặc trong một vài
ngôn ngữ hướng đối tượng để cho máy tính thực hiện việc chuyển đổi theo dạng logic.
Dạng logic này không có sự hạn chế về việc phát biểu các tiên đề và định nghĩa và cho
máy tính thực hiện dễ dàng. Các tiên đề và định nghĩa chỉ mô tả đến các vấn đề mà ứng
dụng quan tâm. Ontology thuật ngữ lớn, nhưng các tiên đề và định nghĩa thường rất dễ
dàng trong suy luận và tính toán. Những ontology này thường do các nhà tin học thiết kế.
Theo cách phân loại của D.Fensel, có 7 loại:
• Knowledge Representation ontology: dựa trên các cách biểu diễn tri thức
truyền thống.
Ví dụ: Frame-Ontology.
• General/Common ontology: từ vựng liên quan đến mọi thứ, sự kiện, thời
gian, không gian,
Ví dụ: ontology về bảng trao đổi giữa meter và inch.
• Meta-ontology: định nghĩa các ontology.
Ví dụ: Registry Ontology, dùng để quản lý các ontology khác.
• Domain ontology: từ vựng của các khái niệm trong trong một phạm vi.
Ví dụ: ontology về lý thuyết hoặc các nguyên lý cơ bản của một miền.
• Task ontology: hệ thống các từ vựng của các thuật ngữ để giải quyết các vấn
đề kết hợp liên quan đến nhiệm vụ mà có thể cùng hoặc không cùng phạm vi ứng dụng cụ
thể.
Ngô Ngọc Thơ
14
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
Ví dụ: ontology về kế hoạch phân công nhiệm vụ.

• Domain-task ontology: task ontology được sử dụng lại trong một phạm vi ứng
dụng cụ thể.
Ví dụ: ontology về kế hoạch phân công nhiệm vụ của các chuyến bay.
• Application ontology: chứa các kiến thức cần thiết của một ứng dụng trong
phạm vi ứng dụng nhất định.
Ví dụ: ontology hình học.
5. Chu trình phát triển ontology
Chu trình phát triển của ontology từ lúc tạo ra đến lúc tiến hoá được trình bày ở hình 1.7
gồm 6 giai đoạn.
Hình 1.7 Chu trình phát triển ontology
Creating (tạo): tạo mới cấu trúc ontology hoặc phát triển các khái niệm mới từ ontology
sẵn có.
Populating (mở rộng): tạo ra các instance của ontology.
Deploying (triển khai): đưa ontology vào sử dụng dựa trên việc đã tạo ra cấu trúc và các
thể hiện của nó.
Validating (kiểm tra tính hợp lệ), maintaining (bảo trì), evolving (tiến hoá): cũng
giống như các thành phần của các hệ thống phức tạp khác. Khi môi trường thay đổi ta
Ngô Ngọc Thơ
15
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
cũng phải kiểm tra tính hợp lệ của ontology, tiến hành bảo trì và tiến hoá ontology.
6. Phương pháp xây dựng ontology
Quy trình phát triển Ontology là một quy trình gồm nhiều bước, tuy nhiên vẫn chưa có
một phương pháp chuẩn hóa nào để phát triển các ontologies. Quy trình phát triển gồm 7
bước do Stanford Center for Biomedical Informatics Research đưa ra (đây là nhóm phát
triển phần mềm Protégé để trình diễn và xoạn thảo Ontology).
Bước 1: Xác định lĩnh vực và phạm vi của Ontology
Trong giai đoạn này cần xác định mục đích của việc xây dựng ontology là gì? Phục vụ

đối tượng nào? Ontology sắp xây dựng cần có đặc điểm gì, liên quan đến lĩnh vực, phạm
vi nào. Quá trình khai thác, quản lý và bảo trì ontology được thực hiện ra sao?
Bước 2: Xem xét việc sử dụng lại các ontology có sẵn
Cấu trúc của một Ontology bao gồm 3 tầng: tầng trừu tượng (Abstract), tầng miền xác
định (Domain) và tầng mở rộng (Extension). Trong đó tầng trừu tượng có tính tái sử
dụng rất cao, tầng miền xác định có thể tái sử dụng trong một lĩnh vực nhất định. Cộng
đồng Ontology cũng đang lớn mạnh và có rất nhiều Ontology đã được tạo ra, với tâm
huyết của nhiều chuyên gia. Do đó trước khi bắt đầu xây dựng ontology, cần xét đến khả
năng sử dụng lại các ontology đã có. Nếu có thể sử dụng lại một phần các ontology đã
có, chi phí bỏ ra cho quá trình xây dựng ontology sẽ giảm đi rất nhiều.
Bước 3: Liệt kê các thuật ngữ quan trọng
Ontology được xây dựng trên cơ sở các khái niệm trong một lĩnh vực cụ thể, vì vậy khi
xây dựng ontology cần bắt đầu từ các thuật ngữ chuyên ngành để xây dựng thành các lớp
trong ontology tương ứng. Tất nhiên không phải thuật ngữ nào cũng đưa vào ontology, vì
chưa chắc đã định vị được cho thuật ngữ đó. Do đó cần phải liệt kê các thuật ngữ, để xác
định ngữ nghĩa cho các thuật ngữ đó, cũng như cân nhắc về phạm vi của ontology. Việc
liệt kê các thuật ngữ còn cho thấy được phần nào tổng quan về các khái niệm trong lĩnh
vực đó, giúp cho các bước tiếp theo được thuận lợi.
Bước 4: Xác định các lớp và phân cấp của các lớp
Công việc xác định các lớp không chỉ đơn giản là tiến hành tìm hiểu về ngữ nghĩa của
các thuật ngữ đã có để có được các mô tả cho thuật ngữ đó, mà còn phải định vị cho các
lớp mới, loại bỏ ra khỏi ontology nếu nằm ngoài phạm vi của ontology hay hợp nhất với
các lớp đã có nếu có nhiều thuật ngữ có ngữ nghĩa như nhau (đồng nghĩa, hay đa ngôn
ngữ). Ngoài ra không phải thuật ngữ nào cũng mang tính chất như một lớp.
Một công việc cần phải tiến hành song song với việc xác định các lớp là xác định phân
cấp của các lớp đó. Việc này giúp định vị các lớp dễ dàng hơn.
Có một số phương pháp tiếp cận trong việc xác định phân cấp của các lớp:
• Phương pháp từ trên xuống (top-down): bắt đầu với định nghĩa của các lớp tổng quát
nhất trong lĩnh vực và sau đó chuyên biệt hóa các khái niệm đó. Ví dụ: Trong Ontology
Ngô Ngọc Thơ

16
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
về quản lý nhân sự, ta bắt đầu với lớp Người, sau đó chuyên biệt hóa lớp Người đó bằng
cách tạo ra các lớp con của lớp Người như : Kỹ sư, Công nhân, Bác sỹ,… Lớp Kỹ sư
cũng có thể chuyên biệt hóa bằng cách tạo ra các lớp con như Kỹ sư CNTT, Kỹ sư điện,
Kỹ sư cơ khí, …
• Phương pháp từ dưới lên (bottom-up): bắt đầu với định nghĩa của các lớp cụ thể nhất,
như các lá trong cây phân cấp. Sau đó gộp các lớp đó lại thành các khái tổng quát hơn.
Ví dụ: ta bắt đầu với việc định nghĩa các lớp như: nhân viên lễ tân, nhân viên vệ sinh,
nhân viên kỹ thuật. Sau đó tạo ra một lớp chung hơn cho các lớp đó là lớp nhân viên.
• Phương pháp kết hợp: kết hợp giữa phương pháp từ trên xuống và từ dưới lên: bắt đầu
từ định nghĩa các lớp dễ thấy trước và sau đó tổng quát hóa và chuyên biệt hóa các lớp
đó một cách thích hợp. Ví dụ ta bắt đầu với lớp nhân viên trước, là thuật ngữ hay gặp
nhất trong quản lý nhân sự. Sau đó chúng ta có thể chuyên biệt hóa thành các lớp con:
nhân viên lễ tân, nhân viên vệ sinh,… hoặc tổng quát hóa lên thành lớp Người.
Bước 5: Xác định các thuộc tính
Để xác định thuộc tính cho các lớp, ta quay trở lại danh sách các thuật ngữ đã liệt kê
được. Hầu hết các thuật ngữ còn lại (sau khi đã xác định lớp) là thuộc tính của các lớp
đó. Với mỗi thuộc tính tìm được, ta phải xác định xem nó mô tả cho lớp nào. Các thuộc
tính đó sẽ trở thành thuộc tính của các lớp xác định. Ví dụ lớp Người có các thuộc tính
sau: Họ, Tên, Ngày sinh, Giới tính, Nghề nghiệp, Địa chỉ, Điện thoại,…
Bước 6: Xác định giới hạn của các thuộc tính (lực lượng, kiểu giá trị)
Các thuộc tính có thể có nhiều khía cạnh khác nhau: như kiểu giá trị, các giá trị cho
phép, số các thuộc tính (lực lượng), và các đặc trưng khác mà giá trị của thuộc tính có
thể nhận. Ví dụ: “Năm sinh” của một “nhân viên” chỉ có duy nhất và là số nguyên, có
thể nhận giá trị từ 1948 đến 1990. Cần phải xác định các ràng buộc cho một thuộc tính
càng chặt chẽ càng tốt, để tránh trường hợp nhập dữ liệu sai, dẫn đến đổ vỡ của các ứng
dụng sử dụng Ontology này.

Bước 7: Tạo các thể hiện / thực thể
Bước cuối cùng là tạo ra các thể hiện của các lớp trong sự phân cấp. Việc tạo thể hiện
cho một lớp là quá trình điền các thông tin vào các thuộc tính của lớp đó.
II. Ngôn ngữ ontology
1. Định nghĩa
Ngôn ngữ ontology là ngôn ngữ dùng để mô tả các thành phần của ontology.
Để mô tả mọi thứ về các khái niệm của ontology đòi hỏi phải có một ngôn ngữ chung
Ngô Ngọc Thơ
17
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
nhất để diễn đạt. Có 2 loại ngôn ngữ chung nhất:
• Ngôn ngữ tự nhiên: mọi thứ kinh nghiệm của con người đều có thể diễn đạt
được bằng một ngôn ngữ tự nhiên (Ví dụ: tiếng Anh, Pháp, Việt Nam, …). Nó là một siêu
ngôn ngữ có thể diễn đạt các ngôn ngữ khác như: ký số toán học, ngôn ngữ lập trình…
• Ngôn ngữ dựa trên logic: mọi thứ được phát biểu chính xác, rõ ràng trong bất
kì ngôn ngữ tự nhiên nào đều có thể biểu diễn được trong logic. Nhiều thứ khó có thể
nắm được ý nghĩa một cách rõ ràng thì khó có thể biểu diễn được trong logic (Ví dụ: tình
yêu, thơ ca, câu nói đùa …). Tuy nhiên, bất cứ thứ gì được thực hiện trên máy tính bằng
ngôn ngữ lập trình thì đều có thể biểu diễn trong logic. Và để giảm thiểu tính hình thức
của logic người ta sử dụng một số ngôn ngữ dựa trên logic.
Các ontology thường dùng cách biểu diễn các khái niệm bằng các ngôn ngữ dựa trên
logic.
2. Các ngôn ngữ biểu diễn thường dùng trong ontology
II.1 Đồ thị khái niệm – Conceptual Graphs (CGs)
a. Khái niệm:
Một đồ thị khái niệm là 1 đồ thị hữu hạng, liên thông, và có hướng. Đồ thị này gồm các
cung định hướng và 2 loại đỉnh là đỉnh khái niệm và đỉnh quan hệ giữa các khái niệm.
Đỉnh khái niệm dùng để biểu diễn các khái niệm cụ thể (TV,con người,…) hay trừu tượng

(ghét, yêu,…). Đỉnh khái niệm được biểu diễn bằng hình chữ nhật có gán nhãn là khái
niệm.
Đỉnh quan hệ: được biểu diễn bằng hình elip (tròn hay bầu dục) dùng để chỉ ra quan hệ
giữa các khái niệm có nối đến nó.
 Chú ý:
• Một quan hệ được biểu hiện bằng một cung hướng về đỉnh quan hệ và 1 cung hướng ra từ
đỉnh quan hệ đó. Nếu quan hệ chỉ có một đối số thì có thể bỏ qua chiều của cung (đầu
mũi tên). Nếu một quan hệ có nhiều hơn 2 đối số, chiều của cung (đầu mũi tên) được thay
Ngô Ngọc Thơ
18
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
thế bằng các số nguyên từ 1,2,…,n. Như vậy một quan hệ có thể có nhiều cung, trong
trường hợp đó các cung sẽ được đánh số thứ tự.
• Trong đồ thị khái niệm chỉ có khác loại mới nối được với nhau.
• Mỗi đồ thị khái niệm biểu diễn một mệnh đề đơn.
• Cơ sở tri thức chứa nhiều đồ thị khái niệm.
Ví dụ: Ta biểu diễn câu “A cat is on a mat.” bằng đồ thị khái niệm với hình thức DF
(Display Form)
Ta cũng có thể biểu diễn bằng kí hiệu văn bản với hình thức LF (Linear Form) như sau:
[Cat] – (On) – [Mat]
Ngoài ra còn có hình thức CG Interchange Form (CGIF), được biểu diễn như sau:
[Cat: *x] [Mat: *y] (On ?x ?y)
b. Tính chất
Định lý 1:
Mỗi đỉnh quan hệ có một hoặc nhiều cung và các cung này phải được nối đến một khái
niệm. Nếu quan hệ có n cung thì ta gọi quan hệ đó là quan hệ n-adic và mỗi cung được
đánh dấu từ 1,2,…,n.
Đa số các quan hệ khái niệm phổ biến thường là quan hệ ngôi (bậc) 2 hay 2-adic (có 2

cung quan hệ), nhưng ta cũng có thể định nghĩa được những quan hệ có n cung. Theo
cách định nghĩa này, đối với những quan hệ bậc 2 thì cung thứ 1 là cung nối từ khái niệm
đến quan hệ khái niệm và cung thứ 2 là cung nối từ quan hệ khái niệm đó 1 khái niệm
khác.
Ngô Ngọc Thơ
19
On
Mat
Cat
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
Tiền đề 1:
Cho Ty là tập các loại và một hàm phân loại type, từ đó sắp xếp các khái niệm và các
quan hệ khái niệm vào Ty.
• Nếu type(a)=type(b), thì a và b cùng loại.
• Tập các loại cũng có sự phân cấp: nếu type(a)≤type(b), thì a là common-subtype của b và
b được gọi là common-supertype.
• Các loại khái niệm và quan hệ khái niệm được phân chia rõ ràng, những tập con không
so sánh được của Ty : nếu a là 1 khái niệm và r là 1 quan hệ khái niệm thì a và r không
bao giờ là cùng loại hoặc chỉ có thể a là subtype của r hoặc ngược lại.
• Ta gọi T là supertype của mọi type và là subtype của mọi type.
Tiền đề 2:
Trong đồ thị khái niệm, mỗi đỉnh quan hệ biểu diễn cho một cá thể đơn lẽ thuộc một loại
nào đó. Để nói lên quan hệ giữa “loại-cá thể”, mỗi đỉnh khái niệm được qui định cách
gán nhãn là: “Loại: tên cá thể”. Tên cá thể có thể là:
• Một tên nào đó, như : Mary, Jonh,…
• Một khoá để phân biệt, được viết theo cú pháp #khoá, như: #21212,
• Có thể dùng dấu sao (*) để chỉ ra một cá thể chưa xác định, như: *,X*, Nh*,….
Trường hợp 1,2 khái niệm được gọi là khái niệm cá thể, trường hợp 3 là khái niệm tổng

quát.
Tiền đề 3:
Cho một quan hệ 2 ngôi có nhãn là Name (tên). Nếu một quan hệ thuộc loại Name xuất
hiện trong đồ thị khái niệm, thì khái niệm nối đến quan hệ đó phải là con của loại Word
(từ) và khái niệm nối từ quan hệ đến phải là con của loại Entity (thực thể). Nếu khái niệm
thứ 2 là cá thể thì khái niệm thứ 1 được gọi là tên của cá thể đó.
Ví dụ:
[Mary] -> (Name) -> [Person:#122]
Ta nói “Mary” là tên của 1 người. Nếu trong bối cảnh chỉ có 1 người có tên là Mary thì
đồ thị có thể rút ngắn lại là: [Person:Mary].
Ngô Ngọc Thơ
20
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
Định lý 2:
Một đồ thị hình sao là một đồ thị khái niệm gồm 1 đỉnh quan hệ và các khái niệm đều có
cung nối với quan hệ đó.
Định lý 3:
Hai khái niệm a và b có thể kết hợp với nhau nếu :
• a và b cùng loại: type(a)=type(b)
• Tên cá thể (referent) của a bằng tên cá thể (referent ) của b : referent(a)=referent(b) hoặc
referent(a)=* hoặc referent(b)=*.
Từ đó, hai đồ thị khái niệm có thể nối với nhau để tạo thành 1 đồ thị khái niệm mới  có
đỉnh khái niệm C xuất hiện trên cả hai đồ thị X và Y, thì ta có thể nối X và Y qua đỉnh
chung C.
Chú ý: Hai đồ thị hình sao có quan hệ r và s có thể kết nối với nhau nếu r và s có cùng số
cung, type(r)=type(s), và khái niệm kết nối với cung thứ i của ra phải kết nối được với
khái niệm kết nối với cung thứ i của s.
Ví dụ:

Ta có G1:
G2:
Ngô Ngọc Thơ
21
PTNT
INSTANGT
HIT HAMMERPERSON: John
PIGGY BANK
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
Nối 2 đồ thị G1 và G2 ta có đồ thị G3:
Định lý 4:
Tạo ra đồ mới bằng cách : từ một đồ thị đã có , thay thế 1 đỉnh khái niệm bởi một đỉnh
khác cụ thể hơn như hai trường hợp:
• Một biến *, được thay thế bởi một biến khoá hay một tên của cá thể. Ví dụ: Person:* ->
Person:#223 hay Person:Mary.
• Một loại (type) được thay thế bởi một loại con của nó (subtype). Ví dụ: Động vật : lulu ->
Chó:lulu.
Ví dụ:
Ta có G5:
Ngô Ngọc Thơ
22
HAVE
PERSON: * 2 LEG
PTNT
INSTANGT
HIT HAMMERPERSON: John
PIGGY BANK
HAVE

2 LEG
PTNT
INSTANGT
HIT HAMMERBOY: John
PIGGY BANK
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]
G2:
Vì BOY là 1 subtype của type PERSON vì thế ta có G2 được biến đổi thành:
G6:
Định lý 5:
Nếu trên một đồ thị có hai đồ thị con giống nhau hoàn toàn thì chúng ta có thể bỏ đi một
để tạo ra một đồ thị mới có khả năng biểu diễn không thay đổi.
Ví dụ:
G7:
Ngô Ngọc Thơ
23
HAVE
PERSON: * 2 LEG
BOY: John
HAVE
2 LEG
BOY: John
HAVE
HAVE
2 LEG
2 LEG
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG

BIỂU DIỄN TRI THỨC]
Ta rút gọn G7 được:
Định lý 6:
Để thuận tiện cho việc biểu diễn các câu gồm nhiều mệnh đề, đồ thị khái niệm đã được
mở rộng để có thể chứa cả một mệnh đề trong một đỉnh khái niệm , lúc đó chúng ta gọi là
đỉnh mệnh đề. Vậy đỉnh mệnh đề là một đỉnh khái niệm có chứa một đồ thị khái niệm
khác.
Ví dụ ta biểu diễn câu: “John believes that Mary wants to marry a sailor.”
Proposition:
Ngô Ngọc Thơ
24
BOY: John
HAVE
2 LEG
Thme
Believe
Expr
Person: John
Person: Mary
Thme
Want
Expr
Situation:
Thme
Sailor
Mary
Agnt
Tháng 1/2013
[TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG
BIỂU DIỄN TRI THỨC]

Ngoài CGs, còn một số ngôn ngữ biểu diễn tương tự là Knowledge Interchange Format
(KIF), Conceptual Graph Interchange Form (CGIF),…
o Knowledge Interchange Format (KIF): được thiết kế nhằm dễ dàng phân tách
cú pháp và một tập kí tự giới hạn để có thể trao đổi được trong các hệ máy tích
khác nhau.
o Conceptual Graph Interchange Form (CGIF): là mức trung gian của CGs và
KIF. Giúp cho CGs và KIF được chuyển đổi dễ dàng thông qua CGIF.
CGs và KIF đều có thể dịch chuyển đổi cho nhau, bất cứ thứ gì biểu diễn trong CGs đều
có thể chuyển đổi thành KIF và ngược lại. CGs dễ cho người đọc và biểu diễn được nhiều
thứ nhưng khó cho máy tính thực hiện, còn KIF thì ngược lại. Vì vậy các ontology
thường biểu diễn đồng thời 2 cách trên.
II.2 Các ngôn ngữ biểu diễn ontology dựa trên web
II.2.1 Ngôn ngữ XML
XML viết tắt của eXtensible Markup Language được suy dẫn từ SGML (Standard General
Markup Language). Nó được phát triển bởi XML Working Group thuộc W3C và sắp tới
sẽ trở thành một ngôn ngữ chuẩn. Là một ngôn ngữ cho World Wide Web, những ưu điểm
chính của nó là: dễ dàng phân tích, cú pháp được định nghĩa tốt và con người có thể đọc
được. Có khá nhiều phần mềm phân tích và thao tác với XML. Nó cho phép người dùng
định nghĩa các nhãn và thuộc tính riêng của mình, định nghĩa cấu trúc, rút trích dữ liệu từ
các tài liệu và phát triển các ứng dụng để kiểm tra tính hợp lệ về mặt cấu trúc của một tài
liệu.
Khi dùng XML làm cơ sở cho một ngôn ngữ đặc tả ontology, các ưu điểm chính của nó
là:
o Định nghĩa đặc tả cú pháp chung bằng DTD (Document Type Definition).
o Con người có thể đọc được dữ liệu mã hoá bằng XML dễ dàng.
o Có thể được sử dụng để biểu diễn tri thức phân tán giữa một số trang web
o vì nó có thể được nhúng trong các trang web.
XML cũng có vài điểm bất lợi ảnh hưởng đến đặc tả ontology:
Ngô Ngọc Thơ
25

×