Tải bản đầy đủ (.docx) (22 trang)

Tiểu luận MÔN BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG Xây dựng ontology về sách

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (574.04 KB, 22 trang )

Đại Học Công Nghệ Thông Tin
Đại Học Quốc Gia Thành Phố Hồ Chí Minh
TP. HCM 12/2012
GVHD : PGS.TS.Đỗ Văn Nhơn
Học viên: Trương Lê Hưng
MS: CH1101089
Lớp: Cao Học khóa 6
Môn học: Biểu diễn tri thức và Ứng dụng
Lời mở đầu
Để biểu diễn tri thức ngày nay có rất nhiều phương pháp biểu diễn như:
biểu diễn tri thức bằng mạng ngữ nghĩa, biểu diễn tri thức bằng script, biểu diễn tri
thức bằng luật dẫn, biểu diễn tri thức bằng frame, biểu diễn tri thức bằng logic vị
từ, biểu diễn tri thức bằng ontology.
Trong nội dung bài thu hoạch này em xin phép được trình bày phương pháp
biểu diễn tri thức bằng Ontology và cách sử dụng công cụ Protégé để xây dựng
Ontology về sách.
Nội dung bài thu hoạch bao gồm :
Phần 1 : Cơ sở lý thuyết về ontology
Phần 2 : Xây dựng ontology về sách bằng công cụ protégé
Phần 3 : Kết quả đạt được và hướng phát triển.
Phần 4 : Tài liệu tham khảo
Môn học: Biểu diễn tri thức và Ứng dụng Trang 2
Mục lục
Môn học: Biểu diễn tri thức và Ứng dụng Trang 3
Phần I . Cơ sở lý thuyết về ontology
1. Tổng quan về ontology
a. Giới thiệu
Ontology trở thành một lĩnh vực nghiên cứu phổ biến có mặt trong
nhiều lĩnh vực từ xử lý ngôn ngữ tự nhiên, công nghệ tri thức, các hệ
thống trao đổi, tích hợp thông tin cho đến biểu diễn và quản lý tri thức.
Ontology được xây dựng để cung cấp các nguồn thông tin có ngữ


nghĩa mà máy tính có thể xử lý và thao tác được nhưng đồng thời vẫn có
thể giao tiếp được giữa người và phần mềm.
b. Định nghĩa
Ontology là một thuật ngữ có nguồn gốc từ Triết học diễn tả các thực
thể tồn tại trong tự nhiên và các mối quan hệ giữa chúng.
Trong khoa học máy tính, Ontology là biểu diễn hình thức của một tập
các khái niệm trong miền cụ thể và các mối quan hệ giữa các khái niệm.
Ontology được dùng để suy luận về các thuộc tính của miền, có thể được
dùng để định nghĩa miền.
Theo lý thuyết, Ontology là một đặc tả hình thức, rõ ràng của một
khái niệm được dùng chung. Một Ontology cung cấp một bảng từ vựng
dùng chung, bảng từ vựng này có thể được sử dụng để mô hình hóa một
miền, cung cấp các đối tượng và (hoặc) các khái niệm đang có, và các
thuộc tính cùng với các mối quan hệ của chúng.
Ontologies được sử dụng trong trí tuệ nhân tạo, Web ngữ nghĩa, công
nghệ phần mềm, trong tin sinh, thư viện học, và kiến trúc thông tin như
một dạng biểu diễn tri thức về thế giới hoặc một về một miền ứng dụng
cụ thể.
Ontology cung cấp một bộ từ vựng chung bao gồm các khái niệm, các
thuộc tính quan trọng và các định nghĩa về các khái niệm và các thuộc
tính này. Ngoài bộ từ vựng, Ontology còn cung cấp các ràng buộc, đôi
Môn học: Biểu diễn tri thức và Ứng dụng Trang 4
khi các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong
muốn của bộ từ vựng, nó được sử dụng trong một miền mà có thể được
giao tiếp giữa người và các hệ thống ứng dụng phân tán khác.
Việc tiếp cận ngữ nghĩa tài nguyên Web thông qua các Ontology thì
mềm dẻo hơn vì người sử dụng có thể lựa chọn bộ từ vựng và các ràng
buộc trong các Ontology. Ví dụ, các ứng dụng trong các miền khác nhau
có thể sử dụng các Ontology khác nhau. Đặc biệt, các Ontology có thể
được sử dụng để đặc tả ý nghĩa của các tài nguyên Web (thông qua các

chú thích) bằng cách xác nhận các tài nguyên như các trường hợp cụ thể
của một số khái niệm quan trọng và hay hoặc khẳng định các tài nguyên
có quan hệ với các tài nguyên khác thông qua một số thuộc tính quan
trọng đã định nghĩa trong các Ontology.
Từ vựng trong một Ontology có thể được biểu diễn bằng các khái
niệm và các quan hệ được đặt tên và các định nghĩa khái niệm có thể
được biểu diễn bằng các giới thiệu tương đương. Các giả định cơ sở có
thể được biểu diễn bằng các tiên đề khái niệm và quan hệ khái quát. Đôi
khi một Ontology tương ứng với một cơ sở tri thức logic mô tả. Một
Ontology cũng chứa các trường hợp của các khái niệm và các mối quan
hệ quan trọng của các cá thể này, nó được biểu diễn bằng các khẳng định
của logic mô tả
Môn học: Biểu diễn tri thức và Ứng dụng Trang 5
2. Các thành phần trong ontology
a. Các cá thể (Individuals)
Các cá thể là các thành phần cơ bản, nền tảng của một ontology. Các
cá thể trong một ontology có thể bao gồm các đối tượng cụ thể như con
người, động vật, cái bàn cũng như các cá thể trừu tượng như các thành
viên hay các từ. Một ontology có thể không cần bất kỳ một cá thể nào,
nhưng một trong những lý do chính của một ontology là để cung cấp một
ngữ nghĩa của việc phân lớp các cá thể, mặc dù các cá thể này không thực
sự là một phần của ontology.
b. Các lớp (Classes) – khái niệm
Các lớp là các nhóm, tập hợp các đối tượng trừu tượng. Chúng có thể
chứa các cá thể, các lớp khác, hay là sự phối hợp của cả hai.
Các ontology biến đổi tuỳ thuộc vào cấu trúc và nội dung của nó:
Một lớp có thể chứa các lớp con, có thể là một lớp tổng quan (chứa tất
cả mọi thứ), có thể là lớp chỉ chứa những cá thể riêng lẻ, Một lớp có thể
xếp gộp vào hoặc bị xếp gộp vào bởi các lớp khác. Mối quan hệ xếp gộp
này được sử dụng để tạo ra một cấu trúc có thứ bậc các lớp, thường là với

một lớp thông dụng nhất kiểu Thing ở trên đỉnh và các lớp rất rõ ràng ở
phía dưới cùng.
Ví dụ: Sách, Người, Tác_giả, Nhà_sách
c. Các thuộc tính (Properties)
Các đối tượng trong ontology có thể được mô tả thông qua việc khai
báo các thuộc tính của chúng. Mỗi một thuộc tính đều có tên và giá trị
của thuộc tính đó. Các thuộc tính được sử dụng để lưu trữ các thông tin
mà đối tượng có thể có. Ví dụ, đối với một quyển sách có thể có các
thuộc tính: tên, ngày_xuất_bản, giá_bìa, chiều_rộng
Giá trị của một thuộc tính có thể có các kiểu dữ liệu phức tạp.
d. Quan hệ (Relation)
Môn học: Biểu diễn tri thức và Ứng dụng Trang 6
Một trong những ứng dụng quan trọng của việc sử dụng các thuộc tính
là để mô tả mối liên hệ giữa các đối tượng trong ontology. Một mối quan
hệ là một thuộc tính có giá trị là một đối tượng nào đó trong ontology.
Một kiểu quan hệ quan trọng là kiểu quan hệ xếp gộp (subsumption).
Kiểu quan hệ này mô tả các đối tượng nào là các thành viên của các
lớp nào của các đối tượng.
Hiện tại, việc kết hợp các ontology là một tiến trình được làm phần
lớn là thủ công, do vậy rất tốn thời gian và đắt đỏ. Việc sử dụng các
ontology là cơ sở để cung cấp một định nghĩa thông dụng của các thuật
ngữ cốt lõi có thể làm cho tiến trình này trở nên dễ quản lý hơn. Hiện
đang có các nghiên cứu dựa trên các kỹ thuật sản sinh để nối kết các
ontology, tuy nhiên lĩnh vực này mới chỉ hiện hữu về mặt lý thuyết.
3. Ngôn ngữ OWL
Web Ontology Language (OWL) là ngôn ngữ đánh dấu được sử dụng
để xuất bản và chia sẻ dữ liệu sử dụng các ontology trên Internet. OWL
là một bộ từ vựng mở rộng của khung mô tả tài nguyên (RDF) và được
kế thừa từ ngôn ngữ DAML+OIL Web ontology – một dự án được hỗ trợ
bởi W3C. OWL biểu diễn ý nghĩa của các thuật ngữ trong các từ vựng và

mối liên hệ giữa các thuật ngữ này để đảm bảo phù hợp với quá trình xử
lý bởi các phần mềm.
OWL được xem như là một kỹ thuật trọng yếu để cài đặt cho
Semantic Web trong tương lai. OWL được thiết kế đặc biệt để cung cấp
một cách thức thông dụng trong việc xử lý nội dung thông tin của Web.
Ngôn ngữ này được kỳ vọng rằng sẽ cho phép các hệ thống máy tính có
thể đọc được thay thế cho con người. Vì OWL được viết bởi XML, các
thông tin OWL có thể dễ dàng trao đổi giữa các kiểu hệ thống máy tính
khác nhau, sử dụng các hệ điều hành và các ngôn ngữ ứng dụng khác
nhau. Mục đích chính của OWL là sẽ cung cấp các chuẩn để tạo ra một
Môn học: Biểu diễn tri thức và Ứng dụng Trang 7
nền tảng để quản lý tài sản, tích hợp mức doanh nghiệp và để chia sẻ
cũng như tái sử dụng dữ liệu trên Web. OWL được phát triển bởi nó có
nhiều tiện lợi để biểu diễn ý nghĩa và ngữ nghĩa hơn so với XML, RDF
và RDFS, và vì OWL ra đời sau các ngôn ngữ này, nó có khả năng biểu
diễn các nội dung mà máy có thể biểu diễn được trên Web.
Môn học: Biểu diễn tri thức và Ứng dụng Trang 8
Phần II. Thiết kế ontology về sách bằng công cụ protégé
1. Giới thiệu công cụ Protégé.
Một số công cụ phát triển và hiệu chỉnh có giá trị trong việc làm giảm
độ phức tạp và thời gian dùng cho nhiệm vụ xây dựng ontology. Các
công cụ như Kaon, OileEd và Protégé cung cấp các giao diện nhằm giúp
đỡ người sử dụng thực hiện các hoạt động chính yêu trong trong quá trình
phát triển một ontology.
Việc lựa chọn một công cụ hiệu chỉnh phù hợp nhất có nhiều khó
khăn vì mỗi kiểu ontology có các yêu cầu về kinh phí, thời gian, tài
nguyên khác nhau. Để giúp cho việc giải quyết vướng mắc này, Singh &
Murshed (2005) đưa ra các tiêu chuẩn đánh giá công cụ tạo ontology.
Tiêu chuẩn bao gồm tính năng, khả năng sử dụng lại, lưu trữ dữ liệu,
mức độ phức tạp, quan hệ, tính lâu bền, độ an toàn, độ chắc chắn, khả

năng học, tính khả dụng, hiệu lực, và tính rõ ràng. Protégé và
OntoEditFree được phát triển bởi Singh & Murshed sử dụng các tiêu
chuẩn này.
Một số công cụ hiệu chỉnh ontology phổ biến:
Môn học: Biểu diễn tri thức và Ứng dụng Trang 9
Protégé là một phần mềm mã nguồn mở miễn phí cung cấp cho cộng
đồng người sử dụng với một bộ công cụ để xây dựng các mô hình miền
và các ứng dụng dựa trên tri thức với ontology.
Về cơ bản, Protégé thực hiện một tập hợp phong phú của các cấu trúc
mô hình tri thức và hành động hỗ trợ sự sáng tạo, trực quan, và thao tác
của ontology trong các định dạng khác nhau.
Protégé có thể được tùy chỉnh để cung cấp tên miền thân thiện hỗ trợ
cho việc tạo ra các mô hình kiến thức và nhập dữ liệu. Hơn nữa, Protégé
có thể được mở rộng như một plug-in và có một giao diện lập trình ứng
dụng dựa trên Java (API) để xây dựng các công cụ và các ứng dụng dựa
trên tri thức.
Protégé hỗ trợ 2 mô hình ontology là Protégé-Frame và Protégé-
OWL:
Protégé-Frame cung cấp một giao diện người dùng đầy đủ và mô hình
có sẵn để tạo, lưu trữ ontrology dưới dạng frame
Protégé-OWL hỗ trợ về Web Ontology languge, được chứng thực dựa
vào W3C, semantic web.
Môn học: Biểu diễn tri thức và Ứng dụng Trang 10
Chúng ta có thể quan sát một cách trực quan thông qua OWL Viz, nó
cho phép quan sát ontology dưới dạng đồ họa và đưa file ảnh JPEG.
Ngoài ra còn hỗ trợ truy vấn SPARQL.
Protégé hiện nay đã có nhiều phiên bản, phiên bản mới nhất là 4.2
Tuy nhiên trong phạm vi thu hoạch này em xin được trình bày chủ
yếu ở phiên bản 3.4.3
Giao diện chính chương trình Protégé phiên bản 3.4.3:


2. Các bước xây dựng Ontology
Quy trình phát triển Ontology là một quy trình gồm nhiều bước, tuy
nhiên vẫn chưa có một phương pháp chuẩn hóa nào để phát triển các
ontology. Quy trình phát triển sau gồm 7 bước do Stanford Center for
Biomedical Informatics Research đưa ra (đây là nhóm phát triển phần
mềm Protégé để trình diễn và soạn thảo Ontology).
Môn học: Biểu diễn tri thức và Ứng dụng Trang 11
a. Xác định phạm vi và lĩnh vực ontology
Cần xác định mục đích của việc xây dựng ontology là gì? Phục vụ đối
tượng nào? Ontology sắp xây dựng cần có đặc điểm gì, liên quan đến lĩnh
vực, phạm vi nào. Quá trình khai thác, quản lý và bảo trì ontology được
thực hiện ra sao?
b. Xem xét việc sử dụng lại các ontology có sẵn
Cấu trúc của một Ontology bao gồm 3 tầng: tầng trừu tượng
(Abstract), tầng miền xác định (Domain) và tầng mở rộng (Extension).
Trong đó tầng trừu tượng có tính tái sử dụng rất cao, tầng miền xác định
có thể tái sử dụng trong một lĩnh vực nhất định. Cộng đồng Ontology
cũng đang lớn mạnh và có rất nhiều Ontology đã được tạo ra, với tâm
huyết của nhiều chuyên gia. Do đó trước khi bắt đầu xây dựng ontology,
cần xét đến khả năng sử dụng lại các ontology đã có. Nếu có thể sử dụng
lại một phần các ontology đã có, chi phí bỏ ra cho quá trình xây dựng
ontology sẽ giảm đi rất nhiều.
c. Liệt kê các thuật ngữ quan trọng
Ontology được xây dựng trên cơ sở các khái niệm trong một lĩnh vực
cụ thể, vì vậy khi xây dựng ontology cần bắt đầu từ các thuật ngữ chuyên
ngành để xây dựng thành các lớp trong ontology tương ứng. Tất nhiên
không phải thuật ngữ nào cũng đưa vào ontology, vì chưa chắc đã định vị
được cho thuật ngữ đó. Do đó cần phải liệt kê các thuật ngữ, để xác định
ngữ nghĩa cho các thuật ngữ đó, cũng như cân nhắc về phạm vi của

ontology. Việc liệt kê các thuật ngữ còn cho thấy được phần nào tổng
quan về các khái niệm trong lĩnh vực đó, giúp cho các bước tiếp theo
được thuận lợi.
Môn học: Biểu diễn tri thức và Ứng dụng Trang 12
d. Xác định lớp và các phân cấp của lớp
Công việc xác định các lớp không chỉ đơn giản là tiến hành tìm hiểu
về ngữ nghĩa của các thuật ngữ đã có để có được các mô tả cho thuật ngữ
đó, mà còn phải định vị cho các lớp mới, loại bỏ ra khỏi ontology nếu
nằm ngoài phạm vi của ontology hay hợp nhất với các lớp đã có nếu có
nhiều thuật ngữ có ngữ nghĩa như nhau (đồng nghĩa, hay đa ngôn ngữ).
Ngoài ra không phải thuật ngữ nào cũng mang tính chất như một lớp.
Một công việc cần phải tiến hành song song với việc xác định các lớp
là xác định phân cấp của các lớp đó. Việc này giúp định vị các lớp dễ
dàng hơn.
Có một số phương pháp tiếp cận trong việc xác định phân cấp của các
lớp:
• Phương pháp từ trên xuống (top-down): bắt đầu với định nghĩa
của các lớp tổng quát nhất trong lĩnh vực và sau đó chuyên biệt hóa các
khái niệm đó.
Ví dụ: Trong Ontology về quản lý sách, ta có lớp cha là sách có các
lớp con như sách âm nhạc, sách đại học, sách tiểu thuyết v.v… trong sách
đại học thì có thể phân thành các lớp con như sách vật lý đại cương, sách
tin học đại cương v.v…
• Phương pháp từ dưới lên (bottom-up): bắt đầu với định nghĩa
của các lớp cụ thể nhất, như các lá trong cây phân cấp. Sau đó gộp các
lớp đó lại thành các khái tổng quát hơn.
• Phương pháp kết hợp: kết hợp giữa phương pháp từ trên xuống
và từ dưới lên: bắt đầu từ định nghĩa các lớp dễ thấy trước và sau đó tổng
quát hóa và chuyên biệt hóa các lớp đó một cách thích hợp.
Môn học: Biểu diễn tri thức và Ứng dụng Trang 13

e. Xác định các thuộc tính
Để xác định thuộc tính cho các lớp, ta quay trở lại danh sách các thuật
ngữ đã liệt kê được. Hầu hết các thuật ngữ còn lại (sau khi đã xác định
lớp) là thuộc tính của các lớp đó. Với mỗi thuộc tính tìm được, ta phải
xác định xem nó mô tả cho lớp nào. Các thuộc tính đó sẽ trở thành thuộc
tính của các lớp xác định. Ví dụ lớp Người có các thuộc tính sau: Họ,
Tên, Ngày sinh, Giới tính, Nghề nghiệp, Địa chỉ, Điện thoại,…
f. Xác định ràng buộc của các thuộc tính
Các thuộc tính có thể có nhiều khía cạnh khác nhau: như kiểu giá trị,
các giá trị cho phép, số các thuộc tính (lực lượng), và các đặc trưng khác
mà giá trị của thuộc tính có thể nhận. Ví dụ: “Năm sinh” của một “nhân
viên” chỉ có duy nhất và là số nguyên, có thể nhận giá trị từ 1948 đến
1990. Cần phải xác định các ràng buộc cho một thuộc tính càng chặt chẽ
càng tốt, để tránh trường hợp nhập dữ liệu sai, dẫn đến đổ vỡ của các ứng
dụng sử dụng Ontology này.
g. Tạo các thực thể (thể hiện)
Bước cuối cùng là tạo ra các thể hiện của các lớp trong sự phân cấp.
Việc tạo thể hiện cho một lớp là quá trình điền các thông tin vào các
thuộc tính của lớp đó.
3. Xây dựng Ontology về sách
a. Thiết kế lớp
Sau khi nghiên cứu và phân tích em đưa ra các khái niệm Ontology về
sách như sau:
- Sách: Lớp tổng quan về sách
- Sách_bí_quyết_kinh_doanh: lớp con của Sách nội dung về bí quyết
kinh doanh
- Sách_chính_trị_hồi_ký: lớp con của Sách nội dung về chính trị, hồi
ký chính trị v.v
- Sách_chứng_khoán: lớp con của Sách nội dung về chứng khoán
Môn học: Biểu diễn tri thức và Ứng dụng Trang 14

- Sách_cẩm_nang_nuôi_dạy_trẻ: lớp con của Sách nội dung về các
bí quyết cẩm nang nuôi dạy trẻ dành cho cha mẹ.
- Sách_du_lịch: lớp con của Sách nội dung về quản bá du lịch,
hướng dẫn du lịch, thủ thuật du lịch v.v…
- Sách_giáo_khoa: lớp con của Sách nội dung về các loại sách cung
cấp kiến thức, với mục đích dạy và học.
- Sách_giáo_viên: lớp con của Sách dành cho giáo viên tham khảo
và giản dạy.
- Sách_khoa_học_kỹ_thuật: lớp con của Sách nội dung về khoa học
kỹ thuật.
- Sách_khoa_học_thường_thức: lớp con của Sách nội dung về các
vấn đề khoa học xảy ra hằng ngày trong cuộc sống.
- Sách_khoa_học_xã_hội: lớp con của Sách nội dung về khoa học xã
hội.
- Sách_kinh_dịch_phong_thủy: lớp con của Sách nội dung về kinh
dịch, phong thủy, bói toán, tra cứu âm dương ngũ hành v.v…
- Sách_kinh_tế: lớp con của Sách nội dung về kinh tế.
- Sách_kế_toán: lớp con của Sách nội dung về kế toán.
- Sách_luyện_thi_đại_học_cao_đẳng: lớp con của Sách nội dung ôn
tập luyện thi đại học cao đẳng.
- Sách_làm_đẹp: lớp con của Sách nội dung về làm đẹp.
- Sách_mỹ_thuật_điện_ảnh_kiến_trúc: lớp con của Sách nội dung về
điện ảnh, kiến trúc, mỹ thuật v.v…
- Sách_ngoại_ngữ: lớp con của Sách nội dung về ngoại ngữ, tiếng
anh, tiếng nhật, tiếng hàn v.v…
- Sách_nông_nghiệp: lớp con của Sách nội dung về nông nghiệp,
trồng trọt, chăn nuôi v.v…
- Sách_nữ_công: lớp con của Sách nội dung về nấu ăn, cắm hoa
v.v…
- Sách_pháp_luật: : lớp con của Sách nội dung về pháp luật, quy

định nhà nước v.v…
Môn học: Biểu diễn tri thức và Ứng dụng Trang 15
- Sách_tham_khảo_cấp_I: lớp con của Sách nội dung là sách tham
khảo dành cho bậc tiểu học
- Sách_tham_khảo_cấp_II: lớp con của Sách nội dung là sách tham
khảo dành cho bậc trung học cơ sở
- Sách_tham_khảo_cấp_III: lớp con của Sách nội dung là sách tham
khảo dành cho bậc phổ thông trung học.
- Sách_thiếu_nhi_tuổi_mới_lớn: lớp con của Sách nội dung về các
vấn đề ở tuổi mới lớn.
- Sách_thơ: lớp con của Sách nội dung về tuyển tập thơ v.v…
- Sách_thể_dục_thể_thao: lớp con của Sách nội dung về các môn
thể thao, đánh cầu, bóng đá, cờ vua v.v…
- Sách_tôn_giáo: lớp con của Sách nội dung về tôn giáo, phật giáo,
công giáo v.v…
- Sách_từ_điển: lớp con của Sách nội dung về từ điển các loại, anh-
việt, pháp-việt v.v…
- Sách_văn_học: lớp con của Sách nội dung về văn học
- Sách_âm_nhạc: lớp con của Sách nội dung về âm nhạc
- Sách_đại_học: lớp con của Sách nội dung về kiến thức dành cho
bậc đại học
- Đặc_điểm_sách: lớp tổng quan về đặc điểm sách
- Biên_soạn: lớp con của Đặc_điểm_sách, là các nhà biên soạn sách
- Biên_tập: lớp con của Đặc_điểm_sách, là các nhà biên tập sách
- Hiệu_đính: lớp con của Đặc_điểm_sách, là các người hiệu đính
sách
- Người_dịch: lớp con của Đặc_điểm_sách, là những người dịch
sách
- Người_tuyển_chọn: lớp con của Đặc_điểm_sách, là những người
tuyển chọn sách

- Nhà_xuất_bản: lớp con của Đặc_điểm_sách, là các nhà xuất bản
sách
- Thể_loại: lớp con của Đặc_điểm_sách nội dung về bí quyết kinh
doanh
Môn học: Biểu diễn tri thức và Ứng dụng Trang 16
- Tác_giả: lớp con của Đặc_điểm_sách, là tác giả quyển sách
- Tổng_biên_tập: lớp con của Đặc_điểm_sách, là tổng biên tập
quyển sách
Trình bày trong Protégé như hình:
b. Xây dựng các thuộc tính
Môn học: Biểu diễn tri thức và Ứng dụng Trang 17
Trong qua trình phân tích các mối quan hệ giữa các lớp em đã xây dựng mô
hình các thuộc tính được ghi rõ trong file ontology book.owl. Một số thuộc
tính như hình sau:
Các thuộc tính như:
- có_tác_giả_là có tên miền là sách và đích là tác_giả
- là_tác_giả_của là thuộc tính ngược của thuộc tính có_tác_giả_là
- có_nhà_xuất_bản_là có tên miền là sách và đích là nhà_xuất_bản
- là_nhà_xuất_bản_của là thuộc tính ngược lại của thuộc tính
có_nhà_xuất_bản_là
- …
c. Xây dựng các thực thể
Quá trình thu thập thông tin sách chủ yếu tại trang web của nhà sách minh
khai ( ).
Môn học: Biểu diễn tri thức và Ứng dụng Trang 18
Sau khi thu thập đủ thông tin, ta sử dụng công cụ protégé để nhập vào
ontology. Ta chọn tab Individuals trong cửa sổ protégé như hình bên dưới:
Chọn class Sách cần tạo thực thể, ví dụ chọn class
Sách_bí_quyết_kinh_doanh sau đó chọn nút “create insance” để bắt đầu tạo
một thực thể Sách_bí_quyết_kinh_doanh sách mới. Protégé sẽ tự tạo ra form

Môn học: Biểu diễn tri thức và Ứng dụng Trang 19
tạo Sách với các thuộc tính ràng buộc đã được quy định trước như hình bên
dưới:
Thay tên sách trong trường “For individual” sau dấu #.
Chọn các thuộc tính ràng buộc với các lớp khác, có thể tạo một individual
của lớp khác trong khi tạo các mối ràng buộc qua các thuộc tính này.
.
Môn học: Biểu diễn tri thức và Ứng dụng Trang 20
Phần III Kết quả đạt được và hướng phát triển
1. Kết quả đạt được
Ontology xây dựng dựa trên Protégé 3.4.3
Đã xây dựng được một hệ thống Ontology sách với 75 lớp, 32 thuộc tính và
các cá thể gồm 27 thể loại sách, hơn 700 quyển sách, 470 tác giả, 68 nhà xuất
bản và các thông tin chi tiết của quyển sách.
2. Hướng phát triển
Tiếp tục phát triển và tiến đến xây dựng một hệ thống hoàn chỉnh tri
thức biểu diễn Ontology sách.
Xây dựng các hệ thống truy cứu thông tin sách bằng cách câu truy vấn
dựa trên Ontology.
Xây dựng các hệ thống quản lý sách cho các nhà sách, thư viện v.v…
Môn học: Biểu diễn tri thức và Ứng dụng Trang 21
Tài liệu tham khảo
Tài liệu tiếng Việt
[1] Trần Thị Ngân, phương pháp xây dựng Ontology.
[2] Nguyễn Quốc Đại, hệ thống hỏi đáp tiếng Việt dựa trên Ontology, Đại học Công nghệ
- 2009
[3] Giáp Thị Ngọc Thúy, Chuyển đổi từ mô hình UML sang OWL Ontology và ứng
dụng, Đại học Công nghệ - 2010
[4] PGS.TS Đỗ Văn Nhơn, Nguyễn Đình Hiển, Phương pháp suy diễn trên mô hình
COKB dựa trên tri thức bài toán mẫu và ứng dụng, Đại học công nghệ thông tin – đại học

quốc gia TP.HCM
Tài liệu tiếng Anh
[5] Ontology,
[6] Vanessa Lopez, Victoria Uren, Enrico Motta, Michele Pasin, AquaLog: An ontology-
driven question answering system for organizational semantic intranets.

Môn học: Biểu diễn tri thức và Ứng dụng Trang 22

×