Tải bản đầy đủ (.pdf) (75 trang)

Xây dựng hệ thống kết nối dịch vụ web ngữ nghĩa hỗ trợ các ngôn ngữ thông dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.42 MB, 75 trang )

Đại Học Quốc Gia TP.Hồ Chí Minh
TRƯỜNG ĐẠI HỌC BÁCH KHOA
-----------------

ĐẶNG NHÂN CÁCH

XÂY DỰNG HỆ THỐNG KẾT NỐI DỊCH VỤ WEB NGỮ
NGHĨA HỖ TRỢ CÁC NGÔN NGỮ THÔNG DỤNG
Chuyên ngành: Hệ Thống Thông Tin Quản Lý

LUẬN VĂN THẠC SĨ

TP. Hồ Chí Minh, tháng 11 năm 2009


CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI
TRƯỜNG ĐẠI HỌC BÁCH KHOA
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
Cán bộ hướng dẫn khoa học : TS. Quản Thành Thơ .........................................
Cán bộ đồng hướng dẫn khoa học : TS. Lê Duy Ngạn ......................................
Cán bộ chấm nhận xét 1 : ...................................................................................
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Cán bộ chấm nhận xét 2 : ...................................................................................
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp. HCM
ngày . . 04 . tháng . . 01. . năm . . 2010. . .
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)
1. Chủ tịch hội đồng : TS. Cao Hào Thi
2. Thư ký hội đồng : TS. Nguyễn Thu Hiền
3. Uỷ viên hội đồng : TS. Nguyễn Thanh Bình, phản biện


4. Uỷ viên hội đồng : TS. Võ Thị Ngọc Châu, phản biện
5. Uỷ viên hội đồng : TS. Quản Thành Thơ, hướng dẫn
6. Uỷ viên hội đồng : TS. Lê Duy Ngạn, hướng dẫn
Xác nhận của Chủ tịch Hội đồng đánh giá LV và Bộ môn quản lý chuyên ngành
sau khi luận văn đã được sửa chữa (nếu có).
Chủ tịch Hội đồng đánh giá LV

Bộ môn quản lý chuyên ngành


TRƯỜNG ĐH BÁCH KHOA TP. HCM
PHÒNG ĐÀO TẠO SĐH

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc

Tp. HCM, ngày . 22. . tháng . 11. . năm 2009 .

NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: ĐẶNG NHÂN CÁCH................................Phái: Nam ...................
Ngày, tháng, năm sinh: 10/10/1978 .......................................Nơi sinh: Bình Thuận ...
Chuyên ngành: Hệ Thống Thông Tin Quản Lý.....................MSHV: 03207085 .........
I- TÊN ĐỀ TÀI: Xây Dựng Hệ Thống Kết Nối Dịch Vụ Web Ngữ Nghĩa Hỗ Trợ
Các Ngôn Ngữ Thông Dụng .............................................................................................
.............................................................................................................................................
.............................................................................................................................................
II- NHIỆM VỤ VÀ NỘI DUNG:
Xây dựng hệ thống kết nối dịch vụ Web hỗ trợ hai ngôn ngữ thông dụng hiện này là
OWL-S và WSMO..............................................................................................................
.............................................................................................................................................

.............................................................................................................................................
III- NGÀY GIAO NHIỆM VỤ (Ngày bắt đầu thực hiện LV ghi trong QĐ giao đề
tài): 02/02/2009 ..............................................................................................................
IV- NGÀY HOÀN THÀNH NHIỆM VỤ: 26/11/2009 ................................................
V- CÁN BỘ HƯỚNG DẪN : TS. Quản Thành Thơ ........................................................
.............................................................................................................................................
VI- CÁN BỘ ĐỒNG HƯỚNG DẪN : TS. Lê Duy Ngạn................................................
CÁN BỘ HƯỚNG DẪN

CÁN BỘ ĐỒNG HƯỚNG DẪN

(Học hàm, học vị, họ tên và chữ ký)
NGÀNH

CN BỘ MÔN

(Học hàm, học vị, họ tên và chữ ký) QL CHUYÊN


i

LỜI CẢM ƠN
Trước hết, cho tôi được phép gửi lời cảm ơn chân thành và sâu sắc đến thầy TS.
Quản Thành Thơ và thầy TS. Lê Duy Ngạn, những người đã tận tâm hướng dẫn, chỉ
bảo tôi từng bước trong quá trình nghiên cứu và thực hiện luận văn này. Ngồi việc
hồn thành xong luận văn cao học, tơi cịn học hỏi được rất nhiều thứ từ hai thầy. Từ
cách trình bày đến phương pháp nghiên cứu, thái độ và trách nhiệm của một nhà
nghiên cứu. Đặc biệt là tôi đã được làm việc trong môi trường chuyên nghiệp với
những người chuyên nghiệp.
Tôi xin chân thành cảm ơn các bạn bè ký túc xá Bách Khoa, các bạn cùng thời

Đại Học Bách Khoa, các bạn lớp cao học MIS 2007 đã động viên, khuyến khích và hỗ
trợ tơi trong q trình làm luận văn.
Tơi xin gửi lời cảm ơn đến tác giả của các bài báo mà tôi đã sử dụng để tham
khảo, nghiên cứu và sử dụng trong luận văn này.
Cuối cùng, xin cảm ơn sâu sắc đến vợ và con gái cùng gia đình đã phải hy sinh
rất nhiều về sự quan tâm chăm sóc của tơi, để tơi có nhiều thời gian và n tâm nghiên
cứu. Họ luôn sát cánh động viên, ủng hộ và là chỗ dựa vững chắc để tơi có niềm tin và
nghị lực hồn thành tốt luận văn này.
Tp. Hồ Chí Minh, ngày 22 tháng 11 năm 2009

Đặng Nhân Cách


ii

TĨM TẮT
Dịch vụ Web có ngữ nghĩa đã trở thành một kỹ thuật quan trọng trong việc phát
triển các hoạt động kinh doanh trên mơi trường Web. Trong đó, kết nối dịch vụ Web là
một hoạt động rất quan trọng để thúc đẩy việc sử dụng các dịch vụ Web. Đã có nhiều
hệ thống kết nối được đề xuất để đáp ứng nhu cầu trên. Tuy nhiên, những hệ thống này
chỉ hỗ trợ cho các dịch vụ Web mô tả bởi một ngôn ngữ duy nhất như OWL-S hoặc
WSMO. Đây là một giới hạn lớn vì các ngơn ngữ trên chỉ dùng để mô tả trong khi nội
dung của các dịch vụ Web là không đổi dù được mô tả bởi bất kỳ ngơn ngữ nào. Vì
vậy, một dịch vụ Web được mơ tả bởi OWL-S có thể kết nối với một dịch vụ Web
được mô tả bởi WSMO và ngược lại là cần thiết. Điều này dẫn đến một nhu cầu xây
dựng hệ thống kết nối dịch vụ Web hỗ trợ đa ngôn ngữ.
Luận văn này sẽ giới thiệu một hệ thống kết nối dịch vụ Web ngữ nghĩa khắc
phục được những hạn chế của các hệ thống kết nối dịch vụ Web hiện thời bằng cách hỗ
trợ đa ngôn ngữ. Khởi đầu, hệ thống hỗ trợ hai ngôn ngữ phổ biến nhất hiện nay là
OWL-S và WSMO. Giải thuật của hệ thống được phát triển dựa trên giải thuật kết nối

đã được đề xuất cho dịch vụ Web mơ tả bởi OWL-S nhưng nó sẽ được mở rộng để hỗ
trợ cho cả WSMO. Giải thuật này dựa vào độ tương tự của đầu vào, đầu ra của các dịch
vụ Web. Các đầu vào và đầu ra này được thể hiện bởi các khái niệm được mô tả bởi
các Ontology. Như vậy, việc tính tốn độ tương tự của đầu vào và đầu ra này chính là
việc tính độ tương tự của các khái niệm thuộc các Ontology.
Hệ thống được kiểm thử dựa vào bộ dữ liệu kiểm thử được tác giả phát triển dựa
trên một ví dụ cụ thể và rất phổ biến trong việc ứng dụng dịch vụ Web. Kết quả kiểm
thử khẳng định tính đúng đắn của hệ thống. Hệ thống hỗ trợ hai ngôn ngữ phổ biến
nhất hiện nay là OWL-S và WSMO nhưng nó cũng dễ dàng được thay đổi khi hỗ trợ
một ngôn ngữ mới với cùng một phương thức.


iii

ABSTRACT
Semantic Web services have become a core technology in developing business
operation on the Web enviroment. Web service composition is an important activity to
leverage the use of Web services. Several composition systems have been proposed to
meet this demand. However, these systems only support a particular Web service
description language such as OWL-S or WSMO but not multiple languages. This is a
significant limitation since these languages only describe the service but the content of
Web service will not be changed although it is described by any language. Thus, a
service described by OWL-S can be composed with a service described by WSMO and
vice versa is necessary. This leads to a motivation to develop a Web service
composition system that supports multiple languages.
This thesis introduces a Web service composition system which supports
multiple description languages to overcome the limitation. Initially, the system
supports OWL-S and WSMO which are the two most popular languages. The
algorithm of the system is based on an existing composition algorithm for OWL-S but
it is extended to support WSMO. Computing similarity degree between input and

output of two Web services is the core of the algorithm. Since input and output of the
services are concepts from ontologies, measuring input and output similartiy is
measuring concept similarity from ontologies.
Experiments have been carried out using a test-bed developed by the authors
based on an example which is popular in the area to compose Web servcies. The
experimental results confirm the validaty of the system. The system supports OWL-S
and OWL languages but it can be extended to support different description languagues
by the same manner easily.


iv

MỤC LỤC
LỜI CẢM ƠN ................................................................................................................. i
TÓM TẮT....................................................................................................................... ii
ABSTRACT...................................................................................................................iii
MỤC LỤC ..................................................................................................................... iv
DANH MỤC CÁC HÌNH............................................................................................ vii
DANH MỤC CÁC BẢNG............................................................................................ ix
DANH MỤC CÁC TỪ VIẾT TẮT .............................................................................. x
Chương 1: GIỚI THIỆU.............................................................................................. 1
1.1 Động cơ thực hiện luận văn............................................................................... 1
1.2 Mục đích và giới hạn của luận văn.................................................................... 2
1.3 Cấu trúc của luận văn ........................................................................................ 3
Chương 2: CƠ SỞ LÝ THUYẾT ................................................................................ 5
2.1 Ontology............................................................................................................ 5
2.1.1 Khái niệm về Ontology............................................................................. 5
2.1.2 Các phần tử trong Ontology...................................................................... 6
2.1.3 Ngôn ngữ Web Ontology- OWL .............................................................. 7
2.1.4 Ngôn ngữ Web Ontology- WSML ........................................................... 9

2.2 Dịch vụ Web ngữ nghĩa................................................................................... 11
2.2.1 Mơ hình dịch vụ Web ............................................................................. 13
2.2.2 OWL-S.................................................................................................... 14
2.2.3 WSMO .................................................................................................... 16
2.3 Kết nối dịch vụ Web (Web service composition) ........................................... 18


v

2.4 Tóm tắt ............................................................................................................ 21
Chương 3: CÁC CƠNG TRÌNH LIÊN QUAN........................................................ 22
3.1 Khảo sát các cơng trình liên quan ................................................................... 22
3.2 Kết nối dịch vụ Web dùng kỹ thuật Workflow ............................................... 23
3.3 Kết nối dịch vụ Web dùng kỹ thuật AI Planning ............................................ 24
3.4 Tóm tắt ............................................................................................................ 26
Chương 4: ĐO ĐỘ GIỐNG NHAU GIỮA HAI KHÁI NIỆM .............................. 27
4.1 Giới thiệu......................................................................................................... 27
4.2 Giải thuật tính tốn .......................................................................................... 28
4.3 Kiểm tra đánh giá ............................................................................................ 34
4.4 Kết luận ........................................................................................................... 36
Chương 5: THIẾT KẾ MƠ HÌNH DỮ LIỆU VÀ GIẢI THUẬT.......................... 38
5.1 Tổng quan về kiến trúc hệ thống ..................................................................... 38
5.2 Mơ hình dữ liệu dịch vụ Web.......................................................................... 39
5.3 Các môđun hỗ trợ ............................................................................................ 42
5.3.1 Môđun Parser .......................................................................................... 42
5.3.2 Môđun sự giống nhau ngữ nghĩa (Sematic Similairty) .......................... 44
5.4 Giải thuật chính ............................................................................................... 44
5.5 Kết luận ........................................................................................................... 48
Chương 6: KIỂM TRA VÀ ĐÁNH GIÁ KẾT QUẢ............................................... 49
6.1 Xây dựng kịch bản kiểm tra ............................................................................ 49

6.2 Dữ liệu kiểm tra............................................................................................... 50
6.3 Kết quả kiểm tra .............................................................................................. 54


vi

6.4 Đánh giá kết quả.............................................................................................. 55
6.5 Kết luận ........................................................................................................... 55
Chương 7: KẾT LUẬN .............................................................................................. 56
7.1 Kết luận ........................................................................................................... 56
7.2 Hướng mở rộng ............................................................................................... 57
DANH MỤC CƠNG TRÌNH DỰA VÀO LUẬN VĂN............................................ 58
TÀI LIỆU THAM KHẢO........................................................................................... 59


vii

DANH MỤC CÁC HÌNH
Hình 2.1: Các kiểu của WSML [10].............................................................................. 10
Hình 2.2: Mơ hình dịch vụ Web .................................................................................... 13
Hình 2.3: Các thành phần chính của OWL-S [11] ........................................................ 15
Hình 2.4: Các thành phần chính của WSMO [5]........................................................... 16
Hình 2.5: Framework của hệ thống kết nối dịch vụ Web [12] ...................................... 19
Hình 3.1: Các hướng tiếp cận kết nối dịch vụ Web....................................................... 22
Hình 4.1: Các kiểu tiếp cận để tính tốn tương tự giữa hai khái niệm .......................... 27
Hình 4.2: Ví dụ về cách tính mức tương tự ngữ nghĩa của hai khái niệm..................... 29
Hình 4.3: Các thành phần đặc tả bởi OWL .................................................................. 30
Hình 4.4: Các thành phần đặc tả bởi WSML................................................................. 31
Hình 4.5: Đo mức tương tự giữa hai khái niệm Vehicle thuộc OWL và WSML ......... 31
Hình 4.6: Đo mức tương tự về nhãn và mô tả giữa hai khái niệm OWL và WSML .... 32

Hình 5.1: Tổng quan về kiến trúc hệ thống CSML ....................................................... 39
Hình 5.2: Mơ hình dữ liệu Service Profile (OWL-S) .................................................... 40
Hình 5.3: Mơ hình dữ liệu Web Service (WSMO)........................................................ 41
Hình 5.4: Ánh xạ giữa file Service Profile và đối tượng Service Profile...................... 43
Hình 5.5: Ánh xạ giữa file Web Service và đối tượng Web Service............................. 43
Hình 5.6: Giải thuật xem xét danh sách đáp ứng yêu cầu đầu vào của dịch vụ ............ 45
Hình 5.7: Giải thuật tính độ tương tự của hai khái niệm cùng một ngơn ngữ............... 46
Hình 5.8: Giải thuật tính độ tương tự của hai khái niệm khác ngôn ngữ ...................... 47


viii

Hình 6.1: Ontology về lĩnh vực du lịch mơ tả bởi OWL............................................... 52
Hình 6.2: Ontology về lĩnh vực du lịch mơ tả bởi WSML............................................ 53
Hình 6.3: Kết quả kiểm tra ............................................................................................ 54


ix

DANH MỤC CÁC BẢNG
Bảng 4.1: Kết quả kiểm tra giải thuật đo độ tương tự giữa hai khái niệm .................... 35
Bảng 6.1: Các đặc tả dịch vụ Web mô tả bởi OWL-S................................................... 51
Bảng 6.2: Các đặc tả dịch vụ Web mô tả bởi WSMO................................................... 51


x

DANH MỤC CÁC TỪ VIẾT TẮT
DAML


- DARPA Agent Markup Language

DAML-S

- DAML-based Web Service Ontology

OWL

- Web Ontology Language

OWL-S

- OWL-based Web service Ontology

RDF

- Resource Description Framework

RDFS

- RDF Schema

UDDI

- Universal Description, Discovery and Integration

URI

- Uniform Resource Identifier


W3C

- World Wide Web Consortium

WSDL

- Web Service Description Language

WSMO

- Web Service Modeling Ontology

XML

- Extensible Markup Language

CSML

- Composition System supports Multiple Languages

AI

- Artificial Intelligence

DAML+OIL

- DARPA Agent Markup Language + Ontology Inference Layer

WSML


- Web Service Modeling Language

PDDL

- Planning Domain Definition Language

WSTL

- Web Servcie Toolkit

HTN

- Hierarchical Task Network


1

Chương 1: GIỚI THIỆU
1.1 Động cơ thực hiện luận văn
Web ngữ nghĩa là sự mở rộng của Web hiện tại với mục đích giúp thơng tin trên
Web được định nghĩa tốt hơn để từ đó khơng những chỉ người dùng có thể đọc mà máy
tính cũng có thể hiểu và diễn dịch được những thơng tin [1]. Bên cạnh đó, dịch vụ Web
đã được sử dụng rất phổ biến và trở thành công cụ quan trọng cho phép các công ty
giảm chi phí bằng cách tăng hiệu quả của hoạt động kinh doanh khi các dịch vụ thơng
thường có thể thực hiện thông qua Web. Tuy nhiên, dịch vụ Web hiện tại được mô tả
bởi ‘Ngôn ngữ mô tả dịch vụ Web’ WSDL (Web Service Description Language) [2, 3]
chỉ thể hiện bởi các từ khóa. Điều này dẫn đến những khó khăn trong việc tìm kiếm,
kết nối, cũng như thực thi của các dịch vụ Web hiện tại. Để giải quyết vấn đề này, kỹ
thuật Web ngữ nghĩa đã được ứng dụng vào dịch vụ Web hiện tại để cho ra đời một kỹ
thuật mới: dịch vụ Web ngữ nghĩa (Semantic Web service).

Trong dịch vụ Web, các tính năng so trùng (matching), khám phá (discovery),
và kết nối (composition) là rất quan trọng vì một dịch vụ Web sẽ là vơ dụng nếu dịch
vụ này được xây dựng mà không thể tìm kiếm được và như thế sẽ khơng được sử dụng.
Vì vậy, các nhà nghiên cứu đã đưa ra những giải pháp để thỏa mãn yêu cầu của người
dùng và hiện nó vẫn đang là một lĩnh vực nghiên cứu thu hút nhiều nhà nghiên cứu trên
thế giới. Trong các tính năng này, tính năng kết nối là ít hồn thiện nhất vì các giải
thuật kết nối hiện tại thường khơng bao phủ hết các kết quả và địi hỏi chi phí tính tốn
trong thời gian thực thi rất cao . Ngoài ra, kết nối các dịch vụ Web trở thành một nhu
cầu cần thiết vì một dịch vụ Web đơn lẻ thường không đáp ứng được nhu cầu người
dùng. Vì vậy, xây dựng một giải thuật cho việc kết nối các dịch vụ Web ngữ nghĩa là
một nhu cầu cần thiết.


2

Một dịch vụ Web ngữ nghĩa phải được mô tả bởi một ngơn ngữ nhất định. Có
nhiều ngơn ngữ mơ tả cho dịch vụ Web, trong đó hai ngơn ngữ được dùng phổ biến
nhất hiện nay là OWL-S (Web Ontology Language) [4] và WSMO (Web Service
Modeling Ontology) [5]. Một vấn đề nữa của các giải thuật kết nối dịch vụ Web hiện
tại là chỉ hỗ trợ một ngôn ngữ nhất định chẳng hạn như cho OWL-S hoặc cho
WSMO. Đây là một giới hạn lớn vì các ngơn ngữ trên chỉ dùng để mô tả trong khi nội
dung của các dịch vụ Web là không đổi dù được mô tả bởi bất kỳ ngơn ngữ nào. Vì
vậy, một dịch vụ được mơ tả bởi OWL-S có thể kết nối với một dịch vụ được mô tả
bằng WSMO và ngược lại là cần thiết. Điều này cho thấy một nhu cầu của xây dựng hệ
thống kết nối dịch vụ Web hỗ trợ nhiều ngơn ngữ.
1.2 Mục đích và giới hạn của luận văn
1.2.1 Mục tiêu của luận văn
Như đã trình bày ở trên, hệ thống kết nối dịch vụ Web ngữ nghĩa hiện tại có giới
hạn về hỗ trợ đa ngơn ngữ. Vì vậy, mục tiêu của luận văn là xây dựng một hệ thống kết
nối dịch vụ Web ngữ nghĩa để giải quyết các vấn đề này. Trong khuôn khổ của một

luận văn thạc sỹ, luận văn sẽ tập trung nghiên cứu xây dựng một hệ thống kết nối dịch
vụ Web ngữ nghĩa hỗ trợ hai ngơn ngữ chính và phổ biến hiện nay là OWL-S và
WSMO, trong khi các ngôn ngữ khác như WSDL-S và METOR sẽ được xem xét trong
tương lai. Hệ thống này được đặt tên là CSML (Composition System supports Multiple
Languages). Xây dựng và hoàn thiện một hệ thống kết nối như vậy, luận văn có những
đóng góp như sau:
· Hệ thống kết nối dịch vụ Web hỗ trợ hai ngôn ngữ phổ biến là OWL-S và
WSMO. Như đã đề cập trên, hệ thống này đã giải quyết được những hạn chế
của các hệ thống hiện tại chỉ hỗ trợ một ngơn ngữ. Vì sự phổ biến của hai ngơn
ngữ này, hệ thống được xây dựng có một đóng góp quan trọng.


3

· Để xây dựng hệ thống này, một giải thuật tính độ tương tự của hai khái niệm
thuộc WSML và OWL được xây đựng. Giải thuật này không chỉ áp dụng cho hệ
thống được xây dựng mà cịn có thể áp dụng cho những ứng dụng khác. WSML
và OWL là hai ngơn ngữ phổ biến, vì vậy, giải thuật tính sự giống nhau này có
một đóng góp nhất định vì những giải thuật hiện tại chỉ áp dụng cho một ngôn
ngữ cụ thể.
1.2.2 Giới hạn của luận văn
Với mục tiêu và đóng góp được đề cập như trên, luận văn được giới hạn bởi
những điểm sau:
· CSML được xây dựng dựa trên một giải thuật có sẵn cho ngơn ngữ OWL-S [6].
Giải thuật này cho độ chính xác cao nhưng thời gian thực thi khơng cao. Vì
CSML được xây dựng dựa trên giải thuật này nên hệ quả là CSML có thời gian
thực thi cũng khơng cao.
· Ngồi ra, như đã đề cập, giải thuật chỉ hỗ trợ hai ngôn ngữ là OWL-S và
WSMO vì sự phổ biến của hai ngôn ngữ này. Các ngôn ngữ khác như WSDL-S
và METOR sẽ được hỗ trợ trong tương lai với cách thức xây dựng tương tự.

1.3 Cấu trúc của luận văn
Phần trên giới thiệu động cơ thực hiện cũng như mục đích và giới hạn của luận
văn. Những phần còn lại của luận văn được trình bày như sau:
· Chương 2 giới thiệu cơ sở lý thuyết dùng để thực hiện trong nghiên cứu luận
văn này. Các khái niệm về Ontology, dịch vụ Web ngữ nghĩa, mơ hình kết nối
dịch vụ Web và hai ngôn ngữ thông dụng dùng để mô tả dịch vụ Web là OWL-S
và WSMO.


4

· Chương 3 giới thiệu các cơng trình nghiên cứu liên quan. Kết nối dịch vụ có hai
phương thức tiếp cận phổ biến là AI (Artificial Intelligence) Planning và kỹ
thuật WorkFlow. Trong chương này, ưu điểm và khuyết điểm của từng cách tiếp
cận sẽ được phân tích và thảo luận.
· Chương 4 giới thiệu giải thuật tính độ tương tự của hai khái niệm thuộc WSML
và OWL Ontology.
· Chương 5 giới thiệu tổng quan các mơ hình dữ liệu và cách áp dụng chúng vào
để xây dựng giải thuật và hệ thống kết nối các dịch vụ Web ngữ nghĩa.
· Chương 6 xây dựng mơ hình dữ liệu kiểm tra và đánh giá tính hiệu quả của hệ
thống.
· Cuối cùng là Chương 7 tổng kết, đánh giá và vạch ra hướng mở rộng của hệ
thống trong tương lai.


5

Chương 2: CƠ SỞ LÝ THUYẾT
2.1 Ontology
2.1.1 Khái niệm về Ontology

Thuật ngữ Ontology có nguồn gốc trong triết học và đã được áp dụng trong
nhiều lĩnh vực khác nhau. Trong khoa học máy tính, Ontology được định nghĩa là một
mơ hình dữ liệu biểu diễn một lĩnh vực và được sử dụng để suy luận về các đối tượng
trong lĩnh vực đó và mối quan hệ giữa chúng. Ontology cung cấp một bộ từ vựng
chung bao gồm các khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái
niệm và các thuộc tính này. Ngồi bộ từ vựng, Ontology cịn cung cấp các ràng buộc,
đơi khi các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong muốn của
bộ từ vựng, nó được sử dụng trong một miền mà có thể được giao tiếp giữa người và
các hệ thống ứng dụng [7].
Các Ontology được sử dụng như là một biểu mẫu trình bày tri thức về thế giới
hay một phần của nó. Các Ontology thường miêu tả:
·

Các thực thể (Individuals hay Instances): Các đối tượng cơ bản, nền tảng.

·

Các lớp (Classes hay Concepts): Các tập hợp, hay kiểu của các đối tượng.

·

Các thuộc tính (Properties): Thuộc tính, tính năng, đặc điểm, tính cách, hay các
thơng số mà các đối tượng có và có thể đem ra chia sẻ.

·

Các mối liên hệ (Relations): Các cách mà đối tượng có thể liên hệ tới một đối
tượng khác.
Bộ từ vựng Ontology được xây dựng trên nền tảng RDF (Resource Description


Framework) và RDFS (RDF Schema) cung cấp khả năng mô tả dữ liệu ngữ nghĩa cho
tài nguyên Web.


6

2.1.2 Các phần tử trong Ontology
a. Các thực thể (Individuals) - Thể hiện
Các thực thể là các thành phần cơ bản, nền tảng của một Ontology. Các thực thể
trong một Ontology có thể bao gồm các đối tượng cụ thể như con người, động vật, cái
bàn... cũng như các thực thể trừu tượng như các thành viên hay các từ. Một Ontology
có thể khơng cần bất kỳ một thực thể nào, nhưng một trong những lý do chính của một
Ontology là để cung cấp một ngữ nghĩa của việc phân lớp các thực thể, mặc dù các
thực thể này không thực sự là một phần của Ontology.
b. Các lớp (Classes) – Các khái niệm (Concepts)
Các lớp là các nhóm, tập hợp các đối tượng trừu tượng. Chúng có thể chứa các
thực thể, các lớp khác, hay là sự phối hợp của cả hai. Các Ontology biến đổi tuỳ thuộc
vào cấu trúc và nội dung của nó: Một lớp có thể chứa các lớp con, có thể là một lớp
tổng quan (chứa tất cả mọi thứ), có thể là lớp chỉ chứa những thực thể riêng lẻ. Một lớp
có thể xếp gộp vào hoặc bị xếp gộp (subsumption) bởi các lớp khác. Mối quan hệ xếp
gộp này được sử dụng để tạo ra một cấu trúc có thứ bậc các lớp.
c. Các thuộc tính (Properties)
Các đối tượng trong Ontology có thể được mơ tả thơng qua việc khai báo các
thuộc tính của chúng. Mỗi một thuộc tính đều có tên và giá trị của thuộc tính đó. Các
thuộc tính được sử dụng để lưu trữ các thông tin mà đối tượng có thể có. Ví dụ, đối với
một cá nhân có thể có các thuộc tính: Họ_tên, ngày_sinh, q_qn, số_cmnd…
Giá trị của một thuộc tính có thể là các kiểu dữ liệu đơn giản hoặc các kiểu dữ liệu
phức tạp.



7

d. Các mối quan hệ (Relation)
Một trong những ứng dụng quan trọng của việc sử dụng các thuộc tính là để mô
tả mối liên hệ giữa các đối tượng trong Ontology. Một mối quan hệ là một thuộc tính
có giá trị là một đối tượng nào đó trong Ontology. Một kiểu quan hệ quan trọng là kiểu
quan hệ xếp gộp. Kiểu quan hệ này mô tả các đối tượng nào là các thành viên của các
lớp nào của các đối tượng.
2.1.3 Ngôn ngữ Web Ontology- OWL
Web Ontology Language (OWL) [4] là ngôn ngữ đánh dấu được sử dụng để
xuất bản và chia sẻ dữ liệu sử dụng các Ontology trên Internet. OWL là một bộ từ vựng
mở rộng của khung mô tả tài nguyên (RDF) và được kế thừa từ ngôn ngữ DAML+OIL
(DARPA Agent Markup Language + Ontology Inference Layer) Web Ontology – một
dự án được hỗ trợ bởi W3C.
OWL biểu diễn ý nghĩa của các thuật ngữ trong các từ vựng và mối liên hệ giữa
các thuật ngữ này để đảm bảo phù hợp với quá trình xử lý bởi các hệ thống hay ứng
dụng. OWL được thiết kế đặc biệt để cung cấp một cách thức thông dụng trong việc xử
lý nội dung thông tin của Web. Ngôn ngữ này được kỳ vọng rằng sẽ cho phép các hệ
thống máy tính có thể đọc và hiểu được nội dung của Web một cách tự động. Vì OWL
được viết bởi XML, nên nó có các ưu điểm của XML. Ví dụ, các thơng tin OWL có thể
dễ dàng trao đổi giữa các kiểu hệ thống máy tính khác nhau, sử dụng các hệ điều hành
và các ngôn ngữ ứng dụng khác nhau. Mục đích chính của OWL là sẽ cung cấp các
chuẩn để tạo ra một nền tảng để quản lý tài sản, tích hợp mức doanh nghiệp và để chia
sẻ cũng như tái sử dụng dữ liệu trên Web. OWL được phát triển và phổ biến bởi nó có
nhiều tiện lợi để biểu diễn ý nghĩa và ngữ nghĩa hơn so với XML, RDF và RDFS.
Ngồi ra, vì OWL ra đời sau các ngơn ngữ này, nó có khả năng biểu diễn các nội dung
mà máy có thể biểu diễn được trên Web.


8


Các phiên bản của OWL
OWL được chia làm ba phiên bản ngôn ngữ con: OWL Lite, OWL DL, và OWL
Full :
·

OWL Lite: hỗ trợ cho những người dùng chủ yếu cần sự phân lớp theo thứ bậc
và các ràng buộc đơn giản. Ví dụ, trong khi nó hỗ trợ các ràng buộc về tập hợp,
nó chỉ cho phép giá trị của các ràng buộc là 0 hay 1. Điều này cho phép cung
cấp các công cụ hỗ trợ OWL Lite dễ dàng hơn so với các bản khác.

·

OWL DL (OWL Description Logic): hỗ trợ cho những người dùng cần sự diễn
cảm tối đa trong khi cần duy trì tính tính tốn tồn vẹn (tất cả các kết luận phải
được đảm bảo để tính tốn) và tính quyết định (tất cả các tính tốn sẽ kết thúc
trong khoảng thời gian hạn chế). OWL DL bao gồm tất cả các cấu trúc của ngơn
ngữ OWL, nhưng chúng chỉ có thể được sử dụng với những hạn chế nào đó. Ví
dụ, trong khi một lớp có thể là một lớp con của rất nhiều lớp, một lớp không thể
là một thể hiện của một lớp khác. OWL DL cũng được chỉ định theo sự tương
ứng với logic mô tả, một lĩnh vực nghiên cứu trong logic đã tạo nên sự thiết lập
chính thức của OWL.

·

OWL Full: muốn đề cập tới những người dùng cần sự diễn cảm tối đa và sự tự
do của RDF mà khơng cần đảm bảo sự tính tốn của các biểu thức. Ví dụ, trong
OWL Full, một lớp có thể được xem xét đồng thời như là một tập của các cá thể
và như là một cá thể trong chính bản thân nó. OWL Full cho phép một Ontology
gia cố thêm ý nghĩa của các từ vựng được định nghĩa trước (RDF hoặc OWL).



9

Mối liên hệ giữa các ngôn ngữ con của OWL:
Các ngơn ngữ con của OWL được trình bày bên trên có các mối quan hệ như
sau:
· Mọi Ontology hợp lệ dựa trên OWL Lite đều là Ontology hợp lệ trên OWL DL.
· Mọi Ontology hợp lệ dựa trên OWL DL đều là Ontology hợp lệ trên OWL Full.
· Mọi kết luận hợp lệ dựa trên OWL Lite đều là kết luận hợp lệ trên OWL DL.
· Mọi kết luận hợp lệ dựa trên OWL DL đều là kết luận hợp lệ trên OWL Full.
Các phiên bản này tách biệt về các tiện ích khác nhau, OWL Lite là phiên bản
đơn giản nhất và OWL Full là phiên bản phức tạp nhất. CSML hỗ trợ OWL-DL vì đây
là phiên bản hồn chỉnh có thể dùng được và được hỗ trợ tốt bởi các thư viện và các cơ
chế suy diễn (reasoners) như Jena [8] và Racer [9]. Ngoài ra, so với OWL-DL, OWLLite thì quá đơn giản nên chỉ phù hợp với các ứng dụng đơn giản trong khi OWL-Full
thì chưa hoàn chỉnh và chưa được hỗ trợ đầy đủ của các thư viện và các cơ chế suy
diễn.
2.1.4 Ngôn ngữ Web Ontology- WSML
Web Service Modeling Language WSML là một ngôn ngữ dùng để mô tả các
Ontology và đặc tả của dịch vụ Web [10]. Cụ thể WSML cung cấp các cú pháp và ngữ
nghĩa cho ngôn ngữ WSMO (Web Service Modeling Ontology). Cũng như các ngôn
ngữ Onlogy khác, WSML cũng bao gồm các khái niệm, thuộc tính, thực thể và các mối
liên hệ giữa các khái niệm và các thuộc tính.
WSML framework cho phép một số các kiểu khác nhau. Các kiểu này và mối
liên hệ giữa chúng được minh họa dưới hình sau :


10

Hình 2.1: Các kiểu của WSML [10]

· WSML-Core : đáp ứng với các phần giao của mô tả logic (Description Logic) và
Horn Logic (khơng có biểu tượng hàm và khơng có đẳng thức) trên nền tảng
ngơn ngữ mơ tả logic. Đặc điểm chính của ngơn ngữ là hỗ trợ các mơ hình lớp,
thuộc tính, mối quan hệ nhị phân và các thực thể. Đặc biệt, ngôn ngữ hỗ trợ các
lớp theo cấp bậc và các mối quan hệ theo cấp bậc. WSML-Core được mở rộng
với các kiểu dữ liệu hỗ trợ hữu ích trong các ứng dụng. WSML-Core hồn tồn
tương thích với một tập con của OWL.
· WSML-DL : mở rộng của WSML-Core, nó tương thích hồn tồn với
Description Logic SHIQ. Do đó, việc bao trùm các phần của OWL mà nó được
thể hiện một cách hiệu quả hơn.
· WSML-Light : mở rộng của WSML-Core trong sự điều khiển của lập trình
Logic. WSML-Light có một tập hợp phong phú những mơ hình ngun thủy
cho đặc tả các thuộc tính khác nhau như những giá trị và sự ràng buộc toàn vẹn.
Hơn nữa, WSML-Light kết hợp chặc chẽ một ngôn ngữ quy tắc, trong khi vẫn
còn cho phép dễ quyết định hiệu quả cơng việc. Chính xác hơn nữa, WSML-


11

Light cho phép bất kỳ quy tắc Datalog nào, mở rộng với sự khác nhau, và sếp
thành tầng phủ định.
· WSML-Rule : mở rộng của WSML-Light đủ khả năng cho ngơn ngữ lập trình
Logic, bởi việc cho phép những ký hiệu hàm và những quy tắc khơng an tồn.
· WSML-Full : hợp nhất của tất cả các loại WSML.
Với các kiểu của WSML trên, hệ thống CSML đã kiểm tra và hoạt động tốt với
WSML-Rule cịn các kiểu khác thì chưa có thời gian cho phép để xem xét và đánh giá.
Nhưng hệ thống CSML dùng các dữ liệu vào (Precondition) và dữ liệu ra
(Postcondition) để giải quyết vấn đề kết nối nên hệ thống cũng có thể hoạt động tốt với
các kiểu còn lại.
2.2 Dịch vụ Web ngữ nghĩa

Các dịch vụ Web (Web services) là những chương trình tiện ích được truy xuất
qua môi trường Internet sử dụng giao thức HTTP. Dựa trên sự phát triển gần đây của
Web có ngữ nghĩa (Semantic Web), các dịch vụ Web có ngữ nghĩa (Semantic Web
Service) được giới thiệu. Các dịch vụ Web có ngữ nghĩa sử dụng Ontology để mơ tả
ngữ nghĩa của các dịch vụ được cung cấp, nhờ đó ý nghĩa và kết quả xuất của các dịch
vụ Web có thể được hiểu rõ bởi con người lẫn các chương trình máy tính. Các dịch vụ
Web có ngữ nghĩa, nhờ vậy, có thể sử dụng để quản lý và cập nhật thông tin tự động
trên hệ thống thông tin.
Dịch vụ Web ngữ nghĩa là sự mở rộng của dịch vụ Web bằng cách dùng tri thức
để hiển thị kỹ thuật của Web ngữ nghĩa. Làm cho dịch vụ Web ngữ nghĩa trở nên thực
tế, ngôn ngữ mô tả (markup languages) phải được mơ tả một cách thích đáng để cho
máy có thể hiểu được. u cầu một ngơn ngữ như vậy bao gồm:
· Khám phá tự động (Automatic Discovery): Khám phá dịch vụ Web tự động là
một quá trình tự động hoặc xác định các dịch vụ Web mà đáp ứng được yêu cầu


12

của người dùng. Ví dụ, người dùng mong muốn tìm kiếm một dịch vụ bán máy
tính và chấp nhận thanh tốn qua thẻ tín dụng (Credit card). Hiện tại, cơng việc
này phải được thực hiện bởi con người như dùng một máy tìm kiếm để tìm một
dịch vụ. Sau đó sẽ xử lý kết quả thông qua trang Web và thực thi dịch vụ bằng
tay. Thứ nhất nó được xác định, ngay cả nếu giao thức UDDI (Universal
Description, Discovery and Integration) được dùng để xác định dịch vụ Web,
kết quả tìm kiếm vẫn bị thiếu sót. Với dịch vụ Web ngữ nghĩa, thông tin cần
thiết cho khám phá dịch vụ có thể đặc tả như một máy tính có thể thông dịch
ngữ nghĩa (semantic markup). Và một dịch vụ đăng ký hay tác nhân có thể được
dùng để xác định tự động dịch vụ.
· Thực thi tự động (Automatic Invocation): Một tác nhân phần mềm hoặc một
chương trình máy tính phải có thể được xác định tự động cách nào để thực thi

dịch vụ. Dịch vụ Web ngữ nghĩa cung cấp một đặc tả của những gì mà tác nhân
cần để thực thi dịch vụ. Một tác nhân phần mềm nên được thông dịch đặc tả để
xác định đâu là đầu vào và cần thiết để thực thi dịch vụ, và thơng tin gì sẽ được
trả về.
· Kết nối tự động (Automatic Composition): Tác vụ này bao gồm chọn lọc tự
động, kết nối và interoperation của dịch vụ Web để thực thi vài tác vụ phức tạp
hoặc một mô tả ở mức cao cung cấp bởi người yêu cầu. Hiện tại, người dùng
phải tự chọn lọc dịch vụ Web và đặc tả kết nối. Với dịch vụ Web ngữ nghĩa, các
tác nhân phầm mềm đựơc mong đợi để chọn lọc và kết nối một số của dịch vụ
Web để hoàn thành mục tiêu phức tạp.
· Giám sát tự động (Automatic Monitoring): Trong khi hệ thống đang thực thi,
các tác nhân phần mềm có thể kiểm tra, xem xét các thuộc tính dịch vụ một cách
tự động.


×