Tải bản đầy đủ (.pdf) (155 trang)

nghiên cứu phương pháp chuyển đổi giữa mô h̀nh mức khái niệm và ontology

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.81 MB, 155 trang )

ĐẠI HỌC HUẾ
TRƯỜNG ĐẠI HỌC KHOA HỌC

VÕ HOÀNG LIÊN MINH

NGHIÊN CỨU PHƯƠNG PHÁP CHUYỂN ĐỔI
GIỮA MƠ HÌNH MỨC KHÁI NIỆM VÀ
ONTOLOGY

NGÀNH: KHOA HỌC MÁY TÍNH
MÃ NGÀNH: 9.48.01.01
LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học:
1. PGS. TS. HOÀNG QUANG
2. PGS. TS. HOÀNG HỮU HẠNH

HUẾ - NĂM 2021



LỜI CAM ĐOAN

Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng cá nhân tôi. Nội dung
tham khảo từ các cơng trình khác đều được trích dẫn rõ ràng. Các kết quả viết chung
với các tác giả khác đều được sự đồng ý trước khi đưa vào luận án. Các kết quả của
luận án là trung thực và chưa được cơng bố trong các cơng trình khác ngồi các cơng
trình của tác giả.
Nghiên cứu sinh

Võ Hồng Liên Minh


i


LỜI CẢM ƠN
Trong quá trình thực hiện luận án tiến sĩ, tôi đã nhận được sự hỗ trợ quý báu từ
nhiều cá nhân, cơ quan và đơn vị.
Trước hết tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS. TS. Hoàng Quang và
PGS. TS. Hoàng Hữu Hạnh đã hướng dẫn tận tình cho tơi các phương pháp nghiên
cứu, phương pháp viết bài báo khoa học và phương pháp tổng hợp tri thức trong q
trình học tập, nghiên cứu.
Tơi xin chân thành cảm ơn lãnh đạo trường Đại học Khoa học – Đại học Huế
đã tạo điều kiện thuận lợi trong suốt quá trình học tập và thực hiện luận án, xin cảm
ơn tập thể thầy cô giáo Khoa Công nghệ thông tin của Trường đã giúp đỡ và động
viên, đóng góp các ý kiến q giá để hồn thiện cơng trình nghiên cứu này.
Tơi xin gửi lời cảm ơn đến cơ quan công tác, tất cả người thân, bạn bè và những
người xung quanh luôn chia sẻ, động viên trong những lúc khó khăn.
Cuối cùng, xin bày tỏ lịng biết ơn vô hạn đối với cha mẹ và gia đình đã ln
ủng hộ, giúp đỡ trong suốt q trình thực hiện luận án.
Nghiên cứu sinh

Võ Hoàng Liên Minh

ii


MỤC LỤC

LỜI CAM ĐOAN ....................................................................................................... i
LỜI CẢM ƠN ............................................................................................................ ii
MỤC LỤC ................................................................................................................. iii

DANH MỤC CHỮ VIẾT TẮT................................................................................. vi
DANH MỤC THUẬT NGỮ ................................................................................... viii
DANH MỤC KÝ HIỆU ............................................................................................ ix
DANH MỤC HÌNH ẢNH ........................................................................................ xi
DANH MỤC BẢNG BIỂU .................................................................................... xiv
PHẦN MỞ ĐẦU .........................................................................................................1
CHƯƠNG 1. TỔNG QUAN VỀ MƠ HÌNH CƠ SỞ DỮ LIỆU MỨC KHÁI NIỆM
VÀ ONTOLOGY ........................................................................................................6
1.1 Giới thiệu các mô hình cơ sở dữ liệu mức khái niệm .....................................7
1.1.1

Mơ hình ER .............................................................................................7

1.1.2

Mơ hình ER mở rộng ..............................................................................9

1.1.3

Giới thiệu mơ hình TimeER .................................................................12

1.1.4

Biểu đồ lớp UML ..................................................................................13

1.2 Giới thiệu về Web ngữ nghĩa và Ontology ...................................................17
1.2.1

Thể hiện ................................................................................................17


1.2.2

Lớp ........................................................................................................17

1.2.3

Thuộc tính .............................................................................................18

1.2.4

Quan hệ .................................................................................................18

1.2.5

Ngôn ngữ của ontology.........................................................................18

1.2.6

RDF Schema .........................................................................................19

1.2.7

Ngôn ngữ OWL ....................................................................................19

1.2.8

OWL2 ...................................................................................................23

1.2.9


Trình soạn thảo ontology ......................................................................27

1.3 Tổng quan về các nghiên cứu chuyển đổi các mơ hình ................................27

iii


1.3.1
OWL

Các kết quả đề xuất chuyển đổi mơ hình thực thể - mối quan hệ sang
27

1.3.2

Các kết quả đề xuất chuyển đổi biểu đồ lớp UML sang OWL.............30

1.3.3
OWL

Các kết quả đề xuất trích xuất mơ hình cơ sở dữ liệu mức khái niệm từ
34

1.4 Tổng kết chương 1 ........................................................................................35
CHƯƠNG 2. CHUYỂN ĐỔI MƠ HÌNH THỰC THỂ - MỐI QUAN HỆ SANG
OWL ..........................................................................................................................37
2.1 Giới thiệu .......................................................................................................37
2.2 Các nghiên cứu trước đây .............................................................................38
2.2.1


Chuyển đổi tập thực thể ........................................................................39

2.2.2

Chuyển đổi mối quan hệ kế thừa (Is-A) ...............................................39

2.2.3

Chuyển đổi thuộc tính ...........................................................................42

2.2.4

Chuyển đổi mối quan hệ .......................................................................46

2.3 Các quy tắc chuyển đổi bổ sung....................................................................49
2.3.1

Chuyển đổi thực thể yếu và mối quan hệ định danh.............................49

2.3.2

Chuyển đổi thuộc tính đa trị phức hợp lồng nhau ................................51

2.3.3

Chuyển đổi mối quan hệ phản xạ .........................................................54

2.4 Chuyển đổi mô hình TimeER sang OWL .....................................................62
2.4.1


Tạo ontology ban đầu biểu diễn yếu tố thời gian .................................63

2.4.2

Chuyển đổi tập thực thể có yếu tố thời gian .........................................64

2.4.3

Chuyển đổi thuộc tính có yếu tố thời gian ............................................66

2.4.4

Chuyển đổi mối quan hệ có yếu tố thời gian ........................................67

2.4.5

Chuyển đổi thuộc tính có yếu tố thời gian của mối quan hệ ................68

2.5 Kết quả thực nghiệm .....................................................................................71
2.6 Tổng kết chương 2 ........................................................................................78
CHƯƠNG 3. CHUYỂN ĐỔI BIỂU ĐỒ LỚP UML SANG OWL .........................79
3.1 Các nghiên cứu trước đây .............................................................................79
3.1.1

Chuyển đổi lớp ......................................................................................80

3.1.2

Chuyển đổi thuộc tính ...........................................................................81


3.1.3

Chuyển đổi quan hệ giữa các lớp ..........................................................83
iv


3.2 Các quy tắc chuyển đổi bổ sung....................................................................89
3.2.1

Chuyển đổi thuộc tính có cấu trúc ........................................................89

3.2.2

Chuyển đổi quan hệ kết hợp phản xạ ....................................................90

3.2.3

Chuyển đổi quan hệ kết tập chia sẻ ......................................................92

3.2.4

Chuyển đổi quan hệ kết hợp có yếu tố hạn định...................................93

3.3 Kết quả thực nghiệm .....................................................................................96
3.4 Tổng kết Chương 3 .....................................................................................100
CHƯƠNG 4. TRÍCH XUẤT MƠ HÌNH CƠ SỞ DỮ LIỆU MỨC KHÁI NIỆM TỪ
OWL ONTOLOGY ................................................................................................102
4.1 Trích xuất mơ hình EER từ OWL ...............................................................102
4.1.1


Các quy tắc trích xuất đã đề xuất ........................................................102

4.1.2

Các quy tắc trích xuất bổ sung ............................................................108

4.1.3

Thuật tốn trích xuất mơ hình EER ....................................................113

4.1.4

Ví dụ minh họa ...................................................................................115

4.2 Trích xuất biểu đồ lớp UML từ OWL .........................................................117
4.2.1

Trích xuất lớp ......................................................................................117

4.2.2

Trích xuất thuộc tính ...........................................................................117

4.2.3

Trích xuất quan hệ giữa các lớp ..........................................................119

4.2.4

Ví dụ minh họa ...................................................................................126


4.3 Tổng kết chương 4 ......................................................................................128
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ..............................................................129
DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ........................131
TÀI LIỆU THAM KHẢO .......................................................................................132

v


DANH MỤC CHỮ VIẾT TẮT
Từ
viết
tắt
BT

Nội dung viết tắt tiếng
Anh
BiTemporal

Diễn giải tiếng Việt

Thời gian hợp lệ và thời gian giao tác
Cơ sở dữ liệu

CSDL
LS

LifeSpan

Thời gian sống là thời gian mà một thực

thể tồn tại trong thực tế.

Lse

LifeSpan end

Thời gian sống kết thúc

LSs

LifeSpan start

Thời gian sống bắt đầu

LT

Lifespan and Transaction
time

Thời gian sống và thời gian giao tác

MDA

Model Driven Architecture

Kiến trúc hướng mô hình

OCL

Object Constraint Language


Ngơn ngữ ràng buộc đối tượng
Ngơn ngữ xây dựng mơ hình phần mềm
được định nghĩa như một chuẩn thêm vào
UML cho phân tích và thiết kế hướng đối
tượng.

ODM

Ontology Definition
Metamodel

Đặc tả của Object Management Group
(OMG) để tạo ra các khái niệm về kiến
trúc hướng mơ hình có thể áp dụng cho
việc xây dựng ontology.

OWL

Web Ontology Language

Ngôn ngữ ontology

QVT

OMG's
Bộ ngôn ngữ tiêu chuẩn để chuyển đổi mơ
Query/View/Transformation hình được xác định bởi Object
Management Group.


SASD Structured Analysis and
Structured Design

Phân tích và thiết kế cấu trúc

TT

Transaction Time

Thời gian giao tác là thời gian mà một
thực thể/sự kiện là hiện thời trong CSDL

TTe

Transaction Time end

Thời gian kết thúc giao tác

TTs

Transaction Time start

Thời gian bắt đầu giao tác

UML

Unified Modeling Language Ngơn ngữ mơ hình hóa thống nhất

VT


Valid Time

Thời gian hợp lệ là thời gian mà một sự
kiện được xem là đúng trong thực tế.
vi


VTe

Valid Time end

Thời gian kết thúc hợp lệ

VTs

Valid Time start

Thời gian bắt đầu hợp lệ

W3C

World Wide Web
Consortium

Tổ chức tiêu chuẩn quốc tế về World Wide
Web.

XMI

XML Metadata Interchange


Một chuẩn OMG cho việc trao đổi siêu dữ
liệu metadata giữa các công cụ, kho dữ liệu
và các ứng dụng, cho phép người dùng mô
tả đối tượng bằng XML.

vii


DANH MỤC THUẬT NGỮ
Thuật ngữ

Diễn giải tiếng Việt

Close World Assumption

Giả thiết thế giới đóng

CSDL

Cơ sở dữ liệu

Data property

Thuộc tính dữ liệu

disjoint

Phân ly


Domain

Miền xác định (của thuộc tính)
Miền của một thuộc tính chỉ định tập hợp các đối
tượng có thể liên quan đến các giá trị khác với
thuộc tính.

Object property

Thuộc tính đối tượng

Open World Assumption

Giả thiết thế giới mở

overlap

Chồng lấp

Range

Phạm vi (của thuộc tính)
Phạm vi của thuộc tính chỉ định tập hợp các đối
tượng hoặc giá trị dữ liệu có thể liên quan đến từ
các đối tượng khác với thuộc tính.

viii


DANH MỤC KÝ HIỆU

Ký hiệu

Diễn giải tiếng Việt

attE

Thuộc tính đơn trị attE của tập thực thể E.

attU

Thuộc tính attU của lớp U trong biểu đồ lớp UML.

C(E)

Lớp C(E) trong OWL, được chuyển đổi từ tập thực thể E của mơ
hình ER.

C(U)

Lớp C(U) trong OWL, được chuyển đổi từ lớp U của biểu đồ lớp
UML.

COWL

Tập các lớp trong OWL

DP(attE)

Thuộc tính dữ liệu DP(attE) trong OWL, được chuyển đổi từ thuộc
tính đơn trị attE của mơ hình ER.


DP(attU)

Thuộc tính dữ liệu DP(attU) trong OWL, được chuyển đổi từ thuộc
tính attU của biểu đồ lớp UML.

DP_attEOWL Tập các thuộc tính dữ liệu trong OWL.
E

Tập thực thể mạnh E của mơ hình ER.

ER

Mơ hình ER mở rộng để thực hiện chuyển đổi (đầu vào của thuật
tốn).

fileER,
fileUML,
fileOWL

Là các file xml mơ tả cho các mơ hình EER, biểu đồ lớp UML và
OWL ontology

keyE

Thuộc tính khóa keyE của tập thực thể E.

OP_attEOWL Tập các thuộc tính đối tượng trong OWL
OWL


OWL ontology (đầu ra của thuật toán).

Q

Yếu tố hạn định Q trong quan hệ kết hợp giữa lớp tổng thể A với lớp
bộ phận F

R

Mối quan hệ nhị ngun R của mơ hình ER.

R

Quan hệ R trong biểu đồ lớp UML.

role

Vai trò của quan hệ trong biểu đồ lớp UML

sub_attU

Thuộc tính thuộc tính thành phần sub_attU là con thuộc tính attU
của lớp U trong biểu đồ lớp UML.

sub_E

Tập thực thể sub_E kế thừa từ tập thực thể E

TimeER


Mơ hình có yếu tố thời gian TimeER để thực hiện chuyển đổi (đầu
vào của thuật toán).

ix


U

Lớp U của biểu đồ lớp UML.

UML

Biểu đồ lớp UML để thực hiện chuyển đổi (đầu vào của thuật toán).

UML

Biểu đồ lớp UML để thực hiện chuyển đổi (đầu vào của thuật toán).

W

Tập thực thể yếu W.

x


DANH MỤC HÌNH ẢNH

Hình 1.1 Biểu diễn lớp cha và lớp con trong mơ hình EER ...................................9
Hình 1.2 Ký hiệu chun biệt hóa và các lớp con trong mơ hình EER ................10
Hình 1.3 Ví dụ hai tập thực thể CAR và TRUCK ................................................11

Hình 1.4 Ví dụ tổng qt hố................................................................................12
Hình 1.5 Ví dụ về vai trị trong quan hệ ...............................................................15
Hình 1.6 Ví dụ về quan hệ tổng qt hóa .............................................................15
Hình 1.7 Ví dụ về quan hệ kết hợp .......................................................................16
Hình 1.8 Ví dụ về quan hệ kết tập thơng thường ..................................................16
Hình 1.9 Ví dụ về quan hệ kết tập chia sẻ ............................................................16
Hình 1.10 Biểu diễn thuộc tính kiểu dữ liệu name của lớp StaffMember ............22
Hình 1.11 Biểu diễn thuộc tính đối tượng isTaughtBy.........................................22
Hình 2.1 Kiến trúc các bước chuyển đổi từ mơ hình CSDL mức khái niệm sang
OWL ..........................................................................................................................38
Hình 2.2 Chuyển đổi tập thực thể con trong mối quan hệ kế thừa. ......................39
Hình 2.3 Chuyển đổi ràng buộc phân ly trong cấu trúc chun biệt hóa/tổng qt
hóa .............................................................................................................................40
Hình 2.4 Chuyển đổi tập thực thể con trong ràng buộc phân ly trong cấu trúc
Chun biệt hóa/Tổng qt hóa ................................................................................40
Hình 2.5 Chuyển đổi tập thực thể con trong ràng buộc chồng lấp trong cấu trúc
Chun biệt hóa/Tổng qt hóa ................................................................................41
Hình 2.6 Ví dụ chuyển đổi ràng buộc chồng lấp trong cấu trúc Chuyên biệt
hóa/Tổng qt hóa .....................................................................................................41
Hình 2.7 Chuyển đổi tập thực thể Employee và thuộc tính. .................................44
Hình 2.8 Ví dụ chuyển đổi thuộc tính đa trị .........................................................45
Hình 2.9 Ví dụ chuyển đổi thuộc tính phức hợp ..................................................45
Hình 2.10 Ví dụ chuyển đổi mối quan hệ khơng có thuộc tính ............................46
Hình 2.11 Ví dụ chuyển đổi mối quan hệ nhị ngun có thuộc tính. ...................48
Hình 2.12 Chuyển đổi tập thực thể yếu và mối quan hệ định danh. .....................50
Hình 2.13 Ví dụ thuộc tính đa trị phức hợp lồng nhau .........................................51
Hình 2.14 Kết quả chuyển đổi thuộc tính đa trị phức hợp lồng nhau sang OWL 53

xi



Hình 2.15 Ví dụ biểu diễn mối quan hệ phản xạ đối xứng bằng đồ thị có hướng G
...................................................................................................................................55
Hình 2.16 Các loại mối quan hệ phản xạ và ví dụ các kiểu mối quan hệ phản xạ
trên tập thực thể Employee........................................................................................55
Hình 2.17 Ví dụ chuyển đổi mối quan hệ phản xạ đối xứng khơng có thuộc tính
...................................................................................................................................57
Hình 2.18 Ví dụ chuyển đổi mối quan hệ phản xạ đối xứng có thuộc tính ..........58
Hình 2.19 Ví dụ chuyển đổi mối quan hệ phản xạ bất đối xứng khơng có thuộc
tính. ............................................................................................................................59
Hình 2.20 Ví dụ chuyển đổi mối quan hệ phản xạ bất đối xứng có thuộc tính ....60
Hình 2.21 Ví dụ mơ hình TimeER........................................................................63
Hình 2.22 Ontology biểu diễn yếu tố thời gian ....................................................64
Hình 2.23 Chuyển đổi yếu tố thời gian của tập thực thể ......................................65
Hình 2.24 Chuyển đổi thuộc tính có yếu tố thời gian của tập thực thể ................66
Hình 2.25 Chuyển đổi mối quan hệ có yếu tố thời gian .......................................68
Hình 2.26 Chuyển đổi thuộc tính có yếu tố thời gian của mối quan hệ ...............69
Hình 2.27 So sánh hiệu suất chuyển đổi giữa các phương pháp trên mơ hình thư
mục trích dẫn .............................................................................................................73
Hình 2.28 So sánh hiệu suất chuyển đổi giữa các phương pháp trên mơ hình
Elmasri ......................................................................................................................73
Hình 2.29 Mơ hình EER của Elmasri ...................................................................75
Hình 2.30 Mơ hình OWL chuyển đổi từ Hình 2.29..............................................76
Hình 2.31 Giao diện ứng dụng chuyển đổi mơ hình Elmasri sang OWL ontology
...................................................................................................................................77
Hình 3.1 Ví dụ biểu đồ lớp UML .........................................................................80
Hình 3.2 Ví dụ chuyển đổi thuộc tính và thuộc tính có cấu trúc của lớp đối tượng
...................................................................................................................................81
Hình 3.3 Ví dụ chuyển đổi kiểu dữ liệu liệt kê .....................................................82
Hình 3.4 Ví dụ chuyển đổi quan hệ kết hợp và thuộc tính có kiểu dữ liệu là lớp 84

Hình 3.5 Ví dụ chuyển đổi quan hệ kết hợp có lớp kết hợp .................................85
Hình 3.6 Ví dụ kết tập thơng thường ....................................................................86
Hình 3.7 Chuyển đổi quan hệ phụ thuộc ..............................................................87
Hình 3.8 Ví dụ chuyển đổi quan hệ tổng qt hóa/chun biệt hóa .....................89
Hình 3.9 Ví dụ chuyển đổi mối quan hệ phản xạ đối xứng ..................................91
xii


Hình 3.10 Ví dụ chuyển đổi mối quan hệ đệ quy bất đối xứng ............................91
Hình 3.11 Ví dụ chuyển đổi quan hệ kết tập chia sẻ ............................................93
Hình 3.12 Ví dụ chuyển đổi quan hệ kết hợp có yếu tố hạn định ........................94
Hình 3.13 So sánh hiệu suất chuyển đổi trên biểu đồ lớp UML Purchase Order
Application ................................................................................................................97
Hình 3.14 So sánh hiệu suất chuyển đổi trên biểu đồ lớp UML Elmasri .............98
Hình 3.15 Kết quả chuyển đổi trên OntoGraf.......................................................98
Hình 3.16 Mơ hình OWL chuyển đổi từ Hình 3.1 ...............................................99
Hình 3.17 Một phần kết quả OWL2 chuyển đổi từ biểu đồ lớp ở Hình 3.1 ......100
Hình 4.1. Trích xuất thuộc tính đơn trị ...............................................................103
Hình 4.2. Trích xuất thuộc tính đa trị Location ..................................................105
Hình 4.3. Trích xuất thành mối quan hệ nhị ngun 1-1 ....................................107
Hình 4.4. Trích xuất thành thuộc tính phức hợp .................................................109
Hình 4.5. Trích xuất mối quan hệ phản xạ đối xứng ..........................................110
Hình 4.6. Trích xuất mối quan hệ phản xạ bất đối xứng ....................................112
Hình 4.7. Sơ đồ phân tích các khả năng nhận dạng thành mơ hình EER ...........113
Hình 4.8 Mơ hình EER trích xuất .......................................................................116
Hình 4.9. Ví dụ biểu diễn quan hệ kết hợp với bản số 1..N ...............................121
Hình 4.10. Quan hệ tổng qt hóa/chun biệt hóa............................................122
Hình 4.11. Quan hệ kế thừa bội ..........................................................................123
Hình 4.12. Quan hệ phụ thuộc ............................................................................124
Hình 4.13. Sơ đồ phân tích các khả năng nhận dạng thành biểu đồ lớp UML ...124

Hình 4.14 Biểu đồ lớp UML trích xuất ..............................................................127

xiii


DANH MỤC BẢNG BIỂU
Bảng 1.1 Bản số trong UML .................................................................................15
Bảng 1.2 Các cú pháp áp dụng cho lớp ................................................................20
Bảng 1.3 Ý nghĩa một số cú pháp ràng buộc trong OWL ....................................21
Bảng 1.4 Các kiểu thuộc tính đối tượng trong OWL............................................22
Bảng 2.1 Cặp thuộc tính thêm vào khi chuyển đổi thuộc tính đa trị phức hợp lồng
nhau ...........................................................................................................................52
Bảng 2.2 Các thuộc tính khóa tương ứng với yếu tố thời gian .............................65
Bảng 2.3 Các cơ sở dữ liệu được thực nghiệm trong luận án...............................71
Bảng 3.1 Các cơ sở dữ liệu được thực nghiệm trong luận án...............................96
Bảng 4.1 Bản số của thuộc tính đối tượng OP giữa hai lớp ...............................107
Bảng 4.2 Cấu trúc trích xuất tổng qt hóa/chun biệt hóa ..............................108
Bảng 4.3 Các trường hợp chuyển đổi quan hệ tổng quát hóa/chuyên biệt hóa ..122

xiv


PHẦN MỞ ĐẦU
1. Tính cấp thiết của đề tài luận án
Ngành cơng nghệ phần mềm đã có nhiều đột phá quan trọng trong việc thiết kế
các mơ hình cơ sở dữ liệu, đặc biệt là mơ hình ở mức khái niệm. Về cơ bản, thiết kế
các mơ hình cơ sở dữ liệu dựa trên ý tưởng của kiến trúc hướng mơ hình (MDA). Các
chức năng hệ thống sẽ được định nghĩa như là một mơ hình nền độc lập bằng cách sử
dụng ngơn ngữ đặc tả thích hợp, sau đó chuyển đổi sang các mơ hình cuối để thực
hiện việc cài đặt.

Mơ hình dữ liệu mức khái niệm được sử dụng để biểu diễn các đối tượng trong
thế giới thực và mối quan hệ giữa các đối tượng đó. Do đặc điểm phản ảnh tốt thế
giới thực, mơ hình thực thể - mối quan hệ (mơ hình ER) và các mở rộng của nó được
xem là các mơ hình dữ liệu ở mức khái niệm. Ngồi ra, để mơ hình hóa các hệ thống
thơng tin bằng tập các thuộc tính và các phương thức nhằm phản ảnh cấu trúc dữ liệu
của lớp, thì biểu đồ lớp UML cũng là một trong những mơ hình dữ liệu ở mức khái
niệm được sử dụng để mô tả và phản ảnh tốt thế giới thực của các hệ thống thông tin.
Theo W3C, thông tin được cung cấp bởi các trang web chiếm gần 70% lượng
thơng tin trao đổi trên tồn thế giới. Web đã trở thành một hệ thống dữ liệu khổng lồ
và là một môi trường chuyển tải thông tin không thể thiếu được trong thời đại ngày
nay. Vấn đề đặt ra là làm thế nào để khai thác được thông tin trên Web một cách hiệu
quả, mà cụ thể là làm sao để máy tính có thể hiểu và hỗ trợ con người xử lý tự động
được các thơng tin đó. Chính vì vậy, Web ngữ nghĩa đã ra đời, trong đó thơng tin
được định nghĩa rõ ràng, từ đó giúp cho con người và máy tính có thể cùng làm việc
với nhau một cách hiệu quả.
Ontology là một thuật ngữ khoa học dùng để mô tả các loại thực thể trong thế
giới thực và mối quan hệ giữa các thực thể đó như thế nào. Ontology cung cấp cách
thức để con người và máy đều có thể nhận biết được các thơng tin, nhờ đó cải thiện
hệ thống tương tác hai chiều và chia sẻ kiến thức, từ đó giúp con người và máy tính
có thể cùng làm việc, giúp máy tính “hiểu” và có khả năng xử lý thơng tin hiệu quả.
Một lợi ích quan trọng của việc sử dụng ontology là khả năng tìm kiếm ngữ nghĩa.

1


Vì vậy, W3C thiết kế OWL là một ngơn ngữ mơ tả các lớp, các thuộc tính và các mối
quan hệ giữa các đối tượng theo cách mà máy có thể hiểu được nội dung web.
Tuy nhiên, hầu hết dữ liệu đã được mơ hình hóa và lưu trữ trong các cơ sở dữ
liệu truyền thống (CSDL quan hệ, đối tượng), nên các dữ liệu đó nằm ngồi khả năng
của nhiều ứng dụng của web ngữ nghĩa. Với sự phát triển của web ngữ nghĩa như

hiện nay, việc tích hợp các ứng dụng web hiện tại vào web ngữ nghĩa đang trở nên là
vấn đề cấp thiết. Ngoài ra, việc thiết kế cơ sở dữ liệu cho các ứng dụng hiện tại thường
được thiết kế từ mơ hình dữ liệu mức khái niệm, trong khi web ngữ nghĩa lại chủ yếu
được xây dựng trên các ontology được biểu diễn bằng OWL. Vì thế, việc nâng cấp
một hệ thống thơng tin bằng cách chuyển đổi các mơ hình cơ sở dữ liệu mức khái
niệm sang ontology cho phép kế thừa các cấu trúc dữ liệu trên các hệ thống cũ nhằm
giảm chi phí trong việc thiết kế là có ý nghĩa khoa học và ứng dụng thực tiễn.
2. Động lực nghiên cứu
Web ngữ nghĩa là một lĩnh vực đang phát triển rất nhanh và nhận được sự quan
tâm của cộng đồng nghiên cứu trong thời gian qua. Để nâng cấp các hệ thống thông
tin trước đây trên nền web ngữ nghĩa nhằm kế thừa các kiến trúc dữ liệu trên các hệ
thống cũ, giải pháp ít tốn kém chi phí nhất là chuyển đổi mơ hình cơ sở dữ liệu mức
khái niệm đã có sang ontology.
Đã có nhiều cơng trình nghiên cứu đề xuất việc chuyển đổi giữa mơ hình cơ sở
dữ liệu mức khái niệm và ontology như: chuyển đổi mơ hình ER sang OWL ontology,
chuyển đổi biểu đồ lớp UML sang OWL ontology, chuyển đổi từ OWL ontology sang
mô hình ER... Trong các nghiên cứu đã cơng bố, các tác giả chỉ mới đề xuất chuyển
đổi các trường hợp chung của mơ hình mức khái niệm và OWL ontology. Nhưng thực
tế, nhiều hệ thống thông tin được thiết kế để đảm bảo phản ảnh đúng bản chất của thế
giới thực, với nhiều thành phần mở rộng. Nếu áp dụng các quy tắc chuyển đổi của
các nghiên cứu trước đây sẽ khơng chuyển đổi đầy đủ các mơ hình. Vì vậy, chúng ta
nhận thấy rằng, đề xuất bộ quy tắc đầy đủ để chuyển đổi các thành phần của mô hình
mức khái niệm và OWL ontology là một vấn đề quan trọng trong việc nâng cấp các
hệ thống thông tin cũ.
3. Mục tiêu của luận án
2


Mục tiêu của luận án là nghiên cứu và phát triển các phương pháp chuyển đổi
giữa một mơ hình dữ liệu mức khái niệm (như mơ hình ER, EER, biểu đồ lớp UML)

và OWL. Vì vậy luận án thực hiện các mục tiêu cụ thể gồm: (1) chuyển đổi mô hình
thực thể - mối quan hệ sang OWL ontology; (2) chuyển đổi biểu đồ lớp UML sang
OWL ontology; (3) trích xuất mơ hình dữ liệu mức khái niệm từ OWL ontology.
4. Phương pháp nghiên cứu
Phương pháp nghiên cứu lý thuyết: Tìm kiếm, thu thập tài liệu về các cơng trình
nghiên cứu đã được công bố, các bài báo đăng ở các hội thảo và tạp chí có uy tín để
nghiên cứu, từ đó bổ sung các quy tắc và phương pháp chuyển đổi giữa một mơ hình
cơ sở dữ liệu mức khái niệm và ontology. Trên cơ sở này, luận án phân tích, đánh giá
ưu và khuyết điểm của các đề xuất.
Phương pháp thực nghiệm: Thực hiện việc cài đặt các thuật toán chuyển đổi của
luận án nhằm minh chứng tính khả thi của phương pháp chuyển đổi.
5. Nội dung và bố cục của luận án
Nội dung của luận án được tổ chức thành bốn chương như sau:
Chương 1 trình bày tổng quan về các mơ hình cơ sở dữ liệu mức khái niệm như
mơ hình thực thể - mối quan hệ, biểu đồ lớp UML, khái niệm web ngữ nghĩa và ngơn
ngữ OWL ontology; khảo sát, phân tích một số cơng trình nghiên cứu liên quan đến
bài tốn chuyển đổi giữa mơ hình cơ sở dữ liệu mức khái niệm và OWL ontology;
phân tích chi tiết các đặc điểm tương đương giữa mơ hình cơ sở dữ liệu mức khái
niệm và OWL ontology; Từ đó luận án định hướng bổ sung các quy tắc chuyển đổi
giữa một mơ hình cơ sở dữ liệu mức khái niệm và OWL ontology.
Chương 2 tổng hợp và phân tích kết quả chuyển đổi giữa mơ hình ER, EER và
OWL ontology của một số cơng trình nghiên cứu, quy tắc hóa thống nhất các quy tắc
chuyển đổi theo quy ước của luận án; đề xuất các quy tắc bổ sung chuyển đổi các
thành phần của mơ hình EER sang OWL ontology; trình bày kết quả thực nghiệm
được kiểm chứng trên phần mềm Protégé và các bộ suy luận HermiT 1.3.8.3,
FaCT+++.
Chương 3 tổng hợp và phân tích kết quả chuyển đổi giữa biểu đồ lớp UML và
OWL ontology của một số cơng trình nghiên cứu, quy tắc hóa thống nhất các quy tắc
3



chuyển đổi theo quy ước của luận án; đề xuất bổ sung các quy tắc chuyển đổi một
biểu đồ lớp UML sang OWL ontology dựa vào các đặc điểm tương đồng giữa biểu
đồ lớp UML và OWL ontology; kết quả thực nghiệm cũng được kiểm chứng trên
Protégé và các bộ suy luận.
Chương 4 đề xuất các quy tắc trích xuất một mơ hình dữ liệu mức khái niệm từ
một ontology cho trước; trích xuất các thành phần của mơ hình mức khái niệm bằng
cách phân tích cấu trúc thành phần của ngơn ngữ OWL ontology. Vấn đề trích xuất
một mơ hình cơ sở dữ liệu mức khái niệm từ OWL ontology được xem là việc xác
định một ánh xạ ngược của ánh xạ chuyển đổi từ mơ hình cơ sở dữ liệu mức khái
niệm sang ontology, cho phép "điều tra" một mơ hình dữ liệu mức khái niệm có thể
đã được sử dụng để thiết kế một ontology. Mỗi phương pháp trích xuất đều được
minh họa để kiểm chứng kết quả.
6. Đóng góp của luận án
Đóng góp chính trong luận án là bổ sung các quy tắc nhằm cho phép thực hiện
việc chuyển đổi giữa một mơ hình cơ sở dữ liệu mức khái niệm và OWL ontology.
Các đóng góp cụ thể bao gồm:
- Kế thừa các quy tắc chuyển đổi từ mơ hình ER sang OWL ontology đã đề xuất
như chuyển đổi tập thực thể, thuộc tính và mối quan hệ, từ đó luận án đã đề xuất bổ
sung các quy tắc chuyển đổi phân lớp chồng lấp, tổng quát hợp nhất, thuộc tính đa trị
phức hợp lồng nhau, quan hệ phản xạ. Luận án đề xuất bổ sung phương pháp chuyển
đổi mơ hình có yếu tố thời gian TimeER gồm các trường hợp, như yếu tố thời gian
của tập thực thể, thuộc tính có yếu tố thời gian, mối quan hệ có yếu tố thời gian, thuộc
tính có yếu tố thời gian của mối quan hệ.
- Đề xuất bổ sung một số quy tắc chuyển đổi biểu đồ lớp UML sang OWL
ontology, cụ thể là chuyển đổi thuộc tính có cấu trúc, thuộc tính có kiểu dữ liệu là
lớp, các mối quan hệ kết hợp có lớp kết hợp, quan hệ kết hợp đệ quy, quan hệ kết hợp
có yếu tố hạn định, quan hệ phụ thuộc.
- Xây dựng phương pháp trích xuất OWL ontology thành mơ hình cơ sở dữ liệu
mức khái niệm. Cụ thể là bổ sung phương pháp trích xuất thuộc tính phức hợp, mối


4


quan hệ phản xạ của mơ hình ER từ OWL ontology. Đề xuất phương pháp trích xuất
các lớp, thuộc tính và các mối quan hệ của biểu đồ lớp UML từ OWL ontology.
Luận án được hồn thành nhưng khơng tránh những sai sót, vì vậy rất mong
nhận được sự góp ý để Luận án được hoàn thiện hơn.

5


CHƯƠNG 1. TỔNG QUAN VỀ MƠ HÌNH CƠ SỞ DỮ LIỆU MỨC KHÁI
NIỆM VÀ ONTOLOGY
Mơ hình cơ sở dữ liệu là một tập hợp các cấu trúc logic được sử dụng để diễn
tả cấu trúc dữ liệu và các mối quan hệ dữ liệu trong một cơ sở dữ liệu. Mơ hình cơ sở
dữ liệu mức khái niệm tập trung vào bản chất logic của việc biểu diễn dữ liệu. Do đó,
mơ hình cơ sở dữ liệu mức khái niệm liên quan tới các đối tượng được biểu diễn trong
cơ sở dữ liệu hơn là làm thế nào để biểu diễn nó.
Một trong những phương pháp thiết kế cơ sở dữ liệu phổ biến là cách tiếp cận
xuất phát từ mơ hình ở mức khái niệm. Q trình này thường được thực hiện như sau:
Từ yêu cầu của bài toán trong thế giới thực, người phân tích thiết kế hệ thống sẽ thiết
kế CSDL ở mức khái niệm (lược đồ ở mức khái niệm), từ đó thiết kế CSDL ở mức
logic (lược đồ ở mức logic) và cuối cùng là thiết kế CSDL ở mức vật lý (lược đồ ở
mức vật lý).
Nhiều hệ thống phần mềm trước đây được phát triển bằng cách phân tích và
thiết kế cấu trúc, phổ biến nhất là mơ hình thực thể mối - quan hệ (gọi tắt là mơ hình
ER) hoặc mơ hình ER mở rộng. Bên cạnh đó, biểu đồ lớp UML cũng được sử dụng
để mơ hình hóa các hệ thống thơng tin bằng tập các thuộc tính và các phương thức
nhằm phản ảnh cấu trúc dữ liệu của lớp, cho phép mô tả và phản ảnh tốt thế giới thực.

Trên thực tế, hầu hết các ứng dụng trước đây đều được thiết kế từ mơ hình dữ liệu
mức khái niệm. Vì vậy, có một khối lượng khổng lồ các tài nguyên thông tin trên
mạng, điều này làm nảy sinh vấn đề là làm thế nào để tìm kiếm chính xác tài nguyên
mình mong muốn. Web ngữ nghĩa ra đời đã giải quyết bài tốn đó.
Để làm cơ sở cho luận án, chương này giới thiệu tổng quan về các mơ hình cơ
sở dữ liệu mức khái niệm, web ngữ nghĩa và ontology. Đồng thời trình bày các kết
quả nghiên cứu trước đây liên quan đến việc chuyển đổi giữa các mô hình CSDL mức
khái niệm và OWL ontology. Theo đó cấu trúc chương này như sau: Mục 1.1 giới
thiệu về các mơ hình CSDL mức khái niệm, nhưng mơ hình ER và ER mở rộng, biểu
đồ lớp UML. Mục 1.2 sẽ giới thiệu về web ngữ nghĩa và ontology. Mục 1.3 khảo sát,
phân tích một số cơng trình nghiên cứu liên quan đến bài tốn chuyển đổi giữa mơ
hình cơ sở dữ liệu mức khái niệm và OWL ontology; phân tích chi tiết các đặc điểm
6


tương đương giữa mơ hình cơ sở dữ liệu mức khái niệm và OWL ontology; Từ đó
luận án định hướng bổ sung các quy tắc chuyển đổi giữa một mô hình cơ sở dữ liệu
mức khái niệm và OWL ontology trong các chương tiếp theo.
1.1 Giới thiệu các mơ hình cơ sở dữ liệu mức khái niệm
1.1.1 Mơ hình ER
Mơ hình ER được đề xuất bởi P.Chen [1] vào năm 1976, đây là mơ hình ở mức
khái niệm, mơ tả chi tiết một cách logic về tổ chức dữ liệu của một hệ thống thơng
tin. Mơ hình ER cịn được xem là một trong những mơ hình dữ liệu ngữ nghĩa, trên
đó có thể xác định được các thực thể của một hệ thống thông tin và ngữ nghĩa của mơ
hình được thể hiện thơng qua mối quan hệ giữa các thực thể.
1.1.1.1 Tập thực thể
Thực thể là một đối tượng tồn tại mà ta có thơng tin về nó và phân biệt được với
các đối tượng khác. Mỗi tập thực thể có một tập các thuộc tính mà thế giới thực yêu
cầu lưu trữ và quản lý. Thông tin về mỗi thể hiện trong tập thực thể được xác định
bởi một bộ các giá trị của các thuộc tính trong tập thực thể đó. Một thuộc tính hay

một tập các thuộc tính mà các giá trị của nó là xác định duy nhất một thể hiện trong
tập thực thể được gọi là khóa [2].
Tập thực thể yếu là một khái niệm về tập thực thể mà sự tồn tại của nó phụ thuộc
vào sự tồn tại của một hay nhiều tập thực thể khác. Tập thực thể mà nó phụ thuộc vào
gọi là tập thực thể chủ. Tập thực thể yếu có tất cả các đặc điểm của một tập thực thể,
tuy nhiên khóa của tập thực thể yếu được gọi là khóa bộ phận mà để định danh được
thực thể của tập thực thể yếu cần kết hợp khóa bộ phận và khóa của tập thực thể chủ.
1.1.1.2 Thuộc tính
Thuộc tính là đặc tính của một thể hiện hay một mối quan hệ trên ER. Thuộc
tính gồm: Thuộc tính đơn là thuộc tính khơng thể phân nhỏ được; Thuộc tính phức
hợp là thuộc tính có thể phân thành nhiều thuộc tính thành phần; Thuộc tính đơn trị
là thuộc tính chỉ có tối đa một giá trị cho một thể hiện của tập thực thể; Thuộc tính đa
trị là thuộc tính có thể có nhiều giá trị cho một thể hiện của tập thực thể. Thuộc tính
khóa được sử dụng để xác định duy nhất một thực thể, đảm bảo thỏa điều kiện là một
thuộc tính đơn, có thể chỉ có một giá trị, khơng thể null và phải khác biệt về giá trị.
7


1.1.1.3 Mối quan hệ
Để diễn tả số lần tham gia tối thiểu và tối đa của một thực thể vào một mối quan
hệ người ta dùng bản số. Bản số giúp xác định loại của mối quan hệ là 1:1, 1:N, N:1
hay N:N, tức là để xác định mỗi thể hiện của tập thực thể này có liên hệ với tối đa là
bao nhiêu thể hiện của tập thực thể kia thông qua mối quan hệ.
Mối quan hệ diễn tả sự liên quan giữa một hay nhiều thực thể với nhau và có
thể được mơ tả thơng qua ngữ nghĩa thế giới thực. Giữa các tập thực thể có thể có
nhiều mối quan hệ và số lượng các tập thực thể tham gia vào mối quan hệ được gọi
là bậc/ngôi của mối quan hệ. Một mối quan hệ R có n tập thực thể tham gia E1, E2,
…, En. Khi đó, thể hiện của mối quan hệ R này là một tập con của tích Descartes E1
 E2  …  En .
Để diễn tả số lần tham gia tối thiểu và tối đa của một thực thể vào một mối quan

hệ người ta dùng bản số. Bản số giúp xác định loại của mối quan hệ là 1-1, 1-N, N-1
hay N-N, tức là để xác định mỗi thể hiện của tập thực thể này có liên hệ với tối đa là
bao nhiêu thể hiện của tập thực thể kia thông qua mối quan hệ.
Các loại mối quan hệ bao gồm:
- Mối quan hệ nhị nguyên: Khi hai đối tượng có quan hệ với nhau thì gọi là một
mối quan hệ nhị nguyên. Một mối quan hệ nhị nguyên có sự tham gia của hai tập thực
thể, Ei và Ej, từ cùng một lớp hoặc từ hai lớp khác nhau, tham gia vào một mối quan
hệ R. Trong OWL2, mối quan hệ nhị nguyên được mô tả bằng cặp các đối tượng, Oi
và Oj (tương ứng từ lớp Ci và Cj), từ cùng một lớp hoặc từ hai lớp khác nhau. Mối
quan hệ nhị nguyên có hai ràng buộc bản số có dạng (x, y), trong đó x là ràng buộc
tham gia tối thiểu, và y là ràng buộc tham gia tối đa. Trong đó, x là 0 hoặc 1, và y là
1 hoặc N.
- Mối quan hệ đa nguyên: Là mối quan hệ giữa 3 tập thực thể trở lên.
- Mối quan hệ Is-a: mỗi lớp con được đặc trưng bằng cách thiết lập giá trị của
một trong các thuộc tính của nó.
- Mối quan hệ phản xạ (recursive relationship): là mối quan hệ giữa các thực thể
trên cùng một tập thực thể. Vì vậy, một thực thể có thể đóng nhiều vai trị trong một
mối quan hệ phản xạ [2].
8


- Mối quan hệ định danh là mối quan hệ giữa tập thực thể yếu và tập thực thể
chủ.
1.1.2 Mô hình ER mở rộng
Mơ hình ER chỉ dừng lại ở việc mô tả các tập thực thể, các mối quan hệ, các
thuộc tính, khóa, và các ràng buộc cấu trúc. Nó chỉ có thể mơ hình hóa được các ứng
dụng CSDL truyền thống. Tuy nhiên, có nhiều ứng dụng phức tạp địi hỏi các khái
niệm bổ sung nếu muốn mơ hình hóa chúng một cách chính xác hơn. Vấn đề đặt ra
là phải xây dựng một mơ hình đáp ứng các u cầu trên. Do mơ hình ER mở rộng
chưa có một chuẩn thống nhất nên có nhiều tác giả đã nghiên cứu đến vấn đề này và

đưa ra nhiều mơ hình khác nhau như: EER, ECR, ERC, ERC+, ORAC... (gọi chung
là mơ hình EER).
Mơ hình EER bao gồm tất cả các khái niệm trong mơ hình ER. Thêm vào đó,
bổ sung thêm các khái niệm về lớp cha, lớp con và các khái niệm liên quan đến tổng
quát hoá và chuyên biệt hoá.
1.1.2.1 Lớp cha, lớp con và sự kế thừa
Mơ hình EER gồm khái niệm của một kiểu con hoặc lớp con của một tập thực
thể. Lớp cha là lớp thực thể tổng quát trong mối quan hệ Is-a, liên quan với một hoặc
nhiều lớp con. Lớp con là sự phân nhóm (chuyên biệt hóa) từ một lớp cha [2].
Fname

Minit
Name

Lname
Ssn

Birthday

Address

EMPLOYEE

Salary

d

SALARIED_EMPLOYEE

Pay_scale


HOURLY_EMPLOYEE

Hình 1.1 Biểu diễn lớp cha và lớp con trong mơ hình EER

Trong nhiều trường hợp, một tập thực thể có nhiều nhóm con hoặc kiểu con của
các thực thể có ý nghĩa và cần được trình bày rõ ràng vì tầm quan trọng của chúng
đối với ứng dụng cơ sở dữ liệu. Ví dụ một tổ chức có hai loại nhân viên: Nhân viên
9


×