Tải bản đầy đủ (.pdf) (38 trang)

Ứng dụng seantic web để xây dựng hệ thống tra cứu hiện vật tại bảo tàng đà nẵng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.61 MB, 38 trang )

ĐẠI HỌC ĐÀ NẴNG

TRƯỜNG ĐẠI HỌC BÁCH KHOA

TRẦN KIM HOÀNG

ỨNG DỤNG SEMANTIC WEB ĐỂ XÂY DỰNG
HỆ THỐNG TRA CỨU HIỆN VẬT
TẠI BẢO TÀNG ĐÀ NẴNG

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01

TÓM TẮT LUẬN VĂN THẠC SĨ
KHOA HỌC MÁY TÍNH

Đà Nẵng – Năm 2017


TRƯỜNG ĐẠI HỌC BÁCH KHOA

Người hướng dẫn khoa học: PGS. TS. Võ Trung Hùng

Phản biện 1: .................................................................
Phản biện 2: .................................................................

Luận văn sẽ được bảo vệ trước hội đồng chấm Luận văn
tốt nghiệp thạc sĩ Khoa học máy tính họp tại Trường Đại
học Bách khoa vào ngày........ tháng ......... năm ........

Có thể tìm hiểu luận văn tại:


-

Trung tâm Học liệu, Đại học Đà Nẵng tại Trường Đại
học Bách khoa
Thư viện Khoa Công nghệ thông tin, Trường Đại học
Bách khoa - ĐHĐN


I
LỜI CAM ĐOAN

Tôi xin cam đoan :
● Những nội dung trong luận văn này là do tôi thực hiện dƣới
sự hƣớng dẫn trực tiếp của PGS.TS. Võ Trung Hùng.
● Mọi tham khảo dùng trong luận văn đều đƣợc trích dẫn rõ
ràng và trung thực tên tác giả, tên công trình, thời gian, địa
điểm công bố.
● Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay
gian trá, tôi xin chịu hoàn toàn trách nhiệm.

Tác giả

Trần Kim Hoàng


II
MỤC LỤC
LỜI CAM ĐOAN ............................................................................. I
MỤC LỤC ........................................................................................ II
CÁC CHỮ VIẾT TẮT ............................................................... VIII

DANH MỤC HÌNH ẢNH ............................................................. IX
MỞ ĐẦU............................................................................................ 1
1. LÝ DO CHỌN ĐỀ TÀI .................................................................... 1
2. MỤC ĐÍCH NGHIÊN CỨU ............................................................. 2
3. ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU ....................................... 2
4. PHƢƠNG PHÁP NGHIÊN CỨU ....................................................... 2
5. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI NGHIÊN CỨU ... 3
6. CẤU TRÚC CỦA LUẬN VĂN ......................................................... 3
CHƢƠNG 1: GIỚI THIỆU TỔNG QUAN .................................... 4
1.1. WEB NGỮ NGHĨA ..................................................................... 4
1.1.1. Những hạn chế của World Wide Web ............................. 4
1.1.2. Sự ra đời của Web ngữ nghĩa.......................................... 4
1.1.3. Định nghĩa Web ngữ nghĩa ............................................. 5
1.2. KI N TRÚC WEB NGỮ NGHĨA................................................... 5
1.2.1. Giới thiệu ........................................................................ 5
1.2.2. Định nghĩa và vai trò của các tầng trong kiến trúc Web
ngữ nghĩa .................................................................................. 6
. . . . Tầng Unicode và URI Uniform Resource
Identifier) .............................................................................. 6
. . . . Tầng XML ............................................................... 6
1.2.2.3. Tầng RDF và RDF Schemma .................................. 6
. . . . Tầng Ontology Vocabulary ..................................... 6
. . . . Tầng Lô-gíc ............................................................. 6
. . . . Tầng Proof ............................................................... 6
. . . . Tầng Trust ............................................................... 6
1.3. NỘI DUNG XÂY DỤNG WEB NGỮ NGHĨA .................................. 6
1.3.1. XML và RDF trên Web.................................................... 6


III

1.3.2. Các ngôn ngữ biểu diễn Ontology cho Web có ngữ nghĩa
................................................................................................... 6
1.3.3. Phát triển nâng cao Web ngữ nghĩa................................ 6
1.4. Ontology ............................................................................. 6
1.4.1. hái niệm Ontology ........................................................ 6
1.4.2.
c đ ch xây dựng Ontology .......................................... 7
1.4.3. Yêu cầu khi sử d ng Ontology ........................................ 7
1.4.4. Các thành phần Ontology ............................................... 7
1.4.5. Ngôn ngữ OWL ............................................................... 7
1.4.6. Công c phát triển Ontology ........................................... 8
1.5. ỨNG DỤNG VÀ TRIỂN VỌNG CỦA WEB NGỮ NGHĨA ................ 8
1.5.1. Search Engine ................................................................. 8
1.5.2. Internet Agent .................................................................. 8
1.5.3. Push System..................................................................... 8
1.5.4. Relationship .................................................................... 8
1.6. MỘT SỐ ỨNG DỤNG CỦA WEB NGỮ NGHĨA VÀO LĨNH VỰC BẢO
TÀNG TRÊN TH GIỚI ...................................................................... 8
1.6.1. Europeana ....................................................................... 8
1.6.2. CHIP (Cultural Heritage Information Personalization) . 8
1.6.3. Ama (Archive Mapper for Archaeology)......................... 8
1.6.4. E-Culture......................................................................... 8
1.6.5. The Museum Finland Portal ........................................... 8
1.6.6. The Reach Project ........................................................... 8
1.6.7. The Museum24 Project ................................................... 8
1.6.8. Cantabria Cultural Heritage Semantic Portal ................ 8
1.6.9. CultureSampo Portal ...................................................... 8
1.6.10. Cultura Italia Project ( ..... 8
1.6.11. Sisc Project ................................................................... 8
CHƢƠNG 2: GIẢI PHÁP ĐỀ XUẤT ............................................. 9

2.1. BẢO TÀNG ĐÀ NẴNG .............................................................. 9
2.1.1. Giới thiệu ........................................................................ 9
2.1.2. Ứng d ng CNTT tại Bảo tàng ......................................... 9
2.2. GIỚI THI U BÀI TOÁN .............................................................. 9


IV
2.2.1. Yêu cầu bài toán .............................................................. 9
2.2.2. Phân t ch v n đ ............................................................ 10
2.3. GIẢI PHÁP .............................................................................. 10
2.3.1. Phác thảo kiến trúc t ng thể hệ th ng .......................... 11
2.3.2. Giải quyết yêu cầu t m kiếm .......................................... 11
2.3.3. Các chức n ng c bản của ứng d ng ............................ 11
2.3.4. Quy tr nh xây dựng Web ngữ nghĩa .............................. 12
2.4. CÁC CONG CỤ H TRỢ ........................................................... 12
2.4.1 Công c xây dựng ứng d ng Prot g ............................. 12
2.4.2 B Visual Studio.Net ...................................................... 12
2.4.3. Thư viện phát triển ứng d ng ........................................ 12
2.5. PHÂN TÍCH VÀ THI T K HỆ THỐNG ...................................... 12
2.5.1. Biểu đ Use Case .......................................................... 12
2.5.2. Biểu đ lớp .................................................................... 13
2.5.3. Biểu đ hoạt đ ng ......................................................... 13
. .3. . Đăng nhập, đăng xuất ............................................ 13
. .3. . Cập nhật dữ liệu..................................................... 13
2. .3.3. Xem thông tin hiện vật .......................................... 13
. .3. . Tìm kiếm hiện vật.................................................. 14
CHƢƠNG 3 : X Y DỰNG HỆ TH NG ..................................... 15
3.1. MO H NH KI N TRÚC T NG THỂ CỦA H THỐNG ................... 15
3.2. PHÁT TRIỂN ỨNG DỤNG ......................................................... 16
3.2.1. Qui tr nh phát triển ứng d ng ....................................... 16

3.2.2. Xây dựng Ontology ....................................................... 16
3.2.3. Xây dựng kết n i truy xu t dữ liệu t ontology sang giao
diện web .................................................................................. 19
3. .3. . Khai báo sử dụng thƣ viện OwlDotNetApi ........... 19
3. .3. . Khai báo truy vấn thông tin ................................... 19
3.2.4.
t s thuật toán được sử d ng để khai thác dữ liệu ... 19
3. . . . Điền dữ liệu ........................................................... 19
3.2.4. . Duyệt theo ngữ nghĩa ............................................ 19
3. . .3. Tìm kiếm cơ bản .................................................... 20
3.2.5. Xây dựng giao diện ....................................................... 20


V
. . Trang chính của hệ thống ...................................... 21
.3. Hiển thị thông tin của một hiện vật: ...................... 21
. . Trang đăng nhập của quản trị hệ thống ................. 22
. . Trang chính của quản trị hệ thống ......................... 22
. . Trang Thêm mới hiện vật ...................................... 23
3.3. TRIỂN KHAI HỆ THỐNG .......................................................... 23
3.4. ĐÁNH GIÁ K T QUẢ CỦA H THỐNG ...................................... 23
ẾT LU N ..................................................................................... 25
DANH MỤC TÀI LIỆU THAM HẢO ...................................... 27
3.
3.
3.
3.
3.

.

.
.
.
.


VI
ỨNG DỤNG SEMANTIC WEB ĐỂ X Y DỰNG HỆ TH NG
TRA CỨU HIỆN V T TẠI BẢO TÀNG ĐÀ NẴNG
Học viên: Trần Kim Hoàng
Mã số:
Khoá: 32

Chuyên Ngành: Khoa học máy tính
Trƣờng Đại học Bách Khoa - ĐHĐN

Tóm tắt - Hiện nay ở một số quốc gia tiên tiến trên thế giới, công
việc số hóa thông tin bảo tàng để xây dựng bảo tàng điện tử đƣợc
thực hiện cách đây hơn chục năm và trên thực tế, họ đã xây dựng
thành công một số mô hình “Bảo tàng điện tử”. Tuy nhiên ở nƣớc ta
bảo tàng điện tử vẫn chƣa đƣợc áp dụng rộng rãi. Nghiên cứu này
đƣợc đề xuất nhằm số hóa thông tin hiện vật của bảo tàng, cũng nhƣ
đƣa ra giải pháp để tìm kiếm thông tin hiện vật trong bảo tàng đây là
một phần nhỏ nhằm góp phần xây dựng bảo tàng điện tử. Bài báo cáo
gồm có tìm hiểu lý thuyết tổng quan về công nghệ Semantic Web,
khái niệm Semantic Web, các ngôn ngữ và công cụ xây dựng. Số hoá
cở sở dữ liệu hiện vật của bảo tàng. Từ đó xây dựng website tìm
kiếm thông tin hiện vật của bảo tàng.
Từ khoá - Semantic Web, Website, bảo tàng, ontology, sparql,
protégé.



VII
SEMATIC WEB APPLICATION TO BUIILD THE
INSPECTION SYSTEM ARTIFACTS
IN THE MUSEUM DA NANG
Sumary - At present in some advanced countries in the world, the
digitization of museum information to build electronic museums has
been done more than a decade ago and, in fact, they have
successfully built some model "Electronic Museum". However,
electronic museums have not yet been widely applied in Vietnam.
This research was proposed to digitize the museum's artifacts as well
as to provide a way to find information about the museum's artifacts.
This is a small part of the museum's contribution to electronic
museums. The report includes an overview of the semantic Web
semantic theory, Semantic Web concepts, languages and build tools.
Digitize the Museum's database of artifacts. From there, the
Museum's website will be searched for information.
Keyword - Semantic Web, Website, museum, ontology, sparql,
protégé.


VIII
CÁC CHỮ VIẾT TẮT
CSDL

Cơ sở dữ liệu

DAML


DARPA Markup Language

HTML

HyperText Markup Language

HTTP

HyperText Transfer Protocol

IRI

Internationalized Resource Identifier

ISO

International Organization for Standards

IWS

Institute of Web Science

OIL

Ontology Inference Layer

OWL

Web Ontology Language


RDF

Resource Description Framework

RDFS

Resource Description Framework Schema

SGML

Standard Generalized Markup Language

SWSE

Semantic Web Search Engine

URI

Semantic Web Search Engine


IX
DANH MỤC HÌNH ẢNH
Số hiệu
hình ảnh

Tên hình vẽ

Trang


1.5

Kiến trúc Web ngữ nghĩa theo đề xuất của
Tim Berners Lee

5

2.4

Kiến trúc hệ thống

11

2.8

Biểu đồ use case

13

2.12

Biểu đồ hoạt động xem thông tin hiện vật

13

2.13

Biểu đồ hoạt động tìm kiếm hiện vật

14


3.1

Mô hình kiến trúc tổng thể của hệ thống

15

3.3

Các lớp trong Ontology

16

3.4

Object Properties

17

3.5

Data properties

18

3.6

Các cá thể trong Ontology

18


3.7

Trang chính cho hệ thống

21

3.8

Trang tìm kiếm

21

3.9

Thông tin của hiện vật

22

3.11

Trang chính của quản trị hệ thống

22

3.12

Trang thêm mới hiện vật

23


3.13

Mô hình triển khai

23


1
MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay, với sự phát triển của khoa học kĩ thuật và công nghệ
ngành bảo tàng ngày càng phát triển, ngày càng nhiều hiện vật, tƣ
liệu khảo cổ đƣợc tìm thấy. Cùng với các hiện vật là kho thông tin và
tƣ liệu khổng lồ về các hiện vật đƣợc tìm thấy mà các nhà khoa học
đã nghiên cứu và phát hiện ra.
Bên cạnh đó, cùng với sự phát triển mạnh mẽ của công nghệ
thông tin, ứng dụng của công nghệ thông tin trong lĩnh vực bảo tàng
đang phát triển mạnh và tạo ra những thay đổi lớn trong công tác bảo
tàng.
Có rất nhiều cách tiếp cận khác nhau khi ứng dụng công
nghệ thông tin trong lĩnh vực bảo tàng. Ở một số quốc gia tiên tiến
trên thế giới, công việc số hóa thông tin bảo tàng để xây dựng bảo
tàng điện tử đƣợc thực hiện cách đây hơn chục năm, trên thực tế, họ
đã xây dựng thành công một số mô hình bảo tàng điện tử. Bảo tàng
điện tử cho phép cung cấp dễ dàng và thuận lợi đến khách tham quan
toàn bộ các hiện vật của bảo tàng cũng nhƣ toàn bộ giá trị phi vật thể
tiềm ẩn trong nó. Ở Việt Nam, trong vài năm gần đây, một số bảo
tàng đã bắt đầu ứng dụng công nghệ thông tin trong hoạt động
nghiệp vụ và bƣớc đầu đã có những hiệu quả thực sự.

Nhƣ chúng ta đã biết, hiện vật và các hoạt động liên quan
đến hiện vật là vấn đề chính yếu của một bảo tàng. Vì vậy, cơ sở của
bảo tàng số hóa là việc ứng dụng khoa học, kĩ thuật thông tin điện tử
vào tất cả những thông tin trong bảo tàng và mọi hoạt động nghiệp
vụ của bảo tàng. Các hiện vật trong bảo tàng, theo quan niệm truyền
thống, là một bản gốc, nên khi đƣợc số hóa, sẽ tạo ra một bản thông
tin mô phỏng lƣu trữ trong bộ nhớ của máy tính, từ đó đem đến nhiều
thuận lợi trong phƣơng thức khai thác thông tin. Trên cơ sở số hóa,
máy tính sẽ thay thế phần lớn các thao tác của cán bộ bảo tàng trong
mọi khâu quản lý, sử dụng hiện vật và tự động hóa các khâu này.


2
Tuy nhiên, các ứng dụng hiện nay vẫn dừng lại ở việc cung
cấp thông tin chứ chƣa cung cấp đƣợc những tri thức cần thiết nên đã
có những khó khăn nhất định trong việc tìm hiểu, tra cứu.
Vì vậy, đề tài “Ứng dụng sematic web để xây dựng hệ thống
tra cứu hiện vật tại Bảo tàng Đà Nẵng” đi sâu vào việc số hoá các
dữ liệu của Bảo tàng sau đó xây dựng tri thức dựa trên tƣ liệu của các
hiện vật đã đƣợc số hoá nhằm phục vụ cho việc tìm hiểu và tra cứu
một cách dễ dàng hơn.
2. Mục đích nghiên cứu
Đề tài hƣớng đến việc số hoá dữ liệu các hiện vật đang có của
Bảo tàng, sau đó dựa trên cơ sở dữ liệu có đƣợc để xây dựng một
ontology đầy đủ về các hiện vật của Bảo tàng. Từ ontology vừa xây
dựng tiếp tục xây dựng hệ thống tìm kiếm hiện vật cho bảo tàng.
3. Đối tƣợng và phạm vi nghiên cứu
Đối tƣợng nghiên cứu của đề tài là các vấn đề liên quan đến
Semantic Web nhƣ phƣơng pháp để xây dựng và lƣu trữ dữ liệu
trong Semantic Web và các công cụ dùng để xây dựng Semantic

Web.
Phạm vi nghiên cứu của đề tài là các hiện vật của Bảo tàng Đà
Nẵng. Hiện nay Bảo tàng Đà Nẵng có khoảng hơn 3000 hiện vật
đƣợc trƣng bày. Tuy nhiên trong đề tài này tôi chi tổng hợp thông tin
của 00 hiện vật về lịch sử các thời kỳ chiến tranh, về điều kiện tự
nhiên, về văn hoá của các dân tộc, về Đà Nẵng thời tiền sơ sử. Ứng
dụng tìm kiếm thông tin của hiện vật đƣợc xây dựng và kiểm thử ở
phạm vi Bảo tàng Đà Nẵng.
4. Phƣơng pháp nghiên cứu
Về mặt lý thuyết tập trung nghiên cứu về các vấn đề liên quan
đến sematic web và việc xây dựng bảo tàng điện tử. Tìm hiểu về số
hoá dữ liệu liên quan đến bảo tàng. Nghiên cứu về quá trình xây
dựng một công cụ search engine.
Phƣơng pháp thực nghiệm tập trung vào việc số hoá dữ liệu và
xây dựng kho dữ liệu các hiện vật của bảo tàng. Xây dựng ontology


3
các hiện vật của bảo tàng. Xây dựng công cụ search engine, xây
dựng website tìm kiếm hiện vật của bảo tàng, triển khai thực tế trên
Internet.
5. Ý nghĩa khoa học và thực tiễn của đề tài nghiên cứu
Về mặt khoa học đề tài đóng góp một công cụ tìm kiếm các
hiện vật theo công nghệ sematic web dành riêng cho bảo tàng.
Phƣơng pháp xây dựng ontology về các hiện vật của bảo tàng. Số
hoá đƣợc một phần dữ liệu về các hiện vật của bảo tàng.
Về thực tiễn đề tài bƣớc đầu mở ra hƣớng nghiên cứu để từng
bƣớc xây dựng bảo tàng điện tử cho Bảo tàng Đà Nẵng. Giúp bảo
tàng từng bƣớc số hoá đƣợc dữ liệu về hiện vật hiện có.


6. Cấu trúc của luận văn
Bố cục của luận văn gồm có 3 chƣơng nhƣ sau:
CHƢƠNG : GIỚI THIỆU T NG QUAN
Trong chƣơng này của đề tài trình bày cơ sở lý thuyết về
Sematic Web và một số ứng dụng thành công về bảo tàng trên thế
giới có sử dụng công nghệ Sematic Web.
CHƢƠNG : GIẢI PHÁP ĐỀ XUẤT
Chƣơng này giới thiệu về Bảo tàng Đà Nẵng và thực trạng ứng
dụng công nghệ thông tin vào lĩnh vực bảo tàng của Bảo tàng Đà
Nẵng. Phân tích ƣu điểm và nhƣợc điểm của website bảo tàng hiện
nay. Từ đó, đề xuất xây dựng hệ thống tìm kiếm hiện vật hiệu quả
hơn.
CHƢƠNG 3: XÂY DỰNG HỆ THỐNG
Dựa trên những đề xuất ở chƣơng , tiến hành phân tích, thiết
kế và xây dựng ontology, xây dựng hệ thống tìm kiếm hiện vật của
bảo tàng.
Ngoài ra, để đánh giá toàn bộ quá trình nghiên cứu, phần cuối của
luận văn có nêu lên kết quả và hƣớng phát triển cho đề tài.


4
CHƢƠNG 1: GIỚI THIỆU TỔNG QUAN
Trong chƣơng này giới thiệu các khái niệm tổng quan về Web
ngữ nghĩa, các ngôn ngữ và công cụ xây dựng Web ngữ nghĩa tính
đến thời điểm hiện nay. Tìm hiểu kiến trúc Web ngữ nghĩa, ứng dụng
và triển vọng của Web ngữ nghĩa trong tƣơng lai. Đồng thời trong
chƣơng này cũng tìm hiểu về một số ứng dụng của Web ngữ nghĩa
vào lĩnh vực bảo tàng trên thế giới.
1.1. Web ngữ nghĩa
1.1.1. Những hạn chế của World Wide Web

World Wide Web gọi tắt là Web) đƣợc sáng lập bởi Tim
Berners - Lee đã trở thành một kho tàng thông tin khổng lồ của nhân
loại và một môi trƣờng chuyển tải thông tin không thể thiếu đƣợc
trong thời đại công nghệ thông tin ngày nay và nó cũng chính là linh
hồn của Internet.
Tuy nhiên, trên thực tế có một khối lƣợng khổng lồ các tài
nguyên trên Web, điều đó đã đặt ra thách thức làm sao để khai thác
thông tin trên Web một cách hiệu quả, mà cụ thể là làm thế nào để
máy tính có thể trợ giúp xử lý tự động đƣợc chúng. Muốn vậy, web
phải có khả năng mô tả các sự vật theo cách mà máy tính có thể
“hiểu” đƣợc, có thể tích hợp dữ liệu, cũng nhƣ tái sử dụng dữ liệu
thông qua các ứng dụng khác nhau.
1.1.2. Sự ra đời của Web ngữ nghĩa
Các trang Web hiện nay hầu hết đƣợc sử dụng bởi con ngƣời,
máy tính ch có nhiệm vụ gửi nhận dữ liệu và thể hiện thông tin dƣới
dạng mà ch có con ngƣời mới đọc hiểu đƣợc. Ngƣời sử dụng phải
làm nhiệm vụ tìm kiếm, suy luận, tổng hợp và trích rút thông tin
mình cần. Điều đó đã đặt ra thách thức là làm sao để khai thác thông
tin trên Web hiệu quả hay nói cách khác là làm thế nào để máy tính
có thể xử lý tự động đƣợc chúng. Muốn vậy thì Web phải có khả
năng mô tả thông tin theo cách mà máy tính có thể hiểu đƣợc. Để


5
chúng ta dễ dàng có đƣợc một kết quả tìm kiếm chính xác, nhanh
chóng và hiểu dần tới ngữ nghĩa vấn đề chúng ta mong muốn.
Web 3.0 - Web ngữ nghĩa ra đời nhằm đáp ứng những yêu cầu
về xử lý và tìm kiếm thông tin, cho phép chúng ta xây dựng những
CSDL phục vụ tìm kiếm chính xác.
1.1.3. Định nghĩa Web ngữ nghĩa

Web ngữ nghĩa đƣợc hình thành từ ý tƣởng của Tim BernersLee, ngƣời phát minh ra WWW, URI, HTTP và HTML. Tim
Berners-Lee đã định nghĩa: “The Semantic Web is an extension of
the current Web in which information is given well- defined
meaning, better enabling computers and people to work in
cooperation” .
1.2. iến trúc Web ngữ nghĩa
1.2.1. Giới thiệu
Tim Berners Lee đã đề xuất mô hình kiến trúc Web ngữ nghĩa
đầu tiên đây là mô hình kiến trúc gồm các thần phần chính của Web
ngữ nghĩa. Mô hình kiến trúc của Web ngữ nghĩa đƣợc thay đổi theo
từng thời điểm nhất định cho thấy công nghệ Web ngữ nghĩa vẫn c n
đang hoàn thiện và phát triển theo thời gian.

H nh 1.5: iến trúc Web ngữ nghĩa theo đ xu t của Tim Berners
Lee


6
1.2.2. Định nghĩa và vai trò của các tầng trong kiến trúc Web
ngữ nghĩa
ng nicode và
niform esource dentifier
ng
ng D và D chemma
ng nto ogy ocabu ary
ng -g c
ng roof
ng rust
1.3. Nội dung xây dụng Web ngữ nghĩa
Để xây dựng hệ thống Web ngữ nghĩa thay thế cho World

Wide Web hiện tại, các nhà nghiên cứu đang n lực và tập trung
nghiên cứu với ba hƣớng chính sau:
 Chuẩn hoá các ngôn ngữ biểu diễn dữ liệu XML) và siêu dữ
liệu RDF) trên Web.
 Chuẩn hoá các ngôn ngữ biểu diễn Ontology cho Web có
ngữ nghĩa.
 Phát triển nâng cao Web ngữ nghĩa Semantic Web
Advanced Development - SWAD)
1.3.1. XML và RDF trên Web
1.3.2. Các ngôn ngữ biểu diễn Ontology cho Web có ngữ nghĩa
1.3.3. Phát triển nâng cao Web ngữ nghĩa
1.4. Ontology
h i niệm nto ogy
Trong khoa học máy tính, một ontology là một mô hình dữ
liệu biểu diễn một lĩnh vực và đƣợc sử dụng để suy luận về các đối
tƣợng trong lĩnh vực đó và mối quan hệ giữa chúng. Ontology cung
cấp một bộ từ vựng chung bao gồm các khái niệm, các thuộc tính
quan trọng và các định nghĩa về các khái niệm và các thuộc tính này.
Ngoài bộ từ vựng, ontology c n cung cấp các ràng buộc, đôi khi các
ràng buộc này đƣợc coi nhƣ các giả định cơ sở về ý nghĩa mong
muốn của bộ từ vựng, nó đƣợc sử dụng trong một miền mà có thể


7
đƣợc giao tiếp giữa ngƣời và các hệ thống ứng dụng phân tán h n tạp
khác.
Các ontology thƣờng miêu tả:
 Cá thể (Individuals): Các đối tƣợng cơ bản, nền tảng
 Lớp Classes : Các tập hợp, hay kiểu của các đối tƣợng
 Thuộc tính Properties : Thuộc tính, tính năng, đặc điểm,

tính cách, hay các thông số mà các đối tƣợng có và có thể
đem ra chia sẻ.
 Quan hệ Relation): Các con đƣờng mà các đối tƣợng có
thể liên hệ tới một đối tƣợng khác.
ục đ ch xây dựng nto ogy
Yêu c u khi sử dụng nto ogy
C c thành ph n nto ogy
Ontology đƣợc sử dụng nhƣ là một biểu mẫu trình bày tri thức
về thế giới hay một phần của nó. Ontology thƣờng miêu tả: Cá thể
Individuals), lớp Classes), thuộc tính Propertises) và quan hệ
(Relation).
Ng n ngữ W
OWL The Web Ontology Language) là một ngôn ngữ gần
nhƣ XML dùng để mô tả các hệ cơ sở tri thức. OWL là một ngôn
ngữ đánh dấu dùng để xuất bản và chia sẻ dữ liệu trên Internet thông
qua những mô hình dữ liệu gọi là “Ontology”.


8
C ng cụ ph t triển nto ogy
1.5. Ứng dụng và triển vọng của Web ngữ nghĩa
1.5.1. Search Engine
1.5.2. Internet Agent
1.5.3. Push System
1.5.4. Relationship
1.6. Một số ứng dụng của Web ngữ nghĩa vào lĩnh vực bảo tàng
trên thế giới
1.6.1. Europeana
1.6.2. CHIP (Cultural Heritage Information Personalization)
1.6.3. Ama (Archive Mapper for Archaeology)

1.6.4. E-Culture
1.6.5. The Museum Finland Portal
1.6.6. The Reach Project
1.6.7. The Museum24 Project
1.6.8. Cantabria Cultural Heritage Semantic Portal
1.6.9. CultureSampo Portal
1.6.10. Cultura Italia Project ( />1.6.11. Sisc Project


9
CHƢƠNG 2: GIẢI PHÁP ĐỀ XUẤT
Chƣơng này sẽ giới thiệu về Bảo tàng Đà Nẵng. Ứng dụng
công nghệ thông tin hiện có của Bảo tàng Đà Nẵng. Phân tích bài
toán tìm kiếm hiện vật, trình bày kết quả phân tíchtích thiết kế hệ
thống. Tìm hiểu xem để xây dựng một ứng dụng Web ngữ nghĩa cần
những gì, mô hình hoạt động nhƣ thế nào, công cụ nào sẽ đƣợc lựa
chọn, gói thƣ viện nào sẽ h trợ trong quá trình triển khai ứng dụng.
2.1. Bảo tàng Đà Nẵng
2.1.1. Giới thiệu
2.1.2. Ứng dụng CNTT tại Bảo tàng
2.2. Giới thiệu bài toán
2.2.1. Yêu cầu bài toán
Đối tƣợng s dụng
Với nội dung của bài toán này ta thấy đối tƣợng sử dụng là các
nhà khoa học, sinh viên các trƣờng đại học, cao đ ng, học sinh các
trƣờng phổ thông và du khách khi muốn tìm kiếm thông tin để phục
vụ cho việc nghiêm cứu, học tập hoặc tham quan.
Sau khi xây dựng thành công cho Bảo tàng Đà Nẵng website
có thể phát triển để liên kết với các website của các t nh thành trong
cả nƣớc giúp cho dữ liệu của website càng ngày càng phong phú và

có tính đúng đắn cao hơn.
Yêu cầu bài toán
Bài toán đặt ra những yêu cầu nhƣ phải số hoá đƣợc dữ liệu
của bảo tàng thành một hệ cơ sở dữ liệu sau đó xây dựng một
website có chức năng tìm kiếm các hiện vật của bảo tàng trong cơ sở
dữ liệu đáp ứng các yêu cầu:
 Cho phép ngƣời sử dụng tìm kiếm chính xác hiện vật muốn
nghiên cứu hoặc muốn tìm hiểu.
 Tuỳ chọn hƣớng tiếp cận dữ liệu theo các bộ sƣu tập, mốc
thời gian, loại hình hiện vật.


10
 Việc tìm kiếm phải đảm bảo đƣợc tính suy luận ngƣợc và
suy luận tƣơng đƣơng của các đối tƣợng
2.2.2. Phân tích vấn đề
Công nghệ Web Semantic với đặc điểm lƣu trữ dữ liệu dƣới
định dạng XML nên tính tùy biến rất cao. Sự tùy biến này cho phép
lƣu trữ dữ liệu, thêm và g bỏ các định dạng dữ liệu dễ dàng. Công
nghệ Web Semantic sử dụng mô hình dữ liệu thông minh, lƣu trữ dữ
liệu dƣới dạng thông tin mà máy có thể hiểu đƣợc. Điều đó không
ch giúp việc tìm kiếm nhanh mà c n h trợ sử dụng truy xuất thông
tin chất lƣợng hơn.
Việc phát triển một trang Web semantic ta cần xây dựng ứng
dụng gồm phần chính đó là xây dựng Ontology và xây dựng trình
duyệt thông minh để hiển thị kết quả.
2.3. Giải pháp
Để giải quyết đƣợc những vấn đề nêu trên tôi xin đề xuất giải
pháp là sử dụng công nghệ Sematic web để xây dựng trang web tìm
kiếm thông tin hiện vật cho Bảo tàng Đà Nẵng. Các bƣớc tiến hành

xây dựng đƣợc mô tả nhƣ sau:
Bước : Thu thập thông tin bao gồm văn bản, hình ảnh, video, audio
về các hiện vật đang có ở Bảo tàng Đà Nẵng.
Bước : Tổng hợp dữ liệu thu thập đƣợc đƣa vào kho tiền xử lý, xác
minh tính chính xác, tổ chức, phân loại theo từng mục cho miền mà
chúng ta cần xây dựng.
Bước : Dùng công cụ phần mềm h trợ là Protégé .0 để xây dựng
ontology cho cho dữ liệu đã tổng hợp đƣợc cũng nhƣ xây dựng các
lớp, thuộc tính và mối quan hệ trong ontology.
Bước : Xây dựng giao diện tƣơng tác với ngƣời dùng trên giao diện
Web có các chức năng tìm kiếm theo ngữ nghĩa.
Bước : Triển khai hệ thống lên internet và tiến hành nghiệm thu,
kiểm thử


11
2.3.1. Phác thảo kiến trúc t ng thể hệ thống
Mô hình đƣợc đề xuất trong luận văn cho ứng dụng tìm kiếm
ngữ nghĩa phải thể hiện đƣợc hai thành phần cơ bản của hệ thống là
giao diện Web Web Browser) và máy tìm kiếm Search Engine).

H nh 2.4: iến trúc hệ th ng.
2.3.2. Giải quyết yêu cầu t m kiếm
Điểm mạnh của Web ngữ nghĩa so với Web .0 là cho phép
khả năng suy luận dữ liệu thông minh nhằm h trợ việc suy luận dữ
liệu theo quy tắc của Ontology.
Ngôn ngữ Ontology h trợ rất nhiều các suy luận khác nhau.
Tuy nhiên, trong giới hạn của đề án này chúng tôi ch đƣa ra hai loại
hình suy luận dữ liệu nhƣ sau:




Suy luận ngang cấp: Là suy luận dựa trên cùng một thuộc
tính của hai đối tƣợng quan hệ.
Suy luận ngƣợc: Là cách suy luận dựa trên các thuộc tính
khác nhau của hai đối tƣợng.

2.3.3. Các chức năng cơ bản của ứng dụng
Chức năng cơ bản của ứng dụng là tìm kiếm, việc áp dụng kĩ
thuật tìm kiếm trên Ontology sẽ trả về những kết quả chính xác hơn
nhờ những ƣu điểm về lƣu trữ dữ liệu RDF so với dữ liệu truyền


12
thống, có cách tổ chức dữ liệu đơn giản, đồng nhất, cấu trúc bộ ba
giúp dễ truy xuất thông tin bởi các hệ thống suy luận.




Duyệt theo ngữ nghĩa: Duyệt cây phân cấp, theo loại hình
dịch vụ: cung cấp cách tìm kiếm địa điểm theo phân cấp trên
cây Ontology. Ngƣời dùng không cần nhập thông tin tìm
kiếm mà vẫn có thể tìm kiếm đƣợc tài liệu cần thiết bằng
cách duyệt cây.
T m kiếm theo khóa: Cách tìm kiếm phổ biến và có nhu cầu
nhiều nhất là tìm kiếm theo từ khóa.

2.3.4. Quy tr nh xây dựng Web ngữ nghĩa
Quy trình phát triển gồm

bƣớc do Stanford Center for
Biomedical Informatics Research đƣa ra - Đây là nhóm phát triển
phần mềm Protégé để trình diễn và soạn thảo Ontology.
Bước : Xác định lĩnh vực và phạm vi của Ontology
Bước 2: Xem xét việc sử dụng lại các Ontology có sẵn
Bước 3: Liệt kê các thuật ngữ quan trọng
Bước : Xác định các lớp và phân cấp của các lớp
Bước : Xác định các thuộc tính
Bước : Xác định ràng buộc của các thuộc tính
Bước : Tạo các thực thể
2.4. Các công cụ h trợ
2.4.1 Công cụ xây dựng ứng dụng Prot g
2.4.2 Bộ Visual Studio.Net
2.4.3. Thƣ viện phát triển ứng dụng
2.5. Phân tích và thiết kế hệ thống
2.5.1. Biểu đ Use Case
Trên cở sở khảo sát yêu cầu và giải pháp ở trên tôi xin đề xuất
biểu đồ Use Case nhƣ sau:


13

H nh 2.8: Biểu đ use case
2.5.2. Biểu đ lớp
2.5.3. Biểu đ hoạt động
Đăng nhập, đăng xuất
Cập nhật dữ iệu
2.5.3.3. Xem th ng tin hiện vật
Sơ đồ hoạt động của chức năng xem thông tin đƣợc mô tả nhƣ sau:


H nh 2.12: Biểu đ hoạt đ ng xem thông tin hiện vật


14
ìm kiếm hiện vật
Sơ đồ hoạt động của chức năng tìm kiếm hiện vật đƣợc mô tả nhƣ
hình dƣới:

H nh 2.13: Biểu đ hoạt đ ng t m kiếm hiện vật


×