Tải bản đầy đủ (.pdf) (82 trang)

Nghiên cứu xây dựng thử nghiệm hệ thống quản lý thông tin bài giảng điện tử ứng dụng web ngữ nghĩa

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.2 MB, 82 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
--------------------------------------ĐẶNG THỊ THANH

ĐẶNG THỊ THANH

CÔNG NGHỆ THÔNG TIN

NGHIÊN CỨU XÂY DỰNG THỬ NGHIỆM HỆ THỐNG
QUẢN LÝ THÔNG TIN BÀI GIẢNG ĐIỆN TỬ ỨNG
DỤNG WEB NGỮ NGHĨA

LUẬN VĂN THẠC SĨ
CÔNG NGHỆ THÔNG TIN
2010 - 2012

HÀ NỘI – NĂM 2013


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
--------------------------------------ĐẶNG THỊ THANH

NGHIÊN CỨU XÂY DỰNG THỬ NGHIỆM HỆ THỐNG
QUẢN LÝ THÔNG TIN BÀI GIẢNG ĐIỆN TỬ ỨNG DỤNG
WEB NGỮ NGHĨA

Chuyên ngành: CÔNG NGHỆ THÔNG TIN

LUẬN VĂN THẠC SĨ
CÔNG NGHỆ THÔNG TIN



NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. CAO TUẤN DŨNG

HÀ NỘI – NĂM 2013


LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của tôi dưới sự hướng dẫn
của TS Cao Tuấn Dũng.
Các số liệu, kết quả nêu trong luận văn là trung thực và mọi trích dẫn trong
báo cáo đều được ghi rõ nguồn gốc trong phần tài liệu tham khảo. Nếu có sử dụng
bất hợp pháp kết quả cơng trình nghiên cứu của người khác trong báo cáo tơi xin
hoàn toàn chịu trách nhiệm.
Tác giả

Đặng Thị Thanh

1


LỜI CẢM ƠN
Lời đầu tiên tơi muốn bày tỏ lịng biết ơn sâu sắc và kính trọng của mình tới
TS. Cao Tuấn Dũng - người đã tận tình chỉ bảo, hướng dẫn và tạo mọi điều kiện cho
tôi trong quá trình tìm hiểu học tập và nghiên cứu đề tài này.
Tôi xin chân thành cảm ơn các Thầy, Cô Viện Công nghệ thông tin trường
Đại học Bách Khoa Hà Nội đã tạo điều kiện cho tôi được học hỏi thông qua các
mơn học cũng như hồn thành khóa học.
Cuối cùng tơi xin bày tỏ lịng cảm ơn chân thành đến gia đình, người thân và
bạn bè đồng nghiệp đã khích lệ và động viên tơi hồn thành luận văn này.!.

Tác giả.

2


MỤC LỤC
LỜI CAM ĐOAN ......................................................................................................1
LỜI CẢM ƠN ............................................................................................................2
MỤC LỤC ..................................................................................................................3
DANH MỤC BẢNG ..................................................................................................6
DANH MỤC HÌNH ...................................................................................................7
MỞ ĐẦU ....................................................................................................................8
1. LÝ DO CHỌN ĐỀ TÀI ...................................................................................8
2. LỊCH SỬ NGHIÊN CỨU ...............................................................................9
3. MỤC ĐÍCH NGHIÊN CỨU .........................................................................10
4. ĐỐI TƯỢNG - PHẠM VI NGHIÊN CỨU .................................................10
5. BỐ CỤC LUẬN VĂN ....................................................................................10
6. PHƯƠNG PHÁP NGHIÊN CỨU ................................................................11
CHƯƠNG 1: TỔNG QUAN...................................................................................12
1.1. TỔNG QUAN VỀ SEMANTIC WEB ......................................................12
1.1.1. KHÁI NIỆM WEB NGỮ NGHĨA VÀ SIÊU DỮ LIỆU .............. 12
1.1.2. PHÂN BIỆT WEB NGỮ NGHĨA VỚI WEB HIỆN NAY .......... 14
1.1.3. VAI TRÒ CỦA WEB NGỮ NGHĨA ............................................. 15
1.2. KIẾN TRÚC CỦA WEB NGỮ NGHĨA ...................................................16
1.3. ONTOLOGY ...............................................................................................21
1.3.1. KHÁI NIỆM VỀ ONTOLOGY ..................................................... 21
1.3.2. CÁC THÀNH PHẦN CỦA ONTOLOGY .................................... 22
1.3.3. PHƯƠNG PHÁP XÂY DỰNG ONTOLOGY.............................. 24
1.4. NGÔN NGỮ BIỂU DIỄN ONTOLOGY..................................................26
1.4.1. RDF (RESOURCE DISCRIPTION FRAME) ............................. 26

1.4.2.

RDF

SCHEMA

(RESOURCE

DISCRIPTION

FRAME

SCHEMA) .................................................................................................. 28
1.4.3. OWL (WEB ONTOLOGY LANGUGE) ...................................... 33

3


1.5. TRUY VẤN NGỮ NGHĨA TRONG WEB NGỮ NGHĨA......................34
1.5.1. VIẾT MỘT TRUY VẤN ĐƠN GIẢN ........................................... 34
1.5.2. CÁC NÚT RỖNG ............................................................................ 35
1.5.3. NHỮNG DẠNG CÚ PHÁP KHÁC ............................................... 36
1.5.4. TRUY VẤN TỪ VỰNG REIFICATION...................................... 36
CHƯƠNG 2. ỨNG DỤNG WEB NGỮ NGHĨA TRONG HỆ THỐNG GIÁO
DỤC ĐIỆN TỬ ........................................................................................................38
2.1. TỔNG QUAN VỀ HỆ THỐNG GIÁO DỤC ĐIỆN TỬ .........................38
2.1.1. KHÁI NIỆM VỀ HỆ THỐNG GIÁO DỤC ĐIỆN TỬ ................ 38
2.1.2. ĐẶC ĐIỂM KỸ THUẬT CỦA HỆ THỐNG GIÁO DỤC ĐIỆN
TỬ ............................................................................................................... 38
2.1.3. SỰ CẦN THIẾT CỦA HỆ THỐNG GIÁO DỤC ĐIỆN TỬ ...... 39

2.1.4. CƠ CẤU CỦA HỆ THỐNG GIÁO DỤC ĐIỆN TỬ ................... 39
2.1.5. MỘT SỐ CHỨC NĂNG CHÍNH CỦA HỆ THỐNG GIÁO DỤC
ĐIỆN TỬ .................................................................................................... 40
2.2. HỆ THỐNG GIÁO DỤC ĐIỆN TỬ VỚI WEB NGỮ NGHĨA..............38
2.2.1. GIỚI THIỆU.................................................................................... 41
2.2.2. WEB NGỮ NGHĨA ......................................................................... 42
2.2.3. ỨNG DỤNG ..................................................................................... 44
2.3. VAI TRỊ CHUẨN HĨA SIÊU DỮ LIỆU CHO HỆ THỐNG GIÁO
DỤC ĐIỆN TỬ ...................................................................................................47
2.3.1. VAI TRÒ WEB NGỮ NGHĨA TRONG HỆ THỐNG GIÁO DỤC
ĐIỆN TỬ .................................................................................................... 47
2.3.2. CÁC THUỘC TÍNH CHUẨN ....................................................... 48
2.3.3. SỬ DỤNG PHÂN LOẠI ACM CCS (COMPUTER
CLASSIFICATION SYSTEM)................................................................ 49
CHƯƠNG 3. XÂY DỰNG HỆ THỐNG QUẢN LÝ BÀI GIẢNG TẠI
TRƯỜNG CAO ĐẲNG NGÔ GIA TỰ BẮC GIANG.........................................51
3.1. ĐÔI NÉT VỀ TRƯỜNG CAO ĐẲNG NGÔ GIA TỰ BẮC GIANG....51

4


3.2. XÁC ĐỊNH YÊU CẦU ...............................................................................52
3.2.1. YÊU CẦU CHỨC NĂNG ............................................................... 52
3.2.2. YÊU CẦU PHI CHỨC NĂNG ....................................................... 53
3.2.3. MÔ HÌNH USE - CASE ................................................................. 53
3.3. BIỂU DIỄN ONTOLOGY CHO HỆ THỐNG QUẢN LÝ BÀI GIẢNG
.............................................................................................................................58
3.3.1 THIẾT KẾ ONTOLOGY ................................................................ 58
3.3.2. CÁC MƠ HÌNH TRONG HỆ THỐNG QUẢN LÝ BÀI GIẢNG
..................................................................................................................... 60

3.4. THIẾT KẾ CƠ SỞ DỮ LIỆU CHO HỆ THỐNG QUẢN LÝ BÀI
GIẢNG ................................................................................................................65
3.4.1. MƠ HÌNH KHÁI NIỆM ................................................................. 65
3.4.2. ĐẶC TẢ DỮ LIỆU VÀ TỪ ĐIỂN DỮ LIỆU ............................... 66
3.5. THIẾT KẾ GIAO DIỆN ............................................................................67
3.5.1. GIAO DIỆN TRANG CHỦ CỦA GIÁO VIÊN ........................... 67
3.5.2. GIAO DIỆN THÊM MỘT TÀI NGUYÊN ................................... 68
3.5.3. GIAO DIỆN HIỂN THỊ MỘT TÀI NGUYÊN ............................ 69
3.5.4. GIAO DIỆN UPLOAD DỮ LIỆU LÊN SERVER ....................... 70
3.5.5. GIAO DIỆN LIỆT KÊ MÔN HỌC ............................................... 71
3.5.6. GIAO DIỆN CẬP NHẬT THÔNG TIN ....................................... 71
3.5.7. GIAO DIỆN SINH VIÊN THAM GIA MÔN HỌC .................... 72
CHƯƠNG 4: KẾT LUẬN ......................................................................................74
4.1. ĐÁNH GIÁ KẾT QUẢ...............................................................................74
4.2. PHẠM VI ỨNG DỤNG..............................................................................75
4.3. HƯỚNG PHÁT TRIỂN .............................................................................75
TÀI LIỆU THAM KHẢO ......................................................................................76
PHỤ LỤC .................................................................................................................77
CÀI ĐẶT CHƯƠNG TRÌNH.................................................................................77

5


DANH MỤC BẢNG

Bảng 1.1. Các lớp trong RDFS .................................................................................30
Bảng 1.2. Các thuộc tính trong RDFS ......................................................................31
Bảng 1.3. Các mơ tả thuộc tính đối tượng OWL ......................................................32
Bảng 1.4. Các mơ tả thuộc tính lớp OWL.................................................................32
Bảng 1.5. Các tiên đề và các sự kiện của OWL ........................................................33

Bảng 1.6. Một Ontology ví dụ trong cú pháp trừu tượng của OWL DL ..................33
Bảng 3.1. Bảng danh sách các actor ..........................................................................53
Bảng 3.2. Bảng danh sách các Use-Case ..................................................................54
Bảng 3.3. Bảng đặc tả dữ liệu tài khoản ...................................................................66
Bảng 3.4. Bảng đặc tả dữ liệu tài nguyên .................................................................67
Bảng 3.5. Bảng đặc tả dữ liệu thao tác ......................................................................67

6


DANH MỤC HÌNH
Hình 1.1 Sự hình thành và phát triển của Web ngữ nghĩa ........................................17
Hình 1.1 Kiến trúc Web ngữ nghĩa ...........................................................................17
Hình 1.2. Bộ ba RDF.................................................................................................18
Hình 1.3. Đồ thị RDF gồm hai mệnh đề ...................................................................19
Hình 3.2. Biểu đồ chức năng và quyền của quản trị hệ thống .................................55
Hình 3.3. Biểu đồ chức năng của giáo viên ..............................................................57
Hình 3.4. Biểu đồ chức năng và quyền của sinh viên ...............................................58
Hình 3.5. Ontology mơ tả các tài ngun học tập .....................................................60
Hình 3.6. Mơ hình các lớp trong thiết kế Ontology ..................................................61
Hình 3.7. Mơ hình thiết kế ontology sử dụng Protégé 3.0 ........................................62
Hình 3.8. Mơ hình các thuộc tính trong thiết kế ontology ........................................63
Hình 3.9. Mơ hình khái niệm ....................................................................................66
Hình 3.10. Giao diện trang chủ của giáo viên ...........................................................68
Hình 3.11. Giao diện thêm một tài nguyên ...............................................................69
Hình 3.12. Giao diện hiển thị một tài nguyên ...........................................................70
Hình 3.13. Giao diện upload dữ liệu lên server ........................................................70
Hình 3.14. Giao diện liệt kê mơn học .......................................................................71
Hình 3.15. Giao diện cập nhật thơng tin ...................................................................72
Hình 3.16. Giao diện sinh viên tham gia môn học ....................................................73


7


MỞ ĐẦU
1. LÝ DO CHỌN ĐỀ TÀI
Ngày nay công nghệ thông tin đã và đang phát triển mạnh mẽ trên tồn thế
giới. Nó đóng vai trị rất quan trọng trong đời sống kinh tế, xã hội, học tập… Nhắc
tới công nghệ thông tin chúng ta không thể bỏ qua công nghệ web. Người sử dụng
Web có thể dễ dàng truy cập những thông tin bằng cách chỉ ra địa chỉ URL –
Uniform Resouce Locator và theo các liên kết để tìm ra các tài ngun liên quan
khác.
Tính đơn giản của web hiện nay đã dẫn đến một số mặt hạn chế. Chẳng hạn
như chúng ta có thể dễ dàng bị lạc hay phải đối đầu với một lượng thông tin không
hợp lý và không liên quan được trả về từ kết quả tìm kiếm trên Web. Như vậy câu
hỏi đặt ra là làm thế nào để chúng ta có được một kết quả tìm kiếm chính xác và
nhanh chóng theo đúng những gì mà chúng ta mong muốn?
Các kĩ thuật Web hiện nay đã cản trở khả năng phát triển thơng tin của nó.
Tính đơn giản của các kĩ thuật này đã gây ra hiện tượng thắt cổ chai, tạo khó khăn
trong việc tìm kiếm, rút trích, bảo trì và phát sinh thơng tin. Máy tính chỉ được dùng
như những thiết bị gửi và trả thông tin, chúng không thể truy xuất được những nội
dung thật sự cần và do đó chúng chỉ hỗ trợ ở một mức giới hạn nào đó trong việc
truy xuất và xử lý thơng tin. Kết quả tất yếu là con người phải gánh trên vai trách
nhiệm không những truy cập và xử lý thông tin mà cịn rút trích và thơng dịch mọi
thơng tin.
Để khắc phục các yếu điểm của Web hiện tại khái niệm “Semantic Web” đã
ra đời, và khái niệm này được Tim Berners-Lee định nghĩa như sau:
“Semantic Web là sự mở rộng của Web hiện tại trong đó thơng tin được định
nghĩa rõ ràng, cho phép con người và máy tính có thể làm việc cộng tác với
nhau”

Web ngữ nghĩa sẽ là một sự ra đời tất yếu của quá trình nghiên cứu với ý
tưởng không ngừng phát triển để phù hợp với yêu cầu thực tế của con người. Do

8


đây là một xu hướng mới còn đang được nghiên cứu và tiếp tục phát triển nên luận
văn này giới hạn trong việc nghiên cứu các kiến thức cơ sở của Web ngữ nghĩa, đi
vào nghiên cứu chi tiết về việc ứng dụng vào xây dựng hệ thống Giáo dục điện tử
như là một ứng dụng minh họa.
Xuất phát từ những ý tưởng trên mà Web ngữ nghĩa có thể mang lại và niềm
hi vọng của bản thân, tác giả đã mạnh dạn chọn đề tài “Nghiên cứu xây dựng thử
nghiệm hệ thống quản lý thông tin bài giảng điện tử ứng dụng Web ngữ nghĩa”
làm đề tài nghiên cứu cho luận văn tốt nghiệp của mình.
2. LỊCH SỬ NGHIÊN CỨU
Thế hệ web đầu tiên bắt đầu với những trang HTML thủ công, thế hệ thứ hai
đã tạo nên một bước cho máy thực hiện và thường là các trang HTML động. Các
thế hệ web này mang ý nghĩa cho con người thao tác trực tiếp (đọc, duyệt, điền vào
mẫu). Thế hệ web thứ ba được gọi là “Web ngữ nghĩa”, mang mục đích là thơng
tin sẽ do máy xử lí. Điều này trùng khớp với quan điểm của Tim Berners-Lee đã mô
tả trong cuốn sách gần đây nhất của ông “Weaving the web”. Web ngữ nghĩa sẽ làm
cho các dịch vụ thơng minh hơn ví dụ như mơi giới thơng tin, tác nhân tìm kiếm, bộ
lọc thơng tin... Những dịch vụ thông minh trên hệ thống web giàu ngữ nghĩa chắc
hẳn sẽ vượt trội hơn những bản sẵn có hiện tại của các dịch vụ này, mà chỉ giới hạn
về chức năng.

Hình 1. Sự hình thành và phát triển của Web ngữ nghĩa
9



3. MỤC ĐÍCH NGHIÊN CỨU
Trong q trình nghiên cứu đề tài, tác giả đã nghiên cứu các vấn đề chính sau:
- Tổng quan về Web ngữ nghĩa, tìm hiểu các kiến thức cơ sở về Ontology – chìa
khóa kỹ thuật của Web ngữ nghĩa, tìm hiểu về các ngơn ngữ, các công cụ để
xây dựng Ontology và Web ngữ nghĩa.
- Tìm hiểu về khái niệm, đặc điểm kỹ thuật, sự cần thiết của hệ thống giáo dục
điện tử và vai trị chuẩn hóa siêu dữ liệu cho hệ thống giáo dục điện tử về cơ
cấu, các dạng chuẩn, các thuộc tính chuẩn của hệ thống giáo dục điện tử.
- Nghiên cứu thử nghiệm sử dụng ứng dụng web ngữ nghĩa trong hệ thống giáo
dục điện tử xây dựng hệ thống hỗ trợ giảng dạy trực tuyến ứng dụng cho:
+ Trường Cao đẳng Ngô Gia Tự Bắc Giang
+ Xây dựng thử nghiệm cho bộ môn Tin học
+ Đánh giá kết quả thử nghiệm.
4. ĐỐI TƯỢNG - PHẠM VI NGHIÊN CỨU
Hệ thống xây dựng với mục đích nghiên cứu ứng dụng của web ngữ nghĩa
trong hệ thống đào tạo trực tuyến sinh viên trường Cao đẳng Ngô Gia Tự Bắc
Giang, nên đối tượng và phạm vi nghiên cứu sẽ tập trung vào các công tác đào tạo
của Trường, các đối tượng sử dụng hệ thống: giáo viên, sinh viên, quản lý…
5. BỐ CỤC LUẬN VĂN
Luận văn gồm 4 chương
Chương 1: Tổng quan

-

Chương này tập trung tìm hiểu và trình bày về Web ngữ nghĩa: bao gồm khái
niệm, kiến trúc, các lĩnh vực ứng dụng của Web ngữ nghĩa, tìm hiểu các kiến
thức cơ sở về Ontology – chìa khóa kỹ thuật của Web ngữ nghĩa, tìm hiểu về
các ngơn ngữ, các cơng cụ để xây dựng Ontology và Web ngữ nghĩa.

Chương 2: Ứng dụng web ngữ nghĩa trong hệ thống giáo dục điện tử

Chương này tập trung tìm hiểu về khái niệm, đặc điểm kỹ thuật, sự cần thiết
của hệ thống giáo dục điện tử và vai trị chuẩn hóa siêu dữ liệu cho hệ thống giáo

10


dục điện tử về cơ cấu, các dạng chuẩn, các thuộc tính chuẩn của hệ thống giáo dục
điện tử.
Chương 3 Xây dựng hệ thống quản lý bài giảng tại trường cao đẳng Ngô Gia
Tự Bắc Giang
-

Luận văn ứng dụng web ngữ nghĩa trọng hệ thống giáo dục điện tử để xây
dựng và phát triển hệ thống thử nghiệm.

Chương 4: Kết luận
-

Luận văn đánh giá kết quả đạt được và tồn tại của hệ thống.

6. PHƯƠNG PHÁP NGHIÊN CỨU
Kết hợp 3 phương pháp:
-

Nghiên cứu lý thuyết.

-

Mơ hình hóa


-

Thực nghiệm
Nghiên cứu lý thuyết: Luận văn tiến hành nghiên cứu tổng quan về Semantic

Web, nghiên cứu các công cụ cho phép xây dựng hệ thống.
Mơ hình hóa: Luận văn tìm hiểu, phân tích đề xuất mơ hình hệ thống ứng
dụng semantic web vào elearning.
Thực nghiệm: Luận văn đã xây dựng trang web với hệt thống giáo dục điện
tử có ứng dụng của SemanticWeb

11


Chương 1: TỔNG QUAN

1.1.

TỔNG QUAN VỀ SEMANTIC WEB

1.1.1. KHÁI NIỆM WEB NGỮ NGHĨA VÀ SIÊU DỮ LIỆU
 Khái niệm
Sau khi ra đời của Internet và World Wide Web (WWW), rất nhiều những nỗ
lực đã được thực hiện và các công nghệ được phát triển nhằm mục đích làm cho
World Wide Web tốt hơn, nhanh hơn, và thông minh hơn. Nhiều công nghệ, kiến
nghị sau khi xuất hiện đã trở thành chuẩn chung chỉ trong một thời gian ngắn. Một
trong những nỗ lực này là web ngữ nghĩa. Web ngữ nghĩa có thể được xem là sự mở
rộng của web hiện tại. Web ngữ nghĩa khơng phải là Trí tuệ nhân tạo, nhưng có thể
xem là một dạng web thơng minh.
Web ngữ nghĩa là sự mở rộng của WWW bằng cách thêm vào các mô tả ngữ

nghĩa của thông tin dưới dạng mà chương trình máy tính có thể “hiểu” và do vậy
cho phép xử lý thông tin hiệu quả hơn. Xét về mặt bản chất, Web ngữ nghĩa chỉ là
một cơng cụ để con người cũng như máy tính sử dụng để biểu diễn thơng tin, hay
nói chính xác hơn thì Web ngữ nghĩa chỉ là một dạng dữ liệu trên Web. Khác với
các dạng thức dữ liệu được trình bày trong HTML, dữ liệu trong Web ngữ nghĩa
được đánh dấu, phân lớp, mơ hình hóa, được bổ sung thêm các thuộc tính, các mối
liên hệ… theo các lĩnh vực cụ thể, qua đó giúp cho các phần mềm máy tính có thể
hiểu được dữ liệu và tự động xử lý được những dữ liệu đó.
Trong web ngữ nghĩa, với sự trợ giúp của các công nghệ khác, chúng ta có
thể trợ giúp cho máy tính hiểu được các khái niệm, mối quan hệ giữa chúng, xử lí
nhanh chóng, chính xác các truy vấn từ người dùng.
 Siêu dữ liệu
Một trong những nền tảng cơ bản làm nên web ngữ nghĩa là các siêu dữ liệu.
Siêu dữ liệu dùng để mơ tả tài ngun thơng tin, cịn gọi là dữ liệu về dữ liệu. Mỗi
thực thể hay khái niệm có thể có một hay nhiều siêu dữ liệu. Ví dụ, một khóa luận
tốt nghiện có [một tác giả], [tên khóa luận], [cán bộ hướng dẫn], ... là các siêu dữ
liệu về khóa luận. Chúng ta có thể đơn giản hóa việc phân loại và truy vấn dữ liệu
12


bằng cách dùng các siêu dữ liệu. Mối liên hệ giữa siêu dữ liệu và tài ngun thơng
tin mà nó mơ tả có thể được thể hiện ở một trong hai cách sau:
-

Các phần tử metadata được chứa trong một biểu ghi tách biệt bên ngồi
đối tượng mơ tả.

-

Các phần tử siêu dữ liệu có thể được nhúng vào bên trong tài ngun mà

nó mơ tả.

Trước đây với tài liệu truyền thống, các mơ tả dữ liệu nằm ngồi đối tượng
mô tả, như vậy siêu dữ liệu được lưu trữ một cách tách biệt bên ngồi đối tương mơ
tả.
Với tài liệu số, siêu dữ liệu của chúng được nhúng trong bản thân tài nguyên
hoặc liên kết với tài nguyên mà nó mơ tả như trong trường hợp các thẻ meta của tài
liệu HTML
i. Sơ đồ siêu dữ liệu
Sơ đồ siêu dữ liệu là tập hợp những yếu tố siêu dữ liệu được thiết kế cho mô
tả một dạng tài nguyên thông tin cụ thể. Như vậy siêu dữ liệu là sơ đồ hình thức
được xác định để mơ tả tài nguyên thông tin cho đối tượng số hoặc không số. Ví dụ
tập hợp yếu tố siêu dữ liệu Dublin Core có sơ đồ bao gồm 15 yếu tố cơ bản để mô tả
tài nguyên thông tin.
ii. Ngữ nghĩa
Định nghĩa các yếu tố hoặc ý nghĩa được gán cho các yếu tố siêu dữ liệu thì
được gọi là ngữ nghĩa của sơ đồ. Mỗi sơ đồ siêu dữ liệu có ngữ nghĩa và cú pháp
được quy định riêng. Ví dụ trong yếu tố siêu dữ liệu Dublin Core yếu tố “Creator” –
dùng để xác định là tác giả của tài liệu, hoặc yếu tố “Title” – được hiểu là nhan đề
của tài liệu.
iii. Nội dung
Giá trị (dữ liệu) của từng yếu tố được gọi là nội dung. Đó chính là giá trị của
mỗi yếu tố siêu dữ liệu. Nhờ các sơ đồ dữ liệu, các chương trình xử lý tự động sẽ
nhận biết đoạn dữ liệu nào sẽ thuộc thành phần nào, chẳng hạn đoạn dữ liệu này
được nhận biết là nhan đề, đoạn dữ liệu kia được nhận biết là tác giả của tài liệu.

13


1.1.2. PHÂN BIỆT WEB NGỮ NGHĨA VỚI WEB HIỆN NAY

Những ưu điểm của web ngữ nghĩa so với web hiện tại:
 Máy tính có thể hiểu được thơng tin trên Web: Web ngữ nghĩa định nghĩa
các khái niệm và bổ sung quan hệ dưới dạng máy tính có thể hiểu được. Do
đó, việc tìm kiếm, đánh giá, xử lý, tích hợp thơng tin có thể được tiến hành
một cách tự động.
 Thơng tin được tìm kiếm nhanh chóng và chính xác hơn: Với Web ngữ
nghĩa, máy tính có thể xác định một thực thể thuộc lớp hay thuộc tính cụ thể
nào dựa trên ngữ cảnh chứa nó. Do đó thu hẹp khơng gian tìm kiếm và cho
kết quả nhanh, chính xác hơn.
 Khả năng suy luận thông minh: Dựa vào các luật suy diễn trên cơ sở tri thức
về các thực thể, máy tính có khả năng sinh ra những kết luận mới.
 Dữ liệu liên kết động: Thay thế cách liên kết sử dụng liên kết tĩnh trong Web
cũ, Web ngữ nghĩa liên kết dữ liệu từ nhiều nguồn khác nhau một cách hiệu
quả hơn dựa trên định danh của tài nguyên (URI) và quan hệ giữa chúng.
Cách liên kết này đơi khi cịn được gọi là liên kết bằng siêu dữ liệu
Những nhược điểm của web ngữ nghĩa so với web hiện tại:
 Web ngữ nghĩa hiện nay chưa được phát triển mạnh là vì bản thân các lớp
ngơn ngữ biểu diễn chúng cịn chưa được hồn thiện, các ứng dụng hỗ trợ
Web ngữ nghĩa cịn rất ít và hiện đang được nghiên cứu, phát triển. Ví dụ cụ
thể là ngôn ngữ HTML, một ngôn ngữ được dùng để biểu diễn thông tin trên
trang Web hiện tại. Các trang Web sử dụng HTML đều có thể được đọc và
hiển thị trên các chương trình gọi là trình duyệt (chẳng hạn như Internet
Explorer hay Firefox…), còn các trang Web ngữ nghĩa thì hiện nay chưa có
một chương trình nào cụ thể được gọi là trình duyệt để xử lý nó cả.
 Web ngữ nghĩa chỉ là một dạng dữ liệu, vì vậy cần phải có các chương trình
máy tính chun biệt để xử lý nó. Đó chính là các cơng cụ cho phép thu hồi,
tách chiết, tìm kiếm, biểu diễn thông tin… trong không gian của Web ngữ
nghĩa. Hiện nay, cùng với việc đề xuất ra các chuẩn ngôn ngữ biểu diễn Web

14



ngữ nghĩa, các chương trình xử lý Web ngữ nghĩa cũng đang được gấp rút
nghiên cứu và phát triển.
1.1.3. VAI TRỊ CỦA WEB NGỮ NGHĨA
i. Máy có thể hiểu được thơng tin trên Web

Internet ngày nay dựa hồn tồn vào nội dung. Web hiện hành chỉ cho con
người đọc chứ không dành cho máy hiểu. Web ngữ nghĩa sẽ cung cấp ý nghĩa cho
máy hiểu. Ví dụ:
 The Beatles là một ban nhạc nổi tiếng của Liverpool.
 John Lennon là một thành viên của The Beatles.
 Bản nhạc “Hey Dude” do nhóm The Beatles trình bày.
Những câu như thế này có thể hiểu bởi con người nhưng làm sao chúng có thể được
hiểu bởi máy tính?
Web ngữ nghĩa là tất cả những gì về cách tạo một Web mà cả người và máy
có thể hiểu. Người dùng máy tính sẽ vẫn có thơng tin trình bày theo cách trước đây,
nhưng đối với máy tính, Web ngữ nghĩa là ánh sáng soi rọi vào màn đêm của Web
hiện hành. Bây giờ, máy không phải suy luận dựa vào ngữ pháp và các ngơn ngữ
đánh dấu nữa vì cấu trúc ngữ nghĩa của văn bản thực sự đã chứa nó rồi.
ii. Thơng tin được tìm kiếm nhanh chóng và chính xác hơn
Với Web ngữ nghĩa, việc tìm kiếm sẽ dễ dàng nếu mọi thứ được đặt trong
ngữ cảnh. Ý tưởng chính yếu là toàn bộ ngữ cảnh mà người sử dụng biết đến. Mục
tiêu của Web ngữ nghĩa là phát triển các tiêu chuẩn và kĩ thuật để giúp máy hiểu
nhiều thông tin trên Web hơn, để chúng tìm ra các thơng tin dồi dào hơn, tích hợp,
duyệt dữ liệu, và tự động hóa các thao tác. Với Web ngữ nghĩa, chúng ta khơng
những nhận được những thơng tin chính xác hơn khi tìm kiếm thơng tin từ máy tính,
mà máy tính cịn có thể tích hợp thơng tin từ nhiều nguồn khác nhau, biết so sánh
các thông tin với nhau.
iii. Dữ liệu liên kết động

Với Web ngữ nghĩa, chúng ta có thể kết hợp các thông tin đã được mô tả và
giàu ngữ nghĩa với bất kì nguồn dữ liệu nào. Ví dụ, bằng cách thêm các metadata

15


(siêu dữ liệu) cho các tài liệu khi tạo ra nó, chúng ta có thể tìm kiếm các tài liệu mà
metadata cho biết tác giả là Eric Miller. Cũng thế, với metadata chúng ta có thể tìm
kiếm chỉ những tài liệu thuộc loại tài liệu nghiên cứu.
Với Web ngữ nghĩa, chúng ta không chỉ cung cấp URI cho tài liệu như đã
làm trong quá khứ mà còn cho con người, các khái niệm, các mối liên hệ. Như trong
ví dụ trên, bằng cách cung cấp những định danh duy nhất cho mỗi con người như
vài trò của “tác giả” và khái niệm “tài liệu nghiên cứu”, chúng ta đã làm rõ người
ở đây là ai và mối quan hệ tương ứng của người này với một tài liệu nào đó. Ngoài
ra, bằng cách làm rõ người mà chúng ta đang đề cập chúng ta có thể phân biệt
những tài liệu nào của Eric Miller với những tài liệu của người khác. Chúng ta có
thể kết hợp những thơng tin đã được mô tả ở nhiều site khác nhau để biết thêm
thông tin về người này ở những ngữ cảnh khác nhau ví dụ như vai trị của anh ta ra
sao khi anh ta là tác giả, nhà quản lý, nhà phát triển…
iv. Hỗ trợ cơng cụ tự động hóa
Ngồi ra, chúng còn cung cấp các loại dịch vụ tự động từ nhiều vùng khác
nhau: từ gia đình và các thư viện kĩ thuật số cho đến các dịch vụ kinh doanh điện tử
và dịch vụ sức khỏe…
Web ngữ nghĩa còn cung cấp các phương tiện để thêm các thông tin chi tiết lên web
nhằm hỗ trợ sự tự động hóa cho các dịch vụ.
1.2. KIẾN TRÚC CỦA WEB NGỮ NGHĨA
Để có được những khả năng như đã đề cập ở phần trên, web ngữ nghĩa cần
có một hạ tầng chặt chẽ với nhiều lớp hỗ trợ. Dưới đây là kiến trúc tổng quát nhất
của web ngữ nghĩa do tổ chức W3C đề xuất:


16


Hình 1.1 Kiến trúc Web ngữ nghĩa
Từ sơ đồ kiến trúc của Web ngữ nghĩa, ta thấy có bảy tầng kiến trúc. Trong
đó, với hệ thống Web hiện tại (World Wide Web) là đang ở tầng thứ hai.
Unicode: chỉ đơn thuần là một bảng mã chuẩn chung có đủ các ký tự để
thống nhất sự giao tiếp trên tất cả các quốc gia, đáp ứng tính nhất qn tồn cầu của
web.
URI (Uniform Resource Identifier)
Một URI (Uniform Resource Identifier) là một kí hiệu nhận dạng Web đơn
giản. Cụ thể, nó là một xâu ngắn cho phép nhận dạng tài nguyên Web như: với các
xâu bắt đầu với "http:" hoặc "ftp:" mà chúng ta thường thấy trên World Wide Web.
Bất kỳ một người nào cũng có thể tạo một URI, và sở hữu chúng và chúng là một
công nghệ cơ sở để xây dựng một hệ thống Web toàn cầu. Hệ thống World Wide
Web được xây dựng trên chúng và bất kỳ cái gì mà có một URI thì được coi là "trên
Web".
URL (Uniform Resource Locator) là một dạng đặc biệt của URI, cụ thể nó
là một địa chỉ trên mạng.
URIref (URI reference) là một URI cùng với một phần nhận dạng tuỳ ý ở
cuối. Ví dụ, ta có một URIref : " bao
gồm một URI: " và một phần nhận dạng
"Ontology" được cách nhau bởi kí hiệu #.
Theo như quy ước, các không gian tên là những tài nguyên mà tạo ra các đa
tài nguyên, thường là những URI được kết thúc bởi kí hiệu #. Ví dụ:
17


" là một không gian tên. Các tài nguyên không có
URIref thì được gọi là các nút trắng; một nút trắng chỉ ra sự tồn tại của tài ngun

khơng có sự đề cập rõ ràng về tham chiếu URIref của tài nguyên.
RDF (Resource Description Framework): Khung mô tả tài nguyên
RDF được W3C giới thiệu để cung cấp một cú pháp chuẩn để tạo, thay đổi
và sử dụng các chú thích trong Web ngữ nghĩa. Một mệnh đề RDF là một bộ ba có
dạng: [chủđề

thuộctính đốitượng]. Trong đó, chủ đề là tài ngun mà được mơ

tả bằng thuộc tính và đối tượng. Thuộc tính thể hiện mối quan hệ giữa chủ đề và đối
tượng. Cịn đối tượng ở đây có thể là một tài nguyên hoặc một giá trị. Ba thành
phần trên trong RDF đều là các URI.

Hình 1.2. Bộ ba RDF
Ví dụ : về mệnh đề RDF
Giả sử biểu diễn mệnh đề "The libary lends books”, ta có chủ đề là "The
libary", thuộc tính là " lends ", đối tượng là " books " và các thơng tin này có các
URI
#libary",

tương

ứng



"Http:/www.libary.org/ontology/

"Http:/www.libary.org/ontology/#lends"




"Http:/www.

libary.org/ ontology/#books". Khi đó mệnh đề được biểu diễn dạng đồ thị như sau:

18


Http:/www.libary.org/ontology/#li
Http:/www.libary.org/ontology/#
Http:/www.libary.org/
Một tập các mệnh đề RDF được gọi là đồ thị RDF.

Hình 1.3. Đồ thị RDF gồm hai mệnh đề
Để biểu diễn các mệnh đề RDF mà máy có thể hiểu, RDF định nghĩa ra một
số cú pháp như: cú pháp Notation 3 (hay còn gọi là N3), cú pháp ngôn ngữ
RDF/XML (mở rộng từ XML), hay đồ thị của các bộ ba như ví dụ Hình 2.5.
RDFS (RDF schema)
RDFS là một ngôn ngữ ontology đơn giản của web ngữ nghĩa, được coi là
một ngôn ngữ cơ sở của web ngữ nghĩa. RDFS là ngôn ngữ mô tả bộ từ vựng trên
các bộ ba RDF. Nó cung cấp các cơng việc sau:
- Định nghĩa các lớp tài nguyên
- Định nghĩa các quan hệ giữa các lớp
- Định nghĩa các loại thuộc tính mà các lớp trên có
- Định nghĩa các mối quan hệ giữa các thuộc tính.
Ontology Vocabulary
Bộ từ vựng ontology được xây dựng trên cơ sở tầng RDF và RDFS, cung cấp
biểu diễn ngữ nghĩa mềm dẻo cho tài nguyên web và có khả năng hỗ trợ lập luận.
Để xây dựng được các bộ từ vựng này, người ta đã sử dụng các ngôn ngữ ontology
19



để biểu diễn chúng như: RDFS, OIL, DAML, DAML+OIL, OWL, ... Các ngôn ngữ
này cung cấp khả năng biểu diễn và hỗ trợ lập luận khác nhau và chúng dựa trên
nền tảng là các ngôn ngữ logic mô tả tương ứng khác nhau.
Tầng Logic
Việc biểu diễn các tài nguyên dưới dạng các bộ từ vựng ontology có mục
đích là để máy có thể lập luận được. Mà cơ sở lập luận chủ yếu dựa vào logic.
Chính vì vậy mà các ontology được ánh xạ sang logic, cụ thể là logic mơ tả để có
thể hỗ trợ lập luận. Vì logic mơ tả có biểu diễn ngữ nghĩa hình thức (đặc trưng của
lý thuyết mơ hình), và cung cấp các dịch vụ lập luận, là cơ sở để hỗ trợ máy có thể
lập luận và hiểu tài nguyên.
Tầng Proof
Tầng này đưa ra các luật để suy luận. Cụ thể từ các thơng tin đã có ta có thể
suy ra các thơng tin mới. Ví dụ: A là cha của B, A là em trai C thì khi đó ta có
thơng tin mới là C là bác của B. Để có được các suy luận này thì cơ sở là FOL
(First-Order-Logic). Và tầng này hiện nay các nhà nghiên cứu đang xây dựng các
ngơn ngữ luật cho nó như: SWRL, RuleML.
Tầng Trust
Đảm bảo tính tin cậy của các ứng dụng trên Web ngữ nghĩa. Ví dụ: có một
người bảo x là xanh, một người khác lại nói x khơng xanh, như thế Web ngữ nghĩa
là không đáng tin cậy? Câu trả lời ở đây được xem xét trong các ngữ cảnh. Mỗi ứng
dụng trên web ngữ nghĩa sẽ có một ngữ cảnh cụ thể, chính vì thế các mệnh đề trên
có thể nằm trong các ngữ cảnh khác nhau khi đó ngữ nghĩa tương ứng khác nhau
nên các mệnh đề đó vẫn đúng, đáng tin cậy trong ngữ cảnh của nó. Để có được sự
chứng minh về độ tin cậy thì các lập luận được áp dụng là không đơn điệu và có các
cơ chế kiểm tra chứng minh kết hợp với công nghệ chữ ký điện tử để xác nhận độ
tin cậy. Các ngôn ngữ chứng minh là ngôn ngữ cho ta chứng minh một mệnh đề là
đúng hay sai.


20


1.3. ONTOLOGY
Phần này trình bày về việc xây dựng Semantic Web dựa trên nền tảng
ontology.
1.3.1. KHÁI NIỆM VỀ ONTOLOGY
Các Ontology đóng vai trị then chốt trong việc cung cấp ngữ nghĩa mà máy
có thể hiểu được cho các tài nguyên của Web ngữ nghĩa. Ontology là một thuật ngữ
mượn từ triết học nhằm chỉ khoa học mô tả các loại thực thể trong thế giới thực và
cách chúng liên kết với nhau. Trong khoa học máy tính, một cách khái quát,
Ontology là "một biểu diễn của sự khái niệm hoá chung được chia sẻ" của một miền
nhất định. Nó cung cấp một bộ từ vựng chung bao gồm các khái niệm, các thuộc
tính quan trọng và các định nghĩa về các khái niệm và các thuộc tính này. Ngồi bộ
từ vựng, Ontology cịn cung cấp các ràng buộc, đơi khi các ràng buộc này được coi
như các giả định cơ sở về ý nghĩa mong muốn của bộ từ vựng, nó được sử dụng
trong một miền mà có thể được giao tiếp giữa người và các hệ thống ứng dụng phân
tán khác. Việc tiếp cận ngữ nghĩa tài nguyên Web thơng qua các Ontology thì mềm dẻo
hơn vì người sử dụng có thể lựa chọn bộ từ vựng và các ràng buộc trong các Ontology.
Ví dụ, các ứng dụng trong các miền khác nhau có thể sử dụng các Ontology khác nhau.
Đặc biệt, các Ontology có thể được sử dụng để đặc tả ý nghĩa của các tài nguyên Web
(thông qua các chú thích) bằng cách xác nhận các tài nguyên như các trường hợp cụ thể
của một số khái niệm quan trọng và hay hoặc khẳng định các tài ngun có quan hệ với
các tài ngun khác thơng qua một số thuộc tính quan trọng đã định nghĩa trong các
Ontology.
Từ vựng trong một Ontology có thể được biểu diễn bằng các khái niệm và
các quan hệ được đặt tên và các định nghĩa khái niệm có thể được biểu diễn bằng
các giới thiệu tương đương. Các giả định cơ sở có thể được biểu diễn bằng các tiên
đề khái niệm và quan hệ khái quát. Đôi khi một Ontology tương ứng với một cơ sở
tri thức logic mô tả. Một Ontology cũng chứa các trường hợp của các khái niệm và

các mối quan hệ quan trọng của các cá thể này, nó được biểu diễn bằng các khẳng
định của logic mô tả.

21


Ví dụ sau chỉ ra một Ontology được biểu diễn trong logic mô tả thông qua
các tiên đề và các khẳng định.
Ví dụ về một Ontology có cơ sở logic mơ tả
Một Ontology đơn giản về thư viện có tên là ThuVien có thể bao gồm 3 phần:
 Phần thứ nhất: là tập các khái niệm và các thuộc tính quan trọng, có thể bao
gồm:
- Các khái niệm như: Sach, TacGia, DocGia, NhaXuatBan, Nguoi
- Các thuộc tính: doc, viet, motphanCua, namxuatban, theloai.
- Khái niệm định nghĩa: ví dụ khái niệm “Tác giả” bao gồm tất cả những
người viết sách hoặc một phần cuốn sách.
 Thành phần thứ hai của Otology ThuVien được đưa ra bằng các giả định cơ
sở của miền và có thể bao gồm:
- Nguyễn Duy, Hồ Chí Minh, Phan Thị Tươi là tác giả.
 Thành phần thứ ba của Ontology ThuVien là về các cá thể và mối quan hệ
của chúng, có thể bao gồm:
Các Ontology dựa trên logic mơ tả có thể khai thác các cơng cụ lập luận
mạnh của logic mô tả, do vậy máy có thể hiểu được các tài nguyên Web dễ hơn. Hỗ
trợ lập luận Logic mơ tả có thể rất hữu ích để đảm bảo chất lượng của các Ontology
mà Ontology là nòng cốt của Web ngữ nghĩa.
Bộ lập luận DL sẽ đưa ra kết quả là thoả. Do đó có thể có một đề nghị bổ
sung tri thức cơ sở này vào trong Ontology ThuVien
Như vậy, các Ontology biểu diễn dựa trên logic mô tả đã khai thác được khả
năng biểu diễn tri thức cũng như khả năng lập luận hiệu quả của logic mơ tả để máy
có thể hiểu được tài nguyên Web.

1.3.2. CÁC THÀNH PHẦN CỦA ONTOLOGY
Ontology được sử dụng như là một biểu mẫu trình bày tri thức về thế giới hay
một phần của nó. Ontology thường miêu tả:
• Cá thể: Các đối tượng cơ bản, nền tảng.
• Lớp: Các tập hợp, hay kiểu của các đối tượng.

22


• Thuộc tính: Thuộc tính, tính năng, đặc điểm, tính cách, hay các thơng số mà các
đối tượng có và có thể đem ra chia sẻ.
• Mối liên hệ: cách mà các đối tượng có thể liên hệ tới một đối tượng khác.
i. Cá thể (Individuals) – Thể hiện
Cá thể là thành phần cơ bản của một ontology. Các cá thể trong một
ontology có thể bao gồm các đối tượng rời rạc như xe, con cọp.. , cũng như các đối
tượng trừu tượng như con số và từ.
ii. Lớp (Classes) - Khái niệm
Lớp là những nhóm, bộ hoặc tập hợp các đối tượng. Một lớp có thể gộp
nhiều lớp hoặc được gộp vào lớp khác. Một lớp gộp vào lớp khác được gọi là lớp
con của lớp gộp. Điều quan trọng của quan hệ xếp gộp là tính kế thừa.
iii. Thuộc tính (Properties)
Các đối tượng trong ontology có thể được mơ tả thơng qua việc khai báo các
thuộc tính của chúng. Mỗi một thuộc tính đều có tên và giá trị của thuộc tính đó.
Các thuộc tính được sử dụng để lưu trữ các thơng tin mà đối tượng có thể có. Ví dụ,
đối với một cá nhân có thể có các thuộc tính: Họ_tên, ngày_sinh, q_qn,
số_cmnd…Giá trị của một thuộc tính có thể có các kiểu dữ liệu phức tạp.
iv. Mối quan hệ (Relation)
Quan hệ giữa các đối tượng trong một ontology cho biết các đối tượng liên
hệ với đối tượng khác như thế nào. Sức mạnh của ontolgy nằm ở khả năng diễn đạt
quan hệ. Tập hợp các quan hệ cùng nhau mô tả ngữ nghĩa của domain. Tập các

dạng quan hệ được sử dụng và cây phân loại thứ bậc của chúng thể hiện sức mạnh
diễn đạt của ngôn ngữ dùng để biểu diễn ontology. Ontology thường phân biệt các
nhóm quan hệ khác nhau. Vd:
• Quan hệ giữa các lớp
• Quan hệ giữa các thực thể
• Quan hệ giữa một thực thể và một lớp
• Quan hệ giữa một đối tượng đơn và một tập hợp
• Quan hệ giữa các tập hợp.

23


×