Tải bản đầy đủ (.pdf) (80 trang)

luận văn công nghệ thông tin nghiên cứu semantic web ứng dụng xây dựng hệ thống e-learning cho một trường đại học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.28 MB, 80 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC DÂN LẬP KỸ THUẬT CÔNG NGHỆ
KHOA CÔNG NGHỆ THÔNG TIN
NGÀNH HỆ THỐNG THÔNG TIN

* * * * * *




LUẬN VĂN TỐT NGHIỆP


Đề tài :
NGHIÊN CỨU SEMANTIC WEB –
ỨNG DỤNG XÂY DỰNG HỆ THỐNG
E-LEARNING CHO MỘT TRƯỜNG
ĐẠI HỌC



SVTH : THÁI TÙNG QUANG – 00ĐTH138
NGUYỄN VĂN THÀNH – 00ĐTH155





TP. HỒ CHÍ MINH
2005


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC DÂN LẬP KỸ THUẬT CÔNG NGHỆ
KHOA CÔNG NGHỆ THÔNG TIN
NGÀNH HỆ THỐNG THÔNG TIN

* * * * * *








LUẬN VĂN TỐT NGHIỆP


Đề tài :
NGHIÊN CỨU SEMANTIC WEB –
ỨNG DỤNG XÂY DỰNG HỆ THỐNG
E-LEARNING CHO MỘT TRƯỜNG
ĐẠI HỌC


GVHD : THẦY CAO TÙNG ANH
SVTH : THÁI TÙNG QUANG – 00ĐTH000
NGUYỄN VĂN THÀNH – 00ĐTH155
KHÓA : 2000






TP. HỒ CHÍ MINH
2005
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 1

LỜI CÁM ƠN
  
Lời đầu tiên chúng em cám ơn đến thầy Cao Tùng Anh, người đã
hướng dẫn cung cấp tài liệu và đóng góp ý kiến cho chúng em hoàn
thành luận văn này.
Chúng em xin chân thành cảm ơn các thầy cô khoa công nghệ
thông tin đã dạy dỗ và cung cấp những kiến thức quý báu trong suốt
thời gian học tập.
Do lần đầu tiên tìm hiểu nên chắc hẳn đề tài này không tránh khỏi
những sai sót nhất định, rất mong sự đóng góp ý kiến của quý thầy cô
cùng các bạn.
Chúng em xin chân thành cám ơn.



TP.HCM, ngày 18 tháng 01 năm 2005.

Sinh viên thực hiện
.

Thái Tùng Quang - Nguyễn Văn

Thành.
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 2

MỤC LỤC
LỜI CÁM ƠN 1

MỤC LỤC 2

MỞ ĐẦU 6

PHẦN 1 : TỔNG QUAN VỀ SEMANTIC WEB 8

CHƯƠNG 1. GIỚI THIỆU VỀ SEMANTIC WEB 9

1. Semantic Web là gì ? 9

2. Phân biệt Semantic Web với Web hiện nay 9

3. Một ví dụ đơn giản về Semantic Web 11

CHƯƠNG 2. GIỚI THIỆU SƠ LƯỢC VỀ ONTOLOGY 12

1. Định nghĩa ontology 12

2. Các lĩnh vực ứng dụng ontology 12

3. Ontology và Semantic Web 12


4. OntoWeb mang lại gì ? 13

5. Các ngôn ngữ xây dựng ontology 13

6. Một số công cụ hỗ trợ xây dựng ontology 14

CHƯƠNG 3. KIẾN TRÚC CỦA SEMANTIC WEB 15

1. Mô hình kiến trúc 15

2. Các lớp trong mô hình kiến trúc của Semantic Web 15

GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 3

2.1. URI : Bộ nhận dạng tài nguyên 15

2.2. Lớp XML 17

2.3. Lớp dữ liệu RDF 19

2.4. Lớp RDFS và Ontology 20

2.5. Lớp Logic 22

2.6. Lớp Proof 22

2.7. Lớp Trust : Digital Signatures và Web of Trust 23


CHƯƠNG 4. CÁC NGÔN NGỮ SEMANTIC WEB 25

1. Giới thiệu chung 25

2. Một số ngôn ngữ Semantic Web 26

2.1. XML 26

2.2. DTDs và XML Schemas 28

2.3. RDF 29

2.4. RDF Schema 30

2.5. SHOE 31

2.6. Topic Maps 32

2.7. XOL 32

2.8. OIL 32

2.9. DAML 37

2.10. DAML + OIL 39

PHẦN 2 : TÌM HIỂU E-LEARNING VÀ XÂY DỰNG ỨNG
DỤNG 41

CHƯƠNG 1. TÌM HIỂU LÝ THUYẾT VỀ ELEARNING 42


1. Khái niệm về hệ thống giáo dục ảo 42

2. Đặc điểm kỹ thuật của hệ thống giáo dục ảo 42

3. Sự cần thiết của elearing 42

GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 4

4. Cơ cấu của E-learning 43

5. Một số chức năng chính yếu của elearning : 43

CHƯƠNG 2. ELEARNING VỚI SEMANTIC WEB 45

1. Giới thiệu 45

2. SEMANTIC WEB 46

3. Ứng dụng 47

CHƯƠNG 3 : VAI TRÒ TRONG CHUẨN HÓA SIÊU DỮ
LIỆU CHO ELEARNING 50

1. Giới thiệu về dạng chuẩn elearning 50

2. Giải pháp cụ thể 50


2.1. Web ngữ nghĩa cho E-learning 50

2.2. Thiết kế ontology cho tài nguyên học 51

3. Các thuộc tính chuẩn 52

3.1. Thuộc tính định nghĩa thêm 53

3.2. Các thuộc tính dùng để mô tả tài nguyên 53

4. Sử dụng phân loại ACM CCS 53

CHƯƠNG 4. ỨNG DỤNG MINH HỌA 55

1. Mô tả bài toán 55

2. Bảng chú giải 55

3. Xác định yêu cầu 56

3.1. Yêu cầu chức năng 56

3.2. Yêu cầu phi chức năng 56

GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 5

4. Ontology cho elearning 57


4.1. Mô tả ontology 57

4.2. Sử dụng Protégé thiết kế ontology 57

5. Cơ sở dữ liệu cho elearning 62

5.1. Mô hình quan niệm 62

5.2. Đặc tả dữ liệu và từ điển dữ liệu 62

6. Mô hình Use-Case 63

6.1. Danh sách các Actor 64

6.2. Danh sách các Use-Case 64

6.3. Lược đồ chính của mô hình Use-Case 64

7. Thiết kế màn hình 67

7.1. Màn hình trang chủ của giáo viên 67

7.2. Màn hình thêm một tài nguyên 68

7.3. Màn hình hiển thị một tài nguyên 69

7.4. Màn hình upload dữ liệu lên server 69

7.5. Màn hình liệt kê môn học 70


7.6. Màn hình cập nhật thông tin 71

7.7. Màn hình sinh viên tham gia môn học 72

TỔNG KẾT 73

1. Các kết quả đạt được 73

2. Các mặt hạn chế 73

3. Hướng phát triển 73

TÀI LIỆU THAM KHẢO 74

PHỤ LỤC A : CÀI ĐẶT CHƯƠNG TRÌNH 76

GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 6

MỞ ĐẦU

Ngày nay công nghệ thông tin đã và đang phát triển mạnh mẽ trên toàn thế
giới. Nó đóng vai trò rất quan trọng trong đời sống kinh tế, xã hội, học tập
…Nhắc tới công nghệ thông tin chúng ta không thể bỏ qua công nghệ web.
Công nghệ này đóng vai trò rất quan trong trong việc trao đổi thông tin giữa
con người với nhau trên thế giới. Nó giúp chúng ta tiết kiệm được cả về
thời gian cũng như tiền bạc so với cách cũ mà ta vẫn thường làm. Hiện nay
việc cải tiến các công cụ phục vụ trong công nghệ web rất quan trọng và
được nhiều cá nhân, tổ chức quan tâm. Với những thông tin có sẵn và tỉ lệ

gia tăng người dùng hiện nay, có thể khẳng định rằng Web là một công
nghệ thành công gây ấn tượng nhất. Hiện nay, Web thâm nhập vào hầu hết
mọi lĩnh vực trong đời sống. Thành công của Web là dựa trên tính đơn
giản, dễ hiểu của nó.
Không may, tính đơn giản này có thể cản trở việc phát triển Web sau này.
Những gì mà chúng ta đang xem xét chỉ là phiên bản đầu tiên của Web.
Phiên bản tiếp theo sẽ lớn hơn và mạnh mẽ hơn - nhưng chúng ta vẫn
đang tìm hiểu làm thế nào để đạt được việc nâng cấp này.
Web khởi đầu như giải pháp cục bộ cho một nhóm nhỏ người sử dụng.
Chẳng bao lâu sau, Web đã chính thức đi vào phương tiện truyền thông
diện rộng cho hơn 10 triệu người. Trong vài năm nữa, Web sẽ gắn bó với
hàng tỷ người và thâm nhập không chỉ vào máy tính mà cả các thiết bị
khác.
Tuy nhiên, tình trạng hiện nay của công nghệ Web tạo ra trở ngại nghiêm
trọng cho sự phát triển của nó sau này. Số người sử dụng Web gia tăng
quá nhanh, sự phát triển theo cấp số mũ số lượng các trang Web, cùng với
tính đơn giản của công nghệ đã gây nên hiện tượng cổ chai làm cản trở
việc tìm kiếm, rút trích, duy trì và tạo ra thông tin. Máy tính chỉ được sử
dụng như các thiết bị gửi và nhận thông tin – chúng không có cách truy cập
đến nội dung thực sự. Do đó, chúng chỉ có thể hỗ trợ một cách hạn chế
trong việc truy cập và xử lý thông tin này. Vì thế, gánh nặng chính không chỉ
ở việc truy cập và xử lý thông tin mà còn ở việc rút trích và diễn dịch thông
tin.Nội dung của Web chỉ dành cho người sử dụng đọc chứ không cho phép
các chương trình máy tính có thể thao tác một cách đầy đủ ý nghĩa.
Semantic Web là sự mở rộng của Web hiện tại trong đó thông tin được định
nghĩa rõ ràng, cho phép con người và máy tính có thể làm việc cộng tác với
nhau.
Ý tưởng của Tim Berners-Lee là xây dựng một Semantic Web có thể cung
cấp cách thức truy cập thông tin một cách tự động nhờ vào các ngữ nghĩa
của dữ liệu và các heuristic (khám phá ra, tìm ra) sử dụng những siêu dữ

liệu này mà máy tính có thể xử lý được. Biểu diễn ngữ nghĩa dữ liệu rõ
ràng, cùng với thuyết lĩnh vực (đó là ontology), sẽ cho phép Web cung cấp
chất lượng dịch vụ mới. Nó sẽ nối kết với một mạng tri thức nhân loại rất
lớn và sẽ bổ sung nó với khả năng xử lý của máy. Nhiều dịch vụ tự động sẽ
giúp người sử dụng đạt được các mục đích bằng việc truy cập và cung cấp
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 7

thông tin theo một dạng máy có thể hiểu. Quá trình này cuối cùng có thể tạo
ra một hệ tri thức với nhiều dịch vụ suy luận chuyên gia - những hệ mà có
thể hỗ trợ chúng ta trong gần như tất cả mọi mặt của đời sống và sẽ trở
nên rất cần thiết cho chúng ta. Điều này cho chúng ta một viễn cảnh hoàn
toàn mới của việc thu nhận và xây dựng tri thức và việc giao tiếp biểu diễn
tri thức
Semantic Web sẽ là một sự ra đời tất yếu của quá trình nghiên cứu với ý
tưởng không ngừng phát triển để phù hợp với yêu cầu thực tế của con
người. Do đây là một xu hướng mới còn đang được nghiên cứu và tiếp tục
phát triển nên luận văn này giới hạn trong việc nghiên cứu các kiến thức cơ
sở của Semantic Web, đi vào nghiên cứu chi tiết về việc ứng dụng vào xây
dựng hệ thống e-learning như là một ứng dụng minh họa.
Với mục tiêu đề ra như trên, luận văn được tổ chức thành hai phần với nội
dung tóm tắt như sau:
Phần 1 : Tổng quan về Semantic Web. Phần này cung cấp kiến
thức tổng quát về Semantic Web như khái niệm, sức mạnh của
Semantic Web; các ngôn ngữ, công cụ, cách thức xây dựng một
Semantic Web và các ứng dụng của Semantic Web.
Phần 2 : Ứng dụng của Semantic Web vào xây dựng hệ thống e
learning. Phần này gồm có lý thuyết và chi tiết cài đặt ứng dụng e
learning - một Website đào tạo trực tuyến - với mục đích minh

họa.
Các kết quả nghiên cứu của luận văn là những kiến thức cơ sở giúp tìm
hiểu về Semantic Web và bắt đầu xây dựng các ứng dụng của Semantic
Web.














GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 8





PHẦN 1
: TỔNG QUAN VỀ
SEMANTIC WEB




GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 9

CHƯƠNG 1. GIỚI THIỆU VỀ SEMANTIC WEB


1. Semantic Web là gì ?
Semantic Web (Web ngữ nghĩa) là một mạng lưới thông tin được kết ghép
trong một phương pháp sao cho có thể xử lí dễ dàng bởi máy tính trên sự
cân bằng toàn diện. Bạn có thể nghĩ về nó giống như một phương pháp
trình bày dữ liệu hiệu quả trên World Wide Web, hoặc như là một cơ sở dữ
liệu liên kết toàn diện.
Semantic Web là một ý tưởng về việc dữ liệu trên Web được xác định và
liên kết với nhau theo cách mà nó có thể được sử dụng bởi máy tính không
chỉ cho mục đích thể hiện mà còn cho mục đích tự động, tích hợp và tái sử
dụng dữ liệu thông qua nhiều ứng dụng khác nhau.
Semantic Web được nghĩ ra bởi Tim Berners-Lee, một nhà phát minh ra
WWW, URIs, HTTP và HTML. “Semantic Web là sự mở rộng của Web hiện
nay theo hướng mà thông tin được xác định ngữ nghĩa rõ ràng, cho phép
máy tính và con người có thể làm việc cộng tác với nhau” – Tim Berners.
Semantic Web được xây dựng dựa trên cú pháp sử dụng URIs để biểu diễn
dữ liệu, luôn luôn trong bộ ba cấu trúc: tức là các bộ ba của dữ liệu URI mà
có thể được giữ lại trong cơ sở dữ liệu hoặc được trao đổi trong World
Wide Web dùng một tập những cú pháp đặc biệt được phát triển riêng cho
tác vụ nào đó. Cú pháp này được gọi là cú pháp “Resource Description
Framework” (khung mô tả tài nguyên).
2. Phân biệt Semantic Web với Web hiện nay

 Web hiện nay : lưu trữ thông tin (store things)
 Trình bày thông tin
 Tìm kiếm chủ yếu dựa vào từ khóa
 Thông tin không đồng bộ và nhanh chóng bị lạc hậu
 Semantic Web : thao tác trên thông tin (does things)
 Trình bày thông tin nhưng nội dung trang Web có thể được xử lý
bởi máy.
 Nội dung của Web nói lên ngữ nghĩa của nó thông qua các siêu dữ
liệu (metadata).
 Các ontology được chia sẽ để có thể hiểu được ngữ nghĩa.
 Do có thể hiểu được ngữ nghĩa nên các phần mềm agent có thể
giao tiếp, trao đổi thông tin với nhau.
 Sử dụng nhiều kỹ thuật của lĩnh vực trí tuệ nhân tạo
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 10

 Tìm kiếm chủ yếu dựa vào ngữ nghĩa
Do có những công cụ tự động cập nhật nên thông tin luôn được đồng bộ và
kịp thời
Một cách phân biệt khác :
 HTML : Web trực quan (visual Web)
 XML : Web theo cú pháp (syntactic Web)
 Logic : Web theo ngữ nghĩa (semantic Web)
Từ WWW sang Semantic Web :
Typed resources,
relational and
typed links

Hình 1. Từ WWW sang Semantic Web


GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 11

3. Một ví dụ đơn giản về Semantic Web

Hình 2
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 12

CHƯƠNG 2. GIỚI THIỆU SƠ LƯỢC VỀ ONTOLOGY


1. Định nghĩa ontology
Nhiều định nghĩa về ontology xuất hiện trong thập kỷ trước nhưng có lẽ
định nghĩa mô tả rõ nhất bản chất của ontology là: “An ontology is a
formal, explicit specification of a shared conceptualization.” (Một
ontology là một hình thức, đặc tả rõ ràng khái niệm hoá chia sẻ). Trong ngữ
cảnh này, conceptualization (khái niệm hoá) đề cập đến một mô hình trừu
tượng của một vài hiện tượng trong thế giới thực dùng để nhận dạng các
khái niệm liên quan đến hiện tượng đó. Explicit (rõ ràng) có nghĩa là loại
khái niệm được sử dụng và các ràng buộc khi sử dụng chúng được xác
định một cách rõ ràng, và formal (hình thức) có nghĩa là máy tính có thể
hiểu được ontology.
2. Các lĩnh vực ứng dụng ontology
Ontology được ứng dụng vào nhiều lĩnh vực như: tích hợp thông tin thông
minh, các hệ thống thông tin cộng tác, phục hồi thông tin, thương mại điện
tử, quản lý tri thức và trong kỹ thuật tri thức, xử lý ngôn ngữ tự nhiên, và

biểu diễn tri thức, E-learning, Web Portals Search engines, Các ứng dụng
Metadata-driven, Rút trích thông tin, Data Text Web Mining, Information
brokering.
3. Ontology và Semantic Web
Hiện tại, các ontology đã ứng dụng vào World Wide Web tạo ra Semantic
Web. Các cấu trúc ở mức khái niệm dùng xác định một ontology cơ sở
cung cấp chìa khoá để máy tính có thể xử lý được dữ liệu trên Semantic
Web. Các ontology phục vụ như các giản đồ siêu dữ liệu, cung cấp khái
niệm về từ vựng có thể kiểm soát được, mỗi ontology được xác định rõ
ràng và máy tính có thể xử lý được ngữ nghĩa. Bằng cách xác định các
nguyên lý trên lĩnh vực chia sẻ và thông thường, các ontology giúp cho
người và máy thông tin một cách chính xác - hỗ trợ việc trao đổi ngữ nghĩa
chứ không chỉ cú pháp. Vì vậy sự thành công và phát triển của Semantic
Web phụ thuộc vào việc cấu trúc các ontology trên lĩnh vực đặc trưng một
cách nhanh chóng và ít tốn kém.
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 13

4. OntoWeb mang lại gì ?

Hình 5. OntoWeb
OntoWeb Network sẽ là trọng tâm cho các hoạt động của Châu Âu trong
lĩnh vực xây dựng các công cụ và phương pháp dựa trên ontology cho
Semantic Web. Nó sẽ bảo đảm cho vị trí cạnh tranh trong lĩnh vực thương
mại bởi:
 Tầm nhìn và phác thảo hiện nay của kỹ sảo ontology liên quan đến
các lĩnh vực tại Châu Âu và toàn thế giới và cung cấp chỉ dẫn chiến
lược cho các ứng dụng công nghiệp và thương mại.
 Hợp với các chuẩn khác nhau để thúc đẩy sự phát triển của chuẩn nội

dung dựa trên ontology (Ontology- based Content Standardization) và
chuẩn ngôn ngữ ontology (Ontology Language Standardization).
 Cung cấp khả năng truy cập không phân biệt các dịch vụ bởi các cá
nhân và các tổ chức kinh doanh và giúp tìm kiếm và rút trích thông tin
từ một mạng tăng trưởng theo hàm mũ.
 Tổ chức các hội thảo phổ biến, các nhóm quan tâm đặc biệt, một biên
bản khoa học và các khoá học huấn luyện hoặc giáo dục đặc biệt với
các ứng dụng dựa trên Web, thương mại điện tử, quản lý tri thức và
tích hợp thông tin. Làm thế nào để có sự trao đổi giữa lĩnh vực nghiên
cứu và công nghiệp về các công nghệ dựa trên sự xuất hiện của
ontology để mang lại lợi thế cạnh tranh trong thị trường đang phát
triển nhanh chóng này.
5. Các ngôn ngữ xây dựng ontology

Ở bước đầu phát triển công nghệ này, được gọi là biểu diễn tri thức, XML
cung cấp một cú pháp cấu trúc cây tuần tự. Cùng lúc đó một cơ chế mã
hóa và chuyển đổi metadata được chỉ rõ bởi Resource Description
Framework (RDF), đang được phát triển bởi W3C như một nền tảng cho
việc xử lý ngữ nghĩa thông tin. Một ngôn ngữ cải tiến vừa xuất hiện gần đây
được gọi là OIL, mô tả ontology và đưa ra ontology editor, các công cụ chú
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 14

thích và các công cụ suy luận cho ontology. DAML (DARPA Agent Markup
Language) cũng đang được phát triển nhắm đến mục tiêu biểu diễn quan
hệ ngữ nghĩa mà có khả năng tương thích với các công nghệ hiện tại và
tương lai. Trong khi SHOE (Simple HTML Ontology Extension) cho phép
tác giả trang Web chú thích các tài liệu Web của họ với tri thức máy có thể
đọc.

6. Một số công cụ hỗ trợ xây dựng ontology
Ontology editors: (trình soạn thảo ontology) để xây dựng các ontology
mới.Ontology editors giúp các kỹ sư tri thức xây dựng các ontology – chúng
hỗ trợ xác định sự phân cấp khái niệm, xác định các thuộc tính cho các khái
niệm, và xác định các tiên đề, các ràng buộc
OntoEdit : là một môi trường kỹ thuật ontology được phát triển tại
Knowledge Management Group của Đại học Karlsruhe, viện AIFB
(http://ontoserver. aifb.uni-karlsruhe.de/ontoedit). Hiện tại, OntoEdit hỗ trợ
Frame-Logic, OIL, RDFS, và XML. OntoEdit được thương mại hoá từ
Ontoprise (www.ontoprise.de).
Protége : cho phép các chuyên gia trong các lĩnh vực xây dựng các hệ
thống cơ sở tri thức bằng cách tạo hay bổ sung các ontology có khả năng
tái sử dụng và các phương thức giải quyết vấn đề ( xem
www.smi.stanford.edu/projects/protege )
Ontology-based annotation tools (các công cụ chú giải cơ sở ontology)
để liên kết thông tin không cấu trúc và bán cấu trúc với các ontology
Reasoning with ontologies : suy luận từ thể hiện và giản đồ (suy luận
với các ontology) cho phép các dịch vụ trả lời truy vấn tiến bộ, hỗ trợ tạo
ontology, và giúp ánh xạ giữa nhiều ontology khác nhau.
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 15

CHƯƠNG 3. KIẾN TRÚC CỦA SEMANTIC WEB



1. Mô hình kiến trúc



Hình 3. Kiến trúc Semantic Web
 Lớp Unicode + URI : nhằm bảo đảm việc sử dụng tập kí tự chuẩn
quốc tế và cung cấp phương pháp để định danh các đối tượng sử
dụng trong Web ngữ nghĩa.
 Lớp XML : được dùng như là lớp cú pháp
 Lớp RDF: thể hiện lớp dữ liệu
 Lớp ontology: dựa trên một sự thoả thuận hình thức chung, xác định ý
nghĩa của dữ liệu
 Lớp logic: cung cấp các quy luật cho phép suy luận thông minh
 Lớp proof : hỗ trợ sự trao đổi của các “proof” trong sự truyền thông
liên agent
 Lớp trust: chữ ký điện tử và Web tin cậy
2. Các lớp trong mô hình kiến trúc của Semantic Web
2.1. URI (Uniform Resource Identifier): Bộ nhận dạng tài
nguyên
Để nhận diện các mục trên trang Web chúng ta cũng dùng các bộ nhận
dạng. Vì chúng ta dùng một hệ các bộ nhận dạng như nhau và vì mỗi mục
được nhận dạng được xem như một tài nguyên (resource) nên chúng ta gọi
các bộ nhận diện này là các “Uniform Resource Identifiers” hay gọi tắt là
URI. Chúng ta có thể xem URI là bất kỳ vật gì, và vật đó có một URI có thể
được diễn đạt trên Web: người, quyển sách bạn mua tuần trước, con ruồi
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 16

bay vo ve quanh ta và bất kỳ thứ gì khác có thể nghĩ đến … tất cả chúng
đều có thể có một URI.
URI là nền tảng của Web. Trong khi gần như mọi thành phần khác của Web
có thể được thay thế nhưng URI thì không: nó giữ các thành phần của Web
lại với nhau.

Một dạng quen thuộc của URI: đó là URL (Uniform Resource Locator). Một
URL là một địa chỉ cho phép ghé thăm một trang Web, ví dụ như:
Nếu click vào nó, có thể thấy rằng một URL
sẽ bảo cho máy tính nơi để tìm thấy một tài nguyên nào đó (trong trường
hợp này là địa chỉ trang Web của W3C). Không giống như hầu hết các dạng
khác của URI, một URL là cả định danh (identify) và định vị (locate). Tương
phản với một “mid:” URI. Một “mid:” URI nhận dạng một thông điệp email,
nhưng nó không có khả năng định vị một bản sao của thông điệp.
Vì Web thì quá lớn đối với các tổ chức trong việc kiểm soát nó nên các URI
được phân quyền. Không phải một người hay tổ chức kiểm soát việc tạo ra
chúng hay làm thế nào để chúng có thể được sử dụng. Trong khi một vài
lược đồ URI (như http:) phụ thuộc vào các hệ tập trung (như DNS) thì các
lược đồ khác (như freenet:) hoàn toàn được phân quyền.
Điều này nghĩa là không cần sự cho phép của bất cứ người nào để tạo một
URI. Kể cả việc có thể tạo URIs cho những vật mà không sở hữu. Trong khi
khả năng linh động này làm cho các URI có “sức mạnh” nhưng nó cũng
mang lại một số vấn đề. Bởi vì mọi người đều có thể tạo một URI, cuối
cùng chắc chắn chúng ta sẽ có nhiều URI biểu diễn cùng một vật nào đó.
Tệ hơn là sẽ không có cách để thấy được là hai URI đề cập đến cùng tài
nguyên. Vì thế chúng ta sẽ không bao giờ có thể nói một cách chính xác
một URI đã cho có ý nghĩa gì. Nhưng có sự thoả hiệp là phải tạo ra nó nếu
chúng ta tạo một thứ gì đó “to lớn” như Semantic Web.
Một cách rèn luyện phổ biến để tạo URI là bắt đầu với một trang Web.
Trang này mô tả đối tượng được nhận dạng và giải thích rằng URL của
trang là URI cho đối tượng đó. Ví dụ muốn tạo một URI cho bản sao
"Weaving the Web" của Tim Berners-Lee. Trước tiên tạo một trang Web mô
tả bản sao. Tiếp theo ghi nhận rằng trang mà URL cho trang đó dùng như
URI cho bản sao quyển sách. Làm điều này, chúng ta đã kết hợp URI
( với bản sao "Weaving the Web".
Việc tạo một URI chỉ làm đơn giản như vậy.

Có thể ghi nhận rằng trong thể hiện này URI
( đang thực hiện hai nhiệm vụ: nó
biểu diễn cả quyển sách vật lý cũng như trang Web mô tả nó. Đây là một
lĩnh vực thảo luận, gọi là Vấn đề trong nhận diện Semantic Web và nó là
một điểm thảo luận cho người thực hiện Semantic Web.
Đây là một thực tế quan trọng cần hiểu rõ. Một URI không phải là một tập
các hướng dẫn chỉ cho máy tính làm thế nào để đến được một file nào đó
trên Web (dù nó cũng có thể làm được điều này). Nó là một tên (name) cho
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 17

một tài nguyên (resource) (một vật). Tài nguyên này có thể hoặc không thể
truy cập được qua Internet. URI có thể hoặc không thể cung cấp cách cho
máy tính lấy thêm thông tin về tài nguyên đó. Một URL là một kiểu của URI
mà sẽ cung cấp cách để lấy thêm thông tin về tài nguyên, hoặc có thể là
cách để tự truy lục tài nguyên và các phương pháp khác để cung cấp thông
tin về các URI và những tài nguyên chúng nhận thấy là chưa phát triển.
Cũng chính xác khi nói rằng các URI là một phần quan trọng của Semantic
Web. Nhưng không nên cho rằng một URI có thể làm bất cứ gì để cung
cấp một bộ nhận dạng cho một tài nguyên.
2.2. Lớp XML (Extensible Markup Language)
XML được thiết kế là một cách đơn giản để gởi các tài liệu qua Web. Nó
cho phép bất kỳ người nào thiết kế định dạng tài liệu của họ và sau đó viết
một tài liệu theo định dạng đó. Những định dạng tài liệu này có thể bao gồm
định dạng để tăng cường ý nghĩa của nội dung tài liệu. Định dạng này là
định dạng “máy có thể đọc”, đó là định dạng các chương trình có thể đọc và
hiểu chúng. Với việc đưa ý nghĩa máy có thể đọc vào trong các tài liệu của
chúng ta, chúng ta làm cho chúng “mạnh mẽ” hơn nhiều.
Xét một ví dụ đơn giản: nếu một tài liệu chứa các từ nào đó được đánh dấu

bằng cách “làm nổi bậc, nhấn mạnh” thì cách những từ đó biểu hiện có thể
được điều chỉnh theo ngữ cảnh. Một trình duyệt Web có thể đơn giản hiển
thị chúng bằng cách in nghiêng, trong khi một trình duyệt bằng giọng nói
(đọc các trang Web lên) có thể biểu thị nhấn mạnh bằng cách thay đổi
giọng nói hoặc âm lượng trong phát âm của nó. Mỗi chương trình có thể
đáp ứng với ý nghĩa đã được mã hoá trong định dạng. Ngược lại nếu đơn
giản đánh dấu các từ như bằng cách in nghiêng thì máy tính không có cách
nào hiểu tại sao các từ đó lại in nghiêng. Nó là để nhấn mạnh hay đơn giản
là cho một hiệu ứng trực quan? Làm thế nào để trình duyệt giọng nói thể
hiện hiệu ứng này?
Đây là một ví dụ của một tài liệu dạng văn bản đơn giản:
I just got a new pet dog.
Từ lâu máy tính đã quan niệm, đây chỉ là văn bản. Nó không có ý nghĩa đặc
biệt nào đối với máy tính. Nhưng hiện nay việc xem xét cùng một đoạn như
vậy được định dạng bằng cách dùng ngôn ngữ định dạng dựa trên XML
(chúng ta sẽ định dạng cho ví dụ này):
<sentence>
<person href=" just got a new pet
<animal>dog</animal>.
</sentence>
Nhớ rằng đây là cùng nội dung, nhưng các phần cuả nội dung đó được gán
nhãn. Mỗi nhãn bao gồm 2 “tag”: một tag mở (ví dụ:<sentence>) và một tag
đóng (ví dụ: </sentence>). Tên của tag “sentence” là nhãn cho nội dung
được bao bởi các tag. Chúng ta sẽ gọi tập hợp các tag này và nội dung một
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 18

“nguyên tố” (element). Vì thế nguyên tố sentence trong tài liệu trên chứa
câu: “I just got a new pet dog.” Điều này bảo với máy tính rằng “I just got a

new pet dog.” là một câu (sentence) nhưng điều quan trọng là nó không
bảo với máy tính một câu là gì. Mãi cho đến nay máy tính mới có một số
thông tin về tài liệu và chúng ta có thể đặt những thông tin này vào để sử
dụng.
Tương tự ngày nay máy tính biết rằng “I” là một “person” và “dog” là
“animal”.
Thỉnh thoảng cung cấp thông tin về nội dung element có ích hơn là chúng
ta chỉ cung cấp tên của element. Ví dụ máy tính biết rằng “I” trong câu trên
biểu diễn một “person” nhưng nó không biết rằng person là gì. Chúng ta có
thể cung cấp loại thông tin này bằng cách thêm thuộc tính “attribute” vào
element của ta. Một attribute có một tên và một giá trị. Ví dụ chúng ta có thể
viết lại ví dụ trên:
<sentence>
<person href="">I</person> just got a new pet
<animal type="dog" href="
</sentence>
Ở đây có một vấn đề, chúng ta đã dùng các từ: “sentence”, “person” và
“animal” trong ngôn ngữ định dạng. Nhưng đây là các từ thông dụng. Điều
gì xảy ra nếu những người khác dùng cùng những từ này trong ngôn ngữ
định dạng của họ? Điều gì xảy ra nếu những từ này có ý nghĩa khác trong
những ngôn ngữ đó? Có thể “sentence” trong ngôn ngữ định dạng khác nói
đến số lần mà một tội phạm thụ án phải chịu trong một hình phạt hình sự.
Làm thế nào để máy tính hiểu đúng?
Để ngăn ngừa sự rối loạn này, phải xác định duy nhất các element định
dạng. Và tốt hơn là nhận diện chúng với một Uniform Resource Identifier?
Vì vậy gán một URI cho mỗi element và attribute, thực hiện điều này bằng
cách dùng cái gọi là XML Namespace. Theo cách này một người có thể tạo
các tag riêng và trộn chúng với những tag của người khác. Một namespace
chỉ là một cách nhận diện các phần của Web (space) từ đó chúng ta nhận
được ý nghĩa của những tên này. Tạo một namespace cho ngôn ngữ định

dạng bằng cách dùng một URI cho nó. (Như đã thảo luận ở trên, sẽ có thể
tạo một trang Web để mô tả ngôn ngữ định dạng và dùng URL trang Web
như URI cho namespace).
Vì các tag của mỗi người có các URI riêng nên chúng ta không lo lắng về
mâu thuẫn tên tag. Tất nhiên XML cho chúng ta rút gọn và đặt URI mặc
định nên chúng ta không phải gõ chúng ra mọi lần:
<sentence
xmlns="
xmlns:c=
<c:person c:href=" just got a new pet
<c:animal>dog</c:animal>
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 19

</sentence>
Nhớ rằng là namespace mặc định. Đó là
nơi mà tất cả các element và attribute không có c: đặt trước được chỉ rõ (vì
vậy trong “sentence” thể hiện này chỉ có element được chỉ rõ).
XML cho phép người dùng thêm vào cấu trúc tùy ý cho các tài liệu của họ
nhưng không đề cập gì đến ý nghĩa của các cấu trúc. Tên các tag không
cung cấp ngữ nghĩa. Semantic Web chỉ dùng XML cho mục đích cú pháp.
2.3. Lớp dữ liệu RDF (Resource Description Framework)
RDF (khung mô tả tài nguyên) là một hạ tầng kiến trúc cho phép mã hoá,
trao đổi và tái sử dụng siêu dữ liệu cấu trúc. Chủ yếu thông tin được lưu trữ
trong hình thức của các phát biểu RDF, trình bày dữ liệu theo một cách
thống nhất (chủ ngữ, vị từ, bổ ngữ) và làm cho máy tính dễ hiểu hơn. Mô
hình dữ liệu RDF trừu tượng biểu diễn một đồ thị gán trực tiếp. Mô hình
trừu tượng này là sự tuần tự độc lập, mặc dù sự tuần tự chuẩn sử dụng
XML. Tổng quát mô hình dữ liệu RDF đưa ra các mô hình nguyên thủy có

thể được mở rộng tuỳ theo nhu cầu khá thuận tiện.
RDF là phần cốt lõi của Semantic Web. Thật tuyệt là có thể tạo các URI và
bàn về chúng qua các trang Web. Tuy nhiên sẽ tốt hơn nếu có thể nói về
chúng theo cách mà máy tính có thể xử lý những gì mà chúng ta đang nói.
Ví dụ một người nói "I really like 'Weaving the Web.'" trên một diễn đàn thảo
luận Web. Nhưng điều này có ý nghĩa gì với một máy tính?
RDF cho một cách để tạo cách trình bày mà máy có thể xử lý được. Tất
nhiên hiện nay máy tính không thể thật sự hiểu những gì chúng ta nói,
nhưng nó có thể giải quyết theo cách mà có vẻ như nó hiểu. Ví dụ có thể
tìm kiếm trang Web phê bình tất cả các sách và tạo một điểm số trung bình
cho mỗi quyển sách. Sau đó có thể đặt lại những thông tin đó vào trang
Web. Website khác có thể lấy thông tin đó (danh sách điểm trung bình cho
sách) và tạo một trang "Top Ten Highest Rated Books".
RDF hoàn toàn đơn giản. Một khai báo RDF giống như một câu đơn giản,
ngoại trừ hầu hết các từ là URI. Mỗi khai báo RDF có 3 phần: subject (chủ
đề), predicate (vị từ) và object (đối tượng). Hãy xem một khai báo RDF đơn
giản:
<
< .
URI thứ nhất là subject. Trong thể hiện này subject là “me”. URI thứ hai là
predicate. Nó liên kết subject và object. Trong thể hiện này predicate là
“reallyLikes”. URI thứ ba là object. Ở đây object là “Tim Berners-Lee's book
"Weaving the Web." ” Vì vậy khai báo RDF trên nói rằng “I really like
"Weaving the Web." ”
Có thể thấy rằng các khai báo RDF thực tế có thể nói bất cứ gì và ai nói
chúng không thành vấn đề. Không có một Website chính thức nói về
“Weaving the Web” hay về “me”. Điều này dẫn chúng ta đến một nguyên
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 20


tắc RDF quan trọng là “anything can say anything about anything”. Thông
tin được trải rộng trên Web và hai người có thể tranh cãi – Bob có thể nói
rằng Aaron thích Weaving the Web và John có thể nói rằng Aaron ghét nó.
Đây là khả năng tự do mà Web cung cấp.
Khai báo trên được viết bằng N-Triples, một ngôn ngữ cho phép ta viết các
khai báo RDF đơn giản. Tuy nhiên đặc tả RDF chính thức chỉ rõ một biểu
diễn XML của RDF, phức tạp hơn một chút, được nói như sau:
<rdf:RDF
xmlns:rdf="
xmlns:love="
>
<rdf:Description rdf:about="
<love:reallyLikes
rdf:resource=" />
</rdf:Description>
</rdf:RDF>
Hiện nay để viết RDF như thế trên thế giới không có gì dễ hơn và nó không
giống như mọi người đang nói về một ngôn ngữ mới lạ. Vì thế chúng ta
mong đợi tất cả thông tin RDF có từ đâu? Hầu như soure là database.
Trên thế giới có hàng ngàn database, phần lớn chứa thông tin quan trọng
máy có thể xử lý. Chính phủ lưu trữ hồ sơ bắt giữ người trong cơ sở dữ
liệu; các công ty lưu trữ thông tin công việc và hàng hoá trong một cơ sở
dữ liệu; phần lớn các sổ địa chỉ được máy tính hoá lưu trữ tên và số điện
thoại - một database. Khi thông tin được lưu trữ trong cơ sở dữ liệu, rất dễ
dàng hỏi máy tính những câu hỏi nào đó về dữ liệu: “Cho biết tất cả những
người bị bắt giữ trong 6 tháng gần đây.” “In danh sách tất cả các công việc
mà chúng ta đang tiến hành chậm.” “Lấy số điện thoại của người có họ là
Jones.”
RDF hoàn toàn thích hợp để tạo những cơ sở dữ liệu như vậy trên Web.

Và khi chúng ta đặt chúng vào Web, chúng ta cho mọi thứ trong cơ sở dữ
liệu một URI để người khác cũng có thể dùng chúng. Hiện nay các chương
trình thông minh có thể gắn dữ liệu với nhau. Dùng thông tin có sẵn, máy
tính có thể kết nối với số điện thoại của Bob Jones trong sổ địa chỉ với Bob
Jones là người bị bắt tuần trước và Bob Jones người vừa đặt 100000 sản
phẩm. Bây giờ chúng ta có thể hỏi những câu hỏi của cơ sở dữ liệu này:
“Lấy số điện thoại của những người đặt hơn 1000 sản phẩm và bị bắt trong
6 tháng gần đây.”
2.4. Lớp RDFS (RDF Schema) và Ontology : xác định nghĩa
Với tất cả các công việc thực hiện trên cơ sở dữ liệu giả sử rằng dữ liệu
gần như là hoàn hảo. Rất ít (nếu không muốn nói là rất hiếm) các hệ cơ sở
dữ liệu được sẵn sàng cho “sự hỗn độn của các trang Web”. Các hệ được
mã hóa cứng để hiểu các dạng hay thuật ngữ cụ thể nào đó sẽ không hiểu
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 21

dạng ngày tháng, hoặc ít nhất là giới hạn khả năng sử dụng khi các thuật
ngữ mới được tạo và định nghĩa. Điều gì xảy ra nếu có người đặt ra một hệ
mới mà loại các quyển sách là từ 1-10 thay cho việc nói rằng người nào đó
"reallyLikes" chúng. Các chương trình xây dựng dựa trên các hệ cũ sẽ
không thể xử lý thông tin mới.
Tệ hơn nữa là không có cách cho một máy tính hay con người hiểu được
một thuật ngữ nào đó có ý nghĩa gì hoặc làm thế nào sử dụng nó. Việc sử
dụng các URI là vô dụng nếu chúng ta không mô tả chúng có nghĩa gì. Đây
là phần việc của các lược đồ (schema) và ontology. Một schema và một
ontology là cách mô tả ý nghĩa và quan hệ giữa các thuật ngữ. Những mô
tả này (dĩ nhiên là trong RDF) giúp các hệ thống máy tính sử dụng các
dạng thuật ngữ dễ dàng hơn và quyết định làm thế nào để chuyển đổi qua
lại giữa chúng.

Hai hệ có quan hệ gần gũi, RDF Schemas và DARPA Agent Markup
Language with Ontology Inference Layer (DAML+OIL) được phát triển
để giải quyết vấn đề này. Ví dụ một schema có thể phát biểu như sau:
@prefix dc: < .
@prefix rdfs: < .

# A creator is a type of contributor:
dc:creator rdfs:subClassOf dc:contributor .
(Ở đây chúng ta dùng Notation3, như superset (siêu tập hợp) của N-
Triples cho phép chúng ta sử dụng một cách giản lược hơn.)
Phát biểu nói rằng “a creator” là một “kiểu” subclass của contributor. Dùng
để làm gì? Xem ví dụ xây dựng một chương trình để tập hợp các “creator”
và “contributor” từ các tài liệu khác nhau. Chương trình dùng bảng từ vựng
này (dc:creator và dc:contributor) để hiểu thông tin nó tìm kiếm. Một ngày
nào đó một nhóm của newbies thuộc AOL bắt đầu tạo các tài liệu RDF.
Không ai trong số họ biết về dc:creator vì thế họ tạo thuật ngữ riêng cho
mình: ed:hasAuthor.
# The old way:
< is dc:creator of
< .

# The new way:
< ed:hasAuthor
< .
Thông thường chương trình sẽ bỏ qua những khai báo mới này vì nó không
thể hiểu chúng. Tuy nhiên một chương trình “có khả năng” sẽ đủ thông
minh để thiết lập mối quan hệ giữa hai “thế giới này” bằng cách cung cấp
thông tin làm thế nào để chuyển đổi giữa chúng.
# [X dc:creator Y] is the same as [Y ed:hasAuthor X]
dc:creator daml:inverse ed:hasAuthor .

GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 22

Khai báo này bảo với chương trình của bạn rằng ed:hasAuthor là ngược lại
của dc:creator. Điều này nghĩa là tất cả chương trình của bạn phải thực
hiện hoán đổi subject và object và đổi ed:hasAuthor thành dc:creator. Vì
chương trình của bạn hiểu DAML ontology nên bây giờ nó có thể nhận
thông tin và dùng chúng để xử lý tất cả các khai báo hasAuthor mà nó
không thể hiểu trước đó.
2.5. Lớp Logic
Từ quan điểm trên chúng ta sẽ thảo luận thành phần của Semantic Web mà
vẫn chưa được phát triển. Không giống như thảo luận ở trên, chúng ta
không bàn về một hệ cụ thể nào mà thay vào đó là một khái niệm tổng quát
mà có thể sẽ hình thành (hoặc đang hình thành) nhiều hệ khác nhau.
Trong khi thật tốt khi có những hệ hiểu những khái niệm cơ bản (subclass,
inverse…) sẽ tốt hơn nếu chúng ta có thể khai báo các nguyên tắc logic và
cho phép máy tính suy diễn (bằng cách suy luận) bằng cách dùng những
nguyên tắc này.
Đây là một ví dụ: một công ty quyết định rằng nếu người nào bán hơn 100
sản phẩm thì họ là thành viên của Super Salesman Club. Một chương trình
thông minh hiện nay có thể hiểu luật này để tạo một diễn dịch đơn giản
“John đã bán 102 sản phẩm vì thế John là thành viên của Super Salesman
Club.”
2.6. Lớp Proof
Khi chúng ta bắt đầu xây dựng các hệ hiểu logic, dẫn đến việc dùng chúng
để chứng minh. Mọi người trên thế giới có thể viết các khai báo logic. Sau
đó máy tính có thể theo những Semantic link (liên kết ngữ nghĩa) này kiểm
chứng.
Ví dụ: tập hợp các record bán hàng cho thấy rằng Jane đã bán 55 widget

và 66 sprocket. Hệ thống kiểm kê biểu diễn rằng widget và sprocket là
những sản phẩm công ty khác nhau. Xây dựng luật toán học biểu diễn rằng
55 + 66 = 121 và 121 thì lớn hơn 100 và như chúng ta biết, người nào bán
hơn 100 sản phẩm là thành viên của Super Salesman Club. Máy tính kết
hợp tất cả các luật logic lại với nhau thành một proof Jane là một Super
Salesman.
Trong khi rất khó tạo những proof này (nó có thể yêu cầu theo sau hàng
ngàn hoặc có thể là hàng triệu link trong Semantic Web) nhưng rất dễ dàng
kiểm tra chúng. Theo cách này chúng ta bắt đầu xây dựng một trang Web
xử lý thông tin. Một vài trang trong số đó chỉ đơn thuần cung cấp dữ liệu
cho những trang khác dùng. Các trang khác thì thông minh hơn và có thể
sử dụng dữ liệu này để xây dựng luật. Thông minh nhất là “heuristic
engine” có thể hiểu tất cả những luật và khai báo này để đưa ra kết luận và
dễ dàng đặt kết quả trở lại vào Web như các proof cũng đơn giản như dữ
liệu cũ.
GVHD: Cao Tùng Anh Xây dựng hệ thống E-Learning

SVTH: Thái Tùng Quang – Nguyễn Văn Thành Trang 23

Lớp proof cũng cần thiết để cung cấp các giải thích về những trả lời được
đưa ra bởi các agent tự động mà (các agent tự động này) sử dụng thông tin
được cung cấp. Một cách tự nhiên, chúng ta có thể muốn kiểm tra các kết
quả suy luận bởi agent, điều này đòi hỏi sự dịch thuật các cơ cấu suy luận
nội tại của agent thành ngôn ngữ thể hiện proof thống nhất.
2.7. Lớp Trust : Digital Signatures và Web of Trust

Bây giờ có thể nghĩ rằng toàn bộ kế hoạch này quá lớn, nhưng sẽ vô dụng
nếu có người nói Ai sẽ tin tưởng vào những hệ như thế? Sao không cho
biết trang Web của bạn? Và ai cũng có thể nói rằng mình là vua của thế
giới. Vì theo qui tắt “anything can say anything about anything”, ai sẽ ngăn

chận điều này?
Điều này dẫn đến Digital Signature (chữ ký điện tử) xuất hiện. Chữ ký điện
tử làm việc dựa trên toán học và mật mã, chữ ký điện tử cung cấp bằng
chứng rằng một người nào đó viết (hoặc tán thành với) một tài liệu hoặc
một tuyên bố. Khi đánh dấu tất cả các khai báo RDF bằng chữ ký điện tử,
chúng ta có thể chắc chắn rằng ai đã viết chúng (hoặc ít nhất là bảo đảm
tính xác thực của chúng). Bây giờ chúng ta chỉ đơn giản bảo cho chương
trình những chữ ký nào đáng tin và những chữ ký nào không. Mỗi chữ ký
có thể được đặt các mức độ hoặc độ tin cậy (hoặc độ nghi ngờ) mà máy
tính có thể quyết định đọc độ tin cậy bao nhiêu.
Bây giờ không giống như việc sẽ tin tưởng vào người tạo ra cách dùng
những thứ trên Web. Thế là "Web of Trust." xuất hiện. Ví dụ chúng ta bảo
với máy tính rằng chúng ta tin tưởng người bạn thân, Robert. Robert tình
cờ trở thành người nổi tiếng trên Net và tin cậy một số người. Và dĩ nhiên
những người Robert tin tưởng sẽ tin tưởng tập những người khác. Mỗi
người lại tin tưởng những người khác và cứ thế. Các mối quan hệ tin tưởng
này bắt đầu, và chúng hình thành một “Trust of Web”. Và mỗi quan hệ này
có một mức độ tin cậy (hoặc ngờ vực) kết hợp với nó.
Lưu ý rằng độ ngờ vực cũng có tác dụng như độ tin cậy. Giả sử rằng máy
tính phát hiện ra một tài liệu mà không có độ tin cậy rõ ràng cũng như độ
ngờ vực cũng không rõ ràng. Chắc chắn máy tính sẽ tin tưởng tài liệu này
hơn là nó sẽ tin tưởng vào tài liệu được gán nhãn rõ ràng là không đáng tin.
Máy tính ghi nhận tất cả những nhân tố này vào bảng đánh giá khi quyết
định thế nào là một mẩu tin đáng tin cậy. Nó cũng có thể tiến hành xử lý
này rõ ràng hoặc không rõ ràng như chúng ta đề nghị. Ví dụ chúng ta có
thể sẽ hài lòng với một hiển thị “thumps up/thumps down” đơn giản. Người

×