Tải bản đầy đủ (.docx) (52 trang)

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (838.9 KB, 52 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA CÔNG NGHỆ THÔNG TIN

Báo cáo:

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

Sinh viên thực hiện:

NHÓM 5

Giảng viên:

P.GS TS. Trần Đình Quế

Lớp:

D09CNPM2


2

NHÓM 5 – D09CNPM2

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

Mục lục

2



3

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA
I.
I.1

NHÓM 5 – D09CNPM2

Sự phát triển, tiến hóa của web
Tổng quan về World Wide Web

Web hay World Wide Web không phải là Internet nhưng là thành phần nổi bật
nhất của hệ thống này. Nói cách khác, nhờ có những trang Web mà người ta biết đến
sự hiện hữu của Internet và thế giới ảo do nó tạo ra vẫn luôn song hành với thế giới
vật lý của hàng tỉ người sử dụng Web.
Sự tiến hóa của Web đã bắt đầu ngay từ khi nó xuất hiện. Trải qua 3 thế hệ, từ
1.0 tức loại Web thông tin đến 2.0 tức Web giao tiếp xã hội rồi 3.0 là loại Web có
khả năng nhận thức, thì nay đến lượt xuất hiện một thế hệ mới - Web 4.0 mà đi đầu
là các nội dung số mang đặc trưng cộng sinh qua lại giữa con người và các sự vật,
tức nội dung của trang Web.
Công nghệ thông tin luôn tiến hóa và đang tạo ra các nội dung số vừa hữu ích,
tiện lợi và hấp dẫn, lại vừa thích đáng và giàu cảm xúc. Từ iTunes đến Amazon, từ
Netflix đến New York Times, người ta đã nhận ra đây đó dấu hiệu xuất hiện mỗi
ngày một nhiều loại nội dung số 4.0. Và cho dù chúng ta chưa có một định nghĩa
thỏa đáng về Web 4.0, hội thảo “tương lai kỹ thuật số” tổ chức vào cuối năm nay
không chỉ đề cập đến trung tâm của vấn đề là sự nổi lên của nội dung 4.0 mà còn
đưa chúng vào những ứng dụng thiết thực trong đời sống, nghiên cứu, học tập và
nhất là vào môi trường kinh doanh mới, nơi khách hàng không chỉ dừng lại ở mức
giao tiếp mà còn nhập cuộc vào chính môi trường tạo nên sản phẩm hay dịch vụ
mình đang quan tâm.

Trên thực tế, sự xuất hiện một thế hệ Web luôn kéo theo những thay đổi trong
đời sống xã hội và các hoạt động kinh tế cũng như khoa học kỹ thuật nhờ vào khai
thác những ứng dụng của nó. Khi Web 1.0 trở thành thứ tiện ích thông tin thì kéo
theo phong trào thành lập các công ty kinh doanh Internet tạo nên hiện tượng bùng
nổ dotCom giữa những năm 1997-2000. Web 2.0 chẳng những chi phối cung cách
và lề lối giao tiếp xã hội mà còn định hình nên nền tảng thương mại điện tử. Việc
điện tử hóa các hoạt động con người, từ y tế điện tử đến chính phủ điện tử và việc
mở rộng từ Internet cố định sang Internet di động đã trở thành hiện thực trong giai
đoạn này. Web 3.0 với tính năng tự nhận thức đã thúc đẩy việc sản xuất ra các thiết
bị thông minh hơn, bao gồm cả các siêu máy tính đủ năng lực để giải quyết những
vấn đề toàn cầu và chiến lược kinh doanh của các doanh nghiệp. Chúng ta có thể
không nhận ra sự xuất hiện của thế hệ Web 4.0 nếu không điểm lại lịch sử tiến hóa
của 3 thế hệ trước.

3


4

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA
I.2

Web 1.0

I.2.1

Định nghĩa

NHÓM 5 – D09CNPM2


Web 1.0 là một khái niệm chỉ giai đoạn ban đầu trong sự tiến hóa của World
Wide Web (www) kéo dài từ năm 1995-2004, tập trung vào phương pháp tiếp cận
trên xuống (1 chiều) về sử dụng web cũng như về giao diện người dùng. Xét về mặt
kỹ thuật, thông tin trên web là đóng (nội dung tĩnh) và chỉ chỉnh sửa được từ bên
ngoài thông qua người quản trị web, do đó không có tính “động”. Công nghệ web
1.0 tập trung vào khía cạnh trình bày, không có khả năng tạo ra từ nội dung có sẵn.
I.2.2

Quá trình phát triển

Thế hệ Web 1.0 ra đời năm 1997 bởi chính cha đẻ của World Wide Web
(WWW) là Tim Berners-Lee. Năm 1989 Burners-Lee đưa ra ý niệm về một không
gian siêu văn bản toàn cầu mà theo đó mỗi một thông tin hay nội dung, thường được
gọi là trang web đều có thể tiếp cận thông qua một bộ nhận dạng chung duy nhất.
Trang web và công cụ tìm kiếm web đầu tiên ra đời năm 1990, tiếp theo là các cổ
máy tìm kiếm mạnh hơn của Worm WWW năm 1993, Yahoo 1994, Web Crawlers
1994, và AltaVista 1995. Berners-Lee định nghĩa Web 1.0 là cấu trúc thông tin chỉ
có thể để đọc, tương tự như một không gian để quảng bá những thông tin đến công
chúng, và cả những bảng quảng cáo hàng hóa hay dịch vụ đến khách hàng. Với
những tính năng ban đầu hạn chế như thế nhưng Web 1.0 đã thực sự tạo nên cơn sốt
hình thành vội vã các công ty kinh doanh Internet, tạo nên hiện tượng bùng nổ
dotCom. Giá trị các công ty công nghệ tăng lên rất nhanh. Có tuần các quỹ đầu tư
mạo hiểm đổ vào Thung lũng Silicon đến cả tỉ đôla. Cisco được định giá cao nhất
đến 400 tỉ Mỹ kim nhưng rồi từ tháng 3 đến tháng 11 năm 2000 mất giá thảm hại chỉ
còn 210 tỉ. Cùng thời gian đó, cổ phiếu của PriceLine từ 94 USD xuống còn 4 USD,
Go.com đánh mất 790 triệu USD, và Boo.com đốt cháy 160 triệu đôla.
I.3
I.3.1

Web 2.0

Định nghĩa

Web 2.0 là thế hệ thứ 2 (bắt đầu từ năm 2004) của chuẩn web và các dịch vụ
lưu trữ (hosting) với mục đích thuận tiện trong việc chia sẻ, hợp tác và sáng tạo giữa
các người dùng. Nó không phải là một dạng nâng cấp kỷ thuật từ web 1.0 mà là một
sự thay đổi về cách phát triển phần mềm và về cách sử dụng của người dùng cuối.

4


5

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA
I.3.2

NHÓM 5 – D09CNPM2

Quá trình phá triển

Dougherty trong một cuộc hội thảo tổ chức năm 2004. Theo đó, 2.0 là thế hệ
Web mới mà người sử dụng vừa có thể đọc các thông tin hay nội dung, vừa có thể
viết hay bổ sung vào đó để tạo nên những thông tin hay nội dung mới. Đây là thứ
cấu trúc hai chiều tạo nên sự giao tiếp hay tương tác giữa người lập ra trang Web và
những người sử dụng, và giữa những người sử dụng với nhau. Ở đỉnh cao Web 2.0
là những trang mạng xã hội, điển hình như Facebook, My Space, Twitter hay Daily
Motion, You Tube mà những người ưa thích cùng một chủ đề có thể tìm đến với
nhau để trao đổi quan điểm, hình ảnh, đoạn phim hay bổ sung những ý tưởng và lời
bình luận. Các nhà thiết kế đã sử dụng 3 giao thức căn bản là AJAX, Flex và Google
Web Toolkit để tạo nên sự dễ dàng cho người sử dụng khai thác các kỹ thuật tương
tác như blog, RSS, wiki, mashup, tag. Trên thực tế, các nhân tố tạo nên Web 2.0 đã

xuất hiện rất sớm; và trải qua cuộc suy thoái thời hậu dotCom thì chỉ những trang
web chứa các nhân tố đó như Google, Amazon, eBay mới có thể sống sót và rồi phát
triển nhanh chóng. Ngày nay 2.0 là dòng Web phổ biến nhất và mang nhiều ứng
dụng nhất trong tất cả các lĩnh vực, từ học tập, nghiên cứu đến thương mại, quản trị
và trong việc tạo ra những cộng đồng mạng đa dạng, năng động, tràn đầy sức sống.
I.3.3 Đặc điểm
- Web đóng vai trò như một nền tảng, có thể chạy mọi ứng dụng.
- Là nơi tập hợp trí tuệ của cộng đồng.
- Dữ liệu đóng vai trò then chốt.
- Phần mềm được cung cấp dưới dạng dịch vụ web và được nâng cấp không
ngừng.
- Phát triển ứng dụng dễ dàng và nhanh chóng.
- Phần mềm có thể chạy được trên nhiều nền tảng như thiết bị di động, thiết bị
cầm tay (PDA).
- Giao diện ứng dụng phong phú.
Ban đầu, web 2.0 chú trọng tới yếu tố công nghệ, nhấn mạnh tới vai trò nền
tảng ứng dụng. Nhưng đến hội thảo Web 2.0 được tổ chức lần thứ 2 vào tháng
2/2005 yếu tố cộng đồng được nhấn mạnh hơn.

5


6

NHÓM 5 – D09CNPM2

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA
I.3.4

Web đóng vai trò như là một nền tảng


Giống như nhiều khái niệm quan trọng khác, web 2.0 không có một ranh giới
cố định mà là một lõi hấp dẫn. Web 2.0 là tập các quy tắc và thực hành chặt chẽ để
kết hợp các thành phần từ lõi.

I.4

Web 1.0 và Web 2.0
Web 1.0

Web 2.0

Tổ chức lưu trữ

Tập trung

Phân tán

Đối tượng

Cá nhân độc quyền

Cộng đồng chia sẻ

Cung cấp

Nội dung

Dịch vụ


Tương tác

Chỉ đọc

Đọc, viết

Giao tiếp hệ thống

Truyền phát

Đồng bộ

Nội dung

Tĩnh, đã tạo sẵn trước, Tự sản sinh, tự đề xuất
không thể thay đổi

6


7

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

Hình 1 Web 1.0 vs Web 2.0

7



8

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

Hình 2 Phân loại ứng dụng Web 1.0 vs Web 2.0

8


9

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA
I.5

Semantic Web

I.5.1

Định nghĩa

NHÓM 5 – D09CNPM2

Các trang web hiện nay được cấu thành bởi các thẻ HTML và những câu chữ
tự nhiên, nhằm hướng dẫn cho trình duyệt biểu diễn thông tin như thế nào khi người
dùng nhìn thấy. Máy không thể hiểu được cũng như ra những quyết định thông minh
với thông tin mà nó đang biểu diễn. Về phía nhà phát triển cũng không thể xử lý các
tài liệu trên phạm vi toàn cầu (các máy tìm kiếm không thỏa mãn hiệu năng).

Giải pháp để giải quyết vấn đề trên là chỉnh sửa lại tài liệu web bằng cách
thêm phần dữ liệu mở rộng với mục đích là cho phép máy có thể hiểu được nghĩa
của tài liệu đó. Và để làm được điều này ta cần xây dựng các công cụ và các tác tử
chạy trên nền web mới này để xử lý tài liệu trên phạm vi toàn cầu, và nền web mới
này gọi là web ngữ nghĩa (semantic web).
I.5.2

Những hạn chế của HTML

Hiện nay, WWW chủ yếu dựa trên Hyper Text Markup Language (ngôn ngữ
đánh dấu siêu văn bản - HTML), là tập quy ước đánh dấu được sử dụng để mã hóa
nội dung của văn bản xen kẻ với các đối tượng đa phương tiện (hình ảnh, âm thanh,
video) và các mẫu tương tác khác. Hầu hết chúng được sử dụng để làm sao máy có
thể hiểu được cách trình bày dữ liệu trên web. Các thẻ siêu dữ liệu (metada tag) cung
cấp phương thức mà máy tính có thể phân loại nội dung của trang web, ví dụ:
<meta name="keywords" content="computing, computer studies, computer" />
<meta name="description" content="Cheap widgets for sale" />
<meta name="author" content="John Doe" />

Các thành phần nội dung được biểu diễn trong HTML là những câu chữ vô
hồn mà máy tính không thể hiểu được về mặt ngữ nghĩa cũng như các quan hệ, các
ràng buộc liên quan đến dữ liệu mà nó đang trình diễn.
I.5.3

Giải pháp Web ngữ nghĩa

Web ngữ nghĩa được xuất bản dựa trên các ngôn ngữ được thiết kế đặc biệt để
mô tả dữ liệu như RDF (Resource Description Framework), Web Ontology
Language (OWL), Extensible Markup Language (XML). HTML có nhiệm vụ mô tả
các tài liệu và liên kết chúng. RDF, OWL, XML với các ràng buộc của mình có thể

mô tả mọi thứ như con người, hội họp, du lịch, …

9


10

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

Các công nghệ này được kết hợp với nhau để cung cấp các mô tả nhằm bổ
sung hoặc thay thế nội dung của tài liệu Web. Do đó, nội dung có thể biểu hiện
chính bản thân nó giống như là phần dữ liệu được mô tả trong các cơ sở dữ liệu, hay
đánh dấu trong các tài liệu (XHTML) xen kẽ với XML hoặc biểu diễn dữ liệu phân
cấp như XML. Máy có thể đọc được các mô tả và cho phép quản lý nội dung để
thêm ý nghĩa cho nội dung đó. Nghĩa là để mô tả cấu trúc của tri thức, chúng ta phải
có thông tin mô tả nội dung. Bằng cách này, máy có thể tự xử lý được tri thức, bằng
cách sử dụng các quá trình xử lý như lập luận, suy diễn, suy luận tương tự như con
người, do đó kết quả xử lý có ý nghĩa hơn và giúp máy tính tự động trong quá trình
thu thập và nghiên cứu thông tin.
Ví dụ thẻ HTML để biểu diễn dữ liệu trong web thông thường
<item>blog</item>

Cũng với thông tin trên nhưng được mô tả trong web ngữ nghĩa
<item rdf:about=" />
I.6

Web 3.0


I.6.1

Định nghĩa

Theo Tim Berners-Lee, Web ngữ nghĩa được mô tả như một thành phần của
Web 3.0. Web ngữ nghĩa đôi khi được sử dụng như là một Web 3.0.
I.6.2

Quá trình phát triển

Giữa lúc Web giao tiếp xã hội 2.0 đang thời kỳ thịnh hành thì những dấu hiệu
của một thế hệ Web mới đã bắt đầu xuất hiện. Nếu bạn sử dụng một máy ảnh kỹ
thuật số có tích hợp GPS để ghi lại các hình ảnh và tải chúng lên mạng xã hội Flickr
thì trang Web này sẽ cho bạn thấy cả những hình ảnh tương tự của các tác giả khác
chụp cùng ngày, cùng đường phố, cùng sự kiện hay cùng nhân vật. Thế hệ web mới
đang tạo cho máy tính khả năng đọc và hiểu các nội dung trong đó, và rồi liên kết
các nội dung tương tự vào lại với nhau. Khả năng tương tự càng mạnh hơn nơi các
cỗ máy tìm kiếm Web như Google Search. Khi chúng ta đặt câu hỏi “tìm ngôi nhà
nghỉ hè gần nice”, máy tính có thể hiểu “nghỉ hè” có ý nghĩa như thế nào, “nice” là
một thành phố ở miền nam nước Pháp, và “gần” đồng nghĩa với ưu tiên khoảng cách
từ bán kính nhỏ đến lớn, từ 1, 2 rồi mới đến 10, 15km. Ý niệm về việc thiết kế kỹ
thuật Web giúp cho máy tính có thể đọc và hiểu ý nghĩa trong đó, gọi là web

10


11

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA


NHÓM 5 – D09CNPM2

semantic đã được Berners-Lee đưa ra từ trước. Nhưng dựa trên những dấu hiệu xuất
hiện thực tế này, năm 2006 John Marshoff của tờ New York Times đề nghị gọi đó là
thế hệ Web 3.0.
Ý niệm căn bản của Web 3.0 là định nghĩa cấu trúc dữ liệu và liên kết chúng
lại để dễ bề khám phá phát hiện, tự động hóa, tích hợp, và tái sử dụng trong các ứng
dụng khác nhau. Web 3.0 cố gắng kết nối, hợp nhất, và phân tích dữ kiện từ những
bộ dữ liệu khác nhau để tạo nên dòng thông tin mới. Điều này tạo ra khả năng cải
tiến cách quản lý dữ liệu, hỗ trợ việc truy cập Internet trên các thiết bị di động, mô
phỏng hoạt động sáng tạo và cải tiến, khuyến khích toàn cầu hóa, gia tăng thỏa mãn
nơi khách hàng và giúp tổ chức cộng tác trong các trang Web xã hội. Ở góc độ
semantic (ngữ nghĩa), Web 3.0 có thể thể hiện một sự vật nhờ vào khả năng hiểu biết
của máy tính và các thiết bị di động thông minh, nhờ đó giảm đáng kể số thao tác và
hỗ trợ con người đưa ra các quyết định nhanh chóng và chính xác. Sự khác nhau
giữa thế hệ Web 2.0 và Web 3.0 là một đằng nhắm đến việc sáng tạo ra các nội dung
mới bởi người sử dụng và nhà sản xuất, đằng kia đặt mục tiêu liên kết các bộ dữ liệu.
Nhiều trang Web hiện nay là sự phối hợp ở các chừng mực khác nhau giữa Web 2.0
và Web 3.0 như iTunes, Netflix, và đây lại chính là tiền đề công nghệ để phát triển
nên một thế hệ Web mới.
I.7

Web 4.0

Cách nay một năm, phần lớn chuyên gia và các nhà phân tích công nghệ cho
rằng thế hệ Web 4.0 chỉ có thể xuất hiện sau 5 năm nữa. Nhưng nay nhiều trong số
họ tin rằng thế hệ Web mới mà thường được gọi là Web cộng sinh (symbiotic) đã
xuất hiện ngay trong năm 2012, hoặc rải rác dưới dạng nội dung số 4.0, hoặc hàm ẩn
có hệ thống trong các nền tảng Web. Nhằm tạo cho các ứng dụng Web trở nên bẩm
sinh (native) ngay trong thiết bị, một điều kiện tiên quyết để tạo nên sự thông minh

tự tại cho máy tính và các thiết bị di động, nhiều công ty và viện nghiên cứu đã tiến
hành thử nghiệm một dòng nền tảng hay hệ điều hành mới gọi là WebOS. Những
kinh nghiệm thành công của kỹ thuật Web 2.0 và Web 3.0 làm cho việc lập trình
WebOS trở nên thuận lợi, cho dù chúng sẽ chạy ngay trong trang Web hay trên hệ
thống điện toán đám mây. Về mặt kỹ thuật, chúng ta có thể hình dung thế hệ Web
4.0 mang tính phân tán và tự sinh ngay trên mỗi trang Web chứ không tập trung hay
bị kiểm soát bởi các máy chủ. Đây chính là môi trường tranh đua công nghệ để chọn
ra giải pháp thích ứng nhất.

11


12

NHÓM 5 – D09CNPM2

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

Động lực của sự tiến hóa Web gồm hai phần. Trước hết là nhu cầu và khuynh
hướng của người sử dụng. Sau đó là mức độ đáp ứng của các giải pháp công nghệ.
Cả hai động lực này đang hướng dẫn thế hệ Web 4.0 đến mục tiêu cộng sinh giữa
người và máy tính (thông qua hệ điều hành WebOS) để luôn luôn tạo ra những nội
dung mới. Máy tính có khả năng tương tác ngược lại với con người và với cộng
đồng xã hội của người sử dụng nhờ vào khả năng đọc - hiểu - hành động - kiểm soát.
Trong khi thế giới công nghệ đang chuyển mình sang một thế hệ Web mới thì thế
giới kinh doanh cũng đang chờ đợi một giai đoạn bùng nổ. Các hình thức quảng cáo
trực tuyến và xã hội hiện nay có thể trở nên lỗi thời bởi sự nhập cuộc chứ không chỉ
giao tiếp của người tiêu dùng, và việc điện tử hóa, tự động hóa các hoạt động con
người có thể trở nên trọn vẹn nhờ sự cộng tác tự nhiên của máy tính. Đây chính là
điều mà các đại gia công nghệ phải đưa ra một định hướng phát triển vào cuối năm

nay.
II.

Dịch vụ Web

II.1

Định nghĩa (Có gì thiếu HOA bổ sung nhá)

Dịch vụ Web (Web Service) là một loại ứng dụng Khách – Chủ (Client –
Server) phân tán. Trong đó, có một ứng dụng đóng vai trò máy chủ (server) cung cấp
các giao diện lập trình ứng dụng (API) có thể truy cập được trên nền web. Một ứng
dụng khác đóng vai trò máy khách (client) sẽ yêu cầu dịch vụ từ máy chủ này.
II.2

Dịch vụ Web và Web
Web thông thường

Định
nghĩa

Dịch vụ web

Web 1.0

Web 2.0

Web 3.0

- Web 1.0 là

một khái niệm
chỉ giai đoạn
ban đầu trong
sự tiến hóa của
World
Wide
Web
(www)
kéo dài từ năm
1995-2004, tập
trung
vào

-Web 2.0 là thế hệ
thứ 2 (bắt đầu từ
năm 2004) của
chuẩn web và các
dịch vụ lưu trữ
(hosting) với mục
đích thuận tiện
trong việc chia sẻ,
hợp tác và sáng
tạo giữa các người

-Theo
Tim
Berners-Lee,
Web ngữ nghĩa
được mô tả như
một thành phần

của Web 3.0.
Web ngữ nghĩa
đôi khi được sử
dụng như là

-Dịch vụ Web
(Web Service) là
một loại ứng dụng
Khách

Chủ
(Client – Server)
phân tán. Trong đó,
có một ứng dụng
đóng vai trò máy
chủ (server) cung
cấp các giao diện
12


13

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

phương
pháp
tiếp cận trên
xuống (1 chiều)
về sử dụng web
cũng như về

giao diện người
dùng.

dùng. Nó không một Web 3.0
phải là một dạng
nâng cấp kỷ thuật
từ web 1.0 mà là
một sự thay đổi về
cách phát triển
phần mềm và về
cách sử dụng của
người dùng cuối.

NHÓM 5 – D09CNPM2

lập trình ứng dụng
(API) có thể truy
cập được trên nền
web. Một ứng dụng
khác đóng vai trò
máy khách (client)
sẽ yêu cầu dịch vụ
từ máy chủ này.
Dịch vụ web còn là
sự kết hợp các máy
tính cá nhân với các
thiết bị khác, các cơ
sở dữ liệu và
các mạng máy
tính để tạo thành

một cơ cấu tính
toán ảo mà người
sử dụng có thể làm
việc thông qua
các trình duyệt
mạng.

13


14

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

Vai trò

-Xét về mặt kỹ
thuật, thông tin
trên web là
đóng (nội dung
tĩnh) và chỉ
chỉnh sửa được
từ bên ngoài
thông qua người
quản trị web, do
đó không có
tính
“động”.
Công nghệ web
1.0 tập trung

vào khía cạnh
trình bày, không
có khả năng tạo
ra từ nội dung
có sẵn.

- Web đóng vai trò
như một nền tảng,
có thể chạy mọi
ứng dụng.
- Là nơi tập
hợp trí tuệ của
cộng đồng.
- Dữ liệu
đóng vai trò then
chốt.
- Phần mềm
được cung cấp
dưới dạng dịch vụ
web và được nâng
cấp không ngừng.
- Phát triển
ứng dụng dễ dàng
và nhanh chóng.
- Phần mềm
có thể chạy được
trên nhiều nền
tảng như thiết bị
di động, thiết bị
cầm tay (PDA).

- Giao diện
ứng dụng phong
phú.
Ban
đầu,
web 2.0 chú trọng
tới yếu tố công
nghệ, nhấn mạnh
tới vai trò nền

NHÓM 5 – D09CNPM2

- Tính rộng
lớn:
WWW
hiện nay có
hàng tỷ trang.
Chỉ xét riêng
bộ ontology y
tế SNOMED
CT cũng đã
chứa 370000
lớp, công nghệ
hiện tại cũng
chưa thể loại
bỏ hết tất cả
ngữ
nghĩa
trùng lặp. Bất
kỳ hệ thống suy

luận tự động
nào cũng phải
đối mặt với dữ
liệu đầu vào
thực sự rất lớn.
- Tính mơ hồ:
Đây là những
khái
niệm
không
chính
xác như là
“trẻ”,
“cao”.
Điều này xuất
hiện từ sự mơ
hồ khi người sử
dụng truy vấn.
Các nhà cung
cấp
bộ
ontology cũng
cố gắng kết

- Dịch vụ Web cho
phép client và
server tương tác
được với nhau ngay
cả trong những môi
trường khác nhau.

Ví dụ, đặt Web
server cho ứng
dụng trên một máy
chủ chạy hệ điều
hành Linux trong
khi người dùng sử
dụng máy tính chạy
hệ điều hành
Windows, ứng dụng
vẫn có thể chạy và
xử lý bình thường
mà không cần thêm
yêu cầu đặc biệt để
tương thích giữa hai
hệ điều hành này.
- Phần lớn kĩ thuật
của Dịch vụ Web
được xây dựng dựa
trên mã nguồn mở
và được phát triển
từ các chuẩn đã
được công nhận, ví
dụ như XML.
- Một Dịch vụ Web
bao gồm có nhiều
mô-đun và có thể
công bố lên mạng
Internet.
- Là sự kết hợp của
việc phát triển theo

14


15

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

tảng ứng dụng.
Nhưng đến hội
thảo Web 2.0
được tổ chức lần
thứ 2 vào tháng
2/2005 yếu tố
cộng đồng được
nhấn mạnh hơn.

NHÓM 5 – D09CNPM2

hợp với các
kiến thức cơ
bản khác để tìm
điểm
chung
nhưng kết quả
cuối cùng lại
khác nhau. Để
đối phó với sự
mô hồ, thông
thường phương
pháp Logic mờ

được sử dụng.
- Sự không
thống
nhất:
Đây là mâu
thuẫn
chắc
chắn sẽ phá
sinh trong quá
trình phát triển
bộ
ontology
rộng lớn, và
nhất là khi các
ontology này
được kết hợp từ
các
nguồn
riêng biệt.
- Lừa dối: Là
khi nhà cung
cấp thông tin
cố ý gây hiểu
nhầm
cho
người sử dụng.
Kỹ thuật mã
hóa
thường


hướng từng thành
phần với những lĩnh
vực cụ thể và cơ sở
hạ tầng Web, đưa ra
những lợi ích cho
cả doanh nghiệp,
khách hàng, những
nhà cung cấp khác
và cả những cá
nhân thông qua
mạng Internet.
- Một ứng dụng khi
được triển khai sẽ
hoạt động theo mô
hình client-server.
Nó có thể được
triển khai bởi một
phần mềm ứng
dụng phía server ví
dụ như PHP, Oracle
Application server
hay
Microsoft.Net…
- Ngày nay dịch vụ
Web đang rất phát
triển, những lĩnh
vực trong cuộc sống
có thể áp dụng và
tích hợp dịch vụ
Web là khá rộng

lớn như dịch vụ
chọn lọc và phân
loại tin tức (hệ
thống thư viện có
kết nối đến web
portal để tìm kiếm
15


16

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

được dùng để các thông tin cần
hạn chế mối đe thiết); ứng dụng cho
dọa này.
các dịch vụ du lịch
(cung cấp giá vé,
- Sự không
thông tin về địa
chắc chắn: Đây
điểm…), các đại lý
là những khái
bán hàng qua mạng,
niệm rõ ràng
thông tin thương
với những giá
mại như giá cả, tỷ

trị không chắc
giá hối đoái, đấu
chắn. Kỹ thuật
giá qua mạng…hay
suy luận logic
dịch vụ giao dịch
được sử dụng
trực tuyến (cho cả
trong
trường
B2B và B2C) như
hợp này.
đặt vé máy bay,
thông tin thuê xe…
- Các ứng dụng có
tích hợp dịch vụ
Web đã không còn
là xa lạ, đặc biệt
trong điều kiện
thương mại điện tử
đang bùng nổ và
phát triển không
ngừng cùng với sự
lớn mạnh của
Internet. Bất kì một
lĩnh vực nào trong
cuộc sống cũng có
thể tích hợp với
dịch vụ Web, đây là
cách thức kinh

doanh và làm việc
có hiệu quả bởi thời
đại ngày nay là thời
đại của truyền
16


17

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

thông và trao đổi
thông tin qua mạng.
Do vậy, việc phát
triển và tích hợp
các ứng dụng với
dịch vụ Web đang
được quan tâm phát
triển là điều hoàn
toàn dễ hiểu.

Ưu điểm Nội dung thông
tin hữ ích

thông tin hiển thị
được gọi ra từ một
cơ sở dữ liệu khi
-Người dùng

người dùng truy
ghé thăm trang vấn tới một trang
web. Trang web
web
được gửi tới trình
- Nhà sản xuất
duyệt gồm những
câu chữ, hình ảnh,
đưa cho khách
âm thanh hay
hang sử dụng
những dữ liệu số
Thiết kế đồ hoạ hoặc ở dạng bảng
đẹp: Trang Web hoặc ở nhiều hình
tĩnh
thường thức khác nữa.
được trình bày
ấn tượng và Thông tin trên
luôn luôn
cuốn hút hơn web
trang web động mới vì nó dễ dàng
về phần mỹ được bạn thường
thuật đồ hoạ vì xuyên cập nhật
thông qua việc

+ Dịch vụ Web
cung cấp khả năng
hoạt động rộng lớn
với các ứng dụng
phần mềm khác

nhau chạy trên
những nền tảng
khác nhau.
+ Sử dụng các giao
thức và chuẩn mở.
Giao thức và định
dạng dữ liệu dựa
trên văn bản (text),
giúp các lập trình
viên dễ dàng hiểu
được.
+ Nâng cao khả
năng tái sử dụng.
17


18

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

chúng ta có thể
hoàn toàn tự do
trình bày các ý
tưởng về đồ hoạ
và mỹ thuật trên
toàn diện tích
từng trang web
tĩnh.
- Tốc độ truy
cập nhanh: Tốc

độ truy cập của
người dùng vào
các trang web
tĩnh nhanh hơn
các trang web
động vì không
mất thời gian
trong việc truy
vấn cơ sở dữ
liệu như các
trang web động.
- Thân thiện
hơn
với
các máy
tìm
kiếm
(search
engine) : Bởi vì
địa chỉ URL của
các .html, .htm,
…trong trang
web tĩnh không
chứa dấu chấm
hỏi (?) như
trong web động.
- Chi phí đầu tư
thấp: Chi phí
xây
dựng

website
tĩnh
thấp hơn nhiều
so với website

Bạn sử dụng các
công cụ cập nhật
của các phần mềm
quản trị web .
Thông tin luôn
được cập nhật
trong một cơ sở
dữ liệu và người
dùng Internet có
thể xem những
chỉnh sửa đó ngay
lập tức. Vì vậy
website được hỗ
trợ bởi cơ sở dữ
liệu là phương tiện
trao đổi thông tin
nhanh nhất với
người
dùng
Internet. Điều dễ
nhận
thấy

những
website

thường
xuyên
được cập nhật sẽ
thu hút nhiều
khách hàng tới
thăm hơn những
web site ít có sự
thay đổi về thông
tin.
- Web có tính
tương tác với
người sử dụng
cao. Với web
động, Bạn hoàn
toàn có thể dễ
dàng quản trị nội
dung và điều hành
website của mình
thông qua các
phần mềm hỗ trợ

NHÓM 5 – D09CNPM2

+ Thúc đẩy đầu tư
các hệ thống phần
mềm đã tồn tại
bằng cách cho phép
các tiến trình/chức
năng nghiệp vụ
đóng gói trong giao

diện dịch vụ Web.
+ Tạo mối quan hệ
tương tác lẫn nhau
và mềm dẻo giữa
các thành phần
trong hệ thống, dễ
dàng cho việc phát
triển các ứng dụng
phân tán.
+ Thúc đẩy hệ
thống tích hợp,
giảm sự phức tạp
của hệ thống, hạ giá
thành hoạt động,
phát triển hệ thống
nhanh và tương tác
hiệu quả với hệ
thống của các
doanh nghiệp khác.

18


19

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

động vì không
phải xây dựng
các cơ sở dữ

liệu, lập trình
phần mềm cho
website và chi
phí cho việc
thuê chỗ cho cơ
sở dữ liệu, chi
phí yêu cầu hệ
điều hành tương
thích (nếu có).

Nhược
điểm

Xét
về
mặt kỹ thuật,
thông tin trên
web là đóng
(nội dung tĩnh)
và chỉ chỉnh sửa
được từ bên
ngoài thông qua
người quản trị
web, do đó
không có tính
“động”. Công
nghệ web 1.0
tập trung vào
khía cạnh trình
bày, không có

khả năng tạo ra
từ nội dung có
sẵn.
Khó khăn trong
việc thay đổi và
cập nhật thông
tin: Muốn thay

NHÓM 5 – D09CNPM2

mà không nhất
thiết Bạn cần phải
có kiến thức nhất
định về ngôn ngữ
html, lập trình we

+ Những thiệt hại
lớn sẽ xảy ra vào
khoảng thời gian
chết của Dịch vụ
Web, giao diện
không thay đổi, có
thể lỗi nếu một máy
khách không được
nâng cấp, thiếu các
giao thức cho việc
vận hành.
+ Có quá nhiều
chuẩn cho dịch vụ
Web khiến người

dùng khó nắm bắt.
+ Phải quan tâm
nhiều hơn đến vấn
đề an toàn và bảo
mật.

19


20

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

đổi và cập nhật
nội dung thông
tin của trang
website
tĩnh
Bạn cần phải
biết về ngôn
ngữ html, sử
dụng được các
chương
trình
thiết kế đồ hoạ
và thiết kế web
cũng như các
chương

trình
cập nhật file lên
server.
- Thông tin
không có tính
linh hoạt, không
thân thiện với
người dùng: Do
nội dung trên
trang web tĩnh
được thiết kế cố
định nên khi
nhu cầu về
thông tin của
người truy cập
tăng cao thì
thông tin trên
website tĩnh sẽ
không đáp ứng
được.
- Khó tích hợp,
nâng cấp, mở
rộng: Khi muốn
mở rộng, nâng
cấp một website
tĩnh hầu như là
phải làm mới lại

20



21

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

website.

21


22

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA
III.
III.1

NHÓM 5 – D09CNPM2

Các công nghệ dịch vụ Web và Web ngữ nghĩa
Các công nghệ dịch vụ Web

Hình 3 Semantic Web architecture stack

III.1.1

XML

Là một chuẩn mở do W3C đưa ra cho cách thức mô tả dữ liệu, nó được sử

dụng để định nghĩa các thành phần dữ liệu trên trang web và cho những tài liệu B2B.
Về hình thức, XML hoàn toàn có cấu trúc thẻ giống như ngôn ngữ HTML nhưng
HTML định nghĩa thành phần được hiển thị như thế nào thì XML lại định nghĩa
những thành phần đó chứa cái gì. Với XML, các thẻ có thể được lập trình viên tự tạo
ra trên mỗi trang web và được chọn là định dạng thông điệp chuẩn bởi tính phổ biến
và hiệu quả mã nguồn mở.
Do dịch vụ Web là sự kết hợp của nhiều thành phần khác nhau nên nó sử dụng
các tính năng và đặc trưng của các thành phần đó để giao tiếp. XML là công cụ
chính để giải quyết vấn đề này và là kiến trúc nền tảng cho việc xây dựng một dịch
vụ Web, tất cả dữ liệu sẽ được chuyển sang định dạng thẻ XML. Khi đó, các thông
22


23

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

tin mã hóa sẽ hoàn toàn phù hợp với các thông tin theo chuẩn của SOAP hoặc XMLRPC và có thể tương tác với nhau trong một thể thống nhất.
III.1.2

SOAP

Chúng ta đã hiểu cơ bản dịch vụ Web như thế nào nhưng vẫn còn một vấn đề
khá quan trọng. Đó là làm thế nào để truy xuất dịch vụ khi đã tìm thấy? Câu trả lời là
các dịch vụ Web có thể truy xuất bằng một giao thức là Simple Object Access
Protocol – SOAP. Nói cách khác chúng ta có thể truy xuất đến UDDI registry bằng
các lệnh gọi hoàn toàn theo định dạng của SOAP.
SOAP là một giao thức giao tiếp có cấu trúc như XML. Nó được xem là cấu

trúc xương sống của các ứng dụng phân tán được xây dựng từ nhiều ngôn ngữ và các
hệ điều hành khác nhau. SOAP là giao thức thay đổi các thông điệp dựa trên XML
qua mạng máy tính, thông thường sử dụng giao thức HTTP.
Một client sẽ gửi thông điệp yêu cầu tới server và ngay lập tức server sẽ gửi
những thông điệp trả lời tới client. Cả SMTP và HTTP đều là những giao thức ở lớp
ứng dụng của SOAP nhưng HTTP được sử dụng và chấp nhận rộng rãi hơn bởi ngày
nay nó có thể làm việc rất tốt với cơ sở hạ tầng Internet.
III.1.3

Kiến trúc một thông điệp theo dạng SOAP

Thông điệp theo định dạng SOAP là một văn bản XML bình thường bao gồm
các phần tử sau:
- Phần tử gốc - envelop: phần tử bao trùm nội dung thông điệp, khai báo văn
bản XML như là một thông điệp SOAP.
- Phần tử đầu trang – header: chứa các thông tin tiêu đề cho trang, phần tử
này không bắt buộc khai báo trong văn bản. Header còn có thể mang những dữ liệu
chứng thực, những chứ ký số, thông tin mã hóa hay cài đặt cho các giao dịch khác.
- Phần tử khai báo nội dung chính trong thông điệp - body, chứa các thông tin
yêu cầu và thông tin được phản hồi.
- Phần tử đưa ra các thông tin về lỗi -fault, cung cấp thông tin lỗi xảy ra trong
qúa trình xử lý thông điệp.
Một SOAP đơn giản trong body sẽ lưu các thông tin về tên thông điệp, tham
chiếu tới một thể hiện của dịch vụ, một hoặc nhiều tham số. Có 3 kiểu thông báo sẽ
23


24

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA


NHÓM 5 – D09CNPM2

được đưa ra khi truyền thông tin: request message(tham số gọi thực thi một thông
điệp), respond message (các tham số trả về, được sử dụng khi yêu cầu được đáp ứng)
và cuối cùng là fault message (thông báo tình trạng lỗi).
Kiểu truyền thông: Có 2 kiểu truyền thông
- Remote procedure call (RPC): cho phép gọi hàm hoặc thủ tục qua mạng.
Kiểu này được khai thác bởi nhiều dịch vụ Web.
- Document: được biết đến như kiểu hướng thông điệp, nó cung cấp giao tiếp
ở mức trừu tượng thấp, khó hiểu và yêu cầu lập trình viên mất công sức hơn.
Hai kiểu truyền thông này cung cấp các định dạng thông điệp, tham số, lời gọi
đến các API khác nhau nên việc sử dụng chúng tùy thuộc vào thời gian và sự phù
hợp với dịch vụ Web cần xây dựng.
Cấu trúc dữ liệu: Cung cấp những định dạng và khái niệm cơ bản giống như
trong các ngôn ngữ lập trình khác như kiểu dữ liệu (int, string, date…) hay những
kiều phức tạp hơn như struct, array, vector… Định nghĩa cấu trúc dữ liệu SOAP
được đặt trong namespace SOAP-ENC.
Mã hóa: Giả sử service rquester và service provider được phát triển trong
Java, khi đó mã hóa SOAP là làm thế nào chuyển đổi từ cấu trúc dữ liệu Java sang
SOAP XML và ngược lại, bởi vì định dạng cho Web Service chính là XML. Bất kỳ
một môi trường thực thi SOAP nào cũng phải có một bảng chứa thông tin ánh xạ
nhằm chuyển đổi từ ngôn ngữ Java sang XML và từ XML sang Java - bảng đó được
gọi là SOAPMappingRegistry. Nếu một kiểu dữ liệu được sử dụng dưới một dạng
mã hóa thì sẽ có một ánh xạ tồn tại trong bộ đăng ký của môi trường thực thi SOAP
đó.

24



25

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA
III.1.4

NHÓM 5 – D09CNPM2

WSDL

WSDL định nghĩa cách mô tả dịch vụ Web theo cú pháp tổng quát của XML,
bao gồm các thông tin:
- Tên dịch vụ
- Giao thức và kiểu mã hóa sẽ được sử dụng khi gọi các hàm của dịch vụ
Web
- Loại thông tin: thao tác, tham số, những kiểu dữ liệu (có thể là giao diện của
dịch vụ Web cộng với tên cho giao diện này).
Một WSDL hợp lệ gồm hai phần: phần giao diện (mô tả giao diện và phương
thức kết nối) và phần thi hành mô tả thông tin truy xuất CSDL. Cả hai phần này sẽ
được lưu trong 2 tập tin XML tương ứng là tập tin giao diện dịch vụ và tập tin thi
hành dịch vụ. Giao diện của một dịch vụ Web được miêu tả trong phần này đưa ra
cách thức làm thế nào để giao tiếp qua dịch vụ Web. Tên, giao thức liên kết và định
dạng thông điệp yêu cầu để tương tác với dịch vụ Web được đưa vào thư mục của
WSDL.
WSDL thường được sử dụng kết hợp với XML schema và SOAP để cung cấp
dịch vụ Web qua Internet. Một client khi kết nối tới dịch vụ Web có thể đọc WSDL
để xác định những chức năng sẵn có trên server. Sau đó, client có thể sử dụng SOAP
để lấy ra chức năng chính xác có trong WSDL.
III.1.5

UDDI


Để có thể sử dụng các dịch vụ, trước tiên client phải tìm dịch vụ, ghi nhận
thông tin về cách sử dụng và biết được đối tượng nào cung cấp dịch vụ. UDDI định
nghĩa một số thành phần cho biết các thông tin này, cho phép các client truy tìm và
nhận những thông tin được yêu cầu khi sử dụng dịch vụ Web.
- Cấu trúc UDDI :
+ Trang trắng - White pages: chứa thông tin liên hệ và các định dạng chính
yếu của dịch vụ Web, chẳng hạn tên giao dịch, địa chỉ, thông tin nhận dạng…
Những thông tin này cho phép các đối tượng khác xác định được dịch vụ.

25


×