Tải bản đầy đủ (.doc) (75 trang)

XML-ngôn ngữ Web thế hệ kế tiếp potx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (498.38 KB, 75 trang )


XML-ngôn ngữ Web thế hệ
kế tiếp
……… , tháng … năm …….
XML - ngôn ngữ Web thế hệ kế tiếp
XML (Extensible Markup Language - ngôn ngữ
đánh dấu mở rộng) đã trở thành thuật ngữ thông
dụng trong lĩnh vực Internet, song có thể bạn còn
chưa hiểu thấu đáo về nó cùng những lợi ích mà nó
mang lại. Đừng cho rằng XML là công nghệ khó
lĩnh hội vì đằng sau những lời khoa trương liên
quan tới ngôn ngữ này là cả thuận lợi lớn cho quá
trình cộng tác.
Quá trình phát triển của XML
XML là ngôn ngữ xây dựng cấu trúc tài liệu văn
bản, dựa theo chuẩn SGML (Standard Generalized
Markup Language: siêu ngôn ngữ có khả năng sinh
ngôn ngữ khác). SGML được phát triển cho việc
định cấu trúc và nội dung tài liệu điện tử, do tổ
chức ISO (International Organization for
Standards) chuẩn hoá năm 1986.
SGML là do IBM đưa ra, song không thể không
kể đến những đóng góp của các công ty khác.
XML được W3C (World Wide Web Consortium:
tổ chức độc lập định ra tiêu chuẩn cho trình duyệt
Web, máy chủ và ngôn ngữ) phát triển, nhưng đặc
tả XML lại do Netscape, Microsoft và các thành
viên của dự án Text Encoding Initiative (TEI) xây
dựng. Tổ chức W3C XML Special Interest Group
có đại diện từ hơn 100 công ty cùng nhiều chuyên
gia được mời khác.


Hình 1: W3C - Tổ chức đi đầu trong việc phát triển
XML (Web site: )
W3C chính thức thông qua chuẩn XML vào tháng
Hai năm 1998. Thực chất, XML phát triển không
phải với mục đích trang trí trang Web mà là trợ
giúp cấu trúc cho tài liệu và dữ liệu để chúng có thể
trao đổi giữa các phòng ban, khách hàng và nhà
cung cấp. Cho dù XML vẫn chưa phổ biến, song
đang được nhiều đối tượng quan tâm bởi nó cho
phép chia sẻ và sử dụng thông tin phân tán trên các
hệ thống khác nhau.
XML hỗ trợ người dùng thông qua khả năng tạo
nội dung động, phát triển ứng dụng và tích hợp trên
qui mô xí nghiệp. Khi việc hỗ trợ những hệ thống
cũ gặp nhiều khó khăn và các doanh nghiệp đang
cố gắng hợp nhất dữ liệu, XML có thể "giảm bớt
gánh nặng" ở những nơi dữ liệu phân tán trên các
hệ thống cũ.
á
XML là gì?
Để hiểu đúng về XML và phân biệt với HTML
(Hypertext Markup Language ố ngôn ngữ đánh dấu
siêu văn bản), cách đơn giản nhất là bắt đầu bằng
một ví dụ HTML. HTML sử dụng tập thẻ (tag) hữu
hạn để định ra thông tin cơ bản về cấu trúc tài liệu.
Do là ngôn ngữ đánh dấu nên HTML rất dễ sử
dụng, bất kỳ ai cũng có thể xây dựng từ đầu trang
Web cơ bản theo yêu cầu riêng.
XML khá giống HTML, hai ngôn ngữ này có cùng
luật cú pháp. Tuy nhiên, tính linh hoạt của XML

cho phép bạn tạo và sử dụng tập thẻ và thuộc tính
riêng để nhận biết các phần tử cấu trúc và nội dung
tài liệu. XML không chỉ đơn thuần là ngôn ngữ
đánh dấu, nó có phương pháp định ra nội dung tài
liệu, tương tự như HTML định hình thức tài liệu
trên Web. Với HTML, người thiết kế đánh dấu văn
bản, hình ảnh cùng các thành phần khác của trang
Web bằng tập thẻ mà không liên quan gì tới ý
nghĩa tài liệu; đoạn mã HTML chỉ nói lên cách
hiển thị nội dung tài liệu qua trình duyệt. XML
không chỉ định ra hình thức mà còn cả nội dung tài
liệu.
Hình 2: Interleaf phát triển công cụ đồ hoạ tạo
XML sử dụng XSL
XML được xem là công cụ mạnh hơn HTML do nó
mang lại thông tin đầy đủ về dữ liệu. XML cung
cấp "siêu dữ liệu" (meta-data) hay dữ liệu về dữ
liệu, giúp việc tìm kiếm thông tin được dễ dàng
hơn. Ví dụ, trong HTML, từ "apple" có thể được
gán thẻ "bold" để mô tả hình dạng trái táo. Tuy
nhiên, XML bao gồm các thẻ mô tả vật thể như
"fruit" hay "apple" hay "red".
Một số tổ chức chuyên môn đã xây dựng ngôn ngữ
XML riêng, bao gồm các thẻ nhận diện đặc tả công
nghiệp. Ví dụ, ngành công nghiệp hoá đã phát triển
ngôn ngữ Chemical Markup Language (CML)
Tháng Hai năm 1998, hơn 40 nhà sản xuất cùng
các công ty đã thông báo kế hoạch hoàn thành ngôn
ngữ Commerce Extensible Markup Language
(CXML) - tập con của XML. CXML định ra các

tập dữ liệu chuẩn dùng cho thương mại điện tử trên
Internet. Phiên bản thu nhỏ, đơn giản hơn của
Electronic Data Interchange (EDI), tập thẻ dữ liệu
CXML và bản thử nghiệm được công bố vào tháng
Ba. Bản chính thức được hoàn thành trong vòng
sáu tháng sau.
XML cho phép các nhà phát triển và quản trị công
nghệ thông tin mô tả thông tin có liên hệ tới các
nguồn thông tin khác. Đây là phương pháp khai
thác thông tin nghiệp vụ lý tưởng trong môi trường
trao đổi thông tin từ server đến server, từ server
đến ứng dụng hay từ ứng dụng đến ứng dụng.
Hình 3: Kenya của General Magic sử dụng XML
Cấu trúc mã chặt chẽ của XML (nội dung được
đặt giữa các ký hiệu mã chuẩn hay còn gọi là thẻ)
cho phép các ứng dụng khác dễ dàng tìm kiếm và
sử dụng nội dung đã tạo. Mỗi tài liệu XML trở
thành một kho dữ liệu hỏi đáp (query data
repository) tương tự như cơ sở dữ liệu (CSDL).
Hiện tại, không có hệ thống quy tắc quản lý các
"gói" dữ liệu Web hay định ra phương pháp vận
hành trên dữ liệu này. Kết quả là Internet trở thành
bộ sưu tập khổng lồ của HTML, JavaScript và Java
trên máy client và "mớ" ngôn ngữ kịch bản và ngôn
ngữ biên dịch trên server.
XML giải quyết sự lộn xộn này bằng cách tổ
chức tất cả các ngôn ngữ lập trình theo một cấu
trúc thống nhất. Trước đây, dữ liệu được lưu trữ
không theo thứ tự trong các trang HTML, nhưng
giờ đây chúng được đặt trong các trang XML theo

cấu trúc chặt chẽ. Cả hai trình duyệt của Netscape
và Microsoft phiên bản 5.x đều thông hiểu XML và
quản lý hiệu quả dữ liệu này.
Độc lập với server
XML giúp bạn tạo tài liệu sử dụng độc lập với
server. Tài liệu nằm ngay trên máy khi người dùng
tải về và tiếp tục được sử dụng không phụ thuộc
server. Ví dụ, bạn tải tài liệu xuống máy tính xách
tay, sau đó có thể sử dụng hiệu quả tài liệu này
trong khi máy tính không nối mạng. Sở dĩ đạt được
điều này là do tài liệu XML được lập trình thông
minh trên chính nó: tài liệu tồn tại độc lập với
server. Thậm chí, tài liệu có thể được gửi tới người
dùng khác dùng ứng dụng có hỗ trợ XML. Những
ứng dụng nhận biết được XML (không phải trình
duyệt) cũng có thể quản lý dữ liệu gán thẻ XML.
Mặt khác, XML mang tính chặt chẽ của SGML,
không ảnh hưởng tới cơ sở cài đặt khổng lồ của các
trang HTML đã tồn tại trên Internet, nghĩa là chỉ
cần điều chỉnh chút ít trang HTML để tương thích
với XML.
Hình 4: Lasso 3.5 Web Data Engine của Blue
World hỗ trợ XML
Đây là một dòng mã HTML định ra nguồn hình
ảnh: <img src = /img/fig1.jpg>, tương ứng trong
XML là: <img src = "/img/ fig1.jpg/">. Rõ ràng, sự
khác biệt giữa hai dòng mã là không lớn, những
thay đổi như đặt thuộc tính ("/img/ fig1.jpg/" nhận
biết tập tin fig1.jpg như một hình ảnh) trong cặp
nháy kép và thêm dấu gạch chéo kết thúc câu lệnh

đã chuyển câu lệnh HTML thành câu lệnh XML và
được biên dịch bình thường. Một trang XML là
một CSDL do các trường đều được nhận diện hay
biên dịch, và chứa dữ liệu đặc tả để ứng dụng khác
có thể truy cập.
Các ứng dụng XML
Nhiều nhà sản xuất đã công bố các chuẩn và ứng
dụng XML, tiêu biểu là Document Object Model
Level 2 cung cấp tập chuẩn gồm các đối tượng để
trình bày tài liệu HTML và XML, đồng thời bổ
sung các giao tiếp kiểu đối tượng Cascading Style
Sheets (CSS), giao tiếp kiểu sự kiện và truy vấn.
Cũng là một trở ngại khi mãi tới năm 1998, các
công cụ tạo XML, DTD (Document Type
Definition ố định nghĩa loại tài liệu: một kiểu tập
tin kết hợp với tài liệu đánh dấu để định ra cách
thông dịch tài liệu bằng ứng dụng thông qua thẻ
đánh dấu) mới được đưa ra. Tuy nhiên đông đảo
các nhà sản xuất đã và sẽ hỗ trợ XML trong những
sản phẩm sắp tới. Ngoài ra, XML hứa hẹn mở rộng
khả năng định dạng tài liệu Web thông qua việc bổ
sung các DTD.
Trên cơ sở sự quan tâm và chấp nhận XML,
trong năm nay, các nhà sản xuất sẽ đưa ra thị
trường những sản phẩm hỗ trợ XML mang tính
chất "chào hàng".
Interleaf Composer/Styler là công cụ đồ hoạ tạo
XML sử dụng XSL (Extensible StyleSheet
Language) (www.interleaf.com). XSL là đặc tả
phân biệt mẫu tài liệu thông qua nội dung khi tạo

trang HTML hay XML. Đặc tả có tác dụng tương
tự mẫu định dạng (template), cho phép nhà thiết kế
áp dụng cùng một mẫu cho nhiều trang. XSL là đặc
tả kiểu thứ hai được W3C đưa ra sau CSS
(Cascading Style Sheet ố hệ thống qui định "kiểu
dáng" trang Web). Interleaf Composer/Styler là
một phần trong bộ sản phẩm BladeRunner được
Interleaf công bố vào tháng Sáu. BladeRunner có
thể định dạng cùng dữ liệu XML theo nhiều kiểu
khác nhau, phụ thuộc mẫu trang được áp dụng.
RightDoc () đưa ra
phiên bản RightDoc 2.0, đây là trình soạn thảo văn
bản XML, sử dụng XML và CSS như các định
dạng tập tin và cũng có thể xuất ra các định dạng
HTML, PDF (Portable Document Format) và
Postscript. Trình này sử dụng Query Designer để
tích hợp dữ liệu thông minh vào tài liệu dùng
ODBC (Open Database Connectivity), cho phép
nhập trực tiếp dữ liệu mới vào tài liệu.
General Magic (http://www. generalmagic.com)
sử dụng XML trong công nghệ xử lý tiếng nói
mang tên Kenya. Kenya dùng XML để lưu tham số
người dùng vào chương trình. Sau đó, chương trình
sẽ sử dụng những tham số này để gọi tới người
dùng và thông báo thông tin quan trọng trên Web.
Ví dụ, Kenya có thể gọi và báo cho người thắng
cuộc trên site bán đấu giá.
Sqribe Technologies (http://www. sqribe.com)
công bố sẽ sử dụng XML trong sản phẩm
ReportMart Enterprise Information Portal để tích

hợp các ứng dụng thứ ba (third-party applications)
và các nguồn dữ liệu trên qui mô xí nghiệp. Sản
phẩm đầu tiên sử dụng định dạng này là
RM/QuickConnect của Sqribe cho PeopleSoft.
RM/QuickConnect cung cấp một điểm truy nhập
duy nhất cho các báo biểu PeopleSoft cùng những
thông tin khác.
IPNet Solution ()
sử dụng XML trong các sản phẩm thương mại điện
tử xí nghiệp IPNet.Suite 3.0. Bộ sản phẩm này có
khả năng nhập, xuất dữ liệu XML, chuyển qua lại
giữa định dạng XML và các định dạng khác, hỗ trợ
DTD và dịch tự động XML thành HTML.
Cuối cùng là Blue World Communicarion
(http://www. blueworld.com) đã hỗ trợ XML trong
sản phẩm Lasso 3.5 Web Data Engine - sản phẩm
xây dựng ứng dụng Web hướng cơ sở dữ liệu. Các
thẻ Lasso sẽ được mã hoá theo cú pháp XML trong
phiên bản sắp tới.
Tìm thông tin về XML trên Web
• - Các bài báo và tin tức về
XML
• - World Wide Web
Consortium ố tổ chức đi đầu trong tiến trình
chuẩn hoá XML
• rosoft .com/xml - Web site
XML của Microsoft
• scape
.com/tech/metadata/index .html - trung tâm
phát triển meta-data và XML của Netscape

• tware .ibm.com/xml - Web site
XML của IBM
• repository .com - Web site sưu
tập công nghệ XML, trang thử nghiệm XML
và có thể tải xuống miễn phí.
Quốc Hùng
PCW Hồng Kông 08/1999
PcLeHoan 1996 - 2002
Mirror :
Mirror :
Mirror :
| Translations
Học XML với 10 điểm ghi nhớ
XML, XLink, Namespace, DTD, Schema, CSS,
XHTML Nếu bạn hoàn toàn chưa biết về XML,
bạn sẽ thấy khó vì không biết bắt đầu từ đâu. Bản
tóm tắt sau là 10 điểm giúp bạn nắm được đầy đủ
những khái niệm cơ bản cho phép người mới học
có khái niệm chung trước khi đi vào chi tiết. Và
nếu bạn nào đang chuẩn bị trình bày một bài tham
luận về XML, vậy thì tại sao lại không bắt đầu với
10 điểm này ?
1. XML được dùng để tạo cấu trúc dữ liệu
Dữ liệu này bao gồm bảng công tác, sổ địa
chỉ, các tham số cấu hình, giao dịch tài chính và vẽ
kỹ thuật. XML là một hệ thống các luật (có thể coi
là những hướng dẫn hay quy ước) dùng cho việc
thiết kế các format cho văn bản giúp bạn tạo cấu
trúc cho dữ liệu. XML không phải là ngôn ngữ lập
trình và bạn cũng không cần phải là một lập trình

viên để có thể học và sử dụng nó thành thạo. XML
giúp cho máy tính của bạn dễ dàng tạo dữ liệu, đọc
dữ liệu và làm cho cấu trúc dữ liệu của bạn trở nên
rõ ràng dễ hiểu. XML còn giúp bạn tránh được
những bẫy thông thường trong thiết kế ngôn ngữ:
nó có thể mở rộng, có platform hoàn toàn độc lập
và hỗ trợ tính quốc tế hoá và nội địa hoá. XML hỗ
trợ hoàn toàn Unicode.
2. XML có một số điểm giống với HTML
Tương tự HTML, XML cũng sử dụng các
tags (các từ được đặt trong ngoặc với '<' và '>') và
dùng thuộc tính (với mẫu name="value"). Trong
khi HTML đặc biệt chú ý tới từng tag và attribute
có ý nghĩa gì, và phần văn bản giữa các tag đó sẽ
hiển thị như thế nào trong trình duyệt thì XML sử
dụng các tag chỉ để phân định ranh giới giữa các
mẩu dữ liệu, và coi việc đọc và xử lý dữ liệu đó
hoàn toàn là nhiệm vụ của ứng dụng. Nói cách
khác, nếu bạn thấy "<p>" trong một file XML,
đừng cho rằng đó là ký hiệu của một đoạn. Tuỳ
thuộc vào văn cảnh, nó có thể là giá (price), một
tham số (a parameter), một người (a person), hay
một cái gì đó bắt đầu bằng chữ cái 'p' trong tiếng
Anh.
3. XML là một văn bản, nhưng không giống
những loại văn bản thông thường mà ta có thể
đọc được
Các chương trình dùng để tạo bảng công
tác, sổ địa chỉ, và các dữ liệu được cấu trúc hóa
thông thường lưu dữ liệu trên đĩa, sử dụng khuôn

dạng text hay nhị phân. Một thuận lợi của khuôn
dạng văn bản là cho phép người ta, nếu cần thiết,
có thể xem dữ liệu mà không cần phải có chương
trình đã tạo ra dữ liệu đó; nói cách khác, bạn có thể
đọc nó với bất kì bộ soạn thảo văn bản nào mà bạn
thích. Các khuôn dạng văn bản cũng cho phép
người ta tìm lỗi dễ dàng hơn trong các ứng dụng.
Giống như HTML, các file XML là những file văn
bản được tạo ra không phải với mục đích để đọc,
nhưng cũng không loại trừ trường hợp nếu cần thì
vẫn có thể đọc được. Tuy nhiên XML lại có điểm
không bằng HTML, các luật dùng trong file XML
rất hạn chế. Chỉ cần quên một tag, hay một thuộc
tính không đi kèm với nội dung (quots) sẽ làm cho
toàn bộ file XML đó ngừng hoạt động, trong khi ở
HTML những lỗi này có thể được bỏ qua. Bản ghi
XML chính thức không cho phép các ứng dụng tìm
hiểu đến lần thứ 2 nguyên nhân gây lỗi file XML;
nếu file bị lỗi ứng dụng đó ngừng hoạt động ngay
lập tức và báo lỗi.
4. XML is verbose by design
Vì XML là định dạng văn bản và nó sử
dụng tag để phân định từng chức năng trong dữ
liệu nên file XML hầu như luôn lớn hơn định dạng
nhị phân. Đó là chủ ý của người tạo ra XML.
Những điểm mạnh của định dạng văn bản đã được
nêu rõ (ở điểm 3), và những bất cập có thể được
đền bù ở mức độ khác. Đĩa với dung lượng lớn
ngày nay rẻ hơn trước kia, và các chương trình nén
như zip và gzip có thể nén file rất nhanh chóng và

chất lượng. Thêm vào đó, giao thức truyền thông
như HTTP/1.1, giao thức chính dùng trong web, có
thể nén dữ liệu nhanh chóng và ghi lại dải tần hiệu
quả như định dạng nhị phân.
5. XML is a family of technologies
XML 1.0 là một bản ghi định nghĩa về
"tags" và "thuộc tính". Trên XML 1.0, "the XML
family" là một bộ các module cung cấp các dịch vụ
hữu dụng để hoàn thành những nhiệm vụ yêu cầu
có tính chất thường xuyên và quan trọng. Xlink
được coi như một phương thức chuẩn để đưa các
liên kết siêu văn bản vào file XML. XPointer and
XFragments là những cú pháp để phát triển các
phần trong văn bản XML . XPointer có đôi chỗ
giống URL, nhưng thay vì tập trung vào văn bản
trên mạng, nó lại tập trung vào từng đoạn dữ liệu
trong file XML. CSS, the style sheet language, có
thể áp dụng được đối với XML giống như HTML.
XSL là một loại ngôn ngữ rất tiến bộ dùng cho style
sheets. Nó dựa trên XSLT, một loại ngôn ngữ
chuyển đổi sử dụng trong việc sắp xếp lại, thêm
vào và xoá đi một số tag và thuộc tính. DOM là
một bộ các chức năng chuẩn dùng cho thao tác file
XML (và HTML) từ một ngôn ngữ lập trình. XML
Schemas 1 và 2 giúp các nhà thiết kế định nghĩa
chính xác cấu trúc định dạng trên của chính họ.
Ngoài ra còn có một số module và công cụ khác
hay vẫn còn đang được phát triển. Xin các bạn đọc
thêm W3C's technical reports page.
6. XML is new, but not that new

Việc phát triển XML được bắt đầu năm
1996 và đã được W3C khuyến cáo sử dụng từ
tháng 2 năm 1998. Điều này có thể khiến bạn nghĩ
rằng, XML là công nghệ mới . Trên thực tế, công
nghệ này không còn là mới lạ. Trước XML cũng đã
có SGML, thiết kế vào đầu những năm 80, đạt tiêu
chuẩn ISO từ năm 1986 và được người ta sử dụng
rộng rãi trong những dự án lớn. HTML bắt đầu
được xây dựng từ năm 1990. Người tạo ra XML
đơn giản chỉ tận dụng những điểm mạnh của
SGML, cùng với kinh nghiệm có được từ HTML
đã tạo ra sản phẩm không thua kém gì SGML,
thêm vào đó nó rất thông dụng và dễ dùng. Tuy
nhiên có những phát triển trong công nghệ khiến
người ta khó phân biệt với cuộc cách mạng công
nghệ Và phải nói rằng trong khi SGML được sử
dụng chủ yếu trong các văn bản kỹ thuật, và cả
trong một số ít các loại dữ liệu khác thì XML lại
hoàn toàn ngược lại.
7. XHTML là sự kết hợp giữa XML và HTML
XML có một ứng dụng rất quan trọng đó
là khuôn dạng văn bản: XHTML của W3C, đây là
thế hệ tiếp sau của HTML. XHTML có nhiều điểm
chung với HTML. Tuy nhiên, trong cú pháp cũng
có một số thay đổi để phù hợp với các luật trong
XML. Một văn bản được tạo ra với XML sẽ mang
cấu trúc của XML và bị hạn chế ở một số phương
diện. (Ví dụ, XHTML cho phép "<p>", nhưng lại
không cho "<r>"); nó cũng bổ sung thêm ý nghĩa
cho cú pháp (XHTML qui định "<p>" là "đoạn văn

(paragraph)", chứ không phải "giá (price)", "người
(person)", hay bất cứ một cái gì khác).
8. XML is modular
XML cho phép bạn tạo ra một khuôn dạng
văn bản mới bằng cách kết hợp hay sử dụng lại các
khuôn dạng có sẵn. Do 2 khuôn dạng được phát
triển độc lập nên có thể xuất hiện những đặc tính
và thuộc tính có tên trùng nhau. Vì vậy phải thận
trọng khi kết hợp những khuôn dạng này với nhau
(nghĩa là "<p>" có thể là "paragraph" trong khuôn
dạng này nhưng lại là "person" trong khuôn dạng
kia. Để tránh nhầm lẫn tên khi kết hợp các khuôn
dạng với nhau, XML cung cấp cơ chế namespace.
XSL và RDF là những ví dụ điển hình của định
dạng XML có sử dụng namespace. XML Schema
được thiết kế để mirror hỗ trợ ráp modun ở mức tạo
cấu trúc văn bản XML, bằng cách tạo điều kiện dễ
dàng kết hợp 2 giản đồ để tạo ra cái thứ 3 có cấu
trúc văn bản kết hợp.
9. XML là cơ sở của RDF và Semantic Web
Khung miêu tả tài nguyên của W3C (RDF)
là một khuôn dạng văn bản XML hỗ trợ mô tả tài
nguyên và các ứng dụng metadata, ví dụ như danh
sách bản nhạc, bộ sưu tầm ảnh , sưu tầm thư mục.
RDF cho phép bạn nhận diện người trong album
ảnh web sử dụng thông tin từ danh sách liên lạc cá
nhân; sau đó chương trình nhận gửi thư sẽ tự động
gửi message đến những người này thông báo cho
họ biết ảnh của họ đang ở trên mạng. Cũng như các
văn bản tích hợp HTML, hệ thống menu, và ứng

dụng forms dùng để bắt đầu các Web gốc, ứng
dụng tích hợp RDF và các tác nhân trong Semantic
Web. Cũng giống như người ta cần có sự thống
nhất về ý nghĩa những từ họ sử dụng trong giao
tiếp, các máy vi tính cần có cơ chế thống nhất về ý
nghĩa các thuật ngữ để truyền đạt thông tin một
cách hiệu quả. Định nghĩa chính thức các thuật ngữ
trong một vài lĩnh vực (mua bán hay sản xuất)gọi
là bản thể học rất cần thiết trong Web Semantic.
RDF, bản thể học, và việc thể hiện ý nghĩa vì vậy
các máy tính có thể giúp người ta tiến hành công
việc của mình là toàn bộ nội dung hoạt động của
Semantic Web.
10. XML được sử dụng miễn phí, có platform
độc lập và được hỗ trợ rất tốt
Khi lựa chọn XML làm cơ sở để thực hiện
một dự án, bạn có thể tiếp cận với rất nhiều các
công cụ phát triển (một trong số đó đã có sẵn cái
bạn cần!) và người kỹ sư công nghệ đã có kinh
nghiệm trong lĩnh vực này. Lựa chọn XML có đôi
chút giống với chọn SQL cho cơ sở dữ liệu: bạn
vẫn phải xây dựng cơ sở dữ liệu cho mình và các
chương trình riêng cũng như phải có những qui tắc
để thao tác nó. Có rất nhiều công cụ có sẵn và bạn
cũng có thể dễ dàng nhận được sự giúp đỡ của
nhiều người. Và vì XML không cần phải mua bản
quyền mới sử dụng được nên bạn có thể tạo cho
mình một phần mềm riêng mà không phải trả một
khoản chi phí nào hết. Hỗ trợ mà lớn chứng tỏ rằng
bạn không có liên quan gì đến một vendor nào hết.

XML không phải lúc nào cũng là giải pháp tốt
nhất, nhưng nó luôn xứng đáng để người ta phải
xem xét.
W3C Communications Team,
Revised 13 Nov. 2001 (last update: $Date:
2001/12/20 10:34:31 $)
Created 27 Mar 1999 by Bert Bos
(Previous version)
Copyright © 1999-2000 W3C
®
( MIT, INRIA,
Keio), All Rights Reserved.
Để thấy ảnh hưởng rộng lớn của XML trong ngành
Công Nghệ Thông Tin cận đại bạn chỉ cần để ý
rằng XML là lý do của sự hiện hữu (raison d'être)
của Microsoft .Net. Từ WindowsXP trở đi, bên
trong đầy dẫy XML. Microsoft đã đầu tư hơn 3 tỷ
đô la Mỹ vào kỹ thuật nầy, và trong tương lai gần
đây tất cả phần mềm của Microsoft nếu không dọn
nhà (được ported) qua .NET thì ít nhất cũng
được .NET Enabled (dùng cho .NET được). Đi
song song với .NET là SQLServer 2000, một cơ sở
dữ liệu hổ trợ XML hoàn toàn.
Có lẽ bạn đã nghe qua Web Services. Đó là những
dịch vụ trên Web ta có thể dùng on-demand , tức là
khi nào cần cho chương trình của mình, bằng cách
gọi nó theo phương pháp giống giống như gọi một
Hàm (Function). Web Services được triển khai dựa
vào XML và Http, chuẩn dùng để gởi các trang
Web.

Điểm quan trọng của kỹ thuật XML là nó không
thuộc riêng về một công ty nào, nhưng là một tiêu
chuẩn được mọi người công nhận vì được soạn ra
bởi World Wide Web Consortium - W3C (một ban
soạn thão với sự hiện diện của tất cả các dân có
máu mặt trên giang hồ Tin học) và những ai muốn
đóng góp bằng cách trao đổi qua Email. Bản thân
của XML tuy không có gì khó hiểu, nhưng các
công cụ chuẩn được định ra để làm việc với XML
như Document Object Model - DOM, XPath, XSL,
v.v thì rất hữu hiệu, và chính các chuẩn nầy được
phát triển không ngừng.
Microsoft committed (nhất quyết dấn thân) vào
XML ngay từ đầu. Chẳng những có đại diện để làm
việc thường trực trong W3C mà còn tích cực đóng
góp bằng cách gởi những đề nghị. Vị trí của
Microsoft về XML là khi tiêu chuẩn chưa được
hoàn thành thì các sản phẩm của Microsoft tuân thủ
(comply) những gì có vẽ được đa số công nhận và
khi tiêu chuẩn hoàn thành thì tuân thủ hoàn toàn.
Cái công cụ XML sáng giá nhất của Microsoft là
ActiveX MSXML. Nó được dùng trong Visual
Basic 6, ASP (Active Server Pages) của IIS và
Internet Explorer từ version 5.5. Hiện nay MSXML
đã có version 4.0. MSXML parse (đọc và phân
tích) và validate (kiểm tra sự hợp lệ) XML file để
cho ta DOM, một tree của các Nodes đại diện các
thành phần bên trong XML. MSXML cũng giúp ta
dựa vào một XSL file để transform (biến thể) một
XML file thành một trang Web (HTML) hay một

×