Tải bản đầy đủ (.doc) (49 trang)

nghiên cứu ứng dụng dịch vụ web (web services) giải quyết bài toán về cung cấp dịch vụ hành chính công của hà nội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (298.12 KB, 49 trang )

ĐỀ TÀI
NGHIÊN CøU ỨNG DỤNG DỊCH VỤ WEB
(WEB SERVICES) GIẢI QUYẾT BÀI TOÁN VỀ CUNG
CẤP DỊCH VỤ HÀNH CHÍNH CÔNG CỦA HÀ NỘI
MỤC LỤC
Trang
1.TỔNG QUAN VỀ NGÔN NGỮ XML
1.1Khái niệm cơ bản
1.2Đặc điểm của XML
1.3XML được sử dông nh thế nào
1.4 XML được sử dụng trong lĩnh vực B2B
1.5 XML có thể được sử dụng để chia sẻ dữ liệu
1.6 XML mô tả dữ liệu cụ thể hơn
1.7 Một ví dụ về tệp XML
1.8 Cấu trúc tài liệu XML
1.8.1 XML hợp khuôn dạng
1.8.2 Quy tắc cú pháp ngôn ngữ XML
1.9 Định nghĩa kiểu tài liệu (Document Type define- DTD)
1.9.1 Các thành phần trong mét DTD
2. TỔNG QUAN VỀ DỊCH VỤ WED
2.1 Khái niệm
2.2 Nền tảng cơ bản của dịch vụ web
2.2.1 Khái niệm
2.2.2 SOAAP(simple Object Access Protocol)
2.2.3 Về vấn đề an ninh?
2.2.4 WSDL
2.2.5 UDDI
2.2.6 Những vấn đề còn tồn tại
3. NGHIÊN CỨU MỘT SỐ MÔ HÌNH ÁP DỤNG DỊCH VỤ WEB (WS)
TRÊN THẾ GIỚI
3.1 Sử dụng dịch vụ WS để tương hợp dữ liệu tại tổ chức Nông lương thế giới


FAO (Food and Agriculture Organization)
3.1.1 Tóm lược
3.1.2 Giới thiệu
3.1.3 Đặt vấn đề
3.1.4 Công việc liên quan
3.1.5 Cách tiếp cận
3.1.5.1 Kênh thông tin
3.1.5.2 Báo cáo sơ lược tiểu sử của quốc gia
3.1.6 Ví dụ
3.1.7 Các khía cạnh triển khai và đánh giá
3.1.8 Kết luận và các công việc tiếp theo
3.2. Các dịch vụ WS của Viamichelin
3.2.1 Chuẩn, mở và đa nền tảng
3.2.2 Tiêu chuẩn cho nội dung bản đồ
3.2.3 Dịch vụ hoàn mỹ có đảm bảo
3.2.4 Giải pháp lâu dài và hiệu quả về kinh tế
3.2.5 Các chức năng sẵn có
3.2.6 Các yêu cầu của hệ thống để truy cập và sử dụng các dịch vụ WS vủa
ViaMichelin :
3.2.7 Yêu cầu hệ thống để sử dụng ví dụ Java
3.2.8 Yêu cầu hệ thống để sử dụng ví dụ. NET
3.4 Sử dụng các dịch vụ WS cho việc tích hợp
3.4.1 Dịch vụ WS: Giảm giá thành cho việc tích hợp
3.4.2 Các giải pháp tích hợp ứng dụng mức xí nghiệp: Tích hợp mức xí nghiệp,
nhưng với giá nào?
3.4.3 Hỗ trợ sẵn các dịch vô WS
3.4.4 Đơn giản hóa việc tích hợp bằng sử dụng các giao diện dùa trên các chuẩn
mở
3.4.5 Tích hợp với các nghiệp vụ khác - Sau tường lửa
3.4.6 Việc triển khai tích hợp bằng dịch vụ WS vẫn còn nhiều thách thức

3.4.7 Các dịch vụ WS đáp ứng khả năng hoàn vốn đầu tư trong việc tích hợp
3.5 Ưu, nhược điểm khi sử dụng công nghệ dịch vụ WS
3.5.1 Bảo mật/ riêng tư
3.5.2 Định tuyến thông điệp, độ tin cậy/chất lượng dịch vụ, và xử lý giao dịch
3.5.3 Quản trị
CHUYÊN ĐỀ : TỔNG QUAN KIẾN TRÚC HỆ THỐNG
VÀ MÔ HÌNH ỨNG DỤNG DỊCH VỤ WEB (WEB SERVICES)
TRÊN THÕ GIỚI
1. TỔNG QUAN VỀ NGÔN NGỮ XML
1.1 Khái niệm cơ bản
XML là viết tắt của ‘eXtensible Markup Language’,được phát triển bởi
W3C ( Hiệp hội Web toàn cầu ). Phiên bản 1.0 được đưa ra vào tháng 2 năm
1998. XML thừa kế các chức năng của SGML và HTML. XML được biết tới
nh mét ngôn ngữ phù hợp hoặc cốt yếu cho thương mại điện tử ( tao đổi tài
liệu ). Bản thân XML là siêu ngôn ngữ và chỉ có cú pháp là được định nghĩa. Để
áp dụng XML, cần phải định nghĩa một số từ ngữ cà phần từ. Ngày nay, có
nhiều hoạt động để thiết lập các tiêu chuẩn họ XML ( các ngôn ngữ ), ví dụ, sơ
đồ XML ( định nghĩa cú pháp và cấu trúc tài liệu XML ), XSL ( ngôn ngữ bảng
tính kiểu XML), XSTL ( biến cố của XSL )v.v. Phần cuối của chương này là
giới thiệu sơ lược cú pháp XML
XML có thể xem là bổ túc cho những ứng dụng mới như các liên hệ với
địa điểm thị trường , chuyển vận các danh bạ điện tử, dùng các khả năng đa môi
trường trong các thông điệp,v.v.XML đặc biệt thích hợp cho một líp người
dùng, đối với họ EDI truyền thống là một công nghệ nặng nề để triển khai, líp
người này chính là líp đa số các doanh nghiệp vừa và nhỏ.
Các giải pháp trao đổi dữ liệu điện tử ( EDIFACT, EANCOM, ANSI
X12, CII, XML, ) đều dùa trên ba cơ sở :
- Một số tối thiểu các qui tắc sử dụng và cú pháp chung
- Một từ vựng duy nhất
- Các phương tiện kỹ thuật tương thích để trao đổi với nhau.

1
Một sè quy tắc sử dụng đã được nêu ở các phần trên. Phần này nhằm mục
đích cung cấp cho người đọc một số khái niệm mở đầu về cú pháp XML. Từ
vựng và các điều kiện kỹ thuật là những phương tiện để triển khai.
1.2 Đặc điểm của XML
- XML là tù do và mở rộng được. Trong XML các thẻ không
được định nghĩa trước mà do người dùng tự phát sinh ra thẻ.
- XML rất quan trọng đối với sự phát triển của web reong tương
lai
- Tầm quan trọng của XML đối với tương lai web cũng giống như
tầm quan trọng của HTML đối với nền tảng của web, và XML
sẽ là công cụ xử lý và truyền dữ liệu phổ biến nhất.
- XML là công cụ dùng được trên mọi nền phần cứng, độc lập với
phần cứng và phần mềm để truyền ( trao đổi, chia sẻ ) thông tin
1.3 XML được sử dông nh thế nào
- XML được thiết kế để lưu giữ, mang và trao đổi dữ liệu nhưng
không hiển thị dữ liệu
- XML dùng cho trao đổi dữ liệu
- Với XML có thể trao đổi dữ liệu giữa các hệ thống không tương
thích
- Trong thế giới thực, các hệ thống và cơ sở dữ liệu máy tính chứa
dữ liệu ở các dạng không tương thích.Một trong những thách
1.4 XML được sử dụng trong lĩnh vực B2B
Với XML, có thể trao đồi thông tin tài chính qua Internet. Ta sẽ thấy ngày
càng nhiều hệ XML và B2B ( Business To Business doanh nghiệp tới doanh
nghiệp) trong tương lai gần. XML sẽ là ngôn ngữ chính để trao đổi thông tin tài
chính giữa các doanh nghiệp qua Internet. Nhiều ứng dụng B2B thó vị đang
được phát triển.
1.5 XML có thể được sử dụng để chia sẻ dữ liệu
2

Với XML, các tệp văn bản thuần tuý có thể dùng để chia sẻ dữ liệu. Vì dữ
liệu XML được lưu dưới dạng văn bản thuần tuý, nên XML cung cấp một
phương pháp không phụ thuộc phần cứng và phần mêm để chia sẻ dữ liệu. Nó
cho phép tạo nên một cách dễ dàng hơn, dữ liệu mà nhiều ứng dụng khác nhau
có thể làm việc được. Nó cũng dễ dàng mở rộng hay nâng cấp một hệ thống lên
hệ điều hành mới, và trình duyệt mới.
XML có thể dùng để lưu trữ dữ liệu. Với XML, các tệp văn bản thuần tuý
có thể dùng để lưu trữ dữ liệu. XML có thể dùng để lưu trữ dữ liệu trong tệp tin
hay trong các cơ sở dữ liệu. Các ứng dụng có thể cất giữ hay lấy dữ liệu ở nơi
lưu trữ, và các ứng dụng bình thường có thể dùng để hiển thị.
1.6 XML mô tả dữ liệu cụ thể hơn
Với XML, dữ liệu dùng được với nhiều người hơn. Vì XML độc lập đối với
phần cứng, phần mềm và ứng dụng, ta có thể khiến dữ liệu của mình dùng được
không chỉ đối với trình duyệt HTML tiêu chuẩn.
Các khách hàng và ứng dụng có thể truy cập tệp XML nh là nguồn dữ liệu,
giống nh khi truy cập có sở dữ liệu. Dữ liệu có thể đọc được bởi mọi loại “ máy
moc” (tác nhân), và người mù, người tàn tật có thể dễ dàng đọc được dữ liệu.
XML có thể dùng để tạo ra các ngôn ngữ mới: XML là mẹ đẻ của WAP và
WML. Ngôn ngữ Đánh dấu không dây (Wireless Markup Language WML), sử
dụng cho các ứng dụng Internet đánh dÊu cho các thiết bị cầm tay nh điện thoại
di động, được viết bằng XML. Nếu người phát triển có ý thức, thì tất cả các ứng
dụng tương lai sẽ trao đổi dữ liệu XML.
Tương lai có thể sẽ có các trình xử lý V#n b#n, bảng tính và cơ sở dữ liệu
có thể đọc được dữ liệu của nhau ở dạng văn bản thuần tuý, không cần bất kỳ
tiện Ých chuyển đổi nào.
1.7 Một ví dụ về tệp XML
Dữ liệu của một thông điệp thư tín của Jim gửi Tom, dưới dạng XML,
được viết nh sau:
< ?xml version = “1.0” encoding = “ISO – 8859-1.?>
3

<message>
<to> Tom </ to>
< from> Jim </from> <heading> Reminder </heading?
<body> Please call me this weekend ! </body>
</message>
<?xml: Khai báo XML: Khai báo một tài liệu XML
Encoding = “ISO – 8859 – 1” định nghĩa bảng mã hoá ký tự dùng trong
tài liệu < message> mô tả phần tử gốc của tài liệu
Các dòng tiếp theo mô tả các phần tử con của phần tử “ thông điệp”
</ message> định nghĩa kết thúc của phần tử gốc
Phần tử: định dạng chung <thẻ> nội dung </thẻ>
1.8 Cấu trúc tài liệu XML
Có 2 dạng XML: XML hợp khuôn dạng và XML hợp lệ.
a) XML hợp khuôn dạng (well – formed document)
Để hợp khuôn dạng, một tài liệu XML cần phải tuân theo quy tắc cú pháp
thiết lập cho XML bởi tổ chức quốc tế W3C.
- Khai báo XML
- Dữ liệu XML
b) XML hợp lệ (Valid document)
Hầu hết các trình duyệt trước hết kiểm tra xem tài liệu XML có hợp lệ
khuôn dạng không. Tiếp theo mét vài ntrinhf duyệt có ntheer kiểm tra thêm tính
hợp lệ của tài liệu. Một tài liệu XML được gọi là hợp lệ khi nó được kết hợp với
định nghĩa kiểu tư liệu ( Document Type Definition DTD) và tuân theo tiêu
chuẩn DTD.
- Khai báo XML
- DTD
- Dữ liệu XML
Mét DTD định nghĩa các phần tử hợp lệ của một tài liệu XML. Mục đích
của DTD là định nghĩa các khối hợp lệ nên một tài liệu XML. Nó định ra phần
4

tử và cấu trúc cây phần tử của dữ liệu. DTD không phải là bắt buộc. Nếu không
có DTD, chỉ cần nhận dạng cấu trúc thẻ.
1.8.1 XML hợp khuôn dạng
Nh trên đã nói, nội dung tài liệu XML bị ràng buộc bởi 2 tính chất: hợp
khuôn dạng và hợp lệ. Tài liệu được coi là hợp khuôn dạng khi theo đúng các
bước thiết kế và xây dựng XML do W3C đưa ra. Nói chung là tuân theo đúng
cú pháp khi khai báo thẻ XML và tuân theo cách đặt các thẻ XML theo một trật
tự có thể phân tích được bởi các bộ phân tích.
Các phần tài liệu của XML được gọi là các thực thể. Một thực thể XML có
thể là dữ liệu văn bản dữ liệu nhị nhân nhưng không được cả hai. Một thực thể
có thể tham chiếu đến một thực thể khác và có thể dùng để phân tích hoặc làm
dữ liệu thông thường không dùng cho mục đích phân tích.
1.8.2 Quy tắc cú pháp ngôn ngữ XML
Các khai báo XML cần được đặt ở dòng đầu tiên của tài liệu.
Mọi phần tử XML đều phải có thẻ đóng :/>
Tất cả các tài liệu XML phải có thẻ gốc trong đó thẻ đầu tiên trong một tài
liệu XML là thẻ gốc.
Mọi tài liệu XML phải có một cặp thẻ đơn để định nghĩa phần tử gốc. Các
phần tử khác được lồng vào trong thẻ gốc. Tất cả các phần tử có thể có phần tử
con, các phần tử con phải được lồng đúng phần tử cha.
Các thẻ XML phân biệt hoa thường
Các giá trị thuộc tính phải luôn luôn đặt trong ngoặc kép
Chú thích trong XML: Cú pháp chú thích trong XML tương tù nh trong
HTML  <!- This is a moment
Với XML, khoảng trắng được giữ lại
Với XML, cặp CR/LF chuyển thành LF. Với XML, một dòng luôn được lưu
trữ nh mét ký tù LF.
Trong các ứng dụng Windows, một dòng văn bản mới thường được lưu trữ
nh là một cặp ký tù CR/LF (carriage return/Line feed). Trong các ứng dụng
5

Unix, một dòng mới thường được lưu trữ nh mét ký tù LF. Các ứng dụng
Macintosh chỉ dùng một ký tù CR để lưu trữ một dòng mới.
1.9 Định nghĩa kiểu tài liệu (Document Type define- DTD)
Mét tài liệu XML được xem là hợp lệ và có giá trị khi toàn bộ các phần tử
trong tài liệu được định nghĩa kiểu mà nó sẽ chứa. Việc định nghĩa kiểu cho các
phần tử thẻ gọi là định nghĩa kiểu tài liệu.
Với DTD, mỗi tệp XML tù mang miêu tả về định dạng của chính nã.
Với DTD, các nhóm người khác nhau có thể đồng ý sử dụng một DTD
chung để trao đổi.
ứng dụng có thể dùng một DTD chuẩn để kiểm chứng dữ liệu nó nhận từ
bên ngoài có hợp lệ hay không
DTD có thể khai báo bên trong tài liệu XML hoặc tham chiếu bên ngoài.
Khai báo DOCTYPE bên trong
Nếu DTD được bao gồm trong tệp XML, có thể gói nó trong một định
nghĩa DOCTYPE với cú pháp nh sau:
< ! DOCTYPE root-element [element - declarations ]>
Khai báo DOCTYPE bên ngoài
Nếu DTD bên ngoài tệp nguồn XML, có thể gói nó trong một định nghĩa
DOCTYPE với cú pháp nh sau:
< ! DOCTYPE root-element SYSTEM “filename”>
Nhìn từ góc độ DTD, mọi tài liệu sl được tạo nên từ các khối xây dựng sau
đây:
Phần từ Thẻ: Các thẻ được dùng làm phần tử đánh dấu. Thẻ bắt đầu
<element_name> đánh dấu điểm bắt đầu của một phần tử, và thể kết thúc
</element_name> đánh dấu kết thúc của phần tử.
Ví dô: <to>Tom</to>, <body>Don’t forget me this weekend!</body>
Thuốc tính: các thuộc tính định nghĩa thuộc tính của các phần tử.
Thực thể: các thực thể là các biến dùng để định nghĩa lối tắt cho văn bản
bình thường.
6

PCDATA: PCDATA nghĩa là kiểu dữ liệu của phần tử là ký tù đã phân
tách.
CDATA: CDATA nghĩa là kiểu dữ liệu của phàn tử là ký tù.
1.9.1 Các thành phần trong mét DTD
Trong DTD, loại hoặc cấu trúc của phần tử XML được khai báo bằng một
khai báo phần tử. Khai báo phần tử có cú pháp nh sau:
<!ELEMENT element-naame category>
EMPTY(#PCDATA)ANY
hoặc
<!ELEMENT element-name (element-content)>
Child-element-name, (sequence)
Child-element-name
Child-element-name+
Child-element-name*
Child-element-name?
Child-element-name/ Child-element-name
(mixed)
2. TỔNG QUAN VỀ DỊCH VỤ WED
2.1 Khái niệm
1. Mét dịch vô wed WS (Wed Service) hay còn được gọi là WS là một ứng
dụng lập trình có thể truy nhập được mét cách logic thông qua việc sử dụng các
giao thức chuẩn Internet. WS tập hợp các khía cạnh tốt nhất của việc phát triển
dùa trên các thành phần và Web. Như nhứng thành phần, WS đưa ra chức năng
hộp đen có thể được sử dụng lại mà không cần phải o lắng về việc dịch vô đó
được triển khai như thế nào. Không giống như những công nghệ thành phần hiện
hanh, WS không truy nhập được thông qua các giao thức đặc chủng về mô hinh
hướng đối tượng, như DCOM (Distributed Component Object Model), RMI
(Remote Method Invocation) hoặc IIOP (Internet Inter-Orb Protocol). Thay vào
7
đó, WS truy nhập được thông qua các giao thức của Web (HTTP) và các định

dạng dữ liệu (XML)
Cơ sở cho các dịch vụ WS:
Xuất bản, Tìm kiếm, Sử dụng các dịch vụ: UDDI
Mô tả dịch vụ một cách chính xác thức: WSDL
Giao tiếp dịch vụ: SOAP
Định dạng dữ liệu tổng hợp: XML
Giao tiếp thông thường: Internet
Đơn giản, Mở, Hỗ trợ rộng rãi
2. WS là một “việc lớn” tiếp theo trong phát triển phần mềm. WS sẽ thay
đổi hoàn toàn cách tiến hành nghiệp vụ, khác xa so với ảnh hưởng mà chúng ta
thấy với thương mại điện tử. WS sử dụng những gì mà HTML va TCP/IP đã có,
cộng thêm vào đó thành phần XML để cho phép các dịch vụ tập trung vào các
tác vụ sao cho chúng làm việc một cách chủ động với nhau thông qua Internet.
3. WS là “những thư viện” cung cấp dữ liệu và dịch vụ cho các ứng dụng
khác trên Web thông qua một tập hợp nhất quán các giao diện và giao thức.
4. WS là một phát kiến mới của ứng dụng Web. Chúng là các ứng dụng
theo module có khả năng tự mô tả theo cách có thể được phát tán, định vị và loại
bỏ thông qua Web. WS thực hiện các chức năng có thể là bất cứ thứ gì, từ các
ứng dụng khác (và các WS khác) có thể phát hiện ra và gọi tới dịch vô đã được
triển khai đó.
5. WS là một khái niệm đang được sử dông để xác định mét tập hợp các
công nghệ đưa ra chức năng của nghiệp vụ trên Web nh mét tập hợp các giao
diện tù động. Các giao diện tù động này cho phép các nghiệp vụ tìm ra và gắn
với các giao diện ở chế độ thời gian thực, giúp làm tối thiểu hoá mọi sự chuẩn
bị, cần thiết bằng các công nghệ tích hợp khác.
6. SOAP và XML là các công nghệ lõi của kiến trúc WS
7. WS và việc tích hợp ứng dụng mức xí nghiệp EAI (Enterprise
Application Integration) đôi khi bị hiểu nhầm là nh nhau. Tuy nhiên, EAI có xu
8
hướng thiên về đặc trng co mét qui trình nghiệp vụ cụ thể, như việc kết nối một

ứng dụng xử lý đơn hành với một ứng dụng kiểm kê kho hàng chẳng hạn. Hơn
nũa, EAI được thiết kế chủ ý nh mét triển khai gắn chặt với các hệ thống kết nối.
WS thì không gắn chặt với hệ thống mà chúng dễ dàng được gắn vào hoặc loại
bỏ, tìm ra để gắn vào hệ thống một cách chủ động.
8. Để tổng kết, có thể nói một WS là:
a) Một ứng dụng lập trình, truy nhập được như mét thành phần thông qua
các giao thức chẩn của Web.
b) Sử dụng các giao thức chuẩn của Web nh HTTP,XML và SOAP
c) Làm việc xuyên qua các tường lửa và Proxy
d) Có thể lợi dông được việc xác minh của giao thức HTML
e) Mã hoá tự do với SSL
f) Dễ kết hợp với các giải pháp thông điệp XML hiện có
g) Lợi dụng mô hình thông điệp XML và dễ dàng chuyển đổi từ các giải
pháp XML RPC
h) Không xung đột với các giải pháp dùa trên các thành phần thương amij
nh CORBA và COM
i) Kết hợp các khía cạnh tốt nhất của việc phát triển dự tên thành phần và
Web
j) Sẵn sàng đối với các nền tảng máy trạm khác nhau (không phụ thuộc nền
tảng)
9. Có thể nói, một WS là một ứng dụng có thể gọi được trên Web thông qua
việc sử dụng các chuẩn nh SOAP trên HTTP.
2.2 Nền tảng cơ bản của dịch vụ web
2.2.1 Khái niệm
1. Dịch vụ WS cũng có thể được nói một cách khác là các khối cơ bản được
xây dùng để di chuyển trong hệ thống máy tính phân tán trên Internet. Các
chuẩn mở và việc tập trung vào giao tiếp và làm việc cộng tác giữa con người và
các ứng dông đã tạo nên một môi trưởng nơi mà WS đang trở thành nền tảng
9
cho việc tích hợp ứng dụng. Các ứng dông được xây dựng các WS các loại từ

nhiều nguồn khác nhau làm việc cùng với nhau bất kể là chúng ở đâu hoặc
chóng đã được triển khai nh thế nào.
2. Có thể có các định nghĩa khác nhau WS khi các công ty xây dựng chúng,
nhưng hầu hết tất cả các định nghĩa đều có chung ác điểm sau:
a) WS đưa ra chức năng hữu dụng cho người sử dụng Web thông qua mét
giao thức chuẩn Web. Trong hầu hết các trường hợp, giao thức được sử dông đó
là SOAP
b) WS đưa ra cách mô tả các giao diện của chúng một cách đủ chi tiết nhằm
cho phép người sử dụng xây dựng một ứng dụng máy trạm để giao tiếp được với
chúng. Mô tả WS-WSDL (Web Services Description Language).
c) WS được đăng ký sao cho các khách hàng tiềm năng là người sử dụng có
thể tìm thấy chúng một cách dễ dàng. Điều này được thực hiện với UDDI
(Universal Disscovery Desscription and Integration).
3. Câu hái đặt ra là vì sao chóng ta lại phải quan tâm tới WS. Mét trong
những ưu điểm đầu tiên của kiến trúc WS là nó cho phép các chương trình được
viết bằng các ngôn ngữ khác nhau trên các nền tảng khác nhau giao tiếp được
với nhau dùa trên một nền tảng tiêu chuẩn.
4. Ta có thể nhận thấy việc triển khai SOAP ở nhiều công ty phần mềm lớn,
nhưng ta cũng còn thấy nhiều triển khai được xây dựng và duy tric bởi chỉ một
nhà lập trình phát triển. Ưu điểm đáng kể khác mà WS hơn những thứ trước đó
là chúng làm việc với các giao thức chuẩn Web – XML, HTTP và TCP/IP. Có
một số lượng đáng kể các công ty đã có kiến trúc Web, và mọi người đều hiểu
biết và có kinh nghiệm trong việc duy trì nó và giá để đưa WS vào hệ thống nh
vậy là nhỏ hơn đáng kể so với các công nghệ trước đây.
5. WS nh mét dịch vụ phần mềm được trình bày trên Web thông qua giao
thức SOAP, được mô tả bằng một tệp WSDL và được dăng ký trong UDDL.
Các dịch vụ WS là nguồn thông tin mà ta có thể dễ dàng kết hợp vào các ứng
dụng. Dễ dàng nhận ra toàn bộ líp ứng dụng có thể được xây dùng để phân tích
10
và tích hợp thông tin ta quan tâm và trình bày nó theo nhiều cách khác nhau. Ví

dụ, ta có thể để mét bảng tính trong MS Excel tổng kết toàn bộ bức tranh tài
chính - chứng khoán, các tài khoản ngân hàng, các khoản vay nợ… Nếu các
thông tin này sẵn sàng thông qua các dịch vụ WS, Excel có thể cập nhật nó liên
tục. Một vài thông tin trong số này có thể xem tù do và một vài cần phải thông
qua việc thuê bao dịch vụ. Hầu hết các thông tin này là sẵn có trên Internet,
nhưng WS sẽ làm cho việc truy cập chúng dễ dàng hơn và đáng tin cậy hơn.
6. Việc trình bày các ứng dông đang có như các dịch vụ WS cho phép
người sử dụng xây dựng các ứng dụng có các tính năng mạnh ôưn thông qua
việc sử dụng WS như những Block được xây sẵn. Ví dụ, người sử dụng có thể
phát triển một ứng dụng mua bán để tù động lấy các thông tin về giá cả từ nhiều
nhà cung cấp khác nhau, cho phép người dùng chọn một nhà cung cấp, chuyển
đơn hàng và sau đó theo dõi việc chuyển hàng cho tới khi nhận được hàng. ứng
dụng của các nhà cung cấp, khi trình bày các dịch vụ của họ trên Web, có thể
quay ra sử dụng các dịch vụ WS để tăng kiểm tra tín dụng của khách hàng, lấy
tiền từ tài khoản của khách hàng và thiết lập viẹc chuyển hàng với một công ty
vận tải.
7. Trong tương lai, sẽ có những dịch vụ WS hỗ trợ các ứng dụng sử dụng
Web để làm mét điều gì đó mà hiện nay ta không thể thực hiện được. Ví dụ,
một trong các dịch vụ mà WS có thể thực hiện là dịch vô đặt lịch. Nếu bác sĩ
nha khoa và kỹ thuật viên cơ khí trình bày lịch của họ thông qua dịch vụ WS
này, ta có thể đặt trước lịch cho các cuộc gặp gỡ với họ một cách trực tuyến
hoặc họ có thể đặt thời gian cho cuộc gặp để chữa răng hay bảo hành thiết bị
trực tiếp trên lịch của ta nếu ta muốn. hãy tưởng tượng, ta có thể hình dung hàng
trăm ứng dụng có thể xây dựng một khi ta có khả năng lập trình trên Web.
2.2.2 SOAAP(simple Object Access Protocol)
1. SOAP là giao thức giao tiếp cho các dịch vụ WS. Vì SOAP được mô tả
nh mét giao thức giao tiếp, hầu hết tất cả mọi người đều nghĩ về DCOM hoặc
CORBA và bắt đầu hái những câu hái đại loại nh “ làm thế nào để SOAP kích
11
hoạt đối tượng?” họăc “ dịch vô đặt tên nào SOAP sử dụng”. SOAP là mét đặc

tả kỹ thuật xác định định dạng XML cho các thông điệp. Nếu ta có mét đoạn
XML được xây dựng tốt nằm trong một vài thành phần của SOAP thì chính là ta
có một thộng điệp SOAP.
2. Có các thành phần khác của đặc tả SOAP mô tả cách trình bày dữ liệu
chượng trình dạng XML và sử dụng SOAP cho thủ tục gọi từ xa. Những thành
phần có thể lùa chọn này của đặc tả kỹ thuật được sử dông để triển khai các ứng
dụng kiểu RPC nơi mà một thông điệp SOAP chứa một hàm goi và các tham sè
để tạo ra các chức năng được gửi từ máy trạm và máy chủ trả về một thông điệp
với kết quả hàm được chạy. Hầu hết các triển khai hiện hành của SOAP hỗ trợ
các ứng dụng RPC vì các lập trình viên sử dông để tạo các ứng dụng COM hoặc
CORBA điều khiển RPC. SOAP còn hỗ trợ các ứng dụng kiểu văn bản nơi mà
các thông điệp SOAP chỉ là vỏ bọc xung quanh mét văn bản XML. Các ứng
dụng SOAP kiểu văn bản là rất mêm dẻo và nhiều dịc vụ WS tận dụng tính mềm
dẻo này để xây dựng các dịch vụ có thể khó triển khai sử dụng RPC ( Remote
procedure Calling Protocol).
3. Phần lùa chọn cuối cùng của đặc tả SOAP xác định mét thông điệp
HTTP chứa một thông điệp SOAP thì sẽ nh thế nào. Phần HTTP là quan trọng
vì HTTP được hỗ trợ bởi hầu hết tất cả các hệ điều hành hiện hành. Phận HTTP
này là một lùa chọn nhưng hầu hết tất cả các triển khai SOAP đều hỗ trợ nó bởi
vì chỉ có nó là giao thức được tiêu chuẩn hoá cho SOAP. Vì vậy, có một sự hiểu
lầm là SOAP đòi hỏi phải có HTTP. Một vài triển khai hỗ trợ MSMQ, MQ
serrierm, SMTP hoặc TCP/IP, nhưng hầu hết tất cả các dịch vụ WS hiện hành sử
dụng HTTP vì nó thông dụng. Vì HTTP là một giao thức cốt lõi của Web, hầu
hết các tổ chức có nền tảng mạng hỗ trợ HTTP và mọi người hiểu cách quản trị
nó. Tính an toàn, việc theo dõi và nền tảng cân bằng tải cho HTTP là đã sẵn
sàng hiện nay.
4. Nguồn gốc chính của sự nhầm lẫn khi bắt đầu với SOAP là sự khác biệt
giữa các đặc tả của SOAP và nhiều triển khai của các đặc tả kỹ thuật SOAP.
12
Nhiều người sử dụng SOAP không viết các thông điệp SOAP trực tiếp mà sử

dụng một bộ cộng cụ SOAP để tạo ra và làm trình biên dịch cho các thông điệp
SOAP. Những bộ công cụ này thường dịch các hàm gọi từ một vài dạng ngôn
ngữ tới dạng thông điệp SOAP. Ví dụ, bộ công cụ MS SOAP 2.0 dịch hàm
COM gọi tới SOAP và bộ công cụ Apache Tooolkit dịch hàm JAVA gọi SOAP.
Các loại chức năng gọi và các dạng dữ liệu của các tham sè được hỗ trợ khác
nhau đối với từng triển khai SOAP vì thế một hàm làm việc với một bộ công cụ
này có thể làm việc với bộ kia. Đây không phải là một hạn chế của SOAP mà là
đơn giản là của một khai triển đặc biệt nào đó mà ta đang sử dụng.
5. SOAP có thể sử dông để liên kết các hệ thống tạp nham khác nhau bên
trong và không cần tổ chức của bạn. Có rất nhiều cố gắng được thực hiện trong
quá khứ để có một giao thức giao tiếp chung có thể sử dông được cho việc tích
hợp hệ thống, nhưng không có cách nào trong sè đó có được ứng dụng rộng rãi
nh với SOAP. Vì sao vậy? Vì SOAP nhá hơn và đơn giản hơn nhiều khi triển
khai so với nhiều giao thức trước đó. DCE (Distributed Computing
Envirinment) và CORBA (Common Object Request Broker Arrchiture) là
những ví dụ- có nhiều năm được tiến hành thực hiện, nhưng chỉ một vài triển
khai là được tung ra thành công. Tuy nhiên, SOAP có thể sử dụng bộ biên dịch
XML và các thư viện hiện hành để thay thế hầu hết các công việc nặng nhọc, vì
thế một triển khai SOAP có thể hoàn tất trong một tháng. Điều này giải thích vì
sao có nhiều triển khai SOAP đang tồn tại.
6. Tính phổ dụng của HTTP và sù đơn giản của SOAP làm cho chúng trở
thành nền tảng lý tưởng cho việc triển khai dịch vụ WS và chúng có thể được
gọi từ hầu hết mọi môi trường.
2.2.3 Về vấn đề an ninh?
1. Mét trong những câu hái đầu tiên đối với một người mới làm việc với
SOAP là SOAP làm việc nh thế nào với vấn đề an ninh? Khi mới được phát
triền, SOAP được xem nh là một giao thức dùa trên HTTP người ta giả định là
an ninh HTTP có thể tương xứng đối với SOAP. Cuối cùng, có hàng ngàn ứng
13
dụng Web chay hôm nay sử dụng an ninh HTTP nên chắc chắn điều này là

tương xứng với SOAP. Vì láy do này, chuẩn SOAP hiện hành giả thiết vấn đề an
ninh là một vấn đề về truyền tải.
2. Khi SOAP được mở rộng và trở thành một giao thức đa mục đích chạy
bên trên phần truyền tải thì an ninnh trở nên là một vấn đề lớn hơn. Ví dụ, HTTP
cung cấp nhiều cách để xác thực xem người sử dụng nào đang thức hiện một lời
gọi SOAP, nhưng làm cách nào để làm cho việc xác thực này có thể truyền tải
được khi thông điệp được định tuyến từ HTTP tới một truyền tải SMTP? SOAP
được thiết kế nh mét giao thức được xây dựng dưới dạng block, vì thế rất may là
có sẵn các đặc tính kỹ thuật khi xây dựng trên SOAP cung cấp các tính năng an
ninh bổ sung cho các dịch vụ Web.
2.2.4 WSDL
1. WSDL là chữ viết tắt của ngôn ngữ mô tả dịch vụ Web- Web Services
Description Language. Ta có thể nói rằng một tệp WSDL là một văn bản XML
mô tả một tập hợp các thông điệp SOAP và cách mà các thông điệp trao đổi với
nhau. Nói cách khác, WSDL đối với SOAP nh là một IDL (Interface Definition
Language) đối với CORBA hoặc COM (Component Object Model). Vì WSDL
là XML, nó có thể đọc được và sửa chữa được nhưng trong nhiều trường hợp, nã
được tạo ra và sử dụng bởi phần mềm.
2. Để xem giá trị của WSDL, hãy mường tượng là ta muốn bắt đầu gọi một
phương thức SOAP được cung cấp bởi một trong các đối tác. Ta có thể hỏi anh
ta về một vài thông điệp SOAP đơn giản và viết ứng dụng của ta nhằm tạo ra và
sử dụng các thông điệp giống như các ví dụ, nhưng nó có thể còn có lỗi. Ví dụ,
ta có thể thấy một mã khách hàng là 2837 và giả thiết đây là một số nguyên khi
trong thực tế nó là một chuỗi ký tù. WSDL xác định mét thông điệp yêu cầu
chứa cái gì và thông điệp trả lời sẽ được nhìn như thế nào trong những ký hiệu
rất rõ ràng.
3. Những ký hiệu mà một tệp WSDL sử dông để mô tả các định dạng thông
thông điệp dùa trên chuẩn của mô hình XML có nghĩa là nó có tính trung tính
14
với ngôn ngữ lập trình và vừa dùa trên tiêu chuẩn tạo nên tính phù hợp cho việc

mô tả các giao diện dich vô WS truy nhập từ các nền tảng khác nhau và từ các
ngôn ngữ lập trình khác nhau. Hơn nữa, để mô tả nội dung các thông điệp,
WSDL xác định nơi mà dịch vụ sẵn sàng và giao tiếp nào được sử dông để nói
chuyện được với dịch vô. Điều này có nghĩa là tệp WSDL xác định mọi yêu cầu
để viết một chương trình làm việc với dịch vụ WS. Có vài công cụ sẵn có để đọc
mét tệp WSDL và tạo ra các mã theo yêu cầu để giao tiếp với một dịch vụ WS.
4. Nhiều bộ công cụ SOAP hiện hành cho phép tạo các tệp WSDL từ giao
diện chương trình hiện hành, nhưng cũng có một số Ýt công cụ cho phép viết
WSDL trực tiếp. Ngày nay, có thể nói WSDL sẽ trở thành cách ưu điểm trong
việc tạo ra các giao diện SOAP cho dịch vụ WS.
2.2.5 UDDI
1. Tích hợp và mô tả trình bày tổng hợp UDDI (Universal Discovery
Desscription and Integration) là các trang vàng của dịch vụ WS. Giống nh các
trang vàng truyền thống, ta có thể tìm một công ty chào các dịch vụ ta cần, đọc
về những thứ mà dịch vô đưa ra phục vụ và liên hệ với ai đó để tìm hiểu thêm
các thông tin liên quan. Tất nhiên, ta có thể mở một thương vô trong tầng hầm
của ta và dùa trên quảng cáo bằng lời truyền miệng nhưng nếu ta muốn có được
mét thị trường đáng kể, ta cần có UDDI so cho các khách hàng của ta có thể tìm
thấy ta.
2. Một nội dung thư mục UDDI là một tệp XML mô tả một nghiệp vụ và
các dịch vụ nó chào. Có 3 phần đối với một nội dung trong thư mục UDDI đó. “
Trang trắng” mô tả công ty chào dịch vụ: tên, địa chỉ, các thông tin liên hệ,…
“Trang vàng” bao gồm các chủng loại công nghệ dùa trên các nguyên tắc phân
loại tiêu chuẩn nh Hệ thống phân loại công nghệ Bắc Mỹ chẳng hạn. “ Trang
xanh” mô tả giao diện đối với dịch vụ một cách đủ chi tiết cho ai đó có thể viết
một ứng dụng sử dụng dịch vụ WS này. Cách thức mà các dịch vô được xác
định là thông qua mét văn bản UDDI gọi là kiểu dạng (Type Model) hoặc là
Tmodel. Trong nhiều trường hợp, Tmodel này chứa một tệp WSDL mô tả giao
15
diện SOAP đối với một diịch vụ WS, nhưng Tmodel còng đủ mềm dẻo để mô tả

hầu hết mọi dạng dịch vụ.
3. Thư mục UDDI cũng có một vài cách để tìm kiếm những dịch vô mà ta
cần để xây dựng các ứng dụng ta cần. Ví dụ, ta có thể tìm các nhà cung cấp của
một dịch vụ tromg mét khu vực địa lý cụ thể nào đó sẽ cung cấp của một dạng
đặc biệt nào đó. Thư mục UDDI sau đó sẽ cung cấp các thông tin, các mối liên
hệ, các đường kết nối và các dữ liệu kỹ thuật để cho phép ta đánh giá những
diochjvụ nào đó đáp ứng được yêu cầu của ta.
4. UDDI cho phép ta tìm kiếm các nghiệp vụ mà từ đó ta có thể có được các
dịch vụ WS. Ta sẽ không thể biết được sẽ tiến hành công việc với ai nếu ta
không biết dịch vụ nào sẽ được đưa ra? Đặc tả kỹ thuật kiểm soát dịch vụ WS
cho phép ta xem xét một tập hợp các dịch vụ WS được đưa ra trên một máy chủ
đặc biệt để tìm ra những dịch vụ nào ta có thể cần tới.
2.2.6 Những vấn đề còn tồn tại
1. Cho tới giê ta đã nói về cách nói chuyện với các dịch vụ WS ( SOAP) ,
cách mà các dịch vụ WS được mô tả (WSDL) và cách tìm kiếm các dịch vụ WS
(UDDI). Những thứ này là một tập hợp các đặc tả kỹ thuật cơ bản cung cấp cho
việc tích hợp và tập hợp các ứng dụng. Từ những đặc tả kỹ thuật cơ bản này, các
công ty xây dựng nên các giải pháp thực và thu được những giá trị thực từ
chúng.
2. Trong khi rất nhiều công việc đã được thực hiện để làm cho các dịch vụ
WS trở nên hiện thực, vẫn còn nhiều thứ cần có thêm. Ngày nay, mọi người
thành công với các dịch vụ WS, nhưng vẫn còn nhiều thứ còn là thử nghiệm đối
với các nhà lập trình phát triển như các vấn đề an ninh, quản lý hoạt động, hệ
thống thông điệp đáng tin cây. Kiến trúc các dịch vụ WS sẽ giúp cho các dịch vụ
WS ở mức tiếp theo thông qua việc cung cấp một mô hình mục tiêu chung, chặt
chẽ vho việc bổ sung những khả năng cao cấp mới đối với các dịch vụ WS dạng
module và ngày càng được mở rộng.
16
3. An ninh WS là một trong những đặc tả kỹ thuật trong kiến trúc dịch vụ
WS toàn cầu. Quản lý hoạt động cần có các thông điệp định tuyến giữa nhiều

máy chủ với nhau và việc thiết lập các máy chủ này một cách chủ động cho việc
xử lý cũng là một phần của kiến trúc dịch vụ WS toàn cầu và sẽ đạt được thông
qua đặc tả kỹ thuật định tuyến của WS và các đặc tả kỹ thuật tham chiếu của
WS. Khi kiến trúc dịch vụ WS toàn cầu phát triển, các đặc tả kỹ thuật đối với
những nhu cầu nh vậy và cả những nhu cầu khác nữa sẽ được đưa ra.
3. NGHIÊN CỨU MỘT SỐ MÔ HÌNH ÁP DỤNG DỊCH VỤ WEB (WS)
TRÊN THẾ GIỚI.
3.1 Sử dụng dịch vụ WS để tương hợp dữ liệu tại tổ chức Nông lương thế giới
FAO (Food and Agriculture Organization)
3.1.1 Tóm lược
Trong tài liệu này chúng tôi trình bày kinh nghiệm sử dụng WS để hỗ trợ
tính tương hợp các nguồn dữ liệu Tổ chức Nông lương thế giới của Liên hợp
quốc. Chúng tôi mô tả kiến trúc thông tin dạng theo tuyến (bus) dùa trên các WS
nhằm hỗ trợ thông qua việc truy cập đa ngôn ngữ tới các dữ liệu được lưu trữ
trong các nguồn dữ liệu khác nhau và tạo nên các báo cáo động. Kiến trúc này
lưu giữ được tính tự quản của các nguồn dữ liệu tham gia và cho phép cải tiến
hệ thống bằng cách thêm hoặc bớt các nguồn dữ liệu. Hơn nữa, nhờ vào các đặc
tính của WS về việc dấu đi các chi tiết triển khai của các dịch vụ cho nên có thể
được sử dụng một cách độc lập với nền tảng phần cứng và phần mềm mà trên đó
chóng triển khai, kiến tróc được đưa ra hỗ trợ bài toán về sự khác biệt công nghệ
đang được sử dụng rất thịnh hành trong tổ chức FAO và làm giảm bớt khó khăn
phải chỉ định mét công nghệ duy nhất trong toàn bộ tổ chức. Chúng tôi thảo luận
về những lợi Ých còng nh khiếm khuyết của tiếp cận này và những kinh nghiệm
có được trong khi phát triển kiến trúc của chúng tôi.
3.1.2 Giới thiệu
1. Sự phát triển của các hệ thống mạng máy tính phân tán đã cung cấp nền
tảng công nghệ cho việc truy cập dữ liệu và các ứng dụng từ xa. Việc phát triển
17
các hệ thống khác nhau cũng làm gia tăng tiện Ých của các hệ thống này, nhưng
không giải quyết được vấn đề tương hợp giữa các ứng dụng khác nhau. Các ứng

dụng không được xây dùng để tích hợp với nhau và do đó chóng thường xác
định các định dạng khác nhau, có những giao tiếp riêng của chúng và được phát
triển trên các nền tảng khác nhau.
2. Tính tương hợp của các hệ thống phân tán là một trở ngại. Ngày nay điều
quan trọng là cho phép tính tương hợp của các dạng nguồn thông tin khác nhau
trong một công ty hoặc cộng đồng rộng lớn. Người sử dụng và các ứng dụng có
nhu cầu ngày một lớn về truy cập và quản trị dữ liệu từ nhiều nguồn thông tin
rộng lớn độc lập, khác nhau một cách vật lý và logic. Khó khăn khác liên quan
tới môi trường còn là tính không đồng nhất và tính tự quản của các hệ thông cơ
sở dữ liệu, cách giải quyết và việc nhận dạng mâu thuẫn, việc trình bày ngữ cảnh
của dữ liệu, vị trí và nhận dạng của các thông tin phù hợp, việc truy cập và tính
thống nhất của các dữ liệu từ xa, việc xử lý các yêu cầu và sự tiến hành dễ dàng
của hệ thông.
3. Một ví dụ trong các vấn đề nêu trên được nhận ra trong tổ chức Nông
lương quốc tế FAO của Liên hiệp quốc. FAO là một tổ chức chuyên biệt của
Liên hiệp quốc, lãnh đạo những nỗ lực quốc tế chống đói nghèo. FAO trợ giúp
các quốc gia đang phát triển hiện đại hoá và phát triển nông nghiệp, trồng rừng,
đánh cá và đảm bảo dinh dưỡng tốt cho tất cả mọi người. Mét trong các chức
năng quan trọng nhất của tổ chức này là thu thập, phân tích và đánh giá các
thông tin hỗ trợ các chính phủ chống đói nghèo và đạt được an ninh lương thực.
Để đạt được các mục tiêu này FAO đã thiết lập Trung tâm Nông nghiệp thế giới
(WAICENT (World Agricculturel Information Center) để đánh giá và quản lý
các thông tin nông nghiệp.
4. Trong khuôn khổ WAICENT, một số lượng đồ sộ các dữ liệu được trình
bày ở các định dạng hoàn toàn khác nhau, trên nhiều ngôn ngữ và được quản trị
bởi nhiều kiến trúc siêu dữ liệu, thường được rạo ra hàng ngày và được lưu trữ
trong các dạng dữ liệu khác nhau của nhiều nguồn dữ liệu khác nhau. Tuy nhiên,
18
không có các tiêu chuẩn cho việc trình bày các ngôn ngữ, các siêu dữ liệu, và
các thông tin đặc biệt của các quốc gia. Mọi người cần truy cập và quản lý các

dữ liệu được phân tán trong nhiều nguồn khác nhau từ cả hai phái bên trong và
bên ngoài tổ chức. Điều quan trọng là chia sẻ dữ liệu giữa các hệ thống nhanh
chóng và dễ dàng, không cần phải yêu cầu các hệ thống phải được “trói lại” chặt
chẽ với nhau. Nói một cách đơn giản là các hệ thống đang tồn tại cần phải “nói
chuyện” được với nhau. Một vấn đề chính nữa liên quan tới thực tế là bên trong
tổ chức sử dụng 2 công nghệ khác nhau (Microsoft ASP [5] và Java
JSP/sevlet[20]) một cách rất rộng rãi và vì thế rất khó để theo chỉ một công nghệ
nào trong toàn bộ tổ chức FAO.
5. Trong tài liệu này trình bày một cách tiếp cận dùa trên các dịch vụ web
WS[17] và công nghệ ngôn ngữ đánh dấu mở rộng XML (eXtenxible Markup
Language) để cho phép tính tương hợp đối với các nguồn dữ liệu khác nhau có
trong tổ chức FAO. Đây là một tiếp cận nhẹ nhàng và dùa trên việc sử dụng một
kênh thông tin cho phép dữ liệu giữa các nguồn thông tin khác nhau được triển
khai bởi việc sử dụng các công nghệ khác nhau có thể trao đổi được với nhau.
Kênh thông tin hỗ trợ truy cập đa ngôn ngữ tới các dữ liệu được lưu trữ tới các
nguồn dữ liệu khác nhau, quản lý siêu dữ liệu theo cùng một cách và cho phép
siêu dữ liệu được sử dông nh các mẫu trao đổi FAO. Cách tiếp cận này cũng hỗ
trợ tạo các báo cáo động. Mét công cụ mẫu được triển khai để trình diễn và đánh
giá tiếp cận này.
(Ve hinh)
3.1.3 Đặt vấn đề
1. Tổ chức FAO có khoảng 200 hệ thống cung cấp thông tin cho việc truy
cập trên Internet, được triển khai trên hai công nghệ khác nhau: Microsoft ASP
[5] và JavaB JSP/servlets[20]. Các nguồn dữ liệu này cần chia sẻ và trao đổi các
dữ liệu giữa chúng với nhau mét cach dễ dàng. Tuy nhiên, việc sử dụng hai công
nghệ này rất rộng rãi trong tổ chức và không thể bắt tuân theo một công nghệ
duy nhất nào. Hơn nữa, cần phải tránh việc phải viết lại các ứng dụng hiện có.
19
2. Kiến trúc các thông tin hiện hành được chỉ ra trên hình 1. Nã bao gôm
các nguồn thông tin(các hệ thống cơ sở dữ liệu) chứa các dạng dữ liệu khác

nhau, bao gồm, nhưng không hạn chế, các dạng văn bản khác nhau đượ viết trên
5 ngôn ngữ chính thức là tiếng Anh, Pháp, Tây Ban Nha, Trung Quốc và ả
Rập( và một Ýt bằng tiếng Nga), các tài liệu thư mục tham chiếu điện tử, các dữ
liệu thống kê, các bản đồ và hình ảnh, các thông tin và sự kiện từ nhiều quốc gia
khác nhau, và thông tin web.
3. Nhiều người khác nhau tạo ra các văn bản tài liệu trong các định dạng
khác nhau, và được đưa vào trong các cơ sở dữ liệu sử dụng giao diện web. Các
dữ liệu này truy cập được từ các cơ sở dữ liệu ở định dạng siêu văn bản HTML,
và các ứng dụng sẵn sàng trên Internet. Ví dụ về các ứng dụng này như công cụ
tìm kiếm thông tin trực tuyến của trung tâm có tên là WAICEENT Information
Finder, mét catalog và thư mục trực tuyến của các trung tâm có tên là FAOBIB,
mét thư viện lưu trữ thư điện tử FAO Vitual librrary và một cơ sở dữ liệu thống
kê các lĩnh vực khác nhau FAOSTAT.
4. người sử dụng FAO là một nông dân, nhà khoa học, nhà buôn, các nhà
lam chính sách của chính phủ và phi chính phủ, cả ở trong tổ chức. Những người
này cần truy cập và xuất bản thông tin. Mặc dù việc thiết lập hiện hành chú
trọng một vài yêu cầu về tích hợp các hệ thống phân tán khác nhau, vẫn cọn
nhiều hạn chế liên quan tới các thách thức về tài chính và kỹ thuật, tính cứng
nhắc, thiếu tiêu chuẩn hoá và khó khăn trong việc nâng cấp, mở rộng hệ thống.
Quan trọng phải có một công nghệ không đắt giá, dễ dàng triển khai, dễ dàng
bảo trì và dùa trên các chuẩn mở, cho phép tác động tới các nguồn đang tồn tại
mà không phải viết lại các ứng dụng.
5. Công nghệ này cần hỗ trơ tính tương hợp các nguồn dữ liệu sẵn có và
quản lý các phương án đa ngôn ngữ mà không phải thay đổi kiến trúc của cơ sở
dữ liệu. Cùng lúc, cần thiết phải tuỳ biến và bổ sung kiến thức cơ sở dữ liệu cho
từng ngôn ngữ khác nhau.
20
6. Không có cách tiêu chuẩn nào để quản lý các phương án ngôn ngữ văn
bản hoặc kiến trúc dữ liêụ. Việc này tạo ra sự không ổn định giữa các ứng dụng
theo cách mà chóng được quản lý bằng ngôn ngữ khác nhau. Hơn nữa, các cơ sở

dữ liệu không dễ dàng mở rộng khi các dữ liệu mới hoặc các phương án ngôn
ngữ được bổ sung. Những khó khăn khác liên quan tới việc hỗ trợ và trình bày
siêu dữ liệu và trao đổi siêu dữ liệu theo cách thức tiêu chuẩn cũng như việc
định dạng bản gốc tiêu chuẩn. Trong tổ chức FAO mét kho văn bản đã được
phát triển với mục đích lưu trữ phổ biến tất các xuất bản phẩm bằng điện tử.
Kho này lưu trữ các biên bản họp, các văn bản siêu dữ liệu và dữ liệu chỉ mục.
Các giao diện ASP khác nhau cho phép tìm kiếm kho văn bản theo dạng, ngôn
ngữ và đối tượng của văn bản. Tuy nhiên, không có cách tiêu chuẩn nào để quản
lý các phương án ngôn ngữ của các văn bản hoặc các kiến trúc dữ liệu khác nhau
như các thông tin đặc trưng của quốc gia và siêu dữ liệu. Từ điển dữ liệu đa
ngôn ngữ về nông nghiệp(AGROVOC) [2] từ FAO được áp dụng cho web nh
mét chiến lược đảm bảo một vài tính phù hợp với mô tả/phát kiến của các
nguồn. Tuy nhiên, chúng không đạt tới mức một công cụ hoàn chỉnh cho mục
đích này theo nghĩa là cần thêm thuật ngữ đặc trưng của đối tượng và nhiều thứ
khác mà từ điển đồng nghĩa truyền thống đưa ra.
3.1.4 Công việc liên quan
1. Thách thức và tương hợp các hệ thống phân tán, đặc biệt là các hệ thống
cơ sở dữ liệu, đã tồn tại lâu nay và được nghiên cứu rất quyết liệt. Nhiều tiếp cận
đã được đưa ra cho phép tích hợp và tương hợp các hệ thống phân tán và được
phát triển một cách độc lập với nhau. Những tiếp cận này được đưa ra nh mét
kết quả công việc nghiên cứu cả trong giới hàn lâm lẫn trong giới công nghiệp.
Chúng ta có thể chia tiếp cận này thành 2 nhóm chính. Trong nhóm đầu mét mô
hình toàn cầu được sử dụng như mét líp khác nhau trên đỉnh các mô hình đang
tồn tại và cho phép người sử dụng các ứng dụng bức tranh về một hệ thống cơ
sở dữ liệu tập trung duy nhất.
21
2. Ví dụ của tiếp cận này nh hệ thống DATAPLEX [9], DDTS [13],
MULTIBASE [29] vàPEGASUS [3]. Tuy nhiên, việc xây dựng một mô hình
tiàn cầu không đơn giản, không đảm báo tính tự chủ của các hệ thống cơ sở dữ
liệu tham gia và không cho phép việc cải tiến hệ thống một cách dễ dàng về

phương diện bổ sung hoặc loại bỏ các cơ sở dữ liệu tham gia. Để vượt qua trở
ngại về xây dựng mô hình tích hợp toàn cầu thì nhóm tiếp cận mô hình kiến
trúc, kiến tróc đa cơ sở dữ liệu mà một vài trong sè đó đưa ra cách sử dụng
những yếu tố trung gian bằng việc Èn đi hoặc để lé ra giao diện bên trong của
các nguồn dữ liệu, các dữ liệu được định dạng lại và dịch các yêu cầu. Ví dụ về
các tiếp cận nh vậy bao gồm kiến trúc kiểu liên kết [19], kiến trúc mô hình 5
mức [28], kiến tróc đa cơ sở dữ liệu [22] [23], hệ thống Jupiter [18] và [33].
3. Bên trong các tiếp cận này không sử dụng mô hình toàn cầu mà một vài
trong sè đó đưa ra việc sử dụng thành phần trung gian và bộ bọc. Trong các tiếp
cận này nguồn dữ liệu được đóng gãi lại làm cho nó có thể sử dông được theo
một cách thuận tiện hơn bằng cách làm Èn đi hoặc cho lé ra giao diện bên trong
các nguồn dữ liệu, các dữ liệu định dạng lại và dịch các yêu cầu. Ví dụ về các hệ
thống nh vậy nh DIOM [24], DISCO [31], GARLIC [27] và TSIMMIS [16].
Trong bất cứ cách tiếp cận và công nghệ nào nêu trên thì vấn đề liên quan tới
cách làm thế nào để định dạng dữ liệu được trao đổi và cách chuyển các dữ liệu
đó vẫn là những vấn đề chưa giải quyết được triệt để. Đối với định dạng dữ liệu,
hầu hết các công cụ có thể tù động hoá qui trình dịch dữ liệu sang các định dạng
khác. Nhiều hệ thống sử dụng các tệp text trên mã ASCII phải có phần mềm tải
được xây dựng sẵn một cách tuỳ biến để quản lý các định dạng tệp khác nhau.
Những hệ thống khác trao đổi dữ liệu thông qua mét định dạng tệp đặc biệt và
không có khả năng bao quát được nhiều (nh Microsoft Excel chẳng hạn)
4. Mặt khác, việc truyền dữ liệu cũng khó thực hiện. Sử dụng giao thức
truyền tệp FTP (File Transfer Protocol) tạo điều kiện cho việc truyền tệp, nhưng
không phải là một tiếp cận hướng đối tượng chặt chẽ để trao đổi các dữ liệu.
Giao thức trao đổi dữ liệu điện tử EDI (Electronic Data Iinterchange) vẫn còn
22

×