Các công cụ và chức năng XML cho những người
dùng pureXML của DB2
Giới thiệu: PureXML của DB2 và dữ liệu XML
Các doanh nghiệp đang sử dụng ngày càng nhiều hơn các khả năng của pureXML trong DB2 để
lưu trữ, quản lý và truy vấn dữ liệu XML cùng với các dữ liệu của cơ sở dữ liệu chứa các con số
và văn bản truyền thống. PureXML của DB2 cho phép lưu trữ XML có hoặc không có xác nhận
hợp lệ với lược đồ, tạo các chỉ mục trên các phần tử hoặc các thuộc tính riêng lẻ trong các tài liệu
XML, và lấy ra tất cả hoặc các phần của tài liệu XML dựa trên các giá trị của các phần tử và các
thuộc tính. Các khả năng pureXML này đã cho phép các công ty giảm số lượng mã ứng dụng cần
thiết để xử lý XML, loại bỏ được phần việc rất đáng kể là phân tích cú pháp và chuyển đổi XML
thành các định dạng khác phù hợp với các cấu trúc quan hệ. Bây giờ các ứng dụng có thể thu
nhận, chuyển phát, lưu trữ và lấy ra XML mà không cần các phép chuyển đổi trung gian. Dòng
chảy đã được hợp lý hóa này thường gọi là xử lý XML xuyên suốt từ đầu đến cuối (được minh
họa trong Hình 1).
Hình 1. Xử lý XML xuyên suốt từ đầu đến cuối
Việc sử dụng khả năng XML mạnh mẽ này trong cơ sở dữ liệu tạo ra nhu cầu phải có các công
cụ để trợ giúp những người dùng cơ sở dữ liệu trong việc tạo, xem và chỉnh sửa XML thô phục
vụ cho các mục đích phát triển và thử nghiệm, cho việc xây dựng các truy vấn và chỉ mục trên
dữ liệu XML, và để làm việc với các lược đồ XML và các đối tượng liên quan khác. Có rất nhiều
công cụ của IBM, cũng như không của IBM, có các khả năng XML trong danh sách chức năng
của chúng. Bài viết này phác thảo một số nhiệm vụ chung mà người dùng cơ sở dữ liệu có thể
cần thực hiện với dữ liệu XML và xác định các công cụ IBM có thể trợ giúp các nhiệm vụ này.
Các nhiệm vụ được phân nhóm theo các vai trò cơ sở dữ liệu điển hình, thường thấy trong các tổ
chức công nghệ thông tin hiện nay, và xác định các công cụ phù hợp nhất với các nhu cầu XML
có liên quan.
Về đầu trang
Bộ công cụ IBM với chức năng XML cho những người dùng DB2
IBM cung cấp các công cụ cho người dùng cuối để quản lý dữ liệu trong suốt vòng đời, bao gồm
các nhiệm vụ như là vận hành và bảo trì cơ sở dữ liệu, điều chỉnh, kiến trúc/thiết kế dữ liệu và
phát triển ứng dụng. Chúng ta hãy xem danh sách tham khảo các công cụ IBM cùng với một mô
tả ngắn gọn các chức năng chính của chúng và các khả năng XML có liên quan:
DB2 Control Center - Trung tâm điều khiển của DB2 (miễn phí, kèm theo cơ sở dữ
liệu DB2)
o Quản lý hệ thống và đối tượng cơ sở dữ liệu DB2; cung cấp một giao diện truy
vấn tương tác bằng cách sử dụng Trình soạn thảo lệnh (Command Editor) tích
hợp.
o XML: Tạo và quản lý các đối tượng cơ sở dữ liệu XML, truy vấn và xem dữ liệu
XML.
o Lưu ý: DB2 Control Center đã lạc hậu, có nghĩa là nó sẽ không được tiếp tục cải
tiến nữa và sẽ bị gỡ bỏ trong bản phát hành trong tương lai, được thay thế bằng
chức năng trong các công cụ khác.
Hình 2. Trung tâm điều khiển và Trung tâm lệnh DB2
IBM Optim® Development Studio (ODS-Xưởng phát triển Optim) và Data Studio
(Xưởng dữ liệu) của IBM
o Phát triển dữ liệu, bao gồm việc tạo và thực hiện các truy vấn (SQL và XQuery)
và các thủ tục đã lưu, phát triển và triển khai các dịch vụ web dữ liệu, và hỗ trợ
cho việc phát triển Java™ để truy cập dữ liệu.
o XML: Trình soạn thảo XML/Lược đồ, trình ánh xạ XML, các dịch vụ web, Trình
thám hiểm cơ sở dữ liệu (Database Explorer), đăng ký Lược đồ, tạo lược đồ XML
từ XML.
Hình 3. Optim Development Studio
IBM InfoSphere™ Data Architect (IDA - Kiến trúc sư dữ liệu InfoSphere của IBM)
o Mô hình hóa dữ liệu logic và vật lý - thiết kế các cơ sở dữ liệu; khám phá, liên
kết, tích hợp, và tiêu chuẩn hóa các tài sản dữ liệu khác nhau; một số phép chuyển
đổi mô hình (UML/LDM/PDM).
Hình 4. InfoSphere Data Architect
IBM Rational® Application Developer (RAD- Nhà phát triển ứng dụng Rational
của IBM) cho Phần mềm WebSphere®
o Phát triển ứng dụng - cung cấp các công cụ liên quan đến việc phát triển Java (các
EJB, JPA, JSF và v.v ), kiểm thử và triển khai, bao gồm cả các dịch vụ web, các
ứng dụng cổng thông tin và SOA. Bao gồm một môi trường thử nghiệm
WebSphere tích hợp.
o XML: Trình soạn thảo XML/Lược đồ/XSL, trình soạn thảo ánh xạ XML, Trình
thám hiểm cơ sở dữ liệu (Database Explorer); tạo ra định nghĩa bảng quan hệ từ
Lược đồ XML.
Figure 5. Rational Application Developer
Rational Software Architect (RSA-Kiến trúc sư phần mềm Rational) cho Phần mềm
WebSphere
o Thiết kế và phát triển hướng mô hình, bao gồm tất cả các tính năng của RAD,
cùng với công cụ mô hình hóa và kiến trúc.
o XML: Chứa các công cụ XML của RAD, và các chức năng mô hình hóa và kiến
trúc (các phép biến đổi, mô hình hóa, UML, và v.v )
Hình 6. Rational Software Architect
InfoSphere Warehouse Design Studio (Xưởng thiết kế kho lưu trữ InfoSphere)
o Công cụ đồ họa để tạo ra các mô hình dữ liệu vật lý, các sơ đồ luồng dữ liệu xây
dựng kho lưu trữ dựa trên SQL của DB2, và các mô hình khối lập phương OLAP.
o XML: Ánh xạ dữ liệu nguồn XML thành các định nghĩa kho lưu trữ.
Hình 7. InfoSphere Warehouse Design Studio
Tóm tắt XML và các công cụ IBM
Các công cụ XML không phải của IBM
Ngoài những công cụ của IBM này, nhiều trình soạn thảo văn bản và mã khác nhau đã thêm các
tính năng làm cho việc chỉnh sửa dữ liệu XML dễ dàng hơn, và chúng thường có thể cung cấp
các khả năng cần thiết cho nhiều nhiệm vụ của người dùng cơ sở dữ liệu. Ngoài ra, có một số
nhà cung cấp đã đưa ra các trình soạn thảo văn bản và các công cụ môi trường phát triển tích hợp
IDE (Integrated Development Environment) được đặc biệt xây dựng dành cho XML có thể đáp
ứng các nhu cầu được thảo luận trong bài viết này, có lẽ chỉ trừ các nhu cầu gắn chặt nhất với các
hoạt động cơ sở dữ liệu. Một số trong các công cụ IDE dành cho XML nổi tiếng nhất là
XMLSpy của Altova, oXygen của SyncRO Soft, và Stylus Studio của Progress Software. Xem
"Phần công cụ không phải của IBM" để biết thêm về chủ đề này.
Các công cụ của IBM này có chung một số khả năng XML và trong một số trường hợp, chúng
chia sẻ chung các mô đun thành phần. Ví dụ, trong mỗi công cụ này, bạn đều có thể thực hiện
chỉnh sửa cơ bản các cá thể hoặc các lược đồ XML. Ngoài ra, tất cả các công cụ ấy, chỉ ngoại trừ
DB2 Control Center, đều dựa trên Eclipse (một nền tảng phát triển nguồn mở có khả năng mở
rộng), vì vậy tất cả chúng đều có chung một dáng vẻ và cảm nhận tương tự nhau. Phần còn lại
của bài này sẽ giúp làm rõ một công cụ có thể thích hợp hơn với một nhiệm vụ cụ thể ở đâu.
Thường thì một khuyến cáo công cụ không được dẫn dắt chỉ bởi một nhiệm vụ duy nhất, mà còn
bởi một ngữ cảnh rộng hơn về vai trò của người dùng cũng như những gì khác nữa cần được
thực hiện. Có những công cụ khác của IBM có thể bao gồm các khả năng XML, nhưng để ngắn
gọn, bài này tập trung vào những công cụ được liệt kê ở trên.
Ngoài ra còn có các sản phẩm của IBM bổ sung PureXML của DB2 dành cho các ứng dụng
XML, như gói Tính năng mới dành cho XML của IBM WebSphere Application Server (Máy chủ
ứng dụng WebSphere của IBM), IBM WebSphere Integration Developer (Nhà phát triển tích
hợp WebSphere của IBM) và WebSphere DataPower của IBM. Việc tích hợp này nằm ngoài
phạm vi của bài này, nhưng chúng đã góp phần vào việc tích hợp các ứng dụng XML xuyên suốt
từ đầu đến cuối. Những người dùng các sản phẩm này có thể có các nhu cầu tương tự đối với
công cụ hướng XML. (Có nhiều thông tin hơn nữa về các chủ đề này trong phần Tài nguyên.)
Về đầu trang
Những người dùng DB2 và tác động của dữ liệu XML
Các chuyên gia công nghệ thông tin với các vai trò riêng biệt trong các công ty có những trách
nhiệm khác nhau, mặc dù có liên quan và đôi khi chồng chéo lên nhau. Ở một mức độ lớn, vai
trò của một cá nhân quyết định anh ta sẽ cần thực hiện các nhiệm vụ nào với dữ liệu XML trong
cơ sở dữ liệu. Ví dụ, một số chuyên gia sẽ cần tạo ra hoặc sửa đổi dữ liệu XML, trong khi những
người khác chỉ cần hiểu cấu trúc của nó để có thể truy vấn nó một cách hiệu quả. Một số các
nhiệm vụ XML ấy sẽ được nhiều chuyên gia thực hiện (ví dụ, xem các dữ liệu XML), trong khi
những nhiệm vụ khác sẽ là đặc thù của một vai trò cụ thể. Trong một số trường hợp, một công cụ
đơn lẻ có thể cung cấp tất cả các chức năng để đáp ứng các nhu cầu của một tập các trách nhiệm
cụ thể và thậm chí có thể đáp ứng các nhu cầu của nhiều vai trò. Trong trường hợp khác, để đáp
ứng các nhu cầu khác nhau của một vai trò cụ thể có thể đòi hỏi nhiều công cụ. Phần này phác
thảo một tập các vai trò chuyên nghiệp xử lý thông tin và các nhu cầu có liên quan đến dữ liệu
XML của chúng. (Lưu ý: Mặc dù các công ty có thể định nghĩa hoặc phân loại vai trò của mình
một cách khác nhau, mỗi hoạt động này sẽ cần được thực hiện bởi một hoặc nhiều nhóm nhân
viên). Trong phần tiếp theo, chúng ta xác định các công cụ của IBM có khả năng đáp ứng các
nhu cầu đó.
Người quản trị cơ sở dữ liệu (DBA)
DBA chịu trách nhiệm về hoạt động của cơ sở dữ liệu của một tổ chức. Các nhiệm vụ bao gồm
việc lập kế hoạch và quản trị cơ sở dữ liệu, điều chỉnh hiệu năng và dung lượng, tạo và duy trì
các chỉ mục và tối ưu hóa các truy vấn, giám sát, và quản lý sao lưu và phục hồi.
Các nhiệm vụ XML: Tạo và duy trì các bảng và các khung nhìn với dữ liệu XML; tạo ra và
điều chỉnh các chỉ mục XML; truy vấn và xem các tài liệu XML; lưu trữ và quản lý các tài liệu
lược đồ XML.
Người phát triển cơ sở dữ liệu (người lập trình cơ sở dữ liệu)
Người phát triển cơ sở dữ liệu tạo và tối ưu hóa truy cập cơ sở dữ liệu, bao gồm các truy vấn, các
thủ tục đã lưu, các dịch vụ web dữ liệu, và các báo cáo, đôi khi bao gồm cả dữ liệu giao dịch
(OLTP) và dữ liệu hướng kho dữ liệu (OLAP). Trong một số tổ chức, vai trò này do một DBA
hoặc một người phát triển phần mềm thực hiện.
Các nhiệm vụ XML: Truy vấn XML (SQL/XML, XQuery) và phát triển thủ tục lưu sẵn; ánh xạ
và điền dữ liệu kho lưu trữ XML.
Người phát triển phần mềm (người lập trình ứng dụng)
Người phát triển phần mềm chịu trách nhiệm thiết kế và phát triển các ứng dụng hoặc các dịch
vụ web để lưu trữ, truy cập, và lấy ra dữ liệu từ cơ sở dữ liệu, và kết nối với các ứng dụng nghiệp
vụ khác. Những người trong vai trò này thường sử dụng Java, nhưng cũng có thể sử dụng các
ngôn ngữ bậc cao hoặc các ngôn ngữ kịch bản lệnh khác.
Các nhiệm vụ XML: Viết các chương trình ứng dụng hoặc các dịch vụ web để lưu trữ và lấy ra
dữ liệu XML một cách hiệu quả từ cơ sở dữ liệu DB2; xem xét XML đối lập với các cấu trúc
quan hệ.
Kiến trúc sư dữ liệu (người phân tích cơ sở dữ liệu)
Kiến trúc sư dữ liệu có trách nhiệm xác định và chú giải các sơ đồ luồng dữ liệu và cấu trúc của
dữ liệu được xử lý và lưu trữ, thường sử dụng các kỹ thuật mô hình hóa dữ liệu cho các cấu trúc
dữ liệu vật lý và logic.
Các nhiệm vụ XML: Thiết kế các cấu trúc cơ sở dữ liệu, bao gồm các cột XML hoặc các cột
quan hệ với dữ liệu được trích xuất từ XML (ánh xạ XML tới quan hệ).
Kiến trúc sư phần mềm (kiến trúc sư ứng dụng)
Kiến trúc sư phần mềm chịu trách nhiệm về mô hình hóa nghiệp vụ mức cao và xác định kiến
trúc cho các ứng dụng thực hiện các mô hình nghiệp vụ. Họ thiết kế các sơ đồ luồng và kiến trúc
ứng dụng, biểu diễn các quy trình nghiệp vụ trong thiết kế ứng dụng.
Các nhiệm vụ XML: Viết ra và duy trì các lược đồ XML, các tài liệu XML, hoặc cả hai để mô
tả nghiệp vụ và xác định bất kỳ phép ánh xạ hoặc các phép biến đổi dữ liệu cần thiết nào.
Bài này bàn thêm về những vai trò này và phác thảo các công cụ có thể giúp đáp ứng các nhu cầu
XML của họ trong phần "Các vai trò người dùng cơ sở dữ liệu và các nhu cầu XML".
Về đầu trang
Xem xét các nhiệm vụ XML chính và các khả năng của công cụ
Trước khi đi sâu hơn nữa vào các vai trò cơ sở dữ liệu và các nhu cầu XML có liên quan, trước
tiên chúng ta hãy tạm dừng để mô tả một vài trách nhiệm XML chính phổ biến, nổi lên khi dữ
liệu XML là một phần của cơ sở dữ liệu. Những trách nhiệm này được chia thành các thể loại
như: liên quan đến cơ sở dữ liệu, XML nguyên gốc, và liên quan đến ứng dụng. Đây chưa phải là
một danh sách đầy đủ (chắc chắn có nhiều hoạt động XML khác mà người dùng cơ sở dữ liệu có
thể tham gia), nhưng là một diễn giải căn bản về các nhiệm vụ có liên quan đến XML phổ biến
nhất đối với những người dùng cơ sở dữ liệu.
Các nhiệm vụ XML có liên quan đến đối tượng cơ sở dữ liệu
Các kiểu nhiệm vụ này có liên quan đến việc tạo ra và quản lý các đối tượng trong cơ sở dữ liệu,
như các bảng và các chỉ mục.
Định nghĩa cấu trúc cơ sở dữ liệu để quản lý dữ liệu XML
Nhiệm vụ này liên quan đến việc định nghĩa lược đồ cơ sở dữ liệu (các bảng, các cột) để
lưu trữ dữ liệu XML trong một cơ sở dữ liệu quan hệ. May mắn cho những người dùng
DB2, việc tạo các bảng để chứa dữ liệu XML là một quá trình rất đơn giản vì XML đã trở
thành một kiểu dữ liệu chính thức trong DB2 9 (LUW và z/OS). Điều này có nghĩa rằng
chính các lệnh và các công cụ được sử dụng để tạo các bảng với kiểu dữ liệu khác cũng
có thể được sử dụng để tạo các bảng có chứa các cột XML. Ví dụ, create table
mytable (idcol int xmldoc xml) sẽ tạo ra một bảng có một cột số nguyên (idcol) và
một cột XML (xmldoc). Các xem xét khác với các bảng và các cơ sở dữ liệu, như định
nghĩa vùng bảng và phân bổ vùng đệm, cũng được quản lý giống nhau đối với XML cũng
như các kiểu dữ liệu quan hệ khác, vì vậy không yêu cầu tạo ra các công cụ mới. Tuy
nhiên, điều căn bản nhất là các công cụ hiện hành mà các chuyên gia cơ sở dữ liệu sử
dụng để thực hiện các nhiệm vụ này đã được mở rộng để bao gồm các chức năng tương
tự cho dữ liệu XML. Với DB2 cho LUW và DB2 cho z/OS, sự hỗ trợ XML đã được kết
hợp trong các công cụ này, bao gồm cả DB2 Control Center, Bộ xử lý dòng lệnh (CLP),
hoặc SPUFI (Bộ xử lý SQL sử dụng đầu vào là tệp) cho z/OS, Cuối cùng, nếu đã thực
hiện mô hình hóa, IDA chứa công cụ để ánh xạ mô hình dữ liệu logic hoặc vật lý tới các
lược đồ XML, có thể được biểu diễn như là một cột XML trong DB2.
Ánh xạ và phép biến đổi XML-tới-quan hệ và quan hệ-tới-XML
Có những lúc bạn có thể cần chuyển đổi dữ liệu từ một định dạng này sang định dạng
khác vì nhiều lý do khác nhau. Ví dụ, một doanh nghiệp có thể nhận được XML từ một
đối tác nhưng cần tích hợp nó vào các ứng dụng truy cập các giá trị phần tử riêng rẽ, vì
vậy cần một công cụ để ánh xạ từ XML sang quan hệ. Hoặc cần làm cho các tài liệu
XML được lưu trữ trong cơ sở dữ liệu có thể truy cập được bởi các công cụ tạo báo cáo
chỉ nhận biết các cột dữ liệu rời rạc và không thể xử lý hoặc định dạng XML, do đó, cần
có một cơ chế chuyển đổi. Ngược lại, một ứng dụng có thể cần chuyển phát định dạng
XML từ dữ liệu bắt nguồn trong các cột quan hệ, do đó, cần có một ánh xạ dữ liệu quan
hệ-tới-XML.
ODS có chứa một trình ánh xạ trực quan chuyên dụng XML-tới-quan hệ để xây dựng các
lược đồ có chú thích xác định cách một cấu trúc XML đã cho sẽ được ánh xạ tới các bảng
và các cột quan hệ như thế nào. Lược đồ có chú thích này sau đó được nạp vào cơ sở dữ
liệu và được sử dụng để biến đổi XML đầu vào thành các cột quan hệ đã định nghĩa. Các
ánh xạ khác, như XML-tới-quan hệ hoặc quan hệ-tới-XML, có thể được thực hiện bằng
cách sử dụng cú pháp SQL/XML rất mạnh, nhưng đây là các cấu trúc mức mã lệnh, chứ
không phải là các công cụ trực quan. Các công cụ như MapForce của Altova được tạo
một cách rõ ràng để ánh xạ trực quan từ một định dạng dữ liệu này sang định dạng dữ
liệu khác, bao gồm các định dạng của cơ sở dữ liệu và XML.
Phát triển và hướng dẫn truy vấn XML
Đối với nhiều người dùng cơ sở dữ liệu và ứng dụng, SQL là một ngôn ngữ truy vấn
quen thuộc, nhưng các phần mở rộng SQL/XML và XQuery đều mới mẻ với họ. Với
những người dùng ấy, cần có các công cụ cung cấp một môi trường phát triển hoặc
hướng dẫn để xây dựng các truy vấn SQL/XML hoặc XQuery. Nhu cầu này có thể được
mở rộng nhằm hỗ trợ phát triển các thủ tục đã lưu để hoạt động trên dữ liệu XML. Một
nhu cầu có liên quan là cần một công cụ để nhận biết XPath đầy đủ của một phần tử hoặc
thuộc tính cụ thể trong một tài liệu XML (các tài liệu này có thể là rất lớn, và rất dễ gõ sai
một phần đường dẫn do nhầm lẫn, hoặc gõ chữ thường trong khi phải là chữ hoa, và
không nhận ra điều đó cho đến khi gỡ lỗi do các truy vấn không đưa ra các kết quả như
dự kiến).
Trình soạn thảo lệnh của Trung tâm điều khiển của DB2 cung cấp một tiện ích để xây
dựng và thi hành các truy vấn XML trên một cơ sở dữ liệu, và xem các kết quả XML
trong một khung nhìn. Các công cụ ODS và RAD/RSA cũng cung cấp một môi trường
phát triển truy vấn nhằm hỗ trợ SQL/XML và XQuery, bao gồm việc kiểm tra cú pháp cơ
bản và phác thảo truy vấn, cũng như khả năng thi hành trên một cơ sở dữ liệu, hiển thị
các kết quả XML, và xây dựng các thủ tục lưu sẵn (xem Hình 8). Những công cụ này
cũng có khả năng phát hiện ra đường dẫn XML cơ bản, nhưng nó gắn liền với trình soạn
thảo XSLT, vì vậy nó không thực sự có ích cho sự phát triển truy vấn. Ngoài IBM, các
công cụ hướng XML, như các sản phẩm IDE của XML, đều cung cấp khả năng này trong
các sản phẩm trình soạn thảo của chúng.
Hình 8. Tạo một câu lệnh XQuery trong ODS
Tạo hoặc sửa đổi một chỉ mục trên dữ liệu XML
Một khi các tài liệu XML được lưu trữ trong một cột XML trong DB2, và các ứng dụng
bắt đầu xác định các mẫu hình sử dụng phổ biến, bạn có thể muốn tạo các chỉ mục trên
các phần tử hoặc các thuộc tính thường xuyên được truy cập trong các tài liệu XML để
cải thiện thời gian đáp ứng truy vấn (cũng giống như với dữ liệu quan hệ). PureXML của
DB2 cho phép các chỉ mục trên bất kỳ phần tử hay thuộc tính nào của các tài liệu XML.
Cách đơn giản nhất để tạo các chỉ mục là sử dụng một giao diện dòng lệnh cho phép chạy
các truy vấn. Bạn có thể sử dụng các giao diện lệnh của DB2 Control Center (Command
Center) và Optim Development Studio (ODS) cho mục đích này. Có một trình thủ thuật
trong DB2 Control Center hướng dẫn những người dùng qua các bước để tạo một chỉ
mục trên một cột XML trong một bảng DB2. Các trình thủ thuật tạo chỉ mục trong các
công cụ khác vẫn chưa có khả năng xử lý định nghĩa của XPath với việc tạo chỉ mục
XML.
Lưu trữ các tài liệu lược đồ XML trong kho lưu trữ lược đồ XML của DB2
PureXML của DB2 cung cấp khả năng để xác nhận hợp lệ các tài liệu XML dựa vào một
lược đồ XML. Để có thể làm điều này, các lược đồ phải được nạp (đăng ký) vào kho lưu
trữ lược đồ XSR (XML Schema Repository) của DB2. Trong khi các lệnh để nạp một
lược đồ vào XSR rất đơn giản, thật không may chính các lược đồ thường phức tạp, chứa
các tệp có liên kết với nhau, trong trường hợp xấu nhất, lên tới hàng trăm tệp. Việc nạp
các lược đồ nhiều tệp như vậy có thể tẻ nhạt và dễ bị lỗi (Tôi đã nạp tệp lược đồ 33 chưa
nhỉ ?), vì vậy những người dùng tìm kiếm các công cụ hỗ trợ xác định tất cả các tệp thành
phần và tự động hóa hoặc tạo kịch bản lệnh cho quá trình nạp.
IBM Data Studio và ODS (cũng như RAD và RSA) cung cấp một tiện ích để hỗ trợ đăng
ký các lược đồ XML vào trong Kho lưu trữ lược đồ (XSR) của DB2. Các công cụ này tự
động phát hiện một mức lệnh nhập khẩu hoặc lệnh bao gồm, còn với các tệp lồng nhau
sâu hơn sẽ cần phải nạp bằng tay. Công cụ có thể hoặc đăng ký trực tiếp hoặc tạo kịch
bản lệnh để chạy sau này. Có thể tìm thấy các công cụ lược đồ XML tinh vi hơn trong
các sản phẩm IDE của XML, một số trong đó kết nối với DB2 và hướng dẫn quá trình
đăng ký, như XMLSpy hay oXygen.
Các nhiệm vụ có liên quan đến XML nguyên gốc
Những nhiệm vụ này được định hướng theo hướng tạo và chỉnh sửa các đối tượng XML, có phần
độc lập với việc sử dụng cơ sở dữ liệu cuối cùng.
Viết ra và xem các tài liệu XML
Dữ liệu XML cần bắt nguồn từ một nơi nào đó. Trách nhiệm có thể rơi vào một người
dùng cơ sở dữ liệu phải tạo ra các tài liệu (các cá thể) XML hoặc tạo ra các lược đồ XML
định nghĩa cấu trúc của các tài liệu XML. Hơn nữa, một khi các lược đồ hoặc dữ liệu cá
thể XML được lưu trong pureXML của DB2, các truy vấn do người dùng thực hiện với
dữ liệu XML này có thể trả về các tài liệu XML (có định dạng) và các tài liệu này sẽ cần
được hiển thị theo một cách (có định dạng) rõ ràng.
Các công cụ xem hoặc chỉnh sửa các tài liệu XML, thường được gọi là các trình soạn
thảo XML (hoặc các trình xem, nếu chỉ đọc). Thông thường, các công cụ này có mã hóa
màu sắc để làm nổi bật cú pháp và hoàn tất tự động văn bản hoặc định dạng theo cách dễ
đọc. Một trình soạn thảo lược đồ là một biến thể đặc biệt của một trình soạn thảo XML
nhận biết được các định dạng lược đồ XML (XSD). Các biến thể "trình soạn thảo thông
minh" đặc biệt khác có thể bao gồm XSLT, DTD và WSDL. Một số trình soạn thảo thậm
chí có thể cung cấp các trình thủ thuật để hướng dẫn người dùng qua các bước tạo tài
liệu.
DB2 Control Center cung cấp một trình xem và trình soạn thảo XML đơn giản, trong khi
Optim Development Studio và Rational Application Developer cung cấp các trình soạn
thảo XML và lược đồ tinh vi hơn.
Đảm bảo XML đúng khuôn dạng hoặc hợp lệ
PureXML của DB2 rất linh hoạt về khả năng lưu trữ các tài liệu XML có các kích cỡ và
các cấu trúc khác nhau trong bất kỳ cột XML nào. Yêu cầu duy nhất để lưu trữ một tài
liệu XML trong một cột XML trong DB2 là nó phải đúng khuôn dạng. Chính DB2 sẽ
kiểm tra tính đúng khuôn dạng của các tài liệu XML được chèn vào, từ chối các tài liệu
không đáp ứng yêu cầu. Theo tùy chọn, DB2 cũng có thể kiểm tra xem một tài liệu XML
có hợp lệ hay không đối với một lược đồ XML đã cho. Nhưng có thể đôi khi một ứng
dụng cơ sở dữ liệu hoặc cá nhân muốn kiểm tra tính đúng khuôn dạng của một tài liệu
XML cụ thể hoặc xác nhận tính hợp lệ của nó trước khi chèn vào DB2.
Có một vài lựa chọn công cụ để trợ giúp các việc kiểm tra XML này. Một lựa chọn đơn
giản là tạo ra một bảng cơ sở dữ liệu thử nghiệm và để cho DB2 thực hiện kiểm tra với
trình phân tích cú pháp dựng sẵn. Một lựa chọn khác để kiểm tra xem một tài liệu có
đúng khuôn dạng không là chỉ cần mở tài liệu XML trong một trình duyệt (Internet
Explorer, Firefox), và nó sẽ hiển thị một thông báo lỗi nếu có các vấn đề tồn tại. Một sự
lựa chọn tốt hơn là mở nó bằng một trình soạn thảo XML, bao gồm cả các trình soạn thảo
trong các công cụ IBM, có thể hiển thị lỗi và cho phép bạn sửa chữa vấn đề. Các trình
soạn thảo XML cũng có thể xác nhận hợp lệ một tài liệu XML dựa vào một lược đồ nếu
bạn có sẵn nó.
Phát triển lược đồ XML
Có những khi một doanh nghiệp nhận được XML từ một đối tác hoặc khách hàng như là
một phần của một định dạng trao đổi đã chấp thuận hoặc tiêu chuẩn công nghiệp. Những
lần khác, một người nào đó trong công ty cần tạo một định dạng XML, sẽ mô hình hóa
dữ liệu quan trọng biểu diễn giao dịch hoặc hoạt động kinh doanh. Dữ liệu này, khi là
XML, thường được nắm bắt bởi một tài liệu lược đồ XML (XSD), định nghĩa các nội
dung bắt buộc và tùy chọn, cấu trúc, và kiểm soát hoặc giới hạn dữ liệu trong mỗi tài liệu
XML hợp chuẩn. Các công cụ để hỗ trợ việc tạo các tài liệu XSD hợp lệ và tạo ra các cá
thể XML mẫu từ XSD sẽ làm cho việc này dễ dàng hơn. Các trình soạn thảo XML, được
cải tiến để nhận biết và hướng dẫn cú pháp XSD, là những ví dụ của các công cụ như
vậy.
Ánh xạ và chuyển đổi XML
Có những lúc bạn cần tạo một cá thể tài liệu XML mẫu từ một lược đồ XML (XSD) đã
cho, tạo một lược đồ từ một cá thể XML, hoặc cả hai việc. Các ví dụ chuyển đổi khác
liên quan đến XML là XML-thành-XML và XSD-thành-XSD.
May mắn thay, hầu hết các trình soạn thảo XML, bao gồm cả các trình soạn thảo trong
các công cụ của IBM được đề cập trong bài này, đều đã dựng sẵn khả năng này. ODS
cũng có các khả năng để phát triển ứng dụng cơ sở dữ liệu Java và phát triển truy vấn
XML.
Tạo dữ liệu thử nghiệm từ cá thể hoặc lược đồ
Khi một doanh nghiệp đã quyết định lưu trữ dữ liệu XML, họ biết rằng DB2 có thể xử lý
và lưu trữ bất kỳ cấu trúc XML nào miễn là nó đúng định dạng. Thông thường, nhóm
phát triển cơ sở dữ liệu hoặc ứng dụng có một ví dụ (cá thể) tài liệu XML hoặc một lược
đồ nhưng muốn tạo ra một tập dữ liệu biến đổi để thử nghiệm truy vấn và ứng dụng (ví
dụ, tạo ra 1000 hàng nội dung XML biến đổi khác nhau dựa trên một tài liệu hoặc lược
đồ XML đơn lẻ). Điều cần thiết là một trình soạn thảo XML "thông minh" hay trình thủ
thuật cho phép tạo nhiều cá thể XML từ một cá thể (hoặc lược đồ) duy nhất bằng cách
cho phép nhận biết các phần tử và các thuộc tính cụ thể cần được cung cấp dữ liệu ngẫu
nhiên/biến đổi khác nhau hoặc có thể có mặt hay vắng mặt.
Người ta có thể sử dụng các trình soạn thảo XML là một phần của các công cụ IBM để
tạo ra dữ liệu thử nghiệm bằng cách chỉnh sửa các cá thể riêng lẻ. Điều này có thể khá tẻ
nhạt nếu mong muốn có hàng trăm tài liệu thử nghiệm hoặc nhiều hơn nữa. Nguồn tốt
nhất cho công cụ tạo dữ liệu thử nghiệm XML khối lượng lớn sẽ là các công cụ chuyên
dụng XML (chứ không phải là cơ sở dữ liệu hoặc các ứng dụng). Một vài IDE XML
được đề cập bên dưới mới đây đã kèm với các khả năng của dữ liệu thử nghiệm.
Các ứng dụng XML
Những nhiệm vụ này liên quan đến việc phát triển các ứng dụng chuyển phát và truy cập dữ liệu
XML được lưu trữ trong một cơ sở dữ liệu.
Thiết kế và phát triển các ứng dụng để lưu trữ và truy vấn XML trong DB2
Khả năng lưu trữ và truy vấn XML trong DB2 cho phép các cơ hội ứng dụng mới hoặc
cải tiến. Các nhà phát triển cần tạo ra các ứng dụng sử dụng SQL/XML hoặc XQuery để
lưu trữ, xử lý và truy vấn dữ liệu XML trong DB2. Điều này có thể liên quan đến công cụ
thiết kế và phát triển đặc thù dành cho xử lý hoặc chuyển đổi dữ liệu XML.
RAD là công cụ cho các nhà phát triển, và nó có khả năng để soát lại và chỉnh sửa XML,
và xây dựng và kiểm thử các truy vấn dựa trên XML đối với DB2. ODS cung cấp công
cụ để giúp các nhà phát triển Java tương tác với cơ sở dữ liệu, bao gồm các truy vấn và
các thủ tục đã lưu đối với dữ liệu XML.
Thiết kế và phát triển các dịch vụ web để xử lý, lưu trữ và truy vấn XML trong một
cơ sở dữ liệu
Tương tự như phần trước, bây giờ là phát triển các dịch vụ Web, sử dụng SQL/XML
hoặc XQuery để lưu trữ hoặc truy vấn dữ liệu XML trong một cơ sở dữ liệu DB2. Các
dịch vụ web chuyên dụng này đôi khi được gọi là DWS (Data web services – Các dịch vụ
web dữ liệu). Các nhu cầu cụ thể trong lĩnh vực này sẽ là cung cấp các giao diện dịch vụ
web, ví dụ như dưới dạng WSDL (Web Services Description Language - Ngôn ngữ mô tả
các dịch vụ Web) hoặc xác minh các điểm đầu cuối dịch vụ web để kết nối thông báo.
Cả ODS và RAD đều có công cụ tạo dịch vụ web. Ví dụ, ODS cho phép tạo và triển khai
một dịch vụ web từ một truy vấn hoặc thủ tục đã lưu bằng cách sử dụng các tính năng
kéo-và-thả.
Tóm tắt các Nhiệm vụ và Công cụ XML
Bảng dưới đây cung cấp một cái nhìn tóm tắt về các khả năng XML của các công cụ IBM khác
nhau được xem xét ở trên. Bảng này cho thấy một số khả năng mà tất cả hoặc hầu hết các công
cụ cung cấp trong khi các khả năng khác là riêng biệt cho một hoặc hai công cụ.
Bảng 1. Các khả năng XML ánh xạ với các công cụ IBM
Các khả năng XML
DB2
Control
Center 9.7
Data
Studio
IDE 2.2
ODS
2.2
IDA
7.5.2
RAD
7.5
RSA
7.5
ISW
Design
Studio
9.7
Các trình
so
ạn thảo
XML
Trình soạn thảo XML
(văn bản, cú pháp, định
dạng)
Trình soạn thảo Lược đồ
Trình xác
nh
ận hợp
lệ
Trình xác nhận hợp lệ
XML
Trình xác nhận hợp lệ
XSD
Trình xác nhận hợp lệ
WSDL
Trình xác nhận hợp lệ
XSL
Trình gỡ
lỗi
Trình gỡ lỗi XSLT
Ánh xạ Trình ánh xạ Quan hệ-
tới-XML
Trình ánh xạ XML- tới-
Quan hệ
Trình ánh xạ Lược đồ có
ghi chú
Trình ánh xạ XML- tới-
XML
Ánh xạ Mô hình logic-
tới-XSD
Ánh xạ Mô hình vật lý-
tới-XSD
Cơ sở dữ
liệu
Kết nối tới DB2
Trình thám hiểm DB (các
đối tượng CSDL)
Tạo cơ sở dữ liệu, các
bảng (XML)
Tạo chỉ mục (XML)
(Lưu ý¹)
(Lưu
ý¹)
(Lưu
ý¹)
(Lưu
ý¹)
(Lưu
ý¹)
Xuất và nhập khẩu XML
Trích xuất dữ liệu-truy
vấn XML
Trình soạn thảo truy vấn
(SQL, XQuery)
Trình xây dựng SQL
Trình xây dựng XQuery
Trình xây dựng thủ tục
lưu sẵn
Data Web Services
Developer(Nhà phát triển
các dịch vụ web dữ liệu)
Tương quan SQL với mã
Java
Đăng ký lư
ợc đồ XML với
DB2
Giải thích trực quan các
truy vấn XML
1
Công cụ có thể tạo chỉ mục thủ công (không phải với trình thủ thuật), nhưng sẽ không hiển thị
trong trình thám hiểm cơ sở dữ liệu (Database Explorer).
Về đầu trang
Các vai trò của người dùng cơ sở dữ liệu và các nhu cầu XML
Thường thì các cá nhân và tập trách nhiệm XML được giao phân thành các nhóm theo các vai trò
của cá nhân trong công ty. Vì lý do đó, thông thường tốt nhất là trước hết tìm kiếm các sản phẩm
của IBM hướng vào trách nhiệm toàn diện của cá nhân khi tìm kiếm sự hỗ trợ của công cụ XML.
Bảng dưới đây tóm tắt các trách nhiệm về nhiệm vụ XML của năm vai trò quản lý dữ liệu, và xác
định công cụ của sản phẩm IBM liên kết chặt chẽ nhất với từng vai trò.
Bảng 2. Các nhiệm vụ XML được ánh xạ tới các vai trò của người dùng cơ sở dữ liệu
Các nhiệm vụ XML
Người
quản trị
cơ sở dữ
liệu (DBA)
Người phát
triển dữ liệu
Người phát
triển phần
mềm
Kiến trúc sư
cơ sở dữ liệu
Kiến trúc s
ư
phần mềm
Các bảng, các khung
nhìn XML
Quản lý lư
ợc đồ XML
trong DB2
Dữ liệu XML
Xem XML
Tạo ra và
chỉnh sửa
XML
Tạo và duy trì
các lược đồ
XML (XSD)
Chỉ xem
B
ảo đảm XML
đúng khuôn
dạng và hợp lệ
Phép biến đổi
XML
XML-thành-
quan hệ
XML-thành-
quan hệ hay
khác
Các phép biến
đổi mô hình d
ữ
liệu thành XSD
Các phép bi
ến
đổi mô hình
dữ liệu th
ành
XSD
Ánh xạ XML
Quan hệ-
tới/từ-
XML
Hướng dẫn
truy vấn
/Xpath
Tạo dữ liệu
thử nghiệm từ
dữ liệu cá thể
Các dịch vụ Web
Phát triển Java
Công cụ của sản
phẩm dành cho từng
vai trò
DB2
Control
Center
(hoặc
ODS)
Optim
Development
Studio
Rational
Application
Developer
InfoSphere
Data Architect
Rational
Software
Architect
Như đã nêu ở trên, có nhiều trách nhiệm xung quanh việc tạo, sử dụng và duy trì dữ liệu XML và
mỗi trách nhiệm đi kèm với một tập tương ứng các nhu cầu công cụ. Phần tiếp theo xem xét cách
chọn một công cụ để đáp ứng các nhu cầu nhiệm vụ XML và liên hệ với hướng dẫn tới các vai
trò cơ sở dữ liệu đã xác định.
Chọn công cụ nào
Với rất nhiều công cụ và các khả năng chồng chéo, có thể sẽ là một thách thức nếu muốn chỉ rõ
chọn công cụ nào cho một nhiệm vụ cụ thể khi có nhiều công cụ có chức năng cần thiết. Có lẽ
không có công cụ "đúng nhất" cuối cùng, nhưng có hai yếu tố đóng phần lớn vào việc bạn chọn
công cụ nào cho một nhiệm vụ cụ thể:
Có phải bạn đã quen với một trong các công cụ cung cấp chức năng này và có lẽ nó đã
được cài đặt rồi? Khi còn nghi ngờ, hãy giữ nguyên những gì bạn biết. Mặc dù một công
cụ mới có thể cung cấp khả năng tốt hơn hoặc dễ sử dụng hơn, nó không chắc bù lại được
thời gian cần thiết để mua, cài đặt và tìm hiểu công cụ mới.
Bạn sẽ phải thực hiện các nhiệm vụ khác nào như là một phần của vai trò rộng hơn của
bạn? Ví dụ, nếu bạn cần xem hoặc chỉnh sửa các tài liệu XML và ngoài ra chủ yếu sẽ
phát triển các ứng dụng Java, bạn có thể xem xét RAD. Mặt khác, nếu bạn có nhu cầu
tương tự, nhưng bạn chủ yếu xử lý các đối tượng cơ sở dữ liệu (các bảng, các truy vấn và
v.v ), thì bạn nên nghĩ về Optim Development Studio hoặc chỉ cần sử dụng Control
Center (Trung tâm điều khiển).
Hướng dẫn nêu trên áp dụng khá tốt nếu bạn thỉnh thoảng có một nhu cầu công cụ có khả năng
XML trong bối cảnh một tập các trách nhiệm rộng lớn hơn.
Tuy nhiên, nếu một tập các nhiệm vụ XML trở thành trách nhiệm chính của bạn trong giai đoạn
nào đó, thì điều quan trọng là ưu tiên cho các chức năng cụ thể hơn là các khả năng khác mà một
công cụ cung cấp. Trong những trường hợp đó, bạn nên dành chút thời gian để nghiên cứu chức
năng quan trọng nhất mà bạn cần và xác định những công cụ nào sẽ làm việc đó dễ dàng nhất.
Trong những trường hợp đó, điều hợp lý là xem xét công cụ được xây dựng dành riêng để xử lý
XML, chứ không phải dành cho nhiệm vụ rõ ràng đó.
Khuyến cáo công cụ XML dựa trên các vai trò người dùng cơ sở dữ liệu
Bây giờ khi chúng ta đã xem lại những gì dính líu đến các nhiệm vụ nổi lên khi những người
dùng cơ sở dữ liệu làm việc với dữ liệu XML, chúng ta hãy quay lại xem xét các vai trò khác
nhau và các hoạt động XML của chúng, và làm nổi bật các công cụ phù hợp tốt nhất với các nhu
cầu XML tương ứng.
Người quản trị cơ sở dữ liệu (DBA) - các hoạt động cơ sở dữ liệu
Các nhiệm vụ XML: Tạo và duy trì các bảng và các khung nhìn với dữ liệu XML; tạo và
tinh chỉnh các chỉ mục XML, truy vấn và xem các tài liệu XML; lưu trữ và quản lý các
tài liệu lược đồ XML.
Hướng dẫn các công cụ chung: DB2 Control Center, Optim Database Administrator.
Người phát triển cơ sở dữ liệu (người lập trình cơ sở dữ liệu) - phát triển truy cập cơ sở dữ
liệu
Các nhiệm vụ XML: Phát triển truy vấn XML và các thủ tục lưu sẵn; thiết kế kho dữ liệu
XML.
Hướng dẫn các công cụ chung: Optim Development Studio.
Người phát triển phần mềm - phát triển ứng dụng để lưu trữ và lấy ra dữ liệu XML (và dữ liệu
khác)
Các nhiệm vụ XML: Viết mã ứng dụng để lưu trữ và lấy ra có hiệu quả dữ liệu XML từ
cơ sở dữ liệu DB2.
Hướng dẫn các công cụ chung: Rational Application Developer.
Kiến trúc sư cơ sở dữ liệu - mô hình hóa và bố trí vật lý cơ sở dữ liệu
Các nhiệm vụ XML: Thiết kế các lược đồ cơ sở dữ liệu, bao gồm các cột XML hoặc các
cột quan hệ được trích xuất từ XML (ánh xạ XML tới quan hệ).
Hướng dẫn các công cụ chung: InfoSphere Data Architect
Kiến trúc sư phần mềm - thiết kế các mô hình nghiệp vụ và các kiến trúc ứng dụng
Các nhiệm vụ XML: Phát triển và duy trì các lược đồ XML và/hoặc các tài liệu XML.
Hướng dẫn các công cụ chung: Rational Software Architect.
Công cụ XML không phải của IBM
Trong khi bài viết này đã nêu ra các khả năng XML trong nhiều sản phẩm khác nhau về công cụ
IBM, có rất nhiều sản phẩm có sẵn bên ngoài IBM cũng cung cấp khả năng XML. Chúng bao
gồm cả phần mềm miễn phí và phần mềm tính phí. Bài viết này không cố gắng liệt kê các tính
năng và các chức năng của các sản phẩm không phải của IBM này, nhưng sẽ tóm tắt một số thể
loại công cụ và cung cấp một số ví dụ về các sản phẩm được cung cấp trong mỗi thể loại. Danh
sách này chỉ để nhận biết. Việc đưa vào danh sách hay bỏ qua các sản phẩm cụ thể không nhằm
ý khuyến cáo về sản phẩm đó.
Môi trường phát triển tích hợp (IDE) của XML: Các công cụ này được xây dựng nhằm
cung cấp một bộ tích hợp các khả năng để viết ra, bảo trì và chuyển đổi dữ liệu XML,
bao gồm cả hai, các cá thể và các lược đồ. Chúng thường bao gồm, hoặc có các phần mở
rộng để phát triển XQuery và SQL/XML. Các ví dụ về các IDE của XML phổ biến là
Altova XMLSpy, trình soạn thảo XML <oXygen/> của SyncRO Soft, và Stylus Studio
của Progress Software. Ngoài ra còn có sẵn một số các IDE của XML miễn phí. Một số
trong đó, ví dụ như XMLSpy và Oxygen, cũng cung cấp kết nối trực tiếp đến PureXML
của DB2 và các cơ sở dữ liệu khác để trích xuất dữ liệu XML, chạy các truy vấn, và lưu
trữ các lược đồ.
Các trình soạn thảo XML: Tương tự như các IDE, nhưng có tính năng hạn chế hơn, tập
trung xung quanh việc tạo và chỉnh sửa các tài liệu, các lược đồ XML, hoặc cả hai. Nhiều
trình soạn thảo XML, với mức độ phức tạp khác nhau, có sẵn miễn phí. Các ví dụ về các
trình soạn thảo XML là XMLPad, XML Marker, XML Viewer và XML Buddy. Để có
một danh sách toàn diện (nếu không phải là thừa thãi) về các trình soạn thảo XML, xem
danh sách trên XML.com (xem phần Tài nguyên).
Về đầu trang
Tóm tắt
Những người dùng cơ sở dữ liệu đã được làm quen với dữ liệu XML, cần có một công cụ để hỗ
trợ các nhiệm vụ liên quan đến tạo, xem, chỉnh sửa, hoặc chuyển đổi XML. Các khả năng này
tồn tại trong các công cụ IBM hiện có đã được nâng cao để xử lý các khía cạnh của XML. Bài
này đã phác thảo ra một loạt các nhiệm vụ như vậy và đã liệt kê các sản phẩm của IBM cung cấp
sự hỗ trợ cho các công việc này. Khi một người dùng cơ sở dữ liệu cần xem xét một loạt các
nhiệm vụ liên quan đến XML, việc lựa chọn sản phẩm để hỗ trợ cho các nhiệm vụ đó trở nên khó
khăn hơn một chút. Thông thường, không có một công cụ nào cung cấp tất cả các khả năng cần
thiết, do đó, có thể cần nhiều công cụ. Thông thường cách tốt nhất là chọn công cụ chính bằng
cách xem xét vai trò chính của người dùng cơ sở dữ liệu và bằng cách tận dụng khả năng XML
của nó càng nhiều càng tốt. Cuối cùng, nếu XML trở thành một phần lớn trong các nhiệm vụ của
một cá nhân, bài viết này đã vạch ra một số sản phẩm không phải của IBM, như các trình soạn
thảo XML và các môi trường phát triển tích hợp, được xây dựng xung quanh việc cung cấp các
khả năng XML để chỉnh sửa, xem, và chuyển đổi dữ liệu XML và có thể là một sự bổ sung tốt
cho các sản phẩm cơ sở dữ liệu cụ thể được xem xét ở đây.