Tải bản đầy đủ (.pdf) (126 trang)

Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.42 MB, 126 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b>TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN HỆ THỐNG THÔNG TIN </b>

<b>NGUYỄN THỊ KIM PHƯỢNG – TRƯƠNG KIỀU GIANG </b>

<b>KHÓA LUẬN CỬ NHÂN TIN HỌC </b>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<b>TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN HỆ THỐNG THÔNG TIN </b>

<b> NGUYỄN THỊ KIM PHƯỢNG 0112237 </b>

GIÁO VIÊN HƯỚNG DẪN

<b>THẠC SĨ: NGUYỄN TRẦN MINH THƯ </b>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

<i><b>Lời cảm ơn </b></i>

<i><b>Chúng em xin chân thành cảm ơn Ban giám hiệu, quý Thầy Cô của trường Đại học Khoa Học Tự Nhiên Tp.Hồ Chí Minh, đặc biệt là các Thầy Cô trong khoa Công Nghệ Thông Tin đã tận tình giảng dạy, trang bị cho chúng em những kiến thức cần thiết trong suốt những năm học tập tại trường. </b></i>

<i><b>Chúng em xin chân thành cảm ơn Thạc sĩ Nguyễn Trần Minh Thư đã tận tình quan tâm, hướng dẫn và giúp đỡ chúng em trong q trình thực hiện luận văn để chúng em có thể hồn thành tốt luận văn này. </b></i>

<i><b>Chúng tơi xin chân thành cảm ơn các anh chị cùng các bạn đã có những nhận xét, đóng góp ý kiến, động viên, quan tâm và giúp đỡ chúng tôi vượt qua khó khăn trong suốt q trình thực hiện đề tài. </b></i>

<i><b>Cuối cùng, chúng con xin gửi lòng biết ơn sâu sắc đến cha mẹ, gia đình đã tạo mọi điều kiện về vật chất, tinh thần, động viên, khích lệ và hỗ trợ chúng con trong suốt thời gian qua. </b></i>

<i><b>Tp.Hồ Chí Minh, ngày 12 tháng 7 năm 2005 Nhóm sinh viên thực hiện </b></i>

<i><b>Nguyễn Thị Kim Phượng – Trương Kiều Giang </b></i>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>LỜI NÓI ĐẦU </b>

Thế kỷ 21 - thế kỷ của sự bùng nổ công nghệ thông tin, các công nghệ tiên tiến phát triển như vũ bão, mang một luồng gió mới thổi vào nhận thức của mỗi người. Song song đó, thế giới đang trong xu thế tồn cầu hóa, tất cả đều mang ý nghĩa hội nhập. Lúc này, các doanh nghiệp và chính phủ khơng chỉ cạnh tranh với các doanh nghiệp trong một quốc gia mà còn cạnh tranh với các doanh nghiệp, chính phủ ở khắp thế giới. Vì thế, để tồn tại và phát triển, mục tiêu mà các doanh nghiệp hướng đến đầu tiên là nâng cao chất lượng phục vụ khách hàng. Khách hàng là yếu tố sống còn của bất kỳ doanh nghiệp nào trong thế kỷ 21. Một chính phủ muốn quốc gia mình phát triển phải xem nhân dân và doanh nghiệp là khách hàng. Để có khách hàng đã khó, để giữ khách hàng càng khó hơn nhiều. Doanh nghiệp nào làm cho khách hàng thỏa mãn, doanh nghiệp đó sẽ phát triển tốt, chính phủ nào làm nhân dân hài lịng chính phủ đó sẽ vững mạnh.

Trong bối cảnh phát triển mạnh mẽ của Internet nói chung, thương mại điện tử và chính phủ điện tử nói riêng, việc ứng dụng công nghệ thông tin vào lĩnh vực dịch vụ khách hàng không là mới trên thế giới nhưng là mới ở Việt Nam. Nhiều vấn đề đặt ra là làm thế nào đem đến cho khách hàng sự

<i><b>phục vụ tốt nhất, tiện lợi và hiệu quả nhất. Chính vì vậy đề tài “Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng” </b></i>

được đưa ra nhằm giúp cho các doanh nghiệp hay các tổ chức nhà nước hỗ trợ khách hàng hiệu quả hơn. Với luận văn này, nhóm chúng em mong muốn sẽ xây dựng được một hệ thống hỗ trợ khách hàng giảm chi phí về nhân sự và viễn thông, thời gian hỗ trợ ngắn hơn, thơng tin hỗ trợ chính xác theo u cầu và khơng bỏ sót u cầu của khách hàng.

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

Nội dung của đề tài gồm các phần chính sau:

<i>Chương 1: Tổng quan - Giới thiệu đơi nét về hệ thống hỗ trợ dịch vụ khách </i>

hàng như mục tiêu, phạm vi, đối tượng mà hệ thống hướng tới. Song song đó là các cách tiếp cận bài toán và đưa ra hướng giải quyết bài toán.

<i>Chương 2: Giới thiệu công nghệ XML – Đề tài sử dụng một công nghệ mới </i>

để hỗ trợ trong vấn đề lưu trữ và trao đổi thông tin trong mơi trường Internet đó là XML. Chương này sẽ giới thiệu được cho mọi người biết XML là gì và các công nghệ đang được hỗ trợ trên XML.

<i>Chương 3: Mô tả hệ thống quản lý dịch vụ khách hàng - Mô tả chi tiết hệ </i>

thống hỗ trợ dịch vụ khách hàng và đưa ra các yêu cầu mà hệ thống sẽ được xây dựng.

<i>Chương 4: Phân tích ứng dụng - Phân tích chi tiết các u cầu theo mơ </i>

hình UML (Unified Model Language).

<i>Chương 5: Thiết kế và cài đặt ứng dụng. </i>

<i>Chương 6: Kết luận và hướng phát triển – Tổng kết những kết quả đạt được </i>

và mặt hạn chế của đề tài, đồng thời cũng đưa ra hướng phát triển cho hệ thống sau này.

Phần cuối cùng là Tài liệu tham khảo và phụ lục.

Do thời gian có hạn, kinh nghiệm phân tích, thiết kế, cài đặt cịn hạn chế nên chắc chắn khơng tránh khỏi một số sai sót nhất định. Rất mong nhận được sự đóng góp ý kiến của q Thầy Cơ và bạn bè để chúng em hoàn thiện đề tài này.

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

1.4. Hướng giải quyết bài toán ... 18

1.4.1. Về tốc độ thực hiện câu truy vấn ... 18

1.4.2. Vấn đề tìm kiếm thơng tin ... 21

<b>Chương 2: NGHIÊN CỨU CƠNG NGHỆ XML... 25</b>

2.1. Tổng quan về XML ... 25

2.1.1. Giới thiệu ... 25

2.1.2. Mục tiêu ra đời và lợi ích khi sử dụng XML... 25

2.1.3. Một tài liệu XML trông như thế nào?... 27

2.1.4. Tạo lập một tài liệu XML ... 27

2.1.5. Những thành phần của một tài liệu XML... 28

2.1.6. Một tài liệu XML hợp lệ... 29

2.1.7. XPath... 33

2.1.8. Nhận xét về XML ... 34

2.2. Cách sử dụng một tài liệu XML... 34

2.2.1. Đọc và phân tích tài liệu XML ... 35

2.2.2. Định hướng qua tài liệu XML để rút trích dữ liệu: ... 37

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

2.2.3. Truy vấn dữ liệu XML sử dụng XPathDocument và

3.3. Xác định yêu cầu chức năng hệ thống ... 51

3.3.1. Yêu cầu chức năng nghiệp vụ... 51

3.3.2. Yêu cầu chức năng hệ thống... 61

3.3.3. Yêu cầu phi chức năng... 63

<b>Chương 4: PHÂN TÍCH... 64</b>

4.1. Lược đồ USE-CASE ... 64

4.2. Đặc tả Use-Case ... 66

4.2.1. Đặc tả Use-Case Tìm kiếm FAQ ... 66

4.2.2. Đặc tả Use-Case Đăng ký tài khoản ... 67

4.2.3. Đặc tả Use-Case Tạo yêu cầu ... 69

4.2.4. Đặc tả Use-Case Xem và hiệu chỉnh yêu cầu... 70

4.2.5. Đặc tả Use-Case Giải đáp yêu cầu... 72

4.2.6. Đặc tả Use-Case Tìm kiếm yêu cầu... 73

4.2.7. Đặc tả Use-Case Quản lý yêu cầu... 74

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

4.2.8. Đặc tả Use-Case Quản lý FAQ... 76

<b>Chương 5: THIẾT KẾ ... 79</b>

5.1. Hiện thực hóa Use-Case... 79

5.1.1. Use-Case Tìm kiếm FAQ ... 79

5.1.2. Use-Case Đăng ký tài khoản... 81

5.1.3. Use-Case Tạo yêu cầu mới ... 83

5.1.4. Use-Case Giải quyết yêu cầu... 85

5.1.5. Use-Case Xem và hiệu chỉnh yêu cầu ... 87

5.1.6. Use-Case Tìm kiếm yêu cầu ... 89

5.1.7. Use-Case Quản lý yêu cầu... 91

5.1.8. Use-Case Quản lý FAQ ... 93

5.2. Thiết kế cơ sở dữ liệu... 96

5.2.1. Sơ đồ lớp... 96

5.2.2. Mơ hình quan hệ ... 97

5.2.3. Mơ tả chi tiết các lớp đối tượng... 98

5.2.4. Mô tả các ràng buộc toàn vẹn ... 102

5.3. Thiết kế cài đặt và triển khai ... 105

5.3.1. Mơ hình cài đặt ... 105

5.3.2. Mơ hình triển khai hệ thống... 106

5.4. Thiết kế giao diện... 107

5.4.1. Sơ đồ liên kết các màn hình... 108

5.4.2. Thiết kế chi tiết một số màn hình ... 109

<b>Chương 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ... 121</b>

6.1. Kết luận ... 121

6.2. Hướng phát triển ... 123

<b>TÀI LIỆU THAM KHẢO ...124</b>

<b>PHỤ LỤC ...125</b>

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

Hình 1-8: Mơ hình truy vấn dữ liệu ... 17

Hình 1-9: Mơ hình truy vấn dữ liệu có hỗ trợ XML... 20

Bảng 4-1: Danh sách các Actor... 65

Bảng 4-2: Danh sách các Use-Case ... 66

Bảng 5-1: Danh sách các đối tượng lưu trữ dữ liệu ... 98

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<b>Chương 1: MỞ ĐẦU </b>

<i><b>1.1. Giới thiệu ứng dụng </b></i>

Hệ thống quản lý dịch vụ khách hàng được xây dựng với mục tiêu chủ yếu là hỗ trợ cho khách hàng khi có nhu cầu tìm hiểu thơng tin về sản phẩm và dịch vụ của doanh nghiệp. Hệ thống hoạt động như sau:

Khi khách hàng có nhu cầu tìm kiếm các thông tin liên quan đến sản phẩm và dịch vụ của công ty hay doanh nghiệp, khách hàng vào khu vực dịch vụ khách hàng (gọi là helpdesk) để tìm kiếm thơng tin trong các câu hỏi và câu trả lời có sẵn (cịn gọi là hệ thống FAQ).

Trường hợp khơng tìm thấy thơng tin cần thiết trong FAQ, khách hàng có thể gửi yêu cầu và yêu cầu được giải đáp từ phía doanh nghiệp, cơng ty. Khách hàng có thể gửi trực tiếp qua hệ thống website hỗ trợ khách hàng hoặc gửi email trực tiếp về địa chỉ email hỗ trợ của doanh nghiệp, khách hàng sẽ được giải đáp trong thời gian nhanh nhất có thể.

Nhân viên phụ trách giải đáp yêu cầu của khách hàng sẽ xem xét yêu cầu và giải đáp cho khách hàng, nếu yêu cầu gửi khơng đúng phịng ban sẽ được nhân viên chuyển qua phòng ban phù hợp.

Nội dung câu hỏi và trả lời của mỗi yêu cầu được nhân viên tuyển chọn, sàng lọc để cập nhật vào FAQ. Như thế khi khách hàng cần thơng tin tương tự thì có thể tìm kiếm ngay trong hệ thống FAQ một cách nhanh chóng và tiện lợi.

Quản trị hệ thống theo dõi quá trình giải quyết yêu cầu của các nhân viên, đảm bảo cho các yêu cầu của khách hàng được hỗ trợ kịp thời.

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<i><b>1.2. Đối tượng và phạm vi của ứng dụng </b></i>

<b>1.2.1. Đối tượng </b>

Hệ thống quản lý dịch vụ khách hàng (eSupport) được xây dựng hướng đến các đối tượng là các doanh nghiệp, công ty vừa và lớn trong cả nước song song đó là các khách hàng giao dịch với doanh nghiệp. Do nhu cầu cạnh tranh các doanh nghiệp cần phải phục vụ tốt khách hàng về các mặt hỗ trợ thông tin, giải đáp, vì thế các doanh nghiệp này cần có hệ thống hỗ trợ dịch vụ khách hàng để kịp thời đáp ứng yêu cầu của khách hàng trong quá trình giao dịch với doanh nghiệp.

<b>1.2.2. Phạm vi </b>

<small>Đầu vào: yêu cầu, tìm kiếm, download,… </small>

<small>Phân hệ hỗ trợ khách hàng </small>

<small>Phân hệ hỗ trợ hệ thống </small>

<small>Đầu ra: yêu cầu được giải quyết, vấn đề tìm kiếm được, … </small>

<small>Mơi trường: khách hàng, doanh nghiệp, … </small>

Hình 1-1: Phạm vi hệ thống

Hệ thống được xây dựng để hỗ trợ, phục vụ khách hàng trong phạm vi giữa doanh nghiệp và khách hàng xoay quanh các vấn đề về thông tin các sản phẩm và dịch vụ của doanh nghiệp.

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<i><b>1.3. Mục tiêu cần đạt được và các cách tiếp cận bài toán </b></i>

<b>1.3.1. Mục tiêu cần đạt được </b>

<b>1.3.1.1. Yêu cầu chức năng </b>

ƒ Yêu cầu chức năng nghiệp vụ

Thực hiện đầy đủ các chức năng nghiệp vụ như tìm kiếm yêu cầu, tạo yêu cầu, giải quyết yêu cầu, tải tài liệu, tìm kiếm thông tin, v.v.…

ƒ Yêu cầu chức năng hệ thống:

Thực hiện các chức năng tự động như: gởi câu trả lời cho khách hàng qua email, gởi thông báo qua email, thống kê, nhận yêu cầu của khách hàng qua email, v.v…Việc lưu trữ dữ liệu phải đạt chi phí tối thiểu và có sự ổn định cao.

<b>1.3.1.2. Yêu cầu phi chức năng </b>

Hệ thống hỗ trợ dịch vụ khách hàng làm việc hiệu quả, có thể giúp doanh nghiệp giảm chi phí về thời gian và nhân lực, giúp doanh nghiệp giải đáp nhanh và chính xác khi khách hàng có u cầu, có thể hỗ trợ trực tuyến (online), v.v…

<b>1.3.2. Các cách tiếp cận bài toán </b>

Hệ thống hỗ trợ dịch vụ khách hàng khơng cịn xa lạ với các doanh nghiệp trong cả nước vì tầm quan trọng và ích lợi của nó trong vấn đề giao dịch với khách hàng. Vì thế nhu cầu xây dựng một hệ thống phục vụ khách hàng cho doanh nghiệp là cần thiết và tất yếu. Nhưng khi bắt đầu xây dựng hệ thống,

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

điều quan tâm đầu tiên của chúng ta là gì? Bất cứ hệ thống nào vấn đề quan trọng đầu tiên cần được quan tâm là tổ chức tốt việc lưu trữ dữ liệu. Nếu dữ liệu được tổ chức tốt thì hệ thống của chúng ta sẽ cải thiện về mọi mặt như tốc độ truy xuất, chi phí lưu trữ, thời gian cập nhật, v.v…Như vậy, làm cách nào tổ chức tốt việc lưu trữ dữ liệu, nhất là ứng dụng của hệ thống dịch vụ khách hàng chạy trong môi trường Internet, môi trường đa người dùng. Ví dụ như khách hàng cần tìm kiếm những vấn đề về sản phẩm mà doanh nghiệp nào đó cung cấp, chúng ta lưu trữ dữ liệu như thế nào để cho việc tìm kiếm của khách hàng đạt hiệu quả là nhanh nhất. Để giải quyết vấn đề này, một số giải pháp cho vấn đề lưu trữ dữ liệu của hệ thống được đề nghị như sau:

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<i>Ưu điểm: Đây là mơ hình đang được sử dụng rất phổ biến vì tận dụng được </i>

những ưu điểm của hệ quản trị cơ sở dữ liệu.

<i>Khuyết điểm: Không linh động trong vấn đề trao đổi dữ liệu giữa các hệ </i>

thống khác nhau đặc biệt là khi ứng dụng chạy trên web.

<i>Ưu điểm: Không phụ thuộc vào bất cứ hệ quản trị nào, dễ thực hiện. </i>

<i>Khuyết điểm: Việc thao tác truy vấn trên tập tin XML</i><sup>2</sup> còn nhiều hạn chế và vấn đề bảo mật không bằng hệ quản trị.

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

Hình 1-4: Giải pháp 3

<i>Ưu điểm: Tận dụng được cả hai cách lưu trữ đó là trên tập tin và trên hệ </i>

quản trị.

<i>Khuyết điểm: Không phải tập tin XML nào cũng có thể đọc/ghi bằng đối </i>

tượng Datatable vì có nhiều tập tin XML lưu trữ phức tạp.

<b>1.3.2.4. Giải pháp 4 </b>

Theo giải pháp này, việc lưu trữ dữ liệu được tổ chức theo mơ hình sau:

Hình 1-5: Giải pháp 4

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<i>Ưu điểm: Mơ hình này nghiên về việc lưu trữ trên tập tin XML. Và việc </i>

trao đổi giữa một đối tượng XMLDom và cơ sở dữ liệu quan hệ cũng dễ dàng vì từ SQL Server 2000 trở lên đã hỗ trợ truy xuất trên tập tin XML.

<i>Khuyết điểm: Mặc dù từ SQL 2000 trở lên có hỗ trợ XML nhưng việc tạo </i>

ra tập tin XML vẫn còn bị lỗi do không thể tạo ra đúng cấu trúc mà người dùng mong đợi nếu như cấu trúc XML đó phức tạp.

<b>1.3.2.5. Giải pháp 5 </b>

Theo giải pháp này, việc lưu trữ dữ liệu được tổ chức theo mơ hình sau:

Hình 1-6: Giải pháp 5

<i>Ưu điểm: Việc đọc/ghi trên từng đối tượng đã được tách riêng biệt ra để </i>

mỗi đối tượng chỉ làm đúng nhiệm vụ của đối tượng đó nên thuận tiện trong vấn đề xử lý.

<i>Khuyết điểm: Vấn đề là làm cách nào để thực hiện việc chuyển đổi từ đối </i>

tượng XMLDom thành đối tượng Datatable và ngược lại.

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<b>1.3.2.6. Giải pháp 6 </b>

Theo giải pháp này, việc lưu trữ dữ liệu được tổ chức theo mơ hình sau:

Hình 1-7: Giải pháp 6

<i>Ưu điểm: Việc trao đổi thông tin giữa các đối tượng rất linh động, vì một </i>

đối tượng XMLDom có thể đọc/ghi trực tiếp đến CSDL quan hệ hoặc có thể thơng qua một Datatable.

<i>Khuyết điểm: Do có nhiều cách đọc/ghi nên phức tạp, khó quản lý. </i>

#

Kết luận: Mỗi giải pháp có ưu điểm và khuyết điểm khác nhau. Việc chọn lựa mơ hình nào sẽ tùy thuộc vào nhu cầu của ứng dụng của chúng ta. Nghĩa là ứng dụng của chúng ta sẽ quan tâm vấn đề nào? Vấn đề nào là vấn đề được quan tâm hàng đầu thì lúc đó chúng ta sẽ lựa chọn giải pháp lưu trữ dữ liệu cho phù hợp.

<b>1.3.3. Vấn đề đặt ra cho hệ thống hỗ trợ dịch vụ khách hàng </b>

Vấn đề quan tâm hàng đầu của hệ thống là làm sao tăng tốc độ thực hiện các thao tác truy vấn trên cơ sở dữ liệu quan hệ. Ví dụ như khách hàng cần tìm kiếm thông tin trong hệ thống FAQ, khách hàng sẽ nhập vào câu hỏi cần tìm kiếm, sau đó chương trình sẽ thực hiện kết nối với SQL để thực hiện câu

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

truy vấn trả về thơng tin tìm kiếm được cho khách hàng. Mơ hình thực hiện được mơ tả như sau:

Hình 1-8: Mơ hình truy vấn dữ liệu

Như vậy, nếu có nhiều khách hàng có nhu cầu tìm kiếm thì mỗi khách hàng đều phải kết nối đến SQL Server để lấy dữ liệu. Và sẽ có trường hợp nhiều khách hàng đều cùng truy vấn đến cùng một dữ liệu, khi đó thời gian thực hiện câu truy vấn để trả về kết quả sẽ rất chậm do phải thực hiện việc điều khiển đồng thời, phân bổ tài nguyên để thực hiện câu truy vấn tại CSDL. Một vấn đề khác đặt ra cho hệ thống là khơng chỉ tìm kiếm được vấn đề dựa trên câu hỏi mà phải tìm kiếm được tất cả những vấn đề có liên quan đến nội dung câu hỏi. Nghĩa là nếu khách hàng nhập vào câu hỏi: “các vấn đề liên quan đến mạng và email” thì hệ thống sẽ phải trả về tất cả những vấn đề có liên quan đến từ khóa “mạng” và “email”. Như vậy nếu chỉ đơn thuần tổ chức trên CSDL quan hệ thì khơng thể giải quyết được vấn đề này vì với cách thực hiện trên CSDL quan hệ, mà cụ thể là SQL Server 2000, nó sẽ tìm đúng cụm

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

từ “các vấn đề liên quan đến mạng và email” và nếu trong CSDL khơng có đúng cụm từ này thì kết quả trả về là khơng có, trong khi mong đợi của người dùng là trả ra những vấn đề có liên quan đến “mạng” và “email”.

Tóm lại: Chúng ta có hai vấn đề cần giải quyết khi lưu trữ dữ liệu trên SQL Server

− Tốc độ thực hiện câu truy vấn. − Việc tìm kiếm thơng tin hiệu quả

Làm sao giải quyết được bài toán đặt ra cho hệ thống khi chỉ lưu trữ trên CSDL quan hệ.

<i><b>1.4. Hướng giải quyết bài toán </b></i>

Chúng ta thấy được việc sử dụng giải pháp 1 để lưu trữ dữ liệu sẽ không giải quyết được những vấn đề đặt ra cho bài tốn. Và như vậy cần thiết phải sử dụng mơ hình khác để hệ thống thực hiện khả thi hơn.

Sau đây, chúng ta sẽ xem qua cách hệ thống thực hiện để giải quyết lần lượt các vấn đề trên, và từ đó chọn ra giải pháp lưu trữ thích hợp nhất.

<b>1.4.1. Về tốc độ thực hiện câu truy vấn </b>

Nhu cầu khách hàng tìm kiếm các vấn đề cần giải đáp là thường xuyên xảy ra và với tần suất rất cao nên việc lưu trữ trong SQL Server sẽ không khả thi. Nên chúng ta sẽ sử dụng thêm một cách lưu trữ nữa đó là trên tập tin mà cụ thể là trên tập tin XML. Giải pháp thực hiện cụ thể như sau:

<i>Giả sử trong SQL Server ta lưu trữ dữ liệu của bảng Câu hỏi-Trả Lời </i>

(FAQ) như sau:

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<b><small>FAQ_ID FAQ_QUESTION FAQ_ANSWER … FAQ_TOP_ID</small></b>

<small>FAQ00001 </small> <sup>Cách nhận biết người nhận </sup><small>thư đã đọc thư của mình hay chưa? </small>

<small>Bạn làm theo các </small>

<small>FAQ00002 </small> <sup>Hỏi về phần mềm gõ tiếng </sup><sub>Việt? </sub> <sup>Unikey là một phần </sup><sub>mềm….. </sub> <small>… TOP002 </small>

<small> <FAQ_Ngay_Cap_Nhat> 10-7-2005 </FAQ_Ngay_Cap_Nhat> <FAQ_Ma_Chu_De> TOP001 </FAQ_Ma_Chu_De> </small>

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

<b><small> Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<small> <FAQ_Cau_Tra_Loi>…..</FAQ_Cau_Tra_Loi> </small>

<small> <FAQ_Ngay_Cap_Nhat>…..</FAQ_Ngay_Cap_Nhat> …. </small>

<small>………. ………. </small>

Như vậy, mỗi khi khách hàng có nhu cầu tìm kiếm trong hệ thống FAQ, thì khơng cần phải thực hiện kết nối đến SQL Server, mà chỉ cần mở tập tin FAQ.xml và thực hiện việc truy vấn trên tập tin XML, cuối cùng trả về kết quả cho khách hàng. Như vậy, việc thực hiện trên tập tin sẽ nhanh hơn rất nhiều so với cơ sở dữ liệu (mở kết nối, tìm kiếm dữ liệu và thực hiện truy vấn trên dữ liệu tìm được để cuối cùng cho ra kết quả như mong muốn =>truy vấn chậm).

Mơ hình minh họa như sau:

Hình 1-9: Mơ hình truy vấn dữ liệu có hỗ trợ XML

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<b>1.4.2. Vấn đề tìm kiếm thơng tin </b>

Muốn kết quả tìm kiếm đúng như mong muốn người dùng thì phải dựa vào ngữ nghĩa của nội dung câu hỏi mà người dùng nhập vào. Để làm được điều này thì phải dựa vào từ điển mới biết được chính xác ngữ nghĩa của câu.

Theo đó, dựa trên tập tin FAQ.xml ở trên, chương trình sẽ trích từ dựa trên từ điển bằng phương pháp LRMM (Left Right Maximum Matching)[4].

Sau đây là mơ hình minh họa cho q trình xử lý

<small>Yêu cầu tìm kiếm</small> <sup>Danh sách</sup>

<small>các từ khóa</small>

XML

<small>Trích từ vàloại bỏ từ thừa</small>

<small>Bảng dữ liệu</small>

<small>Trích từ vàloại bỏ từ thừa</small>

<small>Danh sáchcác từ khóaTạo chỉ mục</small>

<b><small>Kết quảhiển thị</small></b>

Hình 1-10: Mơ hình xử lý tìm kiếm

Theo phương pháp LRMM, để phân đoạn từ tiếng Việt trong một ngữ/câu, ta đi từ trái sang phải và chọn từ có nhiều âm tiết nhất mà có mặt trong từ điển, rồi cứ tiếp tục cho từ kế tiếp cho đến hết câu. Với cách này, ta dễ dàng tách được chính xác các ngữ câu như: “hợp tác xã | mua bán”; “thành lập | nước | Việt Nam | dân chủ | cộng hòa”…Tuy nhiên, phương pháp này sẽ tách từ sai trong các trường hợp như: “học sinh | học sinh | học”; “một | ông | quan tài | giỏi”. Mặc dù vậy, phương pháp này cũng tách từ chính xác đến 95%

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

(theo giáo trình Xử lý ngơn ngữ tự nhiên). Vì vậy nhóm chúng em quyết định chọn phương pháp này để sử dụng trong việc trích từ này mặc dù nó chưa phải là phương pháp tối ưu nhất.

Trở lại vấn đề trích từ cho tập tin FAQ.xml, bằng phương pháp LRMM, chúng ta sẽ trích được các từ trong tập tin FAQ.xml và lưu thành một tập tin FAQ_Word.xml với cấu trúc như sau:

<small><WORDs> </small>

<small> <FAQ FAQ_ID="FAQ00003"/> </small>

<small> <FAQ FAQ_ID="FAQ00005"/> </small>

<small> <FAQ FAQ_ID="FAQ00011"/> </small>

<small> <FAQ FAQ_ID="FAQ00012"/> </small>

<small> <FAQ FAQ_ID="FAQ00013"/> </small>

<small> <FAQ FAQ_ID="FAQ00017"/> </WORD> </small>

<small> <FAQ FAQ_ID="FAQ00008"/> </small>

<small> <FAQ FAQ_ID="FAQ00019"/> </WORD> </small>

<small>………. ………. </small>

<i>Chú thích: Danh sách các thẻ <FAQ>…</FAQ> trong mỗi thẻ <WORD>…</WORDS> cho biết ứng với từ này thì có những tài liệu nào liên quan đến nó. </i>

Tập tin FAQ_Word.xml này sau đó sẽ qua một khâu nữa đó là loại bỏ những từ thừa gọi là kỹ thuật “stoplist”. Chúng ta sẽ duyệt qua các từ trong tập tin FAQ_Word.xml và so sánh với tập tin Stoplist.xml (đây là tập tin lưu

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

<b><small> Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

những từ thừa), sau đó tiến hành loại bỏ những từ khơng có nghĩa để cuối cùng được một tập tin FaqDaLoaiStopList.xml với kích thước tập tin giảm đáng kể so với tập tin FAQ_Word.xml do đã bỏ đi những từ khơng có nghĩa. Đây sẽ là tập tin chúng ta mong muốn để thực hiện việc so khớp khi khách hàng nhập vào một câu truy vấn.

Như vậy, mỗi khi khách hàng nhập vào nội dung câu hỏi cần tìm kiếm, nội dung câu hỏi này sẽ được phân đoạn thành những cụm từ và sẽ loại bỏ những từ thừa, chỉ giữ lại những từ có nghĩa. Và những cụm từ này sẽ được so khớp với tập tin FaqDaLoaiStopList.xml để trả về kết quả truy vấn cho người dùng (xem hình 1.10). Với cách thực hiện này, tất cả những vấn đề có liên quan đến nội dung câu hỏi sẽ được trả về cho người dùng và tất cả những điều này đều thực hiện trên tập tin XML nên sẽ truy vấn rất nhanh. Như vậy vấn đề đặt ra đã được giải quyết.

Và bây giờ thì chúng ta đã biết được hệ thống quản lý dịch vụ khách hàng sẽ chọn giải pháp nào để lưu trữ dữ liệu. Đó là giải pháp 5 vì theo như giải pháp này, việc lưu trữ dữ liệu sẽ sử dụng cả trên tập tin XML và trên cơ sở dữ liệu quan hệ.

Mặt khác, việc chọn giải pháp 5 này là do nhu cầu cần thiết phải sử dụng thêm XML để hỗ trợ trong vấn đề lưu trữ và truy xuất trên hệ thống. Đó là khi dữ liệu được lưu thơng trên mơi trường web thì vấn đề trao đổi thơng tin giữa các hệ thống khác nhau là yếu tố cần được xem xét. Do XML giải quyết rất tốt trong vấn đề này nên cần thiết sử dụng thêm XML. Sau đây là mơ hình để thấy được vai trị của XML:

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

Hình 1-11: Mơ hình mơ tả vai trò của XML

#

Kết luận: Trên đây là một cách nhìn tổng quan về cách thực hiện cũng như là vấn đề lưu trữ của hệ thống hỗ trợ dịch vụ khách hàng. Như vậy, chúng ta muốn tạo lập được những tài liệu XML như mong muốn và thực hiện truy vấn trên tập tin này thì điều tối thiểu là phải biết được XML là gì cũng như các thao tác thực hiện truy vấn trên tập tin XML như thế nào? Vấn đề như thế nào, chúng ta sẽ xem tiếp qua chương sau.

</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<b>Chương 2: NGHIÊN CỨU CÔNG NGHỆ XML </b>

<i><b>2.1. Tổng quan về XML </b></i>

<b>2.1.1. Giới thiệu </b>

XML (Extensible Markup Language) ra đời vào tháng 2/1998, là ngôn ngữ có kiến trúc gần giống với HTML nhưng XML nhanh chóng trở thành một chuẩn phổ biến trong việc chuyển đổi thông tin qua các trang web sử dụng giao thức HTTP. Trong khi HTML là ngôn ngữ chủ yếu về hiển thị dữ liệu thì XML lại đang phát triển mạnh về việc chuyển tải, trao đổi và thao tác dữ liệu bằng XML. XML đưa ra một định dạng chuẩn cho cấu trúc của dữ liệu hoặc thông tin bằng việc tự định nghĩa định dạng của tài liệu. Bằng cách này, dữ liệu được lưu trữ bằng XML sẽ độc lập với việc xử lý. Vì vậy XML ra đời sẽ đáp ứng được yêu cầu ngày càng cao của các nhà lập trình trong vấn đề trao đổi và xử lý thông tin.

<b>2.1.2. Mục tiêu ra đời và lợi ích khi sử dụng XML </b>

<b>2.1.2.1. Mục tiêu ra đời của XML </b>

Ngày nay, XML đang trở thành một chuẩn chung cho việc trao đổi dữ liệu cho những ứng dụng chạy trên mơi trường Internet. Vì XML cho phép người dùng có thể tự định nghĩa các thẻ (tag) - những thẻ này làm cho tài liệu XML đa dạng hơn những ngôn ngữ thông thường như HTML. Như vậy mục tiêu đặt ra cho sự ra đời XML là gì? Đó là, đầu tiên nó sẽ tương thích với SGML, và dễ dàng viết những chương trình để xử lý cho những tài liệu XML. Kế

</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

tiếp, những tài liệu XML rõ ràng, dễ đọc, dễ dàng tạo lập. Và điều quan trọng là nó được hỗ trợ trong nhiều ứng dụng. Nói tóm lại, XML dễ dàng chia sẻ thông tin qua những định dạng khác nhau thông qua môi trường web. XML được thiết kế dành cho mọi người, được mọi người sử dụng.

<b>2.1.2.2. Lợi ích khi sử dụng XML </b>

Trong q trình trưởng thành và phát triển, XML đã đối mặt và đương đầu với nhiều thử thách trong việc thuyết phục các nhà lập trình rằng XML là sự lựa chọn hàng đầu vì nó dễ dàng để hiểu, dễ dàng để đọc, và dễ dàng thực hiện. Sau đây là một số lợi ích khi sử dụng XML

ƒ XML có thể tách rời dữ liệu. Sử dụng XML, dữ liệu được chứa trong các tập tin XML riêng biệt.

ƒ XML có thể mơ tả thơng tin của những đối tượng phức tạp mà cơ sở dữ liệu quan hệ không thể giải quyết được.

ƒ XML có thể dùng để chuyển đổi dữ liệu giữa các hệ thống khơng tương thích.

ƒ XML dùng để chia sẻ dữ liệu với những tập tin văn bản đơn giản dễ hiểu.

ƒ XML cũng được dùng để lưu trữ dữ liệu, có thể làm cho dữ liệu của chúng ta hữu ích hơn.

Như vậy, chúng ta đã biết được lợi ích và vai trò của XML trong vấn đề lưu trữ và trao đổi thông tin. Vấn đề bây giờ là nếu chúng ta muốn có một tài liệu XML thì phải làm như thế nào?

</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">

<b><small> Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<b>2.1.3. Một tài liệu XML trông như thế nào? </b>

Mục đích của việc tổ chức thơng tin là để con người có thể đọc và hiểu được những gì mà nó muốn truyền tải. Chúng ta xem một tập tin văn bản sau đây:

<small>F10 Shimano Calcutta 47.76 F20 Bantam Lexica 49.99 </small>

Theo cách tổ chức thơng tin của tập tin trên, chúng ta thật khó để hiểu tập tin này muốn nói lên điều gì. Bây giờ, chúng ta tổ chức tập tin trên theo định dạng một tài liệu XML một cách đơn giản nhất.

<small><?xml version="1.0"?> <Catalog> </small>

<small> <ProductID>F20</ProductID> </small>

<small> <ProductName>Bantam Lexica</ProductName> <ListPrice>49.99</ListPrice> </small>

<small> </Product> </Catalog> </small>

Như vậy, bằng cách sử dụng định dạng XML, người dùng có thể hiểu và biết được tập tin trên đang muốn truyền tải nội dung gì.

<b>2.1.4. Tạo lập một tài liệu XML </b>

Chúng ta có thể sử dụng trình soạn thảo đơn giản nhất là Notepad để soạn thảo tài liệu XML, nhưng phải tuân thủ theo qui tắc sau:

</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<small><root> </small>

<small> <child> </small>

<small> <subchild>…..</subchild> .... </small>

<small> </child> .... </root> </small>

Theo định dạng trên, chúng ta thấy tuy tài liệu XML rất đơn giản nhưng qui định cũng rất nghiêm ngặt, có nghĩa là các tài liệu XML đều xuất phát từ nút gốc (root), và mỗi phần tử phải có thẻ đóng và thẻ mở “< …/>”.

<b>2.1.5. Những thành phần của một tài liệu XML </b>

ƒ Khai báo: Mỗi một tài liệu XML có một chỉ thị khai báo

ƒ Phần tử gốc (root): Trong tài liệu XML, chỉ có một phần tử gốc, và phần tử này sẽ chứa tất cả những phần tử của tài liệu XML do chúng ta tạo ra.

<b>Theo ví dụ trên, ta thấy chỉ có một phần tử “Catalog” . </b>

ƒ Thuộc tính (Attributes): Như đã trình bày ở trên, một phần tử có thể chứa dữ liệu hoặc chứa phần tử khác hoặc cả hai. Bên cạnh đó, phần tử có thể rỗng, khi đó nó có thể chứa thuộc tính. Một thuộc tính chỉ là một sự lựa

</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">

<b><small> Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

chọn để gắn dữ liệu đến phần tử. Một thuộc tính đặt trong thẻ mở của phần tử và chỉ ra giá trị của nó bằng cách sử dụng cặp “name=value”.

<small><?xml version="1.0"?> <Catalog> </small>

<small> <Product </small><b><small>Type="Spinning Reel" SupplierId="5"</small></b><small>> <ProductID>F10</ProductID> </small>

<small> <ProductName>Shimano Calcutta </ProductName> <ListPrice>47.76</ListPrice> </small>

<small> </Product> </small>

<small> <Product </small><b><small>Type ="Baitcasting Reel" SupplierId="3"</small></b><small>> <ProductID>F20</ProductID> </small>

<small> <ProductName>Bantam Lexica</ProductName> <ListPrice>49.99</ListPrice> </small>

<small> </Product> </Catalog> </small>

<b>2.1.6. Một tài liệu XML hợp lệ </b>

Như chúng ta đã đề cập ở trên, một tài liệu XML hợp khuôn dạng là yếu tố đầu tiên khi tạo lập tài liệu. Hợp khuôn dạng có nghĩa là mỗi tài liệu chỉ có một nút gốc, mỗi phần tử phải có thẻ mở và thẻ đóng, và phải lồng nhau chính xác, và cuối cùng là tên thuộc tính chỉ xuất hiện một lần trong thẻ mở. Nhưng một tài liệu XML hợp khuôn dạng khơng có nghĩa là nó hợp lệ. Muốn kiểm tra sự hợp lệ của một tài liệu XML ta phải dựa vào DTD (Document Type Definition) hoặc Schema XML.

<b>2.1.6.1. DTD (Document Type Definition) </b>

DTD và Schema là hai cách khác nhau để qui định những luật về nội dung của một tài liệu XML. Tuy nhiên DTD có một vài hạn chế. Đầu tiên, tài liệu DTD không sử dụng định dạng XML, nghĩa là bản thân DTD khơng phải là

</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">

<b><small> Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

một tài liệu XML. Điều thứ hai là kiểu dữ liệu có sẵn dùng để định nghĩa nội dung của một thuộc tính hoặc một phần tử thì rất giới hạn trong DTD. Điều thứ ba là DTD khơng có khả năng mở rộng và không hỗ trợ namespace. Cuối cùng là do không viết theo định dạng XML nên DTD khó viết và khó hiểu. Vì vậy, việc sử dụng DTD để kiểm tra sự hợp lệ của một tài liệu XML là không khả thi. Chúng ta cần có một sự lựa chọn khác khả thi hơn để kiếm tra sự hợp lệ của tài liệu XML. Đó là chúng ta sử dụng lược đồ XML - Schema XML Definition (XSD).

<b>2.1.6.2. Lược đồ XML (Schema XML) </b>

<i><b>2.1.6.2.1. Định nghĩa lược đồ XML </b></i>

Một lược đồ đơn giản chỉ là một tập những luật được định nghĩa lại để mô tả nội dung dữ liệu của một tài liệu XML. Nó tương tự như một định nghĩa cấu trúc bảng trong cơ sở dữ liệu quan hệ. Trong lược đồ XML, chúng ta định nghĩa một tài liệu XML, những phần tử của nó, những kiểu dữ liệu của phần tử và những thuộc tính liên quan, và điều quan trọng nhất là mối quan hệ “cha-con” giữa những phần tử. Chúng ta có thể tạo lược đồ trong nhiều cách khác nhau. Cách đơn giản nhất là sử dụng Notepad. Sau đây là một ví dụ một lược đồ XML

<small><xsd:schemaid="Catalog" </small>

<small>targetNamespace=" xmlns=" </small>

<small>xmlns:xsd=" </small>

<small>xmlns:msdata="urn:schemas-microsoft-com:xml-msdata" attributeFormDefault="qualified" </small>

<small>elementFormDefault="qualified"> <xsd:elementname="Catalog" </small>

<small>msdata:IsDataSet="true" </small>

</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<small>msdata:EnforceConstraints="False"> <xsd:complexType> </small>

<small><xsd:choicemaxOccurs="unbounded"> <xsd:elementname="Product"> </small>

<small><xsd:complexType> <xsd:sequence> </small>

<small><xsd:element name="ProductID" </small>

<small>minOccurs="0"/> <xsd:element </small>

<small>name="ProductName" type="xsd:string" minOccurs="0"/> <xsd:element </small>

<small>name="ListPrice" type="xsd:string" minOccurs="0"/></small>

<i><b>2.1.6.2.2. Các kiểu dữ liệu trong lược đồ XML </b></i>

Khi tập tin XML hoạt động như một cơ sở dữ liệu, và XSL, XPath được sử dụng để truy vấn trên tập tin XML giống như một số ngôn ngữ truy vấn trong SQL, thì lúc này chúng ta cần biết được vị trí của từng phần tử trong tập tin XML được khai báo ở đâu và với kiểu dữ liệu như thế nào. Vì trong bất kỳ cơ sở dữ liệu quan hệ nào, ví dụ như SQL Server hoặc Oracle, tất cả những cột đều được định nghĩa kiểu dữ liệu, và vì vậy thật sự cần thiết phải có kiểu dữ liệu trong lược đồ XML.

</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

Có hai loại kiểu dữ liệu trong lược đồ XML đó là kiểu dữ liệu cơ bản và kiểu dữ liệu mở rộng. Kiểu dữ liệu cơ bản là kiểu dữ liệu khơng bắt nguồn từ kiểu dữ liệu nào ví dụ như kiểu dữ liệu float. Kiểu dữ liệu mở rộng dựa trên

<i>những kiểu dữ liệu khác ví dụ như kiểu integer dựa trên kiểu decimal. </i>

Kiểu dữ liệu cơ bản được định nghĩa cho mục đích của lược đồ XML thì khơng nhất thiết phải giống với một số cơ sở dữ liệu khác. Sau đây là danh sách các kiểu dữ liệu của lược đồ XML.

<small>Kiểu dữ liệu cơ bản Kiểu dữ liệu mở rộng Kiểu ràng buộc </small>

<small>Boolean Token minLength </small>

<small>Double NMTOKENS enumeration dateTime NCName maxInclusive </small>

<small>base64Binary negativeInteger </small>

<small> long int short byte </small>

</div><span class="text_page_counter">Trang 34</span><div class="page_container" data-page="34">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<small> nonNegativeInteger unsignedLong unsignedInt unsignedShort unsignedByte positiveInteger </small>

Bảng 2-1: Danh sách các kiểu dữ liệu của lược đồ XML

<b>2.1.7. XPath </b>

Qua phần trình bày trên, chúng ta biết được cấu trúc và cú pháp của XML tương đối đơn giản. Bước tiếp theo là tìm hiểu cách nào để xử lý một tài liệu XML.

Như vậy để xử lý một tài liệu XML, chương trình ứng dụng phải có cách di chuyển bên trong tài liệu để lấy ra giá trị của các phần tử (Elements) hay

<b>thuộc tính (Attributes). Do đó ngơn ngữ XML Path được ra đời, mà chúng ta gọi tắt là XPath. XPath đóng một vai trò quan trọng trong việc truy vấn dữ </b>

liệu cho các chương trình ứng dụng vì nó cho phép ta lựa chọn hay sàng lọc ra những phần tử nào mình muốn để trao đổi hay hiển thị.

Nếu khi làm việc với cơ sở dữ liệu ta dùng các phát biểu SQL như

<i>SELECT .. FROM table_name WHERE ... để trích ra một số mẩu tin từ một </i>

bảng, thì khi làm việc với tập tin XML, XPath cho ta những biểu thức (expressions) về điều kiện (criteria) giống như mệnh đề WHERE trong SQL.

XPath là một ngôn ngữ dùng để xử lý truy vấn trên tài liệu XML, cũng giống như SQL là một chuẩn để làm việc với cơ sở dữ liệu. Một biểu thức

</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35">

<b><small> Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

XPath có thể chỉ ra vị trí và mẫu nào để kết hợp. Chúng ta có thể áp dụng tốn

<i>tử boolean, hàm string, và toán tử số học trong biếu thức XPath để xây dựng </i>

câu truy vấn phức tạp trên tài liệu XML. XPath cũng cung cấp một số hàm về số như tính tổng, hàm làm trịn (round), v.v….

<b>2.1.8. Nhận xét về XML </b>

XML được xây dựng như là một chuẩn cho việc trình bày và trao đổi dữ liệu trên web. Tập đoàn W3C<sup>3</sup> đã xây dựng chuẩn XML và những công nghệ liên quan bao gồm XML DOM, XPath, XSL, và XML Schema. Trong đó XML DOM được sử dụng để tạo, thay đổi, và duyệt qua tài liệu XML. XPath là ngôn ngữ dùng để truy vấn trên tài liệu XML. XSL dùng để chuyển đổi tài liệu XML từ dạng này sang dạng khác. XML Schema định nghĩa cấu trúc và kiểu dữ liệu cho những nút trong một tài liệu XML. Tất cả những công nghệ này đã tạo nên sức mạnh cho XML. Vì thế, XML ngày nay đang được sử dụng rất phổ biến và tương lai sẽ là một chuẩn duy nhất được dùng trên web.

<i><b>2.2. Cách sử dụng một tài liệu XML </b></i>

Khi chúng ta đã có một tài liệu XML, chúng ta sẽ tự hỏi: sử dụng nó như thế nào và làm thế nào để truy cập đến một tập tin XML. Sau đây, là một số kỹ thuật được sử dụng trong mội trường Visual Studio.NET để làm việc với tập tin XML.

<small>3 World Wide Web Consortium </small>

</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<b>2.2.1. Đọc và phân tích tài liệu XML </b>

<b>2.2.1.1. Sử dụng lớp XMLTextReader </b>

<i>Lớp XMLTextReader cung cấp một cursor được sử dụng để lấy dữ liệu từ </i>

một tài liệu XML. Chúng ta khai báo như sau:

<small>XmlTextReader myRdr = </small>

<small> new XmlTextReader(Server.MapPath("catalog2.xml"));</small>

Khi một thể hiện được tạo ra, con trỏ cursor sẽ được đặt ở đầu tài liệu.

<i><b>Chúng ta có thể sử dụng phương thức Read() để lấy những phần dữ liệu một </b></i>

cách tuần tự. Mỗi phần dữ liệu tương tự như một nút trong cây XML. Thuộc

<i><b>tính NodeType sẽ lấy kiểu của phần dữ liệu, thuộc tính Name sẽ lấy tên của nút, và Value sẽ lấy giá trị của nút. Vì thế, khi một phần dữ liệu được đọc, </b></i>

chúng ta có thể sử dụng câu lệnh sau để hiện thị tên, giá trị và kiểu của nút.

<small>Response.Write(myRdr.NodeType.ToString() </small>

<small> +" " + myRdr.Name + ":" + myRdr.Value); </small>

Nếu muốn kiểm tra nút đó có thuộc tính hay khơng, chúng ta có thể sử

<i><b>dụng phương thức HasAttributes. Nếu giá trị trả về của phương thức HasAttributes là true, chúng ta áp dụng phương thức MoveToAttribute(i) để </b></i>

lặp qua các thuộc tính của nút.

<small>if (myRdr.HasAttributes) { </small>

<small> for( inti= 0; i<myRdr.AttributeCount-1;i++) { </small>

<small>myRdr.MoveToAttribute(i); </small>

<small>Response.Write(myRdr.NodeType.ToString()+":"+ </small>

</div><span class="text_page_counter">Trang 37</span><div class="page_container" data-page="37">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<small> myRdr.Name+": "+myRdr.Value"</br>"); } </small>

<small>} </small>

<b>2.2.1.2. Sử dụng mơ hình DOM </b>

<i><b>Bên cạnh XMLTextReader thì mơ trường Visual Studio.NET cũng hỗ trợ </b></i>

mơ hình DOM (Document Object Module) để đọc và trình bày nội dung của một tập tin XML. Việc sử dụng mô hình DOM sẽ thơng qua một số đối tượng

<i><b>như XMLDocument, XMLDataDocument. Khi một XMLDocument được </b></i>

tạo ra, nó tổ chức nội dung của một tập tin XML thành một cây. Trong khi đối

<i><b>tượng XMLTextReader cung cấp một cursor định vị theo một hướng, thì XMLDocument cung cấp việc truy xuất nhanh và trực tiếp đến một nút. Tuy </b></i>

nhiên, việc sử dụng mơ hình DOM rất tốn bộ nhớ để lưu trữ thành một cây, và thật sự sẽ khó khăn khi tài liệu XML có kích thước lớn.

<i><b>Có nhiều cách khác nhau để tạo một đối tượng XMLDocument. Sau đây chúng ta sử dụng đối tượng XMLTextReader để tạo một XMLDocument. </b></i>

<small>{ </small>

<small>if(!Page.IsPostBack) { </small>

<small> XmlTextReader(Server.MapPath("Catalog2.xml"));myDoc.Load(myRdr); </small>

<small>Session("sessionDoc") =myDoc; </small>

<small>//khi cây được tạo ra, chúng ta có thể hiển thị lênlistbox //với thuộc tính InnerText của những node ProductName </small>

<small>for(i0;i<myDoc.DocumentElement.ChildNodes.Count-1;i++) </small>

</div><span class="text_page_counter">Trang 38</span><div class="page_container" data-page="38">

<b><small> Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<i><b>cần thiết cho ứng dụng của mình. Ví dụ như nếu nút đó là ProductName </b></i>

chúng ta sẽ đọc và hiển thị thông tin trên một listbox, cụ thể như sau:

<small>{ </small>

<small>if(XmlNoteType.Element) { </small>

<small>if (myRdr.Name="ProductName") { </small>

<small>myRdr.Read(); </small>

<small>lstProducts.Items.Add(myRdr.ReadString); } </small>

<small> } } </small>

<small>myRdr.Close(); </small>

</div><span class="text_page_counter">Trang 39</span><div class="page_container" data-page="39">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<b>2.2.2.2. Sử dụng mơ hình DOM </b>

Một cây được tạo thành từ nhiều nút. Và một nút cũng là một cây chứa những nút khác. Nút lá thì khơng có nút con, vì thế nút này dùng để hiển thị dữ liệu văn bản.

<i><b>Lớp XmlDataDocument kế thừa từ lớp XmlDocument, vì thế nó cũng có một số phương thức như lớp XmlDocument. Điều thú vị nhất của XmlDataDocument là nó cung cấp hai cách nhìn trên cùng một dữ liệu đó là </b></i>

<i>XML view và relational view. </i>

<i><b>XmlDataDocument có một thuộc tính tên là DataSet, thơng qua DataSet, XmlDataDocument trình bày dữ liệu như một hoặc nhiều bảng (DataTable) có quan hệ hoặc khơng có quan hệ. Khi chúng ta sử dụng phương thức Load() để tải một đối tượng XmlDataDocument, chúng ta có thể xem nó như một </b></i>

cây hoặc như một bảng (hoặc nhiều bảng). Sau đây là hình minh hoạ cho hai

<i><b>cách nhìn về một tài liệu XML khi sử dụng XmlDataDocument. </b></i>

Hình 2-1: Mơ hình DOM

</div><span class="text_page_counter">Trang 40</span><div class="page_container" data-page="40">

<b><small> Tìm hiểu cơng nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng </small></b>

<b>2.2.3. Truy vấn dữ liệu XML sử dụng XPathDocument và XPathNavigator </b>

<i><b>Việc sử dụng lớp XmlDocument và XmlDataDocument để xử lý tài liệu </b></i>

XML cũng có một vài hạn chế. Đầu tiên, tồn bộ tài liệu phải được lưu trong cache. Thêm vào đó, việc định hướng thông qua một cây sẽ gặp nhiều khó khăn, và định hướng thơng qua những view quan hệ cũng không thuận tiện.

<i><b>Để khắc phục vấn đề này, VS.NET cung cấp lớp XPathDocument và XPathNavigator. </b></i>

<i><b>Lớp XPathDocument cho phép chúng ta xử lý dữ liệu XML mà không phải tải lên toàn bộ cây. Và XPathNavigator sử dụng để thao tác trên dữ liệu của XPathDocument. Nó cũng được sử dụng để thao tác trên XmlDocument, và XmlDataDocument. Nó hỗ trợ kỹ thuật định hướng cho việc chọn nút, lặp </b></i>

qua các nút đã chọn, và làm việc trên những nút đã chọn này. Để thực hiện

<i><b>được việc này, nó sử dụng biểu thức XPath. </b></i>

<i><b>XPath chỉ ra cú pháp truy vấn cho việc rút trích dữ liệu từ một tài liệu </b></i>

XML. Ý tưởng sử dụng tương tự như trong SQL, tuy nhiên cú pháp của nó thì

<i><b>khác biệt. Nói chung, cú pháp truy vấn XPath có vẻ phức tạp. Tuy nhiên qua </b></i>

các ví dụ sau, Chúng ta có thể thấy được sự ngắn gọn và hiệu quả trong việc

<i><b>rút trích dữ liệu XML. Chi tiết về cú pháp của XPath sẽ không đi sâu trong </b></i>

bài viết này vì nó nghiên về lĩnh vực khác. Tuy nhiên, chúng ta cũng minh

<i><b>họa vài cách sử dụng biểu thức XPath. Sau đây chúng ta xem qua ví dụ một </b></i>

tài liệu XML mà sẽ được sử dụng để thực hiện truy vấn trên đó. Tài liệu này

<i><b>đặt tên là bank1.xml. </b></i>

<small><Bank> </small>

</div>

×