Tải bản đầy đủ (.pdf) (141 trang)

Quản lý cơ sở dữ liệu trên mạng Internet bằng mô hình cơ sở dữ liệu phân tán

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.45 MB, 141 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA CÔNG NGHỆ
––––––––––





Đăng Quỳnh Nga





QUẢN LÝ CƠ SỞ DỮ LIỆU TRÊN MẠNG INTERNET
BẰNG MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN




Chuyên ngành: Công nghệ thông tin
Mã số: 1.01.10






LUẬN VĂN THẠC SĨ












Hà Nội - 2004
ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA CÔNG NGHỆ
––––––––––





Đăng Quỳnh Nga






QUẢN LÝ CƠ SỞ DỮ LIỆU TRÊN MẠNG INTERNET
BẰNG MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN





Chuyên ngành: Công nghệ thông tin
Mã số: 1.01.10





LUẬN VĂN THẠC SĨ




NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS Phạm Văn Ất





Hà Nội - 2004

MỤC LỤC
Mở đầu 3
Chƣơng 1. Tìm hiểu về các hệ cơ sở dữ liệu phân tán 6
1.1 Xử lý dữ liệu phân tán 8
1.2 Hệ cơ sở dữ liệu phân tán là gì? 11
1.3 Triển vọng của các hệ cơ sở dữ liệu phân tán 16
1.3.1 Quản lý dữ liệu phân tán và nhân bản một cách vô hình 16
1.3.2 Độ tin cậy qua các giao dịch phân tán 25

1.3.3 Cải thiện hiệu năng 26
1.3.4 Tính dễ mở rộng 29
1.4 Các yếu tố phức tạp 29
1.5 Một số vấn đề còn tồn tại trong hệ CSDL phân tán 31
1.5.1 Thiết kế CSDL phân tán 31
1.5.2 Xử lý vấn tin phân tán 31
1.5.3 Quản lý thư mục phân tán 32
1.5.4 Điều khiển đồng thời phân tán 32
1.5.5 Quản lý khóa gài phân tán 32
1.5.6 Độ tin cậy của các hệ quản trị CSDL phân tán 33
1.5.7 Hỗ trợ hệ điều hành 33
1.5.8 CSDL đa chủng loại 33
1.5.9 Mối liên hệ giữa các vấn đề 34
Chƣơng 2. Các công nghệ hỗ trợ việc xây dựng phần mềm
quản lý cơ sở dữ liệu phân tán 37
2.1 Server 37
2.2 Hệ điều hành 37
2.3 Web Server 38
2.4 Giới thiệu về IIS - Internet Information Server 39
2.4.1 IIS là gì? 39
2.4.2 IIS có thể làm được gì? 39
2.4.3 IIS hoạt động như thế nào ? 39
2.4.4 Cài đặt IIS. 39
2.5. Đăng ký Website miễn phí trên Internet 42
2.6 Hệ CSDL quan hệ 45

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
2
2.6.1 SQL Server 45
2.6.2 MySQL 48

Chƣơng 3. Các ngôn ngữ lập trình dùng trong bài toán
quản lý trên mạng Internet 49
3.1 Ngôn ngữ định dạng HTML 49
3.1.1 Trang HTML mẫu 49
3.1.2 Các định dạng 50
3.1.3. Đưa hình ảnh vào trang WEB 52
3.1.4 Liên kết và URL 53
3.1.5 Tạo danh sách 53
3.1.6. Bảng 55
3.1.7. Chia trang Web thành các frame 59
3.1.8. Các ô điều khiển để nhập dữ liệu 60
3.1.9. Các nút lệnh 62
3.1.10 Bài trí Form 64
3.2. Ngôn ngữ kịch bản 64
3.2.1 Ngôn ngữ kịch bản VB Script 65
3.2.2 Ngôn ngữ kịch bản JAVA Script 76
3.3 Xây dựng trang web động với ASP 77
3.3.1 Mở đầu 77
3.3.2 Ngôn ngữ ASP 78
3.3.3 Các đối tượng trong ASP 85
3.3.4 Kết nối cơ sở dữ liệu 104
3.4 Vấn đề tiếng Việt trong website 122
Chƣơng 4. Phần mềm thực nghiệm: Quản lý đào tạo từ xa 123
4.1 Phân tích thiết kế 123
4.2 Website 124
4.3 Một số mã nguồn 128
4.3.1 Đăng ký học từ xa 128
4.3.2 Nhập điểm theo lớp, môn 132
Kết luận 137
Tài liệu tham khảo 137



Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
3

MỞ ĐẦU

Cơ sở dữ liệu nói chung và cơ sở dữ liệu phân tán nói riêng luôn luôn là một
lĩnh vực gây được nhiều sự chú ý do tính thực tiễn của nó, và gần đây, do sự phát
triển nhanh chóng của công nghệ truyền thông và sự bành trướng mạnh mẽ của
mạng Internet, cùng với xu thế toàn cầu hóa trong mọi lãnh vực, đặc biệt là về
thương mại, CSDL phân tán đã trở thành một lĩnh vực thu hút nhiều sự quan tâm
của các nhà nghiên cứu lý thuyết lẫn các nhà sản xuất phần mềm.
Nhiều ứng dụng hiện tại của công nghệ máy tính đang được phân tán như một
hệ quả tất yếu nhằm đáp ứng tốt hơn với việc phân bố ngày càng rộng rãi của các
nguồn dữ liệu cần thiết cho các chủ thể khác nhau như xí nghiệp, trường học, viện
nghiên cứu Tuy vậy ở Việt Nam chưa có nhiều nghiên cứu về vấn đề xử lý CSDL
phân tán để từ đó có thể đưa ra một tài liệu hướng dẫn đầy đủ từ lý thuyết đến thực
tế. Xuất pháp từ nhu cầu trên, tôi chọn hướng nghiên cứu về Cơ sở dữ liệu phân tán,
trên cơ sở đó xây dựng các bài toán quản lý trên mạng Internet phục vụ nhu cầu rất
cần thiết ở Việt Nam hiện nay góp phần phát triển kinh tế, khoa học và công nghệ.
Nội dung chính của đề tài là
- Tìm hiểu về mô hình cơ sở dữ liệu phân tán
- Giới thiệu các công nghệ, các ngôn ngữ phục vụ cho việc xây dựng một hệ
quản lý cơ sở dữ liệu phân tán.
- Xây dựng phần mềm thực nghiệm "Quản lý hệ đào tạo từ xa".
Luận văn gồm phần mở đầu, bốn chương và phần kết luận. Trong đó:
Chương 1. Tìm hiểu về các hệ cơ sở dữ liệu phân tán - giới thiệu việc xử lý dữ
liệu phân tán và bàn về các hệ cơ sở dữ liệu phân tán.
Chương 2. Các công nghệ hỗ trợ việc xây dựng phần mềm quản lý CSDL

phân tán - giới thiệu về cấu trúc Client/Server và các hệ quản trị cơ sở dữ liệu đang
được dùng thông dụng hiện nay.

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
4
Chương 3. Các ngôn ngữ lập trình dùng trong bài toán quản lý trên mạng
Internet - Giới thiệu các ngôn ngữ lập trình hiện nay đang được sử dụng để xây
dựng phần mềm quản lý CSDL phân tán:
- HTML: Xây dựng các trang web tĩnh
- VB Script, Java Script: là ngôn ngữ kịch bản để xử lý dữ liệu, xử lý các sự
kiện trên các mẫu biểu ngay tại User trước khi dữ liệu được gửi về Server.
- ASP: Xây dựng trang Web động và kết nối CSDL.
Chương 4. Phần mềm thực nghiệm: Quản lý hệ đào tạo từ xa - giới thiệu cách
xây dựng một trang web cụ thể.
Phần kết luận tổng hợp những kết quả nghiên cứu của luận văn, chỉ ra một số
hạn chế chưa hoàn thiện. Đồng thời đề xuất một số hướng nghiên cứu cụ thể tiếp
theo của tác giả luận văn.



Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
5
BẢNG CHÚ GIẢI MỘT SỐ CỤM TỪ VIẾT TẮT

ASP
Active Server Pages
CNTT
Công nghệ thông tin
CSDL
Cơ sở dữ liệu

DDBS
Distributed Database Systems – Cơ sở dữ liệu phân tán
DBMS
Distributed Database Management System -
Hệ quản trị CSDL phân tán
HĐH
Hệ điều hành
HTML
Hyper Text Markup Language
IIS
Internet Information System
SQL
Structure Query Language
WWW
World Wide Web


BẢNG CHÚ GIẢI MỘT SỐ THUẬT NGỮ TIẾNG VIỆT

Đa phương tiện
Multimedia
Đào tạo từ xa
Distance learning
Mật khẩu
Password
Máy chủ
Server
Máy khách
Client
Tên định danh

Username
Thảo luận trực tuyến
Chat
Thư điện tử
Email
Văn bản
Text

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
6
CHƢƠNG 1. TÌM HIỂU VỀ CÁC HỆ CƠ SỞ DỮ LIỆU PHÂN TÁN
Công nghệ về các hệ cơ sở dữ liệu phân tán (distributed database systems,
DDBS) là sự hợp nhất của hai hướng tiếp cận đối với quá trình xử lý dữ liệu: công
nghệ CSDL và công nghệ mạng máy tính. Các hệ CSDL chuyển mình từ mô hình
xử lý dữ liệu, trong đó mỗi ứng dụng định nghĩa và duy trì dữ liệu của riêng chúng
(Hình l.l), sang mô hình định nghĩa và quản lý dữ liệu tập trung (Hình 1.2). Hướng
đi này đã dẫn đến tính độc lập dữ liệu (data independence), nghĩa là các ứng dụng được
"miễn nhiễm" với những thay đổi về tổ chức logic hoặc vật lý của dữ liệu và ngược lại.









Hình 1.1 Mô hình xử lý dữ liệu
Một trong những động lực chủ yếu thúc đẩy việc sử dụng hệ CSDL là nhu cầu
tích hợp các dữ liệu của một xí nghiệp và cho phép truy xuất tập trung, nhờ vậy có

thể điều khiển được các truy xuất đến dữ liệu. Còn công nghệ mạng máy tính đi
ngược lại với mọi nỗ lực tập trung hóa. Nhìn thoáng qua, chúng ta rất khó hình
dung ra làm cách nào tổng hợp hai hướng tiếp cận trái ngược nhau để cho ra một
công nghệ mạnh mẽ và nhiều hứa hẹn hơn so với từng công nghệ riêng lẻ. Mấu chốt
của vấn đề là cần phải hiểu rằng, mục tiêu quan trọng nhất của công nghệ CSDL là
sự tích hợp (integratior), không phải sự tập trung hóa (centralization). Cũng cần
phải hiểu rằng giữa hai thuật ngữ, có được điều này không dẫn đến điều kia. Và vẫn
có thể có tích hợp mà không cần tập trung hóa. Đây chính là mục tiêu của công
nghệ cơ sở dữ liệu phân tán.
Chương trình 1
Mô tả dữ liệu
Chương trình 2
Mô tả dữ liệu
Chương trình 3
Mô tả dữ liệu
Tập tin 1
Tập tin 2
Tập tin 3
Dữ liệu thừa

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
7
Chúng ta sẽ bắt đầu bằng cách nghiên cứu về các hệ thống phân tán nói chung,
qua đó nêu bật được vai trò của công nghệ CSDL trong quá trình xử lý dữ liệu phân
tán rồi chuyển sang các đề tài có liên quan trực tiếp đến các hệ cơ sở dữ liệu.

CHƢƠNG TRÌNH 1
CHƢƠNG TRÌNH 2
CHƢƠNG TRÌNH 3
Thao tác dữ liệu

Mô tả dữ liệu

CƠ SỞ DỮ LIỆU

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
8





Hình 1.2 Quản lý dữ liệu tập trung
1.1 Xử lý dữ liệu phân tán
Thuật ngữ xử lý phân tán [7] (distributed processing) hoặc tính toán phân tán
(distributed computing) trong vài năm trở lại đây có lẽ là một thuật ngữ bị lạm dụng
nhiều nhất trong ngành khoa học máy tính. Nó đã được dùng để đề cập đến các hệ
thống rải rác như các hệ đa bộ xử lý (multiprocessor system), công việc xử lý dữ
liệu phân tán và mạng máy tính. Sự lạm dụng này vẫn tiếp tục trong một phạm vi
mà đôi khi thuật ngữ xử lý phân tán được xem như một khái niệm trong khi đang
tìm kiếm một định nghĩa và một tên thích hợp. Một số thuật ngữ khác cũng được
xem như đồng nghĩa với thuật ngữ này, chẳng hạn như chức năng phân tán
(distributed function), mạng phân tán (distributed network), …
Rõ ràng, trong một chừng mực nào đó, việc xử lý phân tán đã thể hiện trong
một số hệ thống máy tính, kể cả trong các máy tính đơn bộ xử lý (single-processor
computer).
Ngay từ các máy tính thế hệ thứ hai, đơn vị xử lý trung tâm CPU
(Central Proccessing Unit) và các chức năng xuất nhập (Input/output function) đã
được tách riêng nhưng vẫn đan quyện vào nhau. Sự tách biệt và đan quyện này có
thể được xem như một dạng xử lý phân tán. Tuy nhiên cũng cần nhận ra rằng điều
mà chúng ta xem là xử lý phân tán ở đây không phải là hình thức phân bổ chức

năng trên một hệ thống đơn bộ xử lý.
Một thuật ngữ đã gây nhiều nhầm lẫn sẽ rất khó định nghĩa chính xác. Có một
số cố gắng nhằm định nghĩa việc xử lý phân tán một cách cụ thể và hầu như mỗi
nhà nghiên cứu đều đưa ra một định nghĩa riêng. Trong luận văn này, chúng tôi định
nghĩa xử lý phân tán theo một cách mà được nhiều tác giả dùng hơn cả để có thể
dẫn đến một định nghĩa về hệ CSDL phân tán. Định nghĩa của chúng tôi cho một hệ
thống tính toán phân tán (distributed computing system) khẳng định rằng đó là một
số các bộ phận xử lý (processing element) tự vận hành (không nhất thiết phải cùng

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
9
chủng loại) được liên kết bởi một mạng máy tính và hiệp đồng thực hiện các tác vụ
mà chúng được phân công. Các bộ phận xử lý muốn nói đến trong định nghĩa này là
các thiết bị tính toán có thể chạy được một chương trình trên chính nó.
Câu hỏi cơ bản đƣợc đặt ra là: Những gì được phân tán? Một trong những
cái có thể được phân tán là thiết bị xử lý. Thực tế, định nghĩa về hệ thống tính toán
phân tán được trình bày ở trên đã ngầm giả sử rằng các bộ phận xử lý được phân
tán. Một kiểu phân tán nữa là chức năng. Nhiều chức năng của hệ thống máy tính
có thể được chuyển giao cho các thành phần phần cứng và phần mềm. Kiểu thứ ba
là theo dữ liệu. Dữ liệu được dùng bởi một số ứng dụng có thể được phân tán cho
một số vị trí xử lý. Cuối cùng là quyền điều khiển (control) cũng có thể phân tán.
Quyền điều khiển việc thực hiện một số tác vụ có thể được phân tán thay vì được
thực hiện bởi một hệ thống máy tính. Từ góc độ của hệ CSDL phân tán, những kiểu
phân tán này đều cần thiết và quan trọng.
Các hệ thống xử lý phân tán có thể được phân loại dựa vào một số chuẩn.
Bochmann đã liệt kê một số chuẩn này như sau: mức độ kết nối, cấu trúc tương
giao, sự liên đới giữa các thành phần, và sự đồng bộ hóa giữa các thành phần
[Bochmann, 1983]. Mức độ kết nối (degree of coupling) muốn nói đến một đơn vị
đo lường nhằm xác định xem các thành phần xử lý được nối kết chặt chẽ với nhau
đến mức độ nào. Nó có thể được xem là tỷ lệ giữa số lượng dữ liệu được trao đổi so

với số lượng xử lý cục bộ được thực hiện trong một tác vụ. Nếu quá trình truyền dữ
liệu (truyền thông) được thực hiện trên một mạng máy tính thì chúng ta nói có một
kết yếu (weak coupling) giữa các phần tử xử lý. Tuy nhiên nếu các thành phần được
dùng chung chúng ta gọi là kết chặt (strong coupling). Các thành phần dùng chung
có thể là bộ nhớ chính hoặc các thiết bị nhớ thứ cấp. Còn về cấu trúc tương giao
(interconnection structure), người ta đề cập đến những trường hợp tương giao điểm-
điểm giữa các bộ phận xử lý, trái với những trường hợp sử dụng một kênh tương
giao chung. Các bộ phận xử lý có thể phụ thuộc nhiều vào những bộ phận xử lý
khác khi thực thi một tác vụ, hoặc sự phụ thuộc qua lại này (sự liên đới) có thể chỉ
là việc truyền thông báo khi bắt đầu thực thi và ghi nhận kết quả lúc kết thúc. Việc
đồng bộ hoá (synchronization) giữa các bộ phận xử lý có thể được duy trì bằng
phương thức đồng bộ (synchronous) hoặc không đồng bộ (asynchronous). Chú ý
rằng một số trong các chuẩn này không hoàn toàn độc lập với nhau. Chẳng hạn nếu

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
10
việc đồng bộ hóa giữa các bộ phận xử lý thuộc kiểu đồng bộ, chúng ta hy vọng rằng
các bộ phận xử lý sẽ hầu như liên đới mật thiết và có thể hoạt động theo kiểu kết
chặt.
Một câu hỏi hợp lý khác đƣợc đặt ra là: Tại sao chúng ta lại thực hiện
phân tán? Nhiều câu trả lời kinh điển cho câu hỏi này đã chỉ ra rằng việc xử lý
phân tán là nhằm thích ứng tốt hơn với việc phân bố ngày càng rộng rãi của các
công ty, xí nghiệp, đồng thời một hệ thống như thế phải có độ tin cậy cao hơn và có
khả năng đáp ứng tốt hơn. Quan trọng hơn, nhiều ứng dụng hiện tại của công nghệ
máy tính được phân tán như một hệ quả tất yếu. Thương mại điện tử trên Internet,
các ứng dụng đa phương tiện nhờ việc cung cấp tin tức theo yêu cầu, các kỹ thuật
chẩn đoán hình ảnh trong y khoa hoặc các hệ thống điều khiển sản xuất đều là
những minh họa cho ứng dụng phân tán.
Tuy nhiên từ góc độ tổng thể hơn, chúng ta có thể khẳng định rằng lý do cơ
bản của việc xử lý phân tán là do nó có thể giải quyết tốt hơn các bài toán lớn và

phức tạp mà chúng ta gặp phải hiện nay bằng cách sử dụng qui tắc cổ điển "chia để
trị" đã được biết từ lâu. Nếu việc hỗ trợ bằng phần mềm cần cho vấn đề xử lý phân
tán phát triển được, thì có thể giải các bài toán này một cách đơn giản là chia nhỏ
chúng ra và gán chúng cho các nhóm phần mềm được chạy trên các máy tính khác
nhau, tạo ra một hệ thống chạy trên nhiều bộ phận xử lý nhưng có thể hoạt động
hiệu quả nhằm thực thi một tác vụ chung nào đó.
Từ quan điểm kinh tế, cách tiếp cận này có hai ưu điểm cơ bản. Trước tiên
việc tính toán phân tán cung cấp một phương pháp kinh tế nhằm tận dụng được sức
mạnh tính toán bằng cách sử dụng nhiều bộ phận xử lý một cách tối ưu. Nó đòi hỏi
phân tích nghiên cứu về các hệ thống phân tán, và cả những hệ thống xử lý song
song. Bằng việc giải quyết bài toán theo từng nhóm hoạt động khá độc lập, chúng ta
có thể kiểm soát được chi phí phát triển phần mềm. Thực sự chúng ta đều biết rằng
chi phí phần mềm đã tăng ngược lại với chi phí của phần cứng.
Các hệ CSDL phân tán cũng có thể được xem xét trong khuôn khổ của bộ
khung này và được xử lý như những công cụ có thể làm cho việc xử lý phân tán dễ
dàng và hiệu quả hơn. Chúng ta có thể phác họa tính chất tương đồng giữa những gì
mà các hệ CSDL phân tán có thể hỗ trợ cho việc xử lý dữ liệu với những gì mà công
nghệ CSDL đã cung cấp. Chẳng nghi ngờ gì nữa, việc phát triển các hệ CSDL phân

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
11
tán đa mục đích, dễ áp dụng và có hiệu quả sẽ giúp rất nhiều cho việc phát triển
các phần mềm phân tán.
1.2 Hệ cơ sở dữ liệu phân tán là gì? [7, 14]
Chúng ta có thể định nghĩa một CSDL phân tán là một tập hợp nhiều CSDL
có liên đới logic và được phân bố trên một mạng máy tính. Thế thì hệ quản trị cơ
sở dữ liệu phân tán (distributed database management system, viết tắt là distributed
DBMS) được định nghĩa là một hệ thống phần mềm cho phép quản lý các hệ CSDL
phân tán và làm cho việc phân tán trở nên "vô hình" đối với người sử dụng. Hai
thuật ngữ quan trọng trong các định nghĩa này là "liên đới logic" và "phân bố trên

một mạng máy tính". Chúng loại bỏ một số trường hợp đôi khi được thừa nhận là
biểu thị cho một hệ CSDL phân tán.
Trước tiên một hệ cơ sở dữ liệu phân tán (distributed database system, viết tắt
là DDBS) không phải là tập hợp các tập tin được lưu trữ riêng lẻ tại mỗi nút của
một mạng máy tính. Để tạo ra một hệ CSDL phân tán, các tập tin không chỉ có liên
đới logic mà chúng còn phải có cấu trúc và được truy xuất qua một giao diện
chung. Chúng ta cần nhấn mạnh rằng gần đây đang có nhiều nỗ lực cung cấp các
đặc thù chức năng của DBMS trên các dữ liệu bán cấu trúc (semi-structured data),
được lưu trong các tập tin trên Internet (chẳng hạn như các trang web). Với hiện
thực đó, đòi hỏi ở trên dường như khắt khe một cách không cần thiết.









Hình 1.3 Hệ đa bộ xử lý có bộ nhớ chung
Đôi khi chúng ta giả thiết rằng việc phân bố vật lý của các dữ liệu không phải
là vấn đề quyết định. Đưa ra quan điểm này có thể tạo thoải mái khi gán cho hai
Đơn vị xử lý
Đơn vị xử lý
Đơn vị xử lý
Hệ thống
xuất nhập
Bộ nhớ

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán

12
CSDL (có liên hệ) hiện hữu trên cùng một hệ thống máy tính là một CSDL phân
tán. Tuy nhiên việc phân bố vật lý của các dữ liệu vẫn hết sức quan trọng. Nó làm
nảy sinh những vấn đề không hề gặp phải khi dữ liệu được lưu trên cùng một máy
tính. Chú ý rằng phân bố vật lý không nhất thiết là các hệ thống máy tính phải tách
biệt nhau về mặt địa lý thực sự chúng có thể ở trong cùng một phòng. Nó chỉ khẳng
định một điều là việc giao tiếp giữa chúng được thực hiện trên một mạng thay vì
qua bộ nhớ chung, với mạng được xem là tài nguyên dùng chung duy nhất.
Điều này lại dẫn đến một vấn đề khác. Định nghĩa trên cũng loại bỏ các hệ
thống đa bộ xử lý ra khỏi nhóm các hệ CSDL phân tán. Một hệ đa bộ xử lý nói
chung được xem như một hệ thống có hai hoặc nhiều bộ xử lý cùng dùng chung một
dạng bộ nhớ nào đó, hoặc là bộ nhớ chính và khi đó được gọi là có bộ nhớ chung
(shared memory) (Hình 1.3), hoặc dùng chung bộ nhớ thứ cấp và khi đó được gọi là
có đĩa chung (shared disk).













Hình 1.4. Hệ đa bộ xử lý có đĩa chung
Trong ngữ cảnh này, chúng ta cần đưa ra một phân biệt nữa, đó là phân biệt
giữa kiến trúc sở hữu tập thể (sharedeverything) và kiến trúc sở hữu cá nhân

(shared-nothing). Mô hình thứ nhất cho phép mỗi bộ xử lý truy xuất được mọi tài
nguyên (bộ nhớ chính, bộ nhớ thứ cấp, các thiết bị ngoại vi) trong hệ thống và như
thế bao quát cả mô hình được mô tả ở trên. Dùng chung bộ nhớ cho phép các bộ xử
Hệ thống máy tính
CPU
Bộ nhớ
Hệ thống máy tính
CPU
Bộ nhớ
Hệ thống máy tính
CPU
Bộ nhớ
Bộ nhớ thứ cấp
dùng chung

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
13
lý giao tiếp với nhau mà không cần phải trao đổi các thông báo. Kiến trúc sở hữu cá
nhân (Hình l.5) là kiến trúc mà trong đó mỗi bộ xử lý có riêng bộ nhớ chính, bộ nhớ
thứ cấp và các thiết ngoại vi, trao đổi với các bộ xử lý khác qua các kênh truyền tốc
độ cao. Theo nghĩa này các hệ thống đa bộ xử lý sở hữu cá nhân rất giống với môi
trường phân tán sẽ được phân tích ở phần sau. Tuy nhiên có nhiều khác biệt giữa
các tương tác trong kiến trúc đa bộ xử lý và các tương tác kém rất thường gặp trong
môi trường tính toán phân tán. Sự khác biệt cơ bản là thể thức hoạt động. Thiết kế
một hệ thống đa bộ xử lý khá đối xứng bao gồm một số bộ xử lý và các thành phần
bộ nhớ đồng nhất, được điều khiển bởi một hoặc nhiều bản sao của cùng một hệ
điều hành, chịu trách nhiệm kiểm soát chặt chẽ việc phân công tác vụ cho mỗi bộ
xử lý. Trong môi trường tính toán phân tán, điều này không đúng do tính đa chủng
của các hệ điều hành cũng nhờ phần cứng.
















Hình 1.5 Hệ đa bộ xử lý sở hữu cá nhân
Ngoài ra một hệ CSDL phân tán không phải là hệ thống mà trong đó, dù có sự
hiện diện của một mạng máy tính, CSDL lại chỉ nằm tại một nút của mạng (Hình
1.6). Trong trường hợp này, vấn đề quản trị CSDL không khác với việc quản trị
CSDL trong môi trường tập trung. CSDL này được quản lý tập trung tại một hệ
Hệ thống máy tính
CPU
Bộ nhớ
Hệ thống máy tính
CPU
Bộ nhớ
Hệ thống máy tính
CPU
Bộ nhớ
Hệ thống máy tính
CPU

Bộ nhớ
KÊ NH CHUY ỂN MẠCH

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
14
thống máy tính (Trạm 2 trong Hình 1.6) và tất cả mọi yêu cầu đều được chuyển đến
vị trí đó. Điều cần xem xét duy nhất là sự chậm trễ khi truyền dữ liệu. Hiển nhiên là
sự tồn tại của một mạng máy tính hoặc một tập các tập tin không đủ để tạo ra một
hệ CSDL phân tán. Điều mà chúng ta quan tâm là một môi trường trong đó dữ liệu
được phân tán trên một số vị trí.












Hình 1.6 CSDL trung tâm trên một mạng





Trạm 1
Trạm 2

Trạm 3
Trạm 4
Trạm 5
Mạng truyền dữ liệu
Trạm 1
Trạm 2
Trạm 3
Trạm 4
Trạm 5
Mạng truyền dữ liệu

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
15

Hình 1.7 Môi trường của hệ CSDL phân tán

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
16
1.3 Triển vọng của các hệ cơ sở dữ liệu phân tán [7, 14]
Nhiều ưu điểm của CSDL phân tán đã được nói đến trong nhiều tài liệu
chuyên ngành từ lý do xã hội của việc phi tập trung [Doliviera, 1977] đến hiệu quả
kinh tế của nó. Tất cả những lý do này đề có thể được phân làm bốn nhóm cơ bản,
được xem là triển vọng đầy hứa hẹn của công nghệ CSDL phân tán.
1.3.1 Quản lý dữ liệu phân tán và nhân bản một cách vô hình
Đặc tính vô hình muốn nói đến sự tách biệt về ngữ nghĩa ở cấp độ cao của một
hệ thống với các vấn đề cài đặt ở cấp độ thấp. Nói cách khác, một hệ thống vô hình
sẽ "che khuất" các chi tiết cài đặt, không cho người dùng "nhìn thấy". Ưu điểm của
một DBMS vô hình hoàn toàn là mức độ hỗ trợ cao mà nó cung cấp cho việc phát
triển các ứng dụng phức tạp. Rõ ràng là chúng ta mong muốn làm cho tất cả các
DBMS (tập trung và phân tán) đều vô hình hoàn toàn.

Chúng ta hãy bắt đầu bằng một thí dụ. Một công ty điện toán có các văn phòng
ở Boston, Edmonton, Paris và San Francisco. Họ có một số dự án (project) được
thực hiện tại mỗi nơi này và muốn duy trì một CSDL về nhân viên (employee), dự
án và các dữ liệu có liên quan khác. Giả sử rằng CSDL này thuộc loại quan hệ, và
có thể lưu những thông tin này vào hai quan hệ: EMP(ENO, ENAME, TITLE)
1

PROJ(PNO, PNAME, BUDGET). Chúng ta cũng có một quan hệ lưu thông tin về
lương: PAY(TITLE, SAL) và quan hệ ASG cho biết những nhân viên nào đã được
phân công cho dự án nào, trong thời gian nào và với nhiệm vụ gì: ASG(ENO, PNO,
DUR, RESP). Nếu tất cả mọi dữ liệu được lưu trong một hệ tập trung, và khi muốn
tìm tên và lương của các nhân viên đã làm việc cho một dự án trên 12 tháng, chúng
ta sẽ mô tả điều này qua câu vấn tin SQL sau đây:
SELECT ENAME, SAL
FROM EMP, ASG, PAY
WHERE ASG. DUR > 12
AND EMP. ENO = ASG. ENO
AND PAY. TITLE = EMP. TITLE


1
Các thuộc tính được viết tắt là ENO (employee number, mã số nhân viên), ENAME(employee name, tên
nhân viên), TITLE (chức vụ), PNO (project number, mã số dự án), BUDGET(ngân sách dự án), PAY(pay-
mem, chi trả). SAL (salary, lương), ASG(assignment, sự phân công), DUR(duration, thời gian), RESP
(responsibility, nhiệm vụ).

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
17
Tuy nhiên do tính chất phân tán của công việc kinh doanh của công ty, trong
tình huống này, người ta mong muốn đặt mỗi dữ liệu sao cho dữ liệu về các nhân

viên của văn phòng ở Edmonton được lưu ở Edmonton, của Boston được lưu ở
Boston, Mong muốn tương tự cũng có đối với thông tin về dự án và lương. Vì
vậy điều chúng ta mong muốn là có một quá trình phân hoạch
2
mỗi quan hệ này và
lưu mỗi phân hoạch tại một vị trí khác nhau. Quá trình này được gọi là quá trình
phân mảnh (fragmentation).
Hơn nữa, người ta cũng mong muốn sao chép một phần dữ liệu này tại những
vị trí khác nhau, vì các lý do hiệu quả hoạt động (hiệu năng) và độ tin cậy (độ khả
tín). Kết quả của yêu cầu này là một CSDL phân tán, được phân mảnh và nhân bản
(Hình 1.8). Truy xuất vô hình hoàn toàn có nghĩa là người sử dụng vẫn có thể đưa
ra các câu vấn tin nhờ đã viết ở trên mà không phải quan tâm đến việc phân mảnh,
định vị hoặc nhân bản dữ liệu, và để cho hệ thống lo giải quyết các vấn đề này.











Hình 1.8 Một ứng dụng phân tán

Để hệ thống có thể giải quyết được kiểu vấn tin này trên một CSDL phân tán,
phân mảnh và nhân bản, nó cần có khả năng giải quyết một số loại vô hình. Chúng
ta sẽ thảo luận về những loại này trong những đoạn tiếp theo.



2
Khi sử dụng thuật ngữ phân hoạch (partition), người ta muốn nói đến thao tác chia một tập đã cho
thành các tập con không phủ lên nhau, nghĩa là giao của chúng là tập rỗng, hay nói cách khác chúng là các
tập tách biệt. Khi đó mỗi tập con này được gọi là một phân hoạch. Thí dụ, một quan hệ tương đơng R
trên một tập S phân hoạch tập S thành các lớp tương đương, mỗi lớp là một phân hoạch.
Paris
San Francisco
Edmonton
Boston
Mạng truyền dữ liệu
Nhân viên ở Paris
Nhân viên ở
Boston
Dự án ở Paris
Dự án ở Boston
Nhân viên ở San
Francisco
Dự án ở San
Francisco


Nhân viên ở
Boston
Nhân viên Paris
Dự án ở Boston
Nhân viên ở
Edmonton
Dự án ở Edmonton
Dự án ở Paris


Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
18
 Sự độc lập dữ liệu
Độc lập dữ liệu là một dạng vô hình cơ bản cần có trong một hệ DBMS. Đây
cũng là loại duy nhất có vai trò quan trọng trong ngữ cảnh các DBMS tập trung. Sự
độc lập dữ liệu liên quan đến khả năng "miễn nhiễm" của các ứng dụng đối với
những thay đổi trong định nghĩa và tổ chức của dữ liệu, và ngược lại.
Định nghĩa dữ liệu có thể xuất hiện ở hai mức. Một mức là đặc tả cấu trúc
logic của dữ liệu, còn mức kia định nghĩa cấu trúc vật lý của dữ liệu. Mức logic
thường được xem là định nghĩa lược đồ (schema definition), còn mức vật lý được
gọi là mô tả dữ liệu vật lý (physical data description). Do vậy chúng ta có thể nói
đến hai loại độc lập dữ liệu: độc lập dữ liệu logic và độc lập dữ liệu vật lý. Độc lập
dữ liệu logic (logical data independence) muốn nói đến tính "miễn nhiễm" của
các ứng dụng đối với những thay đổi trong cấu trúc logic của CSDL. Tổng quát, nếu
một ứng dụng hoạt tác trên một tập con thuộc tính của một quan hệ, nó sẽ không bị
ảnh hưởng khi thêm các thuộc tính mới vào quan hệ. Chẳng hạn như quan hệ EMP
ở trên. Nếu một ứng dụng chỉ xử lý trường address (địa chỉ) của quan hệ này (có thể
là một chương trình gửi thư đơn giản) thì về sau nếu thêm một trường mới vào,
chẳng hạn trường skill, thì nó sẽ không có ảnh hưởng gì đến ứng dụng này.
Độc lập dữ liệu vật lý lo che dấu các chi tiết về cấu trúc lưu trữ. Ứng dụng, khi
được viết, sẽ không quan tâm đến chi tiết tổ chức dữ liệu vật lý. Dữ liệu có thể được
tổ chức trên nhiều loại đĩa khác nhau, và các phần có thể được tổ chức theo những
phương thức khác nhau (thí dụ như truy xuất tuần tự theo chỉ mục hoặc ngẫu nhiên),
thậm chí có thể được phân bố trên các hệ thống lưu trữ khác nhau (đĩa, băng từ).
Ứng dụng không bị "lôi kéo" vào những vấn đề này bởi vì về khái niệm, không hề
có sự khác biệt gì trong các thao tác được thực hiện trên dữ liệu. Do vậy không cần
phải hiệu chỉnh lại ứng dụng khi có các thay đổi về cách tổ chức dữ liệu. Tuy nhiên
hiểu biết về những thay đổi sẽ giúp ích cho việc đánh giá hiệu năng hệ thống.
 Vô hình kết mạng

Trong các hệ CSDL tập trung, tài nguyên có sẵn duy nhất cần được "bọc" lại
là dữ liệu (đó là hệ thống lưu trữ). Tuy nhiên, trong môi trường quản trị CSDL phân
tán, có một tài nguyên nữa cũng cần phải quản lý bằng một cách gần như thế, đó là
hệ thống mạng. Thông thường, người sử dụng cần được tách ra khỏi mọi chi tiết
hoạt động của mạng. Hơn nữa người ta cũng mong muốn che dấu ngay cả sự tồn tại

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
19
của mạng nếu được. Khi đó sẽ không có sự khác biệt nào giữa các ứng dụng CSDL
chạy trên một CSDL tập trung và các ứng dụng chạy trên các CSDL phân tán. Kiểu
vô hình này thường được xem là vô hình kết mạng (network transparency) hoặc vô
hình phân bố (distribution transparency).
Người ta có thể xem xét đặc tính vô hình kết mạng từ quan điểm các dịch vụ
được cung cấp hoặc từ quan điểm dữ liệu. Đối với các dịch vụ, người ta mong muốn
có một phương tiện thống nhất để truy xuất chúng. Từ quan điểm của hệ quản trị
CSDL, vô hình phân bố đòi hỏi rằng người dùng không phải đặc tả vị trí lưu trữ dữ liệu.
Cũng có quan điểm phân chia tính vô hình phân bố thành hai loại: vô hình vị
trí và vô hình đặt tên. Vô hình vị trí (location transparency) liên quan đến sự kiện là
lệnh được dùng để thực hiện một tác vụ phải độc lập với cả vị trí dữ liệu lẫn hệ
thống thực hiện lệnh. Vô hình đặt tên (naming transparency) đòi hỏi phải cung cấp
một tên duy nhất cho mỗi đối tượng CSDL. Khi không có tính vô hình đặt tên,
người sử dụng bị buộc phải gắn tên vị trí (hoặc một định danh) làm thành phần của
tên đối tượng.
 Vô hình nhân bản
Vì những lý do về hiệu năng (performance), độ tin cậy (reliability) và tính sẵn
sàng (availability), người ta thường mong muốn rằng có thể phân bố dữ liệu theo lối
nhân dữ liệu thành nhiều bản (nhân bản) trên các máy của mạng. Việc nhân bản như
thế giúp tăng hiệu năng bởi vì những yêu cầu sử dụng có xung đột và nằm rải rác có
thể được đáp ứng một cách dễ dàng. Thí dụ, dữ liệu thường được một người sử
dụng truy xuất có thể được đặt tại máy của người đó và trên máy của những người

sử dụng khác có cùng nhu cầu truy xuất, nhờ thế làm tăng khu vực tham chiếu.
Ngoài ra nếu một máy phải ngừng hoạt động, một bản sao (replica) khác của dữ
liệu vẫn có sẵn trên một máy khác của mạng. Dĩ nhiên đây là sự mô tả còn quá đơn
giản về tình huống này. Thực tế, việc quyết định xem có nhân bản hay không, và
cần phải có bao nhiêu bản của một đối tượng, đều phụ thuộc nhiều vào các ứng
dụng. Chú ý rằng việc nhân bản sẽ gây khó khăn khi cập nhật CSDL. Vì thế nếu các
ứng dụng có yêu cầu cập nhật thường xuyên thì việc tạo ra nhiều bản sao của dữ
liệu không phải là một giải pháp tốt.
Giả sử rằng dữ liệu được nhân bản, vấn đề có liên quan đến sự vô hình cần
được xem xét đó là người sử dụng có biết được sự tồn tại của các bản sao hay chính

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
20
hệ thống phải lo quản lý các bản sao còn người sử dụng hành xử giống như chỉ có
một bản duy nhất (chú ý rằng chúng ta không đề cập đến vị trí đặt các bản sao mà
chỉ là sự tồn tại của chúng). Từ quan điểm người sử dụng, câu trả lời hoàn toàn rõ
ràng. Người ta không muốn phải xử lý các bản sao và phải xác định rõ một hành
động có thể hoặc/và phải được thực hiện trên nhiều bản sao. Tuy nhiên từ quan
điểm hệ thống, câu trả lời không phải giản đơn. Khi ủy thác cho người sử dụng
trách nhiệm xác định xem hành động nào cần phải thực hiện trên nhiều bản
sao, quản lý giao dịch sẽ đơn giản hơn cho các hệ DBMS phân tán. Nhưng ngược
lại nó làm mất đi độ linh hoạt của hệ thống. Không phải chính hệ thống quyết định
xem có phải nhân bản hay không và cần phải tạo ra bao nhiêu bản sao mà do các
ứng dụng quyết định. Thay đổi những quyết định này vì nhiều vấn đề khác nhau đều
ảnh hưởng đến ứng dụng và vì thế giảm đi tính độc lập dữ liệu. Do đó, người ta
mong rằng tính vô hình nhân bản sẽ được cung cấp như một đặc điểm chuẩn của
DBMS. Cần nhớ ràng đặc tính vô hình nhân bản chỉ đề cập đến sự tồn tại của các
bản sao chứ không phải vị trí thực sự của chúng. Cũng cần chú ý rằng việc phân bố
các bản sao trên mạng theo phương thức vô hình nằm trong phạm vi của vấn đề vô
hình kết mạng.

 Vô hình phân mảnh
Dạng vô hình cuối cùng cần phải thảo luận trong ngữ cảnh của các hệ CSDL
phân tán là vô hình phân mảnh (fragmentation transparency). Người ta có nhu cầu
tách mỗi quan hệ thành các thành dữ liệu (fragment) nhỏ hơn và xử lý mỗi mảnh
này như một đối tượng CSDL độc lập (nghĩa là như một quan hệ). Thông thường nó
được thực hiện vì những lý do về hiệu năng, tính sẵn sàng và độ tin cậy. Hơn nữa
việc phân mảnh có thể làm giảm đi các tác dụng không mong muốn của việc nhân
bản. Mỗi bản sao khi đó không phải là một quan hệ đầy đủ mà chỉ là một tập con
của nó; như thế cần ít chỗ để lưu trữ và ít công sức quản lý các mục dữ liệu.
Có hai kiểu chọn lựa phân mảnh tổng quát. Một là phân mảnh ngang
(horizontal fragmentation), trong đó một quan hệ được phân hoạch thành một tập
các quan hệ con (subrelation), mỗi quan hệ này chứa một tập con các bộ (các hàng)
của quan hệ ban đầu. Chọn lựa thứ hai là phân mảnh dọc (vertical fragmentation)
trong đó mỗi quan hệ con được định nghĩa trên một tập con các thuộc tính (các cột)
của quan hệ ban đầu.

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
21
Khi các đối tượng CSDL bị phân mảnh, chúng ta phải có cách xử lý các vấn
tin của người sử dụng, tuy được đặt ra trên toàn bộ quan hệ nhưng bây giờ phải
được thực hiện trên các quan hệ con. Nói cách khác, vấn đề là tìm ra một chiến lược
xử lý vấn tin dựa trên các mảnh chứ không phải trên quan hệ, dù rằng câu vấn tin
được đặt ra trên quan hệ. Thông thường nó đòi hỏi phải dịch câu vấn tin toàn cục
(global query) thành nhiều câu vấn tin theo mảnh (fragment query).
 Ai sẽ cung cấp các đặc tính vô hình
Trong những phần trước chúng ta đã thảo luận một số dạng vô hình khác nhau
trong môi trường tính toán phân tán. Rõ ràng là để tạo dễ dàng cho những người sử
dụng không chuyên truy nhập các dịch vụ của DBMS, người ta muốn đạt được tính
vô hình hoàn toàn, bao gồm tất cả các kiểu đã trình bày ở trên. Tuy nhiên, mức độ
vô hình cần phải được cân nhắc giữa tính dễ sử dụng với tính phức tạp và chi phí

cao khi cung cấp các mức độ vô hình.
Vấn đề chưa được thảo luận là ai sẽ là người chịu trách nhiệm cung cấp những
dịch vụ vô hình này? Chúng ta có thể định rõ ba tầng có thể cung cấp các dịch vụ vô
hình. Thường thì chúng được xử lý như những phương tiện độc lập, mặc dù sẽ đúng
hơn khi xem như chúng bổ trợ lẫn thau.
Chúng ta có thể trao trách nhiệm cung cấp tính vô hình khi truy xuất đến các
tài nguyên cho tầng truy xuất (access layer). Những đặc tính vô hình có thể được cài
hẳn vào trong ngôn ngữ của người dùng, chúng sẽ dịch các dịch vụ được yêu cầu
thành các thao tác cần thiết. Nói cách khác, trình biên dịch hoặc trình thông dịch sẽ
nhận trách nhiệm này và không có dịch vụ vô hình nào được cung cấp cho người
xây dựng trình biên dịch hay trình thông dịch.
Tầng thứ hai có thể có cung cấp dịch vụ vô hình là ở cấp độ hệ điều hành. Các
hệ điều hành hiện đại có hỗ trợ một mức độ vô hình cho người sử dụng hệ thống.
Chẳn hạn các trình điều khiển thiết bị (device driver) trong hệ điều hành sẽ lo xử lý
các chi tiết khi tiếp nhận thêm các thiết bị ngoại vi. Người sử dụng, hoặc thậm chí
cả lập trình viên ứng dụng, thường không phải viết các trình điều khiển thiết bị để
tương tác với từng thiết bị; công việc này hoàn toàn vô hình đối với người sử dụng
3
.


3
Có thể nói rằng đặc tính plug-and-play của các hệ điều hành Windows 9.x là một nỗ lực cung cấp tính vô
hình ở cấp độ hệ điều hành, làm cho việc cài đặt các thiết bị phần cứng dễ dàng và đơn giản hơn.

Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
22
Cung cấp đặc tính vô hình khi truy xuất các tài nguyên ở cấp độ hệ điều hành
có thể được mở rộng ra cho môi trường phân tán, trong đó việc quản lý tài nguyên
mạng là trách nhiệm của hệ điều hành phân tán. Đây chính là nơi cung cấp đặc tính

vô hình kết mạng rất tốt nếu nó có thể đảm nhận được. Điều không may là không
phải tất cả mọi hệ điều hành phân tán hiện có trên thị trường đều có thể cung cấp
một mức vô hình hợp lý cho việc quản trị mạng.
Tầng thứ ba có thể hỗ trợ đặc tính vô hình là hệ quản trị CSDL. Tính vô hình
và việc hỗ trợ các chức năng CSDL cho các nhà thiết kế DBMS từ hệ điều hành là
hết sức hạn chế và thông thường chỉ là một số thao tác cơ bản cần để thực hiện một
số nhiệm vụ nào đó. Nhiệm vụ của DBMS là phải thực hiện các quá trình phiên
dịch cần thiết từ hệ điều hành sang giao diện cấp cao của người sử dụng. Kiểu hoạt
động này là phương pháp thông dụng nhất hiện nay. Tuy nhiên cũng có nhiều vấn
đề đi kèm với việc trao cho DBMS nhiệm vụ cung cấp đặc tính vô hình hoàn toàn.
Vì thế, điều quan trọng cần nhận ra rằng, mức độ vô hình hợp lý phụ thuộc
vào nhiều thành phần khác nhau trong môi trường quản trị CSDL. Vô hình kết
mạng có thể dễ dàng được xử lý bởi hệ điều hành phân tán, xem đó là một trong
những nhiệm vụ cung cấp tính vô hình nhân bản và phân mảnh (đặc biệt là các khía
cạnh có liên quan đến việc quản lý và khôi phục giao dịch). DBMS phải có nhiệm
vụ cung cấp một mức độ độc lập dữ liệu cao cùng với các đặc tính vô hình nhân bản
và phân mảnh. Cuối cùng giao diện người sử dụng có thể hỗ trợ đặc tính vô hình ở
mức độ cao hơn nữa, không chỉ ở phương pháp truy xuất thống nhất đến các tài
nguyên dữ liệu qua một ngôn ngữ mà còn qua các kết cấu của ngôn ngữ cho phép
người sử dụng xử lý các đối tượng trong môi trường của họ mà không phải quan
tâm đến các chi tiết trong mô tả CSDL. Một điều cần đặc biệt chú ý là giao diện với
DBMS phân tán không nhất thiết là một ngôn ngữ lập trình nhưng có thể là
một giao diện đồ họa (GUI), giao diện của ngôn ngữ tự nhiên và ngay cả bằng
tiếng nói.
Một hình ảnh phân cấp các đặc tính vô hình được trình bày trong Hình 1.9.
Không phải lúc nào chúng ta cũng có thể phân định rõ ràng các mức vô hình nhưng
hình ảnh này có thể được xem như một hướng dẫn quan trọng, dù rằng nó không
hoàn toàn chính xác. Để cho hoàn chỉnh, chúng ta đã đưa thêm một tầng "vô hình
về ngôn ngữ" mặc dù không được thảo luận trong những phần trước. Với tầng tổng


Quản lý CSDL trên mạng Internet bằng mô hình CSDL phân tán
23
quát này, người sử dụng có thể truy xuất đến dữ liệu dưới dạng trừu tượng hóa cao
(thí dụ nhờ ngôn ngữ thế hệ thứ tư, giao diện người và ứng dụng đồ họa GUI, truy
xuất bằng ngôn ngữ tự nhiên, …).

×