Tải bản đầy đủ (.pdf) (83 trang)

Nghiên cứu phương pháp thiết kế cơ sở dữ liệu phân tán và ứng dụng vào bài toán quản lý hồ sơ sinh viên tại viện đại học mở hà nội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.66 MB, 83 trang )

BỘ GIÁO DỤC ĐÀO TẠO
TRẦN TIẾN DŨNG

VIỆN ĐẠI HỌC MỞ HÀ NỘI

CÔNG NGHỆ THÔNG TIN

LUẬN VĂN THẠC SỸ
CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN

NGHIÊN CỨU PHƢƠNG PHÁP THIẾT KẾ CƠ SỞ
DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG VÀO BÀI TOÁN
QUẢN LÝ HỒ SƠ SINH VIÊN TẠI VIỆN ĐẠI HỌC MỞ
HÀ NỘI

TRẦN TIẾN DŨNG
2013 - 2015

HÀ NỘI - 2015


BỘ GIÁO DỤC ĐÀO TẠO
VIỆN ĐẠI HỌC MỞ HÀ NỘI

LUẬN VĂN THẠC SỸ
NGHIÊN CỨU PHƢƠNG PHÁP THIẾT KẾ CƠ SỞ
DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG VÀO BÀI TOÁN
QUẢN LÝ HỒ SƠ SINH VIÊN TẠI VIỆN ĐẠI HỌC MỞ
HÀ NỘI
CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN
MÃ SỐ: 60480201



HƢỚNG DẪN KHOA HỌC
TS. TRƢƠNG TIẾN TÙNG

HÀ NỘI - 2015


Lời cam đoan
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nếu trong luận văn là trung thực và chƣa từng đƣợc ai công bố
trong bất kỳ công trình nào khác.
Tác giả

Trần Tiến Dũng


Lời cảm ơn
Trên thực tế sự thành công nào cũng gắn liền với những sự hỗ trợ, giúp đỡ dù ít
hay nhiều, dù trực tiếp hay gián tiếp của ngƣời khác. Trong suốt thời gian từ khi bắt
đầu học tập tại Viện Đại học Mở Hà Nội đến nay, em đã nhận đƣợc rất nhiều sự quan
tâm, giúp đỡ của quý Thầy Cô, gia đình và bạn bè. Với lòng biết ơn sâu sắc nhất, em
xin gửi đến quý Thầy Cô ở Khoa Sau Đại học và Khoa Công nghệ Thông tin – Viện
Đại học Mở Hà Nội đã cùng với tri thức và tâm huyết của mình truyền đạt vốn kiến
thức quý báu cho chúng em trong suốt thời gian học tập tại trƣờng.
Em xin chân thành cảm ơn TS.Trƣơng Tiến Tùng đã tận tâm hƣớng dẫn em qua
từng buổi học trên lớp cũng nhƣ buổi thảo luận về lĩnh vực sáng tạo trong nghiên cứu
khoa học. Nếu không có những hƣớng dẫn, lời khuyên của thầy thì chắc rằng em sẽ
còn mất rất nhiều thời gian để hoàn thiện luận văn này.
Luận văn này đƣợc thực hiện trong khoảng thời gian không dài. Bƣớc đầu đi vào
nghiên cứu, tìm hiểu về lĩnh vực nghiên cứu khoa học, kiến thức của em còn hạn chế

và bỡ ngỡ. Do vậy, không tránh khỏi những thiếu sót, em rất mong nhận đƣợc những
ý kiến đóng góp quý báu của quý Thầy Cô và các bạn học cùng lớp để kiến thức của
em trong lĩnh vực này đƣợc hoàn thiện hơn.
Sau cùng, em xin kính chúc quý Thầy Cô trong Khoa Sau Đại học thật dồi dào sức
khỏe, niềm tin để tiếp tục thực hiện sứ mệnh cao đẹp của mình là truyền đạt kiến thức
cho thế hệ mai sau.
Trân trọng!


MỤC LỤC
Chƣơng 1: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN.................................... 1
1.1

Ƣu nhƣợc điểm của CSDL tập trung và sự cần thiết của CSDL phân tán. ........ 1

1.2

Xử lý phân tán và hệ thống xử lý phân tán ........................................................ 3
1.2.1

Khái niệm xử lý phân tán ........................................................................ 3

1.2.2

Hệ thống phân tán.................................................................................... 3

1.3

Khái niệm hệ cơ sở dữ liệu phân tán.................................................................. 4


1.4

Sự cần thiết của cơ sở dữ liệu phân tán ............................................................. 6

1.5

1.4.1

Sự phát triển của các cơ cấu tổ chức ....................................................... 6

1.4.2

Giảm chi phí truyền thông tại một trạm .................................................. 7

1.4.3

Hiệu quả công việc .................................................................................. 7

1.4.4

Độ tin cậy và tính sẵn sàng...................................................................... 7

Các đặc điểm của cơ sở dữ liệu phân tán ........................................................... 8
1.5.1

Điểu khiển tập trung ............................................................................... 8

1.5.2

Độc lập dữ liệu ........................................................................................ 8


1.5.3

Dƣ thừa dữ liệu ........................................................................................ 9

1.5.4

Độ tin cậy qua các giao dịch phân tán ..................................................... 10

1.5.5

Cải tiến hiệu năng .................................................................................... 10

1.5.6

Dễ dàng mở rộng hệ thống ...................................................................... 11

1.6

Cấu trúc logic của cơ sở dữ liệu phân tán .......................................................... 11

1.7

Kiến trúc hệ quản trị cơ sở dữ liệu phân tán ...................................................... 12
1.7.1

Các hệ Client/Server................................................................................ 12

1.7.2


Các hệ phân tán ngang hàng( Peer to Peer) ............................................. 13


Chƣơng 2: PHƢƠNG PHÁP THIẾT KẾ CSDL PHÂN TÁN .................................. 18
2.1

2.2

2.3

Các vấn đề về phân mảnh dữ liệu ...................................................................... 18
2.1.1

Giới thiệu về phân mảnh ......................................................................... 18

2.1.2

Các kiểu phân mảnh ................................................................................ 19

2.1.3

Mức độ phân mảnh .................................................................................. 20

2.1.4

Các tính chất phân mảnh ......................................................................... 21

2.1.5

Các kiểu cấp phát .................................................................................... 21


2.1.6

Các yêu cầu thông tin .............................................................................. 22

Phƣơng pháp phân mảnh ngang ......................................................................... 23
2.2.1

Giới thiệu ................................................................................................. 23

2.2.2

Thông tin cần thiết của phân mảnh ngang............................................... 23

2.2.3

Phân mảnh ngang cơ sở ........................................................................... 24

2.2.4

Phân mảnh ngang dẫn xuất...................................................................... 25

Phân mảnh dọc ................................................................................................... 29
2.3.1

Khái niệm phân mảnh dọc ....................................................................... 29

2.3.2

Thông tin cần thiết của phân mảnh dọc................................................... 30


2.4

Phƣơng pháp phân mảnh hỗn hợp ..................................................................... 32

2.5

Quản lý khung nhìn ............................................................................................ 33

2.6

2.5.1

Khung nhìn trong các hệ quản trị cơ sử dữ liệu tập trung ....................... 33

2.5.2

Cập nhật qua khung nhìn ......................................................................... 34

2.5.3

Khung nhìn trong các hệ quản trị cơ sở dữ liệu phân tán ....................... 35

An toàn dữ liệu ................................................................................................... 36
2.6.1

Kiểm soát cấp quyền phân tán................................................................. 37

2.6.2


Kiểm soát cấp quyền tập trung ................................................................ 39


Kiểm soát tính toàn vẹn ngữ nghĩa .................................................................... 41

2.7

2.7.1

Kiểm soát toàn vẹn ngữ nghĩa phân tán .................................................. 42

2.7.2

So sánh việc kiểm soát toàn vẹn ngữ nghĩa tập trung và phân tán.......... 43

Chƣơng 3: ỨNG DỤNG PHÂN TÍCH THIẾT KẾ CSDL PHÂN TÁN TẠI VIỆN
ĐH MỞ HN ................................................................................................................. 44
Phân tích thiết kế CSDL cho bài toán quản lý hồ sơ sinh viên ......................... 44

3.1

3.1.1

Phát biểu bài toán .................................................................................... 44

3.1.2

Sơ đồ phân rã chức năng ......................................................................... 46

3.1.3


Sơ đồ luồng dữ liệu mức khung cảnh ...................................................... 47

3.1.4

Sơ đồ luồng dữ liệu mức đỉnh ................................................................. 47

3.1.5

Sơ đồ luồng dữ liệu mức dƣới đỉnh ......................................................... 48

3.1.6

Đặc tả các chức năng chi tiết ................................................................... 49

3.1.7

ER mở rộng ............................................................................................ 55

Thiết kế cơ sở dữ liệu phân tán bài toán quản lý hồ sơ sinh viên ...................... 62

3.2

3.2.1

Phân mảnh ngang .................................................................................... 62

3.2.2

Phân mảnh dọc ........................................................................................ 65


3.2.3

Đánh giá qua thực nghiệm....................................................................... 70

KẾT LUẬN ................................................................................................................. 71
Danh

mục tài liệu tham khảo ............................................................. 71


DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT
STT

Ý nghĩa

Tên đầy đủ

Tên viết tắt

(Nếu là tiếng anh)

1

CSDL

Cơ sở dữ liệu

2


CSDLPT

Cơ sở dữ liệu phân tán

3

CTĐT

Chƣơng trình đào tạo

Distributed

Distributed database

Hệ quản trị cơ sở dữ

DBMS

management system

liệu phân tán

Database management

Hệ quản trị cơ sở dữ

system

liệu


4

5

DBMS

6

DDBS

distributed database system

7

GCS

Global Conceptual Schema

8

GES

Global External Schema

9

HSSV

Học sinh - sinh viên


10

LCS

Local Conceptual Schema

11

Viện ĐH Mở HN

Viện đại học Mở Hà Nội

Hệ cơ sở dữ liệu phân
tán
Lƣợc đồ khái niệm toàn
cục
Lƣợc đồ ngoài toàn cục

Lƣợc đồ khái niệm cục bộ


DANH SÁCH BẢNG , HÌNH VẼ
Mục lục bảng
Bảng 2. 1 Phân mảnh dọc quan hệ sinh viên ......................................................... 19
Bảng 2. 2 Phân mảnh ngang .................................................................................. 20
Bảng 2. 3 So sánh các phƣơng pháp nhân bản ...................................................... 22
Bảng 2. 4 Phân mảnh ngang dẫn xuất quan hệ SINHVIEN.................................. 26
Bảng 2. 5 Phân mảnh dẫn xuất của DIEMTHI ứng với MONHOC ..................... 27
Bảng 2. 6 Phân mảnh dẫn xuất của DIEMTHI ứng với SINHVIEN .................... 29
Bảng 2. 7 Một ví dụ về ma trận giá trị sử dụng thuộc tính ................................... 32

Bảng 2. 8 Quan hệ kết quả truy vấn tƣơng ứng với khung nhìn .......................... 34
Bảng 2. 9 Ví dụ về ma trận cấp quyền .................................................................. 41
Mục lục hình vẽ
Hình 1. 1 Hệ đa bộ xử lý có bộ nhớ chung.............................................................. 4
Hình 1. 2 Hệ đa bộ xử lý có đĩa chung .................................................................... 5
Hình 1. 3 Kiến trúc tham chiếu Client/Server........................................................ 13
Hình 1. 4 Kiến trúc tham chiếu CSDL phân tán.................................................... 14
Hình 1. 5 Các thành phần của một hệ quản trị CSDL phân tán. ........................... 16
Hình 2. 1 Mô tả mối quan hệ giữa các quan hệ bởi các đƣờng nối ....................... 24
Hình 2. 2 Đồ thị đơn giản nối giữa các mảnh ....................................................... 27
Hình 2. 3 Phân đoạn hỗn hợp. ............................................................................... 32
Hình 2. 4 Tái xây dựng phân đoạn hỗn hợp .......................................................... 33
Hình 3. 1 Sơ đồ phân rã chức năng ....................................................................... 46
Hình 3. 2 Sơ đồ luồng dữ liệu mức khung cảnh .................................................... 47
Hình 3. 3 Sơ đồ luồng dữ liệu mức đỉnh ............................................................... 47


Hình 3. 4 Sơ đồ luồng dữ liệu mức dƣới đỉnh ....................................................... 48
Hình 3. 5 Sơ đồ luồng dữ liệu mức dƣới đỉnh tiến trình “Quản lý CTĐT” .......... 49
Hình 3. 6 Mô hình ER mở rộng ............................................................................. 58
Hình 3. 7 Mô hình ER kinh điển ........................................................................... 60
Hình 3. 8 Mô hình ER quan hệ .............................................................................. 61
Hình 3. 9 Kết quả ví dụ lấy thông tin của sinh viên nam ...................................... 64
Hình 3. 10 Kết quả ví dụ lấy thông tin của sinh viên nam Khoa CNTT ............... 65
Hình 3. 11 Cơ sở dữ liệu trạm chính ..................................................................... 67
Hình 3. 12 Cơ sở dữ liệu trạm phụ ........................................................................ 67
Hình 3. 13 Kết quả ví dụ lấy thông tin cá nhân cơ bản và văn bằng của sinh viên68
Hình 3. 14 Kết quả ví dụ lấy thông tin cá nhân cơ bản và văn bằng của sinh viên
Khoa CNTT ........................................................................................................... 69



Mở đầu
Hiện nay đối với cơ sở dữ liệu cơ sở dữ liệu tập trung và có số lƣợng bản ghi
lớn thì vấn đề thời gian thực hiện truy vấn cơ sở dữ liệu, tốc độ xử lý của máy tính
là một trong những thách thức. Đối với Viện Đại học Mở Hà Nội đào tạo chính quy
và không chính quy là một trong những nhiệm vụ quan trọng. Các công tác liên
quan đến tổ chức, quản lý hồ sơ, quản lý đào tạo rất phức tạp với số lƣợng dữ liệu
phát sinh nhiều, đặc biệt là công tác đánh giá kết quả học với nhiều tiêu chí nhƣ
điểm chuyên cần, điểm thi, điểm kết thúc học phần. Mặt khác, việc tổ chức dữ liệu
lƣu trữ hiện nay trên hệ thống quản lý đang đƣợc thực hiện lƣu trữ một cách tập
trung nên với số lƣợng sinh viên mỗi năm khoảng 50.000 thì lƣợng bản ghi phát
sinh qua mỗi kỳ học sẽ là rất lớn.
Với đặc thù của Viện Đại học Mở Hà Nội là các đơn vị đào tạo đƣợc phân tán
tại nhiều địa điểm khác nhau và tƣơng đối độc lập, từ đó dẫn đến các thông tin trao
đổi giữa các đơn vị quản lý và đơn vị đào tạo trong quá trình quản lý của nhà
trƣờng còn gặp nhiều khó khăn khi cần lấy thông tin của sinh viên cần thiết.
Để giải quyết vấn đề tăng tốc độ xử lý, giảm tải truy vấn thì hiện nay có các
phƣơng án nhƣ nâng cấp SERVER, phân tán cơ sở dữ liệu, vv…. Đối với Viện Đại
học Mở Hà Nội thì phƣơng án phân tán cơ sở dữ liệu là một phƣơng án phù hợp và
khả thi để triển khai tại nhà trƣờng.
Đề tài này em sẽ nghiên cứu phƣơng pháp thiết kế một cơ sở dữ liệu phân tán
từ đó lựa chọn đƣợc một phƣơng án thiết kế cơ sở dữ liệu phân tán phù hợp nhằm
đáp ứng yêu cầu về lƣu trữ dữ liệu phát sinh lớn trong quá trình quản lý và theo dõi
hồ sơ sinh viên tại Viện Đại Học Mở Hà Nội.


Chƣơng 1: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN
1.1 Ƣu nhƣợc điểm của CSDL tập trung và sự cần thiết của CSDL phân tán.
Một hệ cơ sở dữ liệu tập trung, tập tất cả các dữ liệu đƣợc định vị tại một trạm
riêng biệt. Những ngƣời sử dụng tại các trạm từ xa nói chung có thể truy nhập cơ sở

dữ liệu thông qua công cụ truyền thông dữ liệu.
- Hệ cơ sở dữ liệu cá nhân: Các hệ cơ sở dữ liệu cá nhân thƣờng một ngƣời sử
dụng đơn lẻ mà họ vừa thiết kế, vừa tạo lập cơ sở dữ liệu, vừa cập nhật cơ sở
dữ liệu và bảo trì cơ sở dữ liệu. Nói cách khác, họ là ngƣời vừa quản trị cơ sở
dữ liệu đồng thời là ngƣời viết chƣơng trình, đồng thời cũng là ngƣời sử dụng
cuối.
o Ƣu điểm: Dễ thiết kế.
o Nhƣợc điểm: Tính an toàn không cao và khó đáp ứng yêu cầu
ứng dụng thực tế.
- Hệ cơ sở dữ liệu tập trung: Trong các tổ chức lớn, dữ liệu mà hầu hết các ứng
dụng có thể truy nhập đƣợc lƣu trữ trên một máy tính trung tâm. Trong nhiều
hệ thống, những ngƣời sử dụng từ xa có thiết lập truy cập cơ sở dữ liệu này
thông qua các thiết bị đầu cuối và móc nối truyền dữ liệu. Tùy thuộc vào quy
mô tổ chức, máy tính trung tâm này thƣờng là một dàn hay một máy tính. Các
hệ cơ sở dữ liệu trung tâm thƣờng lƣu trữ các cơ sở dữ liệu tích hợp rất lớn và
đƣợc nhiều ngƣời sử dụng truy nhập.
o Ƣu điểm: CSDL dung lƣợng lớn, đồng nhất. Nhiều ngƣời thiết kế
và khai thác.
o Nhƣợc điểm: Chỉ xử lý ở máy trung tâm, xác thực ngƣời dùng bị
hạn chế.
- Hệ cơ sở dữ liệu khách/chủ: Một kiến trúc khách/chủ đƣợc thiết kế với sự phân
tải công việc trên một mạng máy tính trong đó các máy tính khách có thể chia
sẻ các dịch vụ của một máy chủ đơn lẻ. Một máy chủ là một ứng dụng phần

1


mềm cung cấp các dịch vụ quản lý tệp hay cơ sở dữ liệu, quản lý truyền
thông…. đối với các máy khách đang yêu cầu. Một máy khách là một ứng
dụng phần mềm yêu cầu các dịch vụ từ một hay nhiều máy chủ. Thông thƣờng,

ứng dụng máy chủ (máy chủ cơ sở dữ liệu) đƣợc định vị trên một máy tính
riêng trong mạng cục bộ.
o Ƣu điểm: Chi phí cho phần cứng có thể giảm, bổ sung máy khách
dễ dàng.
o Nhƣợc điểm: Xây dựng khó.
Cơ sở dữ liệu phân tán là một tuyển tập dữ liệu có quan hệ logic với nhau, đƣợc
phân bố trên các máy tính của một mạng máy tính.
Nguyên lý các hệ cơ sở dữ liệu phân tán đƣợc xây dựng dựa trên sự hợp nhất của
hai hƣớng tiếp cận đối với quá trình xử lý dữ liệu, đó là lý thuyết các hệ cơ sở dữ liệu
và công nghệ mạng máy tính.
Một trong những động lực thúc đẩy sự phát triển nhanh việc sử dụng các hệ
CSDL là nhu cầu tích hợp các loại dữ liệu, cung cấp đa dạng các loại hình dịch vụ và
các dịch vụ đa phƣơng tiện cho ngƣời sử dụng. Mặt khác, kết nối máy tính thành
mạng với mục tiêu chia sẻ tài nguyên, khai thác có hiệu quả các tài nguyên thông tin,
nâng cao khả năng tích hợp và trao đổi các loại dữ liệu giữa các thành phần trên mạng.
Nhu cầu thu thập, lƣu trữ, xử lý và trao đổi thông tin ngày càng tăng, các hệ thống
xử lý tập trung đã bộc lộ những nhƣợc điểm sau:


Tăng khả năng lƣu trữ thông tin là khó khăn, bởi bị giới hạn tối đa của thiết

bị nhớ.


Độ sẵn sàng phục vụ của CSDL không cao khi số ngƣời sử dụng tăng.



Khả năng tính toán của các máy tính đơn lẻ đang dần tới giới hạn vật lý.




Mô hình tổ chức lƣu trữ, xử lý dữ liệu tập trung không phù hợp cho những

tổ chức kinh tế, xã hội có hoạt động rộng lớn, đa quốc gia.

2


Những nhƣợc điểm này đã đƣợc khắc phục khá nhiều trong hệ thống phân tán.
Những sản phẩm của các hệ thống phân tán đã xuất hiện nhiều trên thị trƣờng và từng
bƣớc chứng minh tính ƣu việt của nó hơn hẳn các hệ thống tập trung truyền thống.
Các hệ thống phân tán sẽ thay thế dần các hệ thống tập trung trong tƣơng lai không xa.

1.2 Xử lý phân tán và hệ thống xử lý phân tán
1.2.1

Khái niệm xử lý phân tán

Thuật ngữ xử lý phân tán có thể là thuật ngữ đƣợc lạm dụng nhiều nhất trong
khoa học máy tính trong những năm vừa qua. Nó thƣờng đƣợc dùng để chỉ những
hệ thống gồm nhiều loại thiết bị khác nhau chẳng hạn nhƣ: hệ đa bộ xử lý, xử lý dữ
liệu phân tán, mạng máy tính.....
Có hai khái niệm xử lý phân tán liên quan với nhau:
- Khái niệm liên quan đến việc tính toán trên Client/Server. Trong đó ứng dụng
đƣợc chia ra thành hai phần, phần của Server và phần của Client và đƣợc vận
hành ở hai nơi. Trong tính toán phân tán này cho phép truy nhập trực tiếp dữ
liệu và xử lý dữ liệu trên Server và Client.
- Khái niệm thứ hai là việc thực hiện các tác vụ xử lý phức tạp trên nhiều hệ
thống. Không gian nhớ và bộ xử lý của nhiều máy cùng hoạt động chia nhau

tác vụ xử lý. Máy trung tâm sẽ giám sát và quản lý các tiến trình này. Có
trƣờng hợp thông qua Internet, hàng nghìn máy cùng xử lý một tác vụ.
Có thể định nghĩa hệ xử lý phân tán nhƣ sau: Hệ xử lý phân tán là một tập hợp
các phần tử xử lý tự trị (không nhất thiết đồng nhất) đƣợc kết nối với nhau bởi một
mạng máy tính và cùng phối hợp thực hiện những công việc gán cho chúng. Phần tử
xử lý ở đây để chỉ một thiết bị tính toán có khả năng thực hiện chƣơng trình trên nó.

1.2.2

Hệ thống phân tán

Hệ thống phân tán là tập hợp các máy tính độc lập kết nối với nhau thành một
mạng máy tính đƣợc cài đặt các hệ cơ sở dữ liệu và các phần mềm hệ thống phân tán
tạo khả năng cho nhiều ngƣời sử dụng truy nhập chia sẻ nguồn thông tin chung. Các

3


máy tính trong hệ thống phân tán có kết nối phần cứng lỏng lẻo, có nghĩa là không
chia sẻ bộ nhớ, chỉ có một hệ điều hành trong toàn bộ hệ thống phân tán.

1.3 Khái niệm hệ cơ sở dữ liệu phân tán
Chúng ta có thể định nghĩa một CSDL phân tán là một tập hợp nhiều CSDL
có liên đới logic và đƣợc phân bố trên một mạng máy tính. Thế thì hệ quản trị cơ
sở dữ liệu phân tán (distributed database management system, viết tắt là
distributed DBMS) đƣợc định nghĩa là một hệ thống phần mềm cho phép quản lý
các hệ CSDL phân tán và làm cho việc phân tán trở nên "trong suốt" đối với ngƣời
sử dụng. Hai thuật ngữ quan trọng trong các định nghĩa này là "liên đới logic" và
"phân bố trên một mạng máy tính". Chúng loại bỏ một số trƣờng hợp đôi khi đƣợc
thừa nhận là biểu thị cho một hệ CSDL phân tán[4].

Trƣớc tiên một hệ cơ sở dữ liệu phân tán (distributed database system, viết
tắt là DDBS) không phải là một "tập hợp các tập tin" đƣợc lƣu riêng rẽ tại mỗi nút
của một mạng máy tính. Để tạo ra một hệ CSDL phân tán, các tập tin không chỉ có
liên đới logic nhƣng chúng còn phải có cấu trúc và đƣợc truy xuất, qua một giao
diện chung. Chúng ta cần nhấn mạnh rằng gần đây đang có nhiều nỗ lực cung cấp
các đặc thù chức năng của DBMS trên các dữ liệu bán cấu trúc (semi-structured
data), đƣợc lƣu trong các tập tin trên Internet (chẳng hạn nhƣ các trang Web). Với
hiện thực đó, đòi hỏi ở trên dƣờng nhƣ khắt khe một cách không cần thiết. Tuy
nhiên việc cung cấp một truy xuất "tựa DBMS" đến dữ liệu khác với một hệ CSDL
phân tán.
Đơn vị xử lý

Đơn vị xử lý

Bộ nhớ

Hệ thống
xuất nhập

Hình 1. 1 Hệ đa bộ xử lý có bộ nhớ chung

4

Đơn vị xử lý


Đôi khi chúng ta giả thiết rằng việc phân bố vật lý của các dữ liệu không phải
là vấn đề quyết định. Đƣa ra quan điểm này có thể tạo thoải mái khi gán cho hai CSDL
(có liên hệ) hiện hữu trên cùng một hệ thống máy tính là một CSDL phân tán. Tuy
nhiên việc phân bố vật lý của các dữ liệu vẫn hết sức quan trọng. Nó làm nảy sinh

những vấn đề không hề gặp phải khi dữ liệu đƣợc lƣu trên cùng một máy tính. Chú ý
rằng phân bố vật lý không nhất thiết là các hệ thống máy tính phải tách biệt nhau về
mặt địa lý, thực sự chúng có thể ở trong cùng một phòng. Nó chỉ khẳng định một điều
là việc giao tiếp giữa chúng đƣợc thực hiện trên một mạng thay vì qua bộ nhớ chung,
với mạng đƣợc xem là tài nguyên dùng chung duy nhất.
Điều này lại dẫn đến một vấn đề khác. Định nghĩa trên cũng loại bỏ các hệ
thống đa bộ xử lý ra khỏi nhóm các hệ CSDL phân tán. Một hệ đa bộ xử lý nói chung
đƣợc xem nhƣ một hệ thống có hai hoặc nhiều bộ xử lý cùng dùng chung một dạng bộ
nhớ nào đó, hoặc là bộ nhớ chính và khi đó đƣợc gọi là có bộ nhớ chung (shared
memory) hay kết chặt (tightly coupled) (Hình 1.1), hoặc dùng chung bộ nhớ thứ cấp
và khi đó đƣợc gọi là có đĩa chung (shared disk) hay kết hờ (loosely coupled) (Hình
1.2).
Hệ thống máy tính
CPU

Bộ nhớ

Hệ thống máy tính

Hệ thống máy tính
CPU

CPU

Bộ nhớ

Bộ nhớ thứ cấp
dùng chung

Hình 1. 2 Hệ đa bộ xử lý có đĩa chung


5

Bộ nhớ


Trong ngữ cảnh hệ xử lý phân tán thì hệ cơ sở dữ liệu phân tán có thể đƣợc xem
nhƣ những công cụ làm cho quá trình xử lý dữ liệu phân tán dễ dàng hơn và hiệu quả
hơn. Khái niệm hệ cơ sở dữ liệu phân tán ở đây bao gồm cả khái niệm cơ sở dữ liệu
phân tán và hệ quản trị cơ sở dữ liệu phân tán.
Cơ sở dữ liệu phân tán là một tập các cơ sở dữ liệu có quan hệ với nhau về mặt
logic và đƣợc phân bố trên một mạng máy tính. Hệ quản trị cơ sở dữ liệu phân tán là
hệ thống phần mềm cho phép quản trị cơ sở dữ liệu phân tán và làm cho sự phân tán
đó là trong suốt đối với ngƣời sử dụng.
Trong mô hình cơ sở dữ liệu phân tán bản thân cơ sở dữ liệu có ở trên nhiều máy
tính khác nhau. Nhƣ vậy, đặc trƣng của cơ sở dữ liệu phân tán là các CSDL đƣợc phân
bố trên mạng máy tính và có quan hệ với nhau về mặt logic.
Hệ CSDL phân tán không đơn thuần bao gồm nhiều file dữ liệu đƣợc tổ chức lƣu
trữ riêng lẻ trên các thiết bị nhớ của mạng máy tính. Để tạo một hệ CSDL phân tán,
các file không chỉ có quan hệ với nhau về mặt logic mà còn cần có một cấu trúc giao
diện chung giữa chúng để các file có thể truy nhập lẫn nhau.
Có rất nhiều ứng dụng yêu cầu các hệ quản trị CSDL thao tác trên dữ liệu bán cấu
trúc hoặc không cấu trúc, nhƣ các file Web trên mạng Internet.

1.4 Sự cần thiết của cơ sở dữ liệu phân tán
Trong những năm gần đây, công nghệ cơ sở dữ liệu phân tán đã trở thành một lĩnh
vực quan trọng của công nghệ thông tin, tính cần thiết của nó ngày càng đƣợc nâng
cao. Có nhiều nguyên nhân thúc đẩy sự phát triển của các hệ CSDLPT

1.4.1


Sự phát triển của các cơ cấu tổ chức

Cùng với sự phát triển của xã hội, nhiều cơ quan, xí nghiệp có cơ cấu tổ chức
không tập trung, hoạt động phân tán trên phạm vi rộng. Vì vậy thiết kế và cài đặt cơ sở
dữ liệu phân tán là phù hợp, đáp ứng mọi nhu cầu truy xuất và khai thác dữ liệu. Cùng
với sự phát triển của công nghệ viễn thông, tin học, động cơ thúc đẩy kinh tế, việc tổ
chức các trung tâm máy tính lớn và tập trung trở thành vấn đề cần nghiên cứu.

6


Cơ cấu tổ chức và vấn đề kinh tế là một trong những nguyên nhân quan trọng nhất
của sự phát triển cơ sở dữ liệu phân tán.

1.4.2

Giảm chi phí truyền thông tại một trạm

Trong thực tế, sử dụng một số ứng dụng mang tính địa phƣơng sẽ làm giảm chi
phí truyền thông tại một trạm lớn hơn so với một ứng dụng mang tính toàn cục. Bởi
vậy, việc tối ƣu hoá tính địa phƣơng của các ứng dụng là một trong những mục tiêu
chính của việc thiết kế và cài đặt một CSDLPT.

1.4.3

Hiệu quả công việc

Sự tồn tại một số hệ thống xử lý địa phƣơng đạt đƣợc thông qua việc xử lý song
song. Vấn đề này có thể thích hợp với mọi hệ đa xử lý. CSDLPT có thuận lợi trong

phân tích dữ liệu phản ánh điều kiện phụ thuộc của các ứng dụng, cực đại hoá tính địa
phƣơng của ứng dụng. Theo cách này tác động qua lại giữa các bộ xử lý đƣợc làm cực
tiểu. Công việc đƣợc phân chia giữa các bộ xử lý khác nhau và tránh đƣợc các tắc
nghẽn thông tin trên mạng truyền thông hoặc các dịch vụ chung của toàn hệ thống.
Vậy sự phân tán dữ liệu sẽ phản ánh hiệu quả công việc làm tăng tính địa phƣơng của
các ứng dụng.

1.4.4

Độ tin cậy và tính sẵn sàng

Cách tiếp cận CSDLPT, cho phép truy nhập độ tin cậy và tính sẵn sàng cao hơn.
Tuy nhiên, để đạt đƣợc mục đích đó là vấn đề không đơn giản đòi hỏi kỹ thuật phức
tạp. Những lỗi xuất hiện trong một CSDLPT có thể xảy ra nhiều hơn vì số các thành
phần cấu thành lớn hơn, nhƣng ảnh hƣởng của lỗi chỉ ảnh hƣởng tới các ứng dụng sử
dụng các trạm lỗi.
CSDLPT là sự tập hợp các dữ liệu thuộc cùng một hệ thống về mặt logic nhƣng
phân bố trên các trạm của mạng máy tính. Công nghệ CSDLPT là sự kết hợp giữa hai
vấn đề phân tán và hợp nhất:


Phân tán: phân tán dữ liệu trên các trạm của mạng



Hợp nhất: hợp nhất về mặt logic các dữ liệu phân tán sao cho chúng xuất

hiện với ngƣời sử dụng giống nhƣ với CSDL đơn lẻ duy nhất.

7



Công nghệ CSDL phân tán mới thực sự phát triển trong những năm gần đây nhờ
sự phát triển của kỹ thuật tính toán, kỹ thuật truyền thông và mạng máy tính. Những
ứng dụng đƣợc xây dựng trên CSDL phân tán đã xuất hiện nhiều trên thị trƣờng và
từng bƣớc chứng minh tính ƣu việt của nó so với CSDL tập trung.

1.5 Các đặc điểm của cơ sở dữ liệu phân tán
1.5.1

Điểu khiển tập trung

Điều khiển tập trung (Centralized Control) là một đặc điểm của cơ sở dữ liệu tập
trung, toàn bộ dữ liệu đƣợc tập trung lại nhằm để tránh sự dƣ thừa dữ liệu, đảm bảo
đƣợc tính độc lập của dữ liệu. Dữ liệu đƣợc quản lý tập trung bởi ngƣời quản trị cơ sở
dữ liệu. Chức năng cơ bản của ngƣời quản trị cơ sở dữ liệu (DBA - Database
Administrator) là bảo đảm sự an toàn của dữ liệu. Trong các cơ sở dữ liệu phân tán
vấn đề điều khiển tập trung không đƣợc nhấn mạnh. Nói chung, trong các cơ sở dữ
liệu phân tán, sự điều khiển đƣợc thực hiện theo một cấu trúc điều khiển phân cấp bao
gồm hai loại ngƣời quản trị cơ sở dữ liệu:
 Ngƣời quản trị cơ sở dữ liệu toàn cục (Global Database Administrator) là
ngƣời có trách nhiệm chính về toàn bộ cơ sở dữ liệu phân tán..
 Ngƣời quản trị cơ sở dữ liệu cục bộ (Local Database Administrator) là
ngƣời có trách nhiệm về cơ sở dữ liệu cục bộ của họ.
Tuy nhiên, những ngƣời quản trị cơ sở dữ liệu cục bộ cần phải có những quyền
độc lập riêng về cơ sở dữ liệu cục bộ của mình mà ngƣời quản trị cơ sở dữ liệu toàn
cục hoàn toàn không có những quyền này và sự phối hợp giữa các vị trí đƣợc thực
hiện bởi chính những ngƣời quản trị cục bộ. Đặc điểm này đƣợc gọi là sự độc lập vị trí.
Các cơ sở dữ liệu phân tán có thể khác nhau rất nhiều về mức độ độc lập vị trí. Từ sự
độc lập vị trí hoàn toàn (không có ngƣời quản trị cơ sở dữ liệu tập trung) đến sự điều

khiển tập trung hoàn toàn.

1.5.2

Độc lập dữ liệu

Độc lập dữ liệu (Data Independence) là một đặc điểm của cơ sở dữ liệu. Độc lập
dữ liệu có nghĩa là tổ chức lƣu trữ dữ liệu là trong suốt đối với ngƣời lập trình ứng

8


dụng. Ƣu điểm của độc lập dữ liệu là các chƣơng trình không bị ảnh hƣởng bởi những
thay đổi về tổ chức lƣu trữ vật lý của dữ liệu.
Trong các hệ cơ sở dữ liệu phân tán, độc lập dữ liệu cũng quan trọng nhƣ trong
các cơ sở dữ liệu tập trung. Tuy nhiên, một đặc điểm mới đƣợc đƣa vào trong khái
niệm thông thƣờng của độc lập dữ liệu là sự trong suốt phân tán (Distribution
Transparency). Nhờ sự trong suốt phân tán mà các chƣơng trình ứng dụng có thể đƣợc
viết giống nhƣ trong cơ sở dữ liệu không đƣợc phân tán. Vì vậy, tính đúng đắn của các
chƣơng trình ứng dụng không bị ảnh hƣởng bởi sự di chuyển dữ liệu từ một vị trí này
đến một vị trí khác. Tuy nhiên, tốc độ thực hiện của các chƣơng trình ứng dụng thì bị
ảnh hƣởng.
Độc lập dữ liệu trong cơ sở dữ liệu tập trung đƣợc thể hiện thông qua một kiến
trúc nhiều mức, các mức này có những mô tả khác nhau về dữ liệu và những ánh xạ
biến đổi giữa các mức. Sự trong suốt phân tán trong cơ sở dữ liệu phân tán đƣợc thể
hiện bằng cách bổ sung thêm các mức trong suốt vào kiến trúc nhiều mức của cơ sở dữ
liệu tập trung.

1.5.3


Dư thừa dữ liệu

Trong các cơ sở dữ liệu tập trung, sự dƣ thừa dữ liệu đƣợc giảm thiểu, vì tránh sự
không nhất quán giữa nhiều bản sao bằng cách chỉ có một bản sao và tiết kiệm vùng
nhớ lƣu trữ. Các ứng dụng chia sẻ chung, truy xuất đến các tập tin dữ liệu.
Tuy nhiên, trong các cơ sở dữ liệu phân tán, sự dƣ thừa dữ liệu là một đặc điểm
cần thiết, vì các lý do sau:


Làm tăng tính cục bộ của các ứng dụng nếu dữ liệu đƣợc nhân bản tại tất

cả các vị trí mà ứng dụng cần dữ liệu này. Khi đó, các ứng dụng cục bộ đƣợc thực
hiện nhanh hơn vì không cần phải truy xuất dữ liệu từ xa.


Làm tăng tính sẵn sàng của hệ thống ứng dụng, vì một vị trí có sự cố sẽ

không làm ngƣng sự thực hiện của các ứng dụng ở những vị trí khác nếu dữ liệu tại
vị trí bị hỏng đƣợc nhân bản tại các vị trí khác.

9


Tuy nhiên, sự nhân bản dữ liệu cần phải xem xét kỹ lƣỡng dựa vào hai loại ứng
dụng cơ bản, đó là ứng dụng chỉ đọc và ứng dụng cập nhật. Sự nhân bản dữ liệu giúp
cho các ứng dụng chỉ đọc đƣợc thực hiện nhanh hơn, nhƣng nó làm cho các ứng dụng
cập nhật bị thực hiện lâu hơn vì phải cập nhật dữ liệu tại các vị trí đƣợc nhân bản. Nhƣ
vậy, sự nhân bản dữ liệu sẽ là một ƣu điểm nếu hệ thống có rất nhiều ứng dụng chỉ đọc
và có rất ít ứng dụng cập nhật. Trong trƣờng hợp ngƣợc lại thì sự nhân bản dữ liệu lại
là một nhƣợc điểm.


1.5.4

Độ tin cậy qua các giao dịch phân tán

Hệ quản trị CSDL phân tán cải thiện độ tin cậy qua các giao dịch phân tán, vì các
thành phần đƣợc nhân bản hạn chế đƣợc các vị trí lỗi riêng lẻ. Lỗi của trạm riêng, hoặc
lỗi của truyền thông làm cho một hoặc nhiều trạm mất liên lạc, không đủ để phá vỡ
toàn bộ hệ thống.
Trong trƣờng hợp CSDL phân tán, điều này nghĩa là một số dữ liệu không thể
truy nhập đƣợc, nhƣng nếu biết cách hỗ trợ cho các giao dịch phân tán và các giao
thức ứng dụng, thì ngƣời sử dụng vẫn có thể truy nhập đƣợc tới phần khác trong
CSDL phân tán.
Giao dịch là một đơn vị tính toán cơ bản, nhất quán và tin cậy, bao gồm một chuỗi
các thao tác CSDL đƣợc thực hiện chuyển từ trạng thái CSDL nhất quán này sang
trạng thái CSDL nhất quán khác ngay cả khi có một số giao dịch đƣợc thực hiện đồng
thời và thậm chí cả khi xảy ra lỗi. Vì vậy, hệ quản trị CSDL phải hỗ trợ đầy đủ cho
giao dịch đảm bảo rằng việc thực thi đồng thời các giao dịch của ngƣời sử dụng sẽ
không vi phạm tính nhất quán của CSDL trong khi hệ thống có lỗi, với điều kiện là
giao dịch đƣợc thực hiện chính xác, nghĩa là tuân theo các qui tắc toàn vẹn của CSDL.

1.5.5

Cải tiến hiệu năng

Hiệu năng của CSDL phân tán đƣợc cải tiến dựa vào hai điểm:
a)

Hệ quản trị CSDL phân tán có khả năng phân mảnh CSDL khái niệm và


cho phép cục bộ hoá dữ liệu. Có hai ƣu điểm nổi bật:

10


o Vì mỗi trạm chỉ xử lý một phần CSDL, sự tranh chấp về CPU và các dịch
vụ vào/ra không nghiêm trọng nhƣ trong các hệ CSDL tập trung.
o Tính cục bộ làm giảm trễ truy nhập từ xa thƣờng gặp trên các mạng diện
rộng.
Hầu hết các hệ CSDL phân tán đƣợc cấu trúc nhằm tận dụng tối đa những ƣu
điểm của tính cục bộ dữ liệu. Lợi ích đầy đủ của việc giảm tranh chấp và giảm chi phí
truyền chỉ có thể có đƣợc bằng cách phân mảnh và phân tán dữ liệu hợp lý.
b)

Tính song song của các hệ thống phân tán có thể đƣợc khai thác để thực

hiện song song liên truy vấn và truy vấn nội bộ. Liên truy vấn song song là khả năng
thực hiện nhiều truy vấn tại cùng thời điểm, còn nội truy vấn song song là phƣơng
pháp tách một truy vấn đơn thành các truy vấn con và mỗi truy vấn con đƣợc thực
hiện tại các trạm khác nhau, truy nhập các phần khác nhau của CSDL phân tán.

1.5.6

Dễ dàng mở rộng hệ thống

Trong môi trƣờng phân tán, dễ dàng tăng kích thƣớc dữ liệu và hiếm khi cần sửa
đổi trong các hệ thống lớn. Việc mở rộng thƣờng có thể đƣợc thực hiện bằng cách tăng
khả năng lƣu trữ và xử lý của mạng. Rõ ràng là không thể có đƣợc sự gia tăng “khả
năng” một cách tuyến tính, vì điều này phụ thuộc vào chi phí phân tán. Tuy nhiên, vẫn
có thể có những cải tiến có ý nghĩa. Khả năng mở rộng hệ thống dễ dàng mang tính

kinh tế, chi phí giảm.

1.6 Cấu trúc logic của cơ sở dữ liệu phân tán
Có 3 kiểu thiết kế cơ sở dữ liệu phân tán trên mạng máy tính.
a) Các bản sao: Cơ sở dữ liệu đƣợc sao chép thành nhiều bản và đƣợc lƣu
trữ trên các trạm phân tán khác nhau của mạng máy tính.
b) Phân mảnh: Cơ sở dữ liệu đƣợc phân thành nhiều mảnh nhỏ theo kỹ
thuật phân mảnh dọc hoặc phân mảnh ngang, các mảnh đƣợc lƣu trữ
trên các trạm khác nhau.
c) Mô hình kết hợp các bản sao và phân mảnh. Trên một số trạm chứa các
bản sao, một số trạm khác chứa các mảnh.

11


1.7 Kiến trúc hệ quản trị cơ sở dữ liệu phân tán
1.7.1

Các hệ Client/Server

Các hệ quản trị CSDL Client/Server cung cấp kiến trúc hai lớp chức năng
Server và chức năng Client, nhằm tạo ra sự dễ dàng trong việc quản lý tính phức tạp
của các hệ quản trị CSDL hiện đại và tính phức tạp của việc phân tán dữ liệu.
Server thực hiện hầu hết các công việc quản lý dữ liệu. Nghĩa là tất cả mọi xử
lý và tối ƣu hoá truy vấn, quản lý giao dịch và quản lý lƣu trữ đều đƣợc thực hiện
trên Server. Với Client ngoài ứng dụng và giao diện ngƣời sử dụng, có một module
hệ quản trị CSDL Client trách nhiệm quản lý dữ liệu và khóa giao dịch đƣợc gửi đến
Client. Client và Server trao đổi với nhau bởi các câu lệnh SQL. Cụ thể hơn, Client
chuyển truy vấn SQL đến Server, Server sẽ thực hiện và trả lại kết quả cho Client.
Loại kiến trúc Client/Server đơn giản chỉ có một Server đƣợc truy nhập bởi

nhiều Client, gọi là đa Client-một Server. Việc quản lý dữ liệu không khác so với
CSDL tập trung. CSDL đƣợc lƣu chỉ trên Server và có phần mềm quản lý nó. Tuy
nhiên, sự khác biệt quan trọng so với các hệ thống tập trung là cách thực thi giao
dịch và quản lý bộ nhớ Cache.
Loại kiến trúc có nhiều Server trong hệ thống, đƣợc gọi là đa Client-đa Server.
Có hai chiến lƣợc quản lý: hoặc Client quản lý kết nối của nó tới Server hoặc Client
chỉ biết Server chủ của nó và liên lạc với các Server khác qua Server chủ khi có yêu
cầu. Chiến lƣợc thứ nhất làm đơn giản cho các Server, nhƣng lại gắn thêm nhiều
trách nhiệm cho các máy Client. Điều này dẫn đến một hệ thống đƣợc gọi là hệ máy
khách tự phục vụ. Mặt khác, với chiến lƣợc thứ hai, tập trung vào chức năng quản lý
dữ liệu tại Server. Vì vậy, tính trong suốt của truy nhập dữ liệu đƣợc cung cấp tại
giao diện Server.
Mô hình CSDL logic Client/Server là duy nhất. Mô hình mức vật lý của nó có
thể phân tán. Vì vậy phân biệt giữa Client/Server và ngang hàng không phải ở mức
độ trong suốt đƣợc cung cấp cho ngƣời sử dụng và cho ứng dụng mà ở mô hình kiến
trúc đƣợc dùng để nhận ra mức độ trong suốt…

12


Operating

Systems

Giao diện
ngƣời sử dụng

Chƣơng trình
ứng dụng


........

Hệ quản trị CSDL Client
Phần mềm truyền thông

Phần mềm truyền thông
Bộ điều khiển dữ liệu ngữ nghĩa
Bộ tối ƣu hoá truy vấn
Operating

Bộ quản lý giao dịch
Bộ quản lý khôi phục
Bộ xử lý hỗ trợ thời gian thực hiện
Hệ thống

CSDL

Hình 1. 3 Kiến trúc tham chiếu Client/Server

1.7.2

Các hệ phân tán ngang hàng( Peer to Peer)

Trƣớc tiên khảo sát về tổ chức dữ liệu vật lý trong các hệ ngang hàng. Tổ chức
lƣu trữ trên các máy khác nhau có thể khác nhau. Điều này có nghĩa là cần phải có
một định nghĩa nội tại riêng cho mỗi vị trí, đƣợc gọi là lƣợc đồ nội tại cục bộ LIS
(Local Internal Schema).
Lƣợc đồ khái niệm toàn cục mô tả cấu trúc logic của dữ liệu ở mọi vị trí. Dữ
liệu trong một CSDL phân tán thƣờng đƣợc phân mảnh và nhân bản trên các vị trí
khác nhau. Vì vậy cần phải mô tả tổ chức lƣu trữ dữ liệu vật trên mọi vị trí. Cần bổ

sung thêm tầng thứ trong kiến trúc cơ sở dữ liệu 3 mức, đó là lƣợc đồ khái niệm cục

13


bộ LCS (Local Conceptual Schema). Vì vậy lƣợc đồ khái niệm toàn cục GCS
(Global Conceptual Schema) là hợp của các lƣợc đồ khái niệm cục bộ. Mức trên
cùng là khung nhìn dữ liệu của ngƣời sử dụng, lƣợc đồ ngoài ES (External Schema).
Ngƣời sử dụng khác nhau có cách nhìn dữ liệu cũng khác nhau. Nhƣ vậy kiến trúc
của hệ cơ sở dữ liệu phân tán có 3 mức: Có nhiều khung nhìn dữ liệu khác nhau
trong mức lƣợc đồ ngoài, nhƣng chỉ có duy nhất một mô hình khái niệm toàn cục và
có nhiều mô hình khái niệm cục bộ, ứng với lƣợc đồ trong cục bộ trên mỗi vị trí.

ES1

. n
ES

ES2
..
GCS

LCS1

.LCSn

LCS2
..

LIS1


.LISn

LIS2
..

Hình 1. 4 Kiến trúc tham chiếu CSDL phân tán.

Mô hình trong hình 1.4 đƣợc mở rộng từ mô hình ANSI/SPARC. Nó phản ánh
tính trong suốt và tính độc lập dữ liệu. Trong suốt định vị và trong suốt nhân bản
đƣợc hỗ trợ bằng các lƣợc đồ khái niệm cục bộ và toàn cục và ánh xạ giữa chúng.
Mặt khác, trong suốt mạng đƣợc hỗ trợ bằng lƣợc đồ khái niệm toàn cục. Ngƣời sử
dụng truy vấn dữ liệu không cần biết đến vị trí hay các thành phần CSDL cục bộ. Hệ
quản trị CSDL phân tán dịch truy vấn toàn cục thành các nhóm truy vấn cục bộ và
đƣợc thực hiện bởi các thành phần quản trị CSDL phân tán tại các trạm khác nhau
và giữa các trạm giao tiếp với nhau.
Mô hình đang xét là mô hình ANSI/SPARC đƣợc mở rộng bằng cách thêm vào
từ điển/thƣ mục toàn cục GD/D (Glocal Directory/Directionary) cho phép ánh xạ
yêu cầu toàn cục. Ánh xạ cục bộ đƣợc thực hiện bởi từ điển/thƣ mục cục bộ LD/D

14


×