CSDL NC- Pham T Xuan L
oc 10/2008
1
CSDL NÂNG CAO
Phạm Thị Xuân Lộc
10/2008
Đại học Cần thơ
Khoa CNTT-TT
CSDL NC- Pham T Xuan L
oc 10/2008
2
MỤC LỤC
•
A. HQTCSDL phân tán
•
B. HQTCSDL hướng đối tượng
•
C. Web và HQTCSDL
•
D. Kho dữ liệu
CSDL NC- Pham T Xuan L
oc 10/2008
3
A. HQTCSDL
phân tán
(DDBMS)
CSDL NC- Pham T Xuan L
oc 10/2008
4
A. HQTCSDL phân tán
(DDBMS: Distributed DataBase
Management System)
•
I. Giới thiệu
•
II. Chức năng và kiến trúc của
DDBMS
•
III. Thiết kế CSDL quan hệ phân tán
•
IV. Tính trong suốt trong DDBMS
•
V. 10 qui tắc của Date cho DDBMS
CSDL NC- Pham T Xuan L
oc 10/2008
5
A.I Giới thiệu
•
1. Nhu cầu có DDBMS
•
2. Khái niệm
•
3. Lợi và bất lợi của DDBMS
•
4. Tính đồng nhất và bất đồng trong
DDBMS
CSDL NC- Pham T Xuan L
oc 10/2008
6
A.I.1. Nhu cầu có
DDBMS
•
Ta đã ng/c các DBMS tập trung:
–
1 CSDL luận lý
–
tại 1 vị trí (site)
–
dưới sự điều khiển của 1 DBMS
•
Trong đó, CSDL như một hòn
đảo thông tin vì cách biệt, khó
truy xuất, do:
–
cách trở về địa lý,
–
cấu hình các máy tính không tương thích nhau,
–
các nghi thức truyền thông không tương thích nhau, …
CSDL NC- Pham T Xuan L
oc 10/2008
7
A.I.1. Nhu cầu có DDBMS
(2)
•
Gần đây, phát triển nhanh chóng các công nghệ:
–
Mạng
–
Truyền thông dữ liệu
qua:
–
Internet
–
Tính toán di dộng và không dây (mobile and
wireless computing)
–
Thiết bị thông minh
–
Tính toán lưới (grid computing)
CSDL NC- Pham T Xuan L
oc 10/2008
8
A.I.1. Nhu cầu có DDBMS
(3)
•
Công nghệ DDBMS= kết hợp 2 công
nghệ trên
∀
⇒ có thể thay đổi cách thức làm việc từ
tập trung sang phân tán
∀
⇒ là một buớc phát triển lớn trong lĩnh
vực DBMS
CSDL NC- Pham T Xuan L
oc 10/2008
9
A.I.1. Nhu cầu có DDBMS
(4)
•
Cách tiếp cận phân tán phản ánh cấu
trúc về tổ chức của các xí nghiệp, vốn
đã phân tán về:
–
luận lý: phân hệ, bộ môn, dự án, …
–
vật lý: văn phòng, xưởng, phòng,
…
CSDL NC- Pham T Xuan L
oc 10/2008
10
A.I.1. Nhu cầu có DDBMS
(5)
•
Tính chia sẻ dữ liệu và tính hiệu quả
trong truy cập dữ liệu cần được cải thiện
bằng một DDBMS.
•
Cần làm cho dữ liệu truy xuất được ở mọi
đơn vị.
•
Cần lưu dữ liệu gần với nơi chúng thường
được dùng nhất.
CSDL NC- Pham T Xuan L
oc 10/2008
11
A.I Giới thiệu
•
1. Nhu cầu có DDBMS
•
2. Khái niệm
•
3. Lợi và bất lợi của DDBMS
•
4. Tính đồng nhất và bất đồng trong
DDBMS
CSDL NC- Pham T Xuan L
oc 10/2008
12
A.I.2 Khái niệm
•
a. CSDL phân tán:
•
b. Hệ quản trị CSDL phân tán (DDBMS):
•
c. Xử lý phân tán (distributed processing)
•
d. Các DBMS song song (parallel
DBMSs)
CSDL NC- Pham T Xuan L
oc 10/2008
13
A.I.2 Khái niệm
CSDL phân tán
Là một tập hợp (collection) các dữ
liệu chia sẻ và các mô tả của chúng,
•
có liên quan nhau về luận lý
•
phân tán về vật lý trên một mạng
máy tính
CSDL NC- Pham T Xuan L
oc 10/2008
14
A.I.2 Khái niệm Hệ quản trị
CSDL phân tán (DDBMS)
–
Đinh nghĩa:
–
Đoạn (fragment)
–
Các loại trình ứng dụng
–
Đặc tính của DDBMS
–
Tính trong suốt trong DDBMS
CSDL NC- Pham T Xuan L
oc 10/2008
15
A.I.2 Khái niệm DDBMS (2)
Định nghĩa:
Là một hệ thống phần mềm, cho
phép:
•
Quản trị một CSDL phân tán
•
Làm cho sự phân tán này trong suốt
đối với người sử dụng
CSDL NC- Pham T Xuan L
oc 10/2008
16
A.I.2 Khái niệm DDBMS (3)
Đoạn (fragment):
Một DDBMS gồm một CSDL luận lý được chia thành
các đoạn.
-
Mỗi đoạn được lưu trên một hoặc nhiều máy tính
dưới sự kiểm soát của một DBMS riêng thông qua
một mạng.
-
Mỗi site có khả năng:
-
xử lý độc lập các yêu cầu của người dùng muốn truy xuất
dữ liệu cục bộ,
-
xử lý dữ liệu lưu ở các máy khác trên mạng.
CSDL NC- Pham T Xuan L
oc 10/2008
17
A.I.2 Khái niệm DDBMS (4)
Các loại trình ứng dụng:
Ứng dụng cục bộ (local
application): không yêu cầu dữ liệu
ở nơi khác.
Ứng dụng toàn cục (global
application): ngược lại
CSDL NC- Pham T Xuan L
oc 10/2008
18
A.I.2 Khái niệm DDBMS (5)
Đặc tính của DDBMS:
•
Là 1 tập hợp các dữ liệu chia sẻ có liên quan về luận lý
•
Dữ liệu được chia nhỏ thành các đoạn
•
Các đoạn có thể được lặp lại (replicate)
•
Các đoạn và các bản sao của chúng đuợc phân phối trên các
sites
•
Các sites liên kết nhau qua một mạng truyền thông
•
Dữ liệu trên mỗi site được điều khiển bởi một hệ quản trị
CSDL (DBMS)
•
DBMS trên mỗi site có thể điều khiển một cách tự chủ các ứng
dụng cục bộ
•
Mỗi DBMS tham gia vào ít nhất một ứng dụng toàn cục.
CSDL NC- Pham T Xuan L
oc 10/2008
19
A.I.2 Khái niệm DDBMS (6)
Mạng máy tính
Site 1
Site 2
Site 3
Site 4
DB
DB
CSDL NC- Pham T Xuan L
oc 10/2008
20
A.I.2 Khái niệm DDBMS (7)
Tính trong suốt trong DDBMS:
Việc:
•
một CSDL phân tán trên nhiều đoạn, trên nhiều máy tính khác nhau
•
các đoạn có thể được nhân bản
cần phải được che dấu đối với người sử
dụng
⇒ Làm cho DDBMS có vẻ như một hệ
thống tập trung
CSDL NC- Pham T Xuan L
oc 10/2008
21
A.I.2 Khái niệm Xử lý phân
tán
•
Cần phân biệt giữa một DDBMS và
một xử lý phân tán
•
Xử lý phân tán:
–
Một CSDL tập trung có thể được truy
xuất qua một mạng máy tính.
CSDL NC- Pham T Xuan L
oc 10/2008
22
A.I.2 Khái niệm DBMS song
song
•
Cần phân biệt giữa một DDBMS
và một DBMS song song
•
DBMS song song: là một DBMS
–
chạy trên nhiều bộ xử lý và đĩa,
–
được thiết kế để khai thác song song các
hoạt động bất cứ lúc nào có thể,
–
để tăng cường hiệu suất
CSDL NC- Pham T Xuan L
oc 10/2008
23
A.I Giới thiệu
•
1. Nhu cầu có DDBMS
•
2. Khái niệm
•
3. Lợi và bất lợi của DDBMS
•
4. Tính đồng nhất và bất đồng trong
DDBMS
CSDL NC- Pham T Xuan L
oc 10/2008
24
A.I.3. Lợi của DDBMS
•
Phản ánh cấu trúc về mặt tổ chức
•
Cải thiện tính chia sẻ và tính tự chủ cục bộ
•
Cải thiện tính sẵn sàng
•
Cải thiện tính tin cậy
•
Cải thiện hiệu suất
•
Tiết kiệm
•
Tăng trưởng theo khối (modular growth)
•
Tích hợp
•
Giữ tính cạnh tranh
CSDL NC- Pham T Xuan L
oc 10/2008
25
A.I.3. Bất lợi của
DDBMS
•
Phức tạp
•
Đắt
•
Khó an toàn
•
Khó kiểm soát tích hợp hơn
•
Thiếu chuẩn
•
Thiếu kinh nghiệm
•
Thiết kế CSDL phức tạp hơn