Tải bản đầy đủ (.pptx) (119 trang)

Chuong 2 co so du lieu phan tan

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (822.81 KB, 119 trang )

Chương 2. Cơ sở dữ liệu phân tán


Nội dung
Tại sao cần CSDLPT
Khái niệm CSDLPT
Phân loại CSDLPT
Đặc điểm của CSDLPT
Mục tiêu các Hệ quản trị CSDLPT
Kiến trúc các hệ CSDLPT
Định nghĩa dữ liệu
Đánh giá truy vấn
Quản lý giao tác phân tán


Tại sao cần CSDLPT
Nhu cầu dùng chung một dữ liệu hợp nhất
 Các tổ chức có nhiều trụ sở phân tán ở nhiều vị trí địa lý khác nhau
 Làm thế nào để có thể quản lý các luồng dữ liệu và sử dụng chung dữ liệu,
chương trình của tổ chức?

 Một hệ thống phân tán bao gồm hai phần: mạng máy tính và CSDL được phân
tán.


Khái niệm
CSDL phân tán là một tập hợp nhiều CSDL có liên quan logic và được phân bố
trên một mạng máy tính
Trạm 1

Trạm 5


Trạm 2

Mạng truyền dữ liệu

Trạm 4

Trạm 3

Môi trường hệ CSDL phân tán


Phân loại CSDLPT
CSDLPT thuần nhất
 Các CSDL tại các máy trạm được quản lý cùng hệ QTCSDL.
 Thường là kết quả của thiết kế từ trên xuống từ một CSDL tập trung.
 Dùng cho các CSDL thiết kế từ đầu.

CSDLPT không thuần nhất
 CSDLPT được tích hợp từ các CSDL tại các máy trạm khác nhau hệ QTCSDL.
 Thích hợp cho thiết kế từ dưới lên.
 Tích hợp các CSDL đã có.


Đặc điểm của CSDLPT
Chia sẻ tài nguyên:

 Các tài nguyên (dữ liệu) được phân bố trên mạng.
 Có chương trình quản lý truy cập nhất quán và tin cậy

Tính mở


 Dễ dàng mở rộng phần cứng và phần mềm
 Các hệ thống phần cứng và phần mềm có nhiều loại khác nhau nhưng chung
chuẩn

Khả năng song song

 Có thể thực hiện đồng thời nhiều thao tác trên CSDL

Khả năng thứ lỗi

 Có khả năng thay thế đảm bảo hoạt động liên tục.


Đặc điểm của CSDLPT (tiếp)
Tính trong suốt
 Trong suốt vị trí
 Trong suốt trong việc sử dụng
 Trong suốt trong sự phân chia
 Trong suốt trong sự trùng lặp

Tính tin cậy và nhất quán
 Dữ liệu được lặp lại nhưng luôn nhất quán


Kiến trúc CSDLPT
Sơ đồ tổng thể

Sơ đồ phân đoạn


Sơ đồ định vị

Sơ đồ ánh xạ địa phương 1

DBMS của vị trí 1

CSDL địa phương tại vị trí 1

Sơ đồ ánh xạ địa phương 2

DBMS của vị trí 2

CSDL địa phương tại vị trí 2

Kiến trúc cơ bản của CSDL phân tán

Các vị trí khác…


Kiến trúc CSDLPT(tiếp)
Sơ đồ tổng thể: Định nghĩa tất cả các dữ liệu sẽ được lưu trữ trong CSDL phân
tán.

Sơ đồ phân đoạn: Mỗi quan hệ tổng thể có thể chia thành một vài phần không
giao nhau được gọi là đoạn (fragments).

Sơ đồ định vị: Sơ đồ định vị định nghĩa đoạn nào định vị tại các vị trí nào.
Sơ đồ ánh xạ địa phương: ánh xạ các ảnh vật lý và các đối tượng được lưu trữ
tại một trạm.



Hệ quản trị CSDLPT
Hệ quản trị CSDLPT gồm các chức năng:

Các chương trình quản trị các dữ liệu phân tán
Các chương trình để quản trị việc truyền thông dữ liệu
Các chương trình để quản trị các CSDL địa phương.
Các chương trình quản trị từ điển dữ liệu.
 Từ điển dữ liệu chứa các thông tin: lược đồ dữ liệu, bố trí dữ liệu, ràng buộc dữ liệu.


Thiết kế cơ sở dữ liệu phân tán


Nội dung
Yêu cầu thiết kế các hệ thống phân tán
Các chiến lược phân tán dữ liệu
Phương pháp thiết kế CSDL phân tán
Phân mảnh dữ liệu
Cấp phát tài nguyên trong hệ phân tán


Yêu cầu thiết kế các hệ thống phân tán
Phải qua bước phân tích trước khi thiết kế.
Các bước này phải độc lập với mọi giải pháp cài đặt
Chọn những vị trí để cài đặt dữ liệu và các chương trình trên mạng máy tính.


Các công việc thiết kế
Xác định kiến trúc mô hình phân tán tổng thể

Định vị các địa phương cần phân tán, loại hình phân tán sử dụng cho mỗi địa
phương (toàn bộ, bản sao, lai,...).

Tiến hành cân đối các yếu tố được phân tán bao gồm các phần tử dữ liệu và các
hoạt động xử lý trên mỗi trạm.

Thiết kế cơ sở dữ liệu phân tán.
Thiết kế các chương trình ứng dụng.


Sản phẩm thiết kế
Mô tả các trạm
 Thông tin địa lý
 Thiết bị vật lý
 Thông tin hạ tầng
 Đặc trưng về con người (trình độ, kỹ năng,,...)

Mô tả về sử dụng dữ liệu cho mỗi trạm
 Các phần tử dữ liệu sử dụng từ hệ thống
 Các phần tử dữ liệu cần phải tạo ra
 Các phần tử dữ liệu cập nhật
 Các phần tử dữ liệu xóa


Các sản phẩm (tiếp)

Mô tả quá trình nghiệp vụ cho mỗi trạm
 Danh sách các xử lý (sơ đồ chức năng) ở các trạm
 Mô tả các xử lý


Các thỏa thuận về phương án kiến trúc hệ thống cho
mỗi trạm:

 Có cần hay không về các trợ giúp không phải kỹ thuật
 Có cần hay không về hệ thống địa phương, về nối mạng
 Có cần hay không về các cấu hình phân tán khác


Các chiến lược phân tán dữ liệu
Có 4 chiến lược phân tán dữ liệu cơ bản:
 Tập trung dữ liệu
 Chia nhỏ dữ liệu
 Sao lặp dữ liệu
 Phương thức lai


Các chiến lược … (tiếp)
Tập trung dữ liệu:
 Tất cả các dữ liệu được tập trung một chỗ
 Dữ liệu không sẵn sàng cho người sử dụng truy nhập từ xa
 Chi phí truyền thông lớn, thường làm cực đại việc truy nhập

dữ liệu tới nơi tập

trung.

 Toàn bộ hệ thống ngừng khi cơ sở dữ liệu bị sự cố

Chia nhỏ dữ liệu:
 Cơ sở dữ liệu được chia thành các phần nhỏ liên kết nhau (không trùng lặp).

 Mỗi phần dữ liệu được đưa đến các trạm một cách thích hợp để sử dụng.


Các chiến lược …(tiếp)
Sao lặp dữ liệu:
 CSDL được nhân thành nhiều bản từng phần hoặc đầy đủ và được đặt ở nhiều trạm
trên mạng.

 Nếu bản sao của

CSDL được lưu giữ tại mọi trạm của hệ thống ta có trường hợp

sao lặp đầy đủ.

 Hiện nay có nhiều kỹ thuật mới cho phép tạo bản sao không đầy đủ phù hợp với
yêu cầu dữ liệu ở mỗi trạm và một bản đầy đủ được quản lý ở server.

 Sau một khoảng thời gian nhất định các bản sao được làm đồng bộ với bản chính
bằng một ứng dụng nào đó.


Các chiến lược …(tiếp)
 Phương thức lai:
 Cơ sở dữ liệu được phân thành nhiều phần: quan trọng và không quan trọng.

 Phần ít quan trọng được lưu giữ một nơi
 Phần quan trọng được lưu trữ ở nhiều nơi khác.


Phương pháp thiết kế CSDLPT

Sơ đồ thiết kế tổng thể cơ sở dữ liệu phân tán
Thiết kế lược đồ quan hệ tổng thể

Thiết kế phân đoạn

Thiết kế định vị các đoạn
(Tạo các ảnh vật lý)

Thiết kế CSDL vật lý

Sơ đồ thiết kế tổng thể


Phương pháp thiết kế … (tiếp)
Thiết kế lược đồ quan hệ tổng thể:
 Thiết kế các quan hệ tổng thể
 Mô tả toàn bộ dữ liệu sẽ được dùng trong hệ thống

Thiết kế phân đoạn: thực hiện chia nhỏ dữ liệu thành các phần.
Thiết kế định vị các đoạn:
 Là quá trình thực hiện ánh xạ các đoạn vào các trạm khác nhau
 Tạo các ảnh vật lý tại các trạm.
 Các đoạn dữ liệu được đưa vào các vị trí lưu trữ thích hợp với yêu cầu hoạt động
thực tế của hệ thống.

Thiết kế cơ sở dữ liệu vật lý: thiết kế dữ liệu vật lý cho các quan hệ tại các
trạm


Phương pháp thiết kế CSDLPT

 Có 2 phương pháp thiết kế CSDL phân tán
 Phương pháp tiếp cận từ trên xuống
 Phương pháp tiếp cận từ dưới lên.


Thiết kế từ trên xuống
Thiết kế từ tổng thể đến riêng biệt
Phân rã một hệ thống lớn thành các hệ thống con
Phân tích các yêu cầu nhằm định nghĩa môi trường hệ thống
Thu thập các yêu cầu về dữ liệu và nhu cầu xử lý của các trạm có sử dụng CSDL.



×