Chương 2. Cơ sở dữ liệu phân tán
Nội dung
Tại sao cần CSDLPT
Khái niệm CSDLPT
Phân loại CSDLPT
Đặc điểm của CSDLPT
Mục tiêu các Hệ quản trị CSDLPT
Kiến trúc các hệ CSDLPT
Định nghĩa dữ liệu
Đánh giá truy vấn
Quản lý giao tác phân tán
Tại sao cần CSDLPT
Nhu cầu dùng chung một dữ liệu hợp nhất
Các tổ chức có nhiều trụ sở phân tán ở nhiều vị trí địa lý khác nhau
Làm thế nào để có thể quản lý các luồng dữ liệu và sử dụng chung dữ liệu,
chương trình của tổ chức?
Một hệ thống phân tán bao gồm hai phần: mạng máy tính và CSDL được phân
tán.
Khái niệm
CSDL phân tán là một tập hợp nhiều CSDL có liên quan logic và được phân bố
trên một mạng máy tính
Trạm 1
Trạm 5
Trạm 2
Mạng truyền dữ liệu
Trạm 4
Trạm 3
Môi trường hệ CSDL phân tán
Phân loại CSDLPT
CSDLPT thuần nhất
Các CSDL tại các máy trạm được quản lý cùng hệ QTCSDL.
Thường là kết quả của thiết kế từ trên xuống từ một CSDL tập trung.
Dùng cho các CSDL thiết kế từ đầu.
CSDLPT không thuần nhất
CSDLPT được tích hợp từ các CSDL tại các máy trạm khác nhau hệ QTCSDL.
Thích hợp cho thiết kế từ dưới lên.
Tích hợp các CSDL đã có.
Đặc điểm của CSDLPT
Chia sẻ tài nguyên:
Các tài nguyên (dữ liệu) được phân bố trên mạng.
Có chương trình quản lý truy cập nhất quán và tin cậy
Tính mở
Dễ dàng mở rộng phần cứng và phần mềm
Các hệ thống phần cứng và phần mềm có nhiều loại khác nhau nhưng chung
chuẩn
Khả năng song song
Có thể thực hiện đồng thời nhiều thao tác trên CSDL
Khả năng thứ lỗi
Có khả năng thay thế đảm bảo hoạt động liên tục.
Đặc điểm của CSDLPT (tiếp)
Tính trong suốt
Trong suốt vị trí
Trong suốt trong việc sử dụng
Trong suốt trong sự phân chia
Trong suốt trong sự trùng lặp
Tính tin cậy và nhất quán
Dữ liệu được lặp lại nhưng luôn nhất quán
Kiến trúc CSDLPT
Sơ đồ tổng thể
Sơ đồ phân đoạn
Sơ đồ định vị
Sơ đồ ánh xạ địa phương 1
DBMS của vị trí 1
CSDL địa phương tại vị trí 1
Sơ đồ ánh xạ địa phương 2
DBMS của vị trí 2
CSDL địa phương tại vị trí 2
Kiến trúc cơ bản của CSDL phân tán
Các vị trí khác…
Kiến trúc CSDLPT(tiếp)
Sơ đồ tổng thể: Định nghĩa tất cả các dữ liệu sẽ được lưu trữ trong CSDL phân
tán.
Sơ đồ phân đoạn: Mỗi quan hệ tổng thể có thể chia thành một vài phần không
giao nhau được gọi là đoạn (fragments).
Sơ đồ định vị: Sơ đồ định vị định nghĩa đoạn nào định vị tại các vị trí nào.
Sơ đồ ánh xạ địa phương: ánh xạ các ảnh vật lý và các đối tượng được lưu trữ
tại một trạm.
Hệ quản trị CSDLPT
Hệ quản trị CSDLPT gồm các chức năng:
Các chương trình quản trị các dữ liệu phân tán
Các chương trình để quản trị việc truyền thông dữ liệu
Các chương trình để quản trị các CSDL địa phương.
Các chương trình quản trị từ điển dữ liệu.
Từ điển dữ liệu chứa các thông tin: lược đồ dữ liệu, bố trí dữ liệu, ràng buộc dữ liệu.
Thiết kế cơ sở dữ liệu phân tán
Nội dung
Yêu cầu thiết kế các hệ thống phân tán
Các chiến lược phân tán dữ liệu
Phương pháp thiết kế CSDL phân tán
Phân mảnh dữ liệu
Cấp phát tài nguyên trong hệ phân tán
Yêu cầu thiết kế các hệ thống phân tán
Phải qua bước phân tích trước khi thiết kế.
Các bước này phải độc lập với mọi giải pháp cài đặt
Chọn những vị trí để cài đặt dữ liệu và các chương trình trên mạng máy tính.
Các công việc thiết kế
Xác định kiến trúc mô hình phân tán tổng thể
Định vị các địa phương cần phân tán, loại hình phân tán sử dụng cho mỗi địa
phương (toàn bộ, bản sao, lai,...).
Tiến hành cân đối các yếu tố được phân tán bao gồm các phần tử dữ liệu và các
hoạt động xử lý trên mỗi trạm.
Thiết kế cơ sở dữ liệu phân tán.
Thiết kế các chương trình ứng dụng.
Sản phẩm thiết kế
Mô tả các trạm
Thông tin địa lý
Thiết bị vật lý
Thông tin hạ tầng
Đặc trưng về con người (trình độ, kỹ năng,,...)
Mô tả về sử dụng dữ liệu cho mỗi trạm
Các phần tử dữ liệu sử dụng từ hệ thống
Các phần tử dữ liệu cần phải tạo ra
Các phần tử dữ liệu cập nhật
Các phần tử dữ liệu xóa
Các sản phẩm (tiếp)
Mô tả quá trình nghiệp vụ cho mỗi trạm
Danh sách các xử lý (sơ đồ chức năng) ở các trạm
Mô tả các xử lý
Các thỏa thuận về phương án kiến trúc hệ thống cho
mỗi trạm:
Có cần hay không về các trợ giúp không phải kỹ thuật
Có cần hay không về hệ thống địa phương, về nối mạng
Có cần hay không về các cấu hình phân tán khác
Các chiến lược phân tán dữ liệu
Có 4 chiến lược phân tán dữ liệu cơ bản:
Tập trung dữ liệu
Chia nhỏ dữ liệu
Sao lặp dữ liệu
Phương thức lai
Các chiến lược … (tiếp)
Tập trung dữ liệu:
Tất cả các dữ liệu được tập trung một chỗ
Dữ liệu không sẵn sàng cho người sử dụng truy nhập từ xa
Chi phí truyền thông lớn, thường làm cực đại việc truy nhập
dữ liệu tới nơi tập
trung.
Toàn bộ hệ thống ngừng khi cơ sở dữ liệu bị sự cố
Chia nhỏ dữ liệu:
Cơ sở dữ liệu được chia thành các phần nhỏ liên kết nhau (không trùng lặp).
Mỗi phần dữ liệu được đưa đến các trạm một cách thích hợp để sử dụng.
Các chiến lược …(tiếp)
Sao lặp dữ liệu:
CSDL được nhân thành nhiều bản từng phần hoặc đầy đủ và được đặt ở nhiều trạm
trên mạng.
Nếu bản sao của
CSDL được lưu giữ tại mọi trạm của hệ thống ta có trường hợp
sao lặp đầy đủ.
Hiện nay có nhiều kỹ thuật mới cho phép tạo bản sao không đầy đủ phù hợp với
yêu cầu dữ liệu ở mỗi trạm và một bản đầy đủ được quản lý ở server.
Sau một khoảng thời gian nhất định các bản sao được làm đồng bộ với bản chính
bằng một ứng dụng nào đó.
Các chiến lược …(tiếp)
Phương thức lai:
Cơ sở dữ liệu được phân thành nhiều phần: quan trọng và không quan trọng.
Phần ít quan trọng được lưu giữ một nơi
Phần quan trọng được lưu trữ ở nhiều nơi khác.
Phương pháp thiết kế CSDLPT
Sơ đồ thiết kế tổng thể cơ sở dữ liệu phân tán
Thiết kế lược đồ quan hệ tổng thể
Thiết kế phân đoạn
Thiết kế định vị các đoạn
(Tạo các ảnh vật lý)
Thiết kế CSDL vật lý
Sơ đồ thiết kế tổng thể
Phương pháp thiết kế … (tiếp)
Thiết kế lược đồ quan hệ tổng thể:
Thiết kế các quan hệ tổng thể
Mô tả toàn bộ dữ liệu sẽ được dùng trong hệ thống
Thiết kế phân đoạn: thực hiện chia nhỏ dữ liệu thành các phần.
Thiết kế định vị các đoạn:
Là quá trình thực hiện ánh xạ các đoạn vào các trạm khác nhau
Tạo các ảnh vật lý tại các trạm.
Các đoạn dữ liệu được đưa vào các vị trí lưu trữ thích hợp với yêu cầu hoạt động
thực tế của hệ thống.
Thiết kế cơ sở dữ liệu vật lý: thiết kế dữ liệu vật lý cho các quan hệ tại các
trạm
Phương pháp thiết kế CSDLPT
Có 2 phương pháp thiết kế CSDL phân tán
Phương pháp tiếp cận từ trên xuống
Phương pháp tiếp cận từ dưới lên.
Thiết kế từ trên xuống
Thiết kế từ tổng thể đến riêng biệt
Phân rã một hệ thống lớn thành các hệ thống con
Phân tích các yêu cầu nhằm định nghĩa môi trường hệ thống
Thu thập các yêu cầu về dữ liệu và nhu cầu xử lý của các trạm có sử dụng CSDL.