Tải bản đầy đủ (.pdf) (78 trang)

Một số kỹ thuật xử lý trong cơ sở dữ liệu phân tán và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.21 MB, 78 trang )

i

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN
THÔNG

[

OUTSA PHOMPHIPHAK

MỘT SỐ KỸ THUẬT XỬ LÝ TRONG
CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái nguyên – 2015

Số hóa bởi Trung tâm Học liệu – ĐHTN




ii

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN
THÔNG

[

OUTSA PHOMPHIPHAK


[

MỘT SỐ KỸ THUẬT XỬ LÝ TRONG
CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60 48 01 01
Ngƣời hƣớng dẫn khoa học: PGS.TS PHẠM VIỆT BÌNH
Thái nguyên – 2015

Số hóa bởi Trung tâm Học liệu – ĐHTN




iii

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN
THÔNG

[

MỘT SỐ KỸ THUẬT XỬ LÝ TRONG
CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG

Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60 48 01 01


LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Ngƣời hƣớng dẫn khoa học

PGS.TS PHẠM VIỆT BÌNH

Học viên thực hiện

Outsa PHOMPHIPHAK

Thái nguyên – 2015
Số hóa bởi Trung tâm Học liệu – ĐHTN




iv

MỤC LỤC
DANH MỤC CÁC HÌNH ẢNH TRONG LUẬN VĂN........................................... vi
DANH SÁCH CÁC BẢNG TRONG LUẬN VĂN ................................................ vii
BẢNG DANH MỤC CÁC CHỮ VIẾT TẮT ......................................................... viii
MỞ ĐẦU .....................................................................................................................1
CHƢƠNG 1: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆUVÀ CƠ SỞ DỮ LIỆU PHÂN
TÁN .............................................................................................................................4
1.1. Khái niệm cơ sở dữ liệu ...................................................................................4
1.2. Nguyên tắc của hệ thống xử lý phân tán ..........................................................5
1.2.1. Khái niệm xử lý phân tán ..........................................................................5
1.2.2. Hệ thống phân tán .....................................................................................5
1.3. Cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung ...........................................6

1.4. Kiến trúc Mô hình cơ sở dữ liệu phân tán ........................................................8
1.4.1. Điểm mạnh của cơ sở dữ liệu phân tán .....................................................9
1.4.2. Hệ quản trị cơ sở dữ liệu phân tán ..........................................................10
1.4.3. Các mức của cơ sở dữ liệu phân tán .......................................................13
1.5. Yêu cầu về quản trị cơ sở dữ liệu phân tán ....................................................17
1.5.1. Quản lý bảng danh mục trong cơ sở dữ liệu phân tán ............................18
1.5.2. Nội dung của bảng danh mục ..................................................................18
1.5.3. Phân tán bảng danh mục .........................................................................19
1.5.4. Quản trị và bảo vệ ...................................................................................21
1.5.5. Áp đặt luật phân quyền ...........................................................................22
1.5.6. Phân lớp ngƣời sử dụng: .........................................................................23
CHƢƠNG 2: MỘT SỐ KỸ THUẬT XỬ LÝ TRONGCƠ SỞ DỮ LIỆU PHÂN
TÁN ...........................................................................................................................25
2.1. Kỹ thuật phân mảnh ngang ............................................................................25
2.1.1. Thuật toán phân mảnh ngang nguyên thủy .............................................27
2.1.2. Thuật toán xác định tập vị từ đầy đủ và cực tiểu ....................................29
Số hóa bởi Trung tâm Học liệu – ĐHTN




v

2.1.3 Phân mảnh ngang dẫn xuất ......................................................................31
2.2. Kỹ thuật phân Mảnh dọc ................................................................................33
2.2.1. Thuật toán tụ nhóm .................................................................................34
2.2.2. Thuật toán phân mảnh .............................................................................38
2.3. Kỹ thuật phân mảnh hỗn hợp: ........................................................................42
2.4. Kỹ thuật trộn ..................................................................................................43
2.4.1. Thuật toán trộn tập trung .........................................................................43

2.4.2. Thuật toán trộn phân tán .........................................................................45
2.5. Đánh giá một số kỹ thuật xử lý trong CSDL phân tán ...................................46
2.5.1. Đánh giá kỹ thuật phân mảnh dữ liệu: ....................................................46
2.5.2. Đánh giá kỹ thuật trộn .............................................................................49
CHƢƠNG 3: XÂY DỰNG HỆ THỐNG QUẢN LÝ HÓA ĐƠN ĐIỆN TỬ
NGÀNH ĐIỆN CHO CỘNG HÒA DÂN CHỦ NHÂN DÂN LÀO........................50
3.1. Phát biểu bài toán ...........................................................................................50
3.2 Các yếu tố tác động đến sự cần thiết xây dựng hệ thống ...............................51
3.3. Phân tích nghiệp vụ các yêu cầu hệ thống .....................................................52
3.3.1. Các yêu cầu phi chức năng......................................................................52
3.3.2 Phân tích các yêu cầu chức năng của hệ thống ........................................55
3.4. Thiết kế mô hình dữ liệu ................................................................................64
3.5. Xây dựng ứng dụng và đánh giá hiệu năng...................................................66
3.5.1. Lựa chọn các công nghệ ..........................................................................66
3.5.2. So sánh hiệu năng và phân tích kết quả đầu ra .......................................67
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ................................................................69
TÀI LIỆU THAM KHẢO .........................................................................................70

Số hóa bởi Trung tâm Học liệu – ĐHTN




vi

DANH MỤC CÁC HÌNH ẢNH TRONG LUẬN VĂN
Hình 1.1: Mô hình các thành phần của hệ quản trị cơ sở dữ liệu phát triển theo kiểu
thƣơng mại (Truy cập từ xa trực tiếp) .......................................................................11
Hình 1.2: Cách thức truy cập csdl của ứng dụng ......................................................12
Hình 1.3 Cách thức truy cập gián tiếp của chƣơng trình ứng dụng vào csdl ............13

Hình 1.4: Sơ đồ các mức của cơ sở dữ liệu phân tán ................................................14
Hình 2.1: Đồ thị kết nối.............................................................................................32
Hình 2.2 Định vị một điểm tách ................................................................................39
Hình 2.3: Phân đoạn hỗn hợp ....................................................................................42
Hình 2.4. Tính tái thiết đƣợc của phân mảnh hỗi hợp ..............................................43
Hình 2.5: Danh sách nhân viên công ty ....................................................................44
Hình 2.6 Kết quả trộn tập trung ................................................................................44
Hình 2.7: Danh sách nhân viên của công ty tại các chi nhánh..................................45
Hình 2.8: Gộp nhóm theo phƣơng pháp trộn phân tán .............................................46
Hình 3.1: Hóa đơn điện tử .........................................................................................50
Hình 3.2: Yêu cầu về siêu liên kết ............................................................................54
Hình 3.3: Sơ đồ thiết kế tổng thể ..............................................................................55
Hình 3.4: Cấu trúc XML của hóa đơn điện tử ..........................................................57
Hình 3.5: Biểu đồ Actor ............................................................................................58
Hình 3.6: Biểu đồ Use Case ......................................................................................59
Hình 3.7: Biểu đồ trình tự ca sử dụng download hóa đơn điện tử ............................60
Hình 3.8: Biểu đồ trình tự ca sử dụng xác thực hóa đơn ..........................................61
Hình 3.9: Biểu đồ hoạt động ca sử dụng kí số hóa đơn ............................................63
Hình 3.10: Mô hình logic phân tán ...........................................................................65
Hình 3.11: Mô hình thực thể dữ liệu .........................................................................65
Hình 3.12: Mô hình trƣờng dữ liệu bảng Hóa đơn ...................................................66
Hình 3.13: Bảng chỉ mục hóa đơn.............................................................................66
Hình 3.14: Indexer database proccess .......................................................................67
Hình 3.15: Biểu đồ so sánh hiệu năng ......................................................................68
Số hóa bởi Trung tâm Học liệu – ĐHTN




vii


DANH SÁCH CÁC BẢNG TRONG LUẬN VĂN
Bảng 3.1: Danh sách các tác nhân .............................................................................57
Bảng 3.2: Danh sách các ca sử dụng .........................................................................59
Bảng 3.3 Mô tả biểu đồ hoạt động UC kí lên hóa đơn điện tử .................................62
Bảng 3.4:Mô tả biểu đồ hoạt động UC Import dữ liệu .............................................64
Bảng 3.5: Hiệu năng tìm kiếm bản ghi đƣợc đánhchỉ mục primary cluster (khóa
chính) .........................................................................................................................67
Bảng 3.6: Tốc độ xuất báo cáo ..................................................................................68

Số hóa bởi Trung tâm Học liệu – ĐHTN




viii

BẢNG DANH MỤC CÁC CHỮ VIẾT TẮT

Thuật ngữ

Ý nghĩa

Chi tiết

CSDL

Cơ sở dữ liệu

DBMS


Database management system

Hệ quản trị cơ sở dữ liệu

DB

Data base

Cơ sở dữ liệu

UC

Use case

Ca sử dụng

DC

Data Communication

Phần truyền thông dữ liệu

DD

Data Dictionary

Từ điển dữ liệu

Distributed Database


Phần cơ sở dữ liệu phân tán

DDB
DN

Doanh nghiệp

HĐĐT

Hóa đơn điện tử

CNTT

Công nghệ thông tin

SSL

Secure socket layer

Giao thức mạng an toàn

PKI

Public key infrastructure

Hạ tầng khóa công khai

Số hóa bởi Trung tâm Học liệu – ĐHTN





1

MỞ ĐẦU
1. Đặt vấn đề
Ngày nay, xu thế công nghệ thông tin toàn cầu cũng nhƣ sự phát triển mạng
internet, cả thể giới đã đƣợc kết nối không khoảng cách. Nhƣ một tất yếu, chính phủ
và các doanh nghiệp cần có những hệ thống, ứng dụng và cơ sở dữ liệu khổng lồ,
chứa hàng tỉ bản ghi để phục phụ các nhu cầu đặc thù. Các bài toán mang tầm vóc
quốc gia hay các hệ thống hoạt động trong thời gian dài đều có số bản ghi lên đến
hàng triệu, hàng tỉ.
Khi hệ thống dữ liệu bùng nổ, các cơ chế lƣu trữ và quản lý dữ liệu tập trung
đã bộc lộ nhiều điểm yếu, nhƣ khả năng tìm kiếm, cập nhật dữ liệu chậm, hệ thống
hay xuất hiện lỗi tràn bộ nhớ, các lỗi về tƣơng tranh câu truy vấn khi vận hành hệ
thống. Ngoài ra, sự quản lý dữ liệu tập trung rất dễ gặp rủi ro sau các sự cố và khả
năng vận hành liên tục không hiệu quả.
Để khác phục các điểm yếu của cơ chế dữ liệu tập trung, các chuyên gia đã
đƣa ra mô hình dữ liệu phân tán. Theo đó, mỗi một đặc thù hệ thống cần cân nhắc
đến khả năng phân tán, cách thức phân tán và cƣờng độ phân tán dữ liệu. Trong
luận văn này, tôi tập trung nghiên cứu các kĩ thuật phân tán dữ liệu, tính hiệu quả
của kĩ thuật đó và khả năng áp dụng bài toán đặc thù thực tế. Bài toán cụ thể ở trong
luận văn là xây dựng hệ thống quản lý hóa đơn điện tử của CHDCND Lào, phân
tích đặc thù hệ thống để đƣa ra kĩ thuật phân tán phù hợp, đánh giá mức độ hiệu quả
của kĩ thuật phân tán áp dụng trong đó
Do đó, “Một số kĩ thuật xử lý trong cơ sở dữ liệu phân tán và ứng dụng”
đƣợc tôi chọn làm đề tài.
2. Đối tƣợng và phạm vi nghiên cứu
- Đối tƣợng nghiên cứu:

 Một số kĩ thuật xử lý trong cơ sở dữ liệu phân tán
 Ứng dụng quản lý hóa đơn đặc thù ngành điện
- Phạm vi nghiên cứu:
 Nguyên tắc của hệ thống phân tán
Số hóa bởi Trung tâm Học liệu – ĐHTN




2

 Kiến trúc mô hình cơ sở dữ liệu phân tán
 Các kĩ thuật xử lý trong cơ sở dữ liệu phân tán
 Nghiệp vụ quản lý tiền điện, nghiệp vụ của hóa đơn điện tử, nguyên tắc
bảo mật trong trao đổi hóa đơn điện tử, mô hình áp dụng và kết quả thực nghiệm
3. Hƣớng nghiên cứu của đề tài
- Xu thế của dữ liệu phân tán
- Các nguyên tắc thiết kế cơ bản, kiến trúc mô hình dữ liệu phân tán
- Các kĩ thuật áp dụng trong việc xử lý cơ sở dữ liệu phân tán
- Tổng quát hóa lớp bài toán áp dụng, kiến trúc có thể áp dụng trên cơ sở dữ
liệu phân tán
- Đƣa ra những đề xuất, thiết kế ứng dụng, phân tích ƣu nhƣợc điểm, so sánh
với hệ thống không áp dụng kiến trúc cơ sở dữ liệu phân tán
4. Bố cục của luận văn
- Mở đầu
- Chƣơng 1. Tổng quan về cơ sở dữ liệu và cơ sở dữ liệu phân tán
- Chƣơng 2. Một số kĩ thuật xử lý trong cơ sở dữ liệu phân tán
- Chƣơng 3. Xây dựng hệ thống quản lý hóa đơn điện tử ngành điện cho
CHDC ND Lào
- Kết luận

5. Phƣơng pháp nghiên cứu
- Nghiên cứu lý thuyết: Tìm hiểu lý thuyết về cơ sở dữ liệu phân tán trên các
sách, bài báo, luân văn và các diễn đàn
- Thực nghiệm: Nghiên cứu bài toán hóa đơn điện tử, áp dụng kĩ thuật xử lí
đã nghiên cứu trong lí thuyết vào bàn toán cụ thể
6. Ý nghĩa khoa học của đề tài
- Ý nghĩa khoa học
 Tổng hợp, phân tích ƣu nhƣợc điểm các kĩ thuật xử lý trong cơ sở dữ liệu
phân tán

Số hóa bởi Trung tâm Học liệu – ĐHTN




3

 Phân tích, đánh giá hiệu năng với việc không áp dụng kĩ thuật phân tán
trong các bài toán lớn
- Ý nghĩa thực tiễn
Xây dựng đƣợc ứng dụng quản lý hóa đơn điện tử nghành điện, thực nghiệm
với lƣợng dữ liệu khổng lồ. Qua đó kết luận tính khả dụng của một hình dữ liệu
phân tán đối với bài toán quốc gia này.

Số hóa bởi Trung tâm Học liệu – ĐHTN




4


CHƢƠNG 1: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆUVÀ CƠ SỞ DỮ LIỆU
PHÂN TÁN
1.1.Khái niệm cơ sở dữ liệu
Cơ sở dữ liệu (Database) là tập hợp dữ liệu đƣợc lƣu trữ một cách có tổ chức để
phục vụ cho công việc sử dụng thuận tiện nhất. Dữ liệu là số liệu, hình ảnh... cần đƣợc
lƣu trữ dƣới dạng file, record...tiện lợi cho ngƣời dùng đối với việc tham khảo, xử lý...
Mỗi cơ sở dữ liệu cần có chƣơng trình quản lý, xắp xếp, duy trì....dữ liệu gọi là
hệ quản trị cơ sở dữ liệu (DBMS - Database Management System). Hệ quản trị cơ sở
dữ liệu đƣợc coi là bộ diễn dịch ngôn ngữ bậc cao để dịch các công việc ngƣời sử dụng
thao tác trên dữ liệu mà ngƣời dùng không cần quan tâm đến thuật toán.
Về mặt kiến trúc, cơ sở dữ liệu đƣợc phân chia thành các mức khác nhau.
Một cơ sở dữ liệu cơ bản có ba phần chính là mức vật lý, mức khái niệm và mức thể
hiện. Tuy nhiên với cơ sở dữ liệu cấp cao thì có thể có nhiều mức phân hoá hơn.
Mức vật lý: là mức thấp nhất của kiến trúc hệ cơ sở dữ liệu, ở mức này dữ
liệu đƣợc tổ chức dƣới nhiều cấp khác nhau nhƣ bản ghi, file...
Mức khái niệm: là sự biểu diễn trừu tƣợng của cơ sở dữ liệu vật lý và có thể
nói mức vật lý là sự cài đặt cụ thể của cơ sở dữ liệu ở mức khái niệm.
Mức thể hiện: khi cơ sở dữ liệu đƣợc thiết kế, những gì thể hiện (giao diện,
chƣơng trình quản lý, bảng...) gần gũi với ngƣời sử dụng với cơ sở dữ liệu ở mức
khái niệm gọi là khung nhìn. Nhƣ vậy sự khác nhau giữa khung nhìn và mức khái
niệm không lớn.
Mô hình phổ biến nhất của cơ sở dữ liệu là mô hình quan hệ: trong mô hinh
quan hệ xét tập con của tích Decard của các miền D (Domain) với miền là một tập
các giá trị. Gọi D1, D2, D3,...Dn là n miền. Tích Decard của các miền D1 D2
D3 ... Dn là tập tất cả n bộ (v1,v2,v3...,vn) sao cho vi

Di với i=1,..,n. Mỗi hàng

của quan hệ là một bộ (tuples). Quan hệ là tập con của tích Decard D1


D2

D3 ... Dn gọi là quan hệ n ngôi. Khi đó mỗi bộ có n thành phần ( n cột ), mỗi cột
của quan hệ gọi là thuộc tính.

Số hóa bởi Trung tâm Học liệu – ĐHTN




5

1.2. Nguyên tắc của hệ thống xử lý phân tán
1.2.1. Khái niệm xử lý phân tán
Xử lý phân tán là phƣơng pháp thiết kế các hệ thống phân tán có các tính
chất: chịu lỗi, xuyên dụng, mở rộng đƣợc, mở. Phƣơng pháp này là kết quả tự nhiên
của việc dùng máy tính để lập nên các hệ thống phân tán.
Có hai khái niệm xử lý phân tán liên quan với nhau.
− Khái niệm liên quan đến việc tính toán trên Client/Server. Trong đó ứng
dụng đƣợc chia ra thành hai phần, phần của Server và phần của Client và đƣợc vận
hành ở hai nơi. Trong tính toán phân tán này cho phép truy nhập trực tiếp dữ liệu và
xử lý dữ liệu trên Server và Client.
− Khái niệm thứ hai là việc thực hiện các tác vụ xử lý phức tạp trên nhiều hệ
thống. Không gian nhớ và bộ xử lý của nhiều máy cùng hoạt động chia nhau tác vụ
xử lý. Máy trung tâm sẽ giám sát và quản lý các tiến trình này. Có trƣờng hợp thông
qua Internet, hàng nghìn máy cùng xử lý một tác vụ.
Có thể định nghĩa hệ xử lý phân tán nhƣ sau: Hệ xử lý phân tán là một tập
hợp các phần tử xử lý tự trị (không nhất thiêt đồng nhất) đƣợc kết nối với nhau bởi
một mạng máy tính và cùng phối hợp thực hiện những công việc gán cho chúng.

Phần tử xử lý ở đây để chỉ một thiết bị tính toán có khả năng thực hiện chƣơng trình
trên nó.
1.2.2. Hệ thống phân tán
Hệ thống phân tán là tập hợp các máy tính độc lập kết nối với nhau thành
một mạng máy tính đƣợc cài đặt các hệ cơ sở dữ liệu và các phần mềm hệ thống
phân tán tạo khả năng cho nhiều ngƣời sử dụng truy nhập chia sẻ nguồn thông
tin chung. Các máy tính trong hệ thống phân tán có kết nối phần cứng lỏng lẻo,
có nghĩa là không chia sẻ bộ nhớ, chỉ có một hệ điều hành trong toàn bộ hệ thống
phân tán.
Các mạng máy tính đƣợc xây dựng dựa trên kỹ thuật Web, ví dụ nhƣ mạng
Internet, mạng Intranet… là các mạng phân tán.

Số hóa bởi Trung tâm Học liệu – ĐHTN




6

1.3. Cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung
Cơ sở dữ liệu tập trung cùng với cơ sở dữ liệu không qua thiết kế hình thành
trƣớc khi có cơ sở dữ liệu phân tán. Hai hình thức này phát triển trên cơ sở tự phát
và hệ thống tập trung. Nhƣ vậy hai hình thức này không đáp ứng đƣợc yêu cầu tổ
chức và công việc trên phạm vi lớn.
Cơ sở dữ liệu phân tán đƣợc thiết kế khác cơ sở dữ liệu tập trung. Do đó cần
đối sánh các đặc trƣng của cơ sở dữ liêu phân tán với cơ sở dữ liệu tập trung để thấy
đƣợc lợi ích của cơ sở dữ liệu phân tán. Đặc trƣng mô tả cơ sở dữ liệu tập trung là
điều khiển tập trung, độc lập dữ liệu, giảm bớt dƣ thừa, cơ cấu vật lý phức tạp đối
với khả năng truy cập, toàn vẹn, hồi phục, điều khiển tƣơng tranh, biệt lập và an
toàn dữ liệu.

Điều khiển tập trung: Điều khiển tập trung các nguồn thông tin của công việc
hay tổ chức. Có ngƣời quản trị đảm bảo an toàn dữ liệu.
Trong cơ sở dữ liệu phân tán: không đề cập đến vấn đề điều khiển tập
trung. Ngƣời quản trị cơ sở dữ liệu chung phân quyền cho ngƣời quản trị cơ sở
dữ liệu địa phƣơng.
Độc lập dữ liệu: là một trong những nhân tố tác động đến cấu trúc cơ sở dữ
liệu để tổ chức dữ liệu chuyển cho chƣơng trình ứng dụng. Tiện lợi chính của độc
lập dữ liệu là các chƣơng trình ứng dụng không bị ảnh hƣởng khi thay đổi cấu trúc
vật lý của dữ liệu. Trong cơ sở dữ liệu phân tán, độc lập dữ liệu có tầm quan trọng
cũng nhƣ trong cơ sở dữ liệu truyền thống. Khái niệm cơ sở dữ liệu trong suốt mô
tả hoạt động chƣơng trình trên cơ sở dữ liệu phân tán đƣợc viết nhƣ làm việc trên cơ
sở dữ liệu tập trung. Hay nói cách khác tính đúng đắn của chƣơng trình không bị
ảnh hƣởng bởi việc di chuyển dữ liệu từ nơi này sang nơi khác trong mạng máy
tính. Tuy nhiên tốc độ làm việc bị ảnh hƣởng do có thời gian di chuyển dữ liệu.
Giảm dư thừa dữ liệu: Trong cơ sở dữ liệu tập trung, tính dƣ thừa hạn chế
đƣợc càng nhiều càng tốt vì:
-Dữ liệu không đồng nhất khi có vài bản sao của cùng cơ sở dữ liệu logic; để
tránh đƣợc nhƣợc điểm này giải pháp là chỉ có một bản sao duy nhất.
Số hóa bởi Trung tâm Học liệu – ĐHTN




7

-Giảm không gian lƣu trữ. Giảm dƣ thừa có nghĩa là cho phép nhiều ứng
dụng cùng truy cập đến một cơ sở dữ liệu mà không cần đến nhiều bản sao ở những
nơi chƣơng trình ứng dụng cần .
Trong cơ sở dữ liệu truyền thống tính dƣ thừa dữ liệu cũng cần quan tâm vì:
-Tính cục bộ của chƣơng trình ứng dụng sẽ tăng nếu dữ liệu đặt ở mọi nơi

mà chƣơng trình ứng dụng cần.
-Khả năng sẵn sàng của hệ thống cao bởi vì khi có lỗi ở một nơi nào đó trong
hệ thống thì không cản trở hoạt động của chƣơng trình ứng dụng.
Nói chung, nguyên nhân đối lập với tính dƣ thừa đƣa ra trong môi trƣờng
truyền thống vẫn còn đúng cho hệ thống phân tán và vì vậy công việc định giá mức độ
tốt của tính dƣ thừa đòi hỏi định giá lại công việc lựa chọn mức độ dƣ thừa dữ liệu.
Cơ sở dữ liệu phân tán khắc phục đƣợc hai nhƣợc điểm này vì dữ liệu đƣợc
chia ra thành nhiều phần nhỏ và chỉ có một bản sao logic tổng thể duy nhất để tiện
cho việc truy cập dữ liệu.
Cấu trúc vật lý và khả năng truy cập: ngƣời sử dụng truy cập đến cơ sở dữ
liệu tập trung phải thông qua cấu trúc truy cập phức tạp: định vị cơ sở dữ liệu, thiết
lập đƣờng truyền...
Trong cơ sở dữ liệu phân tán, cấu trúc truy cập phức tạp không phải là công
cụ chính để truy cập hiệu quả đến cơ sở dữ liệu. Hiệu quả có nghĩa là thời gian tìm
kiếm và chuyển dữ liệu nhỏ nhất, chi phí truyền thông thấp nhất.
Mỗi cách thức truy cập cơ sở dữ liệu phân tán viết bởi ngƣời lập trình hoặc
tạo ra bởi một bộ tối ƣu. Công việc viết ra một cách thức truy cập cơ sở dữ liệu
phân tán cũng giống nhƣ viết chƣơng trình duyệt trong cơ sở dữ liệu tập trung.
Công việc mà chƣơng trình duyệt này làm là xác định xem có thể truy cập đến đƣợc
bao nhiêu cơ sở dữ liệu.
Tính toàn vẹn, hồi phục và điều khiển tương tranh: Mặc dù trong cơ sở dữ
liệu, tính toàn vẹn, hồi phục và điều khiển đồng thời liên quan nhiều vấn đề liên
quan lẫn nhau. Mở rộng hơn vấn đề này là việc cung cấp các giao tác. Giao tác là

Số hóa bởi Trung tâm Học liệu – ĐHTN




8


đơn vị cơ bản của việc thực hiện: giao tác cụ thể là bó công việc đƣợc thực hiện
toàn bộ hoặc không đƣợc thực hiện.
Trong cơ sở dữ liệu phân tán, vấn đề điều khiển giao tác tự trị có ý nghĩa
quan trọng: hệ thống điều phối phải chuyển đổi các quỹ thời gian cho các giao tác
liên tiếp. Nhƣ vậy giao tác tự trị là phƣơng tiện đạt đƣợc sự toàn vẹn trong cơ sở dữ
liệu Có hai mối nguy hiểm của giao tác tự trị là lỗi và tƣơng tranh.
Tính biệt lập và an toàn: trong cơ sở dữ liệu truyền thống, ngƣời quản trị hệ
thống có quyền điều khiển tập trung, ngƣời sử dụng có chắc chắn đƣợc phân quyền
mới truy cập vào đƣợc dữ liệu. Điểm quan trọng là trong cách tiếp cận cơ sở dữ liệu
tập trung, không cần thủ tục điều khiển chuyên biệt.
Trong cơ sở dữ liệu phân tán, những ngƣời quản trị địa phƣơng cũng phải
giải quyết vấn đề tƣơng tự nhƣ ngƣời quản trị cơ sở dữ liệu truyền thống.
Tuy nhiên, hai vấn đề đặc biệt sau đây của cơ sở dữ liệu phân tán có ý nghĩa
quan trọng khi đề cập đến:
-Thứ nhất trong cơ sở dữ liệu phân tán với cấp độ tự trị cao ở mỗi điểm,
ngƣời có dữ liệu địa phƣơng sẽ cảm thấy an toàn hơn vì họ có thể tự bảo vệ dữ liệu
của mình thay vì phụ thuộc vào ngƣời quản trị hệ thống tập trung.
-Thứ hai, vấn đề an toàn thực chất với hệ thống phân tán không giống nhƣ
các hệ thống thông thƣờng khác mà còn liên quan đến mạng truyền thông.
Nhƣ vậy trong cơ sở dữ liệu phân tán vấn đề an toàn cơ sở dữ liệu phức tạp
hơn và đòi hỏi nhiều kỹ thuật bảo vệ. Nguyên nhân gây ra là hệ thống này có tính
mở và nhiều ngƣời dùng trong cùng hệ thống sử dụng nhiều cơ sở dữ liệu.
1.4.Kiến trúc Mô hình cơ sở dữ liệu phân tán
Vì yêu cầu của công ty, doanh nghiệp, đơn vị kinh doanh... về vấn đề tổ chức
sao cho kinh doanh có hiệu quả nhất và nắm bắt thông tin nhanh nhất, khi các cơ sở
của công ty hiện ở những địa điểm xa nhau cho nên xây dựng một hệ thống làm
việc trên cơ sở dữ liệu phân tán là phù hợp xu hƣớng hiện nay vì hệ thống này thoả
mãn đƣợc những yêu cầu tổ chức của đơn vị. Lợi điểm về tổ chức và kỹ thuật của
xu hƣớng phát triển cơ sở dữ liệu phân tán là: giải quyết đƣợc những hạn chế của cơ

Số hóa bởi Trung tâm Học liệu – ĐHTN




9

sở dữ liệu tập trung và phù hợp xu hƣớng phát triển tự nhiên với cơ cấu không tập
trung của các tổ chức, công ty doanh nghiệp...
Nói một cách đơn giản, cơ sở dữ liệu phân tán là tập hợp dữ liệu logic thuộc
về cùng một hệ thống nhƣng trải rộng ra nhiều điểm trên mạng máy tính. Nhƣ vậy
có hai vấn đề của cơ sở dữ liệu phân tán với tầm quan trọng tƣơng đƣơng nhau:
Việc phân tán: Trong thực tế dữ liệu không đặt trên cùng một vị trí vì vậy
đây là đặc điểm để phân biệt cơ sở dữ liệu phân tán với cơ sở dữ liệu tập trung và cơ
sở dữ liệu đơn lẻ.
Liên quan logic: Trong cơ sở dữ liệu phân tán, dữ liệu có một số đặc tính liên
kết chặt chẽ với nhau nhƣ tính kết nối, tính liên quan logíc.. Trong cơ sở dữ liệu tập
trung, mỗi vị trí quản lý một cơ sở dữ liệu và ngƣời sử dụng phải truy cập đến cơ sở
dữ liệu ở những vị trí khác nhau để lấy thông tin tổng hợp.
1.4.1. Điểm mạnh của cơ sở dữ liệu phân tán
Có nhiều nguyên nhân để phát triển cơ sở dữ liệu phân tán nhƣng tựu trung
lại chỉ gồm những điểm sau đây:
Lợi điểmvề tổ chức và tínhkinh tế: tổ chức phân tán nhiều chi nhánh và dùng
cơ sở dữ liệu phân tán phù hợp với các tổ chức kiểu này. Với vai trò là động lực
thúc đẩy kinh tế thƣơng mại phát triển rộng hơn, thì việc phát triển các trung tâm
máy tính phân tán ở nhiều vị trí trở thành nhu cầu cần thiết.
Tận dụng những cơ sở dữ liệu sẵn có: Hình thành cơ sở dữ liệu phân tán từ
các cơ sở dữ liệu tập trung có sẵn ở các vị trí địa phƣơng.
Thuận lợi cho nhu cầu phát triển: Xu hƣớng dùng cơ sở dữ liệu phân tán sẽ
cung cấp khả năng phát triển thuận lợi hơn và giảm đƣợc xung đột về chức năng

giữa các đơn vị đã tồn tại và giảm đƣợc xung đột giữa các chƣơng trình ứng dụng
khi truy cập đến cơ sở dữ liệu. Với hƣớng tập trung hoá, nhu cầu phát triển trong
tƣơng lai sẽ gặp khó khăn.
Giảm chi phí truyền thông: Trong cơ sở dữ liệu phân tán chƣơng trình ứng
dụng đặt ở địa phƣơng có thể giảm bớt đƣợc chi phí truyền thông khi thực hiện
bằng cách khai thác cơ sở dữ liệu tại chỗ.
Số hóa bởi Trung tâm Học liệu – ĐHTN




10

Tăng số công việc thực hiện: Hệ cơ sở dữ liệu phân tán có thể tăng số lƣợng
công việc thực hiện qua áp dụng nguyên lý xử lý song song với hệ thống xử lý đa
nhiệm. Tuy nhiên cơ sở dữ liệu phân tán cũng có tiện lợi trong việc phân tán dữ liệu
nhƣ tạo ra các chƣơng trình ứng dụng phụ thuộc vào tiêu chuẩn mở rộng vị trí làm cho
các nơi xử lý có thể hỗ trợ lẫn nhau. Do đó tránh đƣợc hiện tƣợng tắc nghẽn cổ chai
trong mạng truyền thông hoặc trong các dịch vụ thông thƣờng của toàn bộ hệ thống.
Tính dễ hiểu và sẵn sàng: Hƣớng phát triển cơ sở dữ liệu phân tán cũng
nhằm đạt đƣợc tính dễ hiểu và tính sẵn sàng cao hơn. Tuy nhiên để đạt đƣợc mục
tiêu này không phải là dễ làm và đòi hỏi sử dụng kỹ thuật phức tạp. Khả năng xử
lý tự trị của các điểm làm việc khác nhau không đảm bảo tính dễ sử dụng.
Hai nguyên nhân về mặt kỹ thuật đáp ứng cho sự phát triển hệ cơ sở dữ
liệu phân tán:
-Công nghệ tạo ra máy tính nhỏ và nền tảng phần cứng có khả năng phục vụ
xây dựng hệ thống thông tin phân tán.
-Kỹ thuật thiết kế hệ cơ sở dữ liệu phân tán đƣợc phát triển vững chắc dựa
trên hai kỹ thuật thiết kế chính là Top-down và Bottom-up từ những năm thập kỷ
60.

Kỹ thuật thiết kế cơ sở dữ liệu phân tán phức tạp nhƣng hệ cơ sở dữ liệu
phân tán cũng cần thiết cho xu hƣớng phát triển kinh tế hiện nay.
1.4.2. Hệ quản trị cơ sở dữ liệu phân tán
Hệ quản trị cơ sở dữ liệu phân tán cung cấp công cụ nhƣ tạo lập và quản lý
cơ sở dữ liệu phân tán. Phân tích đặc điểm của hệ thống quản trị cơ sở dữ liệu phân
tán nhƣ dƣới đây để phân biệt hệ thống phát triển theo kiểu thƣơng mại có sẵn và
kiểu mẫu phân tán.
Hệ thống phát triển theo kiểu thương mại có sẵn đƣợc phát triển bởi những
ngƣời cung cấp hệ cơ sở dữ liệu tập trung. Hệ cơ sở dữ liệu tập trung mở rộng bằng
cách thêm vào những phần bổ xung qua cách cung cấp thêm đƣờng truyền và điều
khiển giữa các hệ quản trị cơ sở dữ liệu tập trung cài đặt ở những điểm khác nhau

Số hóa bởi Trung tâm Học liệu – ĐHTN




11

trên mạng máy tính. Những phần mềm cần thiết cho việc xây dựng cơ sở dữ liệu
phân tán là:
Phần quản lý cơ sở dữ liệu ( Database Management - DB ).
Phần truyền thông dữ liệu (Data Communication - DC ).
Từ điển dữ liệu đƣợc mở rộng để thể hiện thông tin về phân tán dữ liệu trong
mạng máy tính (Data Dictionary - DD).
Phần cơ sở dữ liệu phân tán (Distributed Database DDB).
Mô hình các thành phần của hệ quản trị cơ sở dữ liệu phát triển theo kiểu
thƣơng mại (Truy cập từ xa trực tiếp).

Cơ sở dữ

liệu địa
phƣơng 1

DB
DDB

DC

DD

Cơ sở dữ
liệu địa
phƣơng 2

DD
DDB
DB

DC

Hình 1.1: Mô hình các thành phần của hệ quản trị cơ sở dữ liệu phát triển theo
kiểu thương mại (Truy cập từ xa trực tiếp)
Những dịch vụ hệ quản trị cơ sở dữ liệu cung cấp:
-Cách thức truy cập dữ liệu từ xa: bằng chƣơng trình ứng dụng.
-Lựa chọn một cấp độ trong suốt phân tán thích hợp: cho phép mở rộng hệ
thống theo nhiều cách khác nhau theo từng hoàn cảnh (phải cân nhắc giữa cấp độ
trong suốt phân tán và phân chia công việc thực hiện để công việc quản trị hệ thống
đơn giản hơn).
-Quản trị và điều khiển cơ sở dữ liệu bao gồm công cụ quản lý cơ sở dữ liệu,
tập hợp thông tin về các thao tác trên cơ sở dữ liệu và cung cấp thông tin tổng thể về

file dữ liệu đặt ở các nơi trong hệ thống.
-Điều khiển tƣơng tranh và điều khiển hồi phục dữ liệu của giao tác phân tán.
Số hóa bởi Trung tâm Học liệu – ĐHTN




12

Phƣơng
Truy thức
cập truy
cơ sởcập
dữ liệu
dữ liệu
Chƣơng trình ứng
Hệ quản trị cơ
dụng
sở dữ liệu 1

Hệ quản trị cơ
sở dữ liệu 2

Cơ sở dữ
liệu

Hình 1.2: Cách thức truy cập csdl của ứng dụng
Cách thức truy cập cơ sở dữ liệu từ xa qua chƣơng trình ứng dụng theo hai
cách cơ bản: Truy cập từ xa trực tiếp và gián tiếp.
Ở mô hình trực tiếp, chƣơng trình ứng dụng đƣa ra yêu cầu truy cập đến cơ

sở dữ liệu từ xa, yêu cầu này đƣợc hệ quản trị cơ sở dữ liệu tự động tìm nơi đặt dữ
liệu và thực hiện yêu cầu tại điểm đó. Kết quả đƣợc trả lại cho chƣơng trình ứng
dụng. Đơn vị chuyển đổi giữa hai hệ quả trị cơ sở dữ liệu là phƣơng thức truy cập
cơ sở dữ liệu và kết quả nhận đƣợc (thông qua việc thực hiện phƣơng thức truy cập
này). Với cách thức truy cập từ xa nhƣ vậy cấp độ trong suốt phân tán đƣợc xây
dựng bằng cách tạo ra tên file toàn bộ để đánh địa chỉ thích hợp cho những điểm lƣu
trữ dữ liệu ở xa.
Mô hình dƣới đây mô tả cách thức truy cập phức tạp hơn (truy cập gián tiếp):

Số hóa bởi Trung tâm Học liệu – ĐHTN




13

Chƣơng trình
ứng dụng

Hệ quản trị
cơ sở dữ liệu
1
Kết quả toàn
bộ

Chƣơng trình phụ

Hệ quản trị
cơ sở dữ liệu
2


Cơ sở dữ liệu

Hình 1.3 Cách thức truy cập gián tiếp của chương trình ứng dụng vào csdl
Theo mô hình truy cập này, chƣơng trình ứng dụng thực hiện yêu cầu qua
chƣơng trình phụ ở điểm khác. Chƣơng trình phụ này đƣợc ngƣời lập trình ứng
dụng viết để truy cập từ xa đến cơ sở dữ liệu và trả về kết quả của chƣơng trình ứng
dụng yêu cầu.
Hệ quản trị cơ sở dữ liệu phân tán cung cấp cả hai kiểu truy cập bỏi vì mỗi
cách truy cập đều có ƣu điểm của nó.
1.4.3.Các mức của cơ sở dữ liệu phân tán
Trong hệ cơ sở dữ liệu phân tán, những ngƣời thiết kế hệ thống đã xây dựng
lên một hệ các phần mềm phục vụ yêu cầu ngƣời dùng trên cơ sở dữ liệu đã có sẵn.
Hình dƣới đây trình bày kiến trúc chung của cơ sở dữ liệu phân tán. Tất nhiên kiến
trúc này không biểu diễn tƣờng minh cho mọi hệ cơ sở dữ liệu phân tán. Các mức
của cơ sở dữ liệu phân tán đƣợc trình bày mang tính khái niệm thích hợp để dễ hiểu
về tổ chức của các cơ sở dữ liệu phân tán nói chung.

Số hóa bởi Trung tâm Học liệu – ĐHTN




14

Sơ đồ toàn thể

Sơ đồ phân đoạn
Sơ đồ cấp phát


DBMS ở vị trí 1

Sơ đồ ánh xạ

Sơ đồ ánh xạ

địa phƣơng 1

địa phƣơng 2

DBMS ở vị trí 2

Cơ sở dữ

Cơ sở dữ

liệu 1

liệu 2

Hình 1.4: Sơ đồ các mức của cơ sở dữ liệu phân tán
Mức đỉnh của lƣợc đồ là sơ đồ toàn thể: Mô tả mọi dữ liệu nằm trong cơ sở
dữ liệu phân tán nhƣ không bị phân tán. Tuy nhiên mô hình dữ liệu sử dụng để xác
định sơ đồ toàn thể để xác định cách thức ánh xạ đến những mức khác của cơ sở dữ
liệu phân tán. Theo cách sử dụng mô hình sơ đồ toàn thể, sơ đồ toàn thể xác định
một tập các quan hệ chung nhất của hệ thống.
Mỗi quan hệ có thể chia ra các phần không chồng lên nhau gọi là đoạn. Có
nhiều cách chia: chia theo chiều ngang, chia theo chiều dọc và chia theo kiểu hỗn
hợp theo chiều ngang và chiều dọc. Ánh xạ này giữa quan hệ và các đoạn đƣợc xác
định trong sơ đồ phân đoạn. Ánh xạ theo kiểu 1:n (một quan hệ sang nhiều đoạn) là

một đoạn tƣơng ứng một quan hệ và một quan hệ tƣơng đƣơng với một số đoạn.
Đoạn xác định bởi một quan hệ qua chỉ số (chỉ số đoạn dữ liệu).
Đoạn là phần logic của quan hệ, đƣợc đặt vật lý tại một hay vài vị trí trên
mạng máy tính. Sơ đồ cấp phát xác định những vị trí đặt đoạn. Kiểu ánh xạ xác định
trong sơ đồ cấp phát cho phép nhận ra một cơ sở dữ liệu phân tán là dƣ thừa hay
không dƣ thừa

Số hóa bởi Trung tâm Học liệu – ĐHTN




15

Về mặt hình thức ánh xạ thƣờng từ một quan hệ sang nhiều đoạn, trong
trƣờng hợp ánh xạ 1:1 thì một đoạn đƣợc ánh xạ từ một quan hệ. Mọi đoạn dữ liệu
tƣơng ứng với cùng một quan hệ R và đặt ở cùng vị trí j tạo ra “ảnh vật lý” của quan
hệ R ở vị trí j. Vì vậy có ánh xạ 1:1 giữa ảnh vật lý và một cặp (quan hệ, đoạn). Mỗi
ảnh vật lý có thể đƣợc chỉ định bởi một tên quan hệ và một chỉ số vị trí. Để phân
biệt ảnh vật lý, quan hệ với đoạn dữ liệu, ký hiệu Rj chỉ ảnh vật lý của quan hệ R ở
vị trí j.
Thuật ngữ trong suốt mô tả bằng bản sao của đoạn tham chiếu đến vị trí lƣu
trữ và bản sao xác định qua tên quan hệ và hai chỉ số (chỉ số đoạn và chỉ số vị trí).
Trong kiến trúc lƣợc đồ trên có ba mức độ độc lập theo thứ tự giảm: mức
tổng thể, mức cấp phát và mức ánh xạ. Vì vậy, ở mức thấp hơn cần thiết phải ánh xạ
sang mức cao hơn. Việc ánh xạ này gọi là sơ đồ ánh xạ và phụ thuộc vào kiểu của
cơ sở dữ liệu địa phƣơng. Trong hệ thống đồng nhất mức độ độc lập có một số kiểu
khác nhau khi ánh xạ địa phƣơng ở các vị trí khác nhau.
Kiến trúc này cung cấp khái niệm cơ sở và dễ hiểu về cơ sở dữ liệu phân tán.
Ba đối tƣợng quan trọng thúc đẩy phát triển cấu trúc này là tính riêng rẽ của việc

phân đoạn dữ liệu, cấp phát đoạn, điều khiển dƣ thừa và độc lập dữ liệu đối với hệ
quản trị cơ sở dữ liệu địa phƣơng.
1.4.3.1.Phân đoạn dữ liệu và cấp phát dữ liệu.
Sự chia xẻ này cho phép phân biệt hai mức khác nhau của mức độ trong suốt
phân tán, có tên là trong suốt phân đoạn và trong suốt định vị.
Trong suốt phân đoạn: là cấp độ cao nhất của mức độ trong suốt, ngƣời sử
dụng hoặc chƣơng trình ứng dụng chỉ làm việc trên các quan hệ của cơ sở dữ liệu.
Trong suốt định vị là cấp độ thấp hơn của độ trong suốt vì hệ thống yêu cầu ngƣời
sử dụng hay chuơng trình ứng dụng phải làm việc trên đoạn logíc thay vì làm việc
trên các quan hệ của cơ sở dữ liệu. Tuy nhiên ngƣời đó không biết đoạn đó đƣợc đặt
ở vị trí nào trong cơ sở dữ liệu.

Số hóa bởi Trung tâm Học liệu – ĐHTN




16

1.4.3.2.Điều khiển dư thừa.
Kiến trúc tham chiếu cho phép điều khiển dƣ thừa dữ liệu ở mức đoạn. Các
đoạn có thể có dữ liệu giống nhau dùng để kết nối dữ liệu đó là nguyên nhân dƣ
thừa dữ liệu.
1.4.3.3.Độc lập với hệ quản trị cở sở dữ liệu địa phương.
Đặc điểm này gọi là ánh xạ trong suốt đối với cơ sở dữ liệu địa phƣơng:
quản trị cơ sở dữ liệu phân tán không cần quan tâm đến kiểu dữ liệu xác định của cơ
sở dữ liệu địa phƣơng.
Mức trong suốt bản sao liên quan chặt chẽ tới mức trong suốt định vị. Mức
trong suốt bản sao có nghĩa là ngƣời sử dụng không biết bản sao của đoạn đặt ở vị
trí nào. Mức trong suốt bản sao tƣơng đƣơng mức trong suốt định vị. Tuy nhiên,

trong những trƣờng hợp thực tế ngƣời sử dụng không có mức trong suốt định vị
nhƣng lại có mức trong suốt bản sao.
Phân rã quan hệ thành các đoạn thực hiện qua việc áp dụng hai phân đoạn:
phân đoạn ngang và phân đoạn dọc.
Phân đoạn ngang: một đoạn đƣợc xác định qua biểu thức đại số quan hệ với
quan hệ là toán tử và các đoạn là kết quả. Hay nói cách khác, việc phân đoạn ngang
bao gồm việc chia các bộ của quan hệ thành các tập con. Mỗi tập con này có thuộc
tính vị trí thông thƣờng. Các đoạn này đƣợc xác định qua việc coi mỗi đoạn là toán
tử chọn trên quan hệ.
Phân đoạn dọc: phân đoạn dọc một quan hệ là việc chia nhỏ tập thuộc tính
thành nhiều nhóm quan hệ và đoạn dọc. Phân đoạn đúng khi mỗi thuộc tính đều ánh
xạ ít nhất sang một thuộc tính của đoạn. Hơn nữa, có thể tạo lại quan hệ ban đầu
bằng liên kết các đoạn với nhau.
Có một số luật để xác định các đoạn:
Điều kiện hợp: mọi dữ liệu của quan hệ phải ánh xạ đến các đoạn. Không
xảy ra trƣờng hợp dữ liệu thuộc về quan hệ nhƣng không thuộc về một đoạn nào.

Số hóa bởi Trung tâm Học liệu – ĐHTN




17

Điều kiện tái tạo lại quan hệ: luôn luôn có khả năng tạo lại quan hệ từ các
đoạn của quan hệ. Điều kiện cần: mỗi đoạn đƣợc lƣu trữ trong cơ sở dữ liệu phân
tán và quan hệ phải xây dựng lại đƣợc khi cần thiết.
Điều kiện không liên kết: thích hợp khi các đoạn không liên kết với nhau vì
vậy các bản dữ liệu lặp lại có thể đƣợc điều khiển rõ ràng ở các mức cấp phát. Điều
kiện này chủ yếu có ích với phân đoạn ngang.

1.5. Yêu cầu về quản trị cơ sở dữ liệu phân tán
Quản trị hệ cơ sở dữ liệu phân tán để giải quyết vấn đề phát triển, điều khiển,
duy trì và kiểm tra phần mềm của chƣơng trình ứng dụng dùng cơ sở dữ liệu. Quản
trị cơ sở dữ liệu không chỉ là công việc kỹ thuật mà bao gồm cả thông báo về cách
tạo phƣơng thức để ngƣời sử dụng truy cập đƣợc đến cơ sở dữ liệu. Trong phần này
quan tâm đến những nội dung sau đây:
- Nội dung và cách quản lý bảng danh mục.
Bảng danh mục chứa các thông tin hệ thống cho chƣơng trình ứng dụng khi
có yêu cầu truy cập đến cơ sở dữ liệu. Trong hệ thống phân tán, bảng danh mục
chứa các mô tả về việc phân đoạn, cấp phát dữ liệu và ánh xạ tới tên cơ sở dữ liệu
địa phƣơng. Nhƣ vậy những bảng danh mục trở thành cơ sở dữ liệu phân tán để
phân tán tại các vị trí và quản lý một cách hiệu quả.
- Mở rộng cơ chế bảo vệ và phân quyền đối với hệ thống phân tán.
Vấn đề quan trọng nhất trong quản trị cơ sở dữ liệu là cấp độ tự trị của các vị
trí tự trị địa phƣơng. Có hai cách giải quyết cực đoan là không có tính tự trị địa
phƣơng và tự trị địa phƣơng hoàn toàn.
Trường hợp thứ nhất, chức năng của ngƣời quản trị địa phƣơng không khác
so với ngƣời quản trị ở các cơ sở dữ liệu tập trung. Tuy nhiên để thực hiện các chức
năng của ngƣời quản trị khó hơn khi phân tán hệ thống. Một hệ thống không có tính
tự trị địa phƣơng có thể khác nhiều về phía cấp độ phân tán của bài toán thiết lập
các chức năng quản trị.
Trường hợp thứ hai, chức năng của ngƣời quản trị cơ sở dữ liệu hoàn toàn bị
giới hạn vì mỗi vị trí đều quản trị độc lập hay tự trị. Việc chia xẻ dữ liệu giữa hai vị
Số hóa bởi Trung tâm Học liệu – ĐHTN




×