Tải bản đầy đủ (.pdf) (64 trang)

Cấp phát trong cơ sở dữ liệu phân tán

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (790.22 KB, 64 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2

NGUYỄN THỊ VÂN HÀ

CẤP PHÁT TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN

LUẬN VĂN THẠC SĨ: KHOA HỌC MÁY TÍNH

HÀ NỘI, 2017


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2

NGUYỄN THỊ VÂN HÀ

CẤP PHÁT TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN

Chuyên ngành: Khoa Học Máy Tính
Mã số: 60 48 01 01

LUẬN VĂN THẠC SĨ: KHOA HỌC MÁY TÍNH
Ngƣời hƣớng dẫn khoa học: PGS. TS. Lê Huy Thập

HÀ NỘI, 201


LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn sâu sắc nhất tới thầy giáo, PGS.TS Lê Huy Thập
- ngƣời đã hƣớng dẫn tận tình để tôi hoàn thành luận văn này.


Tôi cũng xin bày tỏ lòng biết ơn tới Ban giám hiệu trƣờng Đại học Sƣ
phạm Hà Nội 2, phòng Sau đại học, quý thầy cô đã trực tiếp giảng dạy tôi
trong suốt khóa học.
Xin trân trọng cảm ơn sự giúp đỡ động viên của gia đình, bạn bè và đồng
nghiệp đã giúp đỡ và tạo điều kiện tốt nhất để tôi hoàn thành luận văn này.
Mặc dù đã có những cố gắng, tìm tòi nhất định, song chắc chắn luận
văn không tránh khỏi hạn chế. Vì vậy, tôi rất mong nhận đƣợc những ý kiến
đóng góp của thầy, cô và các bạn để luận văn đƣợc hoàn thiện hơn.
Hà Nội, ngày 28 tháng 11 năm 2017
Học viên

Nguyễn Thị Vân Hà


LỜI CAM ĐOAN
Luận văn đƣợc hoàn thành dƣới sự hƣớng dẫn trực tiếp của thầy giáo,
PGS.TS Lê Huy Thập. Tôi xin cam đoan:
- Luận văn là kết quả nghiên cứu tìm tòi của riêng tôi.
- Những tƣ liệu đƣợc trích dẫn trong luận văn là trung thực.
- Những gì đƣợc triển khai trong luận văn không trùng khít với bất kì
công trình nghiên cứu của các tác giả nào đã đƣợc công bố trƣớc đó.
Hà Nội, ngày 28 tháng 11 năm 2017
Học viên

Nguyễn Thị Vân Hà


MỤC LỤC
LỜI CẢM ƠN…………………………………………………………………i
LỜI CAM ĐOAN…………………………………………………………… ii

MỤC LỤC…………………………………………………………………...iii
DANH MỤC CÁC KÝ HIỆU, TỪ VIẾT TẮT……………………………...v
DANH MỤC CÁC BẢNG………………………………………………... viii
DANH MỤC CÁC HÌNH VẼ………………………………………………. ix
PHẦN MỞ ĐẦU .............................................................................................. 1
1. Lý do chọn đề tài .......................................................................................... 1
2. Mục đích nghiên cứu .................................................................................... 1
3. Nhiệm vụ nghiên cứu ................................................................................... 1
4. Đối tƣợng và phạm vi nghiên cứu ................................................................ 1
5. Phƣơng pháp nghiên cứu .............................................................................. 1
6. Giả thuyết khoa học ...................................................................................... 1
7. Cấu trúc luận văn…………………………………………………………. 2
PHẦN NỘI DUNG ......................................................................................... 3
Chƣơng 1. CƠ SỞ LÝ THUYẾT ………...................................................... 3
1.1. Logic mệnh đề ……………………………………………...................... 3
1.1.1. Mệnh đề toán học .. ………………………………………………… 3
1.1.2. Các biểu thức logic…………………………………………............. 5
1.2. Cơ sở dữ liệu phân tán .............. ………………………………………… 9
1.2.1. Khái quát về cơ sở dữ liệu phân tán trên cơ sở dữ liệu quan hệ…… 9
1.2.2. Các phương pháp phân mảnh cơ bản ………..…………………… 12
1.3. Bài toán quy hoạch nguyên ……………………………………………. 19
1.3.1. Phát biểu bài toán ………………………………………………… 19
1.3.2. Một số phương pháp giải ………….……………………………… 21


Kết luận chƣơng 1………………………………………………………...... 25
Chƣơng 2. CẤP PHÁT TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN ……… 26
2.1. Các thông tin cho cấp phát ...................................................................... 26
2.1.1. Thông tin về cơ sở dữ liệu quan hệ................................................... 26
2.1.2. Thông tin về ứng dụng …………………………………………...... 26

2.1.3. Thông tin về vị trí…………………………………………………. 27
2.1.4. Thông tin về mạng……………………………………………….... 27
2.2. Mô hình cấp phát ... ………………………………………………….... 28
2.2.1. Phát biểu bài toán cấp phát ………………………………………. 28
2.2.2. Hàm chi phí ………………………………………………………. 33
2.2.3. Các ràng buộc ……………………………………………………. 36
2.2.4. Phƣơng pháp giải …………………………………………………. 38
Kết luận chƣơng 2 …………………………………………………………. 41
Chƣơng 3. CHƢƠNG TRÌNH DEMO ………………………………….. 42
3.1. Tóm tắt bài toán…………….. ……………............................................ 42
3.2. Code………………………………………………………………......... 42
3.3. Các giao diện DEMO ………………………………………………… 46
3.3.1. Giao diện chính …………………………………………………... 46
3.3.2. Giao diện dữ liệu DEMO ………………………………………… 47
3.3.3. Giao diện nhập dữ liệu mới ………………………………………. 47
3.3.4. Giao diện kết quả ………………………………………………… 49
Kết luận chƣơng 3 .………………………………………………………… 51
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN. ………………………………… 52
TÀI LIỆU THAM KHẢO ............................................................................. 53


DANH MỤC CÁC KÝ HIỆU, TỪ VIẾT TẮT

STT

Ký hiệu,
từ viết tắt

1


CSDL

2

QTCSDL

3

DDBS

4

DDBMS

5

GCS

6

LCS

7

QHTT

8

f


Hàm mục tiêu

9

D

Tập hữu hạn các phần tử

10

P

Tính chất

11

x

Phần tử

12

F

Mảnh dữ liệu

13

S


Vị trí

14

q

Ứng dụng

15

RRij

Số truy xuất đọc

16

URij

Số truy xuất cập nhật

17

UM

Ma trận cho truy xuất cập nhật

18

RM


Ma trận cho truy xuất đọc

19

uij

Diễn giải
Cơ sở dữ liệu
Quản trị cơ sở dữ liệu
Cơ sở dữ liệu phân tán (Distributed Database
System)
Hệ quản trị cơ sở dữ liệu phân tán (Distributed
Database Management System)
Lƣợc đồ khái niệm toàn cục (Global Conception
Schema)
Lƣợc đồ khái niệm cục bộ (Local Conception
Schema)
Quan hệ tuyến tính

Phần tử trong ma trận truy xuất cập nhật


Phần tử trong ma trận truy xuất đọc

20

rij

21


USCk

Chi phí lƣu dữ liệu tại vị trí Sk

22

LPCk

Chi phí xử lý dữ liệu tại vị trí Sk

23

Cij

24

C’ij

25

FAP

26

DAP

27

U


28

CR

Ma trận chi phí truyền chỉ đọc

29

CRkh

Phần tử trong ma trận chi phí truyền chỉ đọc

30

CU

Ma trận chi phí truyền theo yêu cầu cập nhật

31

cUkh

Phần tử trong ma trận chi phí truyền theo yêu
cầu cập nhật

32

CW

Ma trận chi phí lƣu trữ


33

Cwij

Phần tử trong ma trận chi phí lƣu trữ

34

TOC

Tổng chi phí

35

QPC

Chi phí xử lý câu vấn tin

36

STC

Chi phí lƣu mảnh

37

PC

Chi phí xử lý


38

TC

Chi phí truyền

39

AC

Chi phí truy xuất

40

IE

Chi phí toàn vẹn

41

CC

Chi phí điều khiển đồng thời

Chi phí truyền một đơn vị đối với yêu cầu chỉ
đọc giữa vị trí Si và Sj
Chi phí truyền một đơn vị đối với yêu cầu cập
nhật giữa vị trí Si và Sj
Bài toán cấp phát tập tin (File Allocation

Problem)
Bài toán cấp phát CSDL (Database Allocation
Problem)
Ma trận chi phí cập nhật các mảnh


42

TCU

Thành phần chi phí cập nhật của hàm truyền dữ
liệu

43

TCR

Thành phần chi phí đọc của hàm truyền dữ liệu

44

C

Ma trận hƣởng lợi

45

cij

Phần tử của ma trận hƣởng lợi



DANH MỤC CÁC BẢNG

STT

Bảng

Trang

1

Bảng 1.1-1: Chân trị của các phép toán mệnh đề

5

2

Bảng 1.1-2: Bảng ƣu tiên các phép toán mệnh đề

5

3

Bảng 1.1-3: Bảng mệnh đề tƣơng đƣơng

7

4


Bảng 1.1-4: Biểu thức logic tƣơng đƣơng

9

5

Bảng 1.2-1: Quan hệ DuAn

12

6

Bảng 1.2-2: DuAn1 chỉ lƣu thông tin về ngân sách các
dự án

13

7

Bảng 1.2-3: DuAn2 chỉ lƣu tên và vị trí dự án

13

8
9

Bảng 1.2-4: DuAH1 lƣu thông tin về các dự án có ngân
sách dƣới $2000,000
Bảng 1.2-5: DuAH2 lƣu thông tin về các dự án có ngân
sách lớn hơn $2000,000


14
14


DANH MỤC CÁC HÌNH VẼ

STT

Hình vẽ

Trang

1

Hình 1.2.1-1: CSDL tập trung, không phải là DDBS

10

2

Hình 1.2.1-2: CSDL đƣợc phân tán trên mạng DDBS

11

3

Hình 1.2.2-1: Biểu diễn mối liên hệ giữa các quan hệ
nhờ các đƣờng nối


16

4

Hình 1.2.2-2: Cấu trúc cây của phân mảnh hỗn hợp

17


1
PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Trong hệ thống thông tin thƣờng có nhiều vị trí xử lý đƣợc nối với nhau
thành mạng (ở đây chúng ta xét mạng máy tính). Để nâng cao hiệu quả xử lý
một hệ CSDL trên mạng đã cho, ngƣời ta tiến hành phân chia các quan hệ của
CSDL đó thành tập các mảnh con và gửi chúng đến các nút mạng để xử lý
(mà ta gọi là “Cấp Phát”). Chúng ta sẽ tập trung xem xét một chiến lƣợc cấp
phát tối ƣu các mảnh khi biết các loại thông tin: Thông tin CSDL, Thông tin
các ứng dụng, Thông tin về vị trí, Thông tin về mạng,…, dựa vào bài toán quy
hoạch nguyên.
2. Mục đích nghiên cứu (Các kết quả cần đạt đƣợc)
Nghiên cứu bài toán cấp phát trong CSDL phân tán.
3. Nhiệm vụ nghiên cứu
Nghiên cứu bài toán cấp phát tổng quát, thu thập dữ liệu để giải bài
toán trên cơ sở bài toán quy hoạch tuyến tính nguyên.
4. Đối tƣợng và phạm vi nghiên cứu
Toán rời rạc.
CSDL phân tán.
Quy hoạch tuyến tính nguyên
5. Giả thuyết khoa học

Từ việc nghiên cứu bài toán cấp phát trong CSDL phân tán để bổ sung
thêm kiến thức vào CSDL phân tán.
6. Phƣơng pháp nghiên cứu
Dùng các kiến thức: Toán rời rạc, CSDL phân tán để nghiên cứu bài
toán cấp phát.
Dựa vào Quy hoạch tuyến tính nguyên để giải bài toán cấp phát.


2
7. Cấu trúc luận văn
Ngoài phần mở đầu và kết luận, nội dung của luận văn đƣợc trình bày
trong 3 chƣơng.:
Chƣơng 1. Cơ sở lý thuyết
Chƣơng 2. Cấp phát trong cơ sở dữ liệu phân tán
Chƣơng 3. Chƣơng trình DEMO


3
PHẦN NỘI DUNG
Chƣơng 1
CƠ SỞ LÝ THUYẾT
Logic mệnh đề

1.1.

1.1.1. Mệnh đề toán học
a. Định nghĩa
 Mệnh đề logic là một phát biểu để diễn tả một ý tƣởng trọn vẹn và khẳng
định một cách khách quan là phát biểu đó đúng hoặc sai (không thể vừa
đúng lại vừa sai, hay mang tính chất mập mờ).

 Giá trị trị đúng hay sai của mệnh đề đƣợc gọi là chân trị của mệnh đề.
Chân trị đúng của mệnh đề thƣờng đƣợc kí hiệu là 1 hoặc T hoặc True,
còn chân trị sai đƣợc kí hiệu là 0 hoặc F hoặc False
Ví dụ
i/ “2 là số chẵn” là mệnh đề đúng nên cho chân trị 1 hoặc T
ii/ “2 không là số nguyên tố” là mệnh đề sai nên cho chân trị 0 hoặc F
iii/ “x*y = z” không phải mệnh đề nên không có chân trị

iiii/“x + ay = z” không phải mệnh đề nên không có chân trị
b. Cú pháp
Cú pháp là quy tắc dùng các đối tƣợng và các phép kết nối logic các đối
tƣợng lại để tạo ra một biểu thức logic chuẩn (theo một nghĩa nào đó).
c. Ngữ nghĩa
Ngữ nghĩa của biểu thức logic là ý nghĩa của biểu thức logic đó. Có thể
dùng các phƣơng pháp: quy nạp, đệ quy, suy luận, các quy tắc, các lƣợc đồ
chứng minh,...để chỉ ra một biểu thức logic cho trƣớc là chuẩn hay không
chuẩn và cho biết chân trị của biểu thức đó.


4
Các loại mệnh đề và các phép toán mệnh đề
Hai loại mệnh đề cơ bản: mệnh đề sơ cấp (elementary) và mệnh đề
phức tạp (compound).
a. Mệnh đề sơ cấp.
Mệnh đề sơ cấp hay còn gọi là mệnh đề đơn giản, nó là các nguyên tử
(atom)-không thể chia nhỏ đƣợc. Chẳng hạn “2 là số nguyên tố”.
b. Mệnh đề phức hợp.
Mệnh đề phức hợp: là mệnh đề đƣợc tạo ra từ một hoặc nhiều mệnh đề
khác bằng cách sử dụng các phép toán logic mệnh đề.
Ví dụ

“15 MOD 3 = 0” AND “3 là số nguyên tố”, là mệnh đề phức hợp.
Biến mệnh đề hay ký hiệu mệnh đề. Để máy tính hiểu đƣợc, chúng ta dùng
các kí hiệu cho các mệnh đề đơn giản, đƣợc gọi là biến mệnh đề, các biến
mệnh đề thƣờng đƣợc dùng là các chữ thƣờng.
Ví dụ
p = “2 là số chẵn”
q = “2 là số nguyên tố”
u = “15 MOD 3 = 0”
Các phép toán mệnh đề


NOT (Phép phủ định)



AND (Phép hội - Conjunction)



OR (Phép tuyển - Disjunction)

 () If…Then… (Phép điều kiện hay kéo theo hay suy ra)
() If … AND Only If … (Cần và đủ kéo theo hai chiều hay tƣơng
đƣơng)


XOR (Tổng trực giao - đôi khi dùng )

()


chỉ nhóm ƣu tiên trong biểu thức logic


5
c. Bảng chân trị của các phép toán mệnh đề (Bảng 1.1-1)
Bảng 1.1-1. Chân trị của các phép toán mệnh đề
P
0
0
1
1

q
0
1
0
1

 p

1
1
0
0

p q
0
0
0
1


pq
0
1
1
0

pq
0
1
1
1

pq
1
1
0
1

pq
1
0
0
1

Chú ý: Một biểu thức logic có m biến sẽ có 2m giá trị.
d. Mức ưu tiên của các phép toán logic
Thứ tự ƣu tiên của các phép toán logic đƣợc liệt kê theo mức yếu dần
từ trái sang phải, từ trên xuống dƣới (Bảng 1.1-2)
Bảng 1.1-2. Bảng ƣu tiên các phép toán mệnh đề

Ký hiệu phép toán

Nghĩa của phép toán

 (hoặc  hoặc )

Phủ định

,

Hội, tuyển

,

Kéo theo, tƣơng đƣơng

1. 1.2. Các biểu thức logic
Biểu thức logic là một mệnh đề phức hợp, biểu thức logic thƣờng đƣợc
ký hiệu bởi các chữ in hoa và nó là sự kết hợp của các biến mệnh đề, các biểu
thức logic, các phép toán logic và các dấu ( ).
Ví dụ
E = (pq  r)  t  s là một biểu thức logic
1. Biểu thức hằng đúng: Nếu biểu thức logic E luôn đúng với mọi giá trị của
các biến thành phần thì ta gọi E là biểu thức hằng đúng (còn gọi là khả
thỏa).
2. Biểu thức hằng sai: Nếu biểu thức logic E luôn sai với mọi giá trị của các
biến thành phần thì ta gọi E là biểu thức hằng sai (hay mâu thuẫn).
Ví dụ: E = pp là hằng đúng, F = pp là hằng sai hay mâu thuẫn.



6
3. Biểu thức vững chắc: Một biểu thức là vững chắc nếu nó đúng với mọi bộ
giá trị chân lý của các mệnh đề thành phần
4. Biểu thức hội cơ bản (hay hội sơ cấp): Cho các biến mệnh đề pi, i  1, n .
Biểu thức logic Ek = p1p2  … pk đƣợc gọi là biểu thức hội sơ cấp.
5. Biểu thức tuyển cơ bản (hay tuyển sơ cấp): Cho các biến mệnh đề
pi, i  1, n . Biểu thức logic Ek = p1p2  … pk đƣợc gọi là biểu thức tuyển
sơ cấp.
6. Biểu thức chuẩn hội: Biểu thức logic F = E1 E2 …  Em trong đó Ei ,
i  1, m là biểu thức logic tuyển cơ bản, đƣợc gọi là biểu thức chuẩn hội

(hay còn đƣợc gọi là hội chính tắc).
7. Biểu thức chuẩn tuyển: Biểu thức logic F = E1 E2 …  Em trong đó Ei ,
i  1, m là biểu thức logic hội cơ bản, đƣợc gọi là biểu thức chuẩn tuyển

(hay còn đƣợc gọi là tuyển chính tắc).
8. Quy tắc chuyển biểu thức logic bất kỳ về dạng chuẩn hội
o Khử các phép tƣơng đƣơng: ab  (ab)  (b  a)
o Khử các phép kéo theo: ab  ( a b)
o Chuyển các phép phủ định vào sát các ký hiệu mệnh đề bằng cách áp
dụng luật De Morgan ( a b)  a  b) và ( a  b)  a  b)
o Khử phủ định kép: a  a
o Áp dụng luật phân phối: a (b  c) ≡ (a  b)  (a  c)
Định lý 1
Mọi biểu thức logic E (p1, p2, ...pn ) đều tương đương với một biểu thức
tuyển chính tắc duy nhất. Tức là E (p1, p2, ...pn )  E1  E2  ... Em (duy
nhất ) với Ei ( i  1, m ) là các biểu thức hội cơ bản. Nghĩa là Ei = q1  q2  ...
qn với qi = pi hoặc qi =pi ( i  1, n ).



7
Định lý 2
Mọi biểu thức logic F (p1, p2, ...pn ) đều tương đương với một biểu thức hội
chính tắc duy nhất. Tức là F (p1, p2, ...pn )  F = F1  F2  ... Fm (duy nhất )
với Fi ( i  1, m ) là các biểu thức tuyển cơ bản. Nghĩa là Fi = q1  q2  ... qn
với qi = pi hoặc qi =pi ( i  1, n ).
9. Các biểu thức logic tương đương (Bảng 1.1-3)
Bảng 1.1-3. Mệnh đề tƣơng đƣơng

Hai biểu

thức

P

Q

P⇔Q

Đúng

Đúng

Đúng

Đúng

Sai

Sai


Sai

Đúng

Sai

Sai

Sai

Đúng

logic

(mệnh

đề)

P và Q gọi

là tƣơng

đƣơng

logic hay tƣơng đƣơng với nhau nếu P và Q đồng thời có cùng một giá trị
chân lý; nghĩa là P và Q cùng đúng (hoặc cùng sai), trong những điều kiện
hoàn toàn nhƣ nhau, ta viết:
"PQ" và đọc là "P đúng khi và chỉ khi Q đúng", "" gọi là dấu liên
hệ tƣơng đƣơng. Bảng 1.1-3 cho chân trị của quan hệ tƣơng đƣơng.

Chú ý: Một số tài liệu  là kéo theo hai chiều.
Dễ thấy, mối quan hệ tƣơng đƣơng PQ là (PQ)  (QP).
Trong trƣờng hợp này, hai phát biểu "PQ" và "QP" gọi là đảo của
nhau.
Để chứng minh mối quan hệ tƣơng đƣơng PQ, ta phải chứng minh
mối quan hệ kéo theo PQ và chiều ngƣợc lại.
Chú ý rằng (PQ)  (Q P)


8
Trong ngôn ngữ tự nhiên, để diễn đạt mối liên hệ tƣơng đƣơng
giữa P và Q, ngƣời ta có nói P đúng khi và chỉ khi Q đúng.
Tính chất của các biểu thức logic tƣơng đƣơng


PP

(phản xạ)



(P  Q)  (Q  P)

(đối xứng)



((P  Q)  R)  (P  (Q  R))

(kết hợp)




¬¬P  P

(bất biến)



(P  Q)  (¬P  ¬Q)

(contraposition)

Khi nói P  Q là đúng không có nghĩa là cả P và Q đều đúng, mà
là cả hai có cùng chân trị (hoặc đúng hoặc sai) đồng thời.
10. Quan hệ tương đương giữa nhiều biểu thức
Xem xét ba mệnh đề P, Q và R. Để chứng minh các mối quan hệ tƣơng
đƣơng P  Q  R, chúng ta cần chứng minh P  Q, Q  R và R  P.
Ta có thể tổng quát hóa đối với n mệnh đề P1, P2… Pn.
Để chứng minh các mối quan hệ tƣơng đƣơng P1  P2 …  Pn, chỉ
cần chứng minh các quan hệ kéo theo:
P1  P2, P2  P3… Pn-1  Pn và Pn  P1.
Cách chứng minh nhƣ trên gọi là chứng minh vòng.


9
11. Các biểu thức logic tương đương hay dùng (Bảng 1.1-4)
Bảng 1.1-4. Biểu thức logic tƣơng đƣơng
Tƣơng đƣơng


STT

Tên gọi

p1p
1

p0p

Luật đồng nhất

p11
2

p00

Luật bành trƣớng hay nuốt

ppp
3

ppp

4

p  p

Luật Lũy đẳng
Luật phủ định


pqqp
5

pqqp

Luật giao hoán

(p  q)  r  p  (q  r)
6

(p  q)  r  p  (q  r)

Luật kết hợp

(p  q)  r  (p  r)  (q  r)
7

(p  q)  r  (p  r)  (q  r)

Luật phân phối

 (p  q)  p  q

1.2.

8

 (p  q)  p  q

9


p  q  p q

10

p  q  (pq)  (qp)

Luật De Morgan
Luật kéo theo
Luật kéo theo hai chiều

Cơ sở dữ liệu phân tán

1.2.1. Khái quát về cơ sở dữ liệu phân tán trên cơ sở dữ liệu quan hệ
Hệ CSDL phân tán (Distributed Database System – DDBS) là một
tập hợp dữ liệu có liên đới logic và đƣợc phân bố trên các nút của một
mạng máy tính.


10
Hệ quản trị CSDL phân tán (Distributed Database Management System
– DDBMS) là một hệ thống phần mềm cho phép quản lý các DDBS và làm
cho việc phân tán trở nên vô hình đối với ngƣời sử dụng.
Nhƣ vậy DDBS là một tập các tệp dữ liệu vừa có liên đới logic, vừa
phải có cùng cấu trúc và vừa phải đƣợc truy xuất qua một giao diện chung. Và
phân bố vật lý của các dữ liệu không phải là vấn đề quyết định.
Nhận xét:
Nếu CSDL nằm tại một nút mạng thì nó không phải là DDBS, vì vấn
đề quản trị CSDL không khác với quản trị CSDL trong môi trƣờng tập trung
kiểu client/server của mạng.

Ví dụ CSDL trong hình 1.2.1-1 không phải là DDBS
Worstation1

Worstation2
Worstation5
Mạng
Truyền DL

Worstation4
Worstation3

Hình 1.2.1-1. CSDL tập trung, không phải là DDBS
Nếu một cơ sở dữ liệu đƣợc phân tán trên nhiều nút mạng, khi đó
CSDL sẽ là cơ sở dữ liệu phân tán (Hình 1.2.1-2)


11
Worstation1

Worstation2

Worstation5
Mạng
Truyền DL

Worstation4

Worstation3

Hình 1.2.1-2. CSDL đƣợc phân tán trên mạng, DDBS

Các đặc điểm của hệ CSDL phân tán
* Phức tạp
Các vấn đề của hệ CSDL phán tán phức tạp hơn so với tập trung vì
chúng không những có cả những vấn đề của môi trƣờng tập trung mà còn có
cả hàng loạt những vấn đề mới chƣa đƣợc giải quyết của CSDL phân tán.
* Chi phí cao
Các hệ phân tán đòi hỏi phải có thêm các thiết bị mới (thiết bị truyền
thông chẳng hạn) và nhƣ thế làm tăng chi phí phần cứng. Tuy nhiên hiện nay,
giá thành của thiết bị ngày càng giảm làm cho điều này trở thành một yếu tố
không còn quan trọng.
Phần chi phí đáng kế nằm ở chỗ nó cần phải có các phần mềm và
phƣơng pháp truyền thông phức tạp hơn. Ngoài ra còn cần chi phí về nhân
lực. Khi các thiết bị đƣợc xây dựng ở nhiều vị trí khác nhau, đòi hỏi phải có
ngƣời điều hành và quán lý.
* Quyền điều khiển bị phân tán


12
Điểm này đã đƣợc nêu ra tƣởng nhƣ là một ƣu điểm của các hệ CSDL
phân tán. Tuy nhiên, không may là sự phân tán lại gây ra khó khăn về đồng
bộ hóa. Việc điều khiển phân tán có thể trở thành một gánh nặng nếu không
có những chiến lƣợc phù hợp để giải quyết chúng.
* Tính an ninh.
Trong hệ CSDL phân tán, môi trƣờng mạng kèm theo sẽ có các yêu cầu
an ninh của riêng chúng. Vì vậy, vấn đề an ninh trong các hệ CSDL phân tán
rõ ràng là phức tạp hơn so với các hệ tập trung.
Phân loại
CSDL phân tán thuần nhất: là CSDL phân tán có đƣợc bằng cách chia
một CSDL thành một tập các CSDL cục bộ, đƣợc quản lý bởi cùng một hệ
QTCSDL.

CSDL phân tán có thuần nhất hay không, phụ thuộc bởi các yếu tố
phần cứng, hệ điều hành và các hệ QTCSDL cục bộ.
CSDL phân tán hỗn tạp: là CSDL phân tán có đƣợc bằng cách tích hợp
các CSDL cục bộ đã có, đƣợc quản lý bởi nhiều hệ QTCSDL khác nhau.
1.2.2. Các phương pháp phân mảnh cơ bản [2], [5], [9]
Các quan hệ CSDL thƣờng đƣợc biểu diễn dƣới dạng bảng. Việc phân
mảnh một quan hệ thành nhiều quan hệ con khác nhau, theo các cách khác
nhau, sẽ có các cách phân mảnh tƣơng ứng. Có các kiểu phân mảnh cơ bản,
tƣơng ứng với việc chia quan hệ theo chiều dọc, chiều ngang và hỗn hợp.
Giả sử ta có Quan hệ DuAn(MaDuAn, TenDuAn, NganSach) (bảng 1.2-1)
Bảng 1.2-1. Quan hệ DuAn
MaDuAn
DA1
DA2
DA3
DA4

TenDuAn
Thiết bị đo đạc
Phát triển CSDL
CAD/ CAM
Bảo dƣỡng

NganSach
150000
135000
250000
310000

ViTri

Hải Phòng
Hà Nội
Hà Nội
TP.Hồ Chí Minh


13
a/ Phân mảnh theo chiều dọc:
Phân mảnh dọc quan hệ R sinh ra các mảnh R1, R2,...,Rr sao cho mỗi
mảnh chứa một tập con các thuộc tính của quan hệ R và khóa chính của R.
Nghĩa là thiết lập một quan hệ mới chỉ có một số thuộc tính từ quan hệ gốc.
Thực chất đây là phép chiếu trên tập con các thuộc tính của quan hệ.
Ví dụ: phân mảnh dọc quan hệ DuAn thành hai quan hệ con DuAnV1 và
DuAnV2. DuAnV1 chỉ chứa thông tin về ngân sách các dự án, còn DuAnV2
chứa tên và vị trí dự án. Khoá của quan hệ (MaDuAn) đều có mặt trong cả hai
mảnh (Bảng 1.2-2 và bảng 1.2-3).
Bảng 1.2-2. Mảnh dọc DuAnV1 chỉ lƣu thông tin về ngân sách các dự án
MaDuAn

NganSach

DA1

150000

DA2

135000

DA3


250000

DA4

310000

Bảng 1.2-3. Mảnh dọc DuAnV2 chỉ lƣu tên và vị trí dự án
MaDuAn

TenDuAn

ViTri

DA1

Thiết bị đo đạc

Hải Phòng

DA2

Phát triển CSDL

Hà Nội

DA3

CAD/ CAM


Hà Nội

DA4

Bảo dƣỡng

TP.Hồ Chí Minh

b/ Phân mảnh theo chiều ngang:
Phân mảnh theo chiều ngang là chia quan hệ thành nhiều các nhóm bộ.
Kết quả của quá trình phân mảnh ngang là các quan hệ con, số lƣợng quan hệ
con phụ thuộc vào điều kiện ràng buộc của các thuộc tính, các bộ.


14
Ví dụ: phân mảnh ngang quan hệ DuAn thành hai quan hệ: Quan hệ con
DuAnH1 chứa các thông tin về các dự án có ngân sách dƣới 200,000$, còn
quan hệ con DuAnH2 lƣu các dự án còn lại (Bảng 1.2-4 và bảng 1.2-5)
Bảng 1.2-4. Mảnh ngang DuAnH1 lƣu các thông tin về các dự án có ngân sách
dƣới $200,000
MaDuAn

TenDuAn

NganSach

ViTri

DA1


Thiết bị đo đạc

150000 Hải Phòng

DA2

Phát triển CSDL

135000 Hà Nội

Bảng 1.2-5. DuAnH2 lƣu các thông tin về các dự án có ngân sách lớn hơn
200,000 USD
MaDuAn

TenDuAn

NganSach

ViTri

DA3

CAD/ CAM

250000 Hà Nội

DA4

Bảo dƣỡng


310000 TP.Hồ Chí Minh

Có hai loại phân mảnh ngang:
+ Phân mảnh ngang nguyên thủy: là phân mảnh ngang khi thực hiện
các vị từ trên chính quan hệ đó.
+ Phân mảnh ngang dẫn xuất: là phân rã một quan hệ dựa trên các vị từ
của quan hệ khác.
Nhƣ vậy trong phân mảnh ngang tập hợp các vị từ đóng một vai trò
quan trọng.
Ví dụ
Phân mảnh quan hệ DuAn thành các mảnh ngang DuAnH1 và DuAnH2
nhƣ sau:
DuAnH1 = NganSach 

200000

(DuAn)

DuAnH2 = NganSach > 200000 (DuAn)


×