Nghiên cứu tối ưu truy vấn trong cơ sở dữ liệu phân tán

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.74 MB, 71 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN THỊ ĐIỆU
NGHIÊN CỨU TỐI ƯU TRUY VẤN TRONG
CƠ SỞ DỮ LIỆU PHÂN TÁN
LUẬN VĂN THẠC SĨ KỸ THUẬT PHẦN MỀM
Hà Nội – 2014
2
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN THỊ ĐIỆU
NGHIÊN CỨU TỐI ƯU TRUY VẤN TRONG
CƠ SỞ DỮ LIỆU PHÂN TÁN
Ngành : Công nghệ thông tin
Chuyên ngành : Kỹ thuật Phần mềm
Mã số : 60480103
LUẬN VĂN THẠC SĨ KỸ THUẬT PHẦN MỀM
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. NGUYỄN TUỆ
Hà Nội – 2014
3
LỜI CẢM ƠN
Trước hết, tôi xin gửi lời biết ơn sâu sắc đến người thầy TS. Nguyễn Tuệ,
th
ầy đã dành rất nhiều thời gian, tâm huyết hướng dẫn nghiên cứu và giúp tôi
hoàn thành t
ốt luận văn tốt nghiệp này. Thầy đã có những hướng mở rất hay và
nh
ững định hướng nghiên cứu thiết thực, bổ ích, đồng thời tạo điều kiện thuận
lợi nhất cho tôi nghiên cứu.
Tôi cũng xin được bày tỏ lòng biết ơn tới các thầy cô trường Đại học
Công nghệ, ĐH Quốc gia Hà Nội đã tham gia giảng dạy và chia sẻ những kinh

nghiệm quý báu cho tập thể học viên trong khóa nói chung và cá nhân tôi nói
riêng. Tôi xin c
ảm ơn tới các thầy và các anh chị đã thường xuyên giúp đỡ, trao
đổi, góp ý về những vấn đề khoa học li
ên quan tới luận văn.
Trên tất cả, tôi xin gửi lời biết ơn tới bố mẹ, gia đình người thân. Bố mẹ
đ
ã phải làm việc vất vả tạo cơ hội và điều kiện thuận nhất giúp tôi toàn tâm toàn
ý th
ực hiện luận văn và chọn con đường đi của mình.
M
ột lần nữa, tôi xin chân thành cảm ơn!
Nội, tháng 11 năm 2014
Học viên

Nguyễn Thị Điệu
4
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình của riêng tôi. Các số liệu, kết quả nêu
trong Lu
ận văn là trung thực và chưa từng ai công bố trong bất kỳ công trình
nào khác.
Tôi xin cam đoan rằng các thông tin trích dẫn trong Luận văn đã được
chỉ rõ nguồn gốc.
Học viên thực hiện Luận văn

NGUY
ỄN THỊ ĐIỆU
5
MỤC LỤC

TRANG BÌA PHỤ 1
L
ỜI CẢM ƠN 2
L
ỜI CAM ĐOAN 4
MỤC LỤC 5
Danh mục các ký hiệu và chữ viết tắt 7
Danh mục các bảng 8
Danh mục các hình vẽ, đồ thị 9
MỞ ĐẦU 11
CHƯƠNG 1. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 14
1.1
Cơ sở dữ liệu phân tán 14
1.2 Ki
ến trúc của cơ sở dữ liệu phân tán 14
1.3 H
ệ cơ sở dữ liệu phân tán 15
1.4 L
ợi ích của cơ sở dữ liệu phân tán 16
1.5
Cơ sở dữ liệu phân tán đồng nhất và không đồng nhất 17
1.6
Lưu trữ dữ liệu phân tán 18
1.6.1 Nhân b
ản 18
1.6.2 Phân m
ảnh 20
1.7
Các bước thiết kế cơ sở dữ liệu phân tán 20
1.7.1 Thi

ết kế quan niệm 21
1.7.2 Thi
ết kế lôgic 21
1.7.3 Thi
ết kế phân mảnh 21
1.7.3.1 Phân m
ảnh ngang (Horizontal Fragmentation) 22
1.7.3.2 Phân m
ảnh dọc (Vertical Fragmentation) 26
1.7.3.3 Phân m
ảnh hỗn hợp (Hybrid Fragmentation) 27
1.7.4 Thi
ết kế định vị 28
1.8 Tính trong su
ốt của cơ sở dữ liệu phân tán 28
1.9 V
ấn đề xử lý truy vấn trong CSDL phân tán 30
CHƯƠNG 2. PHÂN TÍCH VÀ XÂY DỰNG CƠ SỞ DỮ LIỆU PHÂN TÁN 34
2.1 Phân tích bài toán 34
2.2
Lược đồ quan niệm của cơ sở dữ liệu 35
2.3
Lược đồ cơ sở dữ liệu toàn cục 36
6
2.4 Thiết kế phân tán cơ sở dữ liệu cho hệ thống 41
2.4.1 Th
ực trạng 41
2.4.2 Gi
ải pháp 41
2.4.3 Phân m

ảnh cơ sở dữ liệu 42
2.5 X
ử lý các nghiệp vụ của hệ thống 44
CHƯƠNG 3. TỐI ƯU HÓA TRUY VẤN 46
3.1 Mô hình xử lý truy vấn 46
3.1.1 Phân rã truy v
ấn 47
3.1.2 C
ục bộ hóa dữ liệu 47
3.1.3 T
ối ưu truy vấn toàn cục 47
3.1.4 Th
ực thi truy vấn phân tán 48
3.2 M
ục đích và quy trình tối ưu truy vấn 48
3.2.1. Không gian tìm ki
ếm 49
3.2.2 Chi
ến lược tìm kiếm 51
3.2.3 Mô hình chi phí phân tán 52
3.2.3.1 Hàm chi phí 52
3.2.3.2 Các th
ống kê cơ sở dữ liệu 53
3.3 Các thu
ật toán tối ưu truy vấn 54
3.3.1 Thu
ật toán tối ưu truy vấn cục bộ 55
3.3.1.1 Thu
ật toán INGRES 55
3.3.1.2 Thu

ật toán SYSTEM R 57
3.3.2 Thu
ật toán tối ưu toàn cục 59
3.3.2.1 Thu
ật toán phân tán INGRES (D- INGRES) 60
3.3.2.2 Thu
ật toán phân tán SYSTEM R* 61
CHƯƠNG 4. CÀI ĐẶT THỰC NGHIỆM 64
4.1 Hệ thống mạng của cơ sở dữ liệu 64
4.2 Các truy v
ấn đã thực hiện 65
4.3
Đánh giá 67
KẾT LUẬN 68
TÀI LI
ỆU THAM KHẢO 70
7
Danh mục các ký hiệu và chữ viết tắt
STT Từ viết tắt Ý nghĩa
1 DBMS Database Management System
2 SQL Structured Query Language
3 OS Operating System
4 DDBS Distributed Database System
5 DDB Distributed Database
6 DDBMS Distributed Database Management System
7 CSDL
Cơ sở dữ liệu
8 CPU Central Processing Unit
9 I/O Input/Output
10 SD Service Directory

11 QEP Query Execution Plan
12 UK United Kingdom
13 QOA Query Optimization Algorithm
14 ORQ Mono - Relation Query
8
Danh mục các bảng
Bảng 1.1 Chi phí của chiến lược 1 32
B
ảng 1.2 Chi phí của chiến lược 2 32
B
ảng 2.1 Danh sách các Actor của hệ thống 35
B
ảng 2.2 Danh sách các Use case của hệ thống 35
B
ảng 2.3 Bảng loại hình kinh doanh 36
B
ảng 2.4 Bảng Quận/Huyện 36
B
ảng 2.5 Bảng tổ chức 36
B
ảng 2.6 Bảng thông tin server của mỗi tổ chức 37
B
ảng 2.7 Bảng phòng ban 37
B
ảng 2.8 Bảng nhóm 37
B
ảng 2.9 Bảng người phụ trách 37
B
ảng 2.10 Bảng loại contact 38
B

ảng 2.11 Bảng loại dịch vụ 38
B
ảng 2.12 Bảng đơn vị giá 38
B
ảng 2.13 Bảng dịch vụ 39
B
ảng 2.14 Bảng ghi nhận dịch vụ đã cung cấp cho khách hàng 39
B
ảng 2.15 Bảng phân mảnh ngang tổ chức 43
B
ảng 3.1 So sánh các thuật toán 63
9
Danh mục các hình vẽ, đồ thị
Hình 1.1 Tổng quan về cơ sở dữ liệu phân tán 14
Hình 1.2 L
ược đồ định vị cơ sở dữ liệu 15
Hình 1.3 Ki
ến trúc cơ sở dữ liệu phân tán 15
Hình 1.4 X
ử lý tập tin truyền thống 16
Hình 1.5 X
ử lý cơ sở dữ liệu 16
Hình 1.6 C
ơ sở dữ liệu phân tán đồng nhất 18
Hình 1.7 C
ơ sở dữ liệu phân tán không đồng nhất 18
Hình 1.8 Kh
ởi tạo bảng Subscriber không đồng nhất trong cơ chế nhân bản 20
Hình 1.9 Các b
ước thiết kế CSDL phân tán 21

Hình 1.10 Các quan h
ệ trong cơ sở dữ liệu Ngân hàng(CSDL Banking) 23
Hình 1.11 Phân m
ảnh ngang quan hệ TAIKHOAN 25
Hình 1
.12 Đồ thị nối giữa các mảnh 26
Hình 1.13 Phân m
ảnh dọc quan hệ TAIKHOAN 27
Hình 1.14 Phân m
ảnh hỗn hợp 28
Hình 1.15 Khôi ph
ục phân mảnh hỗn hợp 28
Hình 1.16 Trong su
ốt phân mảnh 29
Hình 1.17 S
ự trong suốt về vị trí 30
Hình 1.18 Chi
ến lược thứ nhất 32
Hình 1.19 Chi
ến lược thứ hai 32
Hình 2.1 S
ơ đồ Use case tổng quan của hệ thống 35
Hình 2.2 L
ược đồ thực thể liên kết 35
Hình 2.3 L
ược đồ cơ sở dữ liệu quan hệ toàn cục (gọi là CSDL SD) 40
Hình 2.4 Mô hình c
ơ sở dữ liệu tập trung 41
Hình 2.5 Mô hình CSDL phân tán cho
ứng dụng 42

Hình 2.6 L
ược đồ cục bộ cơ sở dữ liệu thứ nhất 44
Hình 2.7 L
ược đồ cục bộ cơ sở dữ liệu thứ hai quản lý chung 44
Hình 3.1 Mô hình x
ử lý truy vấn phân tán 46
Hình 3.2 Quy trình t
ối ưu truy vấn 49
Hình 3.3 Bi
ểu diễn truy vấn bằng cây nối 50
Hình 3.4 Hai lo
ại cây nối chính 51
Hình 3.5 Các ho
ạt động tối ưu trong chiến lược đơn định 51
10
Hình 3.6 Hoạt động tối ưu trong chiến lược ngẫu nhiên hóa 52
Hình 3.7 Ví d
ụ về truyền tải dữ liệu cho truy vấn 53
Hình 3.8
Đồ thị nối của truy vấn 58
Hình 3.9 L
ựa chọn thứ tự nối 59
Hình 4.1 Các c
ơ sơ sở dữ liệu được phân tán 65
Hình 4.2 Các linked server cho k
ết nối từ xa 65
Hình 4.3 Màn hình
đăng nhập hệ thống 66
Hình 4.4 Màn hình th
ống kê tất cả các dịch vụ đã cung cấp 66

Hình 4.5 Màn hình th
ống kê dịch vụ đã tất toán theo ngày 66
Hình 4.6 Màn hình th
ống kê nhân viên 67
Hình 4.7 Bi
ểu đồ so sánh thời gian thực thi truy vấn (dựa vào chức năng thống
kê dịch vụ đã cung cấp) 67
Hình 4.8 Bi
ểu đồ so sánh thời gian thực thi truy vấn (dựa vào chức năng thống
kê dịch vụ đã tất toán) 68
11
MỞ ĐẦU
1. Lý do chọn đề tài
Cơ sở dữ liệu phân tán là thích hợp với môi trường quản lý phân tán của
các công ty, doanh nghiệp. Ngày nay, khi mà các công ty phát triển ngày càng
m
ạnh mẽ, không đơn thuần chỉ hoạt động kinh doanh trên một địa bàn, một khu
vực địa lý mà phát triển phân tán ở nhiều nơi khác nhau, trên nhiều vùng miền
(Quận/Huyện hoặc Tỉnh/Thành). Các công ty này đều có một hoặc nhiều chi
nhánh nhằm quản lý các hoạt động kinh doanh của họ. Khi có nhiều chi nhánh
con cùng ho
ạt động, việc lưu trữ dữ liệu tập trung không phải là hiệu quả trong
trường hợp n
ày bởi nhiều lý do như dữ liệu truyền tải quá mạng với kích thước
lớn sẽ ảnh hưởng đến tốc độ, chi phí và bảo mật, lượng người dùng truy xuất
đến
máy chủ cơ sở dữ liệu nhiều sẽ dẫn đến quá tải. Giải pháp hiệu quả cho bài
toán
này là lưu trữ phân tán dữ liệu, tức là dữ liệu của mỗi chi nhánh sẽ được lưu
trữ và quản lý cục bộ tại mỗi vị trí của chi nhánh đó, đảm bảo tính trong suốt đối

với người sử dụng.
Bài toán trên lại gặp một vấn đề đó là khi trụ sở chính công ty muốn tổng
hợp dữ liệu từ các chi nhánh hoặc giữa các chi nhánh có trao đổi dữ liệu. Với
người d
ùng, dữ liệu là trong suốt, tuy nhiên thực tế thì dữ liệu sẽ phải được tổng
hợp lại từ rất nhiều vị trí khác nhau qua môi trường mạng. Khi dữ liệu truy vấn
nhỏ thì thì không gặp vấn đề gì, nhưng đến thời điểm dữ liệu truy vấn có thể là
vài ch
ục nghìn hoặc hàng triệu bản ghi thì thời gian trả lời truy vấn và là một
vấn đề lớn và cần có phải pháp cho từng bài toán cụ thể. Việc tối ưu truy vấn
phân tán làm giảm các chi phí thực hiện truy vấn, làm tăng hiệu suất của hệ
thống. Vì vậy, luận văn chọn hướng nghiên cứu tối ưu truy vấn phân tán làm đề
tài.
2. Mục tiêu và nhiệm vụ nghiên cứu
Luận văn nghiên cứu thuật toán tối ưu truy vấn trong cơ sở dữ liệu phân
tán chú trọng tới Thuật toán phân tán INGRES (D-INGRES), ngoài ra Luận văn
cũng trình bày về Thuật toán phân tán SYSTEM R (SYSTEM R *), với nghiên
c
ứu này luận văn nhằm tìm ra giải pháp hiệu quả cho thực thi các phép vấn tin
t
ừ xa, từ đó thực hiện cài đặt thực nghiệm và đánh giá kết quả.
3. Đối tượng và phạm vi nghiên cứu
a. Đối tượng nghiên cứu
- Nghiên cứu lý thuyết về cơ sở dữ liệu phân tán.
- Nghiên c
ứu xây dựng cơ sở dữ liệu phân tán cho bài toán cụ thể.
-
Cài đặt cơ sở dữ liệu phân tán sử dụng SQL Server 2008 R2.
- Nghiên c
ứu thuật toán tối ưu truy vấn.

12
b. Phạm vi nghiên cứu
Có 3 cách tiếp cận lưu trữ dữ liệu trong cơ sỡ dữ liệu phân tán:
 Nhân bản: hệ thống duy trì nhiều bản sao (copies) giống hệt nhau của
quan hệ và lưu mỗi bản sao tại các trạm khác nhau.
 Phân mảnh: hệ thống phân chia các quan hệ thành nhiều mảnh và lưu trữ
mỗi mảnh tại các trạm khác nhau.
 Kết hợp: một quan hệ có thể được chia thanh nhiều mảnh và thực hiện
nhân bản cho mỗi mảnh.
Một cơ sở dữ liệu có thể được phân tán đồng nhất hoặc không đồng nhất.
Hệ cơ sở dữ liệu phân tán đồng nhất (homogeneous distributed database system)
nghĩa tất cả các trạm chạy cùng phần mềm hệ quản trị cơ sở dữ liệu (DBMS)
nhưng
hệ điều hành (OS) có thể khác nhau ở các trạm này. Với cơ sở dữ liệu
phân tán không đồng nhất (heter
ogeneous distributed database) thì các trạm
chạy phần mềm hệ quản trị cơ sở dữ liệu khác nhau hoặc hệ thống cơ sở dữ liệu
khác nhau.
Lu
ận văn tiếp cận Cơ sở dữ liệu phân tán đồng nhất và lưu trữ phân mảnh
ngang. Thực nghiệm trên cơ sở dữ liệu này và đánh giá hiệu quả tối ưu của truy
vấn.
4. Phương pháp nghiên cứu
a. Phương pháp lý thuyết
Luận văn nghiên cứu và tham khảo tài liệu, các công trình khoa học về cơ
sở dữ liệu phân tán, nguyên lý các hệ phân tán. Hệ thống lại các vấn đề và rút ra
k
ết luận so sánh giữa thời gian trả lời truy vấn chưa tối ưu và thời gian trả
lời vấn tin đã tối ưu.
b. Phương pháp thực nghiệm

Luận văn cài đặt cơ sở dữ liệu phân tán cho một bài toán cụ thể trên môi
trường mạng LAN, cài đặt các phép truy vấn từ xa, thực hiện tối ưu các phép
truy vấn và đưa ra đánh giá cụ thể.
5. Kết quả dự kiến
Nghiên cứu và lựa chọn thuật toán phù hợp cho bài toán, cài đặt các
nghi
ệp vụ phía trung tâm áp dụng thuật toán phân tán Ingres để so sánh thời gian
trả lời truy vấn phân tán khi chưa tối ưu và khi đã tối ưu. Đưa ra biểu đồ đánh
giá với nhiều phép vấn tin khác nhau.
6. Ý nghĩa khoa học và thực tiễn của đề tài
Luận văn phục vụ cho lĩnh vực phát triển phần mềm nhằm cải thiện thời
gian trả lời vấn tin với kích thước lớn nhằm tiết kiệm chi phí.
13
7. Đặt tên đề tài
“NGHIÊN C
ỨU TỐI ƯU TRUY VẤN TRONG CƠ SỞ DỮ LIỆU
PHÂN TÁN”
8. B
ố cục luận văn
Luận văn được thiết kế bao gồm 4 chương:
Chương 1: Tổng quan về cơ sở dữ liệu phân tán
Chương này giới thiệu tổng quan về cơ sở dữ liệu phân tán, hệ cơ sở dữ
liệu phân tán, những lợi ích khi sử dụng cơ sở dữ liệu phân tán. Thế nào là đồng
nhất và không đồng nhất cơ sở dữ liệu phân tán, lưu trữ cơ sở dữ liệu phân tán.
Chương 2. Phân tích và xây dựng cơ sở dữ liệu phân tán
Chương này nhằm giới thiệu tổng quan về bài toán thực nghiệm, thực
hiện phân tích và thiết kế cơ sở dữ liệu phân tán cho bài toán sử dụng hệ quản trị
SQL Server 2008.
Chương 3. Tối ưu hóa truy vấn
Chương này sẽ giới thiệu chung về về xử lý truy vấn phân tán. Các thuật

toán giúp tối ưu truy vấn trong cơ sở dữ liệu phân tán áp dụng cho bài toán thực
nghiệm.
Chương 4. Cài đặt thực nghiệm
Chương này sẽ thực hiện cài đặt chương trình trên môi trường thực tế.
Đưa ra kết luận và đánh giá về đề t
ài.
14
CHƯƠNG 1. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN
1.1 Cơ sở dữ liệu phân tán
Cơ sở dữ liệu phân tán (DDB) là một tập các cơ sở dữ liệu có quan hệ với
nhau về mặt lôgic và được phân bố tại các trạm (site) trên một mạng máy tính
[2, 3]. Các cơ sở dữ liệu trong trong cơ sở dữ liệu phân tán không chỉ được phân
tán trong mạng cục bộ bên trong một công ty mà còn trên nhiều công ty thông
qua mạng diện rộng [16]. Việc thực hiện phân tán có thể là đồng nhất hoặc
không đồng nhất cơ sở dữ liệu.
Hình 1.1 Tổng quan về cơ sở dữ liệu phân tán
- Tính chất phân tán: Toàn bộ dữ liệu của cơ sở dữ liệu (CSDL) phân tán
không được lưu trữ tại một vị trí mà lưu trữ tại nhiều trạm thuộc mạng
máy tính, điều n
ày giúp chúng ta phân biệt CSDL phân tán với CSDL tập
trung đơn lẻ.
- Tương quan lôgic: Toàn bộ dữ liệu của CSDL phân tán có một số thuộc
tính ràng buộc chúng với nhau điều này giúp chúng ta có thể phân biệt
một CSDL phân tán với một tập hợp các CSDL cục bộ [7 ].
1.2 Kiến trúc của cơ sở dữ liệu phân tán
Mô hình kiến trúc cơ sở dữ liệu phân tán gồm lược đồ toàn cục, lược đồ
phân mảnh, lược đồ định vị và lược đồ ánh xạ cục bộ [1, 4, 6]:
-
Lược đồ toàn cục: Xác định toàn bộ dữ liệu được lưu trữ trong CSDL
phân tán như trong CSDL tập trung.

Trong mô hình quan hệ, lược đồ toàn
c
ục là các quan hệ và mối liên kết giữa chúng.
- Lược đồ phân mảnh: Mỗi quan hệ tổng thể có thể được chia thành các
ph
ần không giao nhau gọi là phân mảnh. Có nhiều cách khác nhau để
phân mảnh như phân mảnh dọc, phân mảnh ngang, phân mảnh hỗn hợp.
Các m
ảnh được mô tả bằng tên của quan hệ tổng thể cùng với chỉ mục
đoạn. Ví dụ
r
i
là đoạn thứ i của quan hệ toàn cục r.
-
Lược đồ định vị: Xác định mảnh dữ liệu nào được định vị tại trạm nào
trên m
ạng. Ký hiệu r
ij
: Cho biết mảnh thứ i của quan hệ tổng thể r được
định vị tr
ên trạm j.
15
Ví dụ một quan hệ toàn cục r chia thành 4 phân mảnh r
1
, r
2
, r
3
, r
4

. Bốn
phân mảnh này được cấp phát dư tại 3 trạm của mạng máy tính, vì thế tạo
nên ba mô hình vật lý r
1
trạm 1, r
2
trạm 2 và r
3
trạm 3 (xem Hình 1.2).
Hình 1.2 Lược đồ định vị cơ sở dữ liệu
Hình 1.3 Kiến trúc cơ sở dữ liệu phân tán
- Lược đồ ánh xạ cục bộ: Thực hiện ánh xạ các ảnh vật lý lên các đối tượng
được thực hiện bởi hệ quản trị cơ sở dữ liệu địa phương
. Tất cả các đoạn
của một quan hệ tổng thể trên cùng một trạm tạo ra một ảnh vật lý.
1.3 Hệ cơ sở dữ liệu phân tán
Hệ cơ cở dữ liệu phân tán (DDBS) là sự kết hợp của hai khái niệm là hệ
cơ sở dữ liệu
và các công nghệ mạng máy tính [15]. Hệ cơ sở dữ liệu đã đưa
chúng ta từ một mô hình xử lý dữ liệu trong đó mỗi ứng dụng xác định và duy
r
1
1

r
1
trạm 1
r
1
2

r
2
1

r
2
trạm 2
r
2
2
r
3
1
r
3
2
r
3
trạm 2
r
3
3
Quan hệ toàn cục Phân mảnh
Định vị
Lư
ợc đồ to
àn c
ục
Lư
ợc đồ phân mảnh

Lược đồ định vị
Lư
ợc đồ ánh xạ cục bộ 1
Lư
ợc đồ ánh xạ cục bộ 2
Lư
ợc đồ ánh xạ cục bộ n
CSDL1 CSDL2 CSDLn
r
1
r
2
r
3
r
4
r
16
trì dữ liệu riêng của mình (xem Hình 1.4) tới một mô hình trong đó dữ liệu được
xác định v
à quản lý tập trung (xem Hình 1.5). Định hướng mới này dẫn đến độc
lập dữ liệu, nhờ đó mà các chương trình ứng dụng không bị ảnh hưởng bởi
những thay đổi lôgic và vật lý trong tổ chức dữ liệu và ngược lại.
Hình 1.4 Xử lý tập tin truyền thống
Hình 1.5 Xử lý cơ sở dữ liệu
Khái niệm hệ cơ sở dữ liệu phân tán ở đây bao gồm cả khái niệm cơ sở dữ
liệu phân tán và hệ quản trị cơ sở dữ liệu phân tán (Distributed Database
Management System - DDBMS). Trong ng
ữ cảnh xử lý phân tán thì DDBMS có
th

ể được xem như những công cụ làm cho quá trình xử lý dữ liệu phân tán dễ
dàng hơn và hiệu quả hơn.
Hệ cơ sở dữ liệu phân tán không đơn thuần bao gồm nhiều file dữ liệu
được tổ chức ri
êng lẻ trên thiết bị nhớ của mạng máy tính. Để tạo một hệ CSDL
phân tán, các tệp tin không chỉ có quan hệ với nhau về mặt lôgic mà còn cần có
một cấu trúc giao diện chung giữa chúng để các tập tin có thể truy cập lẫn nhau
[4].
1.4 Lợi ích của cơ sở dữ liệu phân tán
So với các cơ sở dữ liệu tập trung truyền thống, cơ sở dữ liệu phân tán có
nh
ững ưu điểm sau [15, 16]:
 Tính tự trị cục bộ (Local Autonomy): tất cả dữ liệu trong cơ sở dữ liệu
phân tán được l
àm chủ và quản lý tại mỗi trạm, các trạm không bị phụ
thuộc vào cơ sở dữ liệu tập trung mà chỉ cần cài đặt và thao tác với mỗi cơ
Chương trình 1o
Dữ liệu
Mô t
ả
Chương trình 2
Dữ liệu
Mô t
ả
Chương trình 3o
Dữ liệu
Mô t
ả
Chương trình 1
Chương trình 2

Chương trình 3
Mô tả dữ liệu
Thao tác dữ liệu
….
CSDL
Tệp tin 1
Tệp tin 2
Tệp tin 3
D
ữ
li
ệu
dư
thừ
a
17
sở dữ liệu riêng để đáp ứng nhu cầu công việc. Tính tự trị liên quan dến
tính phân tán của kiểm soát chứ không phải dữ liệu. Nó chỉ ra mức độ mà
các h
ệ quản trị CSDL có thể thao tác một cách độc lập.
 Nâng cao hiệu suất hệ thống (Improved Performance): do việc định vị dữ
liệu làm giảm sự tương tranh giữa CPU và các dịch vụ vào/ra (I/O) và dẫn
đến việc trễ trong các mạng diện rộng
.
 Tăng tính tin cậy (Reliability): là xác suất hệ thống chạy (không dừng) tại
thời điểm xác định.
 Tính sẵn sàng (Availability): là xác suất hệ thống có khả năng vận hành
liên t
ục trong suốt một khoảng thời gian.
 Tính dễ mở rộng (Easier System Expansion): khả năng vận hành của các

cơ sở dữ liệu
phân tán có thể được cải thiện một cách dễ dàng bằng cách
bổ sung thêm các máy tính vào mạng. Việc mở rộng này thường là không
ảnh hưởng đến hệ thống đang chạy và chi phí thấp. Trong môi trường
phân tán, hệ thống có thể kết hợp các máy nhỏ để đạt được sức mạnh
tương đương với sức mạnh của một si
êu máy tính. Các máy tính nhỏ là rẻ
hơn nhiều so với siêu máy tính, và không đ
òi hỏi phải có cơ sở hạ tầng đắt
tiền cho việc cài đặt và bảo vệ.
Yêu cầu cho việc mở rộng không chỉ là mở rộng phần cứng trên mạng mà
nó tr
ải trên các khía cạnh khi thiết kế hệ phân tán. Ví dụ: tần suất sử dụng trên
m
ạng đột ngột, để tránh tình trạng tắc nghẽn xảy ra khi chỉ có một máy chủ
CSDL và phải đáp ứng các yêu cầu truy xuất thì thực hiện nhân bản các dữ liệu
trên một máy chủ khác và hệ thống được thiết kế sao cho việc thêm máy chủ
CSDL được dễ d
àng [9].
1.5 Cơ sở dữ liệu phân tán đồng nhất và không đồng nhất
Trong một hệ cơ sở dữ liệu phân tán đồng nhất (homogeneous distributed
database system), t
ất cả các trạm chạy cùng phần mềm hệ quản trị cơ sở dữ liệu
(DBMS) nhưng hệ điều hành (OS) có thể khác nhau ở các trạm này [10]. Trao
đổi dữ liệu giữa các trạm khác nhau được xử lý dễ dàng (xem Hình 1.6).
18
Hình 1.6 Cơ sở dữ liệu phân tán đồng nhất
Trong cơ sở dữ liệu phân tán không đồng nhất (heterogeneous distributed
database), các tr
ạm chạy phần mềm hệ quản trị cơ sở dữ liệu khác nhau hoặc hệ

thống cơ sở dữ liệu khác nhau [10]. Trong trường hợp này, cần một phần mềm
để hỗ trợ việc trao đổi dữ liệu giữa các trạm (xem
Hình 1.7).
Hình 1.7 Cơ sở dữ liệu phân tán không đồng nhất
Sự khác nhau trong các lược đồ (Schema) thường là một vấn đề lớn cho
việc xử lý truy vấn, trong khi sự khác nhau trong phần mềm trở thành chướng
ngại cho việc xử lý giao dịch để truy xuất đến nhiều trạm khác nhau. Luận văn
tập trung vào cơ sở dữ liệu phân tán đồng nhất.
1.6 Lưu trữ dữ liệu phân tán
Xem xét một quan hệ r được lưu trữ trong cơ sở dữ liệu. Có hai cách tiếp
cận lưu trữ quan hệ này trong cơ sở dữ liệu phân tán là Nhân bản và Phân mảnh.
1.6.1 Nhân bản
Nhân bản (Replication) có nghĩa là hệ thống duy trì nhiều bản sao
(copies) giống hệt nhau của quan hệ và lưu mỗi bản sao tại các trạm khác nhau
[10]. N
ếu quan hệ r được nhân bản, một bản sao của quan hệ r được lưu trữ tại
19
hai hay nhiều trạm. Trong trường hợp xấu nhất, chúng ta có bản sao đầy đủ của
quan hệ, trong đó một bản sao được lưu trữ tại mội trạm trong hệ thống. Có
m
ột vài lợi ích và bất lợi của việc nhân bản:
 Tính sẵn có (Availability): Nếu một trong số những trạm chứa quan hệ bị
hỏng (fail), thì quan hệ r có thể được phục hồi từ trạm khác. Ví thế, hệ
thống có thể tiếp tục xử lý truy vấn liên quan đến r bất chập việc có một
trạm bị hỏng.
 Tăng khả năng xử lý đồng thời (Increased parallelism): Trong phần lớn
các trường hợp, việc truy xuất đến quan hệ
r là chỉ đọc, do đó một vài
trạm có thể xử lý truy vấn đồng thời tới r đáp ứng tốt hơn nhu cầu truy
xuất dữ liệu. Do đó, sao chép dữ liệu giúp giảm thiểu sự di chuyển của dữ

liệu giữa các trạm.
 Chi phí cập nhật tăng (Increased overhead on update): Hệ thống phải đảm
bảo rằng tất cả các bản sao của quan hệ r phải nhất quán, nếu không có
thể dẫn đến tính toán sai. Vì vậy, bất cứ khi nào r được cập nhật, bản cập
nhật phải được phổ biến đến tất cả các trạm có chứa bản sao. Điều này
d
ẫn đến việc tăng chi phí cập nhật. Có thể lấy ví dụ như sau, trong một hệ
thống ngân hàng, thông tin về tài khoản (account information) được nhân
bản tại nhiều trạm khác nhau, điều này là cần thiết để đảm bảo rằng số dư
tài khoản (balance) thống nhất tại tất cả các trạm. Nhưng khi thông tin tài
khoản được cập nhật, thì tất cả các bản sao tại các trạm đều phải được cập
nhật, tức là chi phí cập nhật tăng.
Nhìn chung, nhân bản giúp tăng hiệu suất của các hoạt động đọc và tăng
sự sẵn có của dữ liệu trong giao dịch chỉ đọc. Tuy nhiên, các giao dịch cập nhật
phải chịu chi phí cao hơn. Việc kiểm soát cập nhật đồng thời từ một số giao dịch
tới bản sao dữ liệu trong hệ thống phân tán là phức tạp hơn trong các hệ thống
tập trung. Chúng ta có thể đơn giản hóa việc quản lý các bản sao của quan hệ r
bằng cách chọn một trong số chúng là bản sao chính của r. Ví dụ, trong một hệ
thống ngân hàng, một tài khoản có thể liên kết với trạm mà trong đó tài khoản
đ
ã được mở.
Ví dụ 1.1: Dữ liệu kinh hoanh của công ty có thể được nhân bản tại các trạm tại
SaiGon (dữ liệu mua bán quần áo), tại Huế (dữ liệu mua bán xe hơi), tại UK (dữ
liệu đối tác)
20
Hình 1.8 Khởi tạo bảng Subscriber không đồng nhất trong cơ chế nhân bản
1.6.2 Phân mảnh
Phân mảnh (Fragmentation) tức là hệ thống phân chia các quan hệ thành
nhi
ều mảnh và lưu trữ mỗi mảnh tại các trạm khác nhau. Phân mảnh và nhân

b
ản có thể thực hiện kết hợp: một quan hệ có thể được chia thành nhiều mảnh và
th
ực hiện nhân bản cho mỗi mảnh [10].
Có ba quy t
ắc đảm bảo rằng cơ sở dữ liệu không bị thay đổi ngữ nghĩa
trong quá trình phân mảnh đó là [14]:
 Tính đầy đủ (Completeness): Quan hệ r được phân rã thành các mảnh F
r
= {r
1
, r
2
, , r
n
}, thì mỗi mục dữ liệu có trong quan hệ r sẽ được chứa
trong ít nhất một mảnh r
i
(i=1, , n). Quy tắc này đảm bảo cho các mục
dữ liệu trong r được ánh xạ hoàn toàn vào các mảnh và không bị mất.
Mục dữ liệu có thể hiểu là bộ trong phân mảnh ngang và thuộc tính trong
phân mảnh dọc.
 Tính phục hồi (Reconstruction): Nếu một quan hệ r được phân rã thành
các m
ảnh F
r
= {r
1
, r
2

, ,r
n
} khi đó: r = ∇ r
i
, ∀ r
i
∈ F
r
. Toán tử ∇ thay
đổi tùy theo từng loại phân mảnh, có thể là phép ∪ (phép hợp) đối với
phân mảnh ngang hoặc ⊳⊲ (phép nối) đối với phân mảnh dọc. Khả năng
phục hồi quan hệ từ các mảnh sẽ bảo toàn các phụ thuộc.
 Tính tách biệt (Disjointness): Nếu quan hệ r được phân rã ngang thành
các mảnh F
r
= {r
1
, r
2
, ,r
n
} và mục dữ liệu d
i
nằm trong một mảnh r
i
thì
nó sẽ không nằm trong mảnh r
k
, (k ≠ i). Quy tắc này đảm bảo các mảnh
phân rã rời nhau. Trong trường hợp phân mảnh dọc, khóa chính của quan

hệ phải được lặp lại trong tất cả các mảnh. Vì vậy tính tách biệt trong
phân mảnh dọc được hiểu không liên quan gì đến khóa chính của quan hệ.
1.7 Các bước thiết kế cơ sở dữ liệu phân tán
21
Thiết kế CSDL phân tán liên quan đến việc xác định vị trí của dữ liệu và
chương trình tại các trạm trên mạng máy tính và kể cả việc thiết kế mạng máy
tính đó. Có bốn bước chính để thiết kế một CSDL phân tán bao gồm: Thiết kế
quan niệm, thiết kế lôgic, thiết kế phân đoạn và thiết kế định vị (xem Hình 1.9).
CSDL s
ẽ được thiết kế từ tổng thể đến riêng biệt, phân rã một hệ thống lớn
thành các hệ thống con [9].
Hình 1.9 Các bước thiết kế CSDL phân tán
1.7.1 Thiết kế quan niệm
Thiết kế quan niệm là quá trình thiết kế tổng thể nhằm xác định các kiểu
thực thể và mối liên kết giữa chúng như trong thiết kế tập trung, quá trình này
bao g
ồm phân tích thực thể và phân tích chức năng [15]:
 Phân tích thực thể: nhằm xác định các kiểu thực thể, thuộc tính và liên kết
giữa chúng.
 Phân tích chức năng: xác định các chức năng của hệ thống và đưa ra các
chức năng cơ sở
Kết quả của giai đoạn này là lược đồ khái niệm toàn cục là đầu vào cho
giai đoạn thiết kế tiếp theo.
1.7.2 Thiết kế lôgic
Sau khi có được lược đồ khái niệm toàn cục, bước tiếp theo là thiết kế
lôgic. Giai đoạn này nhằm xác định các quan hệ bằng cách chuyển từ mô hình
th
ực thể liên kết sang lược đồ quan hệ và thực hiện chuẩn hoá các quan hệ.
Nói cách khác, thi
ết kế lôgic có nghĩa là chuyển đổi từ thiết kế khái niệm

thành mô hình bên trong một hệ thống quản lý cơ sở dữ liệu đã đựơc chọn. Đối
với một hệ thống quản lý cơ sở dữ liệu quan hệ, thiết kế lôgic bao gồm việc thiết
kế các bảng, các chỉ số, các giao diện, các chuyển đổi, các thủ tục truy cập thông
tin. Nói cách khác, thiết kế lôgic nghĩa là dịch mô hình khái niệm độc lập với
phần mềm thành các bảng biểu và các ràng buộc cần thiết khi cập nhật dữ liệu.
1.7.3 Thiết kế phân mảnh
Thiết kế quan niệm
Thiết kế lôgic
Thiết kế phân mảnh
Thiết kế định vị
22
Thiết kế phân mảnh nhằm xác định được lược đồ khái niệm cục bộ bằng
cách phân tán các thực thể đến các trạm của hệ thống phân tán. Trong thiết kế
CSDL phân tán, thiết kế phân mảnh là cần thiết bởi một số lý do sau đây [4]:
 Trong các hệ quản trị CSDL, các quan hệ được lưu trữ dưới dạng các
bảng hai chiều. Các thao tác đối với CSDL được thực hiện trên các bảng.
Tuy nhiên trong thực tế, các ứng dụng chỉ yêu cầu thao tác trên các tập
con của các quan hệ, là khung nhìn dữ liệu của người sử dụng. Vì vậy
việc xem tập con của quan hệ là đơn vị truy xuất thông tin để phân tán dữ
liệu là hợp lý.
 Việc phân rã một quan hệ thành nhiều mảnh, mỗi mảnh được xử lý như
một đơn vị dữ liệu, sẽ cho phép thực hiện nhiều giao dịch đồng thời. Đồng
th
ời việc phân mảnh các quan hệ cũng cho phép thực hiện song song một
câu vấn tin bằng cách chia nó thành một tập các câu vấn tin con hoạt tác
trên các mảnh. Vì thế việc phân mảnh sẽ làm tăng mức độ hoạt động đồng
thời và tăng lưu lượng hoạt động của hệ thống.
Quan hệ r trong lược đồ quan hệ toàn cục được phân mảnh được chia
thành các mảnh r
1

, r
2
, , r
n
. Các mảnh này chứa đủ thông tin để có thể
xây dựng lại r từ các mảnh đã phân rã. Quan hệ r được biểu diễn dưới dạng
bảng, việc phân mảnh một quan hệ thành nhiều quan hệ con khác nhau theo các
cách khác nhau, sẽ có các cách phân mảnh tương ứng. Có hai kiểu phân mảnh
tương ứng với việc phân chia quan hệ theo chiều dọc v
à chia quan hệ theo chiều
ngang.
1.7.3.1 Phân mảnh ngang (Horizontal Fragmentation)
Phân mảnh ngang chính là việc chia quan hệ thành nhiều các nhóm bộ tức
là tách các quan hệ ban đầu bằng cách gán cho mỗi bộ của r tới một hoặc nhiều
mảnh. Thực chất đây là phép chọn trong quan hệ, chọn những bộ của quan hệ
thỏa mãn điều kiện cho trước. Có hai loại phương pháp phân mảnh ngang là
[15]:
 Phân mảnh ngang cơ sở: Là phân mảnh ngang được thực hiện trên các vị
từ của chính quan hệ đó.
 Phân mảnh ngang dẫn xuất: Là phân rã một quan hệ dựa trên các vị từ
của quan hệ khác.
Điều kiện phân mảnh ngang là những thông tin cần thiết về cơ sở dữ liệu
và thông tin về ứng dụng.
 Thông tin về CSDL: có liên quan tới lược đồ quan hệ toàn cục, tức là
ph
ải có thông tin đầy đủ và chính xác về lược đồ CSDL quan hệ trước khi
thực hiện phân mảnh ngang. Mối quan hệ giữa các đối tượng trong CSDL
23
thường mô tả bằng các mối quan hệ một - một, một - nhiều và mối quan
hệ nhiều - nhiều. Với mục đích cho thiết kế, đường nối (Link) có hướng

giữa các quan hệ được sử dụng cho việc biểu diễn bởi thao tác nối bằng
(Equijoin).
Ví dụ 1.2: Thông tin về CSDL cho phân mảnh ngang
CHINHANH
TenChiNhanh
DiaChi VonDauTu
TAIKHOAN
SoTaiKhoan
TenChiNhanh SoDu
NGUOIGUI
TenNguoiGui SoTaiKhoan
KHACHHANG
MaKhachHang
TenKhachHang
DiaChiKH
Hình 1.10 Các quan hệ trong cơ sở dữ liệu Ngân hàng(CSDL Banking)
Trong CSDL Banking, giữa CHINHANH và TAIKHOAN là mối quan hệ
một – nhiều được biểu diễn bằng đường nối L1, giữa TAIKHOAN và
NGUOIGUI là m
ối quan hệ một – nhiều được biểu diễn bằng đường nối L2,
tương tự giữa KHACHHANG và NGUOIGUI được biểu diễn bằng đường nối
L3. Như vậy, Owner(L1) = CHINHANH v
à Member(L1) = TAIKHOAN.
 Thông tin về ứng dụng: Để thực hiện phân mảnh, cần phải có thông tin
định tính và thông tin định lượng. Thông tin định tính cơ bản
gồm các vị
từ dùng trong câu truy vấn. Sau đây là các định nghĩa về vị từ đơn giản
(Simple Predicate) và sự kết hợp của các vị cơ đơn giản gọi là vị từ hội sơ
cấp (Minterm Predicate) như sau:
Cho quan hệ r(R

1
, R
2
, ,R
n
), trong đó R
i
là thuộc tính được định nghĩa
trên một miền biến thiên D
i
, một vị từ đơn giản P
j
được định nghĩa trên r
có dạng:
P
j
: R
i
θ Value
Trong đó θ thuộc {=, <, ≠, ≤, >, ≥} và Value được chọn từ miền R
i
(Value
∈ D
i
). Chúng ta sử dụng Pr
i
để biểu thị tập tất cả các vị từ đơn giản được định
nghĩa trên quan hệ r
i
. Các phần tử của Pr

i
được ký hiệu là p
ij
.
Ví dụ 1.3: Trên quan hệ TAIKHOAN
TenChiNhanh = “Hillside”
SoDu
≥ 10000000
L1
L2
L3
là các vị từ đơn giản
24
Trong thực tế các câu truy vấn là tổ hợp của rất nhiều vị từ đơn giản, Mỗi
tổ hợp được gọi là một vị từ hội sơ cấp. Cho tập Pr
i
= {p
i1
, p
i2
, , p
im
} là các vị
từ đơn giản trên quan hệ r
i
, tập các vị từ hội sơ cấp M
i
= {m
i1
, m

i2
, , m
iz
} được
định nghĩa như sau:
M
i
=

m
ij
m
ij
= ∧ p
ik
∗

1 ≤  ≤ m,1 ≤  ≤ z
Trong đó, 

∗
= p
ik
hoặc 

∗
= ¬p
ik
. Vì thế mỗi vị từ đơn giản có thể xuất
hiện trong vị từ hội sơ cấp dưới dạng tự nhiên hoặc dạng phủ định của nó. Phủ

định của một vị từ sẽ có thể có nhưng dạng như sau:
Attribute = Value không có phủ định
Attribute ≤ Value, phủ định là Attribute > Value
C
ận_dưới ≤ Attribute_1, phủ định là ¬(Cận_dưới ≤ Attribute_1)
Attribute_1 ≤ Cận_trên, phủ định là ¬(Attribute_1 ≤ Cận_trên)
C
ận_dưới ≤ Attribute_1 ≤ Cận_trên, phủ định là
¬(Cận_dưới ≤ Attribute_1 ≤ Cận_trên)
Ví dụ 1.4: Xét một số vị từ đơn giản có thể định nghĩa được trên quan hệ
TAIKHOAN.
p
1
: TenChiNhanh = “Hillside”
p
2
: TenChiNhanh = “Valleyview”
p
3
: SoDu ≤ 30000000
p
4
: SoDu > 10000000
M
ột vài vị từ hội sơ cấp được định nghĩa dựa trên các vị từ đơn giản bao gồm:
m
1
: TenChiNhanh = “Hillside” ∧ TenChiNhanh = “Valleyview”
m
2

: TenChiNhanh = “Hillside” ∧ ¬TenChiNhanh = “Valleyview”
m
3
: TenChiNhanh = “Hillside” ∧ SoDu ≤ 30000000
m
4
: TenChiNhanh = “Hillside” ∧ ¬SoDu ≤ 30000000
m
5
: TenChiNhanh = “Hillside” ∧ SoDu > 10000000
m
6
: TenChiNhanh = “Hillside” ∧ ¬SoDu > 10000000
m
7
: TenChiNhanh = “Valleyview” ∧ SoDu ≤ 30000000
m
8
: TenChiNhanh = “Valleyview” ∧¬SoDu ≤ 30000000
m
9
: TenChNhanh = “Valleyvew” ∧ SoDu > 10000000
m
10
: TenChNhanh = “Valleyvew”∧ ¬SoDu > 10000000
m
11
: SoDu ≤ 30000000 ∧ SoDu > 10000000
m
12

: SoDu ≤ 30000000 ∧ ¬SoDu > 10000000
m
13
: TenChiNhanh = “Hillside” ∧ TenChiNhanh = “Valleyview” ∧ SoDu
≤ 30000000
m
14
: TenChiNhanh = “Hillside” ∧ ¬TenChiNhanh = “Valleyview” ∧
SoDu ≤ 30000000
p
ik
∈
Pr
i
25
m
15
: TenChiNhanh = “Hillside” ∧ TenChiNhanh = “Valleyview” ∧
¬SoDu ≤ 30000000
m
16
: ¬TenChiNhanh = “Hillside” ∧ TenChiNhanh = “Valleyview” ∧
SoDu ≤ 30000000
Sau khi lo
ại bỏ các vị từ hội sơ cấp vô lý, chúng ta có thể nhận được các
vị từ hội sơ cấp có ý nghĩa, chẳng hạn:
m
3
: TenChiNhanh = “Hillside” ∧ SoDu ≤ 30000000
m

5
: TenChiNhanh = “Hillside” ∧ SoDu > 10000000
m
7
: TenChiNhanh = “Valleyview” ∧ SoDu ≤ 30000000
m
9
: TenChNhanh = “Valleyvew” ∧ SoDu > 10000000
a) Phân m
ảnh ngang cơ sở
Phân mảnh ngang cơ sở được định nghĩa bằng phép chọn trên quan hệ
đích của lược đồ
CSDL. Cho quan hệ r, các mảnh ngang,
r
i
= 


(r) , i: 1 n
Trong đó F
i
là biểu thức đại số quan hệ. Nếu F
i
có dạng chuẩn hội, thì nó
là v
ị từ hội sơ cấp (m
i
) [4, 15].
Ví dụ 1.5: Phân mảnh ngang cơ sở quan hệ TAIKHOAN thành hai quan hệ
TAIKHOAN

1
và TAIKHOAN
2
thỏa mãn điều kiện: TenChiNhanh = “Hillside”
và TenChiNhanh = “Valleyview”
như sau:

i  “Hisid”
(TAIKHOAN)

i  “i”
(TAIKHOAN)
Như vậy TAIKHOAN
1
và TAIKHOAN
2
sẽ có các bộ tương ứng như sau:
TAIKHOAN
1
TenChiNhanh SoTaiKhoan SoDu
Hillside
A
-
305
500
Hillside
A
-
226
336

Hillside A-155 62
TAIKHOAN
2
TenChiNhanh SoTaiKhoan SoDu
Valleyview A-177 205
Valleyview A-402 10000
Valleyview A-408 1123
Valleyview A-639 750
Hình 1.11 Phân mảnh ngang quan hệ TAIKHOAN
Phân mảnh ngang thường được sử dụng để phân bố dữ liệu tại nơi mà nó
được sử dụng nhiều
nhất, điều này sẽ giúp giảm thiểu dữ liệu phải truyền tải trên
môi trường mạng.

Nghiên cứu tối ưu truy vấn trong cơ sở dữ liệu phân tán

Trích đoạn

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về