Tải bản đầy đủ (.doc) (114 trang)

NGHIÊN CỨU CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG THIẾT KẾ HỆ THỐNG BÁN VÉ MÁY BAY.

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.61 MB, 114 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG

NGUYỄN QUỐC VƯƠNG

NGHIÊN CỨU CƠ SỞ DỮ LIỆU PHÂN TÁN
VÀ ỨNG DỤNG THIẾT KẾ HỆ THỐNG BÁN
VÉ MÁY BAY

LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng - 2010


BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG

NGUYỄN QUỐC VƯƠNG

NGHIÊN CỨU CƠ SỞ DỮ LIỆU PHÂN TÁN
VÀ ỨNG DỤNG THIẾT KẾ HỆ THỐNG BÁN
VÉ MÁY BAY

Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số:
60.48.01

LUẬN VĂN THẠC SĨ KỸ THUẬT

Người hướng dẫn khoa học: PGS.TSKH. Trần Quốc Chiến


Đà Nẵng - 2010


i


i

Tôi xin cam đoan:

LỜI CAM ĐOAN

1. Những nội dung trong luận văn này là do tôi thực hiện dưới sự hướng dẫn
trực tiếp của PGS.TSKH Trần Quốc Chiến.
2. Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng và trung thực
tên tác giả, tên công trình, thời gian, địa điểm công bố.

3.

Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá,
tôi xin chịu hoàn toàn trách nhiệm.
Tác giả

Nguyễn Quốc Vương


ii

MỤC LỤC
Trang



ii

Lời cam đoan………………………………………………………………………...i
Mục lục……………………………………………………………………………...ii
Danh mục các từ viết tắt………………………………………………………… vi
Danh mục các bảng biểu……………………………………………………….…..vii
Danh mục các hình vẽ………………………………………………………...…...viii
Mở đầu:………………………………………………………………………….…..1
CHƯƠNG 1. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN.........................4
1.1. Cơ sở dữ liệu phân tán.................................................................................... 4
1.1.1. Định nghĩa.................................................................................................... 4
1.1.2. Các đặc trưng của cơ sở dữ liệu phân tán.....................................................5
1.2. Hệ quản trị cơ sở dữ liệu phân tán................................................................. 6
1.2.1. Định nghĩa.................................................................................................... 6
1.2.2. Các thành phần của hệ quản trị cơ sở dữ liệu phân tán.................................. 6
1.3.So sánh cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung............................. 7
1.3.1. Điều khiển tập trung..................................................................................... 7
1.3.2. Độc lập dữ liệu............................................................................................. 8
1.3.3. Giảm dư thừa dữ liệu...................................................................................8
1.3.4. Biệt lập và bảo mật....................................................................................... 9
1.4. Các hình thức tổ chức hệ thống phân tán...................................................... 9
1.4.1. Mô hình Peer-to-peer................................................................................... 9
1.4.2. Mô hình File Server................................................................................... 10
1.4.3. Mô hình Client/Server................................................................................ 11
1.5.Các đặc trưng của các loại hình hệ thống phân tán...................................... 11
1.5.1. Đặc trưng của hệ thống File server và kiến trúc Client/Server.....................11
1.5.2. Các chức năng của kiến trúc Client/Server................................................. 12
1.5.2.1. Trình diễn thông tin phân tán.............................................................. 12

1.5.2.2. Trình diễn từ xa................................................................................... 13


ii

1.5.2.3. Quản lý dữ liệu từ xa.......................................................................... 13
1.5.2.4. Phân tán chức năng............................................................................. 14
1.6. Ưu và nhược điểm của hệ phân tán.............................................................. 14
1.7. Các loại truy xuất CSDL phân tán............................................................... 15
1.7.1. Truy xuất từ xa thông qua các tác vụ cơ bản.............................................. 15
1.7.2. Truy xuất từ xa thông qua chương trình phụ trợ.........................................15
1.8. Các mức trong suốt của cơ sở dữ liệu phân tán........................................... 16
1.8.1. Kiến trúc cơ bản của một cơ sở dữ liệu phân tán........................................ 16
1.8.1.1. Sơ đồ tổng thể (Global Schema)......................................................... 17
1.8.1.2. Sơ đồ phân đoạn (Fragment schema).................................................. 17
1.8.1.3. Sơ đồ định vị (Allocation schema)...................................................... 18
1.8.1.4. Sơ đồ ánh xạ địa phương (Local mapping schema)............................18
1.8.2. Các đặc điểm chính của hệ phân tán.......................................................... 20
1.8.2.1. Chia sẻ tài nguyên............................................................................... 20
1.8.2.2. Tính mở.............................................................................................. 20
1.8.2.3. Khả năng song song............................................................................ 21
1.8.2.4. Khả năng mở rộng.............................................................................. 21
1.8.2.5. Khả năng thứ lỗi................................................................................. 21
1.8.2.6. Đảm bảo tin cậy và nhất quán............................................................. 22
1.8.3. Tính trong suốt phân tán............................................................................ 22
CHƯƠNG 2. THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN.................................. 26
2.1. Nội dung thiết kế một hệ thống phân tán..................................................... 26
2.1.1. Các công việc cần phải làm để thiết kế hệ thống phân tán...........................26
2.1.2. Các sản phẩm yêu cầu sau khi phân tích thiết kế....................................... 27
2.2. Các chiến lược phân tán dữ liệu................................................................... 27

2.2.1. Tập trung dữ liệu........................................................................................ 27
2.2.2. Chia nhỏ dữ liệu......................................................................................... 28
2.2.3. Sao lặp dữ liệu............................................................................................ 28
2.2.4. Phương thức lai..........................................................................................28


ii

2.3. Phương pháp thiết kế CSDL phân tán......................................................... 28
2.3.1. Sơ đồ thiết kế tổng thể cơ sở dữ liệu phân tán............................................ 28
2.3.2. Các phương pháp thiết kế CSDL phân tán.................................................29
2.3.2.1. Phương pháp thiết kế từ trên xuống (top- down)................................29
2.3.2.2. Phương pháp thiết kế từ dưới lên (bottom - up)..................................32
2.4. Các vấn đề thiết kế phân tán........................................................................ 33
2.4.1. Các lý do phân mảnh.................................................................................. 33
2.4.2. Các kiểu phân mảnh................................................................................... 34
2.4.3. Mức độ phân mảnh.................................................................................... 34
2.4.4. Các quy tắc phân mảnh.............................................................................. 35
2.4.5. Các kiểu cấp phát....................................................................................... 36
2.4.6. Các yêu cầu thông tin................................................................................. 37
2.5. Phương pháp phân mảnh.............................................................................. 37
2.5.1. Phân mảnh ngang....................................................................................... 38
2.5.1.1. Phân mảnh ngang nguyên thủy........................................................... 40
2.5.1.2. Phân mảnh ngang dẫn xuất................................................................. 40
2.5.2. Phân mảnh dọc........................................................................................... 41
2.5.3. Phân mảnh hỗn hợp.................................................................................... 42
2.6. Cấp phát......................................................................................................... 43
2.6.1. Bài toán cấp phát........................................................................................ 43
2.6.2. Yêu cầu về thông tin.................................................................................. 45
2.6.3. Mô hình cấp phát........................................................................................ 47

CHƯƠNG 3. THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN CHO HỆ THỐNG
BÁN VÉ MÁY BAY VÀ TRIỂN KHAI ỨNG DỤNG........................................51
3.1. Phát biểu bài toán.......................................................................................... 51
3.2. Phân tích hệ thống thông tin......................................................................... 51
3.2.1. Mức ra quyết định...................................................................................... 52
3.2.2. Mức trung gian (mức xử lý, trung chuyển thông tin)................................... 53
3.2.3. Mức tác nghiệp (mức thực hiện)................................................................ 53


ii

3.3. Phân tích chức năng...................................................................................... 53
3.3.1. Phân hệ quản lý chuyến bay....................................................................... 53
3.3.2. Phân hệ quản lý vé..................................................................................... 54
3.3.3. Phân hệ quản lý đại lý................................................................................ 54
3.3.4. Phân hệ quản lý hành khách....................................................................... 54
3.4. Phân tích thực thể.......................................................................................... 54
3.5.Thiết kế cơ sở dữ liệu phân tán cho hệ thống bán vé máy bay....................57
3.5.1. Thiết kế sơ đồ tổng thể của hệ thống.......................................................... 57
3.5.2. Thiết kế phân mảnh.................................................................................... 58
3.5.3. Thiết kế định vị.......................................................................................... 61
3.5.4. Thiết kế sơ đồ ánh xạ địa phương..............................................................62
3.5.5. Thiết kế vật lý tại các trạm......................................................................... 62
3.6. Quản trị cơ sở dữ liệu phân tán cho hệ thống bán vé máy bay....................67
3.6.1. Xây dựng hệ thống mạng cho hệ thống...................................................... 67
3.6.2. Khả năng quản trị cơ sở dữ liệu phân tán của Oracle................................... 69
3.6.2.1. Quản lý tên cơ sở dữ liệu toàn cục trong cơ sở dữ liệu phân tán.........69
3.6.2.2. Tạo các liên kết cơ sở dữ liệu trong hệ thống CSDL phân tán............69
3.6.2.3. Giải quyết vấn đề trong suốt vị trí trong ORACLE............................. 72
3.6.2.4. Bản sao trong cơ sở dữ liệu phân tán của Oracle................................ 80

3.7. Triển khai ứng dụng...................................................................................... 83
3.7.1. Cài đặt chương trình...................................................................................83
3.7.2. Đánh giá kết quả........................................................................................ 84
KẾT LUẬN............................................................................................................ 85
TÀI LIỆU THAM KHẢO..................................................................................... 87


3


4

DANH MỤC CÁC TỪ VIẾT TẮT
Tiếng anh
DBMS

Database Management System

DDBMS

Distributed database management system

RD

Remote Database

SQL

Structured Query Language


CPU

Central Processing Unit

LAN

Local Area NetWork

Tiếng việt
CSDL

Cơ sở dữ liệu

CNTT

Công nghệ thông tin


vii

DANH MỤC CÁC BẢNG BIỂU
Số hiệu
bảng vẽ

Tên bảng biểu

Trang

1.1.


Đặc trưng của File Server và Client/Server

12

1.2.

Trình diễn thông tin phân tán ở Client và Server

12

1.3.

Trình diễn từ xa ở Client và Server

13

1.4.

Quản lý dữ liệu từ ở Client và Server

13

1.5.

Phân tán chức năng ở Client và Server

14

3.1.


Bảng phân tích tần suất và nhu cầu khai thác dữ liệu

58

3.2.

Danh mục các bảng dữ liệu của hệ thống bán vé máy bay

63


viii

DANH MỤC CÁC HÌNH VẼ
Số hiệu hình vẽ

Tên hình vẽ

Trang

1.1.

Mô hình CSDL phân tán

4

1.2.

Các thành phần của một DDBMS thương mại


7

1.3.

Mô hình Peer-to-peer

10

1.4.

Mô hình File Server

10

1.5.

Mô hình Client Server

11

1.6.

Sơ đồ truy xuất từ xa thông qua các tác vụ cơ bản

15

1.7.

Sơ đồ truy xuất từ xa thông qua chương trình phụ trợ


16

1.8.

Kiến trúc cơ bản của CSDL phân tán

17

1.9.

Các đoạn và hình ảnh vật lý của một quan hệ tổng thể

19

1.10.

Trong suốt phân đoạn

23

1.11.

Sự trong suốt về vị trí

24

1.12.

Sự trong suốt ánh xạ địa phương


25

2.1.

Sơ đồ thiết kế tổng thể

29

2.2.

Sơ đồ thiết kế CSDL phân tán theo mô hình từ trên xuống

31

3.1.

Mô hình thực thể quan hệ

56

3.2.

Sơ đồ tổng thể của hệ thống

57

3.3.

Sơ đồ định vị của các mảnh tại các vị trí


61

3.4.

Các đoạn và hình ảnh vật lý của một quan hệ tổng thể

62

3.5.

Mô hình mạng của hệ thống bán vé máy bay

68

3.6.

Giao diện Quản trị CSDL phân tán

83

3.7.

Giao diện thao tác với người sử dụng cuối trên Internet

84


1

MỞ ĐẦU

Trong thời đại của xã hội công nghệ thông tin và nền kinh tế tri thức, mọi hoạt
động của các tổ chức muốn đạt hiệu quả cao, giành được thắng lợi trong thế cạnh
tranh gay gắt thì nhất thiết phải có những phương pháp để có được những thông tin,
tri thức cần thiết một cách nhanh và chính xác nhất.
Đối với các hệ thống lớn thì vấn đề xử lý thông tin nhanh cho kết quả chính
xác là vấn đề được quan tâm. Quá trình xử lý thông tin trong các hệ thống lớn hoạt
động trên hệ thống mạng, để tăng tốc độ xử lý thì không những xây dựng hạ tầng
mạng có đường truyền lớn, mà chúng ta cần phải nghĩ đến việc phân tán dữ liệu như
thế nào trong hệ thống bởi vì nó quyết rất lớn đến kết quả xử lý thông tin. Do vậy
với cùng một hạ tầng mạng có tốc độ đường truyền như nhau nếu hệ thống đặt cơ sơ
dữ liệu phân tán thành nhiều nơi thì quá trình xử lý thông tin cho kết quả nhanh hơn
quá trình xử lý thông tin mà hệ thống đặt cơ sở dữ liệu tại một nơi. Chính vì những
lý do trên, chúng ta cần phải nghiên cứu về cơ sở dữ liệu làm thế nào để phân tán dữ
liệu ra nhiều nơi dựa vào tần suất sử dụng và khoảng cách địa lý của các đối tượng
khai thác dữ liệu để hệ thống xử lý thông tin cho kết quả nhanh đáp ứng được sự
chờ đợi của người sử dụng.
Trong thời gian qua Tôi đã nghiên cứu các hệ thống, đặc biệt là hệ thống bán
vé máy bay đây là hệ thống lớn vì có đối tượng sử dụng rộng, do vậy vấn đề phân
tán cơ sở dữ liệu là vấn đề cấp bách cần được nghiên cứu và triển khai.
Từ những lý do trên cùng với thời gian tìm hiểu về hệ thống bán vé máy bay
của hãng hàng không Việt nam Airlines khi khách hàng xem thông tin về chuyến
bay cũng như mua vé thì phải chờ đợi hệ thống xử lý rất lâu và thường xảy ra nghẽn
mạng.
Xuất phát từ ý tưởng là muốn tìm hiểu về cơ sở dữ liệu phân tán làm cơ sở lý
thuyết để xây dựng một hệ thống bán vé máy bay phục vụ cho việc xem thông tin
về chuyến bay cũng như việc mua vé của hành khách một cách thuận lợi và cho kết


2


quả nhanh nhất. Đó là lý do mà tôi chọn đề tài này.
Mục tiêu mà đề tài hướng đến là trình bày được tổng quan về cơ sở dữ liệu
phân tán, thiết kế phân cơ sở dữ liệu phân tán đặc biệt ứng dụng được thiết kế sơ sở
dữ liệu phân tán cho hệ thống bán vé máy bay và triển khai ứng dụng trên hệ thống
mạng. Để đáp ứng được mục tiêu đặt ra, thì đề tài cần giải quyết những vấn đề
chính sau: tìm hiểu về lý thuyết cơ sở dữ liệu phân tán, thiết kế cơ sở dữ liệu phân
tán; thu thập thông tin và nghiên cứu quy trình hoạt động của hệ thống bán vé máy
bay của hãng hàng không Việt Nam Airlines để phân tích thiết kế hệ thống; thiết kế
cơ sở dữ liệu phân tán cho hệ thống, nghiên cứu công cụ để quản trị cơ sở dữ liệu
phân tán, nghiên cứu các công cụ để thiết kế giao diện và triển khai được trên môi
trường mạng phục vụ cho nhiều đối tượng sử dụng của hệ thống một cách hiệu quả
nhất.
Đối tượng nghiên cứu của đề tài gồm: Nghiên cứu về cơ sở dữ liệu phân tán;
thiết kế cơ sở dữ liệu phân tán như: các vấn đề về thiết kế phân tán, các phương
pháp thiết kế phân tán, phương pháp phân mảnh, cấp phát cho các mảnh, …. Tìm
hiểu hệ thống bán vé máy bay của hãng hàng không Việt Nam Airlines. Ứng dụng
lý thuyết thiết kế cơ sở dữ liệu phân tán vào hệ thống. Ứng dụng khả năng quản trị
cơ sở dữ liệu phân tán của Oracle vào hệ thống.
Để thực hiện được mục tiêu và nhiệm vụ đặt ra trong đề tài này, tôi áp dụng hai
phương pháp nghiên cứu đó là: phương pháp nghiên cứu lý thuyết và phương pháp
nghiên cứu thực nghiệm. Đối với phương pháp nghiên cứu lý thuyết: Tôi tiến hành
nghiên cứu và thu thập các tài liệu liên quan đến cơ sở dữ liệu phân tán, thiết kế cơ
sở dữ liệu phân tán, các công cụ có thể triển khai quản trị cơ sở dữ liệu phân tán,
các công cụ thiết kế giao diện chạy được trên hệ thống mạng. Tiếp đến Tôi thu thập
các tài liệu liên quan đến các hệ thống bán vé máy bay tại Việt Nam. Đối với
phương pháp nghiên cứu thực nghiệm: Tôi phân tích yêu cầu thực tế của hệ thống
và để xác định được các chức năng, quy trình hoạt động của hệ thống. Tiếp theo vận
dụng các cơ sở lý thuyết liên quan như cơ sở dữ liệu phân tán, thiết kế cơ sở dữ liệu



3

phân tán vào thiết kế hệ thống, sử dụng công cụ Oracle để quản trị cơ sở dữ liệu
phân tán và công cụ thiết kế giao diện và cuối cùng là đánh giá kết quả đạt được.
Đề tài đã đạt được một số kết quả như sau: đề tài đã trình bày một cách hệ
thống, chi tiết theo hướng thực nghiệm là một tài liệu cần thiết, bổ ích cho những
người muốn tìm hiểu, thiết kế cơ sở dữ liệu phân tán và triển khai ứng dụng phân
tán. Qua kết quả thực nghiệm, bước đầu cài đặt ứng dụng đã cho kết quả khả quan.
Trong tương lai dựa vào lý thuyết thiết kế cơ sở dữ liệu phân tán này có thể ứng
dụng vào các hệ thống lớn và có đối tượng sử dụng rộng.
Với những mục tiêu nhiệm vụ và ý nghĩa đã được nêu ra ở trên, tôi đặt tên cho
đề tài là:

“NGHIÊN CỨU CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ
ỨNG DỤNG THIẾT KẾ HỆ THỐNG BÁN VÉ MÁY BAY”
Báo cáo luận văn được tổ chức thành 3 chương: Trong chương 1, tôi trình bày
các vấn đề liên quan đến cơ sở dữ liệu phân tán, đặc biệt làm rõ ưu và nhược điểm
của cơ sở dữ liệu phân tán, các mô hình có thể triển khai hệ thống phân tán, các loại
truy xuất, các mức trong suốt của cơ sở dữ liệu phân tán. Chương 2, trình bày các
chiến lược phân tán, các phương pháp thiết kế, các vấn đề thiết kế, các phương
pháp phân mảnh, cấp phát cho các mảnh. Chương 3, trình bày quy trình thiết kế cơ
sở dữ liệu phân tán cho hệ thống bán vé máy bay; trình bày công cụ quản trị cơ sở
dữ liệu phân tán, công cụ thiết kế giao diện triển khai được trên hệ thống mạng.


4

CHƯƠNG 1. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN
Trong chương này Tôi sẽ trình bày những vấn đề liên quan đến cơ sở dữ liệu
phân tán. Nội dung của chương bao gồm giới thiệu cơ sở dữ liệu phân tán, hệ quản

trị cơ sở dữ liệu phân tán, các đặc trưng của cơ sở dữ liệu phân tán, so sánh cơ sở dữ
liệu phân tán với cơ sở dữ liệu tập trung, các hình thức tổ chức hệ thống phân tán,
các đặc trưng của các loại hình hệ thống phân tán, ưu điểm, nhược điểm, các loại
truy xuất, các mức trong suốt của cơ sở dữ liệu phân tán.
1.1.Cơ sở dữ liệu phân tán
1.1.1. Định nghĩa
Cơ sở dữ liệu (CSDL) phân tán là một tập hợp nhiều cơ sở dữ liệu có liên quan
logic và được phân bố trên một mạng máy tính.
Trong cơ sở dữ liệu phân tán có hai vấn đề quan trọng và tương đương nhau là:
Việc phân tán: Trong thực tế dữ liệu không đặt trên cùng một vị trí vì vậy đây
là đặc điểm để phân biệt cơ sở dữ liệu phân tán với cơ sở dữ liệu tập trung.
Liên quan logic: Trong cơ sở dữ liệu phân tán dữ liệu có một số đặc tính liên
kết chặt chẽ với nhau như tính kết nối, tính liên quan logic. Trong cơ sở dữ liệu
phân tán mỗi vị trí chỉ quản lý một cơ sở dữ liệu và người sử dụng phải truy cập đến
cơ sở dữ liệu ở những vị trí khác để lấy thông tin tổng hợp.


5

1.1.2. Các đặc trưng của cơ sở dữ liệu phân tán
Đặc tính vô hình là sự tách biệt về ngữ nghĩa ở mức độ cao của hệ thống với
các vấn đề cài đặt ở cấp độ thấp. Ưu điểm của hệ cơ sở dữ liệu vô hình là không cho
người dùng “nhìn thấy” các chi tiết cài đặt, hỗ trợ phát triển cho các ứng dụng phức
tạp.
Độc lập dữ liệu là dạng vô hình cơ bản cần có trong một hệ cơ sở dữ liệu. Sự
độc lập dữ liệu liên quan đến khả năng “miễn nhiễm” của các ứng dụng đối với
những thay đổi trong định nghĩa, tổ chức dữ liệu và ngược lại.
Vô hình kết mạng: Trong môi trường phân tán, hệ thống mạng là một loại tài
nguyên quan trọng cần quản lý. Thông thường, người dùng cần được tách khỏi mọi
chi tiết hoạt động của mạng, thậm chí người ta mong muốn che dấu sự tồn tại của

mạng nếu được. Khi đó đối với người dùng sẽ không thấy sự khác biệt giữa các ứng
dụng chạy trên cơ sở dữ liệu tập trung và các ứng dụng chạy trên cơ sở dữ liệu phân
tán. Kiểu vô hình này gọi là vô hình kết mạng (network transparency) hoặc vô hình
phân bổ (distribution transparency).
Vô hình nhân bản: Vì những lý do về hiệu năng (performance), độ tin cậy
(reliability) và tính sẵn sàng (availability), người ta mong muốn có thể nhân dữ liệu
thành nhiều bản (nhân bản) trên các máy mạng. Việc nhân bản giúp tăng hiệu năng
vì những yêu cầu sử dụng có xung đột và nằm rải rác có thể đáp ứng kịp thời. Ví dụ,
dữ liệu thường được một người truy xuất có thể được đặt tại máy của người đó và
trên máy của những người khác có cùng nhu cầu truy xuất, như thế sẽ làm tăng khu
vực truy xuất. Ngoài ra nếu một máy phải ngưng hoạt động, một bản sao khác của
dữ liệu vẫn có sẵn trên máy khác của mạng. Tuy nhiên việc nhân bản sẽ gây khó
khăn khi cập nhật cơ sở dữ liệu. Vì vậy việc nhân bản và qui mô nhân bản do các
ứng dụng quyết định.
Vô hình phân mảnh: Phân hoạch dữ liệu cho các vị trí khác nhau là yêu cầu tất
yếu của hệ phân tán, quá trình này gọi là quá trình phân mảnh (fragmentation). Có
hai kiểu phân mảnh: Phân mảnh ngang (horizontal fragmentation), trong đó mỗi


6

quan hệ được phân hoạch thành tập các quan hệ con, mỗi quan hệ con này chứa một
tập con các bộ của quan hệ ban đầu. Phân mảnh dọc (vertical fragmentation), trong
đó mỗi quan hệ được phân hoạch thành tập các quan hệ con, mỗi quan hệ con này
được định nghĩa trên một tập con các thuộc tính của quan hệ ban đầu.
Khi các đối tượng cơ sở dữ liệu bị phân mảnh, chiến lược xử lý vấn tin là dựa
trên các mảnh chứ không phải quan hệ. Như vậy câu vấn tin toàn cục (global query)
phải được dịch thành câu vấn tin theo mảnh (fragment query) [1].
1.2. Hệ quản trị cơ sở dữ liệu phân tán
1.2.1. Định nghĩa

Hệ quản trị cơ sở dữ liệu phân tán (Distributed database management system DDBMS) là một hệ thống phần mềm cho phép quản lý các hệ cơ sở dữ liệu phân
tán và làm cho việc phân tán trở nên vô hình đối với người sử dụng.
1.2.2. Các thành phần của hệ quản trị cơ sở dữ liệu phân tán
Trong một hệ quản trị cơ sở dữ liệu phân tán thương mại phải có các thành
phần sau:
Phần quản trị dữ liệu ( Database management – DB)
Phần truyền thông dữ liệu (Data Communication – DC)
Phần từ điển dữ liệu (Data Dictionary - DD): Dùng để mô tả thông tin về sự
phân tán của dữ liệu trên mạng
Phần cơ sở dữ liệu phân tán (Distributed Database - DDB)


7

T

Local
Database 1

Local
Database 2

T

T

DC

DB


DDB
DD

S
it
eS
1it
e
2

DD

DDB
DB

T
Trong đó, T: Terminal

DC

T

T

Hình 1.2. Các thành phần của một DDBMS thương mại
1.3. So sánh cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung
Nhận xét: CSDL phân tán không đơn giản là những sự thực hiện phân tán của
CSDL tập trung, bởi vì chúng cho phép thiết kế các đặc trưng khác với CSDL tập
trung truyền thống.
Các đặc điểm tiêu biểu của CSDL truyền thống gồm: Điều khiển tập trung,

độc lập dữ liệu, giảm dư thừa dữ liệu, biệt lập và bảo mật dữ liệu [3].
1.3.1. Điều khiển tập trung
Trong CSDL tập trung: Khả năng điều khiển tập trung trên toàn nguồn tài
nguyên thông tin của tổ chức, được xem là động cơ mạnh nhất cho việc ra đời
CSDL. Chúng được phát triển như là sự tiến hoá của hệ thống thông tin mà trong đó
mỗi ứng dụng có các tập tin riêng của nó.
Trong CSDL phân tán: Ý niệm về điều khiển tập trung ít được nhấn mạnh


8
hơn, điều này phụ thuộc vào kiến trúc của CSDL phân tán.


9

Một cách tổng quát, CSDL phân tán được điều khiển với cấu trúc phân lớp
dựa vào một hệ quản trị CSDL toàn cục (có trách nhiệm trên toàn bộ CSDL phân
tán) và hệ quản trị CSDL địa phương (có trách nhiệm với CSDL địa phương riêng).
Điều này cho thấy rằng hệ quản trị CSDL địa phương có thể có một mức tự trị cao.
Các CSDL phân tán có thể rất khác nhau về mức độ tự trị: từ hoàn toàn tự trị, không
có bất cứ một hệ quản trị CSDL tập trung nào, đến hầu như hoàn toàn điều khiển
tập trung
1.3.2. Độc lập dữ liệu
Độc lập dữ liệu cũng là một trong những động lực cho việc mở đầu sự tiếp cận
dữ liệu phân tán. Thuận lợi chính của độc lập dữ liệu là các chương trình không bị
ảnh hưởng bởi sự thay đổi trong cấu trúc vật lý của dữ liệu.
Trong CSDL phân tán, độc lập dữ liệu cũng quan trọng giống như trong CSDL
truyền thống. Tuy nhiên, một khía cạnh mới được thêm vào trong ý niệm của độc
lập dữ liệu là trong suốt phân tán.
Với trong suốt phân tán chúng ta hiểu rằng các chương trình ứng dụng có thể

sử dụng CSDL như là nó không được tổ chức phân tán. Vì thế sự chính xác của
chương trình không bị ảnh hưởng bởi việc dịch chuyển dữ liệu từ trạm này đến trạm
khác, tuy nhiên tốc độ thực hiện của chúng bị ảnh hưởng.
1.3.3. Giảm dư thừa dữ liệu
Trong CSDL truyền thống, dữ liệu dư thừa được giảm đến mức tối thiểu bởi
hai lý do:
Sự không tương thích giữa nhiều bản sao của cùng một tập dữ liệu.
Tiết kiệm không gian lưu trữ bằng cách loại bỏ các dư thừa. Việc giảm dư
thừa dữ liệu có thể đạt được bằng cách chia sẻ dữ liệu cho phép nhiều ứng dụng truy
cập cùng các bản tin và bản ghi.
Trong CSDL phân tán, việc giảm dư thừa phức tạp hơn vì ngoài hai lý do trên
còn nhiều lý do để giảm dư thừa như:


10

Hoạt động của các trình ứng dụng có thể bị tăng lên khi dữ liệu được sao lại
tất cả các vị trí nơi trình ứng dụng cần nó.
Tính thường trực của hệ thống sẽ tăng lên bởi vì khi có lỗi xảy ra ở một trạm
nào đó sẽ không dừng việc thực hiện các ứng dụng của trạm khác nếu dữ liệu đã
được sao chép lại.
1.3.4. Biệt lập và bảo mật
Trong CSDL truyền thống, hệ quản trị cơ sở dữ liệu tập trung có thể bảo đảm
chỉ truy cập đến dữ liệu đã được uỷ quyền.
Trong CSDL phân tán, hệ quản trị dữ liệu địa phương thực chất phải đương
đầu với các vấn đề giống như hệ quản trị cơ sở dữ liệu trong CSDL truyền thống.
Tuy nhiên, hai khía cạnh đặc biệt sau đây của CSDL phân tán cần phải được
xem xét: Trong CSDL phân tán với một mức độ tự trị rất cao của các địa phương,
người chủ dữ liệu địa phương cảm giác được bảo vệ tốt hơn vì họ có thể tự chủ thực
hiện bảo vệ thay vì phụ thuộc vào người quản trị CSDL trung tâm.

Vấn đề bảo mật là bản chất trong hệ phân tán nói chung, vì các mạng truyền
thông diện rộng cho phép nhiều người cập nhật và khai thác dữ liệu nên cần được
bảo vệ.
1.4.Các hình thức tổ chức hệ thống phân tán
1.4.1. Mô hình Peer-to-peer
Các máy tính cá nhân và máy trạm có thể được sử dụng như một hệ thống độc
lập trợ giúp các ứng dụng địa phương.
Mỗi thành viên trong mạng có vai trò ngang nhau, tự quản lý tài nguyên của
chính mình và chia sẻ tài nguyên cho các máy tính khác trên mạng.
Mỗi một máy tính trên mạng vừa đóng vai trò máy chủ (Server), vừa đóng vai
trò là máy khách (Client).
Đây là mô hình mạng đơn giản, phù hợp với những hệ thống mạng nhỏ không
có yêu cầu cao về bảo mật.


11

Hình 1.3. Mô hình Peer-to-peer
1.4.2. Mô hình File Server
File server một số máy dịch vụ file được gán trực tiếp vào mạng LAN
File server là một thiết bị quản lý các hoạt động file và phục vụ các máy tính
cá nhân được kết nối trong mạng LAN
Mỗi máy cá nhân được phân chia một dung lượng cố định trên ổ cứng của File
server, chương trình ở các máy tính cá nhân có thể tham chiếu đến các file trên phần
đĩa tương ứng của nó bằng một đặc tả đường dẫn.
Những hạn chế của File server như: Dữ liệu di chuyển trên mạng quá nhiều,
việc kiểm soát dữ liệu là phi tập trung, các máy trạm phải đủ mạnh.

Hình 1.4. Mô hình File Server



12

1.4.3. Mô hình Client/Server
Một số máy dịch vụ file được gán trực tiếp vào mạng LAN:
Server có chức năng điều khiển, lưu trữ CSDL, xử lý các truy vấn và quản lý
việc khai thác tài nguyên trên mạng của các máy tính khác.
Thuật ngữ client được sử dụng để chỉ người khai thác tài nguyên mạng.

Hình 1.5. Mô hình Client Server
1.5.Các đặc trưng của các loại hình hệ thống phân tán
Việc chuyển các ứng dụng trên máy tính cá nhân cũng như các ứng dụng trên
các hệ thống máy lớn trung tâm sang mô hình phân tán là một xu hướng phát triển
mạnh.
Vấn đề đặt ra là cần lựa chọn hình thức phân tán thích hợp nào cho mỗi mô
hình được chuyển đổi [3].
1.5.1. Đặc trưng của hệ thống File server và kiến trúc Client/Server


×