Tải bản đầy đủ (.pdf) (296 trang)

Nguyên lý của các hệ cơ sở dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.54 MB, 296 trang )

NGUYỄN KIM ANH

-------

NGUYÊN LÝ
CỦA CÁC HỆ CƠ SỞ DỮ LIỆU

NXB ĐẠI HỌC QUỐC GIA HÀ NỘI -2009


M ỤC LỤC
L Ờ I G IỚ I T H IỆ U

3

CHƯƠNG 1. ĐẠI CƯƠNG VÈ CÁC HÊ c ơ s ỡ DỬ LIỆU

5

I . I . Các hệ th o n g xừ lý tệp iruyển Ihồng

5

1.2. Các hẻ c ơ sơ d ừ liệu

9

1.2.1. Các khái niệm cơ hàn

9


1 2.2. c á c khá nông cùa m ật hệ quan ỉn cơ s ơ dũ' liệu

ìì

1.2.3. Kiến trúc c ủa một hệ quàrì tri cơ sở dừ liệu

18

1.2^4. N gười quán trị c ơ s ờ d ữ liệu

20

1.2 5. N hừng người s ử dụng cơ sớ d ừ liệu

21

» 3. S j phán loại các h ệ CC' sơ d ữ Uệii

22

1 .3 .1. CYỉc hệ cơ s ơ d ừ liệu rạp iru/7g

22

ì. 5.2. C á c hệ c ơ s ớ d ừ liệu phân lớn

25

1.4


Kci luận

C H Ư Ơ N G 2. C Á C M Ô H ÌN H D Ữ L IỆ U
2.1. M ô hìn h th ự c thề liên kếl (m ò hinh ER )
2. /. /

C à c khỏi niệm c ơ s ở

28
30
30
31

2.1 2 S ơ đ ồ thực thê hèn kết (sơ đồ ER)

33

2.1.3. Tính nâng cù a cá c liên kếi

34

2.2. M ô hìn h dừ h ệu q u an hệ

39

2 .2 /. C à c khái niệm c ơ hàn

39

2.2.2. Biến đỏi cá c s ơ đ ồ ER son^ mô hình quan hệ


40

2 3. M ò hin h d ữ liệu m ang

44

2.3. ì. C á c khái niệm c ơ hàn

^4

2.3.2. Biến d ồ i c á c s ơ d ồ ER sơng mô hinh m ạng

45

2 4. M ô hìrứi dừ liệu p h ân cắp

48

2.4. L Thuật toán hiến đồì mô hình manỹ, đơn Ịiián

48

2 4 .2 S ụ lặ p lạ i c á c kiêu bán ghỉ

49

2.4.3. C ác kiểu hàn g h i à o
2.5. M ô hin h d ữ liệu hưómg đối iuợng
2 .5 . 1 C á c k h á ỉ m ệm c ơ bán

2 .5 .2 B iể n đ ổ i c ó c s ơ đ ổ ER sơng m ô hinh d ữ liệu h ư ớn g đ o i (ư ợng
2.6, Đ ánh g iá v à kếl iuân

49
52
52
56
57

C H Ư Ơ N G 3. N G Ô N N G Ữ Đ ỊN H N C H ỈA VÀ T H A O T Á C DỮ L IỆ U
Đ Ó I V Ớ I M Ó H ÌN H Q U A N H Ệ

59

3 .1. Đ ai số q u an hệ

60

3 .2. Phép lín h vỊ từ biến bộ

67

3.3. Phép lín h vị lừ biến m iền

71

3.4. N hàn xél ch u n g về kha năng cua các ngôn ngữ thao tác

74


3.5. ISBL: M ột ngôn ngữ đại số quan hê 'ih u ản tu ý '

76


3 .5 .1. Cú p h á p củo các ph ép (oán đại số

76

3.5.2. C ác Ví' dụ vể bìều diễn truy vần hărìg ISDL

7S

3 . 6 . Q U EL; m ột ngôn ngữ tính toán vỊ từ biến bộ

80

3.6.1. Chi thị truv von

so

i. 6-2. C hi thị cập nhật

H!

3. ố. 3. G án ke! qua tim kiếm vào mô! quan hệ

H2

3 6 4. C á c vi dụ vể truy vầr) hang ngôn tĩ^ừ ĩinh ĩoớn vị lừ biền họ Ọ u el ^3

3 6.5^ Tỉnh đắv đủ cùa Quel

H4

3.6.6. C'àc ph ép loan ỉập hợp

H5

3.7. Q B E (Ọ uerv - By “ Exam ple): mòingỏn ngừ lính loán yị lừ biến iTiicn H6
i . 7. /, Truv vắn dừ hệĩi irong QBE

H7

3.7.2. C á c ph ép toán lập hợp

92

3 .7.3. Các thao lác ỉhơv dôi c ơ s ơ dữ liệu

93

3.7.4 Tỉnh đấy đủ cùa QBE

95

3.7.5. Dĩnh nghĩa d ừ liệu trong Q B ĩí

95

3 .8. SQ L (S ư u ctu red Quer>' Language)


98

3.H.Ì. C ác lệnh tru v vẩn c ơ s ơ dừ liêu

Ị 00

3.H.2.CỎC h à m ih ir v ìệ n

109

3.8.3 C á c lệnh cạp nhặt d ừ liệu

IỈO

5. s. 4. C á c lệnh định nghía
ììì

3.8.5. SQỈ. dạng rìhủtig

/ Ị4

3,9. K é llu a n

CHƯƠNG 4. LÝ THUYẾT TH IÉ T KÉ c ơ s ở DỮ LIỆU ỌUAN H Ệ
4.1. P h ự tliu ò c hám

/7 7


\V)
121

4.1.1 H ệ íièn để cho phxi thuộc hàm

/21

4.

ì 26

Ị. 2 Tinh ioán bao đóng

4.1.3. Phú của tậ p c á c phụ ỉhuộc hàm

ì 27

4.2. Phcp tách các sơ dồ quan hệ

131

4.3. C ác d an g chuấn đối với các sơ đ è quan hộ

ÌV)

4^3.]. D ạ n g chuần m ột

140

4.3 .2 D ạ n g chuẩn hai


Ì4I

4.3 3. D ọ n g chuán bơ

ì 43

4.3.4. M ục đich cùa cá c dọng chuQỉì

ì 44

4.3.5. D ợ n g chuắn B oye-C odd

.ì 45

4.3.6. Tách không m ắt íhông tin về cỉạng chuồn Bove-Codcỉ

ì 46

4.3^ 7. Tách háo (oàtì (âp phu ĩhuộc hàm về dọng chuẩn ha

Ì4H

4.3.8. Tách không m ál ỉhỏng lin và háo toàn tậ p phụ íhuộc hởỉU vé
dạn^ chuân ba.

149

4.4. P h u thuộc đa trị


150

4.4.
11

ì. ỉỉệ tiên đế đổi vời cá c plìỉ! thuộc hàm và phụ thuộc d a (rị

Ỉ5I


4.4.2. Bao âóng CUŨ íập phụ ĩhuộc hàm \’à phu ihuỏc do ỉn

153

4 .4 ĩ . Phép tách không mầĩ thỏrìg iìĩì

154

4.4.4. D ạn^ chuẩn hổn

155

4.5. K ết luân
C H Ư Ơ N G 5. T Ô C H Ử C D Ừ L lỆ li V Ạ T LÝ
5.1. M ô h in h tô chức bô n hớ ngoài
5.2. TÓ chứ c lêp đ ồ n g (The H cap Filc O rgani/^tion)

156
157
) 57

158

.1 2 A Tô ch itc tệ p dừ liệu

158

5.2.2. C ác ihao tác ỉrén tó chức (íon^

159

5.3. TÔ chứ c iệp băm (H ashcd Files)

5. 3. ỉ . Tắ c h ĩiv (ệp d ff ỉiẻu
5. ĩ . 2 Các íhao ỉ á c trên tỏ chức iệp bỗm
5.4. T ố chứ c lập chi dẫn (Indexed Files)

160
J 60

162
165

5 .4 .1 To chxrc tệp d ữ liệu

IỔ5

5 .4 2. Cớc ỉhao tác (rên (ỏ chức tép chi dẫn

ỉ 67


5.5. B -cây (B alan ccd trecs)

ỉ 70

5.5. ì. TÒ ch\rc tệp d ừ liệu

/ 70

5.3.2 Các thoo (ác trèn tô chức B - câv

/7 /

5.6. K ếl luận
C H Ư Ơ N G 6. T Ố I Ư U H O Á CẢ U H Ò I

175
177

6.1. T ố n g quan v ề x ử K UTjy vấn

i77

6.2 M ô hình chi phí

181

6.2. ì. Thông tin ĩhư mục dối với (lảnh giờ chi p h i

IHì


Ch2.2. C ác độ đo cù a chì p h i ỉruv van

IH2

6.3. Đ ánh giá các b iểu th ứ c dại số quan hẹ

183

6.3.1. V ậ ĩc h ắ th o á

184

6 . 2. D ư ờn g ổn ? (pipelining)

ì H5

6 4 T ối iru hoả các b iéu Uiửc đại số quan hè

186

6.4. ỉ. ( 'oc chiến ìược tồi xai ìỏn^ quai

IHỔ

ố. 4.2. Biêu ihửc txixm^ ílư(m^

IHH

6.4. ỉ . C ác p h ép hiến đoi iư

ì 89

6.4.4. Toi Uĩi hoớ m ộ t lớp cá c hiểu ihức (ỈỢi so quan hệ

ì 96

6.5. K ẻt luân
C H Ư Ơ N G 7. A N T O À N V À T O À N V Ẹ N D Ử L IỆ U
7.1. A n toàn d ữ liệu

204
206
206

7 .L I. X u ắl irinh cân cước và xàc mitih rìgười sừ d ụ n g

208

7.1.2. Kiểm tra tru y nhập

210

7. /. 3. C ác khung nhìn như các c ơ chế hao vệ

210

7.1.4. C ác lệnh an toàn d ừ liệu trong SQL

21 ì


1 2 . T o àn vọn d ữ liệu

213
UI


t h ứ c c ũ n g n h ư k in h n g h iệ m s u p h ạ m đ ã đ ư ợ c TS. N g u y ễ n K i m A n h
t h ể h iệ n t r o n g c u ố n s á c h n à y . Đ â y k h ô n g p h ả i là c u ố n s á c h ( ti ế n g
V lê t) d u y n h ấ t v à c ũ n g k h ô n g p h à i là c u ố n s á c h c u ố i c ù n g v ề C S D L
ờ V i ê t N a m , t u y n h iê n c h ắ c c h ắ n r ằ n g n ó s ẽ là c u ố n c ẩ m n a n g k iế n
t h ứ c đ á n g ti n c ậ y v à t h ự c s ự b ổ íc h c h o b ạ n đ ọ c , đ ặ c b i ệ t là n h ữ n g
s in h v iê n c á c n g à n h T o á n -T in , T in h ọ c . C ô n g n g h ệ T h ô n g tin à c á c
trư ờ n g đ ai h ọ c v à c a o đ ẳ n g tro n g c ả n ư ớ c.
X in t r â n t r ọ n g g iớ i th i ệ u c ù n g b ạ n đ ọ c .

G S .T S . N g u y ễ n T h ú c H ả i


C H IÍƠ N G 1
ĐẠI C Ư Ơ N G VỀ C ÁC HỆ

cơ sỏ D Ũ

L IỆ U

1.1, Các hệ thống xử lý tệp truyền thống
C ách tiếp cận tru v èn ih o n g đồi với các hộ thống th ô n g Ún th ư ờ n g chi tập
trung v ào các nhu cầu x u lý d ữ liệu c u a các phòng riên g lò tro n g m ôt tô chứ c m à
không xem x ét tô ch ứ c n àv như m ột tông thê. C ác h ệ ihong th ô n g lin n ày đáp
ứ n g c á c y êu c ẩ u c u a n h ữ n g ngư ời sư dụng bang cách v iểt m ọ t ch ư ơ n g trinh mới

đối với m ỗi ứ n g đụng m ới d ơn le. thư ờng là m ột ch ư ơ n g trình đ ư ợ c p h ái Iriẽn tai
m ót th ờ i đicm . M ồi ch ư ơ n g trinh ứ ng dụng ha>* m ột hộ thống th eo y êu cau sỗ
dư ợ c th iếl kế d ê đ á p ứ n g các v cu cầu cu a niộl phòng đạc b iệt hay m ộl nhóm
ngư ời s ử dụ n g cụ thé. D o vạy. không có m ỏi kế hoạch tô n g thê ha>' m ột m ỏ hinh
hư ớng den sự tăn g Irư ơ n g các ứng đụng m ới trong lư ơng lai.
M ỗi ứ n g d ụ n g tin học m ới đ ư ợ c IhiỂt k c m ọt cảc h điển h in h với m ộl lập
các tệ p dữ liộu riên g c u a nó. N hièu dũ’ liộu trong các lẹp m ới có thc đ ã x u ất hiện
trong c á c tẽp đ a n g tồn lại sẽ phai đ ư ơ c cấu trúc lại. m à đến lư ợl n ỏ . các chư ơ ng
trinh đ an g lổn lại s ư d ụ n g cùng các tệp nà> cũng phai đ ư ợ c sư a lại h ay viết lai
hoàn loàn, V ới lý d o này . th iếl kc các lệp mỚ! với m ỗi ứng d ụ n g đ ư ơ c y êu cầu
thư ờ ng là đơ n g ian hơn v à cũng ÍI rui ro hơn.
T rư ớ c tiên, ch ú n g ta hã>' xcm xót ví dụ vè m ộ t phần cu a h ệ thong N gân
hàng tiél kiộm (Ọ u ỷ tiết kiẽm ) lưu g iữ thỏng tin \'C khách h àn g v à c á c lài khoan
tiết kiộm c ú a k h ách hảng. MỘI cách dò lưu (rữ th ô n g tin này trẽn m áy tính là lưu
trữ nó trong c á c lệ p h ê thống bển vírng. Đ c cho p h ép n g ư ờ i s ư dụng th ao lác
những thôiìg lin này , h ệ thong cỏ m ộl sồ c á c ch ư o iig trinh ứ n g dung th ao tác các
tẹ p đó, ch ăn g h ạn như:
• C h ư ơ n g trinh th êm m ộl lài khoan mới;
• C hư ơng ư in h ghì n ợ (g h i có ) m ột lài khoan:
• C hư ơng ưinli tinh s ẻ d u cu a m ội lải khoan.


C ác ch ư ơ n g trinh ứng du n g n ày dược viél bơ i c á c nhà lập Irinh hô íhống dc
đáp ứ ng các y ê u cẩu tin học h o ả củ a N gán h àn g tiét kiộm.
C ác ch ư ơ n g trìn h ứ n g dụng m ới có Ihê bố sung thêm v ào h ệ thong khi các
nhu cầu m ới náy sinh.
Hộ ihồiìg x ử ]ý tệ p diẻn h in h xìra m ỏ ta d ư ơ c hồ irợ bơi m ộl hẹ đ iểu hành
n ào đó. C á c b ản ghi khá ồn dinh v à tồn tại lâu dài đ ư ợ c iưu Irỏ Irong c á c lộp
khảc nhau v à c á c ch ư ơ n g trìn h ứ ng dim g k hác nhau đ ư ơ c viổt dê tri ch ra c á c ban
ghi từ các tệp thich h ợ p hay b ồ su n g ihêm các b an ghi m ới v ào c á c têp đó. N hư

vạ>, trư ớ c khi x u ất hiộn c á c phấn m èm hệ quan trị c ơ sơ d ữ liêu, trong quá khứ
các hệ thống trẽ n c ơ sơ ỉẹp đã đ ư ợ c tạ o lập đé xử lý m ột sồ lưcaig lớ n các d ữ liệu
cua các lô chứ c niỏl c ác h hiệu qua. T rong c á c hệ thong nliư v ạy , việc x ư lý dữ
lỉệu đ ư ợ c hoàn thành boi \ iệc lạo c á c lệp Irẽn các đ ĩa từ h ay các b ă n g từ.
T u y n.hiẽn, khi qui m ô kinh doanh cu a các tồ chứ c v à nhu cẩu x ư Iv Ihao
tác dữ liệii v é i các m ục đích khác nhau theo c á c qui cảnh khác nhau tăn g lỄn,
m ột số các vẩn đe ng h iêm trọ n g có thể này sinh.
C á c h ệ thống ư ê n c ơ sở tệ p đ ư ợ c p h át tn e n với c á c ứiìg d ụ n g đ ặ c b iẽ t, do
vậy việc lưu trừ th ô n g tin cu a các tô chứ c trong các hệ th ố n g lêp c ó m ọ t số bấl
tợỉ chính sau:
• D ư th ừ a dữ ỉiệu v à linh k h ỏ n g n h ất quán dữ liêu: D o các tệ p v à c á c chưcm g
trinh ứ n g d ụ n g đ ư ợ c tạ o lập b ờ i các n h à lập ừ in h k hác n h au ừ o n g m ột
k h o án g thời g ian dài, các íệp k h ác n h au có thể c ó các qui các h k h ác nhau
v à các ch ư ơ n g trinh cỏ thé đ ư ợ c v iết b ẳn g m ột số ngôn n g ữ lập trìn h khác
nhau. H ơn n ữ a , vi c á c tệp d ư ợ c lạo lập đối với m ỗi m ộ i ch ư ơ n g trin h ứng
d ụ n g riê n g , d o vậy cù n g m ọt tạ p các d ữ liêu cù a tồ ch ứ c có thê đ ư ợ c lưu
trữ lạỉ trong m ồi ch ư ơ n g trinh ử ng dụng, có nghĩa là m ột sổ th ô n g Ún có
ihé lă p lại trên m ội số tệp k h ác nhau và c á c lài nguyên p h ần cứ n g n h ư các
đ ĩa từ có thể bị lãn g phí. V í d ụ , địa chi v à số điên thoại củ a c ú a m ọ t khách
hàng dặc b iệ t c ó ihể x u ấ t hiên trong m ọt tệp ch ứ a c á c bàn ghi tải k h o a n tiểt
kiêm v à tro n g m ọt tệ p ch ứ a các b ản ghi số dư tà i khoản. S ự d ư th ừ a nàv
d ẫn đến g iả tru y n h ập v à g iả lưu trữ cao hơn. T h êm v ào d ó , v i c á c d ữ licu
đ ư ợ c lưu trữ tro n g các têp có the đ ư ợ c fftav đoi m ọt c ác h d ộ c lạp b ỏ i các
chưcm g ư in h ứ n g d ụ n g sử dụng chúng, nôi dung c ủ a cù n g c á c k h o an m ục
d ữ liệu ư o n g ch ư ơ n g trinh ứ n g dụiig này có thể không trù n g v ới c ù n g các
k h o ản m ục d ữ liệu đó trong m ộ t ch ư ơ n g trình ứng dụng khác. Đ iể u này
d ẫn đen tín h k h ô n g n h ai quán dữ liệu, có nghĩa là các b ản sao k h á c nhau
cù a cùng m ộl k h o ản m ục dữ liệu k h ô n g giổng n h au .V í d ụ , m ộ t đ ịa chi
k h ách h àn g bi th ay đồi có thể d ư ợ c phán ánh trong bản ghi tài k h o ản tiết
kiệm n h ư n g k h ô n g d ư ơ c p h án ánh trong bản ghi số dư tài k h o ản đ ố i với

khách h án g dó


K h ó k h ăn iro n g tru y n h ập d ữ liệu: G iả s ư rằ n g m ọ t ừ o n g c á c n h â n v iên cu a
N g â n h à n g c ầ n tim đ an h sách lê n c á c k h ách h àn g sống tro n g m ộ t th à n h phố
n à o đó. N h â n v iên n ày hòi p h ò n g x ừ lý d ữ liệu đ ê đ ư a r a m ọ t d an h sách
n h ư vậy, V i y ê u c ầ u n ày k h ô n g đ ư ợ c d ự tín h tru ớ c , h ệ th o n g g ố c d ư ợ c thiểt
k ế k h ô n g c ó sẵ n m ộ t ch ư ơ n g trin h ứ n g d ụ n g để đ áp ứ n g y êu c ầ u n ày .T u y
n h iê n , c ỏ m ộ t c h ư ơ n g trinh ứ n g d ụ n g đ ư a ra d an h sá c h lấ t c á c á c khách
hàng. B ấ y g iờ , n h ân v iên N g â n h àn g n ày đ ứ n g trư ớ c h ai lự a chọn: H o ặc sứ
d ụ n g d a n h sá c h tấ t c ả c á c k h ách h àn g v à ư íc h ra n h ữ n g th ô n g tin c ẩ n Ihiểi
b a n g ta y h o ặ c y ê u c ấ u p h ò n g x ử lý d ữ liệu đ ề nghị m ộ t n h à lậ p ừ in h hệ
ửiong v iết c h ư ơ n g trìn h ứ n g d ụ n g m ới đ áp ứ n g y êu c ầ u m ới n ày . C á hai
lự a c h ọ n h iể n n h iê n đểu k h ô n g đ ư ợ c hải lòng. G ia s ử ran g , m ọ t ch ư ơ n g
trin h n h u v ạy đ u ợ c v iể l, v à sau v ài n g ày , cũ n g n h ân v iẽ n d ó c ầ n m ộ t danh
sá c h k h á c h h à n g khác. C u n g n h ư vậy , m ột c h ư ơ n g trìn h đ ư a ra d a n h sách
đó k h ô n g tồ n tạ i và n h ân v iên này lại đ ứ n g trư ớ c hai lự a ch ọ n v à k h ô n g có
lự a ch ọ n n à o đ ư ợ c h ài lòng. Đ iể u ch ú n g lô i m u ố n chi ra ờ đ ây là c á c m ôi
ừ ư ờ n g x ừ lý tệ p k h ô n g ch o p h ép c á c d ữ liệu c ầ n th iểt đ ư ợ c lim k iể m trong
m ộ t p h ư ơ n g p h á p h iệ u q u ả v à tiện lợi. D o vậy , c á c hệ th ố n g tim k iém dữ
liệu th ic h h ợ p hcni c a n p h ài đ ư ợ c p h át tríế n v à p h ài đ á p ứ n g đ u ọ c c á c ú n g
d ụ n g k h ác ỉứiau c u a hệ thống.
C ô lậ p v à h ạ n c h ể ch ia sẻ d ữ liệu; V ớ i các h tiếp c ả n tru y ền th ổ n g , m ỗi ứ ng
d ụ n g c ỏ c á c tệ p d ữ liệu riên g c ú a nó v à rihững n g ư ờ i s ư d ụ n g ít c ó c ơ hội
c h ia sé d ữ liêu n g o ài c á c ứ n g d ụ n g riê n g c ủ a họ. M ộ t h ậu q u ả c ủ a v iệ c ch ia
sè d ữ liệu b i h ạ n c h ế là c ù n g c á c d ữ liệu p h ải lu u irữ iro n g n h iề u tệ p ứ ng
với c á c ứ n g d ụ n g k h ác n h au do k h i th iểt kế p h ái triê n c á c ứ n g d ụ n g m ới,
n g ư ờ i th íc t k é th ư ờ n g k h ó k h ai th á c c á c d ữ liệu c h ứ a tro n g c á c tệ p đang
lổ n lại tro n g k h i c á c tệ p m ới đ ư ợ c th iế t k é lặ p lạ i n h iều d ữ liệu đ a n g tồn
tại. H ơ n n ữ a , c á c d ữ liệu đ ư ợ c lưu trữ tro n g c á c têp k h ác a h a u v à các tệp

c ó thê có c á c q u i c á c h k h ảc n h au , đ iều n ày dẫn đền k h ó k h ăn khi v iểt các
c h ư ơ n g trin h ứ n g đ ụ n g m ới d e tim k iếm c á c d ữ liẹu th ích h ợ p trê n nhiều
tệp.
C á c v ấn đ ể v ề to à n vẹn: C á c g iá trị d ữ liệu đ ư ợ c lư u trữ tro n g c ơ s ở d ữ liệu
p h ài th o ả m ã n c á c k iể u rà n g b u ộ c to àn vẹn n h ấ t định. C á c n h à p h á t triến
làm h iệu lự c c á c rà n g b u ộ c n ày tro n g h ệ th ố n g b ằ n g c á c h ih ẽm c á c đoạn
m ă tư ơ n g ứ n g v à o c á c ch ư ơ n g ừ ìn h ứ n g đụng. T u y n h iê n , khi c á c fàn g
b u ộ c m ới đ ư ợ c b ổ su n g th ê m đối với c ơ s ớ d ữ liệu, sẽ rấ t k h ó th a y đ ổ i các
ch ư ơ n g trin h đ ế làm h iệu lự c các rà n g b u ộ c m ớ i này . v ấ n d ề n ày p h ứ c tạp
hơn khi c á c rà n g b u ộ c đó lôi k éo m ộ t số k h o ản m ụ c d ữ liệu từ c á c tệp k hác
nhau


• C á c vấn đề v ể dô tin cậy: M ộ t h ệ th ố n g m áy tinh cũ n g n h ư m ộ l Ihiél bị
diộn tư hay cơ học nào đỏ c ỏ Ihê bi lỗi. R o n g n h icu ứ n g d ụ ag . vẩn d è m ấu
chốt lá khi m òl lổi x u ấ l hicn v à d ư ợ c d ố lim p h á i h iệ n , d ừ liệu phai d ư ợ c
phục hổi dén trạn g ihái loàn \c n lồn tại trư ớ c khi xa> ra iỗi. V i dụ. xél
ch ư ơ n g trinh ú n g d ụ n g c h u \ ên 50 đỏ la từ tài k h o an A đ ển là i khoan B
N ếu hệ th ố n g xay ra lỗi tro n g khi th ự c h iên ch ư ơ n g trin h , c ó th ê rẳn g , 50
đô la đ ã chuycn di từ lài k h o àn A n h u n g c h ư a đ ư ợ c g h i c ó v ào tà i k h o án B,
kel q u a là c ơ sờ d ữ liệu ơ (rong m ột trạn g th ái k h ô n g to à n vẹn d ữ liêu.
• C ác dị ih ư ò n g iru)' nliâp d ồ n g thời: Đ c tăn g hiòu n ăn g lô n g thô cu a hộ
th ố n g vả thờ i gian đ ảp ứ n g lứianh n h ắ t c ó th ẻ. a h iể u h ệ th ố n g cho phép
ỉihiẻu n g ư ờ i sư d ụ n g truv n h ảp d ữ liẻu doĩxg thờ i. T ro n g in ò l m ô i Irư òng
rửiư v ậ \ , sự tư ơiig tá c c ú a c á c tru y n h ập đ ồ n g th ờ i c ó th é dẫn đ ển két qua
Irong m ột irạn g th ái không to àn vẹn d ữ liộu. V i d ụ , x é t tà i k h o ản N g ân
h àn g A ch ứ a 500 dô la. M ếu h ai k h á c h h ò n g đếii Iiít q u ỹ (rú t 5 0 đô la vả
100 đỏ la lư ơ n g ứ n g ) lừ là i khoan A v ào c ù n g m ộ t th ờ i đicm . K ết qua cua
các thự c hiện đổng thời nà>' có thê d an d ến tà i k h o an nà>' ơ tro n g m ọ t trạng
thải k h ô n g đ ú n g đ án ( hay k h ô n g to àn vẹn). G ia sư rầ n g . c á c ch ư ơ n g trinh

rú t thự c hiện v ẻu câu rú l b ao gom c á c th a o lá c : d ọ c g iá trị là i k hoan, giam
g iá trị này đi m ột g iá trị b ẳn g sồ c ẩ n r ú t v à g h i kổl q u a tr a lại. N éu hai
ch ư ơ n g trìn h ch ạy dồng thờ i, c a h ai c ó ihê c ù n g đ o c g iá irị 5 0 0 đ ỏ la và ghi
lại 4 5 0 đô la , 4 0 0 đ ô la tư ơ n g ứng. Phu ih u ỏ c v à o c h ư ơ n g trin h n áo ghi giá
trị sau cù ng, tà i k h o án A có th ẽ c h ứ a h o ặc 4 5 0 đô la h o ặc 4 0 0 đ ô la chứ
k h ỏ n g p h ai g iá tr? đ ú n g cu a n ó lả 3 5 0 d ô la. Đ c c à n h g iá c v ớ i n h ữ n g útứx
huống n h ư v ậ y , h ệ Ihống phải duy trì m ộ t d ạ n g g iả m s á t n à o đó. B ời vi dữ
liêu c ó thé d ư ợ c tru y nhập b ò i n h iều c h ư ơ n g trin h ứ n g d ụ n g k h ác lứiau m à
k h ô n g đ ư ợ c d iều phồi tử trư ớ c, m ỏi d ạ n g g iả m s á t n h ư v ậy k h ó c ỏ tlìể dược
cung cầp.
• C ác vấn d ẻ v è an loàn; K lìô n g phai m ọi n g ư ờ i s ư d ụ n g c u a hộ th o n g dều có
ihê tru y n h ập lấ t c á dữ liệu tro n g hệ. V i d ụ , Irong h ệ th o n g N g â n h àng, các
nhân vicn tài vụ c ù a N g ân h à n g chi c ầ n n h ìn th ấ y m ộ i p h ần c u a c ơ sớ dữ
liệu c h ứ a th ô n g tin vể cảc n h ân v iên N g â n h àng. H ọ k h ô n g c ẩ n th iế t truy
n h ập vào th ò n g tin v è c á c tài k h o án k h ách h àng. D o c á c c h ư ơ n g trin h ứng
dụng đ ư ợ c bo sung v ào hệ th ố n g Iheo p h ư ơ n g p h á p Ih êm d ần , v iệ c b ắt tuân
thú c á c ràn g b u ộ c an loàn n h ư v ậy lá k h á khó khản.
• S ụ phụ th u ộ c d ữ liệu cù a c á c ch ư ơ n g trình ứ n g d ụ n g : D o đ ịn h n g h ĩa tệp
đ ư ợ c c h ứ a Irong c á c ch ư ơ n g ừ in h ứ n g d ụ n g , n ểu c á c n ộ i d u n g tệ p v à các
khuôn d ạn g bán ghi cần đ ư ợ c th ay đ oi, c á c c h ư ơ n g ừ in h ứ n g d ụ n g cũng
phái ih ay dối theo.


N h ữ n g k h ỏ k h ã n nà> d ầ u dén c ầ n phai phái iriôn niộl phầti m ểm d ặc biộl.
m ột h ệ q u an Irị c ơ s ơ d ữ liộu với đ ay đu c á c tiiilì năng cho phép kliac p h ụ c các
bất iợi nêu ư ề n .

1.2.

C á c h ệ c ơ s ở d u liệ u

IV oiìg th ờ i g ia n g ầ n đ â \ n g àn h tin liọc đ à c ó iiJiiêu th àn h lựu hct sứ c lo lớii.

T ro n g sổ n h ữ n g th à n h lựu đ ó p h ai k ẽ tớ i v iệ c sir dụng ngà> càn g rộ n g rãi và có
hiệu q u a c ả c h ệ c ơ s ớ đ ữ !iộu. T n rớ c liên ch ú ỉìg (a hãy xem x ét các khái m ệm cơ
ban v è hê c ơ s ơ d ữ liêu

I .2 .I . C á c k h á i n iệ m c ơ b « ĩn
( V/ ,vơ íỉữ liệu là g i ?
M ội tô c h ứ c ( n ì n g h iệ p , n g ân h àn g , bênlì ^'iện. cơ q u an ...) c ỏ Iiliíều ứng
dụiig tin lìỌC k h á c n h a u n h ư n g tấ t c a c á c ứ n g dụng đó cù n g đ ư ợ c liến liàiứi irên
inộl nguồn d ữ liệu clìLuìg ihi k iìông g ì tố t liơĩi là triên klìai các ứ n g d ụ n g đỏ trôn
m ôt c ơ s ơ d ữ liộu h ợ p I\hất c h o p h é p q u an lý tậ p trung tấ t ca d ữ liộu xi nghiệp.

H ìn h 1.1. C ơ s ỡ d ữ iiệ u h ợ |) n h ấ t

T rên hinli 1.1, c lìủ n g ta ìứiin th ấ y thànlì plìần c ơ sơ dữ liệu hợ p nhấl là m ội
b ộ sư u tậ p c á c d ừ liệu c h ứ a trê n c á c p h ư ơ n g tiện lư u trữ n h ư đĩa từ h ay băng
từ... N h ữ n g n g ư ờ i s ư d ụ n g trự c tu y ể n ha>' c á c ch u ơ iìg tritìj\ ứ n g điuig có thô sư
dụn g ch ung h ay clìia se c ơ sơ d ữ liệu 11 à>*.


C ác ch ư ơ n g trình ứ n g dụng theo lô cỏ Ihc th ự c h iện c á c ih a o tá c trẽn các
d ũ liêu d ư ợ c lấy ra lừ c ơ sở dữ liẻu nàv T ihư tim k iém , sư a đôi, b ỏ sung, loại
bo...
N h ữ n g ngư ời sư đ u n g trự c tuyển thao tá c v ớ i c ơ sớ d ữ liệu lử c á c ih iềt bị
đầu cuối ơ c ác h x a (ch ú n g la Ihư ờng gọi !à tihững n g ư ò i s ư d ụ n g c u ố i) v à họ
cOng có ihê th ự c hiện tất ca cảc ih ao tác; tim k iếm , sừ a đôi. b ố su n g , lo ạ i bo. N ói
c h u n g , tim kiếm là ih ao tác phô b iển rứiấl v à q u an tro n g n h a i
N h ư v ậy , ch ủ n g ta c ó ihể đính nghĩa : C ơ sớ d ữ liệu là m ột b ộ s ư u tậ p các
d ữ liệu tác ng h iệp đ ư ợ c iưu trữ lại và dược c á c h ê ứ n g d ụ n g c u a m ộ i \ í nghiệp

c ụ th ẽ nào đó sư dụng.
T ro n g đ ịn h nghĩa nảy , xí nghiẽp ở dâv chi b ấ t kỷ m ộ t h o ạ t đ ô n g khoa hoc.
k> th u ậỉ. km h doanh., n ào đó. D ữ !iẻu tác n g h ic p d ư ợ c sư d ụ n g đê chi dữ liéu
cua xi righiẹp. ch àn g haiì dỗ liỗu về kháclì h à n g ha> d u iiộu v è là i k h o a n trong vi
dụ đ ố i vói N g ân h àn g tiết kiẹm .. C húng tôi rnuốn n h ấn m ạnh rằ n g , c á c dữ liệu
váo, tứ c là các th ô n g Ún đi íừ thể giới bên n g o ài v á o v ả c ó th ể g â y r a n h ư n g thav
đ o i ừ o n g d ữ liệu tác ng h iệp v à c á c dừ !iộu ra , tứ c ià c á c íh ỏ n g b á o , b á o c ả o rú l
ra tù d ũ liệu lác nghiệp k iìông phải là m ôt p h ần c ú a d u liệu lá c n g h iệ p và k h ông
đ ư ợ c b ao hàm trong d ừ liệu tá c nghiệp.
H ệ quản in c ơ s ở d ữ liệu ìà g i?
T rên thị trư ờ n g p h ần m ềm hiện nay ờ V iệ t n am đ ã x u ẩ t h iẹ n k h ả rứiiều
p h an m ềm hệ q u ản trị C0 s ơ dữ liệu ỉứiư: M .A cce ss, D B 2 , In fo rm ix . S Q L Server.
S y b ase, O racle.
C húng ta có thề định nghĩa m ột h ệ q u ản t n c ơ s ơ d ữ liộu n h ư sau : H ệ quan
trị c ơ sơ dữ liệu là m ộl h ê thống phấn m èm ch o p h ép tạ o lâ p c ơ s ơ d ữ liộu và
d íểu kh iẻn m ọi tru y n h ắp đối vớ i cơ sở dữ licu dó.
H ê c ơ s ờ d ữ lĩêu lá
B ây g iò , ch ú n g ta có the dịnh n g h ía m ộ t h ệ c ơ s ò d ữ h ệ u là m ọ l h ệ th o ng
gồ m 4 th àn h phần :
• C ơ sớ d ữ liệu h ợ p nhất: C ơ sờ d ữ liệu c ủ a h ẻ c ó h ai tín h c h ấ t tố i th iểu hoá
d ư th ừ a v à đ ư ợ c c h ia sẻ.
• N h ữ n g ngư ời s ù dụng: N g ư ờ i sử dung c ù a h ệ là b ấ t k ỳ m ọ t c o n n g ư ờ i nào
có nhu cầu tru y n h âp vào cơ sờ dừ iiệu, c ỏ n g h ĩa là n g ư ờ i s ứ d ụ n g b a o gồm
tấ t c ả n h ữ n g n g ư ờ i s ư dụng cuoí> rửiững n g ư ờ i v iế t c á c c h ư ơ n g trìn h ứ n g
d ụ n g v à những n g ư ờ i đ iều khíen toàn b ộ h ệ th ố n g h a y c ò n g ọ i là ngư ời
quản trị c ơ s ở d ữ liệu.
• Phấn m ềm hỗ q u an trị cơ sơ dữ liệu

10



• P h ần cứ n g ; P h ần cứ n g cu a hộ b ao gồm các (hiét bi n h ó th ứ c ấ p d ư ợ c sừ
đ ụ n g đ ê lư u trữ c ơ s ở d ử liêu.
T ro n g c á c phấn tỉểp theo, chủng la sẽ đi sàu tìm h iểu vể h ệ q u án trị cơ sở
d ữ liệu, m ộ i p h ầ n m ềm đ ặc b iệ l VỚI đ ầy đù cảc linh n ăn g cho p h ép c à i dặl các
hô c ơ sở d ữ liệu. Đ ổ n g th ò i, chúng ta cũ n g phản lích c á c k h a n ăn g c ù a m ọl hẹ
q u an tn c ơ s ờ d ữ liêu ch o p h é p khắc phục tắ t cá các n h ư ợ c điểm c ủ a các hệ
ihồng \ ư !ý tộp tru y ền thổng. C uối cù ng, ch ú n g ta sẽ xem x é t c á c nhiêm vụ m à
ngư ời q u an t n c ơ s ơ d ừ liệu phái dam nhiẽm đẽ dièu khiên to àn bọ hẹ c ơ sở dừ
liệu.

1.2.2. C á c k h ả n ã n g c ủ a m ộ t h ệ q u ả n t r ị co* s ờ d ữ liệu
C ỏ h ai k h à n ă n g ch o p h ép phân b iệt các h ệ q u án trị c ơ sờ d ữ liệu v ái các
kiéu hệ th ố n g lạ p trin h khác.
• K h á n ă n g q u ả n lý d ữ liệu tồn tai lảu dài
• K há n ã n g tru v n h ậ p các khối lư ợ ng dữ liệu lớn m ọt cách hiệu qua
Đ ạc đ iềm th ứ n h ấ t chi ra rằn g c ỏ m ột cơ sỡ d ử liệu tổ n tại tro n g m ọt thời
g ia n dải, nội d u n g c ú a c o sờ dữ liệu này là c á c dữ liệu m à m ỏ i hẹ q u án trị cơ sờ
d ữ lìộu truy n h ậ p v à q u ả n lý. Đ ặc điểm th ứ hai phân b iệt m ộ t hệ q u àn ư ị

với

m ô t h ệ thổng x ử lý tệ p cũ n g q u án lý d ữ hệu lon tai lâ u d ài n h ư n g n ó i chung
không cung c ấ p c ả c tru v n h ập nhanh chóng đen các bọ p h ạn d ữ liệu tuỷ ý.
C ảc k h á n à n g c ù a m ô l hộ quán tri

cơ sờ dữ liộu h ầu h é l lá cần Uiièt khi

khổi lư ợ n g d ữ liệu c ầ n lư u trữ là rấl lớn, bới vi các khối lư ợ n g dữ liệu nho thì
c á c k ỹ th u ậ t tn iy n h ậ p đơ n g ià n , chẳng h an q u él tuần tự c á c d ữ liệu ià th ích họp.

K hí ch ú n g ta x em h ai đ ặ c điẻm trễ n cù a m ọt hệ q u àn trị c ơ s ờ dữ íiộu là cơ
bán, còn m ọ t số c á c k h ả n ă n g k h ác m à có thô thấy Irong hầu h ết c ả c hẹ quán trị
cơ s ở dữ liêu th u ơ n g n ìại. Đ ỏ là.
• HỒ trợ ít n h ấ t m ọ t m ô h in h dữ liệu h ay m ỏi sư trừ u tư ợ n g to án học m à qua
đó n g ư ờ i s ứ d ụ n g có th ề q u an sát d ữ liệu.
• Đ àm b ảo tín h độc lậ p d ữ liêu h ay sự b ấ t b iển c ủ a c á c ch ư ơ n g trình ứ ng
đụng đối vớ i c á c th a y đ ổ i về cấu trú c tro n g m ỏ hinh d ữ liệu.
• H ồ trợ c á c n g ô n n g ữ c ấ p cao nhất định cho p h ép ngư ời s ù dụng đ ịn h nghĩa
câu trú c c u a d ữ liệu, tru y n h ập dữ liệu v à thao lá c d ừ liệu.
• Q uán trị g ia o d ịc h , có n g h ĩa lả khá năng cung c ấ p c á c tru y n h ạp d o n g thời,
đủng đ ắn đ ố i v ớ i c ơ s ở d ữ liệu từ nhiều ngư ờ i sứ d ụ n g tại cù n g m ọt thời
diểm.

11


• Đ iểu k h iên lo iy nhập, c ỏ n g h ĩa là khá ĩiăng h an ch ể iru y nhập dổn c á c dữ
liệu b ơ i n h ữ n g n cư ờ i s ư dụng không d ư ơ c c ấ p phép v à kha n ă n g kicni Ira
tinlì d ủ n g d ãn c ú a dữ tiộu
• Phuc lìồi dữ liệu, c ó n g h ĩa lả kha nàng phục hoi. k h ô n g làm m ắl m ảl dữ
liệu dối VỚI c á c lồi cu a h ệ ihong.

ỉ . 2-2.1.

S ự ỉ r ừ u t ư ợ n g h o ớ d ữ Uệu

Đ ế cho hộ thống c ó ihc sư d ụ n g dư ợc, nó phai tra cứ u hay tim k icm d ữ liệu
m ột cách hiệu qu a. Đ iều nà> d ẫn đến việc ílìiết kố cảc cấu trú c dử lièu phứ c lap
dc biêu diễn d ữ liệu tro n g c ơ s ơ dữ liêu này. D o nhiều ngư ờ i s ư d ụ n g iru y nhập
vào các hệ c ơ s ò d ữ liệu k h ỏ n g đ ư ợ c đào tạo về m áy tính, người p h á t triên phai

che dấu liỉili p h ứ c lạ p dổi vớ i rứìũiìg người sủ dung thòng q u a m ọi s o m á c trừ u
iv ơ n g dê đ ơn g ia n h o ả c á c tư ơ iìg lá c cu a n g ư ò i sừ dụng đoi vói hẹ ihóng.

• M ứ c v ật lý. M ứ c thấp n h ất c u a sự trừ u tư ơ ng m ô tá d ữ liộu đ ư ơ c lưu trữ
m ội các h ih ự c s ự n h ư th ế nào. T ại m ức v ật lý, c á c c ả u trú c d ữ liệu m ức
thấp p h ứ c tạp d ư ợ c m ó iá c h i tiết.
• M ứ c logic. M ứ c c a o h ơn liếp theo c u a sư trừ u tư ợ n g m ô ta n h ữ h g d ừ liệu
n ào d ư ợ c lư u Irữ trong c ơ s ở đ ữ liệu và các mối quan hộ n ào tồ n lạ i giữa
các d õ liệu này, N h ư vậy , lo àn bộ cơ sơ d ừ liệu đ ư ợ c m ô tả tro n g th u ậ t ngừ
c u a m ột sổ nhó c á c c ấ u trú c khá dơn giản. M ặc dù sự cài đ ặl c á c c ấ u trú c
d ơ n g iàn tại m ứ c lo g ic n à y c ó Ihc kéo theo các cấu trú c m ú c v ậ t lý phức
tạ p , n g ư ờ i s ử dụng ờ m ử c lo g ic không c ầ n b iếl vể sự phứ c tạ p này. M ức
logic củ a sự trừ u tư ợ n g đ ư ợ c x á c định bơi n g ư ò ỉ q u an trị c ơ sơ d ư liệu, cụ
thề phái q u y ếl dịnh o h ữ ng th ô n g tm gì đ ư ợ c lưu Irử Irong cơ sơ d ữ liệu.
• M ứ c k h u n g nhin. M ứ c c a o n h at cu a sự trừ u tư ợ n g m ỏ tả chi m ộ l phần cua
to àn b ộ c ơ sở dữ liệu. M ặ c dù s ù đụng các cấu trú c dơ n g ia n h ơ n m ức
logic, m ộ t số p h ứ c tạ p vẫjì cò n tồn lại do kích th ư ớ c lớ n củ a c ơ s ớ d ữ liộu.
N h iểu n g u ờ i s ừ d ụ n g c ù a hệ c ơ sờ d ữ liêu k h ô n g quan lâm đến tất ca
n h ữ n g th ô n g tin này. T h ư c c h ất, những ngư ờ i s ử dụng n ày c h ì c ầ n truy
n h ập m ột p h ần cù a c ơ s ớ d ữ liêu. D o vậy sự tư ơ n g tá c cù a h ọ v ớ i hộ thống
n ày d ư ợ c đơ n g iản h o á v à m ứ c khung nhin c ú a sự trừ u tư ợ n g đ ư ợ c xác
định. H ệ th ố n g có thế cu n g c ấ p nhiều khung nhin đối với cù n g m ộ l c a sơ
d ữ liệu.
M ối q u an hê tư ơ n g ho g iữ a b a m ứ c trừ u tư ợ n g đ ư ợ c m inh h o ạ tro n g hinh
1.2.

12

n h ư sau:



M ức kluing nliìn

K hun g nhin 1

K lning nlìin n

M ức logic

M ức v
H ình 1.2: B a m ử c trih i (U'ợng d ữ liệu

Sự tư ơ n g tir doi \ ’ới kJiái niệm c a c kiẻu dữ liệu tro n g các n g ó n n g ữ lặp
ưìĩửi c ó thê lâm sán g to sự phân b iệt g iữ a các m ức trử u lượng. H ầu h ềt c á c Iigỏn
n g ữ iập trinh c ấ p c a o hỗ trợ kiêu d ữ liệu ban ghi. V i dụ. trong ngôn n g ữ tự a
P ascal, ch ú n g ta có thè kliai b ảo m ỏi bàiì glii Ii]iư sau:
t> p e cu sto m cr = rc c o rri
custom er^naine: striiig;
so cial_secu rit}’: string;

cu slo m er_ sừ eet: string:
custom cr_cit>'; striiìg:
end:
Đ oạn niã nảy định nghĩa Iiìột kiêu bân glìi m ới d ư ợ c gọi [ả cuslom er
(kliách hảng) v ớ i bốn trư ờng. M ỗi trư ờ n g c ó tên trư ờ iig vả kiếu d ữ liệu kết h ợp
v ới nó. M ộ t N g â n h àn g tiét kiệm có llìẻ có m ội số kiêu bãii ghi nliư v ậ\', chầug
h ạn b ao gồm c á c kiểu ban ghi sau:
- account (tài k h o an ) với các trucnìg accouiìt_nuniber vả trư ờ n g b alan ce;
- em ployee (n3iâiì v iê n ) với các tnrcm g c n p lo y e e _ n a m e vá tru ờ n g salary.

T ại m ứ c v ật lý , m ột ban ghi custom er, accouỉìỉ h ay m ộ t enip lo y ee c ó thẻ
đ ư ợ c m ỏ ta ìú\ư m ột kliéi lìliớ. C h ư ơ n g trinh dịch n g ô n n g ữ lìàv ch e d ấu các
m ức chi tiết lìày doi với n h ữ n g ngư ời lập trinh. T ư ơ iig tự . các h ệ c ơ s ơ d ữ liệu
che dấu Iilìieu chi tiếl lưii trữ m ử c lliấp nhấl dổi xởi ixltững n g ư ờ i lậ p trìnlì ú n g
dụng. N g ư ờ i quan trí c ơ sơ dữ liệu có thé biết nlìững clìi tiểt n liất đ ịn h về tổ
chứ c dữ liệu v ật lý. T ại m ứ c logic. m ỗi bán ghi n lm v ậy đ ư ợ c m ó tả b ơi m ột
địn h ng]ìĩa kiêu Iihư đ ư ợ c miiứi lìoạ tro n g đoạn m â v ừ a rồ i v à Ểĩiối quan lìệ g iữ a
các kiẽu bãn ghi n ày đ ư ợ c x ác dịnli. N h ữ n g tìgười lậ p triiìh sư đụiig m ộ t ngôn
ng ữ lập iTÌxửì làm việc tại m ó c trừu tư ợ ng nà}'. C ung tirơ n g tự vậ>^ n h ữ n g ngư ời
q u a n trị thư ờiìg làm v iệ c tại m ức triru tưỢỉìg nay.

13


C uối cù ng, lại m ức khung nhin. những người su dụng má> tín h nhiII thấ>
m ộl tập các chưcm g trinh ứ ng dụng m à ch e dấu I ih ữ n g chi liêl vê c á c kicu dữ
liêu. T ư ơ n g tự , tại m ứ c khung nhin. m ột số khung nhìn cu a c ơ sơ d ữ líộii được
x á c dinh và nlìững người sư dụng Cỡ sơ d ừ \\ộu nhìn thầ>' c á c k h u n g nhin n à> .
N goài sự ch e d ấu n h ừ n g chi tiết c u a m ức logic dối ^'ới c ơ s ơ d ữ liệu n ày . các
khung Iilììn cũng cung c ấ p niôt c ơ ch c an loàn đô ngán ch ạn n h ữ n g ngư ời sư
dụng khoi sự tru y nhập các bộ phận cu a cơ sơ dữ iicu. Vi d ụ . inôl klìácỉĩ lìàne
cua inộl N gân hàng chi ĩìhin lh á \ m ôl phần cua cơ so dữ hệu clnVa ih ỏiig Un vc
làí khoan cu a a a h la \ à anh la không llic lru> Iihảp đốn các ihòiiíị lin licn quan
dển lu oiig cu a các n h ân vicn ngân lìảng.

C á c th c h iện v à c á c SO’ dồ

C ãc cơ sơ d ữ licu thay dôi ihco thời gjan khi llìỗng Ini đ ư ợ c th cm \ ào ha>
bị xoá di T ậ p h o p các lliông tin đ ư ơ c lư u Irữ Irong cơ sơ d ư licu la i m ột thởi
điôm d ặc biộl đ ư ợ c gọi là m ọt thê hiộn cu a cơ s a d ữ liộu này. MỘI ih iếl kc lông

ihẽ c u a c ơ sơ d ữ licu đ ư ợ c gọi là sơ đổ cơ sơ dữ lỉộu. C ác sơ đ ồ il k h i bị Ih ay đôi
thậin chi hầu n h ư klìông tha> dồi
S ự tươiig tự c u a các khái tiiộm này vớ i các khái niệm v ề kiôu d ữ h ộu. bièn
vả g iá trị Irong c á c ngỏn ngỗ lạp Irinh là niỗt m inh hoa có ich ơ d ấ y Ọua> Irơ lạj
định nghĩa kiôu b an ghi custonicr, chú ý răng. Irong khai bảo k icu b ati ghi nà>\
chúng la k h ô n g kiiai b áo m ột bicn nảo. Đ é khai b áo c ả c bicn n h ư v ậ v Irong m ột
ngôn n g ữ lụ a P ascal, chúng ta viél:
v ar c u s to m e r i: custom er:
B ién cu slo m erl b ây g iờ tư ơ n g ứng với m ọt \iin g n h ớ m ôt b a ti ghi kicu
cu sto m cr M ộ( sơ dồ c ơ sơ d ừ liôu lư ơ n g ú n g với định nghĩa kicư tro n g ngòn
ngữ lập trinh. M ọt biển cu a kiêu đ ã cho có m ột g iá Irị dặc bièl lại m ỏ i th à i diêm
dâ cho N h ư v ậv . giá In cu a m ôt bién irong các ngỏn ngữ lạ p trin lì lư ơ n g ứ ng
với m ội íhc hiộn c u a sơ dồ cơ sơ dữ liệu C ác liô c ơ sơ dừ licu cỏ m ộ i số s ơ dồ
đirợc phân tách phù hợp với c á c m ứ c trừ u tư ợiig m à ch ú n g ta đâ th á o luân. T ại
m ứ c th ấp n h ắp là sơ đồ vậỉ lý, lại m ứ c tru n g g ian là sơ đồ iogic, v à lại m ứ c cao
nhất là m ộ t sơ đ ẻ con. N ó i chung, các hệ c ơ sớ dữ liệu hồ Irợ Jĩiôt s ơ dổ v ậl lý.
m ột sơ đồ ìogic và m ội số sơ dồ con.

14


T ítih d ộ c lậ p d ữ liệu

K h a n ăn g thay đôi m ộl đinh nghĩa sơ đồ trong m ộ t m ứ c m à k h ô n g anh
hư ơng đến định nghĩa sơ dồ troíìg niửc cao hon tiếp theo đ ư ợ c gọi là tinh dôc
lập d ừ liệu. C ó hai m ứ c độc lập du liệu.
1. Đ ộ c lạ p dũ liộu mức vât lý là k!ia nâng ihay đôi sợ đo ^ ậ t lý m à khòng
dẫu dến c á c ch ư ơ n g trinh ứng dung phai \ icl lại C ác ihay dôi tại m ứ c v ại iý dỏi
khi là c ầ n thiél đ ẽ lăng hiệu nàng hộ Lhống.
2. D ộc lậ p dữ liệu m ửc logic là kha năng thay đôi sơ dồ logic m ả không

dẫn đén c ả c ch ư ơ iìg trình ứiìíì dụng phai ^'icl lại C ác th ay dôi tại m ứ c lo^ic lá
cần thiết b ất kc khi nào cấu im c logic cua cơ so dừ hẻu b | sư a dôi. Vi d ụ . khi các
tài khoan Iicn tệ chứ ng khoán d ư a c thcm \ ào hệ llìống N g ân hang.
Đ ộ c lâp d ữ liệu m ứ c logic là khó dạt dirơc hơn so \ ớ i độc lập d ữ liệu m ức
vậl lý do các ch ư ơ n g trinh ứng dụỉìg phu thuỏc nhiều vảo cẩu trú c logic c u a dữ
liộu mà h ọ đang lru>' nhập.

K hải niệm dỏc láp dữ liệu là tươĩig tụ \ ớ i khái niệm các kicu dù liộu Irừu
tưcmg Irong các ngỏii n g ữ lập trình hiện đại C a hai m ứ c độc lâp d ử liộu đcu cố
gắtìg chc dấu c á c clìi liốt cài dăl dổJ \ ở i những ngư ờ i sư dụng, cho plicp những
người sư dụng lập iru n g vào các cấu irúc lông q u ái cliứ k h ô n g phai các chi uếl
cài đ ăl m ú c Lhấp.

/. 2 .2 2.

C ác nỊỊôn

c ơ s à d ừ Ììệĩi

M ột hc c ơ sơ d ữ liệu cung cẩp hai kicu ngôn ngữ k hác nhau: m ột ngôn ngữ
đ à c la sơ d ồ c ơ so d ữ liêu \ à m ôi ngôn ỉ\gũ biêu diễn các Iruy ^'an và các câp
nhại c ơ s ơ dử liệu.
• N gôn ngữ dịnlì nghĩa dữ liệu {D ala-D cnni(ion L an g u ag e - D D L )
M ột s a đ ồ c ơ sơ đữ liệu dậc la bơi m ộl tâ p các dịnh nghĩa đ ư ợ c b ícu diễn
bơi m ội ngôn n g ữ đ ặc biộl d ư ợ c gọi là ngỏn ngữ dịnh n g h ĩa d u liệu. K ct q u à cùa
việc dịch c á c lẹrửì c ủ a ngôn ngữ này là m ột tập các bang d ư ợ c lưu Irữ trong m ội
tộp đặc b iêt d ư ợ c gọi là từ dicn dử licu h a\ thư m ục dù liộu.
MỘI lừ d i ỗ n d ữ liệ u là m ô l lộp c h ú a các SICU d ữ liệ u c ó n g h ĩ a lả c á c d ữ liệ u
vế dũ liệu. T cp này đ ư ợ c tra cứ u irư ớc khi dữ liêu ih ư c sự d ư ợ c dọc h ay d ư ợ c
sư a dòi tro n g h ẻ cơ sỡ d ữ liỘLi.

C ấu trú c lư u irữ và c ả c phươtig pháp truy n h ập đ ư ợ c sư dụng b ờ i m ộ t hộ cơ
s ơ dữ liệu đư ợ c đặc lá bơi m ột tậ p các định nghĩa Irong m ột kiêu d ặc b iệ t cu a
D D L là ngôn n g ữ định nghĩa vả lưu trử dữ liộu. K ét q u a c ú a việc dịch c á c dịnh

15


ng h ĩa nàv là m ột tậ p các chì ihỊ đặc ià các chi tiểt cài dặt cua c ơ sơ d ữ liộu, các
chi tiết này th ư ờ n g đ ư ợ c ch e dẩu đối với những người sử dụng.
• N g ô n n g ữ th ao tá c dừ liệu (D ala-M an ip u latio n L an g u ag c • D M L )
C ác m ứ c irù u tu ợ n g m ả ch ú n g la đà thào luân Irong phần irư ớ c không chí
áp dụng dồi VỚI định n g h ĩa và c ấ u trúc dữ liệu m á đối với c ả th ao tá c dữ liệu.
C ác yẽu cầu th ao tác d ữ liệu b ao gổm:
T ìm kiếm th ô n g tin đ ư ợ c lưu trữ trong c ơ sơ dữ liệu.
T h êm ih ô n g tin mới vào cơ sờ dữ liêu
X o á th ô n g tin từ c ơ sớ d ữ liệu.
T h ay đối th ô n g lin đ ư ợ c lưu ư ũ irong cơ sơ dữ liộu.
T ại m ứ c v ậ l lý , chúng ta phài xác định các th u ậ t toán cho p h é p truy nhập
d ữ liêu m ột cách hiệu quá. T ại c á c m ứ c cao hơ n cũ a sự trừ u tư ợ n g h o á , chúng ta
n h ẩn m ạn h vào lín h dề sừ dụng. M ụ c đích cù a nó là cung c ấ p sự tư o n g tác cù a
con ngư ời đối v ớ i hệ th ố n g m ột cách thuận tiện,
M ội ngôn n g ừ th ao tá c dữ liệu (D M L ) ià m ộl ngôn ngữ cho p h é p những
ngư ờ i sừ dụng tn iy n h ập hay ih ao tác d ừ liệu được lổ chứ c bởi m ột m ô hình dữ
iiệu Uiích hợp. C ó hai kiéu ngôn n g ữ th ao tảc dữ liệu cơ ban.


C ác D M L thủ lục đòi hòi m ột người sử d ụ n g phái đ ạc là đ ử liệu nào cần
tim k iếm v ả tim kiếm những dữ liộu n ày như thể nào.




C ác D M L phi thủ tục đ ò i hỏi m ỏi người sừ dụng đ ặ c ta d ữ liệu nào cẩn
tim k iếm m à k h ô n g phái đặc tả tim kiếm những d ữ liệu này n h ư thế nào.

C á c D M L phi thủ tục thư ờ n g dề học và dễ sư đụng hơn so VỚI các D M L
thủ tục. T u y ĩìhiên, do m ọt n g ư ờ i sử dụng không phái đặc tá tim k iểm các dữ
liêu n h ư thế n ào , c á c ngôn ngữ nảy có thê sinh ra c á c đoạn m ã k h ô n g hiệu quá
ỉ>u với đoạn m ã đ ư ợ c sinh ra b ở i các ngôn ngữ thủ rục. C h ú n g ta c ó thể k h ẳc
phục vấn đ è n ày th ô n g q u a c ả c kỹ th u ật x ừ lý v à tối ư u h o á câu hòi k h á c nhau.
M ộl tru y v an là m ột chì th ị yêu cầu tim kiểm th ô n g tin. C ác lện h cu a m ộl
D M L k ẻo theo tim kiém thông tin đ ư ợ c gọi là ngôn ngử tru y vấn, M ạ c dù vể kỹ
thuật là k h ô n g đ ú n g dan , trong th ự c hành, các thuậl ngữ ngôn n g ữ tru v vấn và
ngôn n g ữ th ao tác d ữ iiẹu d ư ợ c xem là như nhau.
1.2.2.3.

X ừ lý câ u hỏi

C ô n g v iệ c c ù a b ộ x ử lý c â u hòi là biến đồi m ột tru y vấn h ay m ộ t th a o tác
c ơ s à d ữ liêu c ó th ế d u ợ c b iểu d iễn tạ i m ột m ứ c rất c a o (vi dụ n h ư b iể u diỗn bời
m ột D M L nào đ ó ) th án h m ột d ăy các yêu cầu đổi VỚI các d ữ liệu d ư ợ c lưu Irữ
tro T ìg

16

c ơ sờ dữ liệu. T h ư ở n g p h ẩn khó nhát c u a nhiệm vụ xư lý c â u h o ỉ là tối ư u


hóa c â u hòi, có n g h ĩ lá lự a chọn m ột ké hoạch ihự c hiện lồt n h ất h ay tự a chọn
m ọl d ã v c á c y êu c ầ u đổi vớ i hc thống lưu Irữ đô ira lời tru y v ẩn n ày nhanh nhất.
C ác tru y vẩn phứ c lạp th ư ờ n g cho phép chúng ta sẳ p x ếp lại trinh tự c á c phép

toán v à có thê c ó m ọt số lớn các kể hoạch thuc hiẻn cỏ th ế, th ư ờ n g có thố sồ kế
hoạch lá hàm sổ mũ đổi với kich thư ớc c u a câu hoỉ.
1.2.2.4.

Q uán trị g ia o dịch

T h ô n g thưcm g m ột số thao tác Irên cơ sò d ữ liệu hinh ihảnh m ột đ ơn vị
iogic côĩìg việc đ ơ n nhất. Đ iều này có nghĩa là hoặc tấ l cá các thao tá c d ó được
thự c hiện noặc k h ô n g m ột thao tàc nào được thực hiẻn. rh ê m vào đ o , sư thực
hiện c u a các th a o tác này phai đàm báo lính nhất quán cù a c ơ sờ dư liệu. C ác hộ
quàn trị c ơ s ở d ữ liệu điến hinh cho phép m ột n g ư ờ i sừ dụng nhóm m ộ t hay
nhiều th ao lác rra cứ u hay thay đổ! c ơ sờ dữ liệu ih àn h m ột g ia o dịch. M ột g iao
dịch lá m ột tâ p các th ao tá c m à đ ư ợ c x ừ lý như m ột d ơ n v ị k h ô n g ch ia c ắ t
Sự đ ảm b ao tính ch ất n ày là trảc h nhiậm cùa th ản h phần

q u ản trị g ia o

được.
dịch.

T hư ờ ng m ọt hệ cơ sờ d ữ liộu cho p h ép nhiều giao d ịch th ự c hiện đồng thời. M ột
số các c ơ s ớ d ữ liệu lớn tới m ứ c ch ú ng chi có ích khi ch ú n g d ư ợ c th ao lác đồng
thời bơi tihiểu n g ư ờ i sử dụng. K hi m ộl sổ giao d ịch th ay dồi cơ s ờ dữ liệu dồng
thời, tính n h ấl q u án dữ liệu có ihể khống còn đ ư ợ c đám b áo . th ậm chi ngay cà
khi m ồi giao d ịch c á thể d ư ợ c th ự c hiện đúng đắn, Đ ẳy là trách nhiệm củ a bộ
quàn lý diều khiển tư ơ n g tran h diểu khiến sự tư ơ ng tá c g iữ a c á c g iao dich đồng
ihời đàm b ào lính n h ất quản củ a cơ sờ d ữ liệu. K hí c á c lồi hệ th ố n g x à y ra , m ột
g iao dịch c h u a hoàn (hành không d ư ợ c ánh hưởng dến trạn g ih ải cú a c ơ sớ dữ
liệu. D o vậy, c ơ sờ d ữ iiệu nảy phải đ ư ợ c phuc hoi đ én trạn g thái trư ớ c khi giao
dịch nảy b ắl dầu th ự c hiện. T rá c h nhiệm cu a hộ c ơ s ớ d ữ liệu ià dò Um c á c lỗi hộ

thống và phục hồi c ơ sờ d ữ liệu đến írạn g thái trư ớc khi x u ấ l hiện lỗi này.
C ác hệ c ơ s ở d ữ liệu d u ợ c th iết k ế ư ẻn cảc m áy lín h c á nhân nhò cỏ thổ
không có tal cà c á c d ặ c linh này. Vi (lụ, nhícu hộ ih o n g nhò h ạ n ch ế chi m ộl
ngư ời sử dụng đ ư ợ c phóp iru y nhập cơ sớ dữ liệu tạ i m ỗt thờ i diếm . M ột số hệ
khác xem nhiệm v ụ sa o lư u và phục hồi là nhiệm \TJ c ủ a ngư ờ i s ừ dụng. M ạ c dù
c ác h liếp cận n h ư v ậy lá đú đồi với c ả c cơ sờ dữ liệu c ả n h ân n h ư n g nó se không
thích hợp đe đ áp ử n g c á c yêu c ầ u c ù a các xí nghiệp v ừ a và lớn.
1 .2 .2 . 5.

Q u ả n lý l u v trừ

C ác c ơ sở d ữ liệu th ư ò n g đ ò i hỏi m ột khối lư ợ n g lớ n không g ian lư u trữ.
C á c cơ sỡ dữ iiẽu h ợ p nhất th u ờ n g đư ợ c đo trong th u ạ t n g ữ c ù a g ig ab y tes hay
v ới các cơ sờ d ữ liệu lớ n là terab y tes. D o bộ nhớ ch in h cú a m áy tính k h ò n g the

17


lưu Irír nhiều ih ỏ n g tin n h ư vậy, c á c Ihông lin này dược lưu irủ irôn c á c ihicl bị
nhớ ngoài như c á c đ ĩa từ , b ăn g từ... D ữ iiộu divơc chu>cn g iữ a đ ĩa lừ v à b ộ nhở
chinh là cần Ihiél. Sự di chuycn d ữ liộu này ]á khá chậm so vòi lốc d ộ c u a bộ xir
lý iru n g lâm , d o vậy các hộ c ơ sơ dữ liệu phai lò chứ c dữ liêu v ậi l\ sa o ch o tỏi
ihicu h o á $0 y ê u cầu ch u y ên đ ữ liêu g iữ a đĩa tử và bộ nl\ớ chinh
M ục dích cu a m ột hệ cơ sơ dữ liệu là đơn gian hoá vả tạ o d ic u k iện thiỉận
lơi đé tru y nhập đến dữ liệu. C ác khung nhin inúc c a o g iú p d ạl d ư ợ c niục đich
này. N h ữ n g ngư ờ i sử dụng cu a hộ thống không can thiốl phai b ic l c á c chi ú ct lưu
trữ \ ậ l lý dối với sự cải đ ật cu a hộ thống. Tuy tìlìicn. m ội Iiháa tố c h in h irong
hài lòn g cua ngư ời sử dung đối VỚI n iộl hộ c ơ sơ dữ hộu là h iệu n ă n g cu a hộ

thõng. N cu thời g ian dáp ứ ng đối với m ột vỗu câu là quá lâu, g ỉả trị c u a hệ ihong

sõ bị g iàm SÚI. H iệu n ăn g cu a inội hệ ihổng phụ thuộc vào c á c c ấ u tr\ic dữ liệu
đ ư ợ c sử d ụ n g b icu d iễn dừ liệu trong cơ sơ dừ liộu có hiộu q u á k h ỏ n g \ à hộ
thống có kha n ăn g th ao tá c trên các c ấ u trúc d ữ liệu này m ột c ác h h iệu q u a nhu
the nào.
B ộ quan lỷ lưu trữ là m ội m òdun chương iriiih cung c ấ p g ia o d iẹ n g iừ a các
dữ liệu đirợc lưu trừ tro n g cơ sơ d ữ liệu m ứ c thấp \ à các ch ư ơ n g irin h ứ n g dụng
hay c ả c iru y v ấn đ ư ợ c d ê trinh đ ố i vớ i hệ ihống. Bộ quan Iv lưu i n ì c ó Irách
nhiộm tucm g tác vớ i bộ quan lý lộp. D ữ liệu thô đ ư ợ c lưu trữ trô n đ ĩa từ sư dụng
hẹ thống x ử iý tệ p thưcm g đ ư ợ c cung cấp b ời m ột hệ điều hành n ào d ỏ . B ò quan
lý lư u trừ dịch các lộnh c u a ngôn n g ừ D M L k hác nhau thành c á c lệ n h hộ Uiong
xừ lý tệ p ở m ứ c thấp. D o vậy , b ộ quán lý lu u trữ có trách nhiộm lư u trừ , tim
kicm v à cập n h ật d ũ liệu ư o n g cơ sơ d ữ liệu nả}'.

1.2.3. K iến trú c củ a m ột h ệ quản trị c ơ s ớ dS* liệu

T ro n g p h ần này , chủng ta se phác thao kiển trú c c u a m ột hộ q u á n trị c ơ sơ
d ữ liệu dién hinh. C h ù n g la cũng sỗ nhin ihay cách Ihức m ột hệ q u a n iri c ơ sơ
dữ liộu x ử lý c á c c â u hòi v à các th ao lác khác đồi \ Ớ1 cơ sơ d ữ liộu. C ô n g nghệ
dối VỚI việc cài đ ặl m ột hệ quàn trị c ơ sơ d ừ liệu klìông thuộc p h ạm v i c u a cuốn
sách này. H ơn n ữ a , ch ú n g ta chí lậ p trung vào vấn đ ể c á c c ơ s ở d ữ liộu đu ợ c
th iết kế và đ ư ợ c s ử dụng m ộ t cách hiệu quá như thể ỉiào.
H in h 1,3 chi r a c á c thành phần chu yếu c u a m ọt hệ quan trị c ơ s ớ d ữ liệu.
T ại đ áy c ủ a kiển ưúCy ch ú n g la nhin thấ>' m ột sự bicu diễn c u a th iế t b ị n h ớ ngoài
(th eo qui ư ớ c, th iếl bị n hớ ngoải ờ dây lả cả c đĩa từ) lưu irữ c ả c dũ liệ u vả SICU

d ữ liệu. C hú ý rằn g thành phần n ày ch ử a không chỉ các dữ licu d ư ợ c ỉưu irữ
trong c ơ sở d ữ liệu m à cả c á c siẻu d ữ liệu, tứ c là các ih ô n g tíii vè c ấ u irú c cu a cơ
s ơ d ữ Hệu. Ví đ ụ , nếu m ột hộ quan irị cơ sơ dữ !iệu là !iệ q u an tn c ơ s ơ d ữ licu
q u an hẹ, c á c siêu d ữ liệu b ao gồm tên c u a các quan hệ. lên c á c th u ộ c lính cua


18


các q u an hộ v à c á c kicii dữ liệu dồi với các tlìuộc lính này. T h ô n g tỉìirờiìg. m ột
hộ q u an trị c ơ s ơ d ữ liệu bcio tri niộl sé clìi dẫn đối với dữ liệu. MỘI chi dẫn là
m ọt c ấ u tn ic d ữ liệu g iíip clìo viộc tim kiồm c á c klìoan m ục d ữ liộii m ộl cách
Iilianh c h ó n g vớ i các điêu kiộn clio ta rớ c, MỘI \ í dụ chiuìg nhất là m ội chi dan
cho p h ép tim kiổm c á c bộ cu a m ột quan hộ vớ i m ột g iá Irị cho irirớc đối với mội
trong c á c tlìiiỏc lính cu a quaiì hệ. C ác chi dẫn là m ột phần c u a du liệu lưu trữ ^'à
sự m ò la c á c th u ộ c líiili nào đ ư ợ c chì dần lá m ộ t phần cu a các siêu d ữ ỉiệu.

C ác thav dòi sơ dồ

C ác (hav đòi d ừ liêu

H ình 1.3: C á c th ành phần chính củ a m ộ t h ệ quán trị c ơ s ớ d ư liệu

T rong hinli 1.3. ch ú n g ta cung tilùn ih ấy m ột b ộ quan lý lưu trữ m à lìhiẹni
vụ c u a nó là lấ> ni c á c llìôiig tin đ ư ợ c yêu c ẩ u tìr lìlìững ihiết bị lưu Irù d ữ liệu
v à lha> dôi Iiliững th ô n g tin này khi dư ợ c y èu cầu bơi các m ứ c trẻ lì nó cu a hệ
ihỏng, C hú n g ta cũ n g ti]ìin Iháy IIIỘI thành p h an diiợ c gọi là bộ XIT lý câu lioi
m ặc dù lẻ n gọi n ày là kliỏiig lìoàn loàn chính xác, B ộ x ư lý c â u hoi đicu klìièn
k h ô n g chi c á c c â u hoi m à



cảc )'êu

c ầ u th ay đôi d u liệu hav siêu dữ liệu.


N hiệm vụ c u a lìó là lim ra

m ọt

cách tối

n h ất luộl thao tác đ ư ợ c y êu cầu và phát

ra c á c lộnh đổi v ới bộ quan lỷ liru Irữ đê thự c thi th ao lác đỏ.
llià n h p h ần bộ q u an trị g iao dịch cỏ trác h Iiliiệm đam b ao tíixli loàn vẹn
cua hộ tlìổng này. N ó phai dam b ao rằn g n iộ l sổ th ao lác tlìực liiộn dổng thời
kh ông can trơ inỗi th ao lác k h ác \ à hệ thống sẽ không m ấl dữ liệu tlìậni chí khi
lỗi hệ ihống \ ã \ ra. N ó lư ơiig tác với bộ x ư lý cắii lìòi, do vậy nỏ phai b iếl dữ
liệu tiào đ ư ợ c tliao tác bơi

các

độn g và lìỏ có th ê c ầ n tliiểl làin

i]\ẵ0 lá c

hiện thời d ẻ tráỉili sự dụiìg đ ộ các hành

trề m ột sổ tru\* v ấn rủ)ầi dịnlì Kay m ội sổ th ao lác

cập n h ật đê c á c đụ]\g đ ò n ày k h ô n g \ ã y ra, N ó tiỉơitg tác với bộ quãii Iv lưu trữ

19



bời vi các s ơ đ ô đôi v ó i việc b áo v ệ dữ liệu thư ờng kéo th eo việc lưu iTŨ m ộl
n h ậl k \' các thay dốt đối với d ữ ỉiệu. Bởi v iệ c sẳp thử lư cảc ihao lác m ôl cách
thự c sự, n h ậ t k ý n ày sẽ c h ứ a m ột bản ghi đối với m ỗi thay đôi đê sau khi g ăp lồi
hệ ỉhống, c á c thay đồi ch ư a đ ư ợ c ghi v ào đ ĩa có thê đ ư ợ c th ự c hiện lại
T ại dinh củ a kiển trú c, ch ú n g la n h ìn th ay b a kiêu th ao tá c đồi với h ệ quán
trỊ cơ sờ d ữ liệu này.
1.

C ác tnxỴ vấn: Đ ẳy lả c á c thao tác hòi dáp vể đ ữ liêu đ ư ợ c lưu irữ Irong
cơ sơ d ử liộu. C h ú n g đ ư ơ c sinh ra theo hai cảch k h ác nhau


T h ô n g q u a m ột g ia o điên ư u y vần chung. Vi du. m ột h ệ q u a n tri cơ
sơ dữ liêu quan h ê cho phép ngư ời sư d ụ n g đánh các tru y vẩn SQ L
m à nỏ đ ư ợ c chuyẻn q u a b ộ x ừ lý cáu hoi v à đ ư ợ c trả \ờ\.



T h ỏ n g qua c á c g iao diện ch u ơ n g trinh ứ ng dụng M ọt hệ q u án ư i
c ơ sờ dữ liêu đíến hinh cho phcp những người láp trioh viểí các
chưcm g trìn h ứng dim g gọi đến hẹ q u a r trị c ơ s a d ữ liộư n ảy và
tru y vấn c ơ s ơ d ữ liệu. C ác ừ u v vấn d ư ợ c đê trinh th ô n g q u a m ột
g ia o diện đ ặ c b iệt c ó thể c h ứ a cảc hộp đồi thoại. M ọi ngư ờ i sư
dụng k h ô n g thê hòi các c á u hòi tuy ý thông qua giao diện này.
n h ư n g nói chung sẻ dễ dàng h ơ n dổi với người sừ đụng khi hòi m ọt
câ u hói th ích hợp th õ n g q u a g iao diện này so v ới việc phái viếl m ôí
truy vấn trự c tiếp bờ i SQL.

2.


C ác c ậ p lìhậí d ữ liệu. Đ ây lả c á c thao tác thay đôi đ ữ liệu, vi dụ thêm ,
x o á, sừ a đồi d ữ liệu trong c ơ s ở d ữ liệu. G io n g như các truy vấn,
ch ú n g c ó ihé đ ư ợ c p h á t ra h o ặc thông qua m ột g iao diộn chung hoặc
thông qua g iao diện c u a m ột ch ư ơ n g trinh ứ ng dụng.

3.

C á c thay đổi s ơ dồ. C ác lệnh này Ihường d ư ợ c p h ải ra h ởi m ọt người
s ù d ụ n g đ ư ợ c c ẩ p pliép^ th ư ờ n g lá những ngư ờ i quan trị c a sớ d ừ liệu
m ới đ ư ợ c p h ép thav đôi sơ đ ồ c ù a cơ sở dữ liêu hay tạ o lạp m ội c ơ sơ
d ư liệu mới.

L 2 .4 . N g ư ờ i quản trị c ơ sở d ữ liệu

M ột tro n g rihừng lý do ch ín h đối v ới việc sứ đụng các h ệ q u àn ư-ị c a sơ dữ
hộu lả c ó m ột sự điều khiền tậ p tn u ig c á các d ữ liệu vả c á c ch ư ơ n g trinh Iruy
n h ập d ư liệu này. M ột con n g ư ờ i có ư á c h nhiệm điểu kiển m ộ t các h tạ p tn in g
toàn b ộ hệ th ố n g đ ư ợ c gọi là n g ư ờ i q u ả n trị c ơ sờ d ữ liệu. C ác nhiộm v ụ của
ngư ở i quản frị c ơ s ờ dữ liệu này b ao gồm:
• Đ ịnh n g h ĩa sơ đồ. N g u ờ i q u án trị c ơ sờ dữ liệu lạ o lạp c á c s ơ đồ cợ s ỡ d u
liệu gốc b a n g cách viết m ộl lập c ả c đinh nghĩa m ô tá c á c c ắ u triic d ữ liệu

20


m à ch ú n g d ư ợ c dịch bơi bộ dịch D D L ihành m ột tậ p các b a n g d ư ợ c lưu trữ
m ộ t cách lâu d ài trong lử điên dữ liệu,
X á c định cau trú c lưu trữ và phương pháp Im y nhập. N g ư ờ i quan trị c ơ sò
d ữ liệu tạ o lậ p các cấu Irủc luu irữ và các p h ư ơ n g pháp tru y nhập thích hợp
b ằ n g cách v iếl m ội lập các định nghĩa nià ch ú n g d ư ợ c dịch bởi bộ dịch

ngô n n g ữ định nghĩa d ữ liêu và lưu Irữ dữ liệu.
T u y ê n b ồ ủy quyên truy nhập dữ liệu. Vi ộc tuyên b ồ c á c kiêu u ỳ quyền
k h ác n h au cho phép ngư ời quan trị c a sơ d ữ liệu

qui định

n h ữ n g b ộ phận

n ào c ù a cơ sờ d ữ liệu những nguờ i su dụng khác n h au cỏ thể đ ư ợ c truy
n hập. N h ữ n g th ô n g tin uy quvền này được c ấ t g iữ tro n g m ọ l cấu trú c hệ
th o n g đạc b iệt Jià zò Ihc iiuợc .Ta củ u bới hộ c a .iò c.ữ líẹu b i t zíỉ

lề o

m ộ t tru> n h ạp d ữ liệu định đ\ vào hẹ thống.
Đ ặ c tá các ràn g b u ộ c toàn vẹn, Các g iá trị dữ liêu

d ư ợ c lư u

trữ trong cơ sờ

d ữ liệu th ư ờ n g phải Ihoá m ãn những ràn g buọc toản vẹn n h ất đinh. V ỉ dụ,
ch an g h ạn s o g iờ làm việc cu a m ột nhân v iên trong m ộ t tu ần k h ậ n g v u ợ t
q u á 80 giờ. M ội ràn g buộc như vẳ> phái d ư ợ c đ ặ c tá m ột cách tư ờ n g m inh
b ờ i ngư ò i q u ản tri cơ sơ d ử liệu. C ác ràn g buỏc to àn vẹn n ày đ ư ợ c c ấ l giữ
Irong m ộl c ấ u trú c hê (hổng dặc biệt m à có thê d ư ợ c tra cứ u b ới hệ cơ sơ
d ữ liệu b ất c ứ khi nào m ột cập nhật d ữ liệu xáy r a trong h ệ thong,

.


1.2.5. N h ữ n g n g ư ò i s ử d ụ n g c ơ s ở (iữ liệu

M ụ c đích chíiih c ù a m ột hộ cơ s e d ữ liệu là cung cấp m ọt m ôi In rờ n g dối
với tim kiếm th ô n g tin từ c ơ sớ dữ liệu v à iưu trữ n h ữ n g th ô n g tin m ới v ào cơ
s ớ d ữ hệu. C ó b a n h ó m ngư ờ i sữ dung khác nhau đ ư ợ c phân b iệ t bờ i cách họ
m ong m uốn tư ơ n g tá c VỞI hệ thống,
• N g ư ờ i lập trin h ứ n g dụng.
Đ âv là n h ử n g ngư ờ i chuyên nghiệp v ề iná> tíiJ \ lư ơ n g lác với hộ thống
thông q u a c á c lời gọi D M L m à dược nhúng irong m ột ch ư ơ n g trinh đ ư ơ c
viết bỡi n g ỏ n n g ữ chủ (ví dụ P ascal,

c, P L /K

C obol). C ác ch ư ơ n g trình này

đ ư ợ c gọi ch u n g là c á c chư ơ ng trinh ứng dụng.
D o cú p h áp c ủ a D M L thư ờng d ư ơ c b iều thị khác v ới cú p h áp c ủ a ngôn
ngữ chu, c á c lời gọi D M L Ihường đ ư ợ c b ắl đ ầu b ằn g m ộ t ký hiộu đ ă c biột
sao cho doạiì m ã lư ơ n g ứ n g có ihé đ ư ợ c san sinh. M ộ t b ộ liền x ừ lý dặc
b iật đ ư ợ c g ọ i là bọ tiền địch D M L , biến đồi các chi thị D M L th àn h c á c lời
gọi thù tục ch u ần trong ngỏn ngữ chủ. C h ư ơ n g trình k ết quả sa u đ ó đ ư ợ c
ch ạy th ô n g q u a ch ư ơ n g trinh dịch ngôn ngữ ch ù m à n ỏ sinh r a đ o ạn m ẵ
đích tư ơ n g ứng.

21


C ó m ột sổ kiêu ngôn n g ữ lậ p trinh dặc bí ÔI tô h ơp các cấiì Iríic diều
khiên cu a c á c ngôn ngữ lự a P ascal với các cấu trú c đicu khiôn thao lác mỏt
đối lư ợ n g c o sơ d ữ liệu, C á c ngôn ngữ nà>’ dôi khi d ư ợ c gọi là cảc ngôn

n g ữ thể hệ th ứ tư . chúng th ư ờ n g chứ a các dặc útửi dặc biột dc dàng san
sinh ra các biêu m ẫu vả hiên ihị dư liệu trcn m àn hinh H au hct các h ậ quan
tn cơ sơ d ữ liệu thư ơng m ại đểu chứ a m ộl tigôn ngữ thế hộ th ứ lư.
N gườ i phân tích dử liệu.
Đ ây là những người sư dụiig lương lác với hộ ih o n g k h ô n g ih ô n g qua
c á c ch ư ơ n g In n h ứ ng dụng. T h ự c chất họ phát bicu c á c >ẽu cầu cua họ bơi
m ội ngôn n g ữ tru y van d ử liộu. M ồi m ội truy vần như váy đ ư ợ c đ ẽ trinlì
dối vớ i bỏ xir lý câu hoi m ả nhiệm

cu a nó là phán lách chi ihỊ D M L

thảnh các lệnh m à b ộ quan lý lưu trữ có thẻ hiẽu đư ợc. C ác nhả phán tích
d ệ (rình c ả c Iruy vấn đẽ khai thác dữ liệu đ ư ợ c xếp v ào Iihóm ngư ờ i sư
d u n g này.
N g ư ờ i sư dụng cuồí,
Đ ây là n h ữ n g ngư ờ i s u d ụ n g binh ihưcmg íư ơng lá c với hộ thống bơi
VIỘC th ự c hiện m ột trong c á c ch ư ơ n g trinh ứ n g dụng có sẵn dã đư ơ c viể( lừ

trước.

K3.

Sự phân loạì các hệ cơ sở d ữ liệu
T rong th ự c tể, c á c tổ chứ c th ư ờ n g đã có sẵn mộ( chiến lư ợ c dối với việc

Iriến khai và s u dụng các hộ c ơ s ớ dữ liệu. V ới qui m ô nhó, m ột ngư ờ i sữ dụng
đơn lẻ c ó ihỗ p h ái Iriến m ộl hệ c ơ s ơ d ữ liệu ihanh toán đơ n lò irên m ộl m áy linh
cá nhân đẻ q u ản lý m ột cô n g việc k in h doanh nhò. V ới qui m ô lớn, m ột có n g iy
rất lớ n c ó thồ x ây d ự n g m ội hệ c ơ sờ dừ liệu Icm b ao gồm nhièu c ơ sơ d ữ liệu
nhò, phân tán ở nhiểu nơi c ác h x a nhau \ à dược m óc nối với nhau.

C ó hai loại kiến trú c hệ c ơ s ơ dữ liộu: lập trung và phân lán. T ro n g phần
nảy ch ủ n g ta sẽ m ỏ tà m ộl số kiểu ch u n g nhất cu a mỗi loại và chi r a c á c ư u điêm
cũng như các n h ư ợ c điém tiềm tả n g cu a chủng.

1.3.1. C ả c h ệ c ơ s ờ d ữ liệu tậ p t r u n g

V ới m ội hệ cơ sơ đữ liệu lập tn m g , tập tất cá các dữ liệu đ ư ợ c dỊiih vỊ tại
m ôt trạm d ơn le. N h ữ n g n g ư ờ i sư d ụ n g tại các trạm lừ x a nói ch u n g có th ể Iruv'
nhập c ơ sờ đ ữ liệu Ihông q u a c á c cô n g cụ truyèn th ô n g d ữ liệu. C á c hộ c ơ sơ dữ
lỉôu tậ p trung cu n g c ấ p m ộl sự k iếm so át iớn hon đổi với việc tru y n h ập v ả cập

22


Iihậl đ ữ liệu so với các hệ cợ sơ dữ liộu phán tán. n h ư n g ch ú n g c ó thẽ bị m ẳc lỗi
nhicu hơn do ch ú n g phụ thuộc vào tinlì sẵn sáng c u a c á c lài nguyôn. H inh 1.4
chi ra ba kiêu ch u n g nhấl cu a các hô c ơ s ở dữ liệu lậ p trung; hộ c ơ sơ dữ liệu cá
nhân, hệ c ơ sơ d ữ liêu tn in g lâm và hộ cơ s ơ dữ liệu khách/chu.



H ộ c ơ sớ d ữ liệu cá nhăn

M ột hệ cơ sơ du liệu cá nlìán lá m ột kicu hộ c ơ s ở dữ liộu rất quen thuỏc
đối với lìẳu hết các sinh MCII (H inh 1 4a). C ác hộ cơ s ơ d ữ liộu c ả nhân
thư ờ ng c ỏ in ọ í n gư ờ i sư dung đơn Ic m ả anh la \isa th iểl kể và tạo iạp c ơ sơ

d ữ licu, v ừ a c ậ p nhậl cơ sơ d ừ liệu vả báo iri dfr liệu, đồng thời anh ta cũng
ià ngư ời lạp và hiên th; báo cáo. N ói cách khác, anh ta vT>a lả n g ư ờ i quan trị
c o sơ dữ liệu. w a là ỉigười viết chư ơ ng trinh ứng dung, đổng th ài cũng là

ngư ời sư dụng cuối cu a hệ. T hông ihường. hộ c ơ sở d ữ liệu n ày hỗ irợ m ột
ứ n g dụng h ay m ộl sồ giới hạn các ứng dụng đơn lé.
C ác ứng dụng chung n h ất cu a các hộ cơ sơ d ữ liộu c á nhân lả c á c công
việc kinh d o an h nho. C ác ứng dụng điên hitiiì b ao gồm quán lý th an h toán,
kiểm kê h àn g h o á v à quan lý kháclì hàng. V iệc p h ái iricn và s ư d ụ n g các hê
c ơ sơ dữ liệu c á n h ân lả khá dơii g ian ^•à dễ dàng
C ác hệ cơ s ơ d ữ liộu cá n h ân đ ư ợ c sư đụng trong c á c tô ch ứ c nho v à VTja.
Tu>' nhiên, ừ o n g khi phát triển các ứ ng dụng tiliư v ậy , n h ữ n g n g ư ờ i sư dung
có nguy c ơ phải chịu rui ro khi tạ o ra ‘*các hòn dáo tụ trị” . H ơ n n ữ a , d ữ liệu
khó có ihé đ ư ơ c ch ia sc cho nliiồu ứ n g dụng k hác nhau. N ểu c ỏ m ộ i riiìu cẩu
chia sc dữ liệu, cơ sơ dữ liệu cu a hô I\à> phai d ư ợ c lư u irữ irên m ội m áy chu
cơ sơ d ừ licu h ay Irong m ôl m ang cu c bô.



Hộ c ơ s ở d ữ liệu tru n g tâm

T rong c á c lố chứ c lớn, d ữ liẹu nià hầu h ết c á c ứ n g d ụ n g có thề truy
Jihạp dư ợ c lưu Irừ trôn m ội m áy tinh irung lâm (H in h 1.4b). T ro n g nhiều hệ

ihống, những n g ư ờ i s ư dung lử x a cỏ thô lru \ n h ập c ơ s ở d ữ liêu này thòng
qua các thiốt bị dấu cuối vả c á c m óc nổi tn iy cn ih ô n g dữ liệu. T u ỳ thuộc vào
qui m ô c u a lè ch ứ c, m ảv lính Irung lâm này th ư ờ n g là m ột dàn h ay m ọt m áy
vi tíiứi. C ác hộ c ơ sơ d ữ liộu irung tâm thư ờng iư u trữ c á c c ơ s ờ dữ liệu tích
hơp rất lớ n v ả đ ư ợ c nhiểu ngư ờ i sứ dụng tn iv nhập. V iệc sử d ụ n g th ư ờ n g có
cu ò n g độ lớ n vớ i h àn g Irãm g iao dịch trong m ột g iâ y đ an g đ ư ợ c xư iý (m ội
số hê thống c ó th ể h ỗ Irợ m ộl nghin giao dịclì tro n g m ộ i giây). C ác ứ n g đung

23



điên lìinh b ao gồm các hê thổng đãng ký g iữ chỗ m áy bn>. các hộ thống
ihỏng tin c u a các c ơ quan tài chinlì và các công t>' p h ái trièn ixlianh.

Cữ

sơ đừ liệu

(a) H ệ c ơ sờ dừ iiệu cá Iiliân

Oỡ ĩiOdừ liệu

ì

(b) H ệ c ơ sơ d ữ liệu trung tâm

Máỵ kiiách

M ạng cục b ộ

Máy kl)ách







Cơ sMáv Mi


Mảy khảch
(c) H ệ Cơ SỚ d ữ liệu khách/chù

H ìn h 1.4: C á c h ệ c ơ s ỡ d ữ liệu tậ p tr u n g

24