Tải bản đầy đủ (.pdf) (237 trang)

bài giảng cơ sở dữ liệu nâng cao (đồngthị bích thủy)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.21 MB, 237 trang )

Buổi # 2
(lớp TH08/1)
C
ơ
s

d

li

u nâng cao
Đồ
ng Th

Bích th

y
14/9/2010
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
2
Nhắc lại ý chính tuần trước
THIẾT KẾ CSDL:
• quan niệm
• lô-gíc
• vật lý
Lựa chọn lược ñồ
Tiêu chí hiệu quả
Yêu cầu về
thông tin/dữ
liệu


Yêu cầu khai
thác/ xử lý
Đặc trưng
của Hệ quản
trị CSDL
Cấu trúc CSDL
hiệu quả, phù
hợp với ứng dụng
và môi trường
triển khai
Cấu hình phần cứng /
Đặc trưng của
hệ ñiều hành
THU THẬP-PHÂN
TÍCH NHU CẦU
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
3
Nhắc lại ý chính tuần trước (2)
Thi
ế
t k
ế
quan ni

m
Thi
ế
t k
ế

lô-gíc
Thi
ế
t k
ế
v

t lý
Lược ñồ CSDL vật lý
Yêu cầu về
thông tin/dữ
liệu
Yêu cầu
khai thác/
xử lý
Đặc trưng
của hệ
QTCSDL
Đặc trưng của
phần cứng
và HĐH
CHƯƠNG II:
Giai ñoạn thiết kế quan niệm
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
5
Nội dung tuần này
 II.1 Dẫn nhập
 Quy trình thiết kế quan niệm tổng thể
 Giả thuyết Quan h ph quát

 Pth trong vai trò RBTV - Cơ chế kiểm tra
pth
 II.2 Các mục tiêu của thiết kế quan niệm
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
6
II.1 Dẫn nhập
 Đu vào: kết quả của giai ñoạn phân tích
nhu cầu, có thể là:
 Sơ phác cấu trúc CSDL gồm các quan hệ con
Q’
1
, Q’
2
, …Q’
m
và các phụ thuộc dữ liệu ñịnh
nghĩa trên mỗi quan hệ con: D’
1
, D’
2
, … D’
m
:
C
0
’ = {<Q’
1
, D’
1

>, <Q’
2
, D’
2
>,…<Q’
m
, D’
m
>} (a)
 Hoặc một sơ phác tổng thể:
C
0
= <Q
0
, D
0
> (b)
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
7
II.1 Dẫn nhập (2)
 Thiết kế CSDL mức quan niệm:
Biến ñổi ñầu vào thành một cấu trúc CSDL quan
niệm chất lượng hơn, dựa trên một số tiêu
chuẩn thiết kế
(a) (b)
C
0
’ = {<Q’
i

,
D

i
>}
C
0
= <Q
0
,
D
0
>
Thiết kế CSDL mức
quan niệm
C
= <Q
j
,
D
j
>



tiêu chuẩn thiết kế
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
8
II.1 Dẫn nhập (3)

Gi thit quan h ph quát
 Là nền tảng của mô hình quan hệ và lý
thuyết phụ thuộc dữ liệu
 Khái niệm quan hệ phổ quát:
 Mỗi thế giới thực của ứng dụng 

 một quan
hệ duy nhất (= quan hệ phổ quát, ký hiệu U)
 Quan hệ phổ quát tập hợp tất cả các thuộc tính
của môi trường ứng dụng
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
9
II.1 Gi thuyt quan h ph quát (2)
 Nếu cấu trúc sơ phác CSDL là C
0
’ (trng
hp a), ngầm hiểu quan hệ phổ quát U như
sau:
 U chứa tất cả các thuộc tính của các quan hệ
con Q’
i
.
 Mỗi quan hệ con Q’
i
là kết quả của phép chiếu
của U lên Q’
i
+
:


∀∀
∀i, Q’
i
= U[Q’
i
+
] (Q’
i
+
: tập thuộc tính của Q’
i
)
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
10
II.1 Gi thuyt quan h ph quát (3)
 Nếu cấu trúc sơ phác là C
0
(trng hp b),
khái niệm quan hệ phổ quát ñã ngầm ñược
sử dụng.
 H qu:
 Mỗi một thuộc tính có một ý nghĩa duy nhất.
Dù thuộc tính này hiện diện trong quan hệ con
hay quan hệ phổ quát, ý nghĩa của nó vẫn như
nhau.
 Giữa hai thuộc tính chỉ có một mối kết hợp vớ
i
một ý nghĩa duy nhất.

© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
11
II.1 Gi thuyt quan h ph quát (4)
 Ví dụ 2.1: Cho môi trường ứng dụng với 3
quan hệ con như sau:
<ĐẶT_HÀNG (Mã_ĐH, Ngày); F
ĐH
= {Mã_ĐH →
→→
→ Ngày}>
<TK_HG_GIAO(Mã_HG, Ngày, Lượng);
F
TKHG
= {Mã_HG, Ngày →
→→
→ Lượng }>
<CHI_TIẾT_ĐẶT_HÀNG (Mã_ĐH, Mã_HG, Lượng);
F
CTĐH
= {Mã_ĐH, Mã_HG →
→→
→ Lượng }>
Các thuc tính Ngày và Lng có ý nghĩa khác nhau
trong nhng quan h khác nhau.
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
12
II.1 Gi thuyt quan h ph quát (5)
 Ví dụ 2.1 (tt):

 Nhp nhng v ng nghĩa, dn ñn kt qu sai
khi áp dng lut dn cho pth trên toàn cc:
Mã_ĐH →
→→
→ Ngày (ĐH)
MãHG, Ngày (GH) →
→→
→ Lượng (GH)
 Phi ñt tên li cho các thuc tính:
Ngày trong ĐẶT_HÀNG thành Ngày_ĐH
Ngày trong TK_HG_GIAO thành Ngày_TK

MãHG, Mã_ĐH

→→
→ Lượng (ĐH)
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
13
II.1 Gi thuyt quan h ph quát (6)
 Ví dụ 2.2:
Cho quan hệ NHÂN_VIÊN( Mã_NV, Tên_NV, Ngày)
 Ý nghĩa mối kết hợp giữa Mã_NV và Ngày :
Ngày sinh của nhân viên
 Mối kết hợp này là duy nhất : nếu cần thêm
thông tin về ngày tuyển dụng, ta phải thêm một
thuộc tính mới Ngày_TD, không thể thêm một
ý nghĩa khác cho mối kết hợp giữa Mã_NV và
Ngày.
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin

Trường ĐH Khoa Học Tự Nhiên - HCM
14
II.1 Dẫn nhập (4)
C ch kim tra pth
 Phụ thuộc hàm: một loại ràng buộc toàn
vẹn quan trọng trong CSDL quan hệ
 Cần chọn cấu trúc CSDL sao cho việc kiểm
tra pth hiệu quả nhất 

 tiêu chuẩn thiết kế
quan trọng
 Xem xét:
 Cơ chế kiểm tra pth nào ñược hệ quản trị
CSDL hỗ trợ?
 Thời ñiểm cần kiểm tra pth trong quá trình khai
thác CSDL? Lúc cập nhật? Lúc truy vấn?
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
15
II.1 C ch khóa – c ch ch
mc trong h QTCSDL
 Định nghĩa:
Cho một quan hệ Q, một khóa K của Q, và I, một
chỉ mục duy nhất ñịnh nghĩa trên Q
 Cơ chế khóa là một cơ chế có sẵn của hệ quản
trị CSDL nhằm ñảm bảo:

∀∀
∀q, q’ ∈
∈∈

∈ Q sao cho q ≠
≠≠
≠ q’ , q.K ≠
≠≠
≠q’.K
 Cơ chế chỉ mục với giá trị duy nhất là một cài
ñặt khác ñảm bảo tình trạng tương tự như cơ
chế khóa:

∀∀
∀q, q’ ∈
∈∈
∈ Q sao cho q ≠
≠≠
≠ q’ , q.I ≠
≠≠
≠q’.I
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
16
II.1 C ch kim tra ph thuc
hàm (3)
 Cơ chế khóa ñảm bảo kiểm tra hiệu quả
các phụ thuộc hàm dạng K→
→→
→A, với
A∈
∈∈
∈Q
+

và K là khóa chính của Q
(Không cần duyệt tuần tự qua tất cả các
bộ trong TQ)
 Cơ chế chỉ mục duy nhất ñược dùng ñể
kiểm tra hiệu quả K’→
→→
→A, với K’ là một
khóa khác của Q
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
17
II.1 Hp l hóa tình trng mt
quan h
 Cho Q(ABC) với khóa là A, và tập phụ thuộc
hàm ñược ñịnh nghĩa trên Q:
F = {B→
→→
→C, A →
→→
→BC}
 Cho một tình trạng của Q:
c
1
b
2
a
4
c
3
b

3
a
3
c
1
b
2
a
2
c
1
b
1
a
1
CBA
TQ:
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
18
II.1 Hp l hóa tình trng ca
mt quan h (tt)
 Tình trạng TQ ñược xem là hợp lệ ñối với F
nếu TQ thỏa tt c các pth của F.
 Kiểm tra B →
→→
→ C, ñảm bảo:

∀∀
∀q, q’ ∈

∈∈
∈ Q, nếu q.B = q’.B thì q.C = q’.C
 Cần duyệt qua tất cả các bộ của TQ ñể kiểm tra
 Tốn kém và mất thời gian khi TQ lớn
 Kiểm tra A→
→→
→ BC: nhờ cơ chế khóa của
HQT CSDL, việc kiểm tra pth này sẽ hiệu
quả hơn.
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
19
II.1 Hp l hoá mt bin ñi
tình trng ca Q
 Cho một tình trạng TQ1 ñã hợp lệ
 TQ1 ñược biến ñổi thành TQ2 sau một vài
thao tác:
 Các thao tác biến TQ1 thành TQ2 có thể gây
ra tình trạng không hợp lệ cho TQ2 

 cần
phải hợp lệ hóa TQ2 (= kiểm tra lại xem F có
còn ñược thỏa trong TQ2)
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
20
II.1 Hp l hoá mt bin ñi
tình trng ca Q (tt)
 Các thao tác có thể xảy ra trên TQ1:
 Thêm một bộ: phải kiểm tra lại các pth trong F .

 Xóa một bộ: không cần kiểm tra lại pth (nhưng
có nguy cơ bị mất thông tin)
 Sửa một bộ: phải kiểm tra lại pth và có nguy cơ
bị mất thông tin (Sửa = Xoá + Thêm)
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
21
II.2 Các mục tiêu thiết kế quan
niệm
 Hai tiêu chuẩn quan trọng cần ñạt ñược
trong quá trình thiết kế CSDL ở mức quan
niệm:
 Cấu trúc CSDL kết quả (ñầu ra của giai ñoạn
thiết kế mức quan niệm) cần ñạt dạng chuẩn
cao nhất
 Cấu trúc CSDL kết quả phải tương ñương với
cấu trúc ban ñầu
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
22
II.2 Các mục tiêu thiết kế (2)
 Tiêu chuẩn về dạng chuẩn:
 Giảm tối ña sự trùng lắp thông tin 

 tránh
ñược một số bất tiện khi cập nhật CSDL
 Các phụ thuộc dữ liệu ñược kiểm tra dễ
dàng, ñơn giản và tương ñối ít tốn kém nhất
 Tiêu chuẩn tương ñương:
 Đảm bảo các thông tin trong quan hệ phổ

quát sẽ ñược tìm thấy ñầy ñủ trong CSDL của
cấu trúc kết quả (gồm nhiều quan hệ con).
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
23
II.2 Các mục tiêu thiết kế (3)
 Một CSDL thỏa mãn hai tiêu chuẩn về DC và tính
tương ñương, ñảm bảo cho việc khai thác nó
ñược thuận lợi trên cả ba phương diện:

Truy v

n: tiêu chu

n t
ươ
ng
ñươ
ng
ñả
m b

o các
thông tin
ñượ
c truy xu

t t

CSDL là nh


ng thông
tin
ñ
ã
ñượ
c phân tích.

C

p nh

t: Tiêu chu

n d

ng chu

n gi

m b

t các
tình hu

ng thông tin mâu thu

n sau khi c

p nh


t.

Ki

m tra RBTV: c

hai tiêu chu

n
ñề
u h
ướ
ng
ñế
n
m

c tiêu là ki

m tra RBTV d

ng ph

thu

c d

li


u
ñượ
c thu

n l

i.
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
24
Câu hỏi?
Buổi #3
(lớp TH2008/1)
C
ơ
s

d

li

u nâng cao
Đồ
ng Th

Bích th

y
21/9/2010

×