Buổi # 2
(lớp TH08/1)
C
ơ
s
ở
d
ữ
li
ệ
u nâng cao
Đồ
ng Th
ị
Bích th
ủ
y
14/9/2010
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
2
Nhắc lại ý chính tuần trước
THIẾT KẾ CSDL:
• quan niệm
• lô-gíc
• vật lý
Lựa chọn lược ñồ
Tiêu chí hiệu quả
Yêu cầu về
thông tin/dữ
liệu
Yêu cầu khai
thác/ xử lý
Đặc trưng
của Hệ quản
trị CSDL
Cấu trúc CSDL
hiệu quả, phù
hợp với ứng dụng
và môi trường
triển khai
Cấu hình phần cứng /
Đặc trưng của
hệ ñiều hành
THU THẬP-PHÂN
TÍCH NHU CẦU
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
3
Nhắc lại ý chính tuần trước (2)
Thi
ế
t k
ế
quan ni
ệ
m
Thi
ế
t k
ế
lô-gíc
Thi
ế
t k
ế
v
ậ
t lý
Lược ñồ CSDL vật lý
Yêu cầu về
thông tin/dữ
liệu
Yêu cầu
khai thác/
xử lý
Đặc trưng
của hệ
QTCSDL
Đặc trưng của
phần cứng
và HĐH
CHƯƠNG II:
Giai ñoạn thiết kế quan niệm
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
5
Nội dung tuần này
II.1 Dẫn nhập
Quy trình thiết kế quan niệm tổng thể
Giả thuyết Quan h ph quát
Pth trong vai trò RBTV - Cơ chế kiểm tra
pth
II.2 Các mục tiêu của thiết kế quan niệm
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
6
II.1 Dẫn nhập
Đu vào: kết quả của giai ñoạn phân tích
nhu cầu, có thể là:
Sơ phác cấu trúc CSDL gồm các quan hệ con
Q’
1
, Q’
2
, …Q’
m
và các phụ thuộc dữ liệu ñịnh
nghĩa trên mỗi quan hệ con: D’
1
, D’
2
, … D’
m
:
C
0
’ = {<Q’
1
, D’
1
>, <Q’
2
, D’
2
>,…<Q’
m
, D’
m
>} (a)
Hoặc một sơ phác tổng thể:
C
0
= <Q
0
, D
0
> (b)
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
7
II.1 Dẫn nhập (2)
Thiết kế CSDL mức quan niệm:
Biến ñổi ñầu vào thành một cấu trúc CSDL quan
niệm chất lượng hơn, dựa trên một số tiêu
chuẩn thiết kế
(a) (b)
C
0
’ = {<Q’
i
,
D
’
i
>}
C
0
= <Q
0
,
D
0
>
Thiết kế CSDL mức
quan niệm
C
= <Q
j
,
D
j
>
tiêu chuẩn thiết kế
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
8
II.1 Dẫn nhập (3)
Gi thit quan h ph quát
Là nền tảng của mô hình quan hệ và lý
thuyết phụ thuộc dữ liệu
Khái niệm quan hệ phổ quát:
Mỗi thế giới thực của ứng dụng
một quan
hệ duy nhất (= quan hệ phổ quát, ký hiệu U)
Quan hệ phổ quát tập hợp tất cả các thuộc tính
của môi trường ứng dụng
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
9
II.1 Gi thuyt quan h ph quát (2)
Nếu cấu trúc sơ phác CSDL là C
0
’ (trng
hp a), ngầm hiểu quan hệ phổ quát U như
sau:
U chứa tất cả các thuộc tính của các quan hệ
con Q’
i
.
Mỗi quan hệ con Q’
i
là kết quả của phép chiếu
của U lên Q’
i
+
:
∀
∀∀
∀i, Q’
i
= U[Q’
i
+
] (Q’
i
+
: tập thuộc tính của Q’
i
)
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
10
II.1 Gi thuyt quan h ph quát (3)
Nếu cấu trúc sơ phác là C
0
(trng hp b),
khái niệm quan hệ phổ quát ñã ngầm ñược
sử dụng.
H qu:
Mỗi một thuộc tính có một ý nghĩa duy nhất.
Dù thuộc tính này hiện diện trong quan hệ con
hay quan hệ phổ quát, ý nghĩa của nó vẫn như
nhau.
Giữa hai thuộc tính chỉ có một mối kết hợp vớ
i
một ý nghĩa duy nhất.
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
11
II.1 Gi thuyt quan h ph quát (4)
Ví dụ 2.1: Cho môi trường ứng dụng với 3
quan hệ con như sau:
<ĐẶT_HÀNG (Mã_ĐH, Ngày); F
ĐH
= {Mã_ĐH →
→→
→ Ngày}>
<TK_HG_GIAO(Mã_HG, Ngày, Lượng);
F
TKHG
= {Mã_HG, Ngày →
→→
→ Lượng }>
<CHI_TIẾT_ĐẶT_HÀNG (Mã_ĐH, Mã_HG, Lượng);
F
CTĐH
= {Mã_ĐH, Mã_HG →
→→
→ Lượng }>
Các thuc tính Ngày và Lng có ý nghĩa khác nhau
trong nhng quan h khác nhau.
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
12
II.1 Gi thuyt quan h ph quát (5)
Ví dụ 2.1 (tt):
Nhp nhng v ng nghĩa, dn ñn kt qu sai
khi áp dng lut dn cho pth trên toàn cc:
Mã_ĐH →
→→
→ Ngày (ĐH)
MãHG, Ngày (GH) →
→→
→ Lượng (GH)
Phi ñt tên li cho các thuc tính:
Ngày trong ĐẶT_HÀNG thành Ngày_ĐH
Ngày trong TK_HG_GIAO thành Ngày_TK
MãHG, Mã_ĐH
→
→→
→ Lượng (ĐH)
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
13
II.1 Gi thuyt quan h ph quát (6)
Ví dụ 2.2:
Cho quan hệ NHÂN_VIÊN( Mã_NV, Tên_NV, Ngày)
Ý nghĩa mối kết hợp giữa Mã_NV và Ngày :
Ngày sinh của nhân viên
Mối kết hợp này là duy nhất : nếu cần thêm
thông tin về ngày tuyển dụng, ta phải thêm một
thuộc tính mới Ngày_TD, không thể thêm một
ý nghĩa khác cho mối kết hợp giữa Mã_NV và
Ngày.
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
14
II.1 Dẫn nhập (4)
C ch kim tra pth
Phụ thuộc hàm: một loại ràng buộc toàn
vẹn quan trọng trong CSDL quan hệ
Cần chọn cấu trúc CSDL sao cho việc kiểm
tra pth hiệu quả nhất
tiêu chuẩn thiết kế
quan trọng
Xem xét:
Cơ chế kiểm tra pth nào ñược hệ quản trị
CSDL hỗ trợ?
Thời ñiểm cần kiểm tra pth trong quá trình khai
thác CSDL? Lúc cập nhật? Lúc truy vấn?
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
15
II.1 C ch khóa – c ch ch
mc trong h QTCSDL
Định nghĩa:
Cho một quan hệ Q, một khóa K của Q, và I, một
chỉ mục duy nhất ñịnh nghĩa trên Q
Cơ chế khóa là một cơ chế có sẵn của hệ quản
trị CSDL nhằm ñảm bảo:
∀
∀∀
∀q, q’ ∈
∈∈
∈ Q sao cho q ≠
≠≠
≠ q’ , q.K ≠
≠≠
≠q’.K
Cơ chế chỉ mục với giá trị duy nhất là một cài
ñặt khác ñảm bảo tình trạng tương tự như cơ
chế khóa:
∀
∀∀
∀q, q’ ∈
∈∈
∈ Q sao cho q ≠
≠≠
≠ q’ , q.I ≠
≠≠
≠q’.I
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
16
II.1 C ch kim tra ph thuc
hàm (3)
Cơ chế khóa ñảm bảo kiểm tra hiệu quả
các phụ thuộc hàm dạng K→
→→
→A, với
A∈
∈∈
∈Q
+
và K là khóa chính của Q
(Không cần duyệt tuần tự qua tất cả các
bộ trong TQ)
Cơ chế chỉ mục duy nhất ñược dùng ñể
kiểm tra hiệu quả K’→
→→
→A, với K’ là một
khóa khác của Q
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
17
II.1 Hp l hóa tình trng mt
quan h
Cho Q(ABC) với khóa là A, và tập phụ thuộc
hàm ñược ñịnh nghĩa trên Q:
F = {B→
→→
→C, A →
→→
→BC}
Cho một tình trạng của Q:
c
1
b
2
a
4
c
3
b
3
a
3
c
1
b
2
a
2
c
1
b
1
a
1
CBA
TQ:
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
18
II.1 Hp l hóa tình trng ca
mt quan h (tt)
Tình trạng TQ ñược xem là hợp lệ ñối với F
nếu TQ thỏa tt c các pth của F.
Kiểm tra B →
→→
→ C, ñảm bảo:
∀
∀∀
∀q, q’ ∈
∈∈
∈ Q, nếu q.B = q’.B thì q.C = q’.C
Cần duyệt qua tất cả các bộ của TQ ñể kiểm tra
Tốn kém và mất thời gian khi TQ lớn
Kiểm tra A→
→→
→ BC: nhờ cơ chế khóa của
HQT CSDL, việc kiểm tra pth này sẽ hiệu
quả hơn.
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
19
II.1 Hp l hoá mt bin ñi
tình trng ca Q
Cho một tình trạng TQ1 ñã hợp lệ
TQ1 ñược biến ñổi thành TQ2 sau một vài
thao tác:
Các thao tác biến TQ1 thành TQ2 có thể gây
ra tình trạng không hợp lệ cho TQ2
cần
phải hợp lệ hóa TQ2 (= kiểm tra lại xem F có
còn ñược thỏa trong TQ2)
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
20
II.1 Hp l hoá mt bin ñi
tình trng ca Q (tt)
Các thao tác có thể xảy ra trên TQ1:
Thêm một bộ: phải kiểm tra lại các pth trong F .
Xóa một bộ: không cần kiểm tra lại pth (nhưng
có nguy cơ bị mất thông tin)
Sửa một bộ: phải kiểm tra lại pth và có nguy cơ
bị mất thông tin (Sửa = Xoá + Thêm)
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
21
II.2 Các mục tiêu thiết kế quan
niệm
Hai tiêu chuẩn quan trọng cần ñạt ñược
trong quá trình thiết kế CSDL ở mức quan
niệm:
Cấu trúc CSDL kết quả (ñầu ra của giai ñoạn
thiết kế mức quan niệm) cần ñạt dạng chuẩn
cao nhất
Cấu trúc CSDL kết quả phải tương ñương với
cấu trúc ban ñầu
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
22
II.2 Các mục tiêu thiết kế (2)
Tiêu chuẩn về dạng chuẩn:
Giảm tối ña sự trùng lắp thông tin
tránh
ñược một số bất tiện khi cập nhật CSDL
Các phụ thuộc dữ liệu ñược kiểm tra dễ
dàng, ñơn giản và tương ñối ít tốn kém nhất
Tiêu chuẩn tương ñương:
Đảm bảo các thông tin trong quan hệ phổ
quát sẽ ñược tìm thấy ñầy ñủ trong CSDL của
cấu trúc kết quả (gồm nhiều quan hệ con).
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
23
II.2 Các mục tiêu thiết kế (3)
Một CSDL thỏa mãn hai tiêu chuẩn về DC và tính
tương ñương, ñảm bảo cho việc khai thác nó
ñược thuận lợi trên cả ba phương diện:
Truy v
n: tiêu chu
ẩ
n t
ươ
ng
ñươ
ng
ñả
m b
ả
o các
thông tin
ñượ
c truy xu
ấ
t t
ừ
CSDL là nh
ữ
ng thông
tin
ñ
ã
ñượ
c phân tích.
C
p nh
t: Tiêu chu
ẩ
n d
ạ
ng chu
ẩ
n gi
ả
m b
ớ
t các
tình hu
ố
ng thông tin mâu thu
ẩ
n sau khi c
ậ
p nh
ậ
t.
Ki
m tra RBTV: c
ả
hai tiêu chu
ẩ
n
ñề
u h
ướ
ng
ñế
n
m
ụ
c tiêu là ki
ể
m tra RBTV d
ạ
ng ph
ụ
thu
ộ
c d
ữ
li
ệ
u
ñượ
c thu
ậ
n l
ợ
i.
© Đồng Thị Bích Thủy Bộ môn Hệ Thống Thông Tin
Trường ĐH Khoa Học Tự Nhiên - HCM
24
Câu hỏi?
Buổi #3
(lớp TH2008/1)
C
ơ
s
ở
d
ữ
li
ệ
u nâng cao
Đồ
ng Th
ị
Bích th
ủ
y
21/9/2010