Tải bản đầy đủ (.pptx) (45 trang)

Bai_16_Chuan_Hoa_Luoc_Do_Quan_He docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.16 MB, 45 trang )

BÀI 16:
CHUẨN HOÁ LƯỢC ĐỒ QUAN HỆ
1/45
NỘI DUNG :

Một số khái niệm liên quan
Các dạng chuẩn
Dạng chuẩn 1 (1NF- Fist normal form)
Dạng chuẩn 2 (2NF- Second normal form)
Dạng chuẩn 3 (3NF- Third normal form)
Dạng chuẩn BCNF (Boyce Codd normal form)
Thuật toán tìm dạng chuẩn cao nhất của lược đồ
Mối quan hệ giữa các dạng chuẩn
2/45
NỘI DUNG Chi tiết :

Một số khái niệm liên quan
Các dạng chuẩn
Dạng chuẩn 1 (1NF- Fist normal form)
Dạng chuẩn 2 (2NF- Second normal form)
Dạng chuẩn 3 (3NF- Third normal form)
Dạng chuẩn BCNF (Boyce Codd normal form)
Thuật toán tìm dạng chuẩn cao nhất của lược đồ
Mối quan hệ giữa các dạng chuẩn
3/45
16.1. Một số khái niệm liên quan
Chuẩn hóa:
Là quá trình tách một lược đồ quan hệ thành một tập các
lược đồ con, sao cho quá trình tách là không mất thông tin
và các lược đồ con là tối ưu hơn lược đồ ban đầu theo nghĩa:
hạn chế dư thừa dữ liệu, thuận lợi cho các quá trình tạo lập,


cập nhật và các thao tác tìm kiếm khác.
Định nghĩa về thuộc tính khóa:
Cho lược đồ quan hệ α=(U, F), thuộc tính A∈U được gọi là
thuộc tính khóa nếu như A thuộc một trong các khóa nào đó,
ngược lại A được gọi là thuộc tính không khóa.

4/45
16.1. Một số khái niệm liên quan
Định nghĩa phụ thuộc hàm đầy đủ:
Cho lược đồ quan hệ α=(U, F), X, Y, Y⊆U tập thuộc tính
Y được gọi là phụ thuộc hàm đầy đủ vào tập thuộc tính
X nếu như Y phụ thuộc hàm vào X nhưng không phụ
thuộc hàm vào bất kỳ một tập con thực sự nào của x tức
là:
- X→ Y ( Y phụ thuộc hàm vào X)
- ∀ X’⊂ X thì X’→ Y (mọi tập con thực sự của X đều
không thể xác định hàm Y)
5/45
16.1. Một số khái niệm liên quan
Định nghĩa phụ thuộc hàm bắc cầu:
Cho lược đồ quan hệ α=(U, F), X⊆U, A∈U, thuộc tính
A được gọi là phụ thuộc hàm bắc cầu vào tập thuộc tính
X nếu như Y ⊆X để:
- X → Y
- Y → A
- Y → X
- A ∉ XY
Nêú X → Y và Y không phụ thuộc bắc cầu vào X thì Y
phụ thuộc hàm trực tiếp vào X
6/45


NỘI DUNG Chi tiết :

Một số khái niệm liên quan
Các dạng chuẩn
Dạng chuẩn 1 (1NF- Fist normal form)
Dạng chuẩn 2 (2NF- Second normal form)
Dạng chuẩn 3 (3NF- Third normal form)
Dạng chuẩn BCNF (Boyce Codd normal form)
Thuật toán tìm dạng chuẩn cao nhất của lược đồ
Mối quan hệ giữa các dạng chuẩn
7/45
16.2. Các dạng chUẩn
Sự cần thiết chuẩn hóa dữ liệu:

Mục tiêu: là triệt tiêu mức cao nhất khả năng xuất hiện các dị thường
thông tin khi thực hiện các phép lưu trữ.

Chẩn hóa: khảo sát danh sách các thuộc tính và áp dụng các tập quy tắc
phân tích vào danh sách đó, biến đổi thành nhiều tập nhỏ hơn sao cho:
Tối thiểu việc lặp lại.
Tránh dị thường thông tin.
Xác định và giải quyết được sự không rõ ràng, nhập nhằng trong suy
diễn.
8/45
16.2. Các dạng chUẩn
Quá trình chuẩn hóa:
Là quá trình tách lược đồ quan hệ về một nhóm tương
đương các lược đồ quan hệ chiếu sao cho khi kết nối tự nhiên
không làm tổn thất thông tin và bảo toàn được các phụ thuộc

hàm.
Cơ sở chuẩn hóa:
Dựa trên các khái niệm về phụ thuộc hàm, phụ thuộc hàm
đầy đủ, khóa, các thuộc tính không khóa…
9/45
16.2. Các dạng chUẩn
Ví dụ:
Lược đồ quan hệ QLCAP( TC#, GTR, MC#, N#, NXS)
Trong đó: TC# : Mã tuyến cáp GTR : Giá trị của cáp
NSX : Nước sản xuất MC# : Mã cáp
N# : Mã nước sản xuất
Ngữ nghĩa dữ liệu như sau:
Trong một tuyến cáp, giá trị của một loại cáp được xác định
duy nhất.
Mỗi mã cáp xác định mã nước sản xuất cáp.
Mã nước xác định tên nước sản xuất.
10/45
16.2. Các dạng chUẩn
Hình 16.1: Sơ đồ các phụ thuộc hàm trong lược đồ quan hệ
QLCAP

GTR
MC#
TC#
NSX
N#
Ví dụ:
11/45
16.2. Các dạng chUẩn
TC# GTR MC# N# NSX

T01 200 C01 HAQ Hàn Qu cố
T01 250 C02 HAQ Hàn Qu cố
T01 220 C03 VTC Vi t Namệ
T02 500 C01 HAQ Hàn Qu cố
T02 400 C04 JAN Nh t B nậ ả
T03 100 C05 RUS Nga
T04 400 C06 CHN Trung Qu cố
T04 450 C03 VTN Vi t Namệ
Bảng 16.1: Một thể hiện của lược đồ quan hệ
QLCAP
12/45
NỘI DUNG Chi tiết :

Một số khái niệm liên quan
Các dạng chuẩn
Dạng chuẩn 1 (1NF- Fist normal form)
Dạng chuẩn 2 (2NF- Second normal form)
Dạng chuẩn 3 (3NF- Third normal form)
Dạng chuẩn BCNF (Boyce Codd normal form)
Thuật toán tìm dạng chuẩn cao nhất của lược đồ
Mối quan hệ giữa các dạng chuẩn
13/45
16.2.1. dạng chUẩn 1
(1NF-fist normal form)

Định nghĩa:
Một lược đồ quan hệ α=(U, F) được gọi là ở dạng chuẩn một ( 1NF)
nếu và chỉ nếu tất cả miền giá trị của các thuộc tính của R đều
nguyên tố (không thể phân chia được)
Ví dụ:

Xét quan hệ S(S#, PRO), thấy rằng thuộc tính PRO chứa các giá trị
không nguyên tố. Vì vậy quan hệ này không phải là quan hệ dạng
chuẩn 1NF.
14/45
16.2.1. dạng chUẩn 1
(1NF-fist normal form)
Ví dụ:
Bảng 16.2: Một ví dụ quan hệ không 1NF.
S# PRO
P# QTY
S1 100 1
200 1
300 2
S2 100 2
200 2
S3 300 3
100 1
15/45
NỘI DUNG Chi tiết :

Một số khái niệm liên quan
Các dạng chuẩn
Dạng chuẩn 1 (1NF- Fist normal form)
Dạng chuẩn 2 (2NF- Second normal form)
Dạng chuẩn 3 (3NF- Third normal form)
Dạng chuẩn BCNF (Boyce Codd normal form)
Thuật toán tìm dạng chuẩn cao nhất của lược đồ
Mối quan hệ giữa các dạng chuẩn
16/45
16.2.2. dạng chUẩn 2

(2NF-Second normal form)
Trước khi nghiên cứu dạng chuẩn thứ 2, ta xét ví dụ sau đây:
Xét CSDL gồm 2 lược đồ quan hệ THI (MONTHI,
GIAOVIEN) và SINHVIEN ( MONTHI, MSSV, TEN, TUOI,
DCHI, DIEM) phản ánh thông tin về kết quả thi của một
đơn vị nào đó.
Trong quan hệ THI thì MONTHI là khóa và trong quan hệ
SINHVIEN thì MONTHI và MSSV là khóa.
Ở quan hệ thứ hai dễ nhận thấy rằng MONTHI, MSSV,
DIEM xác định kết quả thi của sinh viên còn MSSV, TEN,
TUOI, DCHI xác định đối tượng dự thi.
17/45
16.2.2. dạng chUẩn 2
(2NF-Second normal form)
Xét các hiện hành của 2 lược đồ quan hệ THI và SINHVIEN
như sau:
THI
MONTHI GIAOVIEN
Toán T.Trợ
Lý T.Công
Hóa T.Giao
18/45
16.2.2. dạng chUẩn 2
(2NF-Second normal form)
SINHVIEN
MONTHI MSSV TEN TUOI DCHI DIEM
Toán 11 Lan 20 HN 8.0
Toán 12 Hue 21 HY 7.5
Hóa 11 Lan 20 HN 7.0
Hóa 12 Hue 21 HY 6.0

Lý 11 Lan 20 HN 5.0
Lý 13 An 21 BN 4.0
19/45
16.2.2. dạng chUẩn 2
(2NF-Second normal form)
Trong quá trình cập nhật, truy suất dữ liệu xuất hiện các vấn
đề sau:

Dư thừa dữ liệu

Phép thay đổi

Phép chèn

Phép loại bỏ
20/45
16.2.2. dạng chUẩn 2
(2NF-Second normal form)
Định nghĩa:
Cho lược đồ quan hệ α=(U, F), lược đồ α được gọi là ở dạng
chuẩn 2( ký hiệu là 2 NF) nếu như lược đồ ở dạng chuẩn 1
NF và các thuộc tình không khóa của α là phụ thuộc đầy đủ
vào khóa chính.
Thuật toán kiểm tra lược đồ có ở dạng chuẩn 2NF
hay không?
Input: Lược đồ quan hệ α =( U, F)
Output: Khẳng định α có đạt dạng chuẩn 2NF hay không
21/45
16.2.2. dạng chUẩn 2
(2NF-Second normal form)

Thuật toán 1:
Thuật toán kiểm tra dạng chuẩn 2NF
Vào: Lược đồ quan hệ Q, tập phụ thuộc hàm F
Ra: Khẳng định Q cóa đạt dạng chuẩn 2NF hay không
Bước 1: Tìm tất cả các khóa của Q
Bước 2: Với tất cả các khóa K, tìm bao đóng của tất cả các
tập con thật sự S của K.
Bước 3: Nếu có bao đóng S+ chứa thuộc tính không khóa thì
Q không đạt chẩn 2NF ngược lại Q đạt được dạng chuẩn
2NF.
22/45
16.2.2. dạng chUẩn 2
(2NF-Second normal form)
Ví dụ:
Cho lược đồ quan hệ Q(A, B, C, D) và tập phụ thuộc hàm:
F={AB→C, B→D, BC→A } . Hỏi Q có đạt chuẩn 2NF hay
không?
Giải:
Iα =Q \ ∪ ( Ri- -Li )=ABCD \ (C∪D∪A)=B. Iα ≠Q
N={∪ ( Ri- -Li ) sao cho Li ⊆Iα }=D
N’=(Iα N)+ \ Iα =(BD)+ \ B = D (N’⊆ Nα )
N’’=∪ Ri- - ∪ Li =ACD \ ABC=D
Nα=N∪N’∪N’’=D
B=Q \ Nα \ Iα=ABCD \ D \ B=AC
Vì B=2 => có hai khóa BA và BC
23/45
16.2.2. dạng chUẩn 2
(2NF-Second normal form)
Iα ={ B}, B={AC}
Khóa là K=AB và K=BC. Ta thấy B⊂ K, B→D, D là

thuộc tính không khóa => thuộc tính không khóa không phụ
thuộc đầy đủ vào khóa .
=> Q không đạt chuẩn 2NF.
X
(Iα ∪ X) (Iα ∪ X)
+
Siêu khóa Khóa
B BD
A AB ABCD AB AB
C BC ABCD ABCD BC
AC ABC ABCD ABC
24/45
16.2.2. dạng chUẩn 2
(2NF-Second normal form)
Thuật Toán 2:
Bước 1: Tìm tất cả các khóa của lược đồ α, từ tất cả các khóa
này ta suy ra các thuộc tính không khóa của lược đồ α. Ký
hiệu tập thuộc tính không khóa này là NK.
Bước 2: Với mỗi khóa Ki, ký hiệu họ của các tập con thực sự
của Ki là { S1, S2, …, Ski }, ký hiệu Q={ Q1, Q2, …, Qn } là
họ tất cả các tập con thực sự của khóa Ki.
Bước 3: Tìm bao đóng Q+ ={ Q1+, Q2+, …, Qn+ }
Bước 4: Nếu Q+ ∩ NK=φ với mọi i=1…n thì lược đồ α ở
dạng chuẩn 2NF ngược lại tồn tại Q+ ∩ NK≠φ thì lược đồ α
không ở dạng chuẩn 2NF.
25/45

×