Tải bản đầy đủ (.pdf) (19 trang)

Slide cơ sở dữ liệu chương 2 mô hình e r và chuẩn hóa

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (411.34 KB, 19 trang )

Chương 2
Mơ hình E-R và Chuẩn Hố

CuuDuongThanCong.com

/>

Nhắc lại











CSDL là tập hợp các dữ liệu quan hệ được lưu trữ dưới dạng bảng
Hệ thống tập tin phẳng nó có những hạn chế về dữ liệu dư thừa, khó
kiểm sốt dữ liệu, và khơng có khả năng thao tác dữ liệu dễ dàng
Hệ thống quản lý CSDL có thể định nghĩa là tập hợp các bản ghi có
quan hệ và tập hợp các các chương trình được dùng để truy cập và
thao tác với các bản ghi đó.
Hệ thống quản lý CSDL là tập hợp các chương trình mà người dùng
có thể thực hiện lưu trữ, sửa đổi và rút trích thơng tin từ CSDL.
Hệ thống quản lý CSDL quan hệ giống như là các chương trình phần
mềm được dùng để tạo, bảo trì, sửa đổi và thao tác trên CSDL quan
hệ.
CSDL quan hệ lưu dữ liệu trên bảng. Các bảng có quan hệ với nhau


bên trong CSDL.
RDBMS and Data Management/ Session 2/2 of 15
CuuDuongThanCong.com

/>

Các mục tiêu của bài học








Định nghĩa và mô tả về sự mơ hình hố dữ liệu
Xác định và mơ tả các thành phần trong mơ hình E-R
(mơ hình quan hệ thực thể) .
Xác định mối quan hệ giữa các thực thể.
Giải thích các sơ đồ E-R và lý do tại sao chúng lại
hữu ích.
Mơ tả biểu đồ, các ký hiệu được sử dụng để vẽ và
hiển thị các mối quan hệ khác nhau.
Mô tả các dạng chuẩn khác nhau
Phác hoạ cách sử dụng các toán tử quan hệ khác
nhau

RDBMS and Data Management/ Session 2/3 of 15
CuuDuongThanCong.com


/>

Mơ hình hố dữ liệu


Mơ hình dữ liệu




Là nhóm các công cụ lý thuyết để mô tả
dữ liệu, các mối quan hệ và ngữ nghĩa của
chúng.
Nó cũng bao gồm cả mơ tả các ràng buộc
tồn vẹn mà dữ liệu phải tuân theo.

RDBMS and Data Management/ Session 2/4 of 15
CuuDuongThanCong.com

/>

Mơ hình hố dữ liệu


Q trình áp dụng một mơ hình thích hợp để tổ chức và
cấu trúc dữ liệu được gọi là mơ hình hóa dữ liệu. Mơ hình
hố dữ liệu được chia nhỏ thành ba bước:
 Conceptual Data Modeling (Mơ hình dữ liệu ý niệm)
 Logical Data Modeling (Mơ hình dữ liệu luận lý)
 Physical Data Modeling (Mơ hình dữ liệu vật lý)


RDBMS and Data Management/ Session 2/5 of 15
CuuDuongThanCong.com

/>



Mơ hình dữ liệu ý niệm: là mơ hình mơ tả cách
nhìn dữ liệu của người sử dụng, mỗi người sử
dụng khác nhau có cách nhìn dữ liệu khác nhau.






Ví dụ: Phịng tuyển sinh nhìn thấy các bản ghi dữ liêu về
sinh viên. Phịng đào tạo nhìn thấy các bản ghi dữ liệu
về điểm thi,..

Mơ hình dữ liệu luận lý: Mô tả chi tiết dữ liệu cùng
với mối quan hệ của dữ liệu. Mơ hình này biểu
diễn dữ liệu của csdl dưới dạng trừu tượng so với
cách lưu trữ vật lý
Mơ hình dữ liệu vật lý: là tồn bộ các dữ liệu của
csdl được biểu diễn dưới dạng gần với lưu trữ
trong các tập tin thực sự trên các thiết bị nhớ
RDBMS and Data Management/ Session 2/6 of 15
CuuDuongThanCong.com


/>

Mơ hình Thực thể- Mối quan hệ
(ER) 1-4


Các mơ hình có thể phân thành các nhóm khác nhau như sau:









Các Tập
mơ hình
thực luận
thể lý dựa trên đối tượng
Các mơ
hình luận lý dựa trên bản ghi
Employee
Các mơ hình vật lý


















Tập thực thể
Department

Relationship

Mơ hình thực thể - Mối quan
phân
loại đầu tiên. Mơ
Human
Resource
Set hệ (E-R) thuộc
hình được dựa trên ý tưởng đơn giản. Dữ liệu có thể được hiểu như là
Production
các đối tượng trong thế giới
thực
thực thể và các mối
works
in được gọi là

quan hệ tồn tại giữa các thực thể này.
Accounts
Mơ hình E-R bao gồm năm thành phần cơ bản. Logistics
Đó là:






Thực thể -Entity
Mối quan hệ- Relationship
Thuộc
tính thể
- Attributes
Các thực
TậpEmployee
thực thể -Entity Set
Tập quan hệ -Relationship Set

Các thực thể

Department

RDBMS and Data Management/ Session 2/7 of 15
CuuDuongThanCong.com

/>

Mơ hình Thực thể- Mối quan hệ

(ER) 2-4


Các mối quan hệ được kết hợp từ một hoặc nhiều
thực thể. Chúng có 3 kiểu:



Mối
hệ
tự
thân:
CácCác
mốiCác
quan
hệ hệ
giữa
thực
Mốiquan
quan
nhị
phân:
mối
quan
hệ

Mối
quan
hệhệ
tam

phân:
mối
quan
màcác
tồn
tại
thể của các tập thực thể giống nhau được gọi là mối
giữa
ba
thực
thể thuộc
các của
tập thực
thể khác
nhau
tồn tại
giữa
các
thực thể
hai thực
thể thuộc
quan
hệ tự
thân.
được
gọi là
mối thể
quankhác
hệ tam
phân.

các tập
thực
nhau
được gọi là quan hệ

nhị phân.

RDBMS and Data Management/ Session 2/8 of 15
CuuDuongThanCong.com

/>

Mơ hình Thực thể- Mối quan hệ
(ER) 3-4
Các mối quan hệ có thể được phân loại dựa trên ánh xạ tập hợp. Các
ánh xạ phân loại khác nhau là:
 Môt - một: Ánh xạ này tồn tại khi một thực thể của một tập thực
thể có thể kết hợp với chỉ một thực thể của tập thực thể khác.
 Một - nhiều: Ánh xạ này tồn tại khi một thực thể của một tập
thực thể được kết hợp với nhiều hơn một thực thể của tập thực
thể khác.
Vehicle
Entity Set

f
f
 f
Vehicle
Customer
Entity Set

Entity Set

CuuDuongThanCong.com

Registration
Entity Set

registration

RDBMS and Data Management/ Session 2/9 of 15
/>

Mơ hình Thực thể- Mối quan hệ
(ER) 4-4




Nhiều-một: Ánh xạ này tồn tại khi nhiều thực thể của
một tập thực thể được kết hợp với một thực thể của
tập thực thể khác.
Nhiều-nhiều
Vehicle : Ánh xạ này tồn tại khi số các thực thể của
Entity thể
set được kết hợp với số thực thể của tập thực
tập thực
thể khác.

f
h

f
Customer
Entity Set

CuuDuongThanCong.com

Location
Account
Entity
set

Entity Set

F
RDBMS and Data Management/ Session 2/10 of 15
/>

Các biểu đồ Thực thể - Mối quan hệ




Biểu đồ E-R là giản đồ trình bày của mơ hình
E-R.
Các ký hiệu được dùng cho các thành phần
khác nhau có thể nhìn thấy trong bảng dưới
đây:

RDBMS and Data Management/ Session 2/11 of 15
CuuDuongThanCong.com


/>

Các biểu đồ Thực thể - Mối quan hệ


Các bước để xây dựng biểu đồ E-R là:











Thu thập tất cả các dữ liệu mà cần được mơ hình.
Nhận biết dữ liệu mà có thể được mơ hình như là các thực thể
trong thế giới thực.
Nhận biết các thuộc tính cho mỗi thực thể.
Sắp xếp các tập thực thể yếu, các tập thực thể mạnh.
Sắp xếp các thuộc tính đóng vai trị khố, các thuộc tính đa trị,
các thuộc tính kết hợp, các thuộc tính dẫn suất.
Xác định các mối quan hệ giữa các thực thể.
Sử dụng các ký hiệu khác nhau để vẽ các thực thể, thuộc tính và
mối quan hệ giữa chúng. Dùng các ký hiệu thích hợp trong khi
vẽ các thuộc tính.


RDBMS and Data Management/ Session 2/12 of 15
CuuDuongThanCong.com

/>

Chuẩn hố






Nó là tiến trình tổ chức dữ liệu một cách có hiệu
quả trong CSDL.
Mục đích của tiến trình chuẩn hoá:
Loại bỏ dữ liệu bị dư thừa mà vẫn đảm bảo dữ
liệu phụ thuộc (phụ thuộc hàm- là ràng buộc về
sự liên quan giữa nhiều thuộc tính trong bảng
với nhau ).
Vào lúc đầu, Codd (1972) trình bày 3 dạng
chuẩn (1NF, 2NF and 3NF), tất cả dựa trên sự
phụ thuộc giữa các thuộc tính của quan hệ.
RDBMS and Data Management/ Session 2/13 of 15
CuuDuongThanCong.com

/>



Dạng chuẩn một (1NF): - Để đạt dạng chuẩn một:

 Chia dữ liệu thành các bảng riêng biệt cho mỗi
nhóm dữ liệu có liên quan





Ví dụ: Bảng dữ liệu sinh viên, bảng kết quả, mơn học

Tồn bộ các cột của bảng phải có giá trị đơn.
Tất cả các thuộc tính khoá phải được xác định

RDBMS and Data Management/ Session 2/14 of 15
CuuDuongThanCong.com

/>

Chuẩn hoá


Dạng chuẩn hai – Các bảng đạt dạng chuẩn hai
nếu:



Chúng phải thoả các yêu cầu của dạng chuẩn một
Mỗi thuộc tính(cột) khơng khóa đều phụ thuộc đầy đủ
vào khóa chính.





Phụ thuộc đầy đủ: B là một thuộc tính khơng khóa, X là một
tập thuộc tính làm khóa, X->B (X xác định B) gọi là phụ
thuộc hàm đầy đủ nếu khơng có một tập con nào của X cũng
có thể xác định B.

Các bảng quan hệ với nhau thông qua các khoá ngoại

RDBMS and Data Management/ Session 2/15 of 15
CuuDuongThanCong.com

/>



Dạng chuẩn ba - Để đạt dạng chuẩn ba:




Các bảng phải thoả các yêu cầu dạng chuẩn
hai
Không tồn tại phụ thuộc bắc cầu trong bảng
(không tồn tại phụ thuộc giữa các thuộc tính
khơng phải là khóa. Phụ thuộc có nguồn là
thuộc tính khơng khóa).

RDBMS and Data Management/ Session 2/16 of 15
CuuDuongThanCong.com


/>

Các tốn tử quan hệ




Mơ hình quan hệ được dựa trên đại số quan hệ, nó bao
gồm tập hợp các toán tử để thực hiện trên các quan hệ.
Mỗi toán tử nắm giữ một hoặc hai quan hệ như là đầu
vào và kết quả quan hệ được xem là đầu ra..






Chọn -SELECT : Tốn tử này được dùng để trích dữ liệu thoả
mãn với điều kiện đã cho. Ký hiệu “σ” được dùng để biểu hiện
cho phép chọn.
Chiếu -PROJECT: Toán tử này được sử dụng để chiếu các chi
tiết của một bảng quan hệ. Nó chỉ hiển thị chi tiết các yêu cầu
loại bỏ các cột được ấn định. Toán tử PROJECT được biểu diễn
bởi ký hiệu “π”.
Tích đề các - PRODUCT: Toán tử này được biểu thị bởi “x”. Nó
giúp kết hợp thơng tin từ hai bảng quan hệ.
RDBMS and Data Management/ Session 2/17 of 15
CuuDuongThanCong.com


/>

Các toán tử quan hệ










Hợp-UNION: Toán tử UNION dùng để tập hợp dữ liệu từ các
bảng khác nhau và hiện diện phiên bản hợp nhất của dữ liệu đầy
đủ. Toán tử union được mơ tả bởi ký tự, “U”.
INTERSECT: Tốn tử này phát sinh dữ liệu mà được thoả mãn
trong tất cả các bảng mà nó được miêu tả. Nó được dựa trên lý
thuyết tập giao và được mô tả bởi ký hiệu “∩”.
Hiệu -DIFFERENCE: Phép này có ký hiệu “-”. Dữ liệu được sinh
ra từ các bảng khác nhau mà thoả mãn trong một bảng cịn bảng
khác thì khơng.
Nối -JOIN: Phép hợp được nâng cao từ phép tích đề các. Nó cho
phép lựa chọn để thực hiện nhân các bảng.
Chia- DIVIDE: Phép chia, được mô tả bởi ký tự “ ”, thích hợp
để truy vấn mà bao gồm cụm từ “for all”.

RDBMS and Data Management/ Session 2/18 of 15
CuuDuongThanCong.com


/>

Tóm tắt








Mơ hình hố dữ liệu là q trình áp dụng mơ hình dữ
liệu thích hợp cho các dữ liệu thơ.
Mơ hình E-R xem thế giới thực như tập các đối tựợng cơ
bản và các mối quan hệ giữa chúng.
Thực thể, thuộc tính, tập thực thể, mối quan hệ và tập
mối quan hệ từ năm thành phần cơ bản của mơ hình ER.
Ánh xạ là yếu tố trong tập hợp nhấn mạnh số các thực
thể được kết hợp với nhau.
Tiến trình gỡ bỏ sự dư thừa dữ liệu từ các bảng của
CSDL quan hệ được gọi là chuẩn hoá.
Đại số quan hệ bao gồm tập hợp các phép toán giúp lấy
dữ liệu từ CSDL quan hệ.
RDBMS and Data Management/ Session 2/19 of 15
CuuDuongThanCong.com

/>



×