1
1
Chương 4
Phân tích dữ liệu
và lập mô hình
2
Nội dung
z Cơ sở dữ liệu
z Mô hình thực thể quan hệ (ERD, Entity
Relationship Diagram)
z Phân tích dữ liệu – chuẩn hóa
z Liên kết giữa mô hình quá trình (DFD) và mô
hình dữ liệu (ERD)
2
3
Cơ sở dữ liệu
z Tậphọpcácdữ liệu có quan hệ có thể
tạogiátrị hữuích
z Cho phép doanh nghiệp truy xuất, lưu
trữ, và phân tích thông tin dễ dàng
z Sống còn cho sự thành công của
doanh nghiệp trong vận hành và ra
quyết định
4
Thuaät ngöõ CSDL
Thựcthể (Entities)
z Sự vật mà chúng ta cầnlưutrữ thông tin
về chúng (như người, địa điểm, sự kiện,
đốitượng v.v )
z Có quan hệ vớicácthựcthể khác
Thuộc tính (Attributes)
z Các thông tin về thựcthể
3
5
Bảnchấtcủacơ sở dữ liệulàgì?
6
C
á
c
m
ứ
c
c
ủ
a
H
ệ
Qu
ả
n
Tr
ị
CSDL
(DBMS)
Cơ sở DL
(Database)
Mẫutin
(Record)
Tậptin
(File)
Trường
(Field)
Cột, các thuộc tính để mô tả mộtthựcthể
Tên
Một hàng, gồm nhiềutrường (thuộc tính)
củamộtthựcthể depending on the DBMS
Mộtbảng, gồm nhiềumẫutin củamộtthực
thể
MộtCSDL, gồm nhiềutậptin (bảng) kếtnối
bởiquanhệ về mộtchủđề
Định nghĩa
Thấpnhất
Cao nhất
Mức
4
7
Ví dụ mộtbảng, tập tin (CSDL)
Attribute
(One Column)
Record
(One
Row)
Attribute
Type
8
Các hoạt động củaCSDL –Query
(Query Request) (Query Program) (Employment Query)
SQL (Structure Query Language)
• Ngôn ngữđểchọnvàtríchdữ liệutừ mộtCSDL
•Chuẩn cho CSDL quan hệ
QBE (Query by Example)
•Kỹ thuật cho phép ngườisử dụng thiếtkế Query trên màn hình
(bảng, lưới) bằng cách kéo thả trường cầnquery
Query –Tríchvàhiểnthị thông tin từ CSDL theo các thông số xác
định
5
9
Các hoạt động CSDL – Report
(Query Request) (Query Program) (Employment Report)
Bộ tạo báo cáo (Report Generator)
•Mộtchương trình chuyên sử dụng SQL để trích và xử lý dữ liệu
(tổng hợp, nhóm, xử lý)
• Các báo cáo đượcthiếtkế dùng các templates chuẩnvàcóthể
điềuchỉnh theo yêu cầu
Báo cáo (Report) –Mộtchứcnăng của CSDL cho phép trích và
trình bày thông tin từ mộtCSDL để in và trình bày
10
Thiếtkế CSDL – Data Model
Ví dụ: ERD (Entity Relationship Diagram)
Mô hình dữ liệu (Data Model, ERD)
•Giản đồ biểudiễncácthựcthể và các quan hệ
giữa chúng
• Được nhà quảntrị CSDL dùng để thiếtkế các
bảng và quan hệ (associations)
6
11
Thiếtkế CSDL – Khóa (Keys)
Khóa chính (Primary Key)
Loạithuộc tính duy nhất dùng để nhận
dạng mộttrường hợpcủamộtthựcthể
Khóa phụ (Secondary /Candidate/alternate Key)
Mộtthuộc tính dùng để nhậndạng (tìm) mộthoặcnhiều
mẫu tin trong mộtbảng vớimộtgiátrị cho trước
Khóa chính kép (Compound Primary Key)
Mộttổ hợpthuộc tính duy nhất dùng để nhận
dạng mộttrường hợpcủamộtthựcthể
Khóa CSDL (Database Keys)
Cơ chế dùng để nhậndạng, chọn, và bảotrìcácmẫutin
dùng trong chương trình ứng dụng, query, report.
12
Thiếtkế CSDL – Keys (Ví dụ)
Khóa chính
- Student ID
Thựcthể
Khóa chính
kép
- Student ID
- Course ID
- Sec No.
-Term
Khóa phụ
-Major
Thựcthểđượcdịch thành bảng
(Students and Grades)
Các thựcthể
đượcnốibởi
các thuộctính
chung
7
13
Thiếtkế CSDL – Quan hệ (Associations)
Quan hệ (Associations)
• Định nghĩa quan hệ giữacácthựcthể
•Xácđịnh cấu trúc khóa cầnthiết để truy xuấtdữ liệu
•Một trong ba loại:
- One-to-One
- One-to-Many
- Many-to-Many
Khóa ngoài (Foreign Key)
•Mộtthuộctínhxuấthiệndướidạng một khóa
không chính trong mộtthựcthể (bảng) và là một
khóa chính trong mộtthựcthể (bảng) khác
14
Designing Databases - Associations
Giản đồ quan hệ thựcthể (ERD)
•Côngcụ dùng để biểudiễn quan hệ giữacácthựcthể
•HữuíchđốivớiCSDL lớn
Ví dụ
• Each Home Stadium has a Team (One-to-One)
• Each Team has Players (One-to-Many)
• Each Team Participates in Games
• For each Player and Game there are Game Statistics
8
15
Designing Databases - Associations
16
Mô
h
ì
n
h
quan
h
ệ
-
Ch
u
ẩ
n
h
ó
a
(Normalization)
Chuẩn hóa (Normalization)
•Kỹ thuậtgiúpmộtcơ sở dữ liệuphứctạptrở nên hiệuquả
hơn (efficient) bằng cách loạibõdư thừadữ liệu càng nhiều
càng tốt
•Vídụ: Cơ sở dữ liệudưới đây bị dư thừadữ liệu
9
17
The Relational Model – Normalization
Normalized Database
To
ù
mta
é
tch
ö
ông
10
19
Các mô hình
1 mô hình là 1 dạng thể hiện thực tế.
Mô hình luận lý: con người Mô hình vật lý: máy tính
20
1. Mô hình thực thể quan hệ (ERD)
-1 mẫu tin (record) cụ
thể có nhiều vùng có
giá trò nào đó, hay hàng.
-1 sự kiện về 1 thực thể
(hay 1 thể hiện của
thực thể, hay 1 bộ)
-Trường (field), hay cột
-Thuộc tính
-Bảng dữ liệu (gồm
nhiều mẫu tin)
-Loại thực thể
Vật lýLuận lý
Ý nghóa các thuật ngữ:
11
Mô hình hóa Dữ liệu
22
1. Mô hình thực thể quan hệ (ERD)
Thuộc tính
Thuộc tính (Attribute) là 1 đặc tính hoặc tính chất
mô tả của 1 thực thể. Các từ đồng nghóa gồm
thành phần, thuộc tính và trường dữ liệu.
Những loại thực thể trong một tổ chức cũng có các
thuộc tính. Những thuộc tính này là những đặc
tính hay tính chất.
Thuộc tính kết hợp (compound attribute) là 1
thuộc tính thực sự gồm nhiều thuộc tính khác.
VD: Tên khách hàng gồm có Họ và Tên
12
23
1. Mô hình thực thể quan hệ (ERD) (tt)
Thuộc tính
z Thuộc tính
Có 3 loại thuộc tính:
TT khóa
TT kết nối (hay khóa ngoài)
TT mô tả
Mỗi sự kiện của 1 loại thực thể phải có thể nhận
dạng riêng biệt theo 1 vài TT nào đó. Thuộc tính này
được gọi là TT khóa.
Mỗi thực thể có 1 TT khóa hoặc 1 tập TT khóa.
24
1. Mô hình thực thể quan hệ (ERD)
Thuộc tính
Kiểu dữ liệu của 1 thuộc tính đònh nghóa thuộc tính đó
có thể lưu theo kiểu dữ liệu nào.
Miền của 1 thuộc tính đònh nghóa 1 thuộc tính có thể
chấp nhận các giá trò nào.
Giá trò mặc nhiên của 1 thuộc tính là giá trò sẽ được
lưu lại nếu người sử dụng không đặc tả giá trò cho
thuộc tính đó.
13
25
1. Mô hình thực thể
quan hệ (ERD)
Khóa nhận dạng &
tiêu chuẩn phân loại
STUDENT
Student Number (Primary Key)
Social Security Number (Alternate Key)
Name
.Last Name
.First Name
.Middle Initial
Address
.Street Address
.City
.State or Province
.Country
.Postal Code
Phone Number
.Area Code
.Exchange Number
.Number Within Exchange
Date of Birth
Gender (Subsetting Criteria 1)
Race (Subsetting Criteria 2)
Major (Subsetting Criteria 3)
Grade Point Average
26
1. Mô hình thực thể quan hệ (ERD)
Loại thực thể
z Loại thực thể
Loại thực thể có khả năng tồn tại độc lập và nó có dữ
liệu cần lưu trữ.
Loại thực thể là 1 khái niệm trừu tượng, có thể có
nhiều sự kiện thực thể cụ thể.
Sự kiện cụ thể này chính là dữ liệu chúng ta cần lưu
trữ.
Dữ liệu là đặc tính chủ yếu của 1 loại thực thể.
VD:
NHÂN VIÊN, ĐƠN ĐẶT HÀNG, MÔN HỌC
14
27
1. Mô hình thực thể quan hệ (ERD)
Loại thực thể (tt)
z Loại thực thể có 3 trường hợp:
Thông tin liên quan tới 1 giao dòch chủ yếu của
hệ.
VD:
Đơn đặt hàng
Thông tin liên quan tới tài nguyên của hệ.
VD:
Kho, Nhà cung cấp, Khách hàng
Thông tin đã khái quát dưới dạng thống kê liên
quan đến lập kế hoạch hoặc kiểm soát.
VD:
Bảng lương, Lòch điều xe
28
1. Mô hình thực thể quan hệ (ERD)
Mối quan hệ
1 mối QH là 1 sự kết hợp nghiệp vụ tự nhiên, tồn tại
giữa 1 hoặc nhiều thực thể.
Mối QH có thể trình bày 1 sự kiện, kết nối giữa các
thực thể hoặc ít khi là 1 mối QH luận lý tồn tại
giữa các thực thể.
15
29
1. Mô hình thực thể quan hệ (ERD)
Mối quan hệ
Lượng số đònh nghóa số lượng tối thiểu và tối đa các thể
hiện xảy ra của 1 thực thể, có liên quan đến 1 thể hiện
xảyracủa1 thựcthểkhác.
Vì tất cả các mối QH đều 2 hướng, nên phải đònh nghóa
lượng số ở cả 2 hướng của mối QH.
Hai chiều
30
Mô hình thực thể quan hệ (ERD) (tt)
Quan hệ (tt)
z Lượng số tối đa và tối thiểu
16
31
1. Mô hình thực thể quan hệ (ERD) (tt)
Quan hệ
z Quan hệ
Những loại thực thể trong tổ chức có thể có mối QH
với nhau.
QH giữa những loại thực thể là 1 đặc tính quan trọng
của 1 tổ chức, 1 đặc tính mà chúng ta cần phải lập mô
hình.
Không phải tất cả các loại thực thể đều có QH với các
loại thực thể khác.
VD:
Loại thực thể NHÂN VIÊN có mối QH “Thuộc về”
với loại thực thể ĐƠN VỊ. Chẳng hạn, Trần Văn An
thuộc về bộ phận kho.
32
1. Mô hình thực thể quan hệ (ERD) (tt)
Quan hệ (tt)
z Những loại quan hệ
Xác đònh Những loại QH theo số sự kiện của những
loại thực thể tương ứng có vai trò trong mối QH.
Những loại QH
Mối quan hệ 1:1
Mối quan hệ 1:n
Mối quan hệ m:n
VD:
Mối QH giữa SẢN PHẨM và CHI TIẾT SẢN PHẨM.
Mối QH giữa KHÁCH HÀNG và ĐƠN HÀNG.
Mối QH giữa NHÀ CUNG CẤP và MẶT HÀNG.
17
33
1. Mô hình thực thể quan hệ (ERD) (tt)
Quan hệ (tt)
z Bậc/ngôi: là số tập thực thể của mối QH.
z Mối QH 1 ngôi (đệ quy) là mối QH tồn
tại giữa các thể hiện khác nhau của cùng
1 thực thể.
34
Mô hình thực thể quan hệ (ERD) (tt)
Quan hệ (tt)
z Mối QH 2 ngôi là mối QH tồn tại giữa 2
thực thể.
18
35
Mô hình thực thể quan hệ (ERD) (tt)
Quan hệ (tt)
Các mối QH có thể tồn
tại giữa nhiều hơn 2
thực thể và gọi là
các mối QH N-ngôi.
VD: ERD mô tả mối QH
3 ngôi.
36
Mô hình thực thể quan hệ (ERD) (tt)
Quan hệ (tt)
Thực thể kết hợp là 1
thực thể kế thừa khóa
chính từ nhiều hơn 1
thực thể khác (gọi là
các thực thể cha).
Mỗi phần của khóa kết
hợp chỉ đến 1 và chỉ
1 thể hiện của mỗi
thực thể kết nối.
19
37
Những ví dụ
z Xác đònh thực thể, QH?
z Xác đònh loại QH?
z Các sự kiện của thực thể?
Bộ phận 4 Bộ phận 5 Bộ phận 6
NHÂN VIÊN ĐƠN VỊ
thành viên
(a)
Bill Smith
Kirti Patel
Mary Jones
Salvator Mendez
Jane Smith
Kim Chen
Bán
Kho
Kế toán
(c)
NHÂN VIÊN ĐƠN VỊ
thành viên
NHÂN VIÊN ĐƠN VỊ
thành viên
NHÀ CUNG CẤP
HÀNG
cung cấp
(e)
(f)
Abc Co.
Mno Co.
Xyz Co.
cung cấp
Bộ phận 1
Bộ phận 2
Bộ phận 3
(g)
ĐÀN ÔNG ĐÀN BÀ
cưới hỏi
(h)
John
George
Mark
Simon
Jane
Mary
Carol
(d)
(b)
(i)
BỘ PHẬN
bao gồm
Bộ phận 1
Bộ phận 2 Bộ phận 2
(j)
38
Mô hình thực thể quan hệ (ERD) (tt)
Quan hệ không rõ (tt)
20
39
Mô hình thực thể quan hệ (ERD) (tt)
Quan hệ không rõ (tt)
z Hôn nhân nên được xem là
• Thuộc tính
• Mối quan hệ
• Thực thể
40
Mô hình thực thể quan hệ (ERD) (tt)
Quan hệ không rõ (tt)
ĐÀN ÔNG ĐÀN BÀ
cưới hỏi
a)
b)
Tình trạng gia đình Ngày sinh
NHÂN VIÊN
C)
Tên chú rễ Tên cô dâu Ngày cưới
CƯỚI HỎI
21
41
Mô hình thực thể quan hệ (ERD) (tt)
Quan hệ không rõ (tt)
z Hôn nhân có thể được xem tất cả, tùy
• Thuộc tính: đơn giản nhất, của 1 thực thể
• Mối quan hệ: của 2 thực thể
• Thực thể: tự nó là một thực thể
42
2. Phân tích dữ liệu và chuẩn hóa
Phân tích dữ liệu từ trên xuống
(1)
Đònh
nghóa
những
phạm
vi dữ
liệu
chính
cho tổ
chức
(2) Xác
đònh
những
loại
thực
thể
cho mỗi
phạm vi
dữ liệu
(3)
Xác
đònh
những
mối
QH
giữa
những
loại
thực
thể
(4) Rút
ra mô
hình
thực
thể
cho
phạm
vi của
tổ
chức
(6)
Chuẩn
hóa
các
thuộc
tính
của
những
loại
thực
thể
(8) Kiểm
tra tính
chính xác
của mô hình
thực thể so
với các chức
năng và quá
trình được
yêu cầu
(5)
Xác
đònh
thuộc
tính
cho
mỗi
loại
thực
thể
(7) Tổng
hợp các
mô hình
thực thể,
để rút ra 1
mô hình
thực thể
đầy đủ cho
tổ chức
Xác đònh lại những
thực thể và những
mối QH
Đònh nghóa lại nếu
không chính xác
22
43
2. Phân tích dữ liệu và chuẩn hóa
Vùng dữ liệu chính
z Xử lý đơn hàng
z Kiểm soát kho
z Lập thời biểu xuất kho
44
2. Phân tích dữ liệu và chuẩn hóa
Các thực thể
z KHÁCH HÀNG
z ĐƠN ĐẶT HÀNG
z HÀNG HÓA
z PHIẾU XUẤT
z HÓA ĐƠN THANH TOÁN
23
45
2. Phân tích dữ liệu và chuẩn hóa
Các quan hệ
Thực thể Thực thể Tên quan hệ Bậc
KHÁCH HÀNG ĐƠN ĐẶT HÀNG đặt hàng 1:n
ĐƠN ĐẶT HÀNG HÀNG HÓA yêu cầu m:n
PHIẾU XUẤT HÀNG HÓA bao gồm m:n
PHIẾU XUẤT ĐƠN ĐẶT HÀNG liên quan n:1
HÓA ĐƠN HÀNG HÓA lập hoá đơn m:n
PHIẾU XUẤT HÓA ĐƠN liên quan đến 1:1
PHIẾU XUẤT KHÁCH HÀNG gửi đếnn:1
KHÁCH HÀNG HÓA ĐƠN nhận 1:n
46
2. Phân tích dữ liệu và chuẩn hóa
Mô hình thực thể
KHÁCH
PHIẾU_XUẤT
HÀNG
ĐƠN
HÓA_ĐƠN
nhận
gởi đến
liên quan đến
bao
gồm
các hóa đơn
liên quan đến
đặt hàng
yêu cầu
24
47
2. Phân tích dữ liệu và chuẩn hóa
Xác đònh thuộc tính của các thực thể
Thực thể Thuộc tính
ĐƠN HÀNG mã số đơn hàng, ngày đặt hàng, mã số khách hàng,
tên khách hàng, [mã hàng
, số lượng, đơn giá]*
KHÁCH HÀNG mã số khách hàng
, tên khách hàng, đòa chỉ khách,
[đòa chỉ phân phối
]*, tên người đại diện, điện thoại,
mã phân loại khách, giới hạn tín dụng, thời hạn nợ,
chiết khấu chuẩn, doanh thu, số dư tài khoản
48
2. Phân tích dữ liệu và chuẩn hóa
Xác đònh thuộc tính của các thực thể
Thực thể Thuộc tính
PHIẾU XUẤT mã số phiếu xuất, ngày lập phiếu xuất, mã số đơn hàng,
mã số khách hàng, tên khách hàng, đòa chỉ khách,
[mã mặt hàng
, số lượng]*
HÓA ĐƠN mã số hóa đơn
, ngày lập hóa đơn, mã số đơn hàng,
mã số khách hàng, tên khách hàng, đòa chỉ khách,
[mã mặt hàng
, tên mặt hàng, đơn giá, số lượng]*,
thành tiền, chiết khấu, thuế, tiền phải trả.
HÀNG HÓA mã mặt hàng
, tên mặt hàng, số lượng tồn kho, giá vốn,
Giá bán, mức tái đặt hàng, mã phân loại tồn kho.
25
49
2. Phân tích dữ liệu và chuẩn hóa
Chuẩn hóa Thuộc tính trên Mô hình thực thể
Chuẩn hóa là kỹ thuật phân tích dữ liệu, nhằm
tổ chức các thuộc tính dữ liệu như nhóm các
thuộc tính dữ liệu thành các thực thể không dư
thừa, ổn đònh, uyển chuyển, và phù hợp.
Có 3 dạng chuẩn
Dạng chuẩn hóa thứ nhất (1NF)
Dạng chuẩn hóa thứ hai (2NF)
Dạng chuẩn hóa thứ ba (3NF)
50
2. Phân tích dữ liệu và chuẩn hóa (tt)
Chuẩn hóa Thuộc tính trên Mô hình thực thể
z Dạng chuẩn hóa thứ nhất: Mộtthựcthểởdạng
chuẩn hóa thứ nhất (1NF) nếu không có sự lặp lại
của nhóm những thuộc tính.
z Dạng chuẩn hóa thứ hai: Mộtthựcthểởdạngchuẩn
hóa thứ hai (2NF) nếu nó ở dạng 1NF và mọi thuộc
tính không khóa phải phụ thuộc toàn bộ vào khóa.
z Dạng chuẩn hóa thứ ba: Một thực thể ở dạng chuẩn
hóa thứ ba (3NF) nếu nó ở dạng 2NF và mỗi thuộc
tính hay (tập thuộc tính) không khóa chỉ phụ thuộc
vào khóa và không phụ thuộc vào bất kỳ thuộc tính
nào khác.