1
Chương 1
Giới thiệu
2
2
Dữ liệu và Thông tin
Dữ liệu là một mô tả hình thức về những sự
kiện, khái niệm, đối tượng (tuổi, chuỗi ngày
tháng, tên người , …)
Thông tin là kết quả của quá trình xử lý dữ liệu
để rút ra “con số có nghĩa “
Dữ liệu là nền tảng để tạo ra thông tin, và từ đó
là cơ sở để có được tri thức
3
3
Dữ liệu và Thông tin (tt)
Thông tin chính xác, kịp thời là chìa khóa cho
việc đưa ra các quyết định tốt
Có được các quyết định tốt là chìa khóa cho
sự tồn tại của tổ chức
4
4
Database và DBMS
Database (DB): là cấu trúc hợp nhất, có thể chia sẽ, lưu
trữ trong máy tính _ chứa một tập hợp dữ liệu bao gồm
End_user data , là những data mà người dùng quan tâm
Metadata , là data về data
Metadata chứa mô tả về các đặc tính của dữ liệu , và
các mối liên kết của nó trong Database
Là dữ liệu bổ sung về dữ liệu
DBMS : là một nhóm các chương trình giúp quản lý cấu
trúc database và truy suất dữ liệu trong database
MS Access, SQL Server, My SQL,…
5
5
Chức năng của DBMS
DBMS phục vụ như một trung gian giữa
user và Database
DBMS hiển thị DB dưới một khung nhìn duy nhất
cho các user/applications.
cho phép applications có thể truy suất DB thông qua
nhiều loại ngôn ngữ.
DBMS cho phép dữ liệu được chia sẽ
6
6
7
7
Chức năng của DBMS
Ưu điểm của DBMS:
Chia sẽ dữ liệu tốt hơn
Bảo mật dữ liệu tốt hơn
Hợp nhất dữ liệu tốt hơn
Giảm thiểu mâu thuẫn dữ liệu
Truy suất dữ liệu tốt hơn
8
Chức năng của DBMS (tt)
Các chức năng của DBMS:
Lưu trữ, truy xuất và cập nhật dữ liệu
Quản lý giao tác (transaction management)
Điều khiển tương tranh(concurrency control)
Chép lưu và phục hồi dữ liệu (backup & restore)
Bảo mật dữ liệu
Hỗ trợ truyền thông dữ liệu
Duy trì tính toàn vẹn, nhất quán dữ liệu
Cung cấp các tiện ích….
9
Hệ thống xử lý tập tin theo lối cũ
Việc hiểu biết những thiếu sót của hệ thống tập
tin sẽ giúp phát triển các database
Các dữ liệu có liên quan được lưu trữ trong
tập tin
Mỗi tập tin có
một chương trình ứng dụng để lưu trữ, truy vấn và
chỉnh sửa dữ liệu.
các chương trình ứng dụng để xuất ra báo cáo
Mỗi cá nhân hay phòng ban có tập tin riêng
10
10
11
Hệ thống xử lý tập tin theo lối cũ
(tt)
Dư thừa dữ liệu (Data redundancy)
Là tình trạng mà cùng một dữ liệu được lưu trữ một
cách không cần thiết ở những vị trí khác nhau
Hạn chế việc dùng chung dữ liệu
Thời gian phát triển lâu
Chi phí bảo trì chương trình cao
12
12
13
Cách tiếp cận cơ sở dữ liệu
Kho dữ liệu trung tâm chứa các dữ liệu dùng
chung.
Dữ liệu được quản lý bởi một đơn vị điều
khiển (controlling agent).
Dữ liệu được lưu trữ theo một dạng thức
chuẩn và thích hợp.
Cần phải có một hệ quản trị CSDL.
14
Cách tiếp cận cơ sở dữ liệu (tt)
Ưu điểm của cách tiếp cận CSDL
Độc lập dữ liệu – chương trình (data - program
independence).
Giảm tối thiểu sự dư thừa dữ liệu (data
redundancy).
Nâng cao tính nhất quán (data consistency) /
toàn vẹn dữ liệu (data integrity).
Nâng cao việc dùng chung dữ liệu (data
sharing).
15
Cách tiếp cận cơ sở dữ liệu (tt)
Ưu điểm của cách tiếp cận CSDL (tt)
Tăng hiệu suất phát triển ứng dụng.
Tuân thủ các tiêu chuẩn.
Nâng cao chất lượng của dữ liệu.
Các ràng buộc (constraint), các qui tắc hợp lệ của dữ liệu
(data validation rule).
Nâng cao tính truy xuất và tính đáp ứng của dữ liệu.
Sử dụng ngôn ngữ truy vấn dữ liệu chuẩn (SQL_Structured
Query Language).
16
Cách tiếp cận cơ sở dữ liệu (tt)
Ưu điểm của cách tiếp cận CSDL (tt)
Giảm chi phí bảo trì chương trình.
Bảo mật (security).
Chép lưu (backup) và phục hồi (recovery).
Điều khiển tương tranh (concurrency control).
17
Cách tiếp cận cơ sở dữ liệu (tt)
Nhược điểm:
Chi phí và rủi ro của cách tiếp cận CSDL
Chi phí ban đầu
Chi phí cài đặt và quản lý
Chi phí chuyển đổi
Chi phí vận hành
Cần nhân viên mới có chuyên môn.
Cần phải chép lưu và phục hồi.
Mâu thuẫn về mặt tổ chức
Rất khó thay đổi các thói quen cũ.
18
Các loại cơ sở dữ liệu
CSDL cá nhân (personal database)
CSDL nhóm làm việc (workgroup database)
CSDL phòng ban (department database)
CSDL xí nghiệp (enterprise database)
Các điểm khác biệt giưã các loại CSDL:
Số người sử dụng
Kiến trúc CSDL
Kích thước CSDL
19
Sự phát triển các hệ CSDL
Hệ thống tập tin (flat file): 1960 – 1980
Hệ CSDL phân cấp(hierarchical): 1970-1990
Hệ CSDL mạng(network): 1970 – 1990
Hệ CSDL quan hệ ( relational): 1980 – nay
Hệ CSDL hướng đối tượng (object oriented):
1990 – nay
Hệ CSDL đối tượng – quan hệ (object –
relational): 1990 – nay.
20
Mô hình hóa dữ liệu
Tại sao phải mô hình hóa dữ liệu ?
Các nhà thiết kế, nhà lập trình và người dùng có cách
nhìn khác nhau về dữ liệu
-> cần có một cái nhìn tổng thể về dữ liệu của tổ chức,
để phản ánh đúng họat động của tổ chức
mô hình hóa dữ liệu sẽ giảm đi sự phức tạp của thiết
kế DB
Sự phức tạp của thế giới thực
Bản vẽ tốt để xây dựng database
21
Mô hình hóa dữ liệu (tt)
Mô hình – model : là sự trừu tượng về một
đối tượng, sự kiện trong thế giới thực
Mô hình dữ liệu – data models:
là cách biểu diễn đơn giản cho các cấu trúc
dữ liệu phức tạp của thế giới thực
thường biểu diễn ở dạng đồ họa
Mô hình dữ liệu được thiết kế cho nhiều
người dùng khác nhau
Như là một công cụ giao tiếp giữa nhà thiết kế, nhà
lập trình và người dùng
22
Các thành phần căn bản của
mô hình dữ liệu
Thực thể - entity
là bất kỳ sự vật hay sự việc nào mà từ đó dữ liệu
được thu thập và lưu trữ
Thuộc tính – attribute
đặc tính của một thực thể
Mối quan hệ - relationship
mô tả mối liên hệ giữa các thực thể
Ràng buộc – constraint
là một hạn chế áp đặt cho dữ liệu
xuất phát từ các qui tắc nghiệp vụ
23
Sự phát triển của
các mô hình dữ liệu
Từ 1960-1970: Hê thống file
Thập kỷ 70 : Mô hình phân cấp và mô hình
mạng
Giữa thập kỷ 70 – nay : Mô hình Quan hệ
Giữa thập kỷ 80 – nay : Mô hình hướng đối
tượng và Mô hình Quan hệ mở rộng
24
Mô hình thực thể kết hợp
The Entity Relationship Model
Được xem là một chuẩn giúp mô hình hóa dữ liệu
Được giới thiệu vào 1976, bởi Chen
Là sự biểu diễn đồ họa các thực thể và các mối liên
hệ của chúng trong cấu trúc một database
Lược đồ ER (ERD)
Mỗi tập thực thể được biểu diễn bằng hình chữ nhật
được ánh xạ là một table
Mỗi thực thể là một dòng trong table
Mối kết hợp được hiển thị bằng một hình thoi
Các mối kết hợp được gán nhãn để thể hiện loại mối kết
hợp
25
STU_LNAME
STU_FNAME
SINH VIEN
LOP
Đăng ký
STU_INITIAL STU_EMAIL
STU_PHONE
CLASS_NAME CLASS_NUM