Chương 1:
Chương 1:
Giới thiệu về Database
Giới thiệu về Database
Database System 1
Database System 2
Nội dung
Nội dung
Các định nghĩa cơ bản
Hệ thống xử lý tập tin truyền thống và
nhược điểm của nó
Cơ sở dữ liệu và các ưu điểm
Chức năng và thành phần cuả hệ quản trị
CSDL (DBMS)
Chu kỳ phát triển hệ thống
Quá trình phát triển CSDL
Kiến trúc CSDL 3 mức
Kiến trúc hệ quản trị CSDL
Database System 3
Các định nghĩa cơ bản
Các định nghĩa cơ bản
Data (dữ liệu) và information (thông tin)
◦
Data: bao gồm sự việc (fact), văn bản(text), đồ
họa(graphics), hình ảnh (images), âm thanh (sound)
◦
Information: dữ liệu đã được xử lý
Phân biệt giữa data và information??
Database System 4
Các định nghĩa cơ bản (tt)
Các định nghĩa cơ bản (tt)
Siêu dữ liệu (metadata): mô tả các tính chất
hoặc các đặc điểm của dữ liệu khác
Database System 5
Make Mode l OwnerID ID Name Age
Honda Accord 12 12 Nemo 22
Honda Accord 156 156 Dory 21
Hệ thống xử lý tập tin truyền thống
Hệ thống xử lý tập tin truyền thống
Là tập hợp các chương trình ứng dụng
thực hiện các dịch vụ cho nhiều người sử
dụng, mỗi chương trình ứng dụng tạo và
quản lý các dữ liệu riêng biệt.
Nhược điểm:
◦
Phụ thuộc dữ liệu – chương trình
◦ Trùng lặp dữ liệu
◦ Hạn chế việc dùng chung dữ liệu
◦
Thời gian phát triển lâu
◦
Chi phí bảo trì chương trình cao
Database System 6
Hệ thống xử lý tập tin truyền thống
Hệ thống xử lý tập tin truyền thống
Data are not stored on disk
Programmer defines both logical data structure
and physical structure (storage structure, access
methods, I/O modes, etc)
One data set per program. High data redundancy.
PROGRAM 2
Data
Management
PROGRAM 3
Data
Management
PROGRAM 1
Data
Management
DATA SET 1
DATA SET 2
DATA SET 3
7Database System
Problems with early data management
Problems with early data management
There is no persistence.
◦
All data is transient and disappears when the program
terminates.
Random access memory (RAM) is expensive and
limited
◦
All data may not fit available memory
Programmer productivity low
◦
The programmer has to do a lot of tedious work.
8Database System
File Processing -
File Processing -
Recent (and Current) History
Recent (and Current) History
Data are stored in files with interface between programs and
files.
Various access methods exist (e.g., sequential, indexed,
random)
One file corresponds to one or several programs.
PROGRAM 1
Data
Management
FILE 1
FILE 2
Redundant Data
PROGRAM 2
Data
Management
PROGRAM 3
Data
Management
File
System
Services
9Database System
File System Functions
File System Functions
Mapping between logical files and physical files
◦
Logical files: a file viewed by users and programs.
Data may be viewed as a collection of bytes or
as a collection of records (collection of bytes
with a particular structure)
Programs manipulate logical files
◦
Physical files: a file as it actually exists on a storage
device.
Data usually viewed as a collection of bytes
located at a physical address on the device
Operating systems manipulate physical files.
A set of services and an interface (usually
called application independent interface – API)
10Database System
Problems With File Systems
Problems With File Systems
Data are highly redundant
◦
sharing limited and at the file level
Data is unstructured
◦
“flat” files
High maintenance costs
◦
data dependence; accessing data is difficult
◦
ensuring data consistency and controlling access to data
Sharing granularity is very coarse
Difficulties in developing new applications
11Database System
PROGRAM 1
PROGRAM 1
PROGRAM 2
Integrated
Database
DBMS
Query Processor
Transaction Mgr
…
Database Approach
Database Approach
12Database System
Database
Database
Database: Là một tập hợp dữ liệu có liên quan
luận lý với nhau chứa thông tin về 1 tổ chức nào
đó có tổ chức và được dùng chung đáp ứng nhu
cầu khai thác thông tin của người dùng.
Hệ quản trị CSDL ( Database Management
System - DBMS ): là 1 bộ phần mềm cho phép
người sử dụng định nghĩa, tạo lập, bảo trì và điều
khiển truy xuất CSDL
Database System 13
Ba thuộc tính cơ bản của Database
Ba thuộc tính cơ bản của Database
Persistent
Interrelated
Shared
Database System 14
Ba thuộc tính cơ bản của
Ba thuộc tính cơ bản của
Database
Database
Persistent:
◦
Dữ liệu được lưu trữ trong bộ nhớ ổn định như đĩa cứng.
Khi dữ liệu không cần dùng nữa thì có thể xoá hay sao
lưu lại.
Database System 15
Ba thuộc tính cơ bản của Database
Ba thuộc tính cơ bản của Database
Interrelated:
◦
Dữ liệu được lưu trữ như những đơn vị riêng biệt và được
kết nối với nhau để tạo 1 tổng thể chung
◦ Database vừa chứa thực thể và cả mối quan hệ giữa các
thực thể
Database System 16
Ba thuộc tính cơ bản của
Ba thuộc tính cơ bản của
Database
Database
Shared:
◦
Database có thể có nhiều người dùng và nhiều người
dùng có thể sử dụng cùng 1 database tại cùng 1 thời
điểm.
◦ Bài toán đồng thời (concurrency problem)
Database System 17
Các bước phát triển của công
Các bước phát triển của công
nghệ Database
nghệ Database
Thế hệ 1: hỗ trợ việc dò tìm ngẫu nhiên và tuần
tự, người dùng phải viết chương trình để truy
xuất dữ liệu.
Là hệ thống xử lý file hơn là DBMS, chỉ có thể xử lý 1
thực thể
Thế hệ 2: là DBMS đầu tiên, có thể quản lý được
nhiều kiểu thực thể và mối quan hệ giữa chúng
Database System 18
Các bước phát triển của công
Các bước phát triển của công
nghệ Database
nghệ Database
Thế hệ 3: xuất hiện DBMS quan hệ.
Đã bắt đầu có ngôn ngữ phi thủ tục
(nonprocedural language) SQL
Thế hệ 4: DBMS có thể lưu trữ và xử lý dữ liệu
không theo quy ước (unconventional data) như
hình ảnh, âm thanh, bản đồ, ảnh động,
Xuất hiện OODBMS (Object oriented DBMS)
Data warehouse ?
Database System 19
Transaction
Transaction
Là 1 đơn vị công việc ( work unit) được xử lý một
cách chắc chắn mà không cần có sự can thịêp từ
người dùng khác và không bị mất dữ liệu do lỗi
Ví dụ: dịch vụ rút tiền ATM, đặt vé máy bay
trước,…
Database System 20
Four module của Database System
Four module của Database System
hiện đại
hiện đại
By the amount of data that needs to be stored,
and concurrency
◦
OLTP (On line Transaction processing) – The OLTP
database stores current data –needs to run its
business; it’s only necessary to keep a small amount of
history.
◦
Operational Data Store (ODS) – Consolidated data
used for day to day reporting - consolidated from
several disparate sources, with some degree of pre-
aggregation performed, in order to save query time.
Database System 21
Four module của Database System
Four module của Database System
hiện đại
hiện đại
By the amount of data that needs to be stored,
and concurrency
◦
Data Warehouse – Grand data store for holding
nearly all organization data and its history.
◦
Data Mart – Specialized data store optimized for
aggregations, used for specific situations, and
heldas a subset of the data warehouse - processed
using a technology known as Online Analytical
Processing (OLAP)
Database System 22
Database System 23
Phân loại DBMS
Phân loại DBMS
Enterprise DBMS: thường chạy trên server
công suất lớn và chi phí cao, database mà
DBMS quản lý thường phản ánh mọi chức
năng của cả tổ chức.
Desktop DBMS: chạy trên PC, server nhỏ,
chi phí thấp và hỗ trợ có giới hạn việc xử
lý các transaction
Embedded DB: thường trú trong những hệ
thống lớn hơn (có thể là 1 ứng dụng, 1
smart card hay 1 thiết bị …), nó hỗ trợ có
giới hạn việc xử lý các transaction, bộ nhớ
nhỏ.
Database System 24
Cách tiếp cận Database
Cách tiếp cận Database
Người sử dụng tương tác với CSDL thông qua
chương trình ứng dụng ( application program)
Người sử dụng có thể nhìn thấy dữ liệu họ cần
thông qua khung nhìn (View - tiện ích của DBMS)
Database System 25