Tải bản đầy đủ (.ppt) (46 trang)

Chương 1 Giới thiệu về Database

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (760.31 KB, 46 trang )

Chương 1:
Chương 1:
Giới thiệu về Database
Giới thiệu về Database
Database System 1
Database System 2
Nội dung
Nội dung

Các định nghĩa cơ bản

Hệ thống xử lý tập tin truyền thống và
nhược điểm của nó

Cơ sở dữ liệu và các ưu điểm

Chức năng và thành phần cuả hệ quản trị
CSDL (DBMS)

Chu kỳ phát triển hệ thống

Quá trình phát triển CSDL

Kiến trúc CSDL 3 mức

Kiến trúc hệ quản trị CSDL
Database System 3
Các định nghĩa cơ bản
Các định nghĩa cơ bản

Data (dữ liệu) và information (thông tin)



Data: bao gồm sự việc (fact), văn bản(text), đồ
họa(graphics), hình ảnh (images), âm thanh (sound)


Information: dữ liệu đã được xử lý

Phân biệt giữa data và information??
Database System 4
Các định nghĩa cơ bản (tt)
Các định nghĩa cơ bản (tt)

Siêu dữ liệu (metadata): mô tả các tính chất
hoặc các đặc điểm của dữ liệu khác
Database System 5
Make Mode l OwnerID ID Name Age
Honda Accord 12 12 Nemo 22
Honda Accord 156 156 Dory 21
Hệ thống xử lý tập tin truyền thống
Hệ thống xử lý tập tin truyền thống

Là tập hợp các chương trình ứng dụng
thực hiện các dịch vụ cho nhiều người sử
dụng, mỗi chương trình ứng dụng tạo và
quản lý các dữ liệu riêng biệt.

Nhược điểm:

Phụ thuộc dữ liệu – chương trình
◦ Trùng lặp dữ liệu

◦ Hạn chế việc dùng chung dữ liệu

Thời gian phát triển lâu

Chi phí bảo trì chương trình cao
Database System 6
Hệ thống xử lý tập tin truyền thống
Hệ thống xử lý tập tin truyền thống

Data are not stored on disk

Programmer defines both logical data structure
and physical structure (storage structure, access
methods, I/O modes, etc)

One data set per program. High data redundancy.
PROGRAM 2
Data
Management
PROGRAM 3
Data
Management
PROGRAM 1
Data
Management
DATA SET 1
DATA SET 2
DATA SET 3
7Database System
Problems with early data management

Problems with early data management

There is no persistence.

All data is transient and disappears when the program
terminates.

Random access memory (RAM) is expensive and
limited

All data may not fit available memory

Programmer productivity low

The programmer has to do a lot of tedious work.
8Database System
File Processing -
File Processing -
Recent (and Current) History
Recent (and Current) History

Data are stored in files with interface between programs and
files.

Various access methods exist (e.g., sequential, indexed,
random)

One file corresponds to one or several programs.
PROGRAM 1
Data

Management
FILE 1
FILE 2
Redundant Data
PROGRAM 2
Data
Management
PROGRAM 3
Data
Management
File
System
Services
9Database System
File System Functions
File System Functions

Mapping between logical files and physical files

Logical files: a file viewed by users and programs.

Data may be viewed as a collection of bytes or
as a collection of records (collection of bytes
with a particular structure)

Programs manipulate logical files

Physical files: a file as it actually exists on a storage
device.


Data usually viewed as a collection of bytes
located at a physical address on the device

Operating systems manipulate physical files.

A set of services and an interface (usually
called application independent interface – API)
10Database System
Problems With File Systems
Problems With File Systems

Data are highly redundant

sharing limited and at the file level

Data is unstructured

“flat” files

High maintenance costs

data dependence; accessing data is difficult

ensuring data consistency and controlling access to data

Sharing granularity is very coarse

Difficulties in developing new applications
11Database System
PROGRAM 1

PROGRAM 1
PROGRAM 2
Integrated
Database
DBMS
Query Processor
Transaction Mgr

Database Approach
Database Approach
12Database System
Database
Database

Database: Là một tập hợp dữ liệu có liên quan
luận lý với nhau chứa thông tin về 1 tổ chức nào
đó có tổ chức và được dùng chung đáp ứng nhu
cầu khai thác thông tin của người dùng.

Hệ quản trị CSDL ( Database Management
System - DBMS ): là 1 bộ phần mềm cho phép
người sử dụng định nghĩa, tạo lập, bảo trì và điều
khiển truy xuất CSDL
Database System 13
Ba thuộc tính cơ bản của Database
Ba thuộc tính cơ bản của Database

Persistent

Interrelated


Shared
Database System 14
Ba thuộc tính cơ bản của
Ba thuộc tính cơ bản của
Database
Database

Persistent:

Dữ liệu được lưu trữ trong bộ nhớ ổn định như đĩa cứng.
Khi dữ liệu không cần dùng nữa thì có thể xoá hay sao
lưu lại.
Database System 15
Ba thuộc tính cơ bản của Database
Ba thuộc tính cơ bản của Database

Interrelated:

Dữ liệu được lưu trữ như những đơn vị riêng biệt và được
kết nối với nhau để tạo 1 tổng thể chung
◦ Database vừa chứa thực thể và cả mối quan hệ giữa các
thực thể
Database System 16
Ba thuộc tính cơ bản của
Ba thuộc tính cơ bản của
Database
Database

Shared:


Database có thể có nhiều người dùng và nhiều người
dùng có thể sử dụng cùng 1 database tại cùng 1 thời
điểm.
◦ Bài toán đồng thời (concurrency problem)
Database System 17
Các bước phát triển của công
Các bước phát triển của công
nghệ Database
nghệ Database

Thế hệ 1: hỗ trợ việc dò tìm ngẫu nhiên và tuần
tự, người dùng phải viết chương trình để truy
xuất dữ liệu.

Là hệ thống xử lý file hơn là DBMS, chỉ có thể xử lý 1
thực thể

Thế hệ 2: là DBMS đầu tiên, có thể quản lý được
nhiều kiểu thực thể và mối quan hệ giữa chúng
Database System 18
Các bước phát triển của công
Các bước phát triển của công
nghệ Database
nghệ Database

Thế hệ 3: xuất hiện DBMS quan hệ.

Đã bắt đầu có ngôn ngữ phi thủ tục
(nonprocedural language) SQL


Thế hệ 4: DBMS có thể lưu trữ và xử lý dữ liệu
không theo quy ước (unconventional data) như
hình ảnh, âm thanh, bản đồ, ảnh động,

Xuất hiện OODBMS (Object oriented DBMS)

Data warehouse ?

Database System 19
Transaction
Transaction

Là 1 đơn vị công việc ( work unit) được xử lý một
cách chắc chắn mà không cần có sự can thịêp từ
người dùng khác và không bị mất dữ liệu do lỗi

Ví dụ: dịch vụ rút tiền ATM, đặt vé máy bay
trước,…
Database System 20
Four module của Database System
Four module của Database System
hiện đại
hiện đại

By the amount of data that needs to be stored,
and concurrency

OLTP (On line Transaction processing) – The OLTP
database stores current data –needs to run its

business; it’s only necessary to keep a small amount of
history.

Operational Data Store (ODS) – Consolidated data
used for day to day reporting - consolidated from
several disparate sources, with some degree of pre-
aggregation performed, in order to save query time.
Database System 21
Four module của Database System
Four module của Database System
hiện đại
hiện đại

By the amount of data that needs to be stored,
and concurrency

Data Warehouse – Grand data store for holding
nearly all organization data and its history.

Data Mart – Specialized data store optimized for
aggregations, used for specific situations, and
heldas a subset of the data warehouse - processed
using a technology known as Online Analytical
Processing (OLAP)
Database System 22
Database System 23
Phân loại DBMS
Phân loại DBMS

Enterprise DBMS: thường chạy trên server

công suất lớn và chi phí cao, database mà
DBMS quản lý thường phản ánh mọi chức
năng của cả tổ chức.

Desktop DBMS: chạy trên PC, server nhỏ,
chi phí thấp và hỗ trợ có giới hạn việc xử
lý các transaction

Embedded DB: thường trú trong những hệ
thống lớn hơn (có thể là 1 ứng dụng, 1
smart card hay 1 thiết bị …), nó hỗ trợ có
giới hạn việc xử lý các transaction, bộ nhớ
nhỏ.
Database System 24
Cách tiếp cận Database
Cách tiếp cận Database

Người sử dụng tương tác với CSDL thông qua
chương trình ứng dụng ( application program)

Người sử dụng có thể nhìn thấy dữ liệu họ cần
thông qua khung nhìn (View - tiện ích của DBMS)
Database System 25

×