Tải bản đầy đủ (.pdf) (78 trang)

Bài giảng cơ sở dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.12 MB, 78 trang )

Chương 1

GIỚI THIỆU TỔNG QUAN

NỘI DUNG TRÌNH BÀY


Các khái niệm cơ bản



Hệ thống xử lý tập tin truyền thống



Hướng tiếp cận cơ sở dữ liệu



Các thành phần của hệ quản trị cơ sở dữ liệu



Các chức năng của hệ quản trị cơ sở dữ liệu

Biên soạn: Ths. Phạm Thế Hùng


CÁC VÍ DỤ VỀ CƠ SỞ DỮ LIỆU

Biên soạn: Ths. Phạm Thế Hùng



CÁC VÍ DỤ VỀ CƠ SỞ DỮ LIỆU

Biên soạn: Ths. Phạm Thế Hùng


CÁC VÍ DỤ VỀ CƠ SỞ DỮ LIỆU

Biên soạn: Ths. Phạm Thế Hùng

CÁC VÍ DỤ VỀ CƠ SỞ DỮ LIỆU

Biên soạn: Ths. Phạm Thế Hùng


CÁC KHÁI NIỆM CƠ BẢN





Dữ liệu (Data): sự kiện, văn bản, hình ảnh, âm
thanh, đoạn phim ảnh,… được ghi nhận và được
lưu trữ lại.
Data is raw, unorganized facts that need to
be processed. Data can be something simple and
seemingly random and useless until it is organized.
Biên soạn: Ths. Phạm Thế Hùng

CÁC KHÁI NIỆM CƠ BẢN





Thông tin (Information):
Dữ liệu đã được xử lý,
hữu ích trong việc ra
quyết định.
When data is processed,
organized, structured or
presented in a given
context so as to make it
useful,
it
is
called Information.

Bieân soạn: Ths. Phạm Thế Hùng


CÁC KHÁI NIỆM CƠ BẢN




Ví dụ về dữ liệu và thông tin
Dữ liệu: 51007
Thông tin:





5/10/07: Ngày nhập học.
$51,007: Thu nhập trung bình của 1 kỹ sư ở Mỹ.
51007: Mã bưu chính của thành phố Bronson, Iowa.

Biên soạn: Ths. Phạm Thế Hùng

CÁC KHÁI NIỆM CƠ BẢN
Thông tin

Dữ liệu










6.34
6.45
6.39
6.62
6.57
6.64
6.71
6.82

7.12
7.06

$7.20
$7.00
$6.80
Stock Price



SIRIUS SATELLITE RADIO INC.

$6.60
$6.40
$6.20
$6.00
$5.80
1

2

3

4

5

6

Last 10 Days


Biên soạn: Ths. Phạm Thế Hùng

7

8

9

10


CÁC KHÁI NIỆM CƠ BẢN

Biên soạn: Ths. Phạm Thế Hùng

CÁC KHÁI NIỆM CƠ BẢN



Siêu dữ liệu (Metadata): Dữ liệu mô tả về dữ liệu.
Metadata, literally "data about data", is
information that describes another set of data. A
common example is a library catalog card, which
contains data about the contents and location of
a book: It is data about the data in the book
referred to by the card. Other common contents
of metadata include the source or author of the
described dataset, how it should be accessed,
and its limitations.


Biên soạn: Ths. Phạm Thế Hùng


CÁC KHÁI NIỆM CƠ BẢN




Cơ sở dữ liệu (Database): Tập hợp dữ liệu mạch
lạc về logic, có một ngữ nghóa nhất định. Cơ sở
dữ liệu được dùng để mô tả về thế giới thực.
A database is an organized collection of data. The
data are typically organized to model relevant
aspects of reality in a way that supports processes
requiring this information. For example, modeling
the availability of rooms in hotels in a way that
supports finding a hotel with vacancies.

Biên soạn: Ths. Phạm Thế Hùng

CÁC KHÁI NIỆM CƠ BẢN


Hệ Quản trị Cơ sở dữ
liệu

Database
Management
System

(DBMS) là:




Một hệ thống phần mềm
cho phép người dùng
định nghóa, tạo mới, duy
trì một CSDL cũng như
cung cấp cách truy xuất
có kiểm soát dữ liệu.
Phần mềm này có thể
quản lý một hay nhiều
CSDL.
Biên soạn: Ths. Phạm Thế Hùng


CÁC KHÁI NIỆM CƠ BẢN


A
Database management systems (DBMS) is
collection of programs that enables users to
create and maintain a database. The DBMS is
general purpose software system that facilitates
the
processes
of
defining,
constructing,

manipulating and sharing database among
various users and application.

Biên soạn: Ths. Phạm Thế Hùng

CÁC KHÁI NIỆM CƠ BẢN








Defining a database involves specifying the data
types, structures and constraints of the data to be
stored in the database.
Constructing the database is the process of storing
the data on some storage medium that is
controlled by the DBMS.
Manipulating a database includes functions such
as querying the database to retrieve specific
data, updating the database to reflect changes in
the real world and generating reports from the
data.
Sharing a database allows multiple users and
programs to access the database simultaneously.
Biên soạn: Ths. Phạm Thế Hùng



CÁC KHÁI NIỆM CƠ BẢN


Các DBMS thương mại phổ biến:

Biên soạn: Ths. Phạm Thế Hùng

CÁC KHÁI NIỆM CƠ BẢN


Các DBMS miễn phí phổ biến:

Biên soạn: Ths. Phạm Thế Hùng


CÁC KHÁI NIỆM CƠ BẢN

Biên soạn: Ths. Phạm Thế Hùng

CÁC KHÁI NIỆM CƠ BẢN

Biên soạn: Ths. Phạm Thế Hùng


CÁC KHÁI NIỆM CƠ BẢN

Biên soạn: Ths. Phạm Thế Hùng

NGƯỜI DÙNG CƠ SỞ DỮ LIỆU



Người quản trị
cơ sở dữ liệu
(Database
Administrators)



toàn
quyền đối với
quyền
truy
xuất
của
người khác

Biên soạn: Ths. Phạm Thế Hùng


NGƯỜI DÙNG CƠ SỞ DỮ LIỆU


Lập trình viên
ứng
dụng
(Programmers)


Xây dựng các
chương trình ứng

dụng

Biên soạn: Ths. Phạm Thế Hùng

NGƯỜI DÙNG CƠ SỞ DỮ LIỆU


Người dùng cuối (End-users)


Tương tác với dữ liệu cho công việc hàng ngày

Biên soạn: Ths. Phạm Thế Hùng


NGƯỜI DÙNG CƠ SỞ DỮ LIỆU


Database
vendors,
implementors


Xây dựng các
phần mềm hệ
quản trị cơ sở dữ
liệu

Biên soạn: Ths. Phạm Thế Hùng


DỮ LIỆU


Có hai loại dữ liệu







Dữ liệu cần thiết của tổ chức
Metadata: thông tin về dữ liệu, được lưu trong data
dictionary hoặc catalog

Data dictionary gồm có thông tin về người dùng,
cấp phát quyền và cấu trúc bên trong của cơ sở
dữ liệu.
Tìm hiểu Cơ sở dữ liệu dưới nhiều khía cạnh khác
nhau:




Hệ thống cần phục vụ cho multi-user hay single-user
Dữ liệu tích hợp hay chia sẻ
Cơ sở dữ liệu tập trung hay phân tán
Biên soạn: Ths. Phạm Thế Hùng



DỮ LIỆU


Single-user System:





CSDL nằm ở 1 máy và chỉ có 1 người dùng ở 1 thời điểm
Người dùng có thể thiết kế, duy trì và viết chương trình
hệ thống, thực hiện các vai trò của người dùng. Hoặc
thuê tư vấn thiết kế hệ thống, còn người này thực hiện
vai trò của end user.

Multi-user System:


Dữ liệu tích hợp hay chia sẻ. Cùng 1 thông tin không
được lưu ở hai nơi và dữ liệu được chia sẻ để dùng
chung.

Biên soạn: Ths. Phạm Thế Hùng

HỆ THỐNG XỬ LÝ TẬP TIN

Biên soạn: Ths. Phạm Thế Hùng


HỆ THỐNG XỬ LÝ TẬP TIN


Biên soạn: Ths. Phạm Thế Hùng

HỆ THỐNG XỬ LÝ TẬP TIN

Biên soạn: Ths. Phạm Thế Huøng


HỆ THỐNG XỬ LÝ TẬP TIN


Đặc trưng:





Tập trung xử lý riêng lẻ
Mỗi ứng dụng được thiết kế với nhiều tập tin dữ liệu
riêng

Nhược điểm






Dư thừa và trùng lặp dữ liệu
Không nhất quán dữ liệu

Khó khăn trong truy xuất dữ liệu
Cô lập và hạn chế chia sẻ dữ liệu
Gây ra các vấn đề về tin cậy, truy cập đồng thời, an
toàn dữ liệu

Biên soạn: Ths. Phạm Thế Hùng

HƯỚNG TIẾP CẬN CƠ SỞ DỮ LIỆU




Theo hướng tiếp cận CSDL, tất cả dữ liệu mà các
ứng dụng sử dụng sẽ được tích hợp lại trong cơ
sở dữ liệu.
Việc tổ chức tốt cơ sở dữ liệu sẽ khắc phục được
những nhược điểm của hệ thống quản lý tập tin.

Biên soạn: Ths. Phạm Thế Hùng


HƯỚNG TIẾP CẬN CƠ SỞ DỮ LIỆU




Giảm sự trùng lặp và dư thừa dữ liệu
Đảm bảo dữ liệu có thể được truy xuất đồng thời
theo nhiều cách khác nhau.
Khả năng chia sẻ thông tin cho nhiều người sử

dụng và nhiều ứng dụng khác nhau.

Biên soạn: Ths. Phạm Thế Hùng

HƯỚNG TIẾP CẬN CƠ SỞ DỮ LIỆU








Data independence
Efficient data access
Data integrity & security
Data administration
Concurrent access, crash recovery
Reduced application development time
So why not use them always?
 Expensive/complicated to set up & maintain
 This cost & complexity must be offset by need
 General-purpose, not suited for special-purpose tasks (e.g.
text search!)

Biên soạn: Ths. Phạm Thế Huøng


HƯỚNG TIẾP CẬN CƠ SỞ DỮ LIỆU


Biên soạn: Ths. Phạm Thế Hùng

HƯỚNG TIẾP CẬN CƠ SỞ DỮ LIỆU
Ứng dụng
#1

Ứng dụng
#2

DBMS

Ứng dụng
#3

Biên soạn: Ths. Phạm Thế Hùng

Cơ sở dữ liệu
chứa các dữ
liệu chia sẻ
tập trung


FILE SYSTEM VS. DBMS

Biên soạn: Ths. Phạm Thế Hùng

CÁC THÀNH PHẦN CỦA HỆ DBMS

Biên soạn: Ths. Phạm Thế Hùng



CÁC THÀNH PHẦN CỦA HỆ DBMS


Ngôn ngữ giao tiếp giữa người sử dụng và CSDL
Ngôn ngữ mô tả dữ liệu (Data Definition Language)
Ngôn ngữ thao tác dữ liệu (Data Manipulation
Language)
 Ngôn ngữ điều khiển dữ liệu (Data Control Language)
 Ngôn ngữ truy vấn dữ liệu (Structured Query Language)





Từ điển dữ liệu



Dùng để mô tả các ánh xạ liên kết
Ghi nhận các thành phần cấu trúc của CSDL, chương
trình sử dụng, mật mã, quyền hạn sử dụng,…

Biên soạn: Ths. Phạm Thế Hùng

CÁC THÀNH PHẦN CỦA HỆ DBMS


Cơ chế giải quyết tranh chấp dữ liệu






Cơ chế sao lưu (backup) và phục hồi (restore) dữ
liệu khi có sự cố xảy ra






Cấp quyền ưu tiên cho người dùng
Đánh dấu yêu cầu truy xuất, người yêu cầu trước truy
xuất trước.

Tạo bản sao lưu định kỳ
Tạo nhật ký thao tác CSDL, tự động rollback khi có sự cố

Cung cấp giao diện tốt, dễ sử dụng, dễ hiểu
Bảo đảm tính độc lập giữa dữ liệu và chương
trình


Khi có thay đổi dữ liệu thì không cần phải viết lại chương
trình ứng dụng
Biên soạn: Ths. Phạm Thế Hùng


CÁC CHỨC NĂNG CỦA HỆ DBMS



Cung cấp môi trường tạo lập cơ sở dữ liệu



Cung cấp môi trường cập nhật và khai thác dữ
liệu









Thông qua ngôn ngữ định nghóa dữ liệu

Ngôn ngữ để người dùng diễn tả yêu cầu cập nhật hay
khai thác thông tin được gọi là ngôn ngữ thao tác dữ
liệu. Phổ biến nhất là ngôn ngữ SQL
Thao tác dữ liệu gồm: cập nhật và khai thác

Cung cấp công cụ kiểm soát, điều khiển truy
cập vào cơ sở dữ liệu







Phát hiện, ngăn chặn những sự truy cập trái phép
Duy trì tính nhất quán của dữ liệu
Tổ chức và điều khiển các truy cập đồng thời
Khôi phục sau sự cố
Quản lý các mô tả dữ liệu
Biên soạn: Ths. Phạm Thế Hùng

SƠ LƯC LỊCH SỬ PHÁT TRIỂN DBMS
1980-present Era of
relational database and
Database Management
System (DBMS):
1968-1980 Era of nonrelational database: IBM’s first
hierarchical DBMS called IMS. CODASYL
DBTG model was for N/w. IDMS most
popular network DBMS.

1968 File-Based:
Data maintained in a
flat file.

Processing characteristics determined by
common use of magnetic tape medium

Ancient Times:
RAM was expensive
and limited,
programmer

productivity low.

Programmer Defined both logical & physical structure,
such as storage structure, access methods, I/O modes etc.
Biên soạn: Ths. Phạm Thế Hùng


PHÂN LOẠI CÁC HỆ DBMS


Dựa trên mô hình dữ liệu






Hệ quản trị cơ sở dữ liệu quan hệ (RDBMS)
Hệ quản trị cơ sở dữ liệu phân cấp
Hệ quản trị cơ sở dữ liệu hướng đối tượng

Phân chia theo chức năng




Client / Server
Phân tán
Hệ quản trị CSDL chịu lỗi


Biên soạn: Ths. Phạm Thế Hùng

KIẾN TRÚC CHUNG MỘT HỆ DBMS
Giao diện lập trình
An toàn và bảo mật
Xử lý truy xuất đồng thời
Khôi phục sau sự cố
Tối ưu hóa câu truy vấn
Tổ chức lưu trữ dữ liệu

Biên soạn: Ths. Phạm Thế Hùng


Chương 2

MÔ HÌNH DỮ LIỆU

NỘI DUNG TRÌNH BÀY


Khái niệm mô hình dữ liệu



Mô hình Quan hệ



Các khóa của Quan hệ và Ràng buộc toàn vẹn




Khung nhìn



Các thao tác trên Mô hình Quan hệ



Kết luận

Biên soạn: Ths. Phạm Thế Hùng

1


MÔ HÌNH DỮ LIỆU
 A data model is a collection of
conceptual tools for describing
data, relationship between data,
and consistency constraints.

Mô hình dữ liệu (data model)
là một liên kết giữa cách nhìn
của người dùng và các bits
được lưu trong máy tính.


Biên soạn: Ths. Phạm Thế Hùng


MÔ HÌNH DỮ LIỆU
Mô hình dữ liệu gồm có
(Codd, 1980):




Tập các cấu trúc dữ liệu

Tập các phép toán để thao
tác với dữ liệu




Tập các ràng buộc dữ liệu

Có nhiều mô hình dữ liệu
khác nhau, chỉ tập trung vào
mô hình dữ liệu quan hệ.


Biên soạn: Ths. Phạm Thế Huøng

2


MÔ HÌNH DỮ LIỆU


Biên soạn: Ths. Phạm Thế Hùng

MÔ HÌNH DỮ LIỆU


Mô hình dữ liệu mức cao (mức khái niệm)




Cung cấp các khái niệm gần gũi với người sử dụng

Mô hình mức thấp (mức vật lý)
Cung cấp các khái niệm mô tả chi tiết cách thức lưu dữ
liệu trong máy tính




Mô hình cài đặt
Cung cấp các khái niệm mà người dùng có thể hiểu và
gần với cách dữ liệu được tổ chức trên máy tính




Các mô hình dữ liệu
Mô hình mạng; mô hình hướng đối tượng; mô hình phân
cấp; mô hình thực thể liên kết; mô hình quan hệ.



Biên soạn: Ths. Phạm Thế Hùng

3


×