Nhập môn CSDL - Khoa CNTT
1
Số tiết: 45
Tài liệu tham khảo:
Giáo trình Cơ sở dữ liệu - Nguyễn Đăng tỵ, Đỗ Phúc
(Đại học QG TP Hồ Chí Minh-Trường Đại học CNTT)
Nhập môn Cơ sở dữ liệu - Nguyễn Tuệ -NXB GD
Hình thức thi: thi viết
Thời gian 60-90 phút
Kiểm tra định kì: 2 lần
Giảng viên: Đặng Thị Kim Anh
Email:
2
1. Định nghĩa cơ sở dữ liệu
3
1.1. D
ữ liệu
Dữ liệu (data): sự biểu diễn của các đối tượng
và sự kiện được ghi nhận và được lưu trữ trên các
phương tiện của máy tính.
Dữ liệu có cấu trúc: số, ngày, chuỗi ký tự, …
Dữ liệu không có cấu trúc: hình ảnh, âm thanh,
đoạn phim, …
1. Định nghĩa cơ sở dữ liệu (TT)
4
1.2. Cơ sở dữ liệu
CSDL là một hệ thống các thông tin có cấu trúc được
lưu trữ trên các thiết bị lưu trữ thứ cấp (như băng từ, đĩa
từ…) nhằm thỏa mãn yêu cầu khai thác thông tin đồng thời
của nhiều người sử dụng hay chươngtrình ứng dụng với
nhiều mục đích khác nhau
Ưu điểm nổi bật của cơ sở dữ liệu:
- Giảm trùng lặp thông tin xuống mức thấp nhất
- Đảm bảo dữ liệu có thể được truy xuất theo nhiều
cách khác nhau
- Khả năng chia sẻ thông tin cho nhiều người sử dụng
và nhiều ứng dụng khác nhau.
1. Định nghĩa cơ sở dữ liệu(tt)
5
1.2. C
ơ sở dữ liệu
Những vấn đề cần lưu ý đối với CSDL:
- Tính chủ quyền của dữ liệu
- Tính bảo mật và quyền khai thác thông tin
của người sử dụng
- Tranh chấp dữ liệu
- Đảm bảo dữ liệu khi có sự cố
1. Định nghĩa cơ sở dữ liệu(tt)
6
1.3. Thông tin (information)
-
Thông tin là dữ liệu đã được xử lý
để làm tăng sự hiểu biết của người sử
dụng.
- Dữ liệu trong ngữ cảnh.
- Dữ liệu được tổng hợp / xử lý.
1. Định nghĩa cơ sở dữ liệu (tt)
7
Dữ liệu
50010273 NguyễnTrung Tiến MT00 20
50100298 LêViệt Hùng MT01 19
59900012 Trần HùngViệt MT99 21
50200542 Hồ Xuân Hương MT02 18
50000075 Bùi Đức Duy MT00 20
Thông tin: dữ liệu trong ngữ cảnh
Mã sinh viên Họ và tên sinh viên Lớp Tuổi
50010273 Nguyễn Trung Tiến MT00 20
50100298 Lê Việt Hùng MT01 19
59900012 Trần Hùng Việt MT99 21
50200542 Hồ Xuân Hương MT02 18
50000075 Bùi Đức Duy MT00 20
1. Định nghĩa cơ sở dữ liệu(tt)
8
Thông tin: dữ liệu được tổng hợp / xử lý
MT00
40%
MT01
20%
MT02
20%
MT99
20%
9
Hệ thống xử lý tập tin (file processing system)
Hệ thống xử lý tập tin là tập hợp các
chương trình dùng để lưu trữ, thao tác và
truy xuất các tập tin dữ liệu có kích thước
lớn.
Các tập tin dữ liệu được lưu trữ trong các
thư mục (folder).
2. Hệ thống xử lý tập tin
10
2. Hệ thống xử lý tập tin
Các thành phần của hệ thống xử lý tập tin
Phần cứng: các máy tính.
Phần mềm:
Hệ điều hành
Các tiện ích
Các tập tin
Các chương trình quản lý tập tin
Các chương trình ứng dụng tạo các báo cáo từ các dữ
liệu được lưu trữ trong các tập tin.
Con người: người quản lý, chuyên gia, người lập trình,
người sử dụng cuối cùng.
Các thủ tục: các lệnh và các qui tắc chi phối việc thiết kế
và sử dụng các thành phần của phần mềm.
Dữ liệu: tập hợp các sự kiện.
11
CSDL cá nhân (personal database)
CSDL riêng.
CSDL nhóm làm việc (workgroup database)
Mạng cục bộ (ít hơn 25 người sử dụng)
CSDL phòng ban (department database)
Mạng cục bộ (từ 25 đến 100 người sử dụng)
CSDL xí nghiệp (enterprise database)
Mạng diện rộng (hàng trăm hoặc hàng ngàn người sử
dụng)
3. Các loại cơ sở dữ liệu
12
4. Hệ quản trị cơ sở dữ liệu
13
Hệ quản trị CSDL
(DBMS – DataBase Management System)
Hệ quản trị CSDL là tập hợp các chương trình
dùng để quản lý cấu trúc và dữ liệu của CSDL và
điều khiển truy xuất dữ liệu trong CSDL.
Cho phép người sử dụng định nghĩa, tạo lập và
bảo trì CSDL và cung cấp các truy xuất dữ liệu.
4. Hệ quản trị cơ sở dữ liệu
14
4. Hệ quản trị cơ sở dữ liệu
15
Hệ quản trị CSDL gồm các thành phần sau:
- Ngôn ngữ giữa người sử dụng và CSDL:.
+ Ngôn ngữ mô tả dữ liệu: Cho phép khai báo
cấu trúc của CSDL, khai báo mối liên hệ dữ liệu
và quy tắc.
+ Ngôn ngữ thao tác dữ liệu: cho phép người
sử dụng có thể thêm (Insert), xóa (Delete), sửa
(Update) dữ liệu trong CSDL
+ Ngôn ngữ truy vấn dữ liệu
+ Ngôn ngữ kiểm soát dữ liệu: cho phép người
quản trị hệ thống thay đổi cấu trúc của bảng dữ
liệu, khai báo bảo mật thông tin và cấp quyền
hạn khai thác CSDL cho người sử dụng.
4. Hệ quản trị cơ sở dữ liệu
16
Hệ quản trị CSDL gồm các thành phần sau:
- Từ điển dữ liệu dùng để mô tả các ánh xạ liên kết,
ghi nhận các thành phần cấu trúc của CSDL, các
chương trình ứng dụng, mật mã, quyền hạn sử dụng
- Có biện pháp bảo mật tốt khi có yêu cầu bảo mật
-
Cơ chế giải quyết tranh chấp dữ liệu
-
Hệ quản trị CSDL cũng phải có cơ chế sao lưu
(backup) và phục hồi (restore) khi có sự cố.
-
Hệ quản trị CSDL phải cung cấp một giao diện tốt,
dễ sử dụng, dễ hiểu cho những người sử dụng
không chuyên.
17
Hệ thống tập tin (flat file): 1960 - 1980
Hệ CSDL phân cấp (hierarchical): 1970 - 1990
Hệ CSDL mạng (network): 1970 - 1990
Hệ CSDL quan hệ (relational): 1980 - nay
Hệ CSDL hướng đối tượng (object-oriented): 1990
- nay
Hệ CSDL đối tượng - quan hệ (object-relational):
1990 - nay
Kho dữ liệu (data warehouse): 1980 - nay
Web-enabled: 1990 - nay
5. Sự phát triển các hệ CSDL
18
6.1. Mức vật lý
Đây là mức lưu trữ CSDL, vấn đề cần giải quyết là dữ
liệu gì và được lưu trữ như thế nào, ở đâu (đĩa từ, băng từ
track, sector…nào)? Việc truy xuất tuần tự hay ngẫu nhiên
đối với từng loại dữ liệu.
6.2. Mức quan niệm
Tại mức này sẽ giải quyết cho các câu hỏi CSDL cần
phải lưu giữ bao nhiêu loại dữ liệu, đó là những dữ liệu gì?
Mối quan hệ giữa các loại dữ liệu này như thế nào.
CSDL ở mức quan niệm là sự biểu diễn trừu tượng
CSDL mức vật lý hoặc ngược lại, CSDL ở mức vật lý là sự
cài đặt cụ thể của CSDL mức quan niệm.
6. Các mức biểu diễn CSDL
19
6.3. Mức ngoài
Đó là mức của người sử dụng và các chương trình
ứng dụng. Làm việc tại mức này có các nhà chuyên
môn, các kỹ sư tin học và nhưng người sử dụng
không chuyên.
Mỗi người sử dụng hay mỗi chương trinh ứng
dụng có thể “nhìn” (view) CSDL theo một góc độ
khác nhau. Có thể nhìn thấy toàn bộ hay chỉ một
phần hoặc chỉ các thông tin tổng hợp từ CSDL hiện
có.
6. Các mức biểu diễn CSDL
20
Sơ đồ
quan niệm
(hoặc mức
logic)
Sơ đồ
Cấu trúc
vật lý
CSDL
Môi trường
thực - thế giới
thực
Cấu trúc
ngoài 1
Cấu trúc
ngoài 2
Cấu trúc
ngoài n
Chương trình
ứng dụng n
NSD1
NSD2
Được mô
hình hoá
thành
7. Tính độc lập giữa dữ liệu và chương
trình
21
Tính độc lập dữ liệu ở mức vật lý
Người quản trị CSDL có thể tổ chức lại CSDL
bằng cách thay đổi cách tổ chức, cấu trúc vật lý của
dữ liệu trên các thiết bị nhớ thứ cấp để làm thay đổi
hiệu quả tính toán của các chương trình ứng dụng,
nhưng không đòi hỏi phải viết lại chương trình ứng
dụng.
7. Tính độc lập giữa dữ liệu và
chương trình
22
Tính độc lập dữ liệu ở mức logic
Giữa khung nhìn với lươc đồ quan niệm cũng có
thể tồn tại một loại độc lập về dữ liệu.
Trong quá trình khai thác CSDL người ta có thể
nhận thấy tính cần thiết phải sửa đổi lược đồ khái
niệm như bổ sung thêm thông tin hoặc xóa bớt các
thông tin của các thực thể đang tồn tại trong CSDL.
Việc thay đổi lược đồ khái niệm không làm ảnh
hưởng tới các lược đồ con, do đó không cần phải viết
lại các chương trình ứng dụng.