Tải bản đầy đủ (.pdf) (61 trang)

Nhập môn cơ sở dữ liệu Phần 1: Giới thiệu về cơ sở dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.53 MB, 61 trang )

Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Nhập môn Cơ sở Dữ liệu
Phần 1: Giới thiệu về CSDL

Biên soạn : ThS.Phan Võ Minh Thắng

1


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Nội dung
1. Dẫn nhập - Tại sao cần phải có một CSDL
2. Khái niệm về CSDL.
3. Hệ quản trị CSDL.
4. Các loại mô hình CSDL.
Mục tiêu:
Phân biệt rõ ràng giữa một hệ thống các file dữ liệu cổ điển
với một cơ sở dữ liệu được tổ chức một cách có hệ thống, có
cấu trúc trong môi trường làm việc nhiều người sử dụng
đồng thời.
Biên soạn : ThS.Phan Võ Minh Thắng

2


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Dẫn nhập
Người sử dụng



Hệ thống
giao diện
Hệ thống
xử lý

Phần
mềm

Hệ thống
lưu trữ
Máy móc,
thiết bị

Mô hình phần mềm
Biên soạn : ThS.Phan Võ Minh Thắng

3


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Tại sao cần phải có một CSDL
• Hệ thống tập tin cổ điển:
– Được tổ chức riêng rẽ, phục vụ cho một mục đích
của một đơn vị hay một đơn vị con trực thuộc cụ
thể .
– Ưu điểm:
• triển khai ứng dụng nhanh.
• có khả năng đáp ứng nhanh chóng, kịp thời.


Biên soạn : ThS.Phan Võ Minh Thắng

4


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Ví dụ về hệ thống tập tin cổ điển

Biên soạn : ThS.Phan Võ Minh Thắng

5


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Các thuật ngữ trong cách tiếp cận
tập tin cổ điển
• Dữ liệu - Data
– Số liệu thô

• Trường - Field
– Nhóm các đặc tính có một ý nghĩa nào đó

• Mẫu tin - Record
– Các trường có liên kết với nhau một cách logic
để mô tả một người, một nơi chốn, hay một vật

• Tập tin và thư mục tập tin – File, file folder

– Tập hợp các mẫu tin có quan hệ
Biên soạn : ThS.Phan Võ Minh Thắng

6


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Nhược điểm hệ thống tập tin cổ điển
• Quản trị Dữ liệu của hệ thống tập tin cổ điển
– Đòi hỏi phải dùng các ngôn ngữ lập trình để lập
trình thêm
– Tốn nhiều thời gian
– Phụ thuộc vào việc lưu trữ dữ liệu về mặc vật lý
– Không thể thực hiện những truy vấn thông tin phức
tạp
– Khó hiệu chỉnh các tập tin trong hệ thống tập tin cổ
điển (vì mỗi file trực thuộc hệ thống riêng của nó)
– Dẫn tới các islands of information
Biên soạn : ThS.Phan Võ Minh Thắng

7


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Nhược điểm hệ thống tập tin cổ điển


Phụ thuộc dữ liệu

– Thay đổi về các đặc tính của tập tin đòi hỏi phải
hiệu chỉnh các chương trình truy cập dữ liệu.
– Chương trình phải biết làm gì và làm thế nào
– Hệ thống tập tin trở nên cồng kềnh trong việc lập
trình và quản lý dữ liệu



Phụ thuộc cấu trúc
– Thay đổi về cấu trúc tập tin đòi hỏi phải hiệu chỉnh
lại các chương trình có liên quan

Biên soạn : ThS.Phan Võ Minh Thắng

8


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Nhược điểm hệ thống tập tin cổ điển


Định nghĩa trường và cách đặt tên
– Định nghĩa các mẫu tin thoãi mái nhưng nó sẽ gây
khó khăn về các yêu cầu báo cáo.
– Chọn được các tên trường đúng là quan trọng
– Chú ý tới độ dài của tên trường
– Sử dụng các định danh duy nhất cho mẫu tin

Biên soạn : ThS.Phan Võ Minh Thắng


9


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Nhược điểm hệ thống tập tin cổ điển


Dư thừa dữ liệu – data redundancy



Các phiên bản khác nhau và mâu thuẫn nhau
của cùng một dữ liệu
Hậu quả của việc dư thừa dữ liệu không thể
kiểm soát được
• Lãng phí công sức nhập liệu và không gian lưu trữ.
• Những dị thường về dữ liệu - data anomalies
– Khi sửa đổi
– Khi thêm
– Khi xóa

• Dữ liệu không nhất quán - Data inconsistency
– Thiếu các ràng buộc về dữ liệu - data integrity

• Thiếu sự chia sẻ thông tin giữa các nơi.

Biên soạn : ThS.Phan Võ Minh Thắng


10


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Tại sao cần phải có một CSDL
• Chúng ta cần gì
– Một hệ thống thông tin đảm bảo được tính chất
nhất quán dữ liệu
– Không trùng lặp thông tin mà vẫn đáp ứng được
nhu cầu khai thác đồng thời của nhiều người dùng
khác nhau.

• Cần làm rõ một số khái niệm
– Dữ liệu
– Thông tin
Biên soạn : ThS.Phan Võ Minh Thắng

11


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Dữ liệu Vs Thông tin
• Dữ liệu - Data

Data








3000124

12-Jan-2002

$121.98

– Số liệu thô


– Được lưu trữ và truy cập
– Chưa được xử lý để thể hiện ý nghĩa của nó cho
người sử dụng
– Ví dụ:

• Công ty Robcor có hai chi nhánh và hai chi nhánh này
lần lược có 1,380,456 và 1,453,907 hóa đơn.
• Mỗi hóa đơn có mã hóa đơn, ngày hóa đơn, và số lượng
• Giai đoạn xem xét là từ quý 1 năm 1997 tới quý 1 năm
2002.
• Tổng cộng có 2,834,363 mẫu tin
Biên soạn : ThS.Phan Võ Minh Thắng

12


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL


Dữ liệu Vs Thông tin
• Thông tin - Information
– Dữ liệu đã được xử lý
– Là mấu chốt để có được các quyết định tốt

Biên soạn : ThS.Phan Võ Minh Thắng

13


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Dữ liệu Vs Thông tin





Dữ liệu hợp thành thông tin
Thông tin có được từ việc xử lý dữ liệu
Thông tin lột tả ý nghĩa của dữ liệu
Thông tin đúng đắng, kịp thời và đầy đủ là
mấu chốt để thực hiện những quyết định
• Quyết định đúng đắng là then chốt quyết định
sự sống còn của tổ chức

Biên soạn : ThS.Phan Võ Minh Thắng

14



Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Khái niệm về Cơ sở Dữ liệu
Cơ sở dữ liệu là một hệ thống các thông tin có
cấu trúc được lưu trữ trên các thiết bị lưu trữ
thông tin thứ cấp (như băng từ, đĩa từ ...) để có
thể thỏa mãn yêu cầu khai thác thông tin đồng
thời của nhiều người sử dụng hay nhiều chương
trình ứng dụng với nhiều mục đích khác nhau.
- CSDL phải là một tập hợp các thông tin mang tính hệ thống

chứ không phải là các thông tin rời rạc, không có mối quan hệ
với nhau.
- Các thông tin này phải có cấu trúc và tập hợp các thông tin này
phải có khả năng đáp ứng các nhu cầu khai thác của nhiều người
sử dụng một cách đồng thời
Biên soạn : ThS.Phan Võ Minh Thắng

15


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Sơ đồ tổng quát về một Cơ sở dữ liệu
Chương
trình ứng
dụng 1


Cơ sở dữ liệu

Chương
trình ứng
dụng 2

Các hệ thống chương
trình khai thác cơ sở dữ
liệu

Biên soạn : ThS.Phan Võ Minh Thắng

Người sử dụng khai
thác cơ sở dữ liệu

16


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Ưu điểm của CSDL
• Giảm sự trùng lặp thông tin xuống mức thấp
nhất và do đó bảo đảm được tính nhất quán và
toàn vẹn dữ liệu.
• Đảm bảo dữ liệu có thể được truy xuất theo
nhiều cách khác nhau.
• Khả năng chia sẻ thông tin cho nhiều người sử
dụng và nhiều ứng dụng khác nhau.

Biên soạn : ThS.Phan Võ Minh Thắng


17


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Các cách tiếp cận CSDL






Mô hình phân cấp
Mô hình mạng
Mô hình quan hệ
Mô hình thực thể kết hợp
Mô hình đối tượng

Biên soạn : ThS.Phan Võ Minh Thắng

18


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Các vấn đề với cách tiếp cận CSDL
• Tính chủ quyền của dữ liệu.
• Tính bảo mật và quyền khai thác thông tin của
người sử dụng.

• Tranh chấp dữ liệu.
• Đảm bảo dữ liệu khi có sự cố.

Biên soạn : ThS.Phan Võ Minh Thắng

19


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Vấn đề quản trị CSDL
• CSDL được chia sẻ, tích hợp giữa các cấu trúc
máy tính giữ các dữ liệu có liên quan:
– Dữ liệu của người sử dụng (dữ liệu thô)
– Metadata (dữ liệu về dữ liệu, nó chứa đựng các đặc
tính và mối quan hệ giữa các dữ liệu với nhau)

Biên soạn : ThS.Phan Võ Minh Thắng

20


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Hệ quản trị Cơ sở Dữ liệu
• Database Management System (DBMS): hệ thống phần
mềm giúp giải quyết các vấn đề liên quan đến CSDL:







Quản lý nội dung dữ liệu
Quản lý cấu trúc CSDL
Cung cấp các công cụ để định nghĩa, tạo lập, khai thác và
xử lý dữ liệu: môi trường phát triển (đồ họa), ngôn ngữ
truy vấn,…
Kiểm soát truy cập dữ liệu,


• Cài đặt dựa trên một mô hình dữ liệu cụ thể.
• Một số hệ quản trị CSDL: Visual FoxPro, MicroSoft
Access, SQL-Server, DB2, Sybase, Paradox, Informix,
Oracle...
Phần mềm ứng dụng
Biên soạn : ThS.Phan Võ Minh Thắng

DBMS

Database
21


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Tầm quan trọng của HQT CSDL
• Việc quản trị dữ liệu được hiệu quả hơn
• Ngôn ngữ truy vấn giúp trả lời các câu hỏi phức tạp
một cách nhanh chóng

• Cho phép truy cập tốt hơn tới dữ liệu được quản lý
một cách tốt hơn và nhiều hơn
• Tăng cường khả năng xem xét các hoạt động tích
hợp của hệ thống
• Giảm khả năng xuất hiện của dữ liệu không nhất
quán
Biên soạn : ThS.Phan Võ Minh Thắng

22


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

DBMS quản lý sự tương tác

Biên soạn : ThS.Phan Võ Minh Thắng

23


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL

Database vs. File Systems

Biên soạn : ThS.Phan Võ Minh Thắng

24


Nhập môn Cơ sở Dữ liệu - Phần 1: Giới thiệu về CSDL


Ba mức độ biểu diễn CSDL
•Mức vật lý (Physical): Lưu trữ vật lý CSDL: dữ liệu gì và được

lưu trữ như thế nào? ở đâu (đĩa từ, băng từ, track, sector ... nào)? Cần
các chỉ mục gì?

•Mức quan niệm (Conception hay Logical): CSDL cần phải lưu

giữ bao nhiêu loại dữ liệu? những dữ liệu gì? Mối quan hệ giữa các
loại dữ liệu?

CSDL mức quan niệm là một sự biểu diễn trừu tượng CSDL mức vật
lý; và CSDL vật lý là sự cài đặt cụ thể của CSDL mức quan niệm.

•Mức ngoài: Người sử dụng hay chương trình ứng dụng "nhìn"

CSDL theo một góc độ toàn bộ hay chỉ một phần hoặc chỉ là các
thông tin tổng hợp từ CSDL hiện có, do người quản trị hay chương
trình ứng dụng quy định. Người sử dụng hay chương trình ứng dụng
có thể hoàn toàn không được biết về cấu trúc tổ chức lưu trữ thông
tin trong CSDL

Biên soạn : ThS.Phan Võ Minh Thắng

25


×