Tải bản đầy đủ (.docx) (4 trang)

Chapter 1. Giới thiệu cơ sở dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (129.37 KB, 4 trang )

Chapter 1. Giới thiệu về hệ thống cơ sở dữ liệu

1.1. Định nghĩa và lý do
Database system (DBS) nói chung một hệ thống lưu trữ dữ liệu. Database
management system (DBMS) là một tập hợp các chương trình cho phép quản lý
database.
Một số chức năng chính của DBS:
- Định nghĩa dữ liệu: tạo và quản lý các quan hệ, phụ thuộc, hạn chế tính nhất
quán, xem dữ liệu
- Điều chỉnh dữ liệu: chèn, cập nhật, xóa, rút trích, tái cấu trúc và tổng hợp dữ liệu.
- An ninh hệ thống và dữ liệu: quản lý truy cập vào hệ thống, nguồn lực và dữ liệu
- Hỗ trợ ngơn ngữ lập trình
Các thành phần của một DBS bao gồm:
- Phần cứng và hệ điều hành
- DBMS
- Database
- Các hệ thống phần mềm và/hoặc các ứng dụng
- Người dùng- bao gồm cả người dùng kỹ thuật và người dùng cuối.


H1. Mơ hình DBS
Bất kỳ các hệ thống phần mềm nào cũng cần có một database để lưu trữ dữ
liệu cũng như truy cập dữ liệu một cách liên tục.
1.2. Khái niệm Data Independence
Độc lập dữ liệu vật lý ngụ ý rằng chế độ xem của người dùng độc lập với tổ
chức tập tin vật lý, máy hoặc phương tiện lưu trữ. Độc lập dữ liệu logic có nghĩa là
mỗi người dùng (hoặc chương trình ứng dụng) có thể có chế độ xem logic của
riêng mình và khơng cần chế độ xem toàn cục của dữ liệu logic cơ sở dữ liệu.
Các ngơn ngữ lập trình cấp cao (HLPL) có các hệ thống xử lý tập tin tích
hợp sẵn mà bạn chắc chắn sẽ thành thạo khi sử dụng. Những HLPL khơng hỗ trợ
tính độc lập của dữ liệu. Khi bạn sử dụng chúng để xác định các tệp dữ liệu của


mình, ở đó khơng có sự tách biệt giữa tệp dữ liệu bạn muốn thao tác và các chương
trình ứng dụng sử dụng chúng. Một hệ thống cơ sở dữ liệu giải quyết tình trạng
tiến thối lưỡng nan này bằng cách giới thiệu một lớp bổ sung ảo giữa người lập
trình ứng dụng và các tệp dữ liệu được thao tác trong nhiều chương trình ứng dụng.
1.3. Các phương pháp thiết kế cơ sở dữ liệu
Khi xem xét đến quản lý dữ liệu thông qua các hệ thống máy tính, có năm
cách tiếp cận đã được thực hiện trong vài thập kỷ qua:
- Hệ thống nhỏ tức thì: chỉ sử dụng một tệp tin
- Hệ thống xử lý tệp: bao gồm nhiều tệp
- Các hệ thống phi quan hệ truyền thống, ví dụ: phương pháp phân cấp, danh sách
đảo ngược và mạng
- Cơ sở dữ liệu quan hệ: được tiên phong bởi những cá nhân nổi bật như Edgar
Codd, Ronald Fagin, Christopher Date.
- Cơ sở dữ liệu đối tượng — một cách tiếp cận khác


Năm cách tiếp cận này thực sự có thể được sắp xếp lại thành ba nhóm lớn
như sau:
- Tệp thơng thường: với phương pháp này các chương trình ứng dụng tồn tại để
cập nhật tệp hoặc truy xuất thông tin từ tệp. Tuy nhiên vấn đề chính với phương
pháp này là nó khơng có dữ liệu độc lập. Để minh họa vấn đề, hãy xem xét một hệ
thống thông tin bao gồm 30 tệp dữ liệu và 150 chương trình ứng dụng thao tác với
các tệp đó. Giả sử rằng mỗi tệp dữ liệu tác động đến 10–15 các chương trình ứng
dụng. Sau đó, bất cứ khi nào cần điều chỉnh cấu trúc của tệp dữ liệu, cũng cần phải
theo dõi 10–15 chương trình ứng dụng và điều chỉnh chúng. Đây là một cách rất
kém hiệu quả để quản lý một hệ thống phần mềm phức tạp.

Figure 1.2. Thiết kế dựa trên tệp truyền thống
- Các cách tiếp cận cơ sở dữ liệu đã lỗi thời như mơ hình phân cấp, mơ hình mạng
và mơ hình danh sách đảo ngược. Các mơ hình này cũng đã bị bỏ vì gặp phải một

số vấn đề.
- Các cách tiếp cận cơ sở dữ liệu đương đại chiếm ưu thế như mơ hình quan hệ và
mơ hình hướng đối tượng. Từ năm 1970 các cơ sở dữ liệu quan hệ chiếm ưu thế
trong lĩnh vực hệ thống cơ sở dữ liệu. Cơ sở dữ liệu hướng đối tượng cũng tạo ra


được sự quan tâm tuy nhiên nó dần dần được thay thế bởi các mơ hình EAV,
Hadoop và NoSQL. Dù vậy cho đến nay các cơ sở dữ liệu quan hệ vẫn chiếm ưu
thế.
Ngoài các phương pháp tiếp cận cơ sở dữ liệu đương đại chiếm ưu thế, có ba
phương pháp tiếp cận cơ sở dữ liệu mới nổi đáng được đề cập. Chúng được tóm tắt
dưới đây:
- Hadoop: là một khung xử lý phân tán các tập dữ liệu lớn
- Mơ hình Thực thể–Thuộc tính–Giá trị (EAV): Cách tiếp cận này giảm cơ sở dữ
liệu thành ba thực thể lưu trữ chính- một thực thể để xác định các thực thể khác;
một thực thể để xác định các thuộc tính (thuộc tính) của thực thể; một thực thể
EAV kết nối hai thực thể khác và lưu trữ các giá trị đối với các kết hợp thuộc tínhthực thể
- NoSQL: Từ viết tắt “NoSQL” thường được hiểu là “không chỉ là Truy vấn có cấu
trúc ngơn ngữ." Cách tiếp cận này đề cập đến một họ các cách tiếp cận cơ sở dữ
liệu phi quan hệ được thiết kế để quản lý các tập dữ liệu lớn, đồng thời cung cấp
các lợi ích như tính linh hoạt, khả năng mở rộng, sẵn có, chi phí thấp hơn và khả
năng đặc biệt. Bốn phương pháp liên quan key value stores, graph stores, column
stores, and document stores.



×