Tải bản đầy đủ (.docx) (57 trang)

Nhom2 tieuluan csdl nang cao quan ly ban sach v1 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.09 MB, 57 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC HỊA BÌNH



BÀI TIỂU LUẬN

CƠ SỞ DỮ LIỆU NÂNG CAO

ĐỀ TÀI: XÂY DỰNG CƠ SỞ DỮ LIỆU HỆ
THỐNG QUẢN LÝ BÁN SÁCH

Giáo viên hướng dẫn: TS. Đoàn Văn
Hòa
Lớp: CNTT2023
Học viên: Trần Trọng Hoàn

Vũ Đức Thuận

Hà Nội, tháng 01/2024

MỤC LỤC

DANH MỤC HÌNH...............................................................................................4
DANH MỤC BẢNG...............................................................................................5
BẢNG MÔ TẢ TỪ VIẾT TẮT................................................................................5
CHƯƠNG I: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU................................................6
1. Khái niệm dữ liệu, cơ sở dữ liệu và hệ quản trị CSDL.....................................6

1.1. Khái niệm dữ liệu........................................................................................6
1.2. Khái niệm CSDL.........................................................................................6


1.3. Khái niệm hệ quản trị CSDL.......................................................................7
2. Các mơ hình cơ sở dữ liệu.................................................................................9
2.1. Mơ hình dữ liệu file phẳng (Flat file)..........................................................9
2.2. Mơ hình dữ liệu mạng (Network model).....................................................9
2.3. Mơ hình dữ liệu phân cấp (Hierarchical model)........................................10
2.4. Mơ hình dữ liệu quan hệ (Relational model).............................................11
2.5. Mơ hình dữ liệu hướng đối tượng (Object-Oriented model).....................12
3. Hệ quản trị cơ sở dữ liệu là gì?......................................................................12
3.1. Hệ quản trị CSDL mã nguồn mở Enterprise Postgres...............................13
3.2. Hệ quản trị CSDL Oracle..........................................................................16
3.3. Hệ quản trị CSDL MongoDB....................................................................17
3.4. Hệ quản trị CSDL Microsoft SQL Server.................................................18
4. Cấu trúc của một DBMS.................................................................................21
4.1. Các thành phần của một DBMS................................................................21
4.2. Các kiểu thao tác với DBMS.....................................................................22
5. SQL và NoSQL................................................................................................22
5.1. SQL là gì?..................................................................................................22
5.2. NoSQL là gì?.............................................................................................24
5.3. So sánh SQL và NoSQL............................................................................25
6. Tầm quan trọng của CSDL..............................................................................30
CHƯƠNG II: ĐẶC TẢ YÊU CẦU..........................................................................32

Trang 2/57

1. Tầm quan trọng của thương mại điện tử.....................................................32
2. Đặt vấn đề.......................................................................................................35
3. Phạm vi nghiên cứu và giải quyết bài tốn.....................................................35
4. Mơ tả nghiệp vụ...............................................................................................35
CHƯƠNG III: PHÂN TÍCH THIẾT KẾ..................................................................38
1. Luồng nghiệp vụ..............................................................................................38


1.1. Luồng nghiệp vụ đăng ký tài khoản..........................................................38
1.2. Luồng nghiệp vụ Quản lý bán sách...........................................................39
2. Mô hình phân rã chức năng của hệ thống.......................................................39
2.1 Sơ đồ phân rã..............................................................................................39
2.2. Danh sách chức năng.................................................................................40

2.2.1. Mô tả Phân hệ Quản lý bán sách........................................................40
2.2.2. Mô tả phân hệ Quản lý đăng ký tài khoản..........................................42
2.2.3. Mô tả phân hệ Quản lý kho................................................................42
2.2.4. Mô tả phân hệ Quản trị hệ thống........................................................43
2.2.5. Mô tả phân hệ Quản trị danh mục......................................................43
3. Xác định thực thể.............................................................................................43
3.1. Danh sách thực thể................................................................................43
3.2. Xác định thuộc tính cho thực thể..........................................................44
4. Mơ hình liên kết thực thể E-R..........................................................................45
5. Chuyển đổi mơ hình liên kết thực thể ER sang mơ hình logic chuẩn 3NF......47
5.1. Phân tích mơ hình thực thể........................................................................47
5.2. Kĩ thuật khóa ảo.........................................................................................47
5.2.1. Áp dụng kĩ thuật khóa ảo chuyển đổi thực thể đảm bảo mơ hình logic
3NF áp dụng với hệ quản trị dữ liệu SQL Server........................................47
5.2.2. Diễn giải chi tiết từng bảng................................................................49
CHƯƠNG IV: KẾT LUẬN......................................................................................54
TÀI LIỆU THAM KHẢO.........................................................................................56

Trang 3/57

DANH MỤC HÌNH

Hình 1: Ví dụ về dữ liệu và cơ sở dữ liệu................................................................8

Hình 2: Cơ sở dữ liệu dạng file phẳng......................................................................9
Hình 3: Thực thể kết nối............................................................................................9
Hình 4: Mơ hình dữ liệu phân cấp..........................................................................10
Hình 5: Mơ hình dữ liệu quan hệ...........................................................................11
Hình 6: Mơ hình dữ liệu hướng đối tượng..............................................................12
Hình 7: (theo: />Hình 8: Các tính năng của Enterprise Postgres.......................................................14
Hình 9: Một ví dụ về cấu trúc hệ quản trị CSDL SQL Server................................19
Hình 10: Hình minh hoạ về tính chất khơi phục nhanh chóng của hệ quản tri CSDL
SQL Server..............................................................................................................20
Hình 11: Cấu trúc DBMS.......................................................................................21
Hình 12: Hình minh hoạ ví dụ nhóm câu lệnh Data Dèinition Language...............23
Hình 13: DML (Data Manipulation Language)......................................................23
Hình 14: DCL (Data Control Language).................................................................23
Hình 15: TCL (Transaction Control Language)......................................................23
Hình 16: Thống kê dữ liệu người dùng MongoDB, MySQL, MS SQL Server trong
5 năm trở lại đây tại Việt Nam................................................................................25
Hình 17: Phân biệt SQL và No SQL.......................................................................28
Hình 18: Luồng nghiệp vụ đăng ký tài khoản.........................................................34
Hình 19: Luồng nghiệp vụ quản lý bán sách...........................................................35
Hình 20: Sơ đồ phân rã............................................................................................35
Hình 21: Phân hệ quản lý bán sách.........................................................................36
Hình 22: Phân hệ Quản lý đăng ký tài khoản..........................................................38
Hình 23: Phân hệ Quản lý kho................................................................................38
Hình 24: Mơ hình liên kết thực thể E-R..................................................................42
Hình 25:Sơ đồ thiết kế cơ sở dữ liệu.......................................................................44

Trang 4/57

DANH MỤC BẢNG


Bảng 1: So sánh SQL và No SQL..........................................................................27
Bảng 2: Bảng chức năng của hệ thống bán sách.....................................................36
Bảng 3: Bảng nhân viên, cán bộ..............................................................................49
Bảng 4: Bảng khách hàng........................................................................................49
Bảng 5: Bảng kho....................................................................................................50
Bảng 6: Bảng phân loại sách...................................................................................50
Bảng 7: Bảng nhà xuất bản......................................................................................50
Bảng 8: Bảng Sách..................................................................................................51
Bảng 9: Bảng tác giả...............................................................................................51
Bảng 10: Bảng chi tiết về sách................................................................................52
Bảng 11: Bảng Đơn hàng........................................................................................52
Bảng 12: Bảng chi tiết đơn hàng.............................................................................52
Bảng 13: Bảng kho sách..........................................................................................53

BẢNG MÔ TẢ TỪ VIẾT TẮT

STT Viết tắt Mô tả

ISBN là chữ viết tắt của International Standard Book Number

1 ISBN (Mã số tiêu chuẩn quốc tế cho sách), là mã số tiêu chuẩn quốc tế
để xác định một quyển sách

2 CĐT Công ty H&M

3 CTXD Công ty DBDudes

4 CSDL Cơ sở dữ liệu

CHƯƠNG I: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU


1. Khái niệm dữ liệu, cơ sở dữ liệu và hệ quản trị CSDL
1.1. Khái niệm dữ liệu

Dữ liệu là tập hợp các thông tin, số liệu, hoặc sự mô tả về các sự kiện, đối
tượng, hoặc hiện tượng trong thế giới thực. Dữ liệu có thể được thu thập từ nhiều

Trang 5/57

nguồn khác nhau và có thể tồn tại dưới nhiều định dạng, bao gồm văn bản, hình ảnh,
âm thanh, video, và số liệu số.

Dữ liệu có thể được chia thành hai loại chính:
- Dữ liệu có cấu trúc (Structured Data): Là dữ liệu có tổ chức theo một cấu

trúc cụ thể, thường được lưu trữ trong các bảng, cơ sở dữ liệu quan hệ hoặc
các định dạng dễ quản lý khác. Ví dụ, dữ liệu trong một bảng Excel hoặc cơ
sở dữ liệu SQL.
- Dữ liệu khơng có cấu trúc (Unstructured Data): Là dữ liệu không tuân theo
một cấu trúc cụ thể, thường là dữ liệu văn bản, hình ảnh, video, hoặc âm
thanh. Ví dụ, nội dung trang web, email, hay hình ảnh chụp từ camera.
Khái niệm về dữ liệu là trọng tâm của nhiều lĩnh vực, bao gồm khoa học máy
tính, khoa học dữ liệu, và quản lý thông tin. Việc hiểu và xử lý dữ liệu là quan trọng
để rút ra thông tin hữu ích và đưa ra quyết định có ích trong nhiều lĩnh vực, từ kinh
doanh đến nghiên cứu khoa học. Đồng thời, quản lý và bảo vệ dữ liệu cũng là một
vấn đề quan trọng để đảm bảo an toàn và tuân thủ các quy định về quyền riêng tư.
1.2. Khái niệm CSDL
Cơ sở dữ liệu (CSDL) là một hệ thống tổ chức và lưu trữ dữ liệu để có thể dễ
dàng truy cập, quản lý và cập nhật. Cơ sở dữ liệu thường được sử dụng để lưu trữ
thông tin trong môi trường máy tính và giúp tổ chức dữ liệu một cách có tổ chức,

hiệu quả và an toàn.
Lợi ích của việc quản lý dữ liệu bằng cơ sở dữ liệu:
- Tổ chức dữ liệu hiệu quả: Cơ sở dữ liệu giúp tổ chức dữ liệu một cách có

tổ chức và dễ dàng quản lý. Dữ liệu được lưu trữ trong các bảng và
trường, giúp tạo ra một cấu trúc rõ ràng và dễ theo dõi.
- Tăng khả năng chia sẻ thông tin: Cơ sở dữ liệu cho phép nhiều người
dùng cùng truy cập và sử dụng dữ liệu mà không gặp vấn đề xung đột
hoặc mất thơng tin. Điều này tăng tính khả dụng và chia sẻ thông tin
trong tổ chức.
- Bảo mật dữ liệu: Các hệ quản trị cơ sở dữ liệu thường có các cơ chế bảo
mật tích hợp, bao gồm quản lý quyền truy cập, mã hóa dữ liệu, và theo
dõi hoạt động người dùng. Điều này giúp bảo vệ thông tin quan trọng
khỏi truy cập trái phép.
- Tính toàn vẹn dữ liệu: Các cơ sở dữ liệu hỗ trợ tính tồn vẹn dữ liệu
thông qua việc sử dụng các ràng buộc, quy tắc và khóa chính. Điều này

Trang 6/57

giúp đảm bảo rằng dữ liệu được lưu trữ và cập nhật một cách đồng nhất
và chính xác.

- Tăng hiệu suất và truy xuất nhanh chóng: Cơ sở dữ liệu được thiết kế để
cung cấp hiệu suất tốt cho các thao tác truy vấn và cập nhật dữ liệu. Các
chỉ mục và kỹ thuật tối ưu hóa khác giúp tăng tốc quá trình truy cập dữ
liệu.

- Dễ dàng mở rộng: Khi tổ chức mở rộng và cần lưu trữ lượng lớn dữ liệu
hơn, cơ sở dữ liệu có thể được mở rộng mà không gặp nhiều vấn đề về
hiệu suất. Các hệ quản trị cơ sở dữ liệu hiện đại thường hỗ trợ khả năng

mở rộng theo nhu cầu.

- Tiết kiệm thời gian và công sức: Cơ sở dữ liệu giúp tự động hóa nhiều
nhiệm vụ liên quan đến việc quản lý dữ liệu, giảm thiểu công sức và thời
gian cần thiết so với việc sử dụng các phương tiện lưu trữ dữ liệu truyền
thống như tệp tin.

- Hỗ trợ phân tích và báo cáo: Cơ sở dữ liệu cung cấp khả năng thực hiện
truy vấn phức tạp, phân tích dữ liệu và tạo báo cáo. Điều này giúp tổ chức
đưa ra quyết định dựa trên thông tin hiểu quả từ dữ liệu đã thu thập.

Sự khác biệt cơ bản giữa cơ sở dữ liệu và dữ liệu thơng thường đó là tính cấu
trúc sắp xếp có hệ thống. Dữ liệu khơng thơi có thể là bất cứ thông tin nào chưa được
sắp xếp hay cấu trúc theo một trật tự cụ thể ví dụ văn bản trên một file được coi là dữ
liệu, hay dữ liệu trên một video hay tập tin.

Ngược lại với cữ liệu, cơ sở dữ liệu bao gồm dữ liệu dược cấu trúc một cách rõ
ràng. Một tập hợp dữ liệu khơng có cấu trúc hệ thống nhất định không được coi là
một cơ sở dữ liệu.

1.3. Khái niệm hệ quản trị CSDL
Hệ quản trị cơ sở dữ liệu (Hệ quản trị CSDL - DBMS) là một phần mềm hoặc

hệ thống phần mềm được thiết kế để quản lý và tương tác với cơ sở dữ liệu. Nhiệm
vụ chính của DBMS là cung cấp một giao diện để định nghĩa, tạo, truy xuất, cập nhật
và quản lý cơ sở dữ liệu. Dưới đây là một số khái niệm cơ bản liên quan đến Hệ quản
trị CSDL :

- Cơ sở dữ liệu (Database): Là nơi lưu trữ dữ liệu theo cách có tổ chức,
giúp dễ dàng quản lý và truy cập thông tin. Cơ sở dữ liệu có thể bao gồm

một hoặc nhiều bảng dữ liệu.

- Hệ quản trị cơ sở dữ liệu (DBMS): Là phần mềm hoặc hệ thống phần
mềm quản lý và điều khiển cơ sở dữ liệu. DBMS giúp tạo, duy trì, và
thao tác dữ liệu một cách hiệu quả.

Trang 7/57

- Bảng (Table): Là một thành phần cơ bản trong cơ sở dữ liệu quan hệ. Mỗi
bảng có các cột (fields) và hàng (records), biểu diễn dữ liệu theo cách có
tổ chức.

- Trường (Field): Là một đơn vị nhỏ nhất trong bảng, đại diện cho một loại
dữ liệu cụ thể như số nguyên, chuỗi ký tự, ngày tháng, v.v.

- Giao dịch (Transaction): Là một chuỗi các hoạt động thao tác với cơ sở
dữ liệu, được thực hiện để đảm bảo tính tồn vẹn và đồng nhất của dữ
liệu.

- Người quản trị cơ sở dữ liệu (Database Administrator - DBA): Là người
chịu trách nhiệm về việc quản lý, duy trì và bảo vệ cơ sở dữ liệu. Công
việc của DBA bao gồm việc thiết lập quyền truy cập, giám sát hiệu suất
và đảm bảo an toàn của dữ liệu.

- Ngôn ngữ truy vấn cơ sở dữ liệu (Database Query Language): Là ngôn
ngữ được sử dụng để tương tác với cơ sở dữ liệu. SQL (Structured Query
Language) là ngôn ngữ truy vấn phổ biến được sử dụng trong hầu hết các
hệ quản trị cơ sở dữ liệu quan hệ.

- Chế độ ACID: Là một tập hợp các tính chất (Atomiticy, Consistency,

Isolation, Durability) mà một giao dịch cần phải tuân theo để đảm bảo
tính toàn vẹn và an toàn của cơ sở dữ liệu.

Hệ quản trị cơ sở dữ liệu đóng vai trị quan trọng trong việc hỗ trợ các ứng dụng
và hệ thống thực hiện các thao tác liên quan đến dữ liệu một cách hiệu quả, an tồn
và có tổ chức.

Các hệ quản trị cơ sở dữ liệu phổ biến hiện này bao gồm: Microsoft Access,
MySQL, Oracle, PostgreSQL, SQL Server...

Việc sử dụng các phần mềm (hệ quản trị cơ sở dữ liệu) này sẽ giúp các nhà quản
trị hệ thống dễ dàng thực hiện các thao tác như tìm kiếm, lọc, xóa, chỉnh sửa hay tạo
mới dữ liệu trên cơ sở dữ liệu. Để làm được điều này trên các hệ quản trị cơ sở dữ
liệu các nhà quản trị hệ thống thường sử dụng ngơn ngữ truy vấn mang tính cấu trúc:
Structured Query Language hay SQL.

Ví dụ về dữ liệu và cơ sở dữ liệu:

Trang 8/57

Hình 1: Ví dụ về dữ liệu và cơ sở dữ liệu
2. Các mơ hình cơ sở dữ liệu
2.1. Mơ hình dữ liệu file phẳng (Flat file)

Dùng cho các CSDL đơn giản. CSDL dạng file phẳng thường là file kiểu văn
bản chứa dữ liệu dạng bảng

Ví dụ:

Hình 2: Cơ sở dữ liệu dạng file phẳng

2.2. Mơ hình dữ liệu mạng (Network model)

Các file trong mơ hình dữ liệu mạng được gọi là các bản ghi. Tập hợp các bản
ghi cùng kiểu tạo thành một kiểu thực thể dữ liệu. Các kiểu thực thể kết nối với nhau
thông qua mối quan hệ cha-con. Mơ hình này được biểu diễn bởi một đồ thị có hướng
và các mũi tên chỉ từ kiểu thực thể cha sang kiểu thực thể con. Ví dụ như sau:

Trang 9/57

Hình 3: Thực thể kết nối
Ưu điểm của mô hình này là có thể biểu diễn được các mối quan hệ phức tạp
Nhược điểm là truy xuất chậm và khơng thích hợp với các CSDL có quy mơ lớn
2.3. Mơ hình dữ liệu phân cấp (Hierarchical model)
Tổ chức theo hình cây, mỗi nút biểu diễn một thực thể dữ liệu. Mỗi nút cha có
thể có một hoặc nhiều nút con nhưng mỗi nút con chỉ có một nút cha. Do đó mơ hình
dữ liệu phân cấp có thể có các kiểu quan hệ: 1-1, 1-N. Nhược điểm của mơ hình này
là một nút con khơng thể có quá một nút cha nên không biểu diễn được các quan hệ
phức tạp.

Hình 4: Mơ hình dữ liệu phân cấp

Trang 10/57

2.4. Mơ hình dữ liệu quan hệ (Relational model)
Trong mơ hình dữ liệu quan hệ khơng có các liên kết vật lý. Dữ liệu được biểu

diễn dưới dạng bảng với các hàng và các cột. Dữ liệu trong hai bảng liên kết với nhau
thông qua các cột chung và có các tốn tử để thao tác trên các hàng của bảng

Ví dụ:


Hình 5: Mơ hình dữ liệu quan hệ

Trang 11/57

2.5. Mơ hình dữ liệu hướng đối tượng (Object-Oriented model)
Mơ hình này ra đời vào khoảng đầu những năm 90, dựa trên cách tiếp cận của

phương pháp lập trình hướng đối tượng
Cơ sở dữ liệu bao gồm các đối tượng:
- Mỗi đối tượng bao gồm các thuộc tính, phương thức của đối tượng
- Các đối tượng trao đổi với nhau thông qua các phương thức
- Một đối tượng có thể được sinh ra từ việc kế thừa từ đối tượng khác
Ví dụ:

Hình 6: Mơ hình dữ liệu hướng đối tượng
3. Hệ quản trị cơ sở dữ liệu là gì?

Hiện nay, một lượng vơ cùng lớn các thơng tin hữu ích với chúng ta đang tồn tại
ở dạng văn bản. Việc của chúng ta là phải biết cách quản lý và sử dụng chúng sao cho
thật hiệu quả. Để quản lý một lượng dữ liệu lớn phức tạp, người sử dụng phải có
những cơng cụ hỗ trợ tính năng đơn giản trong thao tác nhưng lại hiệu quả trong trích
lọc thơng tin. Từ thực tế đó, hệ quản trị cơ sở dữ liệu ra đời.

Hệ quản trị cơ sở dữ liệu (Database Management System - DBMS): Là một hệ
thống phần mềm cho phép tạo lập cơ sở dữ liệu và cung cấp cơ chế lưu trữ, truy cập
dựa trên các mơ hình CSDL

Trên thị trường phần mềm hiện nay ở Việt Nam xuất hiện khá nhiều phần mềm
hệ quản trị cơ sở dữ liệu như: Microsoft Access, Foxpro, SQL Server, Oracle...Trong

đó:

Trang 12/57

- SQL Server, Microsoft Access, Oracle là các hệ quản trị CSDL điển hình
cho mơ hình quan hệ

- IMS của IBM là hệ quản trị CSDL điển hình cho mơ hình dữ liệu phân
cấp

- IDMS là hệ quản trị CSDL điển hình cho mơ hình dữ liệu mạng
- Những lợi ích mà DBMS mang lại:
- Quản trị các CSDL
- Cơ chế an toàn, bảo mật cao
- Hỗ trợ các ngơn ngữ giao tiếp. Ví dụ như ngơn ngữ truy vấn dữ liệu có

cấu trúc - SQL, ngôn ngữ thao tác dữ liệu - DML, ngôn ngữ mô tả, định
nghĩa dữ liệu – DDL
3.1. Hệ quản trị CSDL mã nguồn mở Enterprise Postgres
PostgreSQL là một hệ quản trị cơ sở dữ liệu nguồn mở đa tính năng, được sử
dụng bởi hàng triệu người dùng trên tồn cầu. Nó là một trong những hệ quản trị cơ
sở dữ liệu đầu tiên được phát triển và cho phép người dùng quản lý cả dữ liệu có cấu
trúc và khơng cấu trúc. Nó có thể được sử dụng trên hầu hết các nền tảng chính và
hồn toàn tuân thủ ACID (Atomicity, Consitency, Isolation và Durability), với việc
hỗ trợ foreign keys, joins, views, triggers và stored procedures (hỗ trợ nhiều ngôn ngữ
như PL/pgSQL, java, C, python, perl,...).
Ngồi các tính năng chính của một hệ quản trị CSDL, PostgreSQL cịn có các
tính năng nổi bật như:
- Kiểm soát đồng thời nhiều phiên bản (MVCC)
- Cho phép bổ sung các Extensions, dễ dàng hỗ trợ nhiều loại dữ liệu khác

như GIS, Time Series...
- Tính năng Foreign Data Wrappers cho phép liên kết với các database
khác dễ dàng
- Transactions lồng nhau (savepoints)
- Hỗ trợ nhân bản không đồng thời (asynchronous replication)
- Sao lưu trực tuyến (online backup)
- Phục hồi tại thời điểm lỗi (point-in-time recovery)
- Trong bảng xếp hạng của DB-Engine, PostgreSQL xếp thứ 4, chỉ sau các
CSDL của Oracle và Microsoft. Có thể nói PostgreSQL đứng đầu trong
số các CSDL mã nguồn mở.

Trang 13/57

Hình 7: (theo: /> Enterprise Postgres là một hệ quản trị cơ sở dữ liệu quan hệ đáng tin cậy và
mạnh mẽ, dành cho các tổ chức đang yêu cầu một CSDL với hiệu năng truy vấn
mạnh mẽ và tính sẵn sàng cao.
Bên cạnh đó, Enterprise Postgres cịn cung cấp các tính năng như cài đặt dễ
dàng, sao lưu và phục hồi thơng minh, đảm bảo tích hợp liền mạch vào bất kỳ hệ
thống nghiệp vụ hiện tại nào, cùng với việc hỗ trơ thao tác dễ dàng và trực quan cho
người quản trị cũng như người dùng cuối.
Các tính năng của Enterprise Postgres:

Hình 8: Các tính năng của Enterprise Postgres
- Công cụ quản lý cơ sở dữ liệu có thể mở rộng và xử lý hàng terabyte dữ

liệu.
- Hỗ trợ đồng thời cả dữ liệu có cấu trúc và dữ liệu phi cấu trúc như JSON,

XML, Key-value.


Trang 14/57

- Bảo mật mã hóa dữ liệu 256-bit (tuân thủ PCI-DSS).
- Che giấu các dữ liệu "nhạy cảm" (Data masking).
- Chỉ mục theo cột trên Memory (In-Memory Columnar Index).
- Dự phòng cho WAL file, tăng khả năng sẵn sàng cao.
- Bộ điều khiển đồng bộ dữ liệu (Mirroring controller).
- Khả năng tương thích cao với các hệ quản trị CSDL phổ biến như Oracle,

MS SQL Server, MySQL... giúp cho việc di chuyển dữ liệu (migration)
từ các hệ quản trị CSDL khác sang Enterprise Postgres dễ dàng và hiệu
quả chi phí.
- Độ tin cậy cao và khả năng sao lưu/phục hồi thông minh.
- Giao diện quản trị nâng cao (GUI).

o Quản lý cụm cluster (High availability).
o Sao lưu và phục hồi dễ dàng, chỉ với một cú nhấp chuột.
o Dashboard thống kê mức độ sử dụng của hệ thống.
- Hỗ trợ (24 x 7 hỗ trợ toàn cầu).
Nâng cao độ tin cậy : Tính tồn vẹn dữ liệu và tính liên tục hoạt động là tối
quan trọng đối với bất kỳ tổ chức nào. Rất nhiều rủi ro có thể gây mất mát dữ liệu, ví
dụ như hỏng ổ đĩa vật lý, hỏng RAID,... Enterprise Postgres giảm thiểu rủi ro này
thơng qua dự phịng dữ liệu trên các nhiều thiết bị phần cứng vật lý khác nhau và điều
phối dữ liệu phân tán này trong quá trình tự động fail-over và phục hồi.
An ninh tốt hơn: Khi khối lượng dữ liệu được lưu trữ trong một hệ thống
CNTT tăng lên, thì nguy cơ rị rỉ dữ liệu cũng tăng theo. Tất cả dữ liệu trong
Enterprise Postgres có thể được bảo vệ bằng cách sử dụng thiết lập mã hóa với cơ chế
Mã hóa dữ liệu trong suốt (TDE) sử dụng các thuật toán tương tự như được sử dụng
bởi Chính phủ Mỹ, cung cấp cho khách hàng khả năng bảo vệ dữ liệu ở mức bảo mật
cao nhất. Enterprise Postgres tăng cường bảo mật ở nhiều cấp độ bao gồm mã hóa dữ

liệu, mã hóa nhật ký và mã hóa kết nối nội bộ. Bên cạnh đó là tính năng Data
Masking, Data Redaction giúp che giấu những thông tin “nhạy cảm”, tránh rị rỉ thất
thốt dữ liệu.
Hiệu suất tốt hơn : Chỉ mục theo cột trên bộ nhớ (In-Memory Columnar
Index) của Enterprise Postgres đảm bảo phản hồi nhanh hơn cho các truy vấn phức
tạp, cung cấp cho tổ chức/doanh nghiệp thông tin cần thiết và kịp thời để đáp ứng các
tình huống quan trọng.

Trang 15/57

Nâng cao độ tin cậy và cải thiện hiệu năng cùng với sự hỗ trợ dài hạn của đơn vị
cung cấp đem lại sự yên tâm và lợi ích đáng kể cho doanh nghiệp.

3.2. Hệ quản trị CSDL Oracle
Oracle là một hệ quản trị cơ sở dữ liệu quan hệ đa mơ hình, chủ yếu được thiết

kế điện toán lưới và lưu trữ dữ liệu cho doanh nghiệp. Đây là một trong những lựa
chọn hàng đầu giúp doanh nghiệp xử lý linh hoạt và đưa ra những giải pháp tối ưu
cho việc quản lý thông tin và ứng dụng

Cấu tạo của Oracle

Giống như các phần mềm khác, Oracle được xây dựng dựa trên SQL, một ngôn
ngữ lập trình được tiêu chuẩn hóa cho các nhà quản trị cơ sở dữ liệu, nhà phân tích dữ
liệu và các chuyên gia về dữ liệu sử dụng quản lý và truy vấn dữ liệu được lưu trữ.

Các tính năng được hỗ trợ bởi Oracle

Tính khả dụng:


Để hỗ trợ cho tính khả dụng của cơ sở dữ liệu, Oracle cung cấp tính năng Oracle
Data Guard. Khi sử dụng các tính năng này, cơ sở dữ liệu dự phịng thứ cấp được duy
trì như một bản sao của cơ sở dữ liệu chính và có thể sử dụng các lựa chọn thay thế
trong q trình chuyển đổi dự phịng.

Bảo mật:

Tính năng Oracle Advanced Security cung cấp giải pháp bảo vệ thông tin nhạy
cảm tại nguồn là TDE (mã hóa dữ liệu thời gian thực) và Data Redaction (che giấu dữ
liệu). Giải pháp này cho phép mã hóa dữ liệu tại nguồn và đăng xuất. Ngồi ra,
Oracle cịn phát triển thêm một số tính năng bảo mật khác để bảo vệ quyền lợi cho
người dùng.

Khả năng mở rộng:

Oracle RAC là điển hình cho khả năng mở rộng của Oracle, cung cấp khả năng
như di chuyển phiên bản, thực hiện nâng cấp, truy trì tính liên tục của ứng dụng và
quản lý chất lượng dịch vụ.

Hiệu suất:

Oracle cung cấp các giải pháp nâng cao hiệu suất như Oracle Advanced
Compression, Oracle Database In- Memory,... nhằm tối ưu hiệu suất hoạt động của
hệ thống ở mức tốt nhất.

Lợi ích của Oracle mang lại

Chúng tơi đã nói về các tính năng của Oracle database. Những tính năng này
mang lại lợi thế cho Oracle so với các đối thủ cạnh tranh. Tuy nhiên thì những ưu
điểm của Oracle là gì? Dưới đây là xem xét những ưu điểm của Oracle.


Trang 16/57

Hiệu suất: Oracle có phương pháp luận và nguyên tắc để đạt được hiệu suất cao.
Vietnix có thể triển khai điều chỉnh hiệu suất trong database của nó để truy xuất và
thay đổi dữ liệu nhanh hơn. Nhằm cải thiện thời gian thực hiện truy vấn.

Cơ sở dữ liệu đa người dùng: Database của nó hỗ trợ quản lý nhiều trường hợp
database trên một server duy nhất. Phương pháp Instance Caging được Oracle cung
cấp để quản lý việc cấp phát CPU trên server đang chạy các cơ sở dữ liệu cá nhân.
Instance Caging hoạt động với database resource manager để quản lý các dịch vụ qua
nhiều phiên bản.

Các phiên bản: Như đã thảo luận ở trên, về các phiên bản khác nhau được cung
cấp bởi Oracle. Nó mang lại lợi ích cho người dùng khi mua phiên bản theo yêu cầu
ứng dụng của họ. Họ có thể cập nhật liên tục phiên bản nếu yêu cầu của họ thay đổi
trong tương lai.

Cluster: Nó sử dụng Real Application Clusters để cung cấp một hệ thống dữ liệu
sẵn. Database với RAC có những lợi ích so với các database server truyền thống như:
scaling database qua nhiều trường hợp, cân bằng tải, dự phịng dữ liệu và tính khả
dụng, linh hoạt để tăng khả năng xử lý.

Failure Recovery: RMAN (Recovery Manager) là tính năng của Oracle DB có
chức năng khơi phục hoặc phục hồi các file database trong downtime. Nó hỗ trợ
backup online, lưu trữ. Người dùng cũng có thể sử dụng SQL*PLUS để recovery,
được gọi là recovery do người dùng quản lý. Có một tiện ích có sẵn trong database để
thêm các backup do người dùng quản lý.

PL/SQL: Database hỗ trợ PL/SQL extension để lập trình liên tục.


3.3. Hệ quản trị CSDL MongoDB
MongoDB là một database hướng tài liệu (document), một dạng NoSQL

database. Vì thế, MongoDB sẽ tránh cấu trúc table-based của relational database để
thích ứng với các tài liệu như JSON có một schema rất linh hoạt gọi là BSON.
MongoDB sử dụng lưu trữ dữ liệu dưới dạng Document JSON nên mỗi một
collection sẽ các các kích cỡ và các document khác nhau. Các dữ liệu được lưu trữ
trong document kiểu JSON nên truy vấn sẽ rất nhanh.

Các tính năng của MongoDB gồm có:

Các ad hoc query: hỗ trợ search bằng field, các phép search thông thường,
regular expression searches và range queries.

Indexing: bất kì field nào trong BSON document cũng có thể được index.

Replication: có ý nghĩa là “nhân bản”, là có một phiên bản giống hệt phiên bản
đang tồn tại, đang sử dụng. Với cơ sở dữ liệu, nhu cầu lưu trữ lớn, đòi hỏi cơ sở dữ

Trang 17/57

liệu tồn vẹn, khơng bị mất mát trước những sự cố ngồi dự đốn là rất cao. Vì vậy,
người ta nghĩ ra khái niệm “nhân bản”, tạo một phiên bản cơ sở dữ liệu giống hệt cơ
sở dữ liệu đang tồn tại và lưu trữ ở một nơi khác, đề phịng có sự cố.

Aggregation: Các Aggregation operation xử lý các bản ghi dữ liệu và trả về kết
quả đã được tính tốn. Các phép tốn tập hợp nhóm các giá trị từ nhiều Document lại
với nhau và có thể thực hiện nhiều phép tốn đa dạng trên dữ liệu đã được nhóm đó
để trả về một kết quả duy nhất. Trong SQL, count(*) và GROUP BY là tương đương

với Aggregation trong MongoDB.

Lưu trữ file: MongoDB được dùng như một hệ thống file tận dụng những
function trên và hoạt động như một cách phân phối qua sharding.
3.4. Hệ quản trị CSDL Microsoft SQL Server

Giới thiệu về SQL server
SQL Server là hệ quản trị cơ sở dữ liệu, được xây dựng dựa trên khái niệm trí
tuệ nhân tạo nhằm tạo điều kiện thuận lợi, cải tiến dịch vụ cơ sở dữ liệu, bảo mật và
giảm bớt các khó khăn gặp phải khi phát triển các ứng dụng và lưu trữ dữ liệu.
Các phiên bản SQL Server hiện nay được tích hợp với Cloud, điều này đồng
nghĩa các tổ chức có thể hưởng lợi từ tính năng bảo mật cao, vừa đồng bộ được dữ
liệu trên nhiều máy tính và các thiết bị hiện đại khác.
SQL Server tạo ra nền tảng dữ liệu hợp nhất đi kèm với Hệ thống tệp phân tán
Apache Spark và Hadoop (HDFS) để trở nên thông minh hơn với tất cả dữ liệu.
Các ưu điểm của SQL server
Các Big Data Cluster và PolyBase
Microsoft triển khai Big Data Clusters (Cụm dữ liệu lớn) vào SQL Server nhằm
mang đến sự linh hoạt và khả năng mở rộng cho nền tảng dữ liệu doanh nghiệp.
Cụm dữ liệu lớn của SQL Server được triển khai dưới dạng vùng chứa trên
Kubernetes, kết nối trực tiếp công cụ cơ sở dữ liệu SQL Server với Apache Spark.
Nhờ vậy, người dùng có thể nhận thơng tin chi tiết từ tất cả các dữ liệu thông qua truy
vấn trên dữ liệu quan hệ để có một bức tranh toàn cảnh.
Bộ tính năng này được xem là cải tiến lớn với PolyBase (một thành phần tùy
chọn trong SQL Server) khi kết nối SQL Server với Oracle, Teradata và MongoDB,
đồng thời cung cấp kết nối với các nguồn dữ liệu khác. Microsoft gọi đây là “ảo hóa
dữ liệu”. Ảo hóa dữ liệu với PolyBase cho phép bạn sử dụng SQL Server làm trung
tâm dữ liệu, truy vấn từ nhiều nguồn dữ liệu. PolyBase đã được thêm vào trên bản
SQL Server Standard Edition, giúp nhiều người dùng có thể tiếp cận được với nó.


Trang 18/57

Hình 9: Một ví dụ về cấu trúc hệ quản trị CSDL SQL Server

Xử lý truy vấn thông minh
Tính năng Query Store được cho là tính năng tuyệt vời đã được giới thiệu trong
SQL Server. Tính năng này cho phép người dùng có thơng tin về thời gian chạy, kế
hoạch thực thi cho các truy vấn. Nhờ điều này, quản trị viên cơ sở dữ liệu có thể
nhanh chóng tìm ra ngun nhân của vấn đề hiệu suất.
Trong SQL Server, Microsoft đã thực hiện một số cải tiến bổ sung cho các tính
năng Query Store mặc định bằng cách thêm điều chỉnh truy vấn tự động cho các kế
hoạch thực thi hồi quy về hiệu suất.
Giám sát thông minh
Để hạn chế một số vấn đề về tranh chấp tài nguyên mà tính năng Query Store
gây ra trên một số hệ thống, SQL Server giới thiệu một tùy chọn cho phép tùy biến
việc thu thập dữ liệu. Ngoài ra, SQL Server cũng cập nhật một số cải tiến quanh việc
thu thập kế hoạch thực thi.
Với những cập nhật này, người dùng có thể nắm bắt các kế hoạch thực thi thực
tế, kiểm tra được số lượng hàng được truy vấn sử dụng, từ đó dễ dàng so sánh chúng
với những dữ liệu ước tính mà trình tối ưu hóa truy vấn đã sử dụng và tìm ra vấn đề
về hiệu suất một cách nhanh chóng.
Khơi phục cơ sở dữ liệu nhanh hơn
Với SQL Server, Microsoft đã cải thiện quá trình phục hồi cơ sở dữ liệu bằng
cách triển khai danh sách các phiên bản để cho phép giao dịch được cập nhật nhanh
hơn rất nhiều sau khi khôi phục hay cập nhật máy chủ, thời gian khôi phục mẫu chỉ
mất vài giây.

Trang 19/57

Hình 10: Hình minh hoạ về tính chất khơi phục nhanh chóng của hệ quản tri

CSDL SQL Server

Tối ưu hóa hiệu suất
SQL Server thường xảy ra sự cố khi hệ thống cố gắng chèn các bản ghi tuần tự
vào một bảng với khối lượng rất cao. Vấn đề này xảy ra do sự cạnh tranh trong bộ
nhớ, vì chỉ có một luồng có thể truy cập một trang dữ liệu trong một thời điểm nhất
định. Để khắc phục sự cố này, tính năng OLTP trong bộ nhớ được thiết lập thêm. Tuy
nhiên, điểm yếu của nó là khơng tương thích được 100% với tất cả các loại dữ liệu,
nên không thể sử dụng ở mọi nơi được.

Trang 20/57


×