Tải bản đầy đủ (.doc) (6 trang)

Tài liệu Bài 1: Mở đầu (Hệ quản trị cơ sở dữ liệu) docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (151.97 KB, 6 trang )

Bài 1- MỞ ĐẦU
1. Bài toán quản lý
- Công việc quản lý là rất phổ biến, có thể nói mọi tổ chức đều có nhu cầu quản lý.
• Công ty cần quản lý tài chính, vật tư, con người…
• Khách sạn cần quản lý phòng cho thuê, các dịch vụ, khách thuê phòng, tài chính, trang
thiết bị…
• Bệnh viện cần quản lý bệnh nhân, thuốc, bệnh án , bác sĩ, các thiết bị y tế…
- Để có thể thấy rõ công tác quản lý ta có thể xét ví dụ về bài toán Quản lý sinh viên trong nhà
trường như sau:
• Để quản lý sinh viên, nhà trường cần phải có hồ sơ sinh viên, đó chính là học bạ của
sinh viên. Học bạ thường gồm các thông tin sau: Họ tên, ngày sinh, giới tính, địa chỉ, kết
quả học tập và rèn luyện (điểm các môn học, xếp loại đạo đức…).
• Có thể hình dung hồ sơ đó như một bảng mà mỗi cột tương ứng với một mục thông tin,
mỗi hàng chứa một bộ thông tin về một sinh viên như sau:
STT Họ tên Ngày sinh Giới tính Điểm toán ….
1 Nguyễn An 12/8/1981 Nam 8
2 Trần văn Giang 21/3/1990 Nữ 7 …
… … … … … …
• Trong quá trình quản lý, hồ sơ có thể có những bổ sung, thay đổi, hay nhầm lẫn phải sửa
đổi, ví dụ như khi sinh viên ghi sai địa chỉ thì cần phải sửa lại địa chỉ mới. Khi học sinh
chuyển trường thì hồ sơ của học sinh đó cần được rút ra để chuyển đi. Hồ sơ của học sinh
khác chuyển về thì cần phải bổ sung vào hồ sơ lớp…Công việc này cần thực hiện chính
xác và thường xuyên để đảm bảo nó phản ánh đúng thực tế.
• Việc tạo lập hồ sơ không đơn thuần dùng để lưu trữ mà chủ yếu dùng để khai thác,
nhằm phục vụ các yêu cầu quản lý của nhà trường.
o Chẳng hạn như giáo viên có thể tìm hồ sơ của một học sinh nào đó để xem Gọi
là tìm kiếm.
o Có thể chọn ra một sinh viên thỏa mãn một điều kiện nào đó.
o Giáo viên có thể sắp xếp danh sách sinh viên theo thứ tự điểm trung bình.
o Cuối kỳ giáo viên phải thống kê, tổng hợp như đếm số đoàn viên, số sinh viên đạt
loại giỏi, tính điểm trung bình…


2. Các công việc thường gặp khi xử lý thông tin của một tổ chức
Ngày nay tin học hóa công tác quản lý chiểm khoảng 80% ứng dụng của tin học. Công
việc quản lý tại mỗi nơi, mỗi lĩnh vực có những đặc điểm riêng về đối tượng quản lý cũng như là
về phương thức khai thác thông tin.
Các bài toán quản lý có đặc điểm chung là khối lượng hồ sơ cần xử lý thường là rất lớn
nhưng thuật toán để xử lý nói chung là không phức tạp.
Công việc quản lý nói chung gồm:
• Tạo lập hồ sơ
• Cập nhật
• Khai thác hồ sơ
a. Tạo lập hồ sơ
• Xác định chủ thể cần quản lý.
• Xác định cấu trúc hồ sơ.
• Thu nhập và tập hợp thông tin cần thiết cho hồ sơ từ nhiều nguồn khác nhau và lưu trữ
đúng cấu trúc đã tạo.
b. Cập nhật hồ sơ
1
Thông tin trong hồ sơ cần được cập nhật kịp thời để phản ánh đúng thực tế, công việc thường làm
là:
• Sửa hồ sơ
• Bổ sung hồ sơ
• Xóa hồ sơ
c. Khai thác hồ sơ
Các công việc thường làm là:
• Sắp xếp hồ sơ
• Tìm kiếm hồ sơ
• Thống kê
• Lập báo cáo
3. Hệ quản trị cơ sở dữ liệu (QTCSDL)
3.1. Khái niệm CSDL và HQTCSDL

- Bài toán quản lý là bài toán phổ biến trong mọi hoạt động kinh tế xã hội. Việc lưu trữ và xử lý
thông tin một cách chính xác và kịp thời chiếm vị trí quan trọng trong quản lý, điều hành của
mọi tổ chức.
- Máy tính điện tử ra đời và phát triển đã trở thành một công cụ lưu trữ dữ liệu khổng lồ, tấc độ
truy xuất và xử lý dữ liệu nhanh. Do vậy cần phải tạo lập được các phương thức mô tả các cấu
trúc dữ liệu để có thể sử dụng máy tính trợ giúp đắc lực cho con người trong việc lưu trữ và
khai thác thông tin. Cơ sở dữ liệu (CSDL) và hệ quản trị cơ sở dữ liệu (HQTCSDL) ra đời và
phát triển để đáp ứng nhu cầu đó.
 Khái niệm CSDL : Một csdl (database) là một tập hợp các dữ liệu có liên quan với
nhau, chứa thông tin của một tổ chức nào đó (như trường học, bệnh viện, công ty…),
được lưu trữ trên các thiết bị nhớ để đáp ứng nhu cầu khai thác thông tin của nhiều
người dùng với nhiều mục đích khác nhau.
- Ví dụ, như hồ sơ của sinh viên được lưu trữ ở bộ nhớ ngoài của máy tính có thể xem như là một
CSDL.
- Hiện nay thì việc ứng dụng CSDL trong hầu hết các hoạt động xã hội trở nên phổ biến và quen
thuộc. Như CSDL quản lý thư viện, CSDL quản lý hàng không…
- Để có thể tạo lập, lưu trữ và cho phép nhiều người có thể khai thác được CSDL thì cần có hệ
thống các chương trình cho phép người dùng giao tiếp với CSDL. Hệ thống các chương trình
này đã làm ẩn đi những chi tiết kỹ thuật phức tạp và làm đơn giản những tương tác của
người dùng với máy tính.
Khái niệm HQTCSDL: Phần mềm cung cấp một môi trường thuận lợi và hiệu quả để
tạo lập, lưu trữ và khai thác thông tin của CSDL được gọi là hệ quản trị cơ sở dữ liệu
(database management system).
- Người ta thường dùng thuật ngữ HỆ CƠ SỞ DỮ LIỆU để chỉ một CSDL cùng với HQTCSDL.
- Ngoài ra còn có các phần mềm ứng dụng được xây dựng dựa trên HQTCSDL để việc khai thác
CSDL trở nên thuận lợi hơn, đáp ứng nhu cầu đa dạng của người dùng (H.1).
2
H.1- Các thành phần của hệ cơ sở dữ liệu
- Để lưu trữ và khai thác thông tin bằng máy tính cần phải có:
• CSDL

• HQTCSDL
• Các thiết bị vật lý (máy tính, đĩa cứng, mạng…)
3.2. Các mức thể hiện của cơ sở dữ liệu
- Có 3 mức hiểu CSDL là mức vật lý (mức trong), mức khái niệm, mức khung nhìn (mức ngoài):
a. Mức vật lý (mức trong)
CSDL được nhìn theo mức vật lý tức là được nhìn theo cấu trúc lưu trữ. Mức vật lý cho
phép miêu tả dữ liệu theo dạng lưu trữ trên máy, thí dụ mô tả dữ liệu thông qua các tệp chứa dữ
liệu, gồm tên, cách tổ chức, những bản ghi của tệp với thông tin về đồ dài các trường, kiểu bố trí,
cách truy nhập các bản ghi.
Hay ta có thể hiểu đơn giản mức vật lý của một CSDL là tập hợp các tệp dữ liệu tồn tại
trên các thiết bị nhớ.
b. Mức khái niệm
Tại mức khái niệm, CSDL được nhìn theo cấu trúc chính quy của dữ liệu như nó xuất
hiện trong xã hội, trong xí nghiệp, trong tự nhiên…Đó là xác định những dữ liệu nào được lưu
trữ trong hệ CSDL? Giữa các dữ liệu có mối quan hệ với nhau như thế nào?
Ví dụ như CSDL lớp, mức khái niệm cho biết mỗi sinh viên phải lưu các thông tin: Họ
tên, ngày sinh, giới tính, địa chỉ, điểm các môn học….Như vậy CSDL Lớp có thể được mô tả như
một bảng, mỗi cột là một thuộc tính, mỗi hàng tương ứng với dữ liệu về một sinh viên.
c. Mức khung nhìn (mức ngoài)
Khi khai thác CSDL, một người có thể không quan tâm đến toàn bộ thông tin chứa trong
CSDL mà chỉ cần một phần thông tin nào đó phù hợp với nghiệp vụ hay mục đích của mình.
Mỗi thể hiện phù hợp của CSDL cho mỗi người dùng được coi là một khung nhìn của
CSDL. Mức hiểu CSDL của người dùng thông qua khung nhìn được gọi là mức khung nhin của
CSDL.
- Như vậy một CSDL chỉ có một CSDL vật lý, Một CSDL khái niệm nhưng có thể có nhiều
khung nhìn khác nhau (H.2)
H.2- Các mức thể hiện của CSDl
3.3. Các yêu cầu cơ bản của hệ CSDL
a. Tính cấu trúc
Dữ liệu trong CSDL được lưu trữ theo một cấu trúc xác định.

3
Bảng 1
Dữ Liệu
Bảng n

Bảng 1
Khung nhìn n

Khung nhìn 1
Mức vật lýMức khái niệmMức khung nhìn
Ví dụ, CSDL lớp có cấu trúc bảng gồm có các cột và hàng, trong đó mỗi cột là mỗi thuộc
tính và mỗi hàng là một hồ sơ.
b. Tính toàn vẹn
Các giá trị dữ liệu được lưu trữ trong CSDL phải thỏa mãn một số ràng buộc, tùy thuộc
vào hoạt động của tổ chức mà CSDL phản ánh.
Ví dụ, mỗi thư viện đều có quy định về số sách nhiều nhất mà người đọc có thể được
mượn trong một lần, chẳng hạn số sách muợn không vượt quá 5 quyển. CSDL của 1 thư viện
phải phù hợp với quy định hạn chế sách mượn của thư viện đó.
c. Tính nhất quán
Sau những thao tác cập nhật dữ liệu và ngay cả khi có sự cố (phần cứng, phần mềm) xẩy
ra trong quá trình cập nhật, dữ liệu trong CSDL phải được đảm bảo đúng đắn.
Ví dụ, Chương trình của ngân hàng chuyển 100 triệu đồng từ tài khoản A sang tài khoản
B. Trong quá trình chuyển có sự có xẩy ra rất có thể số tiền ở A đã trừ nhưng ở B không nhận
được. Để tránh sự không nhất quán như vậy đối với CSDL thì hoặc cả 2 hành động rút tiền khỏi
A và nhập tiền vào B đều xẩy ra hoặc không có hành động nào xẩy ra cả.
Nếu có nhiều cập nhật dữ liệu xẩy ra cùng lúc, tương tác giữa chúng có thể dẫn đến dữ
liệu không nhất quán. Ví dụ, nếu cùng một thời điểm có 2 khách cùng muốn đặt một vé còn lại
của chuyến bay , ở 2 địa lý bán vé máy bay thì điều này có thể dẫn đến một chỗ ngồi được bán
cho 2 khách khác nhau.
Hệ CSDL phải đảm bảo được tính nhất quán dữ liệu, nghĩa là không xẩy ra tình huống

như trên.
d. Tính an toàn và bảo mật thông tin
CSDL cần được bảo vệ an toàn, phải ngăn chặn được những truy xuất không được phép
và phải khôi phục được CSDL khi có sự cố xẩy ra. Mỗi nhóm người sử dụng CSDL có quyền hạn
mục đích sử dụng khác nhau. cần phải có những nguyên tác và cơ chế bảo mật khi trao quyền
truy xuất dữ liệu cho người dùng.
Ví dụ, CSDL lớp, không thể cho phép bất cứ ai cũng truy cập được và sửa điểm của sinh
viên.
e. Tính độc lập
Vì một CSDL thường phục vụ cho nhiều người dùng với những mục đích khác nhau nên
dữ liệu cần độc lập với các ứng dụng, không phụ thuộc vào bài toán cụ thể, không phụ thuộc vào
phương tiện lưu trữ và xử lý.
f. Tính không dư thừa
Trong CSDL thường không lưu trữ những dữ liệu trùng lặp hoặc những thông tin có thể
dễ dàng suy diễn hay tính toán được từ dữ liệu đã có.
Sự trùng lặp thông tin gây lẵng phí bộ nhớ và dễ dẫn đến tình trạng không nhất quán
thông tin.
Ví dụ, Trong CSDL ta chỉ cần lưu trữ điểm của sinh viên chứ không cần lưu trữ điểm
trung bình vì thông tin này có thể kết xuất từ dữ liệu trong CSDL và hiển thị trên khung nhìn.
3.4. Các chức năng của HQTCSDL
a. Cung cấp môi trường tạo lập CSDL
Một HQTCSDL phải cung cấp môi trường cho người dùng dễ dàng khai báo kiểu dữ liệu,
các cấu trúc dữ liệu thể hiện thông tin và các ràng buộc trên dữ liệu.
Các HQTCSDL hiện nay cho phép người sử dụng có thể tạo lập CSDL thông qua giao
diện đồ họa.
b. Cung cấp môi trường cập nhật và khai thác dữ liệu
Ngôn ngữ để người dùng diễn tả yêu cầu cập nhật hay khai thác thông tin được gọi là
Ngôn ngữ thao tác dữ liệu. Thao tác dữ liệu gồm.
4
• Cập nhật (thêm, sửa, xóa dữ liệu)

• Khai thác (sắp xếp, tìm kiếm, kết xuất báo cáo…)
Ngôn ngữ thao tác dữ liệu được dùng phổ biến hiện nay là SQL (Structured Query
Language).
c. Cung cấp công cụ kiểm soát, điều khiển truy cập vào CSDL
Để đảm bảo được các yêu cầu cơ bản của một HQTCSDL, thì HQTCSDL phải có các bộ
chương trình thực hiện những nhiệm vụ sau:
• Phát hiện và ngăn chặn những truy cập không được phép Giúp an toàn và bảo mật
thông tin
• Duy trì tính nhất quán của dữ liệu
• Tổ chức điều khiển các truy cập đồng thời
• Khôi phục dữ liệu khi có sự cố xẩy ra
• Quản lý các mô tả dữ liệu
3.5. Các ứng dụng của HQTCSDL
- Việc sử dụng các HQTCSDL ngày càng nhiều và phổ biến trong các lĩnh vực như kinh tế, giáo
dục, xã hội, y tế…
• Cơ sở giáo dục đào tạo dùng để quản lý thông tin người học, môn học, kết quả học tập.
• Cơ sở kinh doanh cần có CSDL về thông tin khách hàng, sản phẩm, việc mua bán…
• Cơ sở sản xuất cần quản lý dây chuyền thiết bị và theo dõi việc sản xuất các sản phẩm
trong nhà máy, hàng tồn kho…
• Tổ chức tài chính lưu thông tin về cổ phần, tình hình kinh doanh mua bán tài chính như cổ
phiếu, trái phiếu…
• Ngân hàng cần quản lý các tài khoản, khoản vay, các giao dịch hàng ngày
• Hàng không quản lý các chuyến bay, việc đăng ký vé…
• Tổ chức viễn thông cần ghi nhận các cuộc gọi, hóa đơn hàng tháng, tính toán số dư cho
các thẻ gọi trả trước…
• Những ứng dụng khác.
- Mỗi tổ chức trên đều phải thiết kế và xây dựng một CSDL riêng.
3.6. Các bước xây dựng CSDL
Bước1: Khảo sát
• Tìm hiểu yêu cầu công tác quản lý

• Xác định dữ liệu cần lưu trữ, phân tích mối liên hệ giữa chúng
• Phân tích các chức năng, để đáp ứng các yêu cầu đặt ra
• Xác định khả năng phần cứng, phần mềm có thể khai thác và sử dụng.
Bước 2: Thiết kế
• Thiết kế CSDL
• Lựa chọn HQTCSDL để triển khai
• Xây dựng hệ thống chương trình ứng dụng
Bước 3: Kiểm thử
• Nhập dữ liệu cho CSDL
• Tiến hành chạy thử các chương trình ứng dụng
4. Mô hình dữ liệu
- Mô hình dữ liệu là một sự hình thức hóa toán học với một tập ký hiệu để mô tả dữ liệu và một
tập các phép toán được sử dụng để thao tác các dữ liệu này.
- Hiện có nhiều mô hình dữ liệu. Ba loại mô hình cơ bản đang được sử dụng là:
• Mô hình phân cấp: Mô hình dữ liệu là một cây, trong đó các nút biểu diễn các tập thực
thể, giữ các nút con và nút cha được liên hệ theo một mối quan hệ xác định.
5
• Mô hình mạng: Mô hình được biểu diễn là một đồ thị có hướng.
• Mô hình quan hệ: Mô hình này dựa trên cơ sở khái niệm lý thuyết tập hợp của các quan
hệ, tức là tập các k-bộ với k cố định.
- Trong 3 loại mô hình trên thì mô hình quan hệ có nhiều ưu điểm và được nhiều người quan tâm
hơn cả vì mô hình dữ liệu quan hệ có tính độc lập dữ liệu rất cao, lại dễ sử dụng. Điều quan trọng
hơn cả là mô hình quan hệ được hình thức hóa toán học tôt, do đó được nghiên cứu, phát triển và
cho được nhiều kết lý thuyết cũng như ứng dụng trong thực tiễn.
- Trên cơ sở mô hình quan hệ, đến nay đã phát triển thêm một số loại mô hình khác nhằm mô tả
về thế giới thực một cách chính xác và phù hợp hơn như mô hình quan hệ thực thể và mô hình
dữ liệu hướng đối tượng…
6

×