Tải bản đầy đủ (.ppt) (37 trang)

Bài giảng Nhập môn hệ thống thông tin - Bài 5: Tổ chức dữ liệu và thông tin

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (483.73 KB, 37 trang )

Organizing
Data and Information
1


Giới thiệu
• Ngun nhân gây thất bại trong cơng việc kinh
doanh hiện đại là có q nhiều dữ liệu nhưng
khơng đủ thơng tin.
• Máy tính hiện nay có ở mọi nơi, lưu trữ hàng
gigabytes dữ liệu, nhưng đồng thời gây khó
khăn hơn trong việc rút ra những điều quan trọng
trong hàng đống con số, sự kiện, những thống kê.
• Giống như các thành phần khác của hệ thống
thông tin, nhiệm vụ của một cơ sở dữ liệu là giúp
tổ chức đạt được mục đích của mình. Một cơ sở
dữ liệu có thể đem lại thành cơng cho tổ chức
bằng nhiều cách, bao gồm khả năng cung cấp cho
nhà quản lý, người ra quyết định thơng tin kịp
thời, chính xác, thích hợp dựa trên các dữ liệu 2


Giới thiệu
• Một cơ sở dữ liệu có thể đem lại thành công cho tổ
chức bằng nhiều cách, bao gồm khả năng cung cấp
cho nhà quản lý, người ra quyết định thơng tin kịp
thời, chính xác, thích hợp dựa trên các dữ liệu. Cơ
sở dữ liệu cịn giúp các cơng ty có thơng tin để hạ
chi phí, tăng doanh thu, theo dõi các hoạt động
kinh doanh, có cơ hội khai phá thị trường mới. Thật
vậy, khác biệt giữa kẻ thắng, người thua trong


thương trường cạnh tranh cao độ là khả năng thu
thập dữ liệu, phân tích, và hành động nhanh chóng.
• Vì dữ liệu có tính quyết định đến thành công của tổ
chức, nhiều doanh nghiệp phát triển cơ sở dữ liệu
để truy cập dữ liệu và sử dụng chúng một cách có
3
hiệu quả hơn.


Giới thiệu
• Cơ sở dữ liệu là tập hợp dữ liệu được tổ chức để đáp
ứng nhu cầu của người dùng. Chúng ta đã tiếp cận
nhiều cơ sở dữ liệu trực tiếp hay gián tiếp. Ta truy
cập một cơ sở dữ liệu bằng phần mềm gọi là hệ quản
trị cơ sở dữ liệu (database management system DBMS), DBMS gồm một nhóm chương trình điều
khiển cơ sở dữ liệu và cung cấp giao diện giữa cơ sở
dữ liệu và người dùng và các chương trình ứng dụng
khác. Một cơ sở dữ liệu, một DBMS, và các chương
trình ứng dụng cơ sở dữ liệu tạo nên môi trường cơ
sở dữ liệu. Hiểu rõ các khái niệm cơ bản của hệ thống
cơ sở dữ liệu giúp tăng cường khả năng sử dụng sức
mạnh hệ thống cơ sở dữ liệu được vi tính hóa để hỗ
trợ hệ thống thông tin và mục tiêu của tổ chức.
4


I- Quản lý dữ liệu
• Nếu thiếu dữ liệu và khả năng xử lý các dữ liệu
nầy, một tổ chức không thể thực hiện thành công
hầu hết các hoạt động kinh doanh.

• Dữ liệu chỉ bao gồm những sự kiện thô như số
nhân viên, doanh số bán hàng … Để dữ liệu
chuyển thành thơng tin hữu dụng, nó phải được tổ
chức một cách có ý nghĩa.

5


I- Quản lý dữ liệu - Hệ thống dữ liệu
• Ký tự (character) đơn vị cơ bản để xây dựng thông tin, bao
gồm chữ hoa, chữ thường, con số, hay các ký tự đặc biệt
khác (như ! ; +; /…) . Các ký tự hợp lại thành trường.
• Trường (field): đặc trưng bởi một cái tên, con số, hay các
từ ngữ miêu tả một bộ phận của một đối tượng hay một
hoạt động kinh doanh.
• Mẩu tin (record): tập hợp các trường có liên hệ với nhau.
Tổng hợp các trường miêu tả các bộ phận, ta được một đối
tượng hay hoạt động kinh doanh hoàn chỉnh. VD, một mẩu
tin về nhân công được tổng hợp từ các trường về một
nhân công như họ, tên, địa chỉ, bộ phận, tiền lương …
• Tập tin (file): là tập hợp các mẩu tin có liên hệ với nhau. VD
tập tin về nhân viên là tập hợp của các mẩu tin về nhân
viên trong công ty. Các phần mềm cơ sở dữ liệu thường
biểu diễn tập tin bằng một bảng.
• Cơ sở dữ liệu (database): tập hợp các tập tin có liên quan
6
với nhau.


I- Quản lý dữ liệu


7


2- Các thực thể dữ liệu, thuộc tính, khố
• Thực thể (entity) biểu hiện một lớp khái quát các đối tượng
con người, nơi chốn hay sự vật mà các dữ liệu thu thập, lưu
trữ và bảo trì.
• Thuộc tính (attribute) biểu hiện một phần đặc trưng của thực
thể. VD: mã nhân viên, tên, họ, bộ phận … là các thuộc tính
của nhân viên. Giá trị cụ thể của một thuộc tính gọi là data
item, chứa trong các trường của mẩu tin thể hiện một thực
thể.
• Khóa (key): là một trường hay một nhóm trường dùng để
nhận biết mẩu tin. Khóa chính (primary key) là một hay một
nhóm trường đặc biệt của mẩu tin, khơng mẩu tin nào khác
có được, dùng để phân biệt các mẩu tin (VD mỗi nhân viên
chỉ có duy nhất một mã số, khơng ai giống ai).
• Khi xác định mẩu tin cụ thể có nhiều tiêu chuẩn phân biệt, ta
có thể dùng kết hợp các khóa phụ (secondary key). VD khi
tìm một SV nhưng khơng biết khóa chính (mã số SV), ta có
thể tìm theo một khóa phụ như lớp, rồi từ đó, kiểm tra các 8
khóa khác như họ, tên, ngày sinh … để tìm chính xác SV.


Các thực thể dữ liệu, thuộc tính, khố

9



Cách tiếp cận theo Truyền thống
• Phương pháp quản lý dữ liệu truyền thống là cách
tiếp cận các tập tin dữ liệu riêng biệt được thiết
lập và lưu trữ cho từng chương trình ứng dụng. Ví
dụ, các mẩu tin về khách hàng được giữ trong các
tập tin khác nhau, mỗi tập tin dùng cho một hoạt
động riêng như giao hàng, lập hóa đơn …
• Khuyết điểm
- Dư thừa dữ liệu (Khơng tồn vẹn dữ liệu)
- Mỗi ứng dụng phụ thuộc một chương trình
riêng, một dữ liệu riêng
10


Cách tiếp cận theo Cơ sở dữ liệu
• Phương pháp quản lý dữ liệu theo CSDL là cách tiếp
cận khối dữ liệu có liên quan nhau, được chia xẻ sử
dụng bởi nhiều chương trình ứng dụng.
• Ưu điểm
Nâng cao giá trị khối dữ liệu: dữ liệu chính xác, đầy đủ, cập
nhật
Giảm dữ liệu dư thừa: Cải thiện tính tồn vẹn dữ liệu:
Dễ dàng chỉnh sửa và cập nhật: Vì khơng động chạm đến CT
Dữ liệu và chương trình độc lập nhau:
Truy cập dữ liệu và thông tin tốt hơn: Chuẩn hóa cách truy cập
dữ liệu: Tạo ra một khn mẫu để phát triển chương trình.
chương trình phải thơng qua các DBMS để lấy dữ liệu nên
chuẩn hóa phương thức truy cập cơ.
Bảo vệ dữ liệu tốt hơn. Các đoạn mã bảo mật và mật khẩu đảm
bảo rằng chỉ những người được phép mới được truy cập

Chia sẻ tài nguyên dữ liệu và thơng tin. Chi phí phần cứng,
phần mềm, nhân sự có thể trải rộng ra cho các ứng dụng và
11
người dùng. Đây là đặc điểm quan trọng của DBMS


Cách tiếp cận theo Cơ sở dữ liệu
Khuyết điểm
• Chi phí mua và vận hành DBMS trên máy chủ cao.
• Tăng chi phí chuyên gia. Để thi hành và phối hợp
CSDL cần thêm chuyên gia và nhân sự. Tuy nhiên,
một số tổ chức đã áp dụng phương pháp CSDL
mà không thêm nhân sự.
• Gia tăng nguy hiểm. Mặc dù CSDL có thể được
bảo mật tốt hơn nhờ vào các mức độ bảo mật tập
trung trong một hệ thống, nhưng dữ liệu dễ bị truy
cập bởi tội phạm một khi các biện pháp bảo mật bị
xâm hại. Thêm vào đó, vì một lý do nào đó mà
DBMS bị lỗi, điều này sẽ làm ành hưởng đến nhiều
chương trình ứng dụng.
12


II/ MƠ HÌNH HĨA DỮ LIỆU VÀ MƠ HÌNH CSDL
Khi xây dựng một CSDL một tổ chức cần xem xét
cẩn thận những câu hỏi sau:
• Nội dung: Những dữ liệu nào cần thu thập và giá
bao nhiêu ?
• Truy cập: Những dữ liệu nào phục vụ ai và khi nào
?

• Cấu trúc luận lý: Dữ liệu được sắp xếp ra sao để
có ý nghĩa đối với người dùng ?
• Cấu tạo vật lý: Vị trí lưu trữ dữ liệu ở đâu?
13


II/ MƠ HÌNH HĨA DỮ LIỆU
Chìa khóa quan trọng trong việc tổ chức dữ liệu của
một CSDL bao gồm:
• Những dữ liệu nào được tập hợp trong CSDL.
• Ai sẽ sử dụng.
• Mục đích sử dụng dữ liệu.

14


II/ MƠ HÌNH HĨA DỮ LIỆU
Xây dựng một CSDL địi hỏi hai loại thiết kế khác
nhau: thiết kế luận lý & thiết kế vật lý.
Thiết kế luận lý một CSDL tạo ra một mơ hình trừu
tượng, dữ liệu được tổ chức sắp xếp như thế nào
để dễ dàng tìm thấy những thông tin cần thiết.
Thiết kế luận lý của một CSDL bao gồm:
- Nhận biết các mối quan hệ giữa những dữ liệu
khác nhau và nhóm chúng theo thứ tự.
- Bởi vì CSDL cung cấp cả đầu vào và đầu ra cho hệ
thống thông tin trong suốt công ty, người dùng từ
những khu vực chức năng khác nhau nên những
người nầy cần hỗ trợ việc thiết kế luận lý để đảm
bảo nhu cầu của họ được đáp ứng.

15


II/ MƠ HÌNH HĨA DỮ LIỆU
Thiết kế vật lý
Bắt đầu từ bản thiết kế luận lý và tinh chỉnh để nó hoạt
động và tính tốn chi phí (VD cải thiện thời gian trả
lời, giảm không gian lưu trữ, giảm chi phí vận hành).
Những người tinh chỉnh thiết kế vật lý phải có sự
hiểu biết sâu rộng về hệ thống quản lý dữ liệu để thi
hành CSDL.
Một trong những công cụ nhà thiết kế CSDL dùng để
chỉ ra mối quan hệ luận lý giữa các dữ liệu là mơ
hình dữ liệu. Đó là một biểu đồ các thực thể và mối
quan hệ giữa chúng. Việc mơ hình hóa dữ liệu bao
gồm việc nhận thức được một vấn đề cụ thể và phân
tích dữ liệu cùng thơng tin cần thiết để tìm ra giải
16
pháp


II/ MƠ HÌNH CƠ SỞ DỮ LIỆU
Cấu trúc của những mối quan hệ trong hầu hết
những CSDL thường là một trong ba mơ hình sau:
Cây phân cấp (Hierarchical Models)
Mạng (Network Model)
Quan hệ. (Relational Model)
Hầu hết CSDL mới đều được xây dựng theo mơ hình
quan hệ.


17


II/

MƠ HÌNH CƠ SỞ DỮ LIỆU – Mơ hình cây phân cấp

Trong mơ hình cây phân cấp, dữ liệu được tổ chức
theo cấu trúc từ trên xuống. Mơ hình cây phân cấp
được áp dụng trong những trường hợp mối quan
hệ luận lý giữa các dữ liệu có thể diễn tả theo cách
tiếp cận một-nhiều.

18


II/

MƠ HÌNH CƠ SỞ DỮ LIỆU – Mơ hình mạng

Mơ hình mạng là mơ hình cây phân cấp mở rộng. Mơ
hình mạng là kiểu quan hệ chủ-thành viên (ownermember), trong đó mỗi thành viên có thể có nhiều
chủ.

19


II/

MƠ HÌNH CƠ SỞ DỮ LIỆU – Mơ hình quan hệ


• Trong một CSDL được tổ chức theo mơ hình quan
hệ, dữ liệu được đặt trong các bảng hai chiều gọi
là các mối quan hệ, tương đương các tập tin. Các
bảng tổ chức dữ liệu theo hàng và cột, đơn giản
hóa việc truy cập và thao tác trên dữ liệu.
• Trong một bảng, mỗi hàng là một thực thể, mỗi cột
là một thuộc tính. Mỗi thuộc tính đều có giá trị cụ
thể, nằm trong một miền giá trị (domain). Khai báo
rõ miền giá trị sẽ giúp dữ liệu được chính xác hơn.
• Ưu : dễ điều khiển, linh động, trực quan.
Được dùng rộng rãi cho các CSDL lớn, trên các
20
máy PC hoặc máy lớn


Ví dụ về mơ
hình quan hệ
21


II/ Thao tác cơ bản trên dữ liệu
• Thao tác cơ bản trên dữ liệu bao gồm: Phép chọn,
phép chiếu và phép nối.
• Phép chọn (Selecting) là thao tác lấy về các hàng
theo điều kiện.
• Phép chiếu (Projecting) là thao tác lọc bớt các cột
trong bảng.
• Phép nối (Joining) là thao tác nối hai hay nhiều
bảng với nhau.


22


III- Hệ quản trị CSDL - DBMS
• Một hệ quản trị cơ sở dữ liệu là một nhóm những
chương trình được dùng như là một giao diện giữa
một cơ sở dữ liệu và những chương trình ứng
dụng hay với người dùng. DBMS được phân loại
theo kiểu mơ hình cơ sở dữ liệu mà chúng hỗ trợ.
• Tất cả DBMS đều có vài chức năng chung, như là
cung cấp cách xem CSDL, lưu trữ và trả lại dữ liệu,
chỉnh sửa CSDL, thao tác trên dữ liệu, xuất báo
cáo.

23


Hệ quản trị CSDL – Cung cấp cách xem CSDL
• DBMS có thể tham khảo một sơ đồ để tìm nơi truy
cập dữ liệu được yêu cầu trong mối liên hệ với
những mẫu dữ liệu khác.
• Một DBMS cũng thực hiện như một giao diện với
người sử dụng bằng cách cung cấp một cái nhìn
tổng quan về cơ sở dữ liệu

24


Hệ quản trị CSDL – Tạo và hiệu chỉnh CSDL

DDL (data definition language) ngôn ngữ định nghĩa dữ
liệu. DDL là một tập hợp những chỉ dẫn và câu lệnh
được dùng để định nghĩa và mô tả dữ liệu cùng những
mối quan hệ giữa dữ liệu trong một cơ sở dữ liệu cụ thể.
Tự điển dữ liệu (data dictionary)
• Cung cấp một định nghĩa chuẩn cho những giới hạn và
thành phần dữ liệu. Nó cung cấp các giới hạn và biến số
nhất qn dùng cho tất cả các chương trình.
• Hỗ trợ lập trình viên trong việc thiết kế và viết chương
trình
• Đơn giản hố việc hiệu chỉnh cơ sở dữ liệu:
Từ điển dữ liệu góp phần đem lại các ưu điểm cho cách
tiếp cận CSDL.
• Giảm bớt dữ liệu dư thừa.
• Gia tăng độ tin cậy của dữ liệu.
• Phát triển chương trình nhanh hơn.
25
• Hiệu chỉnh dữ liệu và thông tin dễ dàng hơn


×