Tải bản đầy đủ (.pdf) (20 trang)

Giáo trình hệ thống thông tin quản lý phần 2 trường đh công nghiệp quảng ninh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (927.52 KB, 20 trang )

Giáo trình Hệ thống thơng tin quản lý

CHƢƠNG 5. CÁC QUY TẮC CỦA THƢƠNG MẠI THÔNG
MINH: CƠ SỞ DỮ LIỆU VÀ QUẢN TRỊ THÔNG MINH
5.1. Sắp xếp dữ liệu trong môi trƣờng tệp truyền thống
5.1.1. Hệ thống quản lý tệp truyền thống
Hệ thống quản lý tệp truyền thống thƣờng đƣợc tổ chức riêng rẽ, phục vụ cho
một mục đích của một đơn vị hoặc một đơn vị con trực thuộc cụ thể.
Hệ thống quản lý tệp truyền thống cho phép ta tạo các tệp, truy cập và xử lý
thông tin trong các tệp thơng qua các chƣơng trình ứng dụng. Các phần mềm ứng dụng
này đƣợc viết bằng các ngôn ngữ lập trình đa năng nhƣ PASCAL, C ...
Ƣu điểm:
- Việc xây dựng hệ thống các tệp tin riêng tại từng đơn vị quản lý ít tốn thời

gian bởi khối lƣợng thông tin cần quản lý và khai thác là nhỏ, khơng địi hỏi
đầu tƣ vật chất và chất xám nhiều, do đó triển khai ứng dụng nhanh.
- Thơng tin đƣợc khai thác chỉ phục vụ mục đích hẹp nên khả năng đáp ứng

nhanh chóng, kịp thời.
Nhƣợc điểm:
- Thơng tin đƣợc tổ chức riêng rẽ ở nhiều nơi nên việc cập nhật dễ làm mất

tính nhất quán dữ liệu.
- Hệ thống thông tin đƣợc tổ chức thành các hệ thống file riêng lẻ nên thiếu

sự chia sẻ thông tin giữa các nơi.
- Có sự dƣ thừa dữ liệu rất lớn qua việc trùng lặp các tệp tin trong các ứng

dụng khác nhau.
- Khơng gian đĩa bị lãng phí, khó khăn trong việc bảo trì hệ thống.
- Khó khăn trong việc truy xuất dữ liệu.



Một ví dụ điển hình về sự trùng lặp dữ liệu nhƣ trong Hệ quản lý nguồn nhân
lực bao gồm ba hệ chính:
1. Hệ lương: hệ này duy trì ngày cơng và lƣơng cho tất cả nhân viên.
2. Hệ nhân sự: hệ này duy trì lý lịch cá nhân, dữ liệu về tổ chức, công việc

đào tạo và vị trí thăng tiến.
3. Hệ hưu: hệ này quản trị các qui tắc liên quan đến nghỉ hƣu, loại nghỉ hƣu.

Chi tiết về hƣu của từng nhân viên.
Vấn đề bất lợi là Hệ quản lý lƣơng thông thƣờng đƣợc quản lý bởi phịng Tài
chính, trong khi Hệ quản lý nhân sự và Hệ quản lý hƣu đƣợc quản lý bởi phịng Tổ
chức cán bộ. Rõ ràng, có nhiều dữ liệu về nhân viên là chung cho cả ba hệ. Thƣờng
những hệ này thực hiện và lƣu trữ riêng biệt nên chúng tạo ra sự trùng lặp dữ liệu.
Qua phân tích trên, chúng ta nhận thấy việc tổ chức dữ liệu theo hệ thống tệp
hồn tồn khơng phù hợp với những hệ thống thông tin lớn. Việc xây dựng một hệ
60


Giáo trình Hệ thống thơng tin quản lý

thống thơng tin đảm bảo đƣợc tính nhất quán dữ liệu, đáp ứng đƣợc nhu cầu khai thác
đồng thời của nhiều ngƣời là thực sự cần thiết.
5.1.2. Thiết kế tệp (file) dữ liệu
File là một phần nhỏ của bộ nhớ thứ cấp (bộ nhớ ngoài) lƣu các bản ghi một
cách độc lập. Một số phần mềm hệ thống cho phép lƣu một file ở một số mảng riêng
biệt, nhƣng ngƣời dùng không cảm nhận đƣợc điều đó (hiện tượng này gọi là tính
trong suốt). Trong những trƣờng hợp nhƣ vậy, việc lƣu file ở nhiều vị trí khác nhau
đối với ngƣời sử dụng khơng có gì quan trọng, nhƣng lại đƣợc các nhà thiết kế đặc biệt
quan tâm.



Các loại file

- File dữ liệu: là file chứa dữ liệu nghiệp vụ liên quan đến mơ hình dữ liệu logic
và vật lý. File này ln tồn tại, nhƣng nội dung thay đổi. Ví dụ file về khách
hàng, về các đơn đặt hàng…
- File lấy từ bảng: là danh sách các dữ liệu tham chiếu lấy từ các giá trị đúng của
một hay một số file dữ liệu. Những file này thƣờng cố định và đƣợc thiết kế để
lấy dữ liệu nhanh từ một số file cụ thể.
- File giao dịch: là những file dữ liệu tạm thời phục vụ các hoạt động hàng ngày
của một tổ chức. File này thƣờng đƣợc thiết kế phục vụ việc xử lý nhanh.
- File làm việc: là file tạm thời để lƣu kết quả trung gian. File này tự động xố đi
mỗi khi khơng cần thiết. File này đƣợc thiết kế với mục đích dùng tức thời.
- File bảo vệ: là file đƣợc thiết kế để lƣu trữ các file khác nhau có nguy cơ bị sai,
hỏng trong quá trình làm việc. Các file này cho hình ảnh của file dữ liệu trƣớc
và sau những hoạt động nhất định (cơng nghệ, xử lý, xố) của hệ thống.
- File lịch sử: là file chứa các dữ liệu cũ hiện không cần đƣợc sử dụng, nhƣng có
thể vẫn cần thiết để phân tích hay làm một việc gì đó khi cần đến. File này đƣợc
thiết kế nhằm sử dụng hiệu quả khơng gian nhớ, giảm kích thƣớc file sử dụng,
tăng tốc độ xử lý.
Việc tổ chức các loại file khác nhau không chỉ liên quan đến việc tổ chức lƣu
trữ và khai thác dữ liệu, mà còn liên quan đến các hoạt động xử lý dữ liệu trong quá
trình hoạt động của hệ thống. Về nguyên tắc, việc dùng càng ít file càng tốt. Tuy
nhiên, việc đƣa vào các file là cần thiết cho việc đảm bảo an toàn dữ liệu (file sao lưu),
tăng tốc độ truy nhập hay xử lý (file giao dịch, file lấy từ bảng, file làm việc ,…), giảm
dung lƣợng bộ nhớ làm việc thƣờng xuyên (file lịch sử).
5.1.3. Sắp xếp dữ liệu (tổ chức file)
Một cách tổ chức file là một kỹ thuật để sắp xếp vật lý các bản ghi của một file
trên một thiết bị bộ nhớ ngoài. Tổ chức một file cụ thể cần tính đến các yếu tố sau:

1.
2.
3.
4.

Lấy dữ liệu nhanh.
Thơng lƣợng các giao dịch xử lý lớn.
Sử dụng hiệu quả khơng gian bộ nhớ.
Tránh đƣợc sai sót và mất dữ liệu.
61


Giáo trình Hệ thống thơng tin quản lý

5. Tối ƣu hoá nhu cầu tổ chức file.
6. Đáp ứng đƣợc nhu cầu tăng trƣởng của dữ liệu.
7. An toàn.
Các tiêu chuẩn thƣờng có tính đối kháng nhau, việc lựa chọn các tiêu chính nào
đều cần phải đảm bảo sự hợp lý và cân đối giữa các tiêu chuẩn đƣợc chọn. Việc chọn
tiêu chuẩn nào và sử dụng chúng đến đâu cho việc thiết kế tuỳ thuộc vào kinh nghiệm
của các nhà phân tích, các điều kiện cụ thể của tình huống đặt ra.
-

Tổ chức file tuần tự: các bản ghi đƣợc sắp xếp tuần từ theo giá trị của khố
chính. Để tìm đƣợc một bản ghi, ta cần duyệt lần lƣợt từ bản ghi đầu tiên. Vì
vậy, việc xử lý lần lƣợt các bản ghi sẽ rất nhanh. Tuy nhiên, việc thêm, sửa,
xoá bản ghi theo các này sẽ yêu cầu file phải đƣợc ghi lại sau mỗi lần thực
hiện thao tác.

-


Tổ chức file chỉ số: các bản ghi có thể đƣợc sắp xếp tuỳ ý. Một file chỉ số
đƣợc tạo ra cho phép xây dựng đƣợc vị trí của mỗi bản ghi cụ thể trong file
gốc. Giống nhƣ những phích sách trong thƣ viện, một chỉ số là một bảng mà
đƣợc sử dụng để xác định vị trí của dịng trong một file thoả mãn điều kiện
nào đó. Nhƣ vậy, việc tìm kiếm một hay một số bản ghi đƣợc thông qua file
chỉ số. Nhƣợc điểm của phƣơng pháp này là mất thêm thời gian để truy nhập
và bảo trì file chỉ số.

-

Tổ chức file băm: địa chỉ mỗi bản ghi đƣợc xác định nhờ thuật toán băm
(hashing). Một thuật tốn băm là một q trình để chuyển một giá trị khố
chính vào một số thứ tự tƣơng ứng với địa chỉ bản ghi. Có một số dạng file
băm, nhƣng trong đa số trƣờng hợp của file băm, các bản ghi đƣợc sắp
không phải là tuần tự mà theo cách xác định bởi thuật toán băm.

5.2. Phƣơng pháp cơ sở dữ liệu để quản lý dữ liệu
5.2.1. Dữ liệu



Dữ liệu – hiểu đơn giản là tập hợp các thông tin.
Quản lý dữ liệu (QLDL)

QLDL hiệu quả vô cùng quan trọng trong việc triển khai các hệ thống CNTT
thông qua các ứng dụng kinh doanh, cung cấp thơng tin phân tích để thúc đẩy quá trình
ra quyết định vận hành và hoạch định chiến lƣợc trong doanh nghiệp. Quy trình QLDL
là kết hợp các chức năng khác nhau, nhằm đảm bảo dữ liệu trong các hệ thống doanh
nghiệp chính xác, có sẵn và có thể truy cập đƣợc.

Tầm quan trọng của QLDL
Dữ liệu là tài sản của công ty đƣợc sử dụng để đƣa ra quyết định kinh doanh
chính xác, cải thiện chiến dịch tiếp thị, tối ƣu hóa hoạt động kinh doanh. Tất cả nhằm
hƣớng tới mục tiêu tăng doanh thu và giảm chi phí. Nếu bộ dữ liệu khơng nhất quán sẽ
làm hạn chế khả năng chạy các ứng dụng phân tích thơng minh (BI) và tệ hơn là dẫn
đến các kết quả bị lỗi, sai lệch.

62


Giáo trình Hệ thống thơng tin quản lý

5.2.2. Cơ sở dữ liệu (CSDL)
 Cơ sở dữ liệu (Database)

CSDL đơn giản chỉ là tập hợp các thông tin đƣợc tổ chức theo một cấu trúc nhất
định giúp dễ dàng đọc thông tin, chỉnh sửa, thêm hoặc xóa dữ liệu. Ví dụ: danh sách
khách hàng của cơng ty gồm ít nhất các trƣờng họ và tên, số điện thoại đƣợc coi là một
CSDL.
Việc sử dụng hệ thống CSDL này sẽ khắc phục đƣợc những khuyết điểm của
cách lƣu trữ dạng file riêng lẻ:
-

Giảm trùng lặp thơng tin, đảm bảo tính nhất qn và toàn vẹn dữ liệu.

-

Cho phép dữ liệu đƣợc truy xuất theo nhiều cách khác nhau, từ nhiều ngƣời
khác nhau và nhiều ứng dụng khác nhau.


-

Tăng khả năng chia sẻ thông tin.

Tuy nhiên việc sử dụng hệ quản trị CSDL lại có những phiền hà khơng hề nhỏ
sau đây:
-

Đảm bảo tính chủ quyền của dữ liệu, vì khi sử dụng có tính chất chia sẻ cao.
Bảo mật quyền khai thác thông tin.
Bảo đảm vấn đề tranh chấp dữ liệu khi xảy ra.
Đảm bảo an toàn, toàn vẹn của dữ liệu.

Trong cuộc sống hằng ngày chắc hẳn bạn có sử dụng qua các hệ thống CSDL
nhƣng bạn lại không biết. Chẳng hạn hằng ngày bạn vào đọc bài tin tức từ các trang
báo, ở mỗi trang họ có dùng một hệ thống lƣu trữ dữ liệu và khi bạn vào xem hệ thống
sẽ trả dữ liệu về màn hình trình duyệt cho bạn xem. Rõ ràng bạn có thể truy cập một
lúc nhiều trang và nhiều ngƣời có thể đọc một trang cùng một lúc đƣợc, nhƣng vẫn
đảm bảo tính tồn vẹn dữ liệu không bị sai lệch.
 Quản lý CSDL
Hệ thống quản trị CSDL (Database Management System) là hệ thống đƣợc
thiết kế để quản lý CSDL tự động và có trật tự. Các hành động quản lý này bao gồm
chỉnh sửa, xóa, lƣu thơng tin và tìm kiếm (truy xuất thơng tin) trong một nhóm dữ liệu
nhất định.
Nói một cách dễ hiểu hơn, hệ quản trị CSDL là hệ thống tự động giúp ngƣời
dùng có thể kiểm sốt các thơng tin, tạo, cập nhật và duy trì các CSDL. Trong đó, hai
thành phần chính trong một hệ quản trị CSDL là: Bộ xử lý truy vấn (bộ xử lý yêu cầu)
và bộ QLDL.
5.2.3. Thiết kế CSDL
Đa số các hệ thống thông tin hiện nay đều sử dụng công nghệ CSDL đƣợc gọi

là hệ quản trị CSDL (DBMS- Data Base Management System). Hệ quản trị CSDL là
một phần mềm nằm trung gian giữa chƣơng trình ứng dụng và hệ điều hành. Nó hƣớng
các khả năng của hệ điều hành vào việc tất cả dữ liệu. Có một số hệ quản trị CSDL mà
ta thƣờng gặp: Oracle, MsSQL, DB2,…
63


Giáo trình Hệ thống thơng tin quản lý

Mỗi hệ quản trị CSDL đƣợc xây dựng dựa trên một loại mô hình dữ liệu. Khi
thiết kế dữ liệu vật lý, ta phải nắm vững các đặc trƣng của hệ quản trị CSDL đƣợc
chọn để thiết kế dữ liệu thích hợp với nó.
Thiết kế CSDL vật lý là bƣớc cuối cùng của thiết kế dữ liệu. Quá trình thiết kế
CSDL vật lý là quá trình ánh xạ cấu trúc dữ liệu logic đƣợc xây dựng ở bƣớc trƣớc vào
bên trong hệ thống.
Ba nguồn đầu vào của thiết kế CSDL vật lý là:
- Các cấu trúc CSDL logic đã thực hiện trong thiết kế logic.
- Khối lƣợng yêu cầu xử lý của ngƣời dùng thu đƣợc khi xác định nhu cầu,
bao gồm quy mô, tần suất sử dụng dữ liệu và các yêu cầu về: thời gian đáp
ứng, an toàn, ghi tạm, phục hồi và lƣu giữ dữ liệu.
- Các đặc tính của hệ quản trị CSDL và các thành phần của môi trƣờng hoạt
động của máy tính.
Các bƣớc cần cho thiết kế dữ liệu vật lý phụ thuộc vào số lƣợng các yếu tố, bản
chất của hệ quản trị CSDL sử dụng, đặc tính mơi trƣờng tính tốn của tổ chức, việc mở
rộng các xử lý phân tán và truyền thông dữ liệu, các loại ứng dụng của tổ chức. Ở đây
ta chỉ nhấn mạnh đến những mặt chủ yếu của thiết kế vật lý, nó là chung cho hầu hết
các dự án phát triển CSDL. Thiết kế CSDL vật lý bao gồm năm thiết kế sau:
1.
2.
3.

4.
5.

Phân tích khối lƣợng dữ liệu và sử dụng dữ liệu.
Chiến lƣợc phân tán.
Tổ chức file.
Lập các chỉ số.
Ràng buộc an tồn.

5.2.4. Phƣơng pháp CSDL
Cơng nghệ QLDL tiến bộ cho phép biểu diễn dữ liệu thành các file riêng biệt
cho mỗi ứng dụng và tổ chức chúng thành những CSDL dùng chung, một CSDL là
một tập các dữ liệu có liên hệ logic với nhau và đƣợc tổ chức làm dễ dàng việc thu
thập, lƣu trữ và lấy ra của nhiều ngƣời dùng trong một tổ chức.
CSDL bao gồm các phương pháp tổ chức dữ liệu cho phép QLDL một cách
tập trung, chuẩn hóa và nhất quán.
Nhờ việc tách dữ liệu để tổ chức riêng, ngƣời ta có thể áp dụng các cơng cụ
tốn học (lý thuyết tập hợp) để tổ chức dữ liệu một cách tối ƣu cả về phƣơng diện lƣu
trữ (tiết kiệm không gian nhớ) cũng nhƣ về mặt sử dụng: giảm dƣ thừa, tìm kiếm thuận
lợi, lấy ra nhanh chóng và sử dụng chung. Việc tổ chức dữ liệu nhƣ trên cho phép
CSDL đƣợc sử dụng và phục vụ cho nhiều ứng dụng độc lập khác nhau.

64


Giáo trình Hệ thống thơng tin quản lý

Hình 5.1: Phƣơng pháp QLDL truyền thống

Hình 5.2: Sự khác biệt giữa quản lý truyền thống với tiếp cận CSDL


Hình 5.3: Phƣơng pháp tiếp cận CSDL

65


Giáo trình Hệ thống thơng tin quản lý

Hình 5.4: Quản lý CSDL dạng bảng
5.2.5. Hệ quản trị CSDL
Hệ quản trị CSDL (Database Management System – DBMS) là một tập hợp
chƣơng trình giúp cho ngƣời sử dụng: Tạo ra, khai thác, duy trì CSDL…

Hình 5.5: Sử dụng hệ quản trị CSDL

66


Giáo trình Hệ thống thơng tin quản lý

Hình 5.6: Một số hệ quản trị CSDL phổ biến

Hình 5.7: Sự vận hành của hệ quản trị CSDL

67


Giáo trình Hệ thống thơng tin quản lý

Hình 5.8: Ví dự về sự vận hành của hệ quản trị CSDL


Hình 5.9: Năng lực của hệ quản trị CSDL


Dữ liệu đƣợc lƣu trữ trong các bảng dữ liệu nhƣng các bảng có bổ sung thêm
các tính năng hƣớng đối tƣợng nhƣ lƣu trữ thêm các hình vẽ, âm thanh, video,
hành vi...

68


Giáo trình Hệ thống thơng tin quản lý

5.3. Sử dụng cơ sở dữ liệu để cải thiện hiệu suất kinh doanh và ra quyết định

Hình 5.10: Hoạt động của doanh nghiệp

Hình 5.11: Sử dụng CSDL trong doanh nghiệp
5.3.1. Kinh doanh thông minh (Business Intelligence – BI)
Kinh doanh thông minh (BI) là một qui trình và cơng nghệ mà các doanh
nghiệp dùng để kiểm soát khối lƣợng dữ liệu khổng lồ, khai phá tri thức.
 Lợi ích của BI:

-

Giúp cho các doanh nghiệp có thể đƣa các các quyết định hiệu quả hơn.

-

Tăng khả năng kiểm sốt thơng tin của doanh nghiệp.


-

Giúp doanh nghiệp có thể dự đốn về xu hƣớng của giá cả dịch vụ, hành vi
khách hàng => phát hiện khách hàng tiềm năng

69


Giáo trình Hệ thống thơng tin quản lý

Hình 5.12: Chức năng của BI
5.3.2. Kho dữ liệu (Data warehouse)
5.3.2.1. Định nghĩa Kho dữ liệu
Kho dữ liệu – “Chiếc dạ dày” của hệ thống BI. Để có thể trình bày đƣợc thơng
tin trên các báo cáo quản trị (dashboard) thì cần có nguồn cung cấp thơng tin đó – đó
chính là Kho dữ liệu.
Ban đầu Kho dữ liệu đƣợc định nghĩa là một tập dữ liệu đƣợc dùng để hỗ trợ
quy trình ra quyết định. Theo quá trình phát triển, Kho dữ liệu đƣợc định nghĩa là
một môi trƣờng thông tin (information environment).
Vị trí của Kho dữ liệu đƣợc minh họa trong hình sau:

Hình 5.13: Kiến trúc mức cao của hệ thống BI
 Phía bên phải (hình oval bên phải) là đối tƣợng thụ hƣởng của hệ thống –
những ngƣời sẽ phân tích thơng tin để đƣa ra các kế hoạch dài hạn hay điều
hành ngắn hạn.

70



Giáo trình Hệ thống thơng tin quản lý

 Để có thể đƣa ra đƣợc các thơng tin có tính hệ thống, phù hợp với nghiệp vụ
kinh doanh của doanh nghiệp thì cần có đội ngũ nghiệp vụ (hình oval ở
giữa), chịu trách nhiệm xây dựng các báo cáo quản trị từ Kho dữ liệu. Cuối
cùng để có thể lấy đƣợc dữ liệu và đƣa vào Kho dữ liệu theo nhu cầu nghiệp
vụ thì cần có đội ngũ kỹ thuật (hình oval bên trái).
 Ngồi ra có thể có các hệ thống thơng mình (hình vng góc dưới bên trái)
có thể khai thác dữ liệu từ Kho dữ liệu nhằm hỗ trợ quản lý ra quyết định.
5.3.2.2. Chức năng của Kho dữ liệu


Cung cấp một góc nhìn tồn diện về doanh nghiệp:

Cho dù doanh nghiệp có nhiều mảng kinh doanh đƣợc quản lý bởi các hệ thống
tác nghiệp khác nhau, nhƣng Kho dữ liệu là nơi đã tập hợp (tích hợp) đƣợc mọi thông
tin về các mảng nghiệp vụ khác nhau để cung cấp một góc nhìn tồn diện. Việc tích
hợp này còn cung cấp khả năng đánh giá chéo các mảng nghiệp vụ khác nhau để đánh
giá sự tƣơng quan giữa chúng.


Cung cấp đầy đủ thông tin hiện tại và lịch sử của doanh nghiệp; sẵn sàng
cho việc khai thác, sử dụng cho việc hỗ trợ ra quyết định chiến lƣợc:

Từ thông tin ở đây thể hiện dữ liệu ở trong kho không chỉ đơn thuần là dữ liệu
thô lấy từ các hệ thống tác nghiệp mà nó đã đƣợc tổng hợp, tính tốn thành các độ đo
có ý nghĩa phân tích.


Có khả năng cung cấp dữ liệu chi tiết theo nhu cầu mà không phải truy

xuất các hệ thống tác nghiệp:

Điều này thể hiện trong một số trƣờng hợp có thể nhu cầu phân tích dữ liệu ở
mức giao dịch, thì nó cũng sẽ đƣợc lƣu sẵn ở Kho dữ liệu.


Đảm bảo thơng tin trong Kho dữ liệu có tính nhất qn:

Ví dụ doanh nghiệp có nhiều nghiệp vụ đƣợc quản lý với các hệ thống tác
nghiệp khác nhau, nhƣng cần đảm bảo ánh xạ đƣợc một khách hàng xuất hiện ở nhiều
hệ thống về 1 ngƣời duy nhất. Điều này áp dụng cho các đối tƣợng dữ liệu khác. Ngồi
ra một trƣờng dữ liệu có thể đƣợc biểu diễn bằng nhiều cách khác nhau, ví dụ Tên
khách hàng có hệ thống tách họ và tên thành 2 trƣờng khác nhau, có hệ thống chỉ lƣu
trong 1 trƣờng. Khi tổng hợp về Kho dữ liệu thì sẽ đƣợc chuyển về 1 dạng thống nhất.


Là nguồn thông tin chiến lƣợc mềm dẻo và có tính tƣơng tác:

Chữ mềm dẻo và tƣơng tác ở đây thể hiện ngƣời dùng có thể lấy các thông tin
khác nhau của cùng một đối tƣợng. Từ tƣơng tác ở đây thể hiện có thể thực hiện đƣợc
nhiều thao tác với các đối tƣợng dữ liệu thay vì trả lại một danh sách tĩnh. Ví dụ có thể
lấy dữ liệu tổng hợp theo ngày, theo tuần, theo tháng của cùng 1 đối tƣợng dữ liệu.
Tính tƣơng tác thể hiện ngƣời dùng có thể áp dụng các thao tác phân tích dữ liệu, một
ví dụ là nền tảng phân tích dữ liệu SQL Server Analysis Services (SSAS) cho phép
ngƣời dùng có thể tƣơng tác để phân tích dữ liệu.

71


Giáo trình Hệ thống thơng tin quản lý


5.3.2.3. Đặc điểm của Kho dữ liệu
Dữ liệu đƣợc lƣu trong Kho dữ liệu không đƣợc tạo ra trực tiếp từ ngƣời dùng
mà đƣợc lấy từ các nguồn dữ liệu sẵn có và mục đích là phục vụ tạo ra các báo cáo
quản trị do đó nó có các tính chất sau:


Hƣớng chủ đề (subject-oriented):

Mục đích của Kho dữ liệu là phục vụ các yêu cầu phân tích, hoặc khai phá cụ
thể đƣợc gọi là chủ đề. Ví dụ với chủ đề phân tích nhân sự thì có thể bao gồm các độ
đo về doanh thu của từng ngƣời, số ngày nghỉ trong tháng, số dự án tham gia trong
tháng, theo các chiều phân tích: thời gian, chi nhánh, sản phẩm, …
Một sự so sánh dễ hiểu, giống nhƣ chẩn đoán một bệnh ví dụ bệnh liên quan
đến tim, thì bác sỹ cần quan tâm không chỉ một mà một vài chỉ số nhƣ các chỉ số liên
quan đến máu, chỉ số về huyết áp, nhịp tim, điện tâm đồ. Ngồi ra cịn cần theo dõi
theo thời gian (có thể là hàng ngày) để xem xét sự thay đổi mà có phƣơng pháp điều
trị kịp thời. Trong trƣờng hợp này thời gian đƣợc gọi là chiều phân tích. Để chẩn đốn
đƣợc chính xác thì cần đầy đủ các thơng tin về các chỉ số trên, và cũng không cần các
chỉ số khác lẫn vào làm nhiễu q trình chẩn đốn và cũng khơng cần thiết. Việc tổ
chức dữ liệu theo chủ đề này sẽ dẫn đến nhu cầu tổ chức lƣu trữ dữ liệu khác với các
CSDL tác nghiệp.


Đƣợc tích hợp (integrated):

Tại một bệnh viện, các phòng khác nhau sẽ thực hiện các xét nghiệm khác
nhau, do đó để có đƣợc đầy đủ thơng tin phục vụ chẩn đốn thì cần thu thập đƣợc kết
quả từ nhiêu nguồn. Điều này hoàn toàn tƣơng tự nhƣ tại doanh nghiệp, dữ liệu cần để
phân tích có thể nằm rải rác ở nhiều hệ thống tác nghiệp khác nhau, và vì vậy cần tích

hợp lại.
Việc tổng hợp dữ liệu từ nhiều nguồn vào một kho dữ liệu cho phép chúng ta có
thể xem đồng thời nhiều nhóm chỉ tiêu khác nhau (từ nhiều hệ thống nghiệp vụ khác
nhau), ví dụ ta có thể xem chỉ tiêu doanh thu ở nhiều mảng nghiệp vụ khác nhau để có
thể so sánh đƣợc sự tƣơng quan giữa các mảng nghiệp vụ này. Điều này cũng giống
trong chuẩn đoán bệnh ta có thể cần nhiều xét nghiệm (thử máu, thử nước tiếu, siêu
âm, …) và kiểm tra khác nhau để có thể đƣa ra kết luận chính xác.


Có gán nhãn thời gian (time variant):

Nhƣ đã đề cập, với các chỉ số thay đổi liên tục (như huyết áp, nhịp tim) việc
chẩn đốn bệnh sẽ cần dữ liệu của các hơm trƣớc để so sánh phục vụ quá trình điều trị.
Do đó hàng ngày cần phải lƣu lại giá trị của các chỉ số này. Hay nói cách khác các chỉ
số này khi lƣu sẽ đƣợc gán 1 nhãn thời gian tƣơng ứng. Tƣơng tự nhƣ vậy, dữ liệu lịch
sử có tầm quan trọng đặc biệt trong phân tích dữ liệu, cùng một độ đo sẽ có nhiều giá
trị khác nhau trong lịch sử có thể dùng để so sánh với nhau để biết đƣợc sự thay đổi là
tốt hay xấu.
Ví dụ, độ đo doanh thu của một mặt hàng của tháng hiện tại, nếu đem so sánh
với doanh thu của mặt hàng đó trong tháng trƣớc, tháng này năm trƣớc thì sẽ có nhiều
72


Giáo trình Hệ thống thơng tin quản lý

thơng tin hơn để đánh giá doanh thu của mặt hàng đó là tốt hay khơng, trên cơ sở đó sẽ
có các quyết định phù hợp. Ngồi ra, dữ liệu lịch sử cịn cho phép dự báo đƣợc tƣơng
lai khi ứng dụng khai phá dữ liệu.



Bất biến (non-volatile):

Khác với các CSDL giao dịch, nơi thơng tin của một đối tƣợng có thể đƣợc cập
nhật thay đổi hàng ngày, dữ liệu trong Kho dữ liệu có chức năng báo cáo lại các chỉ số
về hoạt động kinh doanh thực tế đã xảy ra. Do đó dữ liệu trong Kho dữ liệu khơng thể
cập nhật, thay đổi vì nó sẽ khơng phản ánh đúng thực tế. Do đó với kho dữ liệu chỉ có
2 thao tác chính là tải dữ liệu vào kho và truy cập (đọc) dữ liệu từ kho.
Trƣờng hợp sau khi tổng hợp dữ liệu mà dữ liệu ở trong nguồn bị thay đổi, khi
đó một giải pháp xử lý là thực hiện lại q trình ETL (Extract-Load-Transform: trích
xuất – tải – biến đổi) để tải lại dữ liệu từ nguồn vào Kho dữ liệu chứ không cho phép
sửa đổi dữ liệu ở trong Kho. Một ý nghĩa khác của tính chất này là dữ liệu lịch sử vẫn
đƣợc bảo tồn, vẫn có ý nghĩa chứ khơng nhƣ dữ liệu tác nghiệp ở các CSDL, dữ liệu
cũ (năm trƣớc, hoặc tháng trƣớc) khơng có ý nghĩa phục vụ hoạt động hằng ngày.
Nhƣ vậy, nếu nhƣ CSDL tác nghiệp đƣợc ví nhƣ cái tủ sách cá nhân, nơi ngƣời
ta thƣờng xuyên tra cứu, cập nhật, hiệu đính, ghi chú vào lề, thêm mới hoặc chuyển
sách đi. Thì Kho dữ liệu lại đƣợc so sánh với thƣ viện quốc gia, nơi các tài liệu kinh
điển đƣợc đƣa đến liên tục để lƣu trữ và tham khảo, không ai sửa chữa hoặc chuyển
chúng qua chỗ nào khác cả.
 Mơ hình biểu diễn dữ liệu trong Kho dữ liệu
Vì các đặc điểm dữ liệu đƣợc tổ chức hƣớng chủ đề, nên mơ hình quan hệ thực
thể đƣợc dùng trong thiết kế CSDL tác nghiệp là không còn phù hợp. Trong thực tế,
ngƣời ta dùng 2 khái niệm là độ đo (measure) và chiều phân tích (dimension) để biểu
diễn dữ liệu trong kho. Áp dụng vào ví dụ ở trên, tập các chỉ số máu, nhịp tim, huyết
áp sẽ tƣơng ứng với các độ đo, và thời gian là chiều phân tích.
Một số mơ hình sau đã đƣợc thiết kế để biểu diễn các độ đo và chiều phân tích.
Ngƣời ta vẫn dùng mơ hình CSDL quan hệ để biểu diễn, trong đó bảng sự kiện (Fact)
sẽ đƣợc tạo ra để chứa các độ đo, và bảng chiều (demension) đƣợc dùng để chứa thông
tin về các chiều phân tích, bảng sự kiện sẽ có mối quan hệ với bảng chiều tƣơng ứng.
Cụ thể có 3 mơ hình biểu diễn quan hệ giữa bảng sự kiện và bảng chiều nhƣ sau:



Mơ hình ngơi sao (star schema)

Trong mơ hình này, một bảng sự kiện sẽ nằm ở trung tâm và xung quanh là các
bảng chiều (Hình 5.14 bên trái), vì hình ảnh này giống một ngơi sao đang phát sáng
nên ngƣời ta đặt cho nó tên là mơ hình ngơi sao (Hình 5.14 bên phải).

73


Giáo trình Hệ thống thơng tin quản lý

Hình 5.14: Ví dụ về mơ hình ngơi sao
Ở trong ví dụ trong Hình 5.14, bảng sự kiện chứa thơng tin bán hàng với các độ
đo: số lƣợng bán đƣợc (unit sold), số tiền thu đƣợc (dollars sold) và trung bình doanh
thu (average sale). Bảng sự kiện này có liên kết với 4 bảng chiều: thời gian (time), chi
nhánh cửa hàng (branch), mặt hàng (item) và vị trí cửa hàng (location).
Đặc điểm của mơ hình ngơi sao là chỉ có 1 cấp quan hệ giữa bảng chiều và bảng
sự kiện do đó khi truy xuất dữ liệu thì các hệ quản trị CSDL sẽ xử lý nhanh hơn và trả
lại kết quả nhanh hơn. Nhƣng nhƣợc điểm của phƣơng pháp này là một số bảng chiều
chƣa đƣợc chuẩn hóa. Ví dụ nhƣ bảng chiều vị trí, trong đó nó khơng đƣợc chuẩn hóa
theo mơ hình CSDL.
Trong bảng này nhiều dữ liệu bị lặp lại ví dụ tồn bộ các trƣờng city,
state_or_province, và country sẽ bị lặp trên các dịng có trùng city. Việc dữ liệu khơng
đƣợc chuẩn hóa sẽ khơng đảm bảo đƣợc sự nhất quán về dữ liệu. Khi dữ liệu thay đổi
ví dụ ngƣời ta đổi tên city, có thể q trình cập nhật sẽ bị sót do rất nhiều dịng cần
phải cập nhật. Ngoài ra dữ liệu lặp sẽ làm tăng khơng gian lƣu trữ, ảnh hƣởng đến tiến
trình sao lƣu, đồng bộ dữ liệu.
Một chủ đề phân tích có thể đƣợc biểu diễn bằng một hoặc nhiều “ngôi sao”.



Mô hình bơng tuyết (snowflake)

Mơ hình bơng tuyết khắc phục nhƣợc điểm của mơ hình ngơi sao ở khía cạnh
dữ liệu khơng đƣợc chuẩn hóa. Do đó nó cho phép các bảng chiều đƣợc chuẩn hóa (tùy
theo trường hợp mà nó có thể chuẩn hóa đến chuẩn 3 Boyce–Codd). Vì sau khi chuẩn
hóa các bảng chiều, nó có hình dạng giống một bơng tuyết (Hình 5.15 bên phải), đây
là lý do nó có tên nhƣ vậy.

74


Giáo trình Hệ thống thơng tin quản lý

Hình 5.15: Mơ hình bơng tuyết
Hình 5.15 minh họa mơ hình bơng tuyết trong đó bảng location đã đƣợc chuẩn
hóa, do thiếu khơng gian nên ở hình này chỉ vẽ đƣợc đến bảng city (trong đó có chứa
khóa state_or_province_key) để liên kết với bảng state_or_province, tiếp tục bảng
state_or_province lại có quan hệ với bảng country (nếu muốn chuẩn hóa đến chuẩn 3).
Tuy nó khắc phục đƣợc nhƣợc điểm của mơ hình chịm sao, nhƣng nó lại phá mất ƣu
điểm của mơ hình ngơi sao là tốc độ xử lý dữ liệu khi nó phải liên kết nhiều bảng với
nhau để lấy dữ liệu.
Tƣơng tự với mơ hình ngơi sao, một chủ đề phân tích có thể đƣợc biểu diễn
bằng một hoặc một vài bơng tuyết.


Mơ hình chịm sao (constellation)

Mơ hình chịm sao tiếp tục là sự mở rộng mơ hình bơng tuyết, trong đó nó cho
phép các bảng sự kiện có thể sử dụng chung các bảng chiều. Khi đó các bảng sự kiện

và bảng chiều sẽ tạo ra mối quan hệ giống nhƣ một đồ thị – và một hình ảnh rất giống
với mối quan hệ này là chịm sao (Hình 5.15 bên phải).

75


Giáo trình Hệ thống thơng tin quản lý

Hình 5.16: Mơ hình chịm sao
Trong ví dụ ở Hình 5.16, khi bổ sung thêm vào bảng sự kiện Giao hàng
(shipping), khi đó bảng sự kiện này sẽ có nhu cầu sử dụng chiều location, item, time.
Việc sử dụng chung chiều có ƣu điểm là rút gọn đƣợc số lƣợng bảng chiều.
Nhƣng việc làm này sẽ ảnh hƣởng lớn đến quá trình ETL dữ liệu. Giả sử hệ thống
quản lý bán hàng là tách biệt với hệ thống quản lý giao hàng, khi đó cần phải lấy thơng
tin từ cả 2 nguồn dữ liệu để đẩy vào bảng chiều chung là location.
Nhƣợc điểm của mơ hình chịm sao là phức tạp, khó sử dụng và cần đọc tài liệu
hƣớng dẫn thì mới có thể hiểu và lấy đƣợc thông tin cần từ Kho dữ liệu. Các công
đoạn khác nhƣ ETL cũng sẽ phức tạp hơn so với các mơ hình khác. Vì đặc điểm mơ
hình này phức tạp nên một số sách có thể khơng đề cập giới thiệu mơ hình này.
Với các mơ hình biểu diễn sẽ có các ƣu điểm và nhƣợc điểm riêng, nên ngƣời
thiết kế phải chịu trách nhiệm lựa chọn mơ hình nào phù hợp.
5.3.3. CSDL và Web
Web đƣợc sử dụng để cung cấp một vài thông tin trong CSDL nội bộ doanh
nghiệp cho khách hàng và các đối tác.
Lợi ích của sử dụng Web để truy cập vào CSDL nội bộ của một tổ chức:
-

Nhân viên yêu cầu đào tạo ít hơn;
Giao diện Web hầu nhƣ ít hoặc không đổi với CSDL nội bộ.


76


Giáo trình Hệ thống thơng tin quản lý

5.4. Quản lý nguồn dữ liệu
5.4.1. Thiết lập chính sách thơng tin
Chính sách về thông tin qui định những nguyên tắc của tổ chức về việc chia sẻ,
truyền bá, thu thập, chuẩn hóa, phân loại và lƣu trữ thông tin.
5.4.2. Bảo vệ nguồn dữ liệu
Các tổ chức phải bảo vệ nguồn dữ liệu của họ chống lại sự xâm nhập bất hợp
pháp và sự phá hỏng dữ liệu.
Ba bƣớc chính mà một tổ chức có thể thực hiện để bảo vệ dữ liệu là:
1. Phát triển chiến lƣợc sao lƣu và phục hồi dữ liệu
-

Sao lưu: Tạo một bản sao chính xác của tồn bộ hệ thống thơng tin.
Phục hồi: Khả năng đƣa hệ thống trở về hoạt động lại khi hệ thống bị xâm
nhập hoặc bị phá hỏng.

2. Lập kế hoạch khắc phục sự cố
-

-

Kế hoạch khắc phục sự cố: Một quy trình chi tiết để phục hồi thơng tin
hoặc một hệ thống ứng dụng CNTT trong trƣờng hợp xẩy ra sự cố.
 Vùng nóng (hot site): Một vùng phƣơng tiện riêng đƣợc trang bị đầy đủ
mà cơng ty có thể ngay lập tức đƣa vào sử dụng sau sự cố.
 Vùng lạnh (Cold site): Một vùng tách biệt không trang bị sẵn các thiết bị

máy tính, nhƣng là nơi mà nhân viên có thể chuyển tới sau khi xẩy ra sự
cố.
Biểu đồ chi phí khắc phục sự cố:
 Chi phí mà tổ chức phải chịu nếu khơng có thơng tin và những cơng
nghệ cần thiết.
 Chi phí mà tổ chức phải chịu để khắc phục thảm họa.

Hình 5.17: Thời gian từ khi sự cố xảy ra cho tới khi khắc phục đƣợc
3. Xây dựng hệ thống kinh doanh có khả năng thích ứng.
-

Linh hoạt: Hệ thống phải đáp ứng đƣợc những thay đổi trong kinh doanh.
Đo lường được: Hệ thống có thể thích ứng với nhu cầu tăng lên tới mức
nào.
Đáng tin cậy: Đảm bảo mọi hệ thống đều thực hiện đúng chức năng và cung
cấp thơng tin chính xác.
77


Giáo trình Hệ thống thơng tin quản lý

-

Sẵn sàng: Các điểm mà nhân viên, khách hàng, và đối tác có thể tiếp cận hệ
thống.
Vận hành: Xác định xem hệ thống có thể thực hiện một quy trình hoặc giao
dịch cụ thể nhanh tới mức nào.

5.4.3. Các nguyên tắc quản lý CSDL









Nhu cầu quản lý dữ liệu luôn tồn tại.
Dữ liệu có thể đƣợc trích xuất ở nhiều cấp.
Phần mềm ứng dụng phải đƣợc tách riêng khỏi cơ sở dữ liệu.
Phần mềm ứng dụng nên đƣợc phân loại theo cách mà nó xử lý dữ liệu.
Phần mềm ứng dụng nên đƣợc thiết kế độc lập.
Dữ liệu nên đƣợc nhập vào hệ thống chỉ một lần.
Cần có chuẩn dữ liệu.

78


Giáo trình Hệ thống thơng tin quản lý

CHƢƠNG 6. ỨNG DỤNG DOANH NGHIỆP

6.1. Các hệ thống doanh nghiệp
6.1.1. Khái niệm về Hệ thống Doanh nghiệp
Một hệ thống hoạch định nguồn lực doanh nghiệp (ERP - Enterprise Resource
Planning - ERP) của công ty với các tổ chức để tăng cƣờng quản lý và hoạt động kinh
doanh trong một cơ sở dữ liệu tập trung. Các cơ quan kết hợp phần mềm ERP để đồng
hóa các quy trình kinh doanh, tích lũy dữ liệu hoạt động, cải thiện hiệu quả chuỗi cung
ứng, kích thích các chiến lƣợc dựa trên dữ liệu và cải thiện sự hợp tác giữa các bộ
phận.

Hệ thống ERP hay còn đƣợc gọi bằng tên phổ biến là phần mềm quản trị
(nguồn lực) doanh nghiệp, chính là q trình quản lý tích hợp các chu trình kinh doanh
cốt lõi, thƣờng là theo thời gian thực, đƣợc thực hiện với sự trợ giúp trung gian của
công nghệ và phần mềm.
Các quy trình kinh doanh trong từng chức năng kinh doanh khác nhau và khơng
có khả năng chia sẻ thơng tin với nhau. Các nhà quản lý đã gặp khó khăn khi tập hợp
dữ liệu bị phân mảnh thành các hệ thống riêng biệt để trình bày một bức tranh tổng thể
về hoạt động của tổ chức và đƣa ra các quyết định cho tồn cơng ty.
Ví dụ: tại thời điểm khách hàng đặt hàng, nhân viên bán hàng có thể không thể
cho anh ta biết liệu các mặt hàng mong muốn có trong kho hay sắp đƣợc sản xuất hay
khơng.
Để khắc phục những khó khăn đó, trong những năm gần đây, nhiều tổ chức đã
lựa chọn thay thế một số hệ thống thông tin riêng biệt bằng một hệ thống tích hợp duy
nhất có thể hỗ trợ các hoạt động kinh doanh cho các chức năng kinh doanh khác
nhau. Hệ thống nhƣ vậy đƣợc gọi là hệ thống doanh nghiệp.
Các chu trình kinh doanh cốt lõi thường bao gồm:


Lập kế hoạch sản phẩm, mua hàng;



Kế hoạch sản xuất;



Tiếp thị và bán hàng;




Quản lý hàng tồn kho;



Tài chính và kế tốn;



Quản trị nguồn lực.

ERP còn thƣờng đƣợc đề cập đến nhƣ một phần mềm quản lý kinh doanh điển
hình, đƣợc tích hợp tất cả các công cụ, chức năng chỉ trong một phần mềm nhỏ gọn.
Nhờ có ERP, doanh nghiệp có thể dễ dàng hơn trong việc thu thập, lƣu trữ, quản lý
thơng tin, dữ liệu, hỗ trợ trong q trình đƣa quyết định chiến lƣợc và đánh giá hiệu
quả kinh doanh. Là một phần mềm tích hợp đầy đủ các công năng mà một doanh
nghiệp cần đến, liên tục cập nhật các quy trình, hoạt động kinh doanh của các bộ phận
79



×