Vai trò của OLTP và OLAP trong hệ thống
thông tin quản lý doanh nghiệp (MIS)
Về cơ bản, chúng ta có thể chia dữ liệu trong một hệ thống IT thành hai mảng: Một
là dữ liệu giao dịch, hai là dữ liệu phân tích. Thông thường, dữ liệu OLTP sẽ là
nguồn dữ liệu cho OLAP để phục vụ cho mục đích phân tích dữ liệu chi tiết từ hệ
thống OLTP thành thông tin. Hình minh họa như sau:
- Dữ liệu giao dịch gọi là OLTP (Online Transaction Processing)
Ví dụ: một phần mềm kế toán, phần mềm bán hàng, phần mềm nhân sự, tiền
lương, … được
nhập liệu thường xuyên bởi những người dùng cuối và dữ liệu chi tiết tới từng
nghiệp vụ, mô hình thiết kế theo quan hệ thực thể, database thiết kế cho hệ thống
này thường được chuẩn hóa.
Nó được đặc trưng bởi một số lượng lớn giao dịch (insert, update, delete) trong
một thời gian ngắn, được thiết kế nhằm mục đích thu thập dữ liệu, duy trì tràng
buộc dữ liệu trong nhiều môi trường truy cập khác nhau, đo lường hiệu quả của mô
hình này chính là số lượng giao dịch trên giây.
- Dữ liệu Phân tích là OLAP (Online Analysis Processing): đặc trưng bởi khối
lượng tương đối thấp của các giao dịch. Thay vào đó, hệ thống này thường có
nhiều truy vấn để tính toán tổng hợp dữ liệu. Với hệ thống này, thời gian phản hồi
yêu cầu là đơn vị đo lường cho tính hiệu quả. Ứng dụng OLAP được sử dụng rộng
rãi bởi công nghệ Data Minning. Dữ liệu trong ứng dụng OLAP thường được lưu
trữ dưới dạng đã được tính toán, có tính lịch sử và theo mô hình đa chiều (multi-
dimensional) thường là mô hình hình sao (star schema).
Bảng tổng hợp so sánh giữ OLTP và OLAP:
Nội dung OLTP System
(Hệ thống hoạt động)
OLAP System
(Data warehouse)
Dữ liệ
nguồn
Dữ liệu hoạt động, do
người dùng cuối nhập
vào
Dữ liệu hợp nhât. Dữ liệu
OLAP đến từ nhiều nguồn
khác nhau của hệ thống OLAP
Mục đích
của dữ liệu
Để kiểm soát và chạy
các nghiệp vụ kinh tế
cơ b
ản, thiết yếu xảy ra
hàng ngày. Phục vụ
người dùng ở cấp hoạt
động trong doanh
nghiệp
Phục vụ mục đích lập kế
hoạch, giải quyết vấn đề, hỗ
tr
ợ ra quyết định. Phục vụ cho
các cấp bậc quản lý chiến
lượng.
Phản ánh
dữ liệu nào
Cho th
ấy một ảnh chụp
nhanh của các quá tr
ình
kinh doanh liên tục
Số liệu cung cấp góc nhìn đa
chiều các hoạt động kinh
doanh trong doanh nghiệp.
Thêm và
sửa dữ liệu
Thêm, s
ửa nhanh chóng
và được tạo bởi người
dùng cuối ở cấp hoạt
động.
Chạy theo chu kỳ, theo lô lớn
các giao dịch, như vào m
ột giờ
nh
ất định để tập hợp, tính toán
và làm mới dữ liệu.
Truy vấn
Liên quan đến các truy
vấn cơ bản, số lượng
dòng dữ liệu trả về ít.
Thường truy vấn với các câu
truy vấn tính toán phức tạp
dựa trên khối lư
ợng dữ liệu rất
lớn.
Tốc độ xử
Thư
ờng rất nhanh trong
Phụ thuộc vào khối lượng dữ
lý
một vài giây liệu cần xử lý và m
ột lần xử lý
một lô query để tập hợp và
tính toán dữ liệu có thể kéo d
ài
hàng gi
ờ đồng hồ. Tăng tốc độ
xử lý bằng cách tạo index và
các kỹ thuật design chuyên
nghiệp
Không gian
lưu trữ
Tương đối nhỏ nếu dữ
liệu lịch sử được cắt
giảm và lưu trữ thích
hợp
Thường rất lớn, do sự tồn tại
của dữ liệu tổng hợp mang
tính lịch sử, cần nhiều index
hơn so với OLTP
Thiết kế
database
Chuẩn hóa ở mức cao,
cần nhiều table
Thư
ờng không cần chuẩn hóa,
ít table hơn. Thư
ờng theo 2 mô
hình là Star hoặc Snowflake
Backup và
phục hồi
dữ liệu
Tín đồ của backup. Dư
liệu hoạt động là c
ực kỳ
quan trọng với hoạt
động kinh doanh nên
phải bảo trì backup cẩ
n
thận, việc mất mát dữ
liệu cũng đồng nghĩa
với việc mất mát thời
gian, tiền bạc và công
sức nhập liệu cũng nh
ư
liên quan đến trách
nhiệm pháp lý.
Thay vì phải backup đều đặn,
khi mất mát dữ liệu xảy ra,
nhiều hệ thống OLAP thường
chọn một phương pháp đơn
giản là load lại dữ liệu từ các
nguồn dữ liệu gốc ở các hệ
thống OLTP như là một giải
pháp phục hồi dữ liệu.
Theo Bigdata