Tải bản đầy đủ (.doc) (63 trang)

KIỂM TRA sự PHÙ hợp mô HÌNH QUÁ TRÌNH và NHẬT ký sự KIỆN BẰNG PHƯƠNG PHÁP PHÁT lại

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.27 MB, 63 trang )

KIỂM TRA SỰ PHÙ HỢP MÔ HÌNH QUÁ TRÌNH VÀ NHẬT KÝ SỰ
KI

N
BẰNG
PHƢƠNG
PHÁP PHÁT
L

I
Tóm tắt khóa luận
tốt
nghi

p:
Theo WMP Van der Aalst, 2011 [1], trong thập kỷ vừa qua, khai phá quá trình
hay còn gọi đầy đủ
hơn
là “khai
phá
dữ liệu
quá
trình”, nổi lên
như

một
lĩnh
vực nghiên cứu mới, tập trung vào phân tích quá trình dựa trên những dữ liệu sự kiện
sẵn có. Hiện nay, những nghiên cứu
trong
lĩnh vực này ngày càng trở thành một


chủ đề nóng, và
được
rất nhiều nhà khoa học trên thế giới quan tâm, nghiên cứu,
trong đó
nổi bật và có nhiều
đóng góp
hơn cả là nhóm của WMP Van der Aalst
và cộng sự tại
trường
đại học công nghệ Eindhoven. Kiểm tra sự phù hợp là một
trong ba bài toán chính của khai phá quá trình (bao gồm: phát hiện quá trình, kiểm
tra sự phù hợp, và
tăng cường
mô hình).
Dựa trên quá trình tìm hiểu một số nghiên cứu của WMP Van der Aalst và Anne
Rozinat [1, 6, 13, 14, 16] về một số
hướng
tiếp cận giải quyết bài toán kiểm tra sự
phù hợp, khóa luận trình bày về
hướng
tiếp cận dựa
trên phương pháp phát
lại,
một
hướng tiếp
cận tăng cường, trong đó thực
hiện phát lại từng dấu vết (phiên làm việc
của
người dùng trong hệ thống) trong nhật ký sự kiện. Đồng thời, khóa luận
cũng

đưa
ra
một
ý
tưởng thay đổi
về
việc
xác định không gian trạng thái
của mô hình
lưới
Petri trong quá trình phát lại.
Thực nghiệm mô hình giải quyết bài toán và ý tưởng thay đổi với plugin
Conformance Checker
được phát triển và tích hợp trong bộ công cụ mã nguồn mở
ProM 5.2 cho kết quả
độ đo precision trung bình tăng
lên.
Từ khóa: process mining, conformance checking, replay method.
CONFORMANCE CHECKING OF PROCESS MODEL AND EVENT
LOG
USING REPLAY
METHOD
Abtract:
According to WMP Van der Aalst, 2011 [1], in the last decade, Process mining
emerged as a new research field, that focus on process analysis based on the available
event data. Today, the research in this field has increasingly become a hot topic, and
received attention of many scientists around the world. The most active group of
scientists, which has many contributions in this field is group of WMP Van der Aalst
and colleagues at Technische Universiteit Eindhoven. Conformance checking is one of
the three major types of process mining (including: process discovery, conformance

checking, and enhance the model).
Based on learning some researches of WMP van der Aalst and Anne Rozinat [1,
6, 13, 14, 16] about some approaches to solving the conformance checking, this thesis
presents an approach based on the replay method. An enhanced approach,
implementation replay each trace (the session of the user in the system) in the event
log. At the same time, this thesis also gives an change of idea in defining state space of
Petri nets model during replay.
Experimenting problem solving model and change of ideas by Conformance
Checker plugin, which is developed and integrated on open source toolkit ProM 5.2,
result of increased average measurement precision.
Keywords: process mining, conformance checking, replay method.
Mục Lục
Mở
đ

u
1
Chương
1: GIỚI THIỆU CHUNG 3
1.1. Giới thiệu khái quát về khai phá quá trình 3
1.1.1.
Tổng
quan
về
khai phá quá
trình
3
1.1.2. Ba
bài toán chính trong
lĩnh vực khai phá quá t

rình
6
1.2. Giới thiệu bài toán
kiểm
tra sự phù hợp của mô hình quá trình và nhật ký sự
kiện
…………………………………………………………………………………
8
1.2.1. Giới thiệu
về
bài toán kiểm tra sự phù
h

p
8
1.2.2.
Tổng
quan một số nghiên cứu
về
bài toán
kiểm
tra sự phù
hợp
9
1.3. Một
số
khái
niệm cơ bản về
nhật ký sự kiện và mô hình quá
trình

10
1.3.1. Nhật ký sự
kiện
10
1.3.2. Mô hình quá
trình
11
1.3.3.
Mô hình quá trình được
biểu diễn bởi lưới Petri 14
1.3.4. Ánh xạ mô hình quá trình và nhật ký sự
kiện
16
1.4. Quan
hệ
giữa
kiểm
tra sự phù hợp với phù hợp kinh doanh và
kiểm t
oán
18
1.5. Một
số
ứng dụng khác của
kiểm
tra sự phù
h

p
19

1.6. Tóm
tắt chương
m

t 19
Chương
2: HƯỚNG TIẾP CẬN GIẢI QUYẾT BÀI TOÁN 20
2.1. Độ
đo đánh giá
sự phù hợp của mô hình quá trình và nhật ký sự
kiện 20
2.2.
Hướng
tiếp cận
dựa trên phương pháp phát
lại trong bài toán kiểm tra sự phù
hợp của mô hình quá trình và nhật ký sự
kiện.
23
2.2.1. Fitness 24
2.2.2.
Precision
29
2.2.3.
Structure
31
2.3. Tóm
tắt chương
hai
33

Chương
3: MÔ HÌNH GIẢI QUYẾT BÀI TOÁN 34
3.1. Giải thuật phát l

i 34
3.2. Phát biểu bài
toán
41
3.3. Mô hình giải quyết bài toán 42
3.4. Tóm
tắt chương ba
44
Chương
4: THỰC NGHIỆM 45
4.1. Dữ liệu thực
nghiệm
46
4.1.1. Dữ liệu sử
dụng trong bước
một của quá trình thực
nghiệm (DL1)
46
4.1.2. Dữ liệu sử
dụng trong bước
hai của quá trình thực
nghiệm
(DL2) 48
4.2. Thực
nghiệm
48

4.3. Kết quả thực
ngh
i

m
49
4.3.1. Kết quả thực
nghiệm
Bước 1 49
4.3.2. Kết quả thực
nghiệm
Bước 2 50
4.4.
Đánh
giá
51
Kết
luận

đ

nh

hướng
nghiên cứu tiếp theo 52
Tài liệu tham
khảo
53
Danh sách hình
v


Hình
1.1:
Vòng đời
BPM
6
Hình 1.2. Ngữ cảnh khai phá quá trình
6
Hình 1.3: Ba bài toán trong khai phá quá trình
8
Hình
1.4:
Ý
tưởng
của bài toán kiểm tra sự phù
hợp
8
Hình 1.5: Ví dụ nhật ký sự kiện
10
Hình 1.6: Ví dụ quá trình của một công ty
A

11
Hình 1.7: Mô hình quá trình trực quan của quy trình trong công ty A
12
Hình 1.8: Mô hình quá trình trực
quan

13
Hình 1.9: Ví dụ

mô hình
lưới
Petri 15
Hình 1.10: Minh họa không gian ánh xạ của mô hình và nhật ký sự
ki

n
17
Hình 2.1: Ví dụ
mô hình
lưới Petri mô tả quá trình bồi
thường
của một công t
y
20
Hình 2.2: Những nhật ký sự kiện của quá trình bồi
thườ
ng
21
Hình 2.3: Ví dụ về mô hình quá chính xác và quá chung
chung 21
Hình 2.4:
Những góc độ đánh giá
sự phù
h

p 22
Hình
2.5:
Ý

tưởng phương pháp phát
l

i
23
Hình 2.6: Quá trình phát lại của dấu vết
ABDEA

25
Hình 2.7: Quá trình phát lại dấu vết
ACHDFA 27
Hình 2.8: Minh họa quá trình xây dựng tập quan
h

30
Hình 2.9: Ví dụ
mô hình
lưới Petri có chứa các cấu trúc lặp,
ẩn.
32
Hình 3.1: Mô hình giải quyết bài t
oán 42
Hình 4.1: Nhật ký sự kiện L1 của DL1
46
Hình 4.2: Mô hình quá trình N1 của DL1
47
Hình 4.3: Mô hình quá trình N2 của DL1
47
Hình 4.4: Mô hình quá trình N3 của DL1
47

Hình 4.5: Mô hình quá trình N4 của DL1
47
Hình
4.6:
Đồ thị tổng hợp kết quả thực
nghiệm
Bước 1
49
Hình
4.7:
Đồ thị tổng hợp kết quả thực
nghiệm
Bước 2
50
Danh sách bảng
bi

u
Bảng 3.1: Ví dụ ánh xạ mô hình quá trình và nhật ký sự
kiện
43
Bảng 4.1: Cấu hình hệ
thống
thử
ngh
i

m

45

Bảng 4.2: Các phần mềm sử
d

ng

45
Bảng 4.3: Kết quả thực
nghiệm
Bước 1, với giải thuật phát lại
chưa thay đổi
49
Bảng 4.4: Kết quả thực
nghiệm
Bước 1, với giải thuật phát lại
thay
đ

i
49
Bảng 4.5: Kết quả thực
nghiệm
Bước 2, với giải thuật phát lại
chưa thay đổi
50
Bảng 4.6: Kết quả thực
nghiệm
Bước 2, với giải thuật phát lại
thay
đ


i
50
Danh sách các từ
viết
tắt
BPI Business Process Intelligence
BPM Business Process Management
PPM Process Performance Manager
WF Work Flow
WFM Work Flow Management
1
Mở
đ

u
Ngày nay, hầu hết các tổ chức
đều
tài liệu hóa quá trình sản xuất kinh doanh
theo một số mẫu (mô hình), nhằm trợ giúp
hoạt động
quản lý doanh nghiệp,
đồng
thời điều chỉnh, cải tiến
hoạt động
kinh doanh. Trong khi một số tổ chức chỉ trình
bày mô hình quá trình trên giấy, thì
nhiều
tổ chức
đã đầu tư khá
lớn vào công nghệ

mô hình hóa quá trình, và giờ
đây, kho dữ
liệu của các tổ chức này có thể có tới
hàng
trăm mô hình
quá trình. Ngoài ra những dữ liệu sự kiện
được
ghi nhận lại trong hệ
thống thông tin của những tổ chức
đó cũng ngày một tăng
lên, và
phản
ánh
tốt hơn
thực
tiễn quá trình hoạt
động
sản xuất kinh doanh của những tổ chức
đó.
Thực
tiễn
trên đặt
ra một
đòi hỏi
mới, dẫn tới hình thành và phát
triển hướng
nghiên cứu khai
phá quá trình (process mining), một nội dung tích hợp khai phá dữ liệu với quản lý
quá trình kinh doanh (business process management: BPM) nhằm phát hiện những
tri thức mới về quá trình kinh doanh, từ những dữ liệu ghi nhận quá trình kinh

doanh trong các nhật ký sự kiện (event logs). Kiểm tra sự phù hợp của mô hình quá
trình và nhật ký sự kiện là một bài
toán cơ bản
trong lĩnh vực khai phá quá trình.
Lý do cần phải
đặt
ra bài toán kiểm tra sự phù hợp là do: trong thực tiễn sản
xuất, kinh doanh của một tổ chức
nào
đó
,

những
quy trình thực tế khó có thể luôn
luôn giữ nguyên, không bao giờ
thay đổi,
mà trái lại, nó cần phải
được
cập nhật
thường
xuyên theo những yêu cầu mới, tức là chúng cần
được thay đổi
cho một mục
tiêu kinh doanh cụ thể. Trong
trường hợp đó,
các mô hình trong kho dữ liệu của tổ
chức
đó
không còn có thể
đảm

bảo
phản ánh đúng thực
tế sản xuất kinh doanh nữa.
Thậm chí ngay cả các hệ thống WFM (Work Flow Management: quản lý dòng công
việc),
trong đó
mô hình
quá trình được
sử dụng trực
tiếp để
thiết lập, cấu hình những
thi hành
quá trình
được
phép, độ
sai lệch vẫn có thể xảy ra. Vì vậy,
đặt
ra một
vấn đề
rất quan trọng là tự động kiểm tra tính thống nhất của mô hình quá trình hệ thống
với quá trình thực tế được phản ánh trong các nhật ký sự kiện.
Theo W.M.P. van der Aalst, 2011 [1], kiểm tra sự phù hợp có thể giúp kiểm
chứng tính thống nhất của mô hình quá trình và nhật ký sự kiện
tương
ứng. Bài toán
trả lời câu hỏi về sự phù hợp phát sinh khi cả hai yếu tố: nhật ký sự kiện và mô hình
quá trình đều đã
sẵn có
(hành
vi

được quan sát

hành
vi
được
mô hình hóa phù hợp
tốt với
nhau
như
thế
nào?). Nếu mô hình là mô hình mô tả hay mô hình quy tắc thì
kiểm tra sự phù hợp cung cấp một giải
pháp để đo lượng,
và xác định vị trí sai lệch.
Nếu
mô hình được
tạo ra thông qua bài toán phát hiện quá trình, thì kiểm tra sự phù
2
hợp trở nên quan
trọng để
thẩm
đ

nh

đánh
giá
chất
lượng của mô hình
được

phát hiện [6].
Trong khóa luận, chúng tôi sử
dụng phương pháp phát
lại nhật ký sự kiện trên
mô hình quá trình, dựa theo một số nghiên cứu của A. Rozinat và W.M.P. van der
Aalst [6, 13, 14],
để đo lượng cũng như đánh giá
sự phù hợp giữa mô hình quá trình và
nhật ký sự kiện đã cho. Theo đó, mỗi dấu vết (một phiên làm việc của
người
dùng
trong hệ thống) trong nhật ký sự
kiện được
phát lại tuần tự trên mô hình quá trình,
với mỗi lần phát lại, những tham số
để tính toán độ
phù
hợp, độ
chính xác của những
dấu
vết đó
so với mô hình
được
lưu lại. Cuối cùng dựa vào những công thức của
từng
độ
đo để
tính toán mức
độ
phù hợp chung cho cả nhật ký sự kiện với mô hình

quá trình. Đồng thời
chúng tôi cũng đề
xuất
một
ý
tưởng thay đổi
trong
việc
xác định
không gian
trạng thái trong phương thức
phát lại
để
có thể
thu được
những kết quả
phân
tích đầy
đủ

chính
xác hơn.
Nội dung của khóa
luận được chia thành các chương như
sau:
Chƣơng
1: Giới thiệu khái quát về lĩnh vực khai phá quá trình và bài toán kiểm
tra sự phù hợp của mô hình quá trình và nhật ký sự kiện (một trong ba bài toán chính
trong
lĩnh vực

khai phá quá trình). Ngoài
ra
chương này cũng trình bày
về một số
khái
niệm

bản
trong bài toán kiểm tra sự phù hợp, về quan hệ giữa kiểm tra sự
phù hợp với phù hợp kinh doanh và
hoạt động
kiểm toán kinh doanh của doanh
nghiệp. cũng
như
một
số
ứng dụng của bài toán
kiểm
tra sự phù hợp.
Chƣơng
2: Trình bày về
những độ đo

sở để đánh giá
sự phù hợp của mô
hình quá trình và nhật ký sự kiện. Đồng thời,
cũng trình bày
về
hướng
tiếp cận giải

quyết bài toán dựa trên
phương pháp phát
lại áp
dụng để
tính toán
những độ đo
đó.
Chƣơng
3:
Chương
này
trình bày
về giải thuật phát lại,
đưa
ra ý
tưởng thay
đổi trong giải thuật phát lại
đó,
và xây dựng mô hình giải quyết bài toán.
Chƣơng
4: Trình bày giải pháp thực
nghiệm đánh
giá sự phù hợp của mô hình
quá trình và nhật ký sự kiện,
cũng như đánh giá
ý
tưởng thay đổi
với thực nghiệm dựa
trên việc thay đổi
phương

thức phát lại của plugin Conformance Checker trong bộ
công cụ mã nguồn mở ProM 5.2.
Phần
kết
luận: Tóm lược kết quả
đạt được
của khóa luận và định hướng phát
triển tương lai
.
3
Chƣơng
1: GIỚI THIỆU CHUNG
1.1. Giới
thiệu
khái quát
về
khai phá quá trình
1.1.1.
Tổng
quan
về
khai phá quá trình
Khai phá quá trình (process mining) là một chuyên ngành nghiên cứu mới, phát
triển mạnh mẽ trong thập kỷ gần đây. Theo WMP Van der Aalst, 2011 [1], khai phá
quá trình là
một
lĩnh vực nghiên cứu
đặt
giữa học máy và khai phá dữ liệu ở một bên
và mô hình hóa và phân tích quá trình ở bên kia, nhằm

chiết xuất thông
tin có giá trị,
liên
quan đến quá trình
từ
các nhật
ký sự kiện,
bổ sung
các
phương pháp tiếp cận
hiện có tới
quản

quá
trình kinh doanh (Business Process Management: BPM).
Khai phá
quá trình đóng một
vai trò quan trọng là cầu nối giữa khai phá dữ liệu và
mô hình hóa quá trình, một thành phần của quản lý quá trình kinh doanh.
Theo Michael Hammer, 2010 [5],
quản

quá trình
kinh
doanh được
thể hiện cả
ở mặt quản lý lẫn ở mặt công nghệ. Về mặt quản lý, quản lý quá trình kinh doanh là
cách tiếp cận có hệ thống nhằm giúp các tổ chức, doanh nghiệp tiêu chuẩn hóa và tối
ưu
hóa

các quy trình
hoạt động
với mục
đích giảm
chi phí,
tăng chất
lượng
hoạt
động
nhằm đạt được
các mục tiêu cần thiết. Về mặt công nghệ, quản lý quá trình kinh
doanh là bộ công cụ trợ giúp tổ chức, doanh nghiệp thiết kế, mô hình hóa, triển
khai, giám sát, vận hành và cải tiến các quy trình kinh doanh linh hoạt. Có thể coi
quản lý quá trình kinh doanh là công nghệ
thúc
đẩy hợp tác giữa công nghệ
thông
tin và người dùng nhằm xây dựng các ứng dụng có khả
năng tích hợp con người,
quy
trình và thông tin trong
tổ
chức, doanh nghiệp
Có hai yếu tố chính
khiến
lĩnh vực khai phá quá trình ngày càng
nhận được
nhiều sự quan tâm. Một mặt, ngày càng có nhiều dữ liệu sự
kiện được
ghi nhân lại

trong các hệ thống thông tin, giúp cung cấp
tốt hơn những
thông tin chi tiết về quy
trình thực tế, và
mặt
khác,
đó

do
yêu
cầu
đặt ra cần phải hỗ trợ và cải tiến những
quy trình kinh
doanh trong
m
ô
i

trường
kinh doanh cạnh tranh và có
nhiều thay
đ

i
nhanh chóng
như hiện nay.
Cũng theo
WMP Van der Aalst, 2011 [1], dưới không gian chung của lĩnh vực
kinh doanh thông minh (Business Intelligence – BI), có nhiều thuật ngữ thông
dụng

đề
cập đến
những kỹ
thuật được
sử dụng trong việc phân tích, hỗ trợ và cải tiến quy
trình kinh doanh
như
:
Theo dõi
hoạt
động kinh doanh (Business Activity
Monitoring – BAM)
đề cập đến
kỹ thuật cho phép theo dõi quy trình thời gian thực,
Xử lý sự kiện
4
phức tạp (Complex Event Processing – CEP)
đề cập đến
kỹ thuật xử lý với
một
lượng
sự kiện lớn, sử
dụng chúng
để theo dõi, chỉ đạo, và tối ưu
hóa
kinh
doanh,
Quản lý
hiệu suất công ty (Corporate Performance Management – CPM) đề cập
đến

cách
đo lượng hiệu suất của một quy trình hay tổ chức.
Ngoài
ra
cũng có những
thuật ngữ
khác liên
quan đến
hướng quản lý quá trình kinh doanh
như
:
Cải tiến quá trình
liên tục (Continuous Process Improvement – CPI), Cải tiến quá trình kinh doanh
(Business Process Improvement – BPI), Quản lý
chất
lượng toàn diện (Total
Quanlity Management – TQM), và Six Sigma – một triết lý quản lý, quản trị dựa theo
quá trình
hơn

theo chức năng,

đưa
ra
quyết
định dựa theo những sự kiện thực tế
chứ không phải cố hữu.
Những phương pháp trên đều

điểm

chung là các quá trình
luôn là đối
tượng được xem xét để
tìm ra những cải tiến có thể. Khai phá quá trình là
một kỹ thuật
thúc đẩy
CMP, BPI, TQM, Six Signa và
những phương pháp tương
t

.
Trong thập kỷ
gần
đây,
dữ
liệu sự
kiện đã trở
nên sẵn có, và những kỹ thuật
khai
phá quá
trình đã
phát
triển nhanh chóng. Hơn nữa như đã đề cập,
những
xu
hướng
quản
lý liên
quan đến
cải tiến quy trình

(như
Six
Sigma,
TQM, CPI, và CPM)
và tuân thủ (BAM) có thể
được
hưởng lợi từ khai
phá quá
trình. Do đó, không ít
thuật toán khai
phá quá trình đã được
thực thi trong nhiều hệ
thống thương
mại hay
phi
thư
ơng
mại khác nhau nhằm trợ giúp cho
những
xu
hướng
quản lý kinh doanh.
Hiện nay, một nhóm tích cực những nhà nghiên cứu làm việc
trong
lĩnh vực khai
phá quá trình (IEEE-TfoPM: xin xem dưới đây) và nó đã trở thành một trong
những chủ đề nóng trong nghiên cứu Quản lý quy trình kinh doanh (Business
Process Management - BPM).
Hơn nữa,
cũng

có một sự quan tâm rất lớn từ ngành công
nghiệp đến
lĩnh vực
khai phá quá trình. Và càng ngày càng có nhiều nhà cung cấp phần mềm bổ xung
thêm chức năng khai phá quá trình vào công cụ của họ. Ví dụ như ARIS
Process Performance Manager (Software AG), Process Discovery Focus
(Iontas/Verint),
Comprehend (Open Connect), Flow (Fourspark), Interstage Automated Process
Discovery (Fujitsu), OKT Process Mining suite (Exeura), ProcessAnalyzer (QPR),
ProM (TU/e), Reflect|one (Pallas Athena), Rbminer/Dbminer (UPC).
Sự
quan tâm tăng
lên
trong phân
tích
quá
trình đã
thúc
đẩy việc thành lập
Đội đặc nhiệm IEEE về khai phá quá trình (IEEE Task Force on Process Mining:
IEEE- TFoPM). Kể từ khi IEEE-TFoPM
được
thành lập
năm 2009 bởi
Ủy ban kỹ
thuật khai phá dữ liệu (Data Mining Technical Committee – DMTC) trong Hiệp hội
CIS – Computational Intelligence Society của Viện IEEE – Institute of
Electrical and
5
Electronic Engineers, IEEE-TFoPM hiện tại đã thu hút được sự tham gia của nhiều

nhà cung cấp phần mềm (ví dụ, Pallas Athena, Software AG, Futura Process
Intelligence, HP, IBM, Infosys, Fluxicon, Businesscape, Iontas/Verint, Fujitsu, Fujitsu
Laboratories, Business Process Mining, Stereologic) những công
ty
tư vấn (ví dụ:
ProcessGold, Business Process Trends, Gartner, Deloitte, Process Sphere, Siav SpA,
BPM Chile, BWI Systeme GmbH, Excellentia BPM, Rabobank) và những trường-
viện nghiên cứu (ví dụ, TU/e, University of Padua, Universitat Politècnica de
Catalunya, New Mexico State University, IST - Technical University of Lisbon,
University of
Calabria, Penn State University, University of Bari, HumboldtUniversität zu Berlin,
Queensland University of Technology, Vienna University of Economics and Business,
Stevens Institute of Technology, University of Haifa, University of Bologna, Ulsan
National Institute of Science and Technology, Cranfield University, K.U. Leuven,
Tsinghua University, University of Innsbruck, University of Tartu).
Đã

rất nhiều những
hoạt động khác được
tổ chức liên
quan đến
chủ
đề
trên.
Ví dụ
như đã có một
số hội
thảo được
IEEE-TFoPM tổ chức
hay đồng

tổ chức. Ví dụ
như những hội thảo về quy trình kinh doanh thông minh (Business Process
Intelligence – BPI: BPI 2009, 2010, 2011, 2012, 2013) và những hội nghị chính
của
IEEE
như CIDM 2011. Ngoài những hội thảo và hội nghị, kiến thức về khai
phá quá trình
cũng được phổ biến thông qua những hướng dẫn (WCCI 2010 và
PMPM 2009), những trường hè (ESSCaSS 2009, ACPN 2010, CICH 2010), những
video qua trang web www.proc e

s s

m in i

ng.o rg

, và một số ấn phẩm gần đây về khai
phá quá trình trên Springer. IEEE-TFoPM còn tổ chức và
đồng
tổ chức những cuộc
thi Business Process Intelligence Challenge (BPIC 2011, 2012, 2013) nhằm yêu cầu
những đội tham gia phải trích
xuất được
những thông tin hữu ích từ lượng lớn những
nhật ký sự kiện phức tạp.
Trong năm
2010, IEEE-TFoPM còn chuẩn hóa XES
(w


ww.xes s

tandard. o

rg )

, một chuẩn định dạng nhật ký sự kiện và được hỗ
trợ bởi thư viện OpenXES (www.ope n

xes.org ) và những công cụ như ProM,
XESame, Nitro, vv. Những thông tin thêm về những
hoạt
động của IEEE-TFoPM
có thể tham khảo tại trang web
www.win .

tue.nl/ie e

et f

p m /

.
6
1.1.2. Ba
bài toán chính trong lĩnh vực
khai phá quá trình
Trước khi
đề
cập tới các bài

toán chính trong
lĩnh vực khai phá quá trình, chúng
ta xem xét mô hình quá trình có ảnh
hưởng như thế
nào trong quy trình quản lý kinh
doanh [1].
Hình 1.1: Vòng đời
BPM
Hình 1.1 cho thấy
vòng đời
BPM mô tả
các
giai
đoạn
khác nhau của việc quản lý
quá trình kinh
doanh. Trong đó, mô hình quá trình đóng
vai
trò chủ đạo
trong các giai
đoạn
thiết kế (lại) và cấu hình/thực hiện, trong khi dữ liệu
đóng
một vai trò chủ đạo
trong
các giai
đoạn
ban hành/ giám sát và chẩn đoán/ yêu cầu. Theo WMP Van der
Aalst [1],
cho đến

gần
đây mới
có một vài liên kết giữa dữ
liệu được
sinh ra khi thực
hiện quá trình với quá trình
được
thiết kế thực tế. Thực tế trong hầu hết tổ chức thì
giai
đoạn
chẩn đoán/ yêu cầu
không được
hỗ trợ một cách có hệ thống và liên tục.
Do đó khai phá quá trình cần phải cung cấp khả
năng
để thực sự “làm
đóng
kín”
vòng
đời BPM. Dữ liệu
được
các hệ thống thông tin ghi lại có thể
được
sử
dụng
để
cung cấp một cái nhìn
tốt hơn
lên các
quá trình thực

tế, tức là những sai lệch có thể
được
phân tích và chất lượng của các mô hình có thể
được
cải thiện.
Hình 1.2. Ngữ cảnh khai phá quá
trình
7
Hình 1.2 cho thấy khai phá quá trình thiết lập các liên kết giữa các quá trình thực
tế và dữ liệu ở một bên và các mô hình quá trình ở bên kia. Hệ thống thông tin ngày
nay phải
đối
mặt với sự gia
tăng không ngừng
cả về mặt số hóa và vật lý (công nghệ
vật liệu). Nhất là về mặt số hóa, hệ thống thông tin ngày nay ghi lại nhật ký với số
lượng rất lớn các sự kiện. Các hệ thống WFM cổ
điển (chẳng hạn,
Staffware và
Cosa), các hệ thống BPM (chẳng hạn, BPM|One của Pallas Athena,
SmartBPM của Pegasystems, FileNet, Global 360 và
TeamWork
của Lombardi
Software), hệ thống ERP (chẳng hạn, SAP Business Suite, Oracle E -Business
Suite, và Microsoft Dynamics
NAV
)…
c
un
g


cấp một lượng thông
tin chi tiết rất
lớn về các
hoạt động
đã
được
thực hiện trong quy trình sản xuất kinh
doanh.

với
lượng thông
tin vô tận chứa
nhiều
tri thức hữu ích đó, yêu cầu đặt ra là làm
sao
chúng ta
có thể sử dụng
chúng để thu nhận được những thông
tin
cần thiết

hỗ
trợ, cải
tiến thực tiễn quá
sản
xuất
kinh
doanh.
Từ

đó theo
WMP Van der Aalst
[1], khai phá quá trình bao gồm ba
bài toán chinh:
Bài toán thứ
nhất
là bài toán “phát
hiện
quá trình”. Đây là
một

thuật
phát
hiện quá trình từ nhật ký sự kiện và tạo ra một mô hình quá trình mà không sử dụng
bất cứ một thông tin tiền nghiệm nào. Đối với các doanh nghiệp,
đây
là điều khá bất
ngờ vì việc có thể phát hiện những quá trình thực chỉ
đơn thuần
dựa trên những ví dụ
hành
vi
được
lưu
trữ
trong những nhật ký sự kiện.
Bài toán thứ hai là bài toán
“kiểm
tra sự phù
hợp”.

Ở bài toán này một mô hình
quá trình hiện có
được
so sánh với một nhật ký sự kiện
tương
ứng với nó. Quá trình
kiểm tra sự phù hợp có thể
được dùng để
kiểm tra xem quá trình thực tế -
được
ghi
lại trong một nhật ký và
mô hình quá trình được
mô hình hóa, có thống nhất với nhau
hay không và có thể
đưa
ra
những điểm
sai
lệch để hỗ
trợ việc cải tiến quá trình.
Khóa luận "Kiểm tra sự phù hợp mô hình quá trình và nhật ký sự kiện
bằng phương
pháp
phá
t
lại" tiến hành nghiên cứu, phân tích giải pháp giải quyết bài toán thứ hai.
Nội dung bài toán thứ hai sẽ
được
giới thiệu chi

tiết hơn
ở mục tiếp theo.
Bài toán thứ ba là bài toán
“tăng cƣờng
mô hình”. Bài
toán này hướng
tới việc
cải tiến hay mở
rộng
mô hình
trước
đó. Ví dụ như, bằng cách sử dụng các mốc
thời gian trong những nhật ký sự kiện, ta có thể mở
rộng mô hình để
có thể cho thấy
những phần tắc nghẽn, mức
độ
phục vụ và thời gian thực hiện giữa chúng.
8
Hình 1.3: Ba bài toán trong khai phá quá
trình
1.2. Giới
thiệu
bài toán
kiểm
tra sự phù hợp của mô hình quá trình và
nhật ký sự ki

n
1.2.1. Giới

thiệu về
bài toán
kiểm
tra sự phù hợp
Bài toán “kiểm tra sự phù hợp” là một trong ba bài toán chính
của
lĩnh vực khai
phá quá trình. Trong bài toán này, một mô hình quá trình hiện có
được
so sánh với
một nhật ký sự
kiện tương
ứng với nó. Quá trình kiểm tra sự phù hợp có thể
được
dùng
để kiểm tra xem quá trình thực tế -
được
ghi lại trong một nhật ký và mô hình
quá trình
được
mô hình hóa, có thống nhất với nhau hay không và có thể
đưa
ra
những điểm
sai
lệch để hỗ
trợ việc cải tiến quá trình.
Hình 1.4: Ý tưởng của bài toán kiểm tra sự phù
hợp
Với ý

tưởng
so
sánh
mô hình
quá
trình được mô hình hóa và nhật ký sự kiện
tương ứng
để kiểm tra tính thống nhất giữa chúng, những hành vi của mô hình
quá
9
trình

hành
vi
được
ghi lại trong nhật ký sự
kiện được so sánh để tìm
ra
điểm
tương
đồng và khác biệt. Sự thể hiện của không phù hợp phụ thuộc vào mục đích của mô
hình. Nếu
mô hình được
đ

nh

hướng để
mô tả, thì những khác nhau giữa mô hình và
nhật ký sự kiện thể hiện rằng mô hình

cần được
cải
thiện để đạt được
tính thực tế cao
hơn. Nếu mô hình mang tính tiêu chuẩn, thì những khác biệt có thể
được
giải thích
theo
2
hướng.
Một số khác
biệt được
tìm thấy có thể thể hiện những chênh lệch
không mong muốn, tức là kiểm tra sự phù hợp cho thấy nên cải
tiến quy trình để

thể điều khiển quy trình
tốt hơn.
Những khác biệt khác có thể thể hiện những chênh
lệch mong
muốn.
Ví dụ
như
ngườ
i

lao động
có thể sai
lệch để
phục vụ khách hàng

tốt
hơn, hay
xử lý những tình
huống không lường trước được
trong mô hình quá trình.
Trong thực tế tính linh hoạt và không phù
hợp thường tương quan tích
cực lẫn nhau.
Khi kiểm tra sự phù hợp, điều quan
trọng
là xem xét
độ
lệch từ hai
góc độ:
(a)
mô hình sai và không
phản ánh đúng thực
tế (làm thế
nào để
cải tiến mô hình?) và (b)
những trường hợp
đi lệch khỏi mô hình và
những hành động
khắc phục cần thiết.
(làm
sao để
cải tiến sự
điều khiển để
thực thi sự phù hợp
tốt hơn?),


thuật
kiểm tra
sự phù hợp nên
hỗ
trợ cả 2
quan điểm
này.
1.2.2.
Tổng
quan
một số
nghiên cứu
về
bài toán
kiểm
tra sự phù
hợp
Kiểm tra sự phù hợp khởi
đầu
từ nghiên cứu của Cook và cộng sự [7],
ngườ
i
đã
giới thiệu các khái niệm
về thẩm
định quá trình.
Họ đề
xuất một kỹ thuật so sánh
luồng sự kiện trong mô hình quá trình với luồng sự kiện trong nhật ký thực thi

dựa
trên
đánh giá sự khác biệt giữa hai chuỗi. Những khái niệm về sự phù
hợp cũng
được
thảo luận trong bối cảnh bảo
mật
và an ninh [8], điều chỉnh kinh doanh [10]
và khai phá di truyền [9, 3]. Nhiều nghiên cứu
gần đây
về khai phá di
truyền cũng đề
cập đến vấn
đề mô hình quá trình tạo ra quá nhiều hành vi và thí nghiệm với việc
giới
thiệu
(và đánh giá) của những hành vi trùng lặp trong
những hành
vi
quan sát
được đó
[17]. Ngoài ra
cũng có một số
nghiên cứu:
dựa trên hướng
tiếp cận khai phá
mờ (Fuzzy mining [18].
Khai phá quá trình và kiểm tra sự phù hợp có thể
được
thấy trong bối cảnh

rộng
hơn
của quản lý doanh nghiệp, quá trình kinh doanh thông minh,
được
đề cập
trong hội nghị BPI 2010 [2], và giám sát
hoạt
động kinh doanh.
Ngoài
ra
cũng

một số công cụ BPI, thiết lập dựa trên quy trình quản lý của công ty HP
được
thực
thi [11]. Bộ công cụ BPI bao gồm một công nghệ
được
gọi là “BPI
Process
Mining
Engine”. Zur Muehlen
cũng
mô tả bộ công cụ PISA, có thể
được
sử
dụng để
trích
xuất giá
tr


hiệu xuất từ những nhật ký luồng công việc [12]. Phát
hiện tương tự được
10
đưa
ra bởi
11
ARIS Process Performance Manager (PPM). Công cụ này sau đó
mang
tính
thương mại và có một phiên bản tùy biến
của
PPM là
Staffware Process Monitor
(SPM), được thiết kế
theo hướng
Staffware
1
. Những công cụ này hỗ trợ kiểm tra sự
phù
hợp
nhưng
thường

đo
lường
hiệu năng chứ
không chú
trọng đến
giám sát
những hành vi mong

muốn
hay không mong muốn.
1.3.
Một số
khái
niệm cơ bản về
nhật ký sự
kiện
và mô hình quá trình
1.3.1. Nhật ký sự
ki

n
Như đã trình bày, dữ liệu đầu
vào cho khai phá quá trình là nhật ký sự kiện, chứa
đựng dữ liệu sự kiện về quá trình theo cấu
trúc
quy
đ

nh

nào
đó. Cụ thể, dữ liệu sự
kiện được
lưu
trữ
trong nhật ký sự kiện có
cấu trúc như
sau:

Hình 1.5: Ví dụ nhật ký sự kiện
1
https://doc s

.tibco. co

m /

pub/iproce ss

-engi n

e/1 1

.1. 0

-sept e

mber-20 0

9/ p

d f

/ t

ib-iproces s

-
objects-ser v


er-a d

m i

nis t

rator s

-guid e

.pdf
12
Từ cấu trúc nhật ký sự kiện trong Hình 1.5, có thể
đưa
ra giả định rằng một quá
trình (process) có
thể
bao
gồm nhiều trường
hợp (cases)
hay cũng có thể
gọi là dấu
vết, chúng thể hiện một phiên làm việc
của người
dùng trong hệ thống.
Một trường
hợp có thể chứa nhiều sự kiện
(events) được
sắp xếp theo trình tự, mỗi sự kiện chứa

một số thuộc tính (attributes). Chẳng hạn như ở ví dụ trên, các thuộc
tính điển
hình
t


ng
thấy là tên
hoạt
động (activity), thời gian (time), chi phí
(
cost)

.
Tuy
nhiên không phải lúc nào tất cả các sự
kiện đều
chứa cùng một tập thuộc tính. Các sự
kiện liên quan
đến
cùng một
hoạt động
thì có cùng tập các
thuộc
tính.
Theo WMP Van der Aalst [1], có thể tổng quát hóa nhật ký sự kiện trên về dạng
nhật ký sự
kiện đơn giản được
đ


nh

nghĩa một
cách toán
học như
sau:
• Cho A là một tập
những hành
động trong nhật ký sự kiện, một dấu
vết
σ là
một chuỗi
những hành động,
tức là σ ϵ A*. Một nhật ký sự
kiện đơn giản
L

một đa tập
(multi-set) trên tập A tức là L ϵ B (A*).
Trong đó khái niệm đa tập
trên tập A có thể
hiểu như

nhật
ký sự
kiện đơn
giản L là một tập hợp của những dấu
vết
σ,
trong đó mỗi

dấu
vết
σ
được
thể hiện
kèm
ch

số số
lần dấu
vết đó được
thực thi trong nhật ký sự kiện.
Ví dụ: A = { a,b,c,d,e}, có ba dấu
vết
σ
1
= (a,b,c,d) xảy ra 3 lần, σ
2
= (a,c,b,d)
xảy ra 2
lần,
và σ
3
= (a,e,d) xảy ra 1
lần,
khi
đó
L
được
biểu

diễn như
sau:
L=[ (a,b,c,d)
3
, (a,c,b,d)
2
, (a,e,d)]
1.3.2. Mô hình quá trình
Để
tường minh hơn
khái niệm mô hình quá trình, xem xét một ví dụ minh họa
sau về quy trình hệ thống phục vụ khách hàng của một công ty A. Khi khách hàng có
vấn đề
với sản phẩm,
họ
liên
hệ
với trung tâm tiếp nhận
cuộc
gọi của công ty này.
Hình 1.6: Ví dụ quá trình của một công ty A
13
Như
mô tả
trên Hình 1.6,
công ty đó

một
bộ phận “Front office” có kiến
thức chung và có thể

đối
phó với hầu
hết
các
trường
hợp chung và
đơn
giản. Nếu
một vấn đề không thể giải quyết
được
bởi “Front office”, khách hàng sẽ
được
giới
thiệu đến một “Back office” chuyên môn. Với mỗi cuộc gọi
đến,
chúng có một mã
số yêu cầu dịch vụ duy nhất, mà có thể
được
dùng trong những lần gọi sau của khách
hàng để
lưu lại trong quy trình phục vụ hoàn chỉnh. Nếu một sản phẩm thực sự cần
sửa chữa và vẫn còn bảo hành, khách hàng
sẽ nhận được
một mã
số
sửa chữa duy
nhất và sản phẩm
đó được
gửi
đến

cửa hàng sửa chữa. Ở
đó,
các sản
phẩm đầu
vào
được
sửa chữa nếu có thể, nếu sửa chữa thành công, nó cần phải
được kiểm tra trước
khi sản
phẩm
được
chuyển
lại cho khách hàng. Theo nguyên tắc
chất
lượng,
kiểm
tra
này không
được
thực hiện bởi
người
cùng tham gia sửa chữa. Nếu không thể sửa
chữa, thì khách hàng sẽ
nhận được
một sản phẩm mới
để
thay thế.
Mô hình quá trình mô tả quy trình
hoạt động
trên của công ty A:

Hình 1.7: Mô hình quá trình trực quan của quy trình trong công ty A
Để
đơn giản mô hình này được
mô tả bởi môt số kí hiệu và cấu trúc không
chính quy. Trong thực tế, có nhiều ngôn ngữ
mô hình hóa khác nhau, như Business
Process Modeling Notation (BPMN), Event-driven Process Chains (EPCs), Unified
Modeling Language (UML) Activity diagrams, Petri Nets, Yet Another Workflow
Language
(YAWL).
14
Trước khi xem xét một mô hình quá trình từ một ngôn ngữ mô hình hóa cụ thể,
chúng ta xem xét mô hình quá trình ở mức tổng quan và xem xét một số cấu trúc
chung, xuất hiện khi ánh xạ mô hình quá trình với nhật ký sự kiện. Trong khai phá
quá trình, có một tình
huống thường
gặp là mô hình quá trình và nhật ký sự kiện liên
quan
đến
cùng
một quá trình tương
tự,
do đó
cần thiết lập một ánh xạ
tương
ứng giữa
chúng. Đó là
một trường
hợp, ví dụ, khi
một mô hình quá trình được

phát hiện từ
nhật ký sự kiện, hay khi
một mô hình trước đó
cần
được
so sánh với nhật ký sự
kiện
được
quan sát của mô hình quá trình.
Để thiết lập một quan hệ giữa những mô hình quá trình và nhật ký sự kiện, một
số khái
niệm
cơ bản
được
giới thiệu. Trong một mô hình quá trình trực quan, những
tác vụ thể hiện những hành
động
trong quá trình thực tế
được
quan sát, và những tác
vụ này
được
gán với
một nhãn,
đại diện cho
những hành
vi
quan
sát
được

kích hoạt
khi những tác vụ
này được
thực thi.
Định nghĩa
1.1 (Mô hình quá trình trực quan): Một mô hình quá trình trực quan
là một bộ ba (T, L, l )
trong
đó:
 T là tập hữu hạn các tác vụ.
 L là tập hữu hạn các nhãn
 l() là một hàm ánh xạ từ tập tác vụ
đến
tập nhãn.
Hình 1.8: Mô hình quá trình trực quan
Xem xét các mô hình quá trình trực
quan được
mô tả trong Hình 1.8, mô hình
bao gồm 6 tác vụ, tức là T = {t1, t2, t3, t4, t5, t6}, có liên
quan
đến
hoạt
động của
“Front office” và “Back office”. Trong thủ tục
được
mô tả, một cuộc gọi
được
chuyển
15
từ “Front office” sang “Back office” chỉ sau khi nhận

được
ý kiến của
chuyên
gia tư
vấn. Hầu hết những tác vụ
trong mô hình quá trình được
gán cho môt nhãn, mô tả ở
góc bên phải. Các nhãn này thể hiện cho mã
hành động
được ghi lại bởi hệ thống
thông tin trong trung tâm tiếp nhận cuộc gọi nếu các
hoạt động tương ứng được
thực
thi. Ví dụ,
nhãn được
gán với tác vụ
„Redirect
to Back Office‟ là R,
tức
là l(t4) = R.
tổng cộng, có ba nhãn khác
nhau được
gán cho những tác vụ trong mô hình {F, P, R}

L.
Bởi vì l() là một hàm thành phần, có thể có những tác vụ trong mô hình không
được gán nhãn
.

do đó

không thể
được
quan sát trong nhật ký sự kiện. Các tác vụ
không nằm trong tập những tác vụ
được
gán nhãn bởi ánh xạ l(),
được
gọi là tác vụ
ẩn,
ngược
lại những tá vụ
được gán nhãn được
gọi là tác vụ hiện.
Trong ví dụ trên, chỉ có t2 là tác vụ ẩn, các tác vụ khác là tác vụ hiện.
Hơn nữa, có thể có nhiều tác vụ trong mô hình quá trình có cùng nhãn, chúng
được
gọi là những tác vụ trùng lặp và sự xuất hiện của chúng không
thể được
phân
biệt trong nhật ký sự kiện. chú ý rằng, tác vụ trùng lặp chỉ xuất hiện từ quá trình gán
nhãn, kể từ khi tác vụ của mô hình quá trình tự phân
biệt
được (có thể không
bằng tên,
nhưng bằn
định danh của chúng hay vi trí duy
nhất trong đồ
th

).

Trong ví dụ trên, t1 và t5, t3 và t6 là những tác vụ trùng lặp, chú ý rằng những
tác vụ trùng lặp luôn là tác vụ hiện.
1.3.3.
Mô hình quá trình đƣợc biểu diễn bởi lƣới
Petri
Lưới Petri [15] được coi là một mô hình quá trình bao gồm một tập thanh
chuyển, một tập vị trí và một
tập cung có hướng
nối các thanh chuyển và các vị trí
với nhau.
Trong đó, thanh
chuyển là một thành phần trong mô hình, liên
quan đến
một tác vụ hay
hành động nào đó
có thể
được
thực thi trong quá trình và
được
biểu
diễn bởi hình chữ nhật. Vị trí
được
thể hiện bởi vòng tròn và có thể giữ một hay
nhiều thẻ (thẻ
được
biểu diễn bởi một
chấm đen),
sự phân phối của các thẻ trên các
vị trí của mô hình
thể

hiện trạng thái
của mô hình
đó.
Thanh chuyển được kích hoạt khi tất cả các vị trí vào của nó (những vị trí có
cung vào thanh
chuyển đó) đều
chứa ít nhất một thẻ. Và nếu thanh
chuyển được
kích
hoạt, nó có thể cháy. Quá trình cháy thanh chuyển là quá trình tiêu thụ một thẻ ở
mỗi vị trí vào, và sinh ra một thẻ ở mỗi vị trí ra của thanh
chuyển đó
(những vị trí mà
thanh
chuyển đó có cung
ra).
16
Bằng cách này, quá trình cháy thanh chuyển có thể làm
thay
đổi các
đánh
dấu
trong
lưới Petri (tức là
thay đổi
sự phân bố các thẻ trên các vị trí trong mô hình), và
do
đó trạng
thái
của quá trình cũng được thay đổi. Điều này làm cho mô hình

lưới Petri

tính động,
khi nó có thể
thay đổi
trạng thái sau mỗi quá trình cháy thanh chuyển
khác nhau.
Hình 1.9: Ví dụ mô hình lưới Petri
Hình 1.9 mô tả
một
mô hình lưới Petri của quá trình phục vụ khách hàng
đang
được
xét. Tại trạng thái khởi
đầu,
có thể thấy một thẻ trong vị trí
đầu
tiên của
mô hình.
17
Khi thanh chuyển với ký hiệu A cháy, thẻ này sẽ được tiêu thụ và một thẻ khác sẽ
được
sinh ra và
đặt
tại vị trí ra của thanh
chuyển
A. Sau
đó
có một sự lựa chọn giữa
B và C, bởi chỉ có một trong hai thanh chuyển này có thể cháy.

Bằng cách
này, lưới
Petri có thể mô hình hóa cấu trúc lựa
chọn. Tương tự như
vậy,
nhiều
nhánh có thể
được
kích hoạt trong cùng một thời điểm được minh họa trong phần được bôi
sáng với nhãn “parallel split”. Khi thanh chuyển cháy, hai thẻ sẽ
được
sinh ra (mỗi
thẻ cho một vị trí ra), cho phép kích hoạt
những hành động độc
lập
trong
hai
nhánh
đó. Trạng thái của mô hình quá trình chỉ
được
thể hiện qua sự phân phối của các
thẻ trên những vị trí trong mô hình. Mặc dù lưới Petri được thể hiện
bằng
đồ họa
như
trên
hình vẽ, tuy
nhiên, chúng cũng có những
đ


nh

nghĩa toán học
chính xác
trong ngữ cảnh thực thi của
nó,

do đó nó cũng có thể hoàn toàn được
sử dụng mà
không cần
thể hiện đồ
họa.
Lưới Petri là một hình thức mô hình hóa thú vị, nó cung cấp một cân bằng tốt
giữa mô hình hóa và khả
năng phân tích
[1]. Để phục vụ bài toán kiểm tra sự phù
hợp,
đ

nh

nghĩa
của lưới Petri
được
gán nhãn
được đưa
ra. Một biến thể của lưới
Petri cổ
điển,
mô tả

tốt hơn những hành động
tổng quát của những
hệ thống đồng
thời.
Định nghĩa
1.2 (Lưới Petri được gán nhãn): Lưới Petri
được
gán nhãn là một bộ
năm
P
N
= (P, T, F, L, l)
trong
đó
• P là tập hữu hạn những vị trí.
• T là tập hữu hạn những thanh
chuyển
P∩T = Ø.
• F là tập hữu hạn các cung F ⊆ (P×T)∪ (T×P).
• L là tập các nhãn.
• l là một hàm gán nhãn cụ thể.
1.3.4. Ánh xạ mô hình quá trình và nhật ký sự
kiện
Phần trên
đề
cập
đến
mô hình quá trình trực quan,
trong đó
những hành vi trực

quan
được liên kết với những tác vụ trong mô hình bởi những hàm gán nhãn thành
phần l(). Hơn nữa, một nhật ký sự kiện
đơn
giản đã
được
xác định,
trong đó
mỗi
sự kiện trong
nhật
ký đã được dự kiến
nhãn hành
động của nó. Tiếp theo đó, sử
dụng những khái niệm
trên
để liên kết mô hình quá trình và nhật ký sự kiện bởi
giả định rằng tập
những nhãn hành động
trong nhật ký sự kiện (A) và tập nhãn trong
mô hình quá trình trực quan (L)
được
so sánh với nhau, tức là giả định A = L.
Để hình thức quá trình gán nhãn, khái niệm tập nhãn mô hình và tập nhãn chuỗi
cần
được
đ

nh
nghĩa.

18
Định
nghĩa
1.3 (Nhãn mô hình): Cho một mô hình quá trình trực quan (T,L,l),
tập nhãn mô hình
được
định
nghĩa
như
sau
:
;
trong
đó
dom (l) là miền giá trị của l ().
Định
nghĩa
1.4 (Nhãn chuỗi): Cho một nhật ký sự kiện E, tập nhãn chuỗi
được
định nghĩa ∪
trong
đó set() là hàm chuyển chuỗi thành tập hợp
thành phần.
Như
vậy tập nhãn mô hình là tập con của
tập nhãn
L
được
gán cho những tác
vụ trong mô hình trực quan, tức là ⊆ .

tương tự
⊆ .
Hình 1.10: Minh họa không gian ánh xạ của mô hình và nhật ký sự kiện
Có thể thấy, không phải nhất thiết mọi nhãn mô hình phải thực sự
được
quan sát. Ví dụ, nó có thể xảy ra
như

một hành động
thay thế
nào đó trong mô
hình
quá trình trực
quan, nhưng
đã
không được
ghi nhận bởi một nhật ký sự kiện.
Trong hình trên (a) là tập
những nhãn không được
quan sát
(nhưng thực
tế là có
thể
xảy ra) của mô hình quá trình trực quan . (b)
Những nhãn được
quan sát liên kết với mô hình quá trình trực quan ∩ . (c) có thể là
những trường
hợp mà những sự kiện trong nhật ký mà
những nhãn hành động
của nó

trong
không được
liên kết với bất kì tác vụ
nào được
quan sát trong
mô hình quá trình trực quan. Những lý do dẫn đến điều này có thể là
những hành
động
trong quá trình kinh doanh thực tế
thường
được ghi lại ở một mức
độ
cụ thể
hơn

chúng được
thể hiện trong mô hình quá trình. Nhật ký sự kiện có thể bao gồm
một số loại sự
kiện mang tính
giai
đoạn
của
một hành
động
như
lập lịch,
bắt đầu,
hay
hoàn thành
,…


trong
khi
đó, trong mô hình
quá trình những
hành động tương
ứng
chỉ
được
thể hiện bởi một tác vụ
đơn duy nhất
mà không chia ra
những
giai
đoạn
cụ
thể. Hơn nữa, có thể có các sự kiện ở mức
độ thấp
liên
quan
đến những mã lỗi và
thông điệp
hệ thống. Vì vậy, nhật ký sự kiện nằm ngoài phạm vi của mô hình, ví dụ
như tập
(c)
thường
bi loại bỏ,
điều
này
được

thực thi hoặc
trong
bước lọc
trước
khi
áp dụng thuật toán phát hiện quá trình, hoặc
trong bước
ánh xạ một mô hình quá
trình và nhật ký sự
kiện đã
có.
Trong quá trình ánh
xạ, ta chỉ xem xét những ánh xạ
tới miền giá trị của ,
những nhãn hành động
ngoài

bị loại bỏ.

×