Tải bản đầy đủ (.pdf) (104 trang)

Nghiên cứu kỹ thuật khai phá quy trình và ứng dụng phân tích quy trình chăm sóc sức khỏe tại bệnh viện

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.94 MB, 104 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
------------------------------------------

NGUYỄN THANH LINH

NGHIÊN CỨU KỸ THUẬT KHAI PHÁ QUY TRÌNH
VÀ ỨNG DỤNG PHÂN TÍCH QUY TRÌNH
CHĂM SÓC SỨC KHỎE TẠI BỆNH VIỆN

LUẬN VĂN THẠC SĨ
NGÀNH HỆ THỐNG THÔNG TIN

Đà Nẵng - Năm 2018


ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
------------------------------------------

NGUYỄN THANH LINH

NGHIÊN CỨU KỸ THUẬT KHAI PHÁ QUY TRÌNH
VÀ ỨNG DỤNG PHÂN TÍCH QUY TRÌNH
CHĂM SÓC SỨC KHỎE TẠI BỆNH VIỆN

Chuyên ngành: Hệ thống thông tin
Mã số: 8480104

LUẬN VĂN THẠC SĨ


NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. Phạm Anh Phương

Đà Nẵng - Năm 2018


I

LỜI CAM ĐOAN
Tôi xin cam đoan luận văn nghiên cứu kỹ thuật khai phá quy trình và ứng dụng
phân tích quy trình chăm sóc sức khỏe tại Bệnh viện là do tôi thực hiện dưới sự
hướng dẫn của TS Phạm Anh Phương.
Tất cả các tài liệu tham khảo từ các nghiên cứu liên quan đến luận văn đều
được nêu nguồn gốc một cách rõ ràng từ danh mục tài liệu tham khảo. Trong luận văn
không có việc sao chép tài liệu công trình nghiên cứu của người khác mà không ghi rõ
tài liệu tham khảo.
Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, tôi xin chịu hoàn toàn
trách nhiệm.

TÁC GIẢ

Nguyễn Thanh Linh


II

LỜI CẢM ƠN
Trước tiên, xin gửi lời cảm ơn đến quý thầy cô giáo, những người đã trực tiếp
giảng dạy, truyền đạt cho tôi những kiến thức quý giá trong suốt quá trình học tập tại
khoa Tin học, trường Đại học Sư Phạm, Đại học Đà Nẵng.

Xin gửi lời cảm ơn sâu sắc nhất đến TS. Phạm Anh Phương, người đã trực tiếp
hướng dẫn giúp tôi hoàn thành tốt luận văn này.
Cuối cùng, xin gửi lời cảm ơn chân thành nhất đến gia đình, bạn bè và đồng
nghiệp những người đã kịp thời động viên, hỗ trợ, tạo mọi điều kiện thuận lợi về vật
chất và tinh thần để tôi có được những thành quả như ngày hôm nay.
Đà Nẵng, tháng 10 năm 2018
Nguyễn Thanh Linh


III

MỤC LỤC
LỜI CAM ĐOAN .......................................................................................................... I
LỜI CẢM ƠN ............................................................................................................... II
MỤC LỤC ................................................................................................................... III
DANH MỤC VIẾT TẮT ........................................................................................... VII
DANH MỤC CÁC BẢNG............................................................................................ X
DANH MỤC CÁC HÌNH ẢNH................................................................................. XI
MỞ ĐẦU ......................................................................................................................... 1
1. Lý do chọn đề tài ......................................................................................................... 1
2. Mục đích và ý nghĩa của đề tài .................................................................................... 3
3. Mục tiêu đề tài ............................................................................................................. 3
4. Đối tượng và phạm vi nghiên cứu ............................................................................... 3
5. Phương pháp nghiên cứu ............................................................................................. 3
6. Kết quả dự kiến............................................................................................................ 4
7. Bố cục của luận văn ..................................................................................................... 4
CHƯƠNG I: TỔNG QUAN VỀ KHAI PHÁ QUY TRÌNH...................................... 5
1.1. Giới thiệu chung về khai phá quy trình .................................................................... 5
1.2. Mô hình quy trình và phân tích mô hình theo quy trình........................................... 6
1.2.1.Mô hình hóa quy trình ................................................................................... 7

1.2.2.Một số ngôn ngữ mô hình quy trình .............................................................. 7
1.2.3. Mạng Petri..................................................................................................... 7
1.2.4. Mạng Workflow ............................................................................................ 8
1.3. Phân tích quy trình dựa trên mô hình ....................................................................... 8
1.3.1. Phân tích quy trình ........................................................................................ 8
1.3.2. Kiểm tra quy trình ......................................................................................... 8


IV
1.3.3. Phân tích hiệu năng ....................................................................................... 9
1.3.4. Giới hạn của phân tích quy trình trên mô hình ............................................. 9
1.3.5. Các thao tác nhật ký sự kiện và mô hình quy trình .................................... 10
1.4. Bài toán phát hiện quy trình ................................................................................... 11
1.4.1 Nhật ký sự kiện ............................................................................................ 11
1.4.2. Phát hiện quy trình ...................................................................................... 13
1.5. Kiểm tra phù hợp .................................................................................................... 16
1.5.1. Bài toán kiểm tra phù hợp ........................................................................... 16
1.5.2. Kiểm tra phù hợp theo trường hợp replay .................................................. 17
1.5.3. Kiểm tra phù hợp theo so sánh vết ............................................................. 19
1.5.4. Ứng dụng khác của kiểm tra phù hợp. ........................................................ 20
1.6. Mở rộng quy trình ................................................................................................... 21
1.6.1. Thêm quan điểm tổ chức ............................................................................ 23
1.6.2.Thêm quan điểm thời gian và xác suất ........................................................ 26
1.6.3. Thêm quan điểm trường hợp ...................................................................... 27
1.7. Kết luận chương 1 .................................................................................................. 28
CHƯƠNG II. MỘT SỐ THUẬT TOÁN KHAI PHÁ QUY TRÌNH ...................... 29
2.1. Thuật toán alpha ..................................................................................................... 29
2.1.1. Đầu vào của thuật toán ............................................................................... 29
2.1.2. Thuật toán ................................................................................................... 30
2.1.3. Ý tưởng của thuật toán Alpha ..................................................................... 32

2.14. Giới hạn của thuật toán Alpha. .................................................................... 33
2.2. Thuật toán khai phá quy trình Heuristic (HM) ....................................................... 36
2.2.1. Đầu vào và đầu ra của thuật toán ................................................................ 37
2.2.2. Thuật toán khai phá quy trình Heuristic ..................................................... 38
2.2.3. Kết luận thuật toán khai phá quy trình Heuristic ........................................ 50
2.2.4. Thuật toán khai phá quy trình di truyền (GPM) ......................................... 50


V
2.2.5. Thuật toán di truyền (GA) .......................................................................... 51
2.2.6. Khởi tạo ...................................................................................................... 52
2.2.7. Lựa chọn ..................................................................................................... 52
2.2.8 Tái sản xuất (sinh sản) ................................................................................. 53
2.2.9 Kết thúc ........................................................................................................ 53
2.2.10. Một số lựa chọn thiết kế cần thực hiện ..................................................... 53
2.2.11. Kết luận thuật toán khai phá quy trình di truyền ...................................... 57
2.3. Kết luận chương 2 .................................................................................................. 58
CHƯƠNG III. ỨNG DỤNG PHÂN TÍCH QUY TRÌNH CHĂM SÓC SỨC
KHỎE TẠI BỆNH VIỆN ............................................................................................ 59
3.1. Bài toán khai phá quy trình phân tích quy trình chăm sóc sức khỏa tại bệnh viện 59
3.1.1. Đầu vào của bài toán ................................................................................... 59
3.1.2. Đầu ra của bài toán ..................................................................................... 60
3.1.3. Hướng giải quyết bài toán.......................................................................... 61
3.2. Công cụ khai phá quy trình ProM .......................................................................... 61
3.2.1.Giới thiệu chung về công cụ khai phá quy trình ProM ................................ 61
3.2.2. Các chức năng của công cụ khai phá quy trình ProM ................................ 62
3.3. Thực nghiệm khai phá quy trình chăm sóc sức khỏe tại bệnh viện ....................... 69

3.3.1. Khai phá quy trình chăm sóc sức khỏe bằng thuật toán Alpha......... 77
3.3.2. Khai phá quy trình chăm sóc sức khỏe bằng thuật toán Heuristic

minin .................................................................................................................... 78
3.3.3. Khai phá quy trình chăm sóc sức khỏe bằng thuật toán khai phá quy trình
di truyền ......................................................................................................................... 81
3.4. Kết luận chương ba ................................................................................................. 85
KẾT LUẬN .................................................................................................................. 86

TÀI LIỆU THAM KHẢO ................................................................................ 79


VI


VII


VIII

DANH MỤC VIẾT TẮT
Ký hiệu, chữ viết tắt

Giải thích

BPM

Business Process Management
(Quản lý quy trình bán hàng)

BPMN
C-net
CRM

DG
EmiT
EPC
ERP
FHM
GPM
HM
MXML
PNML
SCM
SWF-net
WFM

Business Process Modeling Notation
(Ký hiệu Mô hình hóa quy trình nghiệp vụ)

Causal Net (lưới nguyên nhân)
Customer Relationship Management
(Quản lý quan hệ khách hàng)
Dependency Graph (Biểu đồ phụ thuộc)
Enhanced Mining Tool
(Công cụ khai phá nâng cao)
Event-driven Process Chain
(Chuỗi quy trình theo hướng sự kiện)
Enterprise Resource Planning
(Lập kế hoạch)
Flexible Heuristics Miner
(linh động thuật toán Heuristics Miner)
Genetic Process Mining
(khai phá quy trình di truyền)

Heuristics Miner(thuật toán Heuristics Miner)
Mining eXtensible Markup Language
Khai phá ngôn ngữ đánh dấu eXtensible
Petri Net Markup Language
(Ngôn ngữ đánh dấu Petri Net)
Software Configuration Management
(Quản lý cấu hình phần mềm)
Structured Workflow Net
(lưới quy trình làm việc)
Workflow management
(Quản lý công việc)


IX

WF-net
XES
YAWL

Workflow Nets (Lưới công việc)
eXtensible Event Stream
(Luồng sự kiện)
Yet Another Workflow Language
(Ngôn ngữ quy trình làm việc khác)


X

DANH MỤC CÁC BẢNG
Tên bảng


Số hiệu bảng

Trang

1.1

Một ví dụ bảng ghi sự kiện

12

1.2

Một cách biểu diễn gọn hơn của bản ghi sự kiện

13

1.3

Một bản ghi sự kiện đơn giản với thông tin nguồn lực
được làm nổi bật

23

Bảng nguồn lực hoạt động cho thấy thời gian trung
1.4

bình một người thực hiện một hoạt động cho mỗi
trường hợp


24

2.1

Ví dụ về một bảng in vết

30

Chuyển đổi một mạng Petri trong hình 2.8 thành một
2.2

C-net

38

2.3

Đếm tần suất xuất hiện của các mối quan hệ nhân quả
giữa các hoạt động

42

2.4

Đếm số vòng lặp có độ dài 2 (tức là đếm a >>w b).

42

2.5


Hiển thị độ phụ thuộc giữa các hoạt động

44

2.6

Đồ thị phụ thuộc kết quả được suy ra từ bảng 2.5

44

2.7

Một C-net mở rộng đối với đồ thị phụ thuộc của Bảng
2.6 với sự liên kết các bản ghi sự kiện với 1000 vết.

47

3.1

Bản ghi sự kiện LFull

60

3.2

So sánh, đánh giá các thuật toán đã thực nghiệm

75



XI

DANH MỤC CÁC HÌNH ẢNH
Tên hình ảnh

Số hiệu hình ảnh
1.1

Sơ đồ khai phá quy trình
Ba sự liên quan giữa các bản ghi sự kiện và quy

1.2

trình mô hình: Play-in, Play-out, và Replay

Trang
6
10

1.3

WF-net N2 được phát hiện cho L2

14

1.4

Vấn đề phát hiện lại quy trình: phát hiện mô hình quy
trình N’ tương đương với mô hình quy trình gốc N


15

1.5

Kiểm tra phù hợp

17

Kiểm tra sự phù hợp cung cấp các biện pháp và

19

1.6

chẩn đoán địa phương

1.7

Mô hình tích hợp bao gồm quan điểm tổ chức, thời
gian và trường hợp

22

1.8

Một mạng xã hội bao gồm các nút đại diện cho các
tổ chức và cung đại diện cho mối quan hệ

24


1.9

Mô hình tổ chức được phát hiện dựa trên bản ghi sự
kiện

25

2.1

Một mô hình quy trình được khai phá từ bản ghi sự
kiện được mô tả như bảng 1.2 bằng thuật toán Alpha

32

2.2

Mối liên hệ giữa bản ghi sự kiện với cấu trúc mạng
Petri cơ bản dựa trên các mối quan hệ

33

2.3

Một mô hình quy trình với các hoạt động trùng lặp

34

2.4

Một mô hình quy trình với cấu trúc không tự do lựa

chọn

34

2.5

Mô hình quy trình có vòng lặp ngắn độ dài 1

35


XII

2.6

Mô hình quy trình có vòng lặp ngắn độ dài 2
Mô hình mạng Petri được sử dụng để tạo ra một bản

36
38

2.7

ghi sự kiện

2.8

Đồ thị phụ thuộc kết quả khi sử dụng các tham số
mặc định.


45

2.9

Đồ thị phụ thuộc kết quả khi thiết lập tham số σa =
0.80 và σr = 0.2

45

Một mô hình quy trình dưới dạng mạng Petri với cấu

48

2.10

trúc phụ thuộc khoảng cách xa

2.11

Sự tương ứng của DG với hình 2.11 mà không có
mối quan hệ phụ thuộc khoảng cách xa

49

2.12

DG tương ứng với hình 2.12 với quan hệ đồ thị phụ
thuộc khoảng cách xa

50


Tổng quan về hướng tiếp cận sử dụng khai phá di

51

2.13

truyền

2.14

Hai mô hình bố mẹ (trên) và hai mô hình con là kết
quả từ phép giao nhau

56

2.15

Mô tả quá trình đột biến, một vị trí bị loại bỏ và
một cung mới được thêm vào

57

3.1

Tổng quan về khung ứng dụng ProM

61

Các tùy chọn đối với dữ liệu đầu vào là bản ghi

3.2

sự kiện

62

3.3

Giao diện tùy chỉnh thông số cho thuật toán GA

63

3.4

Giao diện kết quả của thuật toán GA.

64

3.5

Giao diện làm việc trên ProM 5.2

64

Giao diện chức năng quản lý gói flugin của ProM
3.6

Lite 1.2

65



XIII

3.7

Không gian làm việc (workspace) trên ProM Lite 1.2

66

3.8

Không gian hoạt động (Action) trên ProM Lite 1.2

67

3.9

Tùy chỉnh thông số đầu vào cho thuật toán
Heuristic Miner.

67

3.10

Không gian khung nhìn (view) của ProM Lite 1.2

68

Kết quả khai phá quy trình xử lý quy trình chăm sóc


69

3.11

sức khỏe tại bệnh viện bằng thuật toán Alpha.

3.12

Kết quả nhận được khi khai phá với bản ghi sự kiện
có lỗi.

70

Mô hình kết quả khai phá quy trình bằng thuật toán
HM khi sử dụng các tham số mặc định (Kết nối tần
suất thấp giữa F và C không có trong mô hình)

71

3.13

3.14

Mô hình kết quả khai phá quy trình bằng thuật toán
HM khi thiết lập tham số σa = 0.90 và σr = 0.1 (Kết

71

nối tần suất thấp giữa F và C cũng được chấp nhận)


.

3.15

Kết quả khai phá với bản ghi có sự kiện lỗi và hoạt
động trùng lặp

72

3.16

Các tham số thiết lập khi thực hiện thuật toán khai
phá quy trình di truyền

73

3.17

Một cá thể có độ phù hợp gần bằng 1

74

3.18

Một cá thể có độ phù hợp thấp.

74

3.19


So sánh thời gian thực hiện và độ phù hợp của mô
hình kết quả của ba thuật toán Alpha, HM, GPM

76



1

MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay, cùng với sự phát triển mạnh mẽ của các hệ thống công nghệ thông
tin trên toàn thế giới, lượng dữ liệu được tạo ra trong quá trình hoạt động của các hệ
thống đó cũng tăng lên một cách chóng mặt. Sự bùng nổ dữ liệu dẫn đến nhiều hệ quả.
Hệ quả về thích ứng, lưu trữ, quản lý và xử lý khối dữ liệu khổng lồ đó. Bùng nổ dữ
liệu ở các tổ chức, doanh nghiệp kéo theo một thách thức không hề nhỏ là làm sao
trích xuất thông tin có giá trị từ núi dữ liệu mà họ đang có.
Sự quan trọng của các hệ thống thông tin của các tổ chức, doanh nghiệp ngày
nay không chỉ thể hiện qua khả năng thích ứng với lượng dữ liệu bùng nổ mà còn thể
hiện qua vai trò của các hệ thống này trong việc quản lý các hoạt động kinh doanh.
Trong quá trình hoạt động của các tổ chức, doanh nghiệp, dữ liệu sự kiện mô tả các
hoạt động của các tổ chức, doanh nghiệp liên lục được tạo ra và được các hệ thống
thông tin ghi lại và phân tích để hỗ trợ cho quy trình hoạt động của tổ chức, doanh
nghiệp.
Từ thực tế bùng nổ dữ liệu và nhu cầu trích xuất thông tin có giá trị từ lượng dữ
liệu khổng lồ đó, nhiều kỹ thuật phân tích dựa trên dữ liệu xuất hiện và đem lại nhiều
hiệu quả trong xử lý dữ liệu. Các kỹ thuật phân tích dựa trên dữ liệu như khai phá dữ
liệu, học máy, … cung cấp nhiều kỹ thuật để có thể trích xuất được thông tin có giá trị,
từ đó hỗ trợ nhiều cho quá trình hoạt động của các tổ chức, doanh nghiệp. Song các kỹ

thuật phân tích dựa trên dữ liệu thường hướng đến quyết định hoặc các mẫu riêng lẽ để
phục vụ cho những yêu cầu cụ thể chứ thường không hướng đến toàn bộ quy trình hoạt
động của tổ chức, doanh nghiệp.
Các kỹ thuật quản lý quy trình nghiệp vụ thực hiện phân tích và tăng cường
hiệu quả quy trình hoạt động kinh doanh. Kỹ thuật quản lý quy trình nghiệp vụ tập
hợp các công cụ tích hợp để thiết kế, xây dựng và quản lý hoạt động doanh nghiệp dựa
trên các quy trình kinh doanh tối ưu. Các kỹ thuật này cho phép các tổ chức, doanh
nghiệp tự mô hình hóa và thay đổi một cách hiệu quả và nhanh chóng các quy trình
hoạt động, kinh doanh nhằm đáp ứng các nhu cầu cụ thể của tổ chức, doanh nghiệp
mình. Song các kỹ thuật này thường sử dụng tri thức công nghệ thông tin và khoa học
quản lý lấy từ một mô hình trung tâm có sẵn. Do đó, có thể sự tương thích trong các
mô hình quy trình không đạt hiệu quả cao nhất.
Từ thực tế bùng nổ dữ liệu hiện nay, các kỹ thuật quản lý quy trình gặp một
thách thức lớn. Đó chính là thách thức về tính chính xác, hiệu quả cao hơn trong môi


2
trường dữ liệu khổng lồ. Bên cạnh đó cũng gặp thách thức về hiệu năng thông qua thời
gian xử lý, về sức chứa thông qua không gian lưu trữ và về giải thích thông qua mô
hình quy trình với rất nhiều hành động. Phân tích và tối ưu các quy trình là một giải
pháp.
Khai phá quy trình là sự kết hợp giữa các kỹ thuật phân tích dữ liệu và các kỹ
thuật phân tích mô hình quy trình từ đó có thể chiết xuất thông tin có giá trị, liên quan
đến quy trình từ các bản ghi sự kiện, bổ sung vào các tiếp cận hiện có để quản lý cũng
như cải thiện quy trình tác nghiệp. Kỹ thuật này có thể là giải pháp cho những thách
thức đối với các kỹ thuật quản lý quy trình đã được nhắc đến.
Tại nhiều quốc gia, các tổ chức chăm sóc sức khoẻ, như bệnh viện, đang chịu
áp lực ngày càng tăng để nâng cao năng suất và giảm chi phí. Cụ thể, tại Việt Nam
nhu cầu về các dịch vụ bệnh viện đang tăng lên. Chăm sóc y tế kéo dài đối với người
già, tăng chi phí liên quan đến việc quản lý bệnh mãn tính, khả năng điều trị sáng tạo

nhưng tốn kém và nhu cầu nhân viên chăm sóc sức khoẻ nhiều hơn gây áp lực lên các
tổ chức chăm sóc sức khỏe. Để đối phó với tình trạng này, các bệnh viện cần phải
kiểm soát và cải tiến các quy trình chăm sóc của họ để chúng được thực hiện tốt hơn
và hiệu quả hơn.
Mặt khác, các hệ thống thông tin bệnh viện ngày nay chứa đựng rất nhiều dữ
liệu. Khối lượng của dữ liệu liên quan đến chăm sóc sức khoẻ đang gia tăng đáng kể
với việc sử dụng ngày càng nhiều hệ thống hồ sơ y tế điện tử (EHR), hệ thống lưu trữ
và truyền thông hình ảnh (PACS) và nhiều hệ thống thu thập dữ liệu. Phương pháp
tiếp cận phân tích đương đại thường chỉ tập trung vào việc trình bày dữ liệu tổng
hợp về các quá trình chăm sóc được thực hiện. Ví dụ, thông tin được cung cấp về các
chỉ số hoạt động như số lần phẫu thuật đầu gối, thời gian chờ đợi và tỷ lệ thành công
của phẫu thuật. Thật không may, không có thông tin bên trong (inside information) chi
tiết inside information được cung cấp về các quy trình được thực hiện, do đó hạn chế
khả năng hiểu và cải tiến các quy trình chăm sóc hiệu quả!
Hơn nữa, các phương pháp truyền thống của quá trình phát hiện và cải tiến đã không
còn thích ứng trong tương lai, bên cạnh đó là những chi phí khổng lồ liên quan đến
những phương pháp này. Vì vậy tôi chọn đề tài “Nghiên cứu kỹ thuật khai phá quy
trình và ứng dụng phân tích quy trình chăm sóc sức khỏe tại bệnh viện” Trong đề tài
này, tôi tập trung nghiên cứu những khái niệm cơ bản, đặc điểm, ứng dụng, các thuật
toán được sử dụng vv, của kỹ thuật khai phá quy trình. Bên cạnh đó, để có cái nhìn
trực quan hơn về kỹ thuật này, tôi thực hiện mô phỏng khai phá quy trình chăm sóc


3
sức khỏe tại bệnh viện. Việc mô phỏng sẽ được thực hiện bằng nhiều thuật toán để có
thể có sự so sánh và đánh giá hiệu quả của từng thuật toán khai phá quy trình.
2. Mục đích và ý nghĩa của đề tài
2.1. Mục đích
Nghiên cứu kỹ thuật khai phá quy trình, nắm được các đặc điểm, đặc trưng của
kỹ thuật này. Nghiên cứu các thuật toán được sử dụng trong kỹ thuật khai phá quy

trình.
2.2. Ý nghĩa đề tài
Nghiên cứu ứng dụng kỹ thuật khai phá quy trình trong quản lý cũng như cải
thiện quy trình tác nghiệp.
3. Mục tiêu đề tài
Nghiên cứu tổng quan về kỹ thuật khai phá quy trình: Sự cần thiết của khai
phá quy trình, các khái niệm, cơ sở lý thuyết cơ bản và chi tiết, bài toán khai phá
quy trình và các phương pháp giải quyết bài toán.
Nghiên cứu các thuật toán được sử dụng trong kỹ thuật khai phá quy trình, qua
đó đánh giá được ưu nhược điểm của các thuật toán đó.
Sử dụng các thuật toán và công cụ khai phá quy trình để minh họa kỹ thuật
khai phá quy trình trong thực tế. Thông qua bài toán chăm sóc sức khỏe y tế tại
bệnh viện.
4. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu
- Kỹ thuật khai phá quy trình.
- Các thuật toán khai phá quy trình.
- Công cụ khai phá quy trình ProM.
Phạm vi nghiên cứu
- Tập trung nghiên cứu một số thuật toán ứng dụng trong khai phá quy trình
nghiệp vụ.
- Sử dụng bộ dữ liệu sự kiện quy trình chăm sóc y tế tại một bệnh viện để mô
phỏng kỹ thuật khai phá quy trình.
5. Phương pháp nghiên cứu
Các phương pháp sẽ thực hiện để đạt được mục tiêu nghiên cứu:
- Phương pháp thu thập thông tin: Tìm kiếm tài liệu từ sách, giáo trình, báo
cáo, mạng internet, các trang elearning liên quan.


4

- Phương pháp so sánh: Tổng hợp và đối chiếu giữa những tài liệu thu được để
đưa ra một cái nhìn tổng quan nhất về kỹ thuật khai phá quy trình và các thuật toán
khai phá quy trình, ưu nhược từng thuật toán.
- Phương pháp chuyên gia: Tham vấn từ những người có kinh nghiệm nhằm
hoàn thiện các nội dung cần nghiên cứu.
- Phương pháp thực nghiệm: Thực nghiệm khai phá quy trình chăm sóc sức
khỏe tại Bệnh viện.
6. Kết quả dự kiến
- Nắm được các đặc điểm, đặc trưng của kỹ thuật khai phá quy trình.
- Hiểu được các thuật toán trong khai phá quy trình.
- Mô phỏng khai phá quy trình, đánh giá được các thuật toán khai phá quy trình.
7. Bố cục của luận văn

- Chương 1: Tổng quan về khai phá quy trình, sẽ giới thiệu ý tưởng, mục đích
của khai phá quy trình nghiệp vụ, giới thiệu kỹ thuật mô hình quy trình và một số hạn
chế của các kỹ thuật đó, giới thiệu các bài toán của khai phá quy trình. Quá đó, cho
thấy ý nghĩa và tầm quan trọng của việc ứng dụng khai phá quy trình nghiệp vụ tại các
cơ quan, doanh nghiệp, y tế.…

- Chương 2: Một số thuật toán khai phá quy trình, giới thiệu chi tiết ba trong số
các thuật toán thường được sử dụng trong khai phá quy trình nghiệp vụ, đó là: Thuật
toán khai phá quy trình Anpha, thuật toán khai phá quy trình Heuristic và thuật toán
khai phá quy trình di truyền, qua đó so sánh đánh giá ưu, nhược điểm của từng thuật
toán.

- Chương 3: Ứng dụng khai phá quy trình chăm sóc sức khỏe tại bệnh viện, sẽ
giới thiệu một cách tổng quan về công cụ khai phá quy trình ProM. Qua đó ứng dụng
ProM để khai phá quy trình chăm sóc sức khỏe tại bệnh viện bằng các thuật toán đã
được trình bày ở chương hai, kết quả khai phá sẽ góp phần mô tả chi tiết và đánh giá
cụ thể hơn ưu nhược điểm của các thuật toán khai phá quy trình đã được trình bày.

Kết luận tổng kết những kết quả đã đạt được và đưa ra hướng phát triển của
luận văn trong tương lai.


5

CHƯƠNG 1: TỔNG QUAN VỀ KHAI PHÁ QUY TRÌNH
1.1. Giới thiệu chung về khai phá quy trình
Trước khi tập trung vào kỹ thuật khai phá quy trình, ta lướt qua một số kỹ thuật
và mô hình liên quan. Hệ thống quản lý quy trình nghiệp vụ (BPM), hệ thống quản lý
luồng công việc (WFM) là hệ thống cho phép chúng ta xác định và điều khiển luồng
công việc của một quy trình, hệ thống hoạch định nguồn lực doanh nghiệp (ERP), hệ
thống quản lý mối quan hệ với khách hàng (CRM), công cụ quản lý cấu hình phần
mềm (SCM)... Những hệ thống thông tin khác nhau này đều có một điểm chung đó là
tất cả các hoạt động của chúng đều được ghi lại trong bản ghi sự kiện. Các bản ghi được
ghi lại bởi các hệ thống thông tin nói trên chứa dữ liệu về các sự kiện, các giao dịch,
các trường hợp ngoại lệ trong quá trình thực hiện quy trình. Các bản ghi này phản ánh
các quy trình thực của nó một cách trung thực nhất, nghĩa là chúng phản ánh đúng
thực tế.
Khai phá quy trình trong phạm vi của các quy trình luồng công việc được giới
thiệu đầu tiên bởi Agrawaletal vào năm 1998. Tuy nhiên, thuật ngữ khai phá luồng
công việc hay còn gọi là khai phá quy trình chính thức được đưa ra vào năm 1999 bởi
Ton Weijters và Van der Aalst. Theo Van der Aalst: Ý tưởng của khai phá quy trình là
để khám phá, giám sát và cải thiện quy trình thực sự của nó bằng cách trích xuất tri
thức từ những bản ghi sự kiện có sẵn trong các hệ thống thông tin ngày nay. Cụ thể
hơn theo A. Rozinat, I.S.M. de Jong, C.W. Gunther, và W.M.P. van der Aalst, 2007: ý
tưởng cơ bản của khai phá quy trình là nghiên cứu từ những hoạt động quan sát được
của một quy trình và dùng nó để

(i) : Khám phá mô hình mới

(ii) : Kiểm tra tính phù hợp của mô hình bằng cách kiểm tra xem trạng thái của
mô hình đó có phù hợp với trạng thái mô hình được quan sát hay không?

(iii) : Mở rộng mô hình đang có bằng cách sắp xếp thông tin được trích
xuất từ những bản ghi vào một số mô hình ban đầu.


6

Hình 1.1: Sơ đồ khai phá quy trình.
Hình 1.1 cho chúng ta thấy quá trình khai phá quy trình và các mối quan hệ giữa
các thực thể như là hệ thống thông tin, quy trình hoạt động, các bản ghi sự kiện và mô
hình quy trình. Khai phá quy trình thiết lập liên kết, một mặt giữa quy trình thực tế và
dữ liệu của chúng, mặt khác giữa quy tình thực tế và mô hình quy trình. Các hệ thống
thông tin ngày nay ghi lại một lượng lớn các dữ liệu về quá trình hoạt động. Dữ liệu
này được mô tả như là bản ghi sự kiện ở sơ đồ trên.
Chiết tách dữ liệu là một phần không thể thiếu của bất kỳ nỗ lực khai thác quy
trình nào bởi vì dữ liệu được lưu trong các hệ thống thông tin thường không được cấu
trúc sẵn.
Bản ghi sự kiện được sử dụng trong ba loại khai phá quy trình. Đó là phát hiện
quy trình, kiểm tra phù hợp, và cải thiện quy trình như đã trình bày ở định nghĩa phía
trên. Ba hoạt động khai phá quy trình này sẽ được trình bày chi tiết ở các phần sau.
1.2. Mô hình quy trình và phân tích mô hình theo quy trình
Sự phát triển của các kỹ thuật, ngôn ngữ mô hình hóa quy trình cho thấy sự quan
trọng của quá trình mô hình hóa quy trình. Ngày nay, hầu hết các mô hình quy trình
được thực hiện bằng tay và không dựa trên một phân tích nghiêm ngặt của dữ liệu quy


7
trình hiện có. Phần này trình bày hai nội dung chính. Một là, giới thiệu chung về các

kỹ thuật mô hình quy trình sẽ được sử dụng trong các chương sau. Hai là, chương này
cho thấy những hạn chế của phương pháp cổ điển, do đó thúc đẩy nhu cầu khai thác
quá trình.
1.2.1.Mô hình hóa quy trình
Ngày nay, các hoạt động kinh doanh trở nên phức tạp hơn. Mô hình quá trình hỗ
trợ quản lý phức tạp bằng cách cung cấp cái nhìn sâu sắc về mô hình và lập hồ sơ thủ
tục. Kết quả là, các mô hình quy trình được sử dụng rộng rãi trong các tổ chức hiện
nay.
Quản lý hoạt động trong tổ chức, doanh nghiệp, và nghiên cứu những hoạt động
cụ thể là một nhánh của khoa học quản lý phụ thuộc nhiều vào mô hình. Tạo ra một
mô hình do đó là một nhiệm vụ khó khăn và dễ bị lỗi. lỗi điển hình bao gồm: mô hình
mô tả một phiên bản lý tưởng của thực tại, mô hình không có khả năng để nắm bắt đầy
đủ hành vi của con người và mô hình ở mức độ trừu tượng sai.
1.2.2.Một số ngôn ngữ mô hình quy trình
Có rất nhiều ngôn ngữ mô hình và việc quyết định chọn một hay nhiều mô hình
phụ thuộc vào nhiều yếu tố. Trong phần dưới đây luận văn sẽ giới thiệu một số ngôn
ngữ mô hình thường được sử dụng trong khai phá quy trình.
1.2.3. Mạng Petri
Mạng Petri công cụ hình học và toán học biểu diễn quá trình biến đổi trạng thái
của các hệ thống, do Carl Adam Petri đề xuất vào năm 1962. Mạng Petri được xem là
một ngôn ngữ mang tính tượng trưng cao và dễ dàng giao tiếp giữa các nhà thiết kế khác
nhau trên thế giới cũng như rất thuận lợi và dễ dàng cho người sử dụng. Trong lĩnh vực
khai phá quy trình mạng Petri được sử dụng rộng rãi để mô hình hóa luồng quy trình
dựa vào các bản ghi sự kiện. Hiện nay có nhiều phương pháp được dùng để phân tích
mạng Petri. Hơn thế nữa, ngôn ngữ ProM cung cấp cho chúng ta nhiều công cụ để
chuyển đổi những ngôn ngữ mô hình khác thành mạng Petri.
Mạng Petri là một dạng biểu đồ có hướng gồm hai loại nút: chuyển tiếp
(transition) và vị trí (place). Các vị trí và chuyển tiếp được nối với nhau bằng các



8
đường nối (liên kết). Chỉ có thể nối vị trí với chuyển tiếp, không thể nối giữa hai vị trí
hoặc hai chuyển tiếp với nhau. Khi một đường nối đi từ một vị trí đến một chuyển tiếp,
thì vị trí đó được gọi là vị trí đầu vào của chuyển tiếp đó. Ngược lại, khi có một đường
nối đi từ chuyển tiếp tới một vị trí thì vị trí đó được gọi là vị trí đầu ra của chuyển tiếp
đó. Các vị trí có thể chứa một số lượng các token (thẻ) nào đó. Thẻ trong vị trí được
biểu diễn bằng dấu chấm. Chuyển tiếp của Petri Net có thể hoạt động được khi tất cả
các vị trí đầu vào của nó có ít nhất một token. Sau khi chuyển tiếp hoạt động (bắn),
mỗi vị trí đầu vào sẽ mất một thẻ và mỗi vị trí đầu ra thêm một thẻ. Tại một thời điểm,
việc phân bố các thẻ trên các vị trí, được gọi là đánh dấu (marking) của Petri Net. Nó
biểu diễn trạng thái hiện tại của hệ thống được mô hình hóa.
1.2.4. Mạng Workflow
Khi mô hình hóa quy trình nghiệp vụ dưới dạng mạng Petri ta thường quan tâm
đến một tập con của mạng Petri được gọi là mạng luồng công việc.
(Workflow nets hay WF-nets). Một WF-nets là một mạng Petri chỉ có một vị trí
dành riêng cho nguồn nơi quy trình bắt đầu và một vị trí dành riêng cho đích nơi quy
trình kết thúc. Ngoài ra, tất cả các nút đều trên một đường dẫn từ nguồn đến đích.
1.3. Phân tích quy trình dựa trên mô hình
1.3.1. Phân tích quy trình
Phân tích quy trình dựa trên mô hình bao gồm kiểm tra quy trình và phân tích
hiệu suất quy trình. Kiểm tra quy trình tập trung vào sự đúng đắn của hệ thống hoặc
quy trình. Phân tích hiệu suất tập trung vào số dòng công việc, thời gian chờ, dịch vụ
được sử dụng và mức độ.
1.3.2. Kiểm tra quy trình
Một phương pháp ta kiểm tra tính mạnh của mô hình, tức là tính liên thông của
mô hình khi từ bất kỳ một trạng thái nào cũng có đường chuyển đến trạng thái kết thúc.
Một phương pháp kiểm tra khác là so sánh hai mô hình. Ví dụ, khi bước vào giai đoạn
triển khai, quy trình đó cần được so sánh với các đặc điểm kỹ thuật cao cấp hơn. Nếu
quy trình đó có thể “theo tất cả các hành động” của quy trình cao cấp hơn thì có thể
nói, mô hình quy trình được triển khai là đúng đắn.



9
1.3.3. Phân tích hiệu năng
Hiệu suất của một quá trình hoặc tổ chức có thể được định nghĩa theo nhiều cách
khác nhau. Thông thường, ba khía cạnh của hoạt động được xác định: thời gian, chi phí
và chất lượng. Đối với từng khía cạnh hiệu suất, chỉ số hiệu suất chính khác nhau có thể
được xác định. Các chỉ số sau đây có thể được xác định cho khía cạnh thời gian: Thời
gian dẫn là tổng thời gian từ việc tạo ra các trường hợp đến hoàn thành các trường hợp.
Mức độ lệch thời dẫn giữa các trường hợp khác nhau có tầm quan trọng khi đánh giá
hiệu suất. Thời gian phục vụ là thời gian làm việc thực tế trên một trường hợp. Thời
gian chờ đợi là thời gian một trường hợp đang chờ tài nguyên trở nên có sẵn. Thời gian
đồng bộ hóa là thời điểm hoạt động chưa được kích hoạt đầy đủ và chờ đợi một kích
hoạt bên ngoài hoặc một nhánh song song. Chỉ số hiệu suất cũng có thể được định
nghĩa cho mức chi phí. Các chi phí thực hiện một hoạt động có thể được cố định hoặc
phụ thuộc vào loại tài nguyên được sử dụng, tận dụng, hoặc thời gian hoạt động. Chỉ
số hiệu suất thường được tính bằng trung bình các nguồn lực trong một thời gian nhất
định. Các chỉ số chất lượng thường tập trung vào các "sản phẩm" hoặc "dịch vụ" giao cho
khách hàng. Như chi phí, điều này có thể được đo bằng nhiều cách khác nhau. Ví dụ sự hài
lòng của khách hàng đo lường thông qua bảng câu hỏi.
Trong khi kiểm tra tập trung vào tính chính xác của quy trình được mô hình hóa
thì phân tích hiệu quả nhằm mục tiêu cải tiến quy trình liên quan đến thời gian, chi phí,
hoặc chất lượng. Trong bối cảnh của hoạt động quản lý, nhiều kỹ thuật phân tích đã
được phát triển.
1.3.4. Giới hạn của phân tích quy trình trên mô hình
Kiểm định và phân tích hiệu suất phụ thuộc rất nhiều vào sự sẵn có của mô hình
chất lượng cao. Khi các mô hình và thực tế có rất ít điểm chung, phân tích dựa trên mô
hình không có ý nghĩa nhiều. Ví dụ, mô hình quy trình có thể nhất quán và đáp ứng tất
cả các loại tính chất mong muốn. Tuy nhiên, nếu mô hình mô tả một phiên bản lý
tưởng của thực tế, điều này là khá vô dụng như trong thực tế tất cả các loại sai lệch có

thể xảy ra, mô hình mô phỏng cũng tương tự. Có thể mô hình dự đoán một sự cải thiện
đáng kể trong khi trên thực tế đây không phải là trường hợp vì các mô hình dựa trên
các giả định sai lầm. Tất cả những vấn đề này xuất phát từ sự thiếu liên kết giữa các
mô hình làm bằng tay và thực tế. Khai phá quy trình giải quyết những vấn đề này bằng


×