Tải bản đầy đủ (.pdf) (11 trang)

Khai phá mạng xã hội dựa trên các bản ghi sự kiện hoạt động của doanh nghiệp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.8 MB, 11 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

TRẦN THỊ PHƯƠNG

KHAI PHÁ MẠNG XÃ HỘI DỰA TRÊN CÁC BẢN GHI
SỰ KIỆN HOẠT ĐỘNG CỦA DOANH NGHIỆP

Ngành:

Công nghệ Thông tin

Chuyên ngành:

Hệ thống thông tin

Mã số:

604805

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. HÀ QUANG THỤY

Hà Nội - 2015


2

LỜI CÁM ƠN
Lời đầu tiên, tôi xin chân thành cảm ơn sự hướng dẫn và chỉ bảo tận tình của


PGS.TS. Hà Quang Thụy – người đã đưa ra định hướng khoa học và luôn quan
tâm, động viên, thông cảm, tạo điều kiện thuận lợi cho tôi trong suốt quá trình
thực hiện luận văn.
Tôi xin cảm ơn Phòng thí nghiệm Khoa học dữ liệu và Công nghệ Tri thức
(DS&KTLab)và Đề tài cấp Đại học Quốc Gia Hà Nội, mã số QG.15.22 đã định
hướng cho tôi trong đề tài nghiên cứu này.
Cuối cùng, tôi xin gửi lời cảm ơn tới các bạn bè đã giúp đỡ, hỗ trợ tôi cả về
mặt tinh thần và nền tảng kiến thức để tôi có thể hoàn thành luận văn.
Hà Nội, tháng 10 năm 2015

Trần Thị Phương


3

LỜI CAM ĐOAN
Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm của riêng cá
nhân tôi, không sao chép lại của người khác. Trong toàn bộ nội dung của luận
văn, những điều đã trình bày là của cá nhân tôi hoặc được tôi tổng hợp từ nhiều
nguồn tài liệu. Tất cả các nguồn tài liệu tham khảo có xuất xứ rõ ràng và được
trích dẫn hợp pháp.
Tôi xin chịu toàn bộ trách nhiệm và chịu mọi hình thức kỷ luật theo quy định
cho lời cam đoan của tôi.
Hà Nội, tháng 10năm 2015

Trần Thị Phương


4


MỤC LỤC
LỜI CÁM ƠN ................................................................................................................2
LỜI CAM ĐOAN ..........................................................................................................3
DANH MỤC TỪ VIẾT TẮT ........................................................................................6
DANH MỤC BẢNG BIỂU ...........................................................................................7
DANH MỤC HÌNH VẼ.................................................................................................8
MỞ ĐẦU .........................................................................................................................9
Chương 1. Những khái niệm cơ bản về nhật ký sự kiện và khai phá quy trình....11
1.1.

Khái niệm nhật ký sự kiện ............................................................................... 11

1.2.

Khai phá quy trình ........................................................................................... 12

Chương 2. Khai phá mạng xã hội ..............................................................................15
2.1.

Trích xuất đồ thị quan hệ xã hội từ các bản ghi sự kiện .................................. 15

2.2.

Các độ đo trong xây dựng đồ thị quan hệ xã hội ............................................. 16

2.3.

2.2.1.

Độ đo dựa trên quan hệ nhân quả ..........................................................17


2.2.2.

Độ đo dựa trên trường hợp chung ..........................................................24

2.2.3.

Độđo dựa trên các hoạt động chung ......................................................25

Phân tích mạng xã hội ...................................................................................... 27
2.3.1.

Mật độ mạng ..........................................................................................28

2.3.2.

Độ gần ....................................................................................................28

2.3.3.

Độ trung tâm ..........................................................................................29

2.3.4.

Độ trung gian .........................................................................................31

Chương 3. Cải thiện độ đo trong xây dựng đồ thị quan hệ xã hội ..........................33
3.1.

Đặt vấn đề ........................................................................................................ 33


3.2.

Giải pháp .......................................................................................................... 34
3.2.1.

Đánh trọng số .........................................................................................34

3.2.2.

Áp dụng trọng số chuyển giao vào công thức độ đo .............................36


5

Chương 4. Cài đặt, thực nghiệm ................................................................................37
4.1.

Công cụ MiSoN ............................................................................................... 37

4.2.

Thiết kế và cài đặt ............................................................................................ 39

4.3.

4.2.1.

Thiết kế tổng thể ....................................................................................39


4.2.2.

Cấu trúc tệp nhật ký sự kiện đầu vào .....................................................41

4.2.3.

Thiết kế lớp ............................................................................................41

4.2.4.

Luồng hoạt động ....................................................................................43

Kết quả thực nghiệm ........................................................................................ 44

Kết luận ........................................................................................................................50


6

DANH MỤC TỪ VIẾT TẮT
Từ viết tắt
HRM

Từ viết đầy đủ
Human resource management

CRM

Customer relationship
management

Human resource
Social Network analysis

HR
SNA

Diễn giải
Hệ thống quản lý nguồn
nhân lực
Hệ thống quản trị quan hệ
khách hàng
Bộ phận quản lý nhân sự
Phân tích mạng xã hội


7

DANH MỤC BẢNG BIỂU
Bảng 1.1 Một ví dụ nhật ký sự kiện tổng quát .................................................... 12
Bảng 1.2 Nhật ký sự kiện tổng quát đã sắp xếp theo từng trường hợp ............... 13
Bảng 2.1. Giá trị độ đo dựa trên sự chuyển giao công việc ................................ 21
Bảng 2.2. Ma trận tần xuất thực thi hoạt động .................................................... 25
Bảng 4.1 Bảng trọng số các hoạt động................................................................ 47
Bảng 4.2. Ma trận trọng số khi bỏ qua chuyển giao công việc nhiều lần, bỏ qua
chuyển giao gián tiếp........................................................................................... 47
Bảng 4.3. Ma trận trọng số khi bỏ qua chuyển giao công việc nhiều lần, có tính
tới chuyển giao gián tiếp ..................................................................................... 47
Bảng 4.4. Ma trận trọng số khi có tính tới chuyển giao công việc nhiều lần, bỏ
qua chuyển giao gián tiếp .................................................................................... 48
Bảng 4.5. Ma trận trọng số khi có tính tới chuyển giao công việc nhiều lần, bỏ

qua chuyển giao gián tiếp .................................................................................... 49


8

DANH MỤC HÌNH VẼ
Hình 1.1. Sơ đồ quy trình tuyển dụng ................................................................. 11
Hình 1.2. Sơ đồ quy trình dạng lưới Petri cho nhật ký sự kiện tổng quát .......... 14
Hình 2.1. Đồ thị quan hệ xã hội trích xuất từ nhật ký sự kiện Bảng 1.1 ............ 16
Hình 2.2. Đồ thị minh họa về độ gần của nút trong đồ thị.................................. 29
Hình 2.3. Đồ thị minh họa về độ trung tâm cục bộ của nút ................................ 30
Hình 2.4. Đồ thị minh họa về độ trung gian ....................................................... 31
Hình 4.1. Kiến trúc của MiSoN .......................................................................... 38
Hình 4.2 Giao diện MiSoN hiển thị đồ thị quan hệ xã hội với dữ liệu từ
Staffware log ....................................................................................................... 39
Hình 4.3. Vị trí và mối quan hệ của package SocialNetwork trong ProM ......... 40
Hình 4.4. Thiết kế lớp cài đặt độ đo chuyển giao công việc............................... 42
Hình 4.5 Biểu đồ công tác xây dựng đồ thị quan hệ xã hội ................................ 44
Hình 4.6 Sơ đồ luồng tính toán ma trận trọng số ................................................ 44


9

MỞ ĐẦU
Cùng với sự phát triển của công nghệ thông tin, các hệ thống thông tin doanh
nghiệp ngày càng được ứng dụng phổ biến, trong đó có thể kể đến những cái tên
tiêu biểu: HRM – hệ thống quản lý nhân sự, CRM - quản trị quan hệ khách
hàng… Các hệ thống này lưu trữ dữ liệu sự kiện hoạt động của doanh nghiệp
dưới dạng các bản ghi có cấu trúc kèm theo thông tin về thời gian, chi tiết hoạt
động, đối tượng tham gia…, nhờ đó chúng ta có thể hình dung được luồng công

việc một cách có hệ thống. Tuy nhiên, các hệ thống nói trên mới mới chỉ dừng ở
mức lưu trữ và thống kê, dữ liệu sự kiện của các doanh nghiệp vẫn chưa được sử
dụng một cách hiệu quả trong việc hỗ trợ nhà quản trị đưa ra quyết định điều
hành.
Việc phân tích các bản ghi sự kiện đã được thực hiện từ rất sớm với nhiều công
trình nghiên cứu khác nhau. Hầu hết các đề tài nghiên cứu hiện nay đều đi theo
hướng khai phá quy trình - sử dụng các bản ghi sự kiện phục vụ việc xây dựng,
cải tiến và kiểm chứng mô hình quy trình. Tuy nhiên, bên cạnh các thông tin về
thời gian, công việc thì nhiều hệ thống còn ghi lại cả thông tin về yếu tố con
người (ví dụ người thực thi hành động, người được chuyển giao công việc…).
Như vậy, các bản ghi sự kiện ngoài việc phản ánh luồng công việc còn có thể
phản ánh được mối quan hệ cộng tác trong công việc giữa các cá nhân, nhóm
người trong doanh nghiệp.
Môi trường doanh nghiệp cũng có thể coi là một xã hội thu nhỏ, và mối quan hệ
trong công việc có thể coi là một loại quan hệ xã hội trong xã hội thu nhỏ đó.
Các cá nhân, nhóm người trong doanh nghiệp cùng mối quan hệ giữa họ hình
thành nên mạng xã hội. Từ các bản ghi sự kiện chúng ta có thể xây dựng nên mô
hình mạng xã hội cũng như phân tích dữ liệu để cho ra những thông tin tổng hợp
dưới góc nhìn thuận tiện, hữu ích, hỗ trợ cho nhà quản trị doanh nghiệp.
Luận văn của tôi dựa trên nghiên cứu của WMP Van der Aalst và Minseok Song
trình bày trong [1]. Trong đó, các bản ghi sự kiện sẽ được sử dụng trong khai
phá mạng xã hội (mà cụ thể hơn là khai phá mối quan hệ giữa các cá nhân/nhóm
người) nhằm phục vụ cho việc quản trị nhân sự trong doanh nghiệp.
Nội dung đề tài tôi sẽ trình bày bao gồm các phần như sau:
Chương 1: Trình bày những khái niệm cơ bản về nhật ký sự kiện, khai phá quy
trình và những kiến thức khác liên quan đến đề tài.


10


Chương 2: Trình bày về khai phá mạng xã hội bao gồm những khái niệm cơ bản,
các độ đo trong trích xuất đồ thị quan hệ xã hội và phân tích mạng xã hội.
Chương 3: Cải thiện độ đo trong trích xuất đồ thị quan hệ xã hội.
Chương 4: Cài đặt và thực nghiệm.
Hà Nội, ngày18 tháng10 năm 2015
Trần Thị Phương


51

TÀI LIỆU THAM KHẢO
1. Wil M. P. van der Aalst, Hajo A. Reijers, Minseok Song. Discovering Social
Networks from Event Logs. Computer Supported Cooperative Work 14(6),
2005.
2. Wil M. P. van der Aalst, Minseok Song. Mining Social Networks: Uncovering
Interaction Patterns in Business Processes. Business Process MMaigement
2004, 2004.
3. Wil van der Aalst. Process mining: Discovery, Conformance, enhancement
of business processes, 2011.
4.K Chandra Sekharaiah, MAM Khan. Towards Metrics for Social Computing.
World Congress on Science, Engineering, Technology, Dubai, UAE,
January, 20-30, 2009.
5. Evelien Otte, Ronald Rousseau. Social network Mailysis: a powerful strategy,
also for the information sciences. J. Information Science 28(6): 441-453,
2002.
6.Kazuya Okamoto, Wei Chen, Xiang-Yang Li.Ranking of Closeness Centrality
for Large-Scale Social Networks.
7.Guandong Xu, Yanchun Zhang, Lin Li. Web Mining and Social Networking:
Techniques and Applications (1st edition). Springer US, 2011.
8. Neveen Ghali, Mrutyunjaya Panda, Aboul Ella Hassanien, Vaclav Snasel,

Ajith Abraham (eds.). Computational Social Networks: Mining and
Visualization. Springer-London, 2012.
9.Sibel Adal, Xiaohui Lu, Malik Magdon-Ismail. Local, community and global
centrality methods for analyzing networks.
10.Freeman, Linton. A set of measures of centrality based on betweenness,
1977.



×