Tải bản đầy đủ (.docx) (54 trang)

Khai phá mạng xã hội dựa trên các bản ghi sự kiện hoạt động của doanh nghiệp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (688.52 KB, 54 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

TRẦN THỊ PHƯƠNG

KHAI PHÁ MẠNG XÃ HỘI DỰA TRÊN CÁC BẢN
GHI SỰ KIỆN HOẠT ĐỘNG CỦA DOANH NGHIỆP

Ngành:

Công nghệ Thông tin

Chuyên ngành:

Hệ thống thông tin

Mã số:

604805

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. HÀ QUANG THỤY

Hà Nội - 2015


2

LỜI CÁM ƠN
Lời đầu tiên, tôi xin chân thành cảm ơn sự hướng dẫn và chỉ bảo tận tình của


PGS.TS. Hà Quang Thụy – người đã đưa ra định hướng khoa học và luôn quan
tâm, động viên, thông cảm, tạo điều kiện thuận lợi cho tôi trong suốt quá trình
thực hiện luận văn.
Tôi xin cảm ơn Phòng thí nghiệm Khoa học dữ liệu và Công nghệ Tri thức
(DS&KTLab)và Đề tài cấp Đại học Quốc Gia Hà Nội, mã số QG.15.22 đã định
hướng cho tôi trong đề tài nghiên cứu này.
Cuối cùng, tôi xin gửi lời cảm ơn tới các bạn bè đã giúp đỡ, hỗ trợ tôi cả về
mặt tinh thần và nền tảng kiến thức để tôi có thể hoàn thành luận văn.
Hà Nội, tháng 10 năm 2015

Trần Thị Phương


3

LỜI CAM ĐOAN
Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm của riêng cá
nhân tôi, không sao chép lại của người khác. Trong toàn bộ nội dung của luận
văn, những điều đã trình bày là của cá nhân tôi hoặc được tôi tổng hợp từ nhiều
nguồn tài liệu. Tất cả các nguồn tài liệu tham khảo có xuất xứ rõ ràng và được
trích dẫn hợp pháp.
Tôi xin chịu toàn bộ trách nhiệm và chịu mọi hình thức kỷ luật theo quy định
cho lời cam đoan của tôi.
Hà Nội, tháng 10năm 2015

Trần Thị Phương

LỜI CÁM ƠN ................................................................................................................
LỜI CAM ĐOAN ..........................................................................................................
DANH MỤC TỪ VIẾT TẮT ........................................................................................

DANH MỤC BẢNG BIỂU ...........................................................................................
DANH MỤC HÌNH VẼ .................................................................................................
MỞ ĐẦU .........................................................................................................................
Chương 1. Những khái niệm cơ bản về nhật ký sự kiện và khai phá quy trình....
1.1.

Khái niệm nhật ký sự kiện .............................................................

1.2.

Khai phá quy trình .........................................................................

Chương 2. Khai phá mạng xã hội ..............................................................................
2.1.

Trích xuất đồ thị quan hệ xã hội từ các bản ghi sự kiện ................

2.2.

Các độ đo trong xây dựng đồ thị quan hệ xã hội ...........................

2.2.1.Độ đo dựa trên quan hệ nhân quả ..........................................


2.2.2.Độ đo dựa trên trường hợp chung ..........................................

2.2.3.Độđo dựa trên các hoạt động chung ......................................
2.3.

Phân tích mạng xã hội ...................................................................


Chương 3. Cải thiện độ đo trong xây dựng đồ thị quan hệ xã hội ..........................
3.1.

Đặt vấn đề ......................................................................................

3.2.

Giải pháp ........................................................................................

3.2.2.Áp dụng trọng số chuyển giao vào công thức độ đo .............


Chương 4. Cài đặt, thực nghiệm ................................................................................
4.1.

Công cụ MiSoN .............................................................................

4.2.

Thiết kế và cài đặt ..........................................................................

4.2.1.Thiết kế tổng thể ....................................................................

4.2.2.Cấu trúc tệp nhật ký sự kiện đầu vào .....................................

4.3.

Kết quả thực nghiệm ......................................................................


Kết luận ........................................................................................................................


6

DANH MỤC TỪ VIẾT TẮT
Từ viết tắt
HRM
CRM
HR
SNA


7

DANH MỤC BẢNG BIỂU
Bảng 1.1

Một ví dụ nhật ký sự kiệ

Bảng 1.2

Nhật ký sự kiện tổng qu

Bảng 2.1. Giá trị độ đo dựa trên sự chuyển giao công việc ................................
Bảng 2.2. Ma trận tần xuất thực thi hoạt động ....................................................
Bảng 4.1

Bảng trọng số các hoạt đ


Bảng 4.2. Ma trận trọng số khi bỏ qua chuyển giao công việc nhiều lần, bỏ qua
chuyển giao gián tiếp ...........................................................................................
Bảng 4.3. Ma trận trọng số khi bỏ qua chuyển giao công việc nhiều lần, có tính
tới chuyển giao gián tiếp .....................................................................................
Bảng 4.4. Ma trận trọng số khi có tính tới chuyển giao công việc nhiều lần, bỏ
qua chuyển giao gián tiếp ....................................................................................
Bảng 4.5. Ma trận trọng số khi có tính tới chuyển giao công việc nhiều lần, bỏ
qua chuyển giao gián tiếp ....................................................................................


8

DANH MỤC HÌNH VẼ
Hình 1.1. Sơ đồ quy trình tuyển dụng .................................................................
Hình 1.2. Sơ đồ quy trình dạng lưới Petri cho nhật ký sự kiện tổng quát ..........
Hình 2.1. Đồ thị quan hệ xã hội trích xuất từ nhật ký sự kiện Bảng 1.1 ............
Hình 2.2. Đồ thị minh họa về độ gần của nút trong đồ thị ..................................
Hình 2.3. Đồ thị minh họa về độ trung tâm cục bộ của nút ................................
Hình 2.4. Đồ thị minh họa về độ trung gian .......................................................
Hình 4.1. Kiến trúc của MiSoN ..........................................................................

Hình 4.2
Giao diện MiSoN hiển th
Staffware log .......................................................................................................
Hình 4.3. Vị trí và mối quan hệ của package SocialNetwork trong ProM .........
Hình 4.4. Thiết kế lớp cài đặt độ đo chuyển giao công việc ...............................
Hình 4.5

Biểu đồ công tác xây dựn


Hình 4.6

Sơ đồ luồng tính toán ma


9

MỞ ĐẦU
Cùng với sự phát triển của công nghệ thông tin, các hệ thống thông tin doanh
nghiệp ngày càng được ứng dụng phổ biến, trong đó có thể kể đến những cái tên
tiêu biểu: HRM – hệ thống quản lý nhân sự, CRM - quản trị quan hệ khách
hàng… Các hệ thống này lưu trữ dữ liệu sự kiện hoạt động của doanh nghiệp
dưới dạng các bản ghi có cấu trúc kèm theo thông tin về thời gian, chi tiết hoạt
động, đối tượng tham gia…, nhờ đó chúng ta có thể hình dung được luồng công
việc một cách có hệ thống. Tuy nhiên, các hệ thống nói trên mới mới chỉ dừng ở
mức lưu trữ và thống kê, dữ liệu sự kiện của các doanh nghiệp vẫn chưa được sử
dụng một cách hiệu quả trong việc hỗ trợ nhà quản trị đưa ra quyết định điều
hành.
Việc phân tích các bản ghi sự kiện đã được thực hiện từ rất sớm với nhiều công
trình nghiên cứu khác nhau. Hầu hết các đề tài nghiên cứu hiện nay đều đi theo
hướng khai phá quy trình - sử dụng các bản ghi sự kiện phục vụ việc xây dựng,
cải tiến và kiểm chứng mô hình quy trình. Tuy nhiên, bên cạnh các thông tin về
thời gian, công việc thì nhiều hệ thống còn ghi lại cả thông tin về yếu tố con
người (ví dụ người thực thi hành động, người được chuyển giao công việc…).
Như vậy, các bản ghi sự kiện ngoài việc phản ánh luồng công việc còn có thể
phản ánh được mối quan hệ cộng tác trong công việc giữa các cá nhân, nhóm
người trong doanh nghiệp.
Môi trường doanh nghiệp cũng có thể coi là một xã hội thu nhỏ, và mối quan hệ
trong công việc có thể coi là một loại quan hệ xã hội trong xã hội thu nhỏ đó.
Các cá nhân, nhóm người trong doanh nghiệp cùng mối quan hệ giữa họ hình

thành nên mạng xã hội. Từ các bản ghi sự kiện chúng ta có thể xây dựng nên mô
hình mạng xã hội cũng như phân tích dữ liệu để cho ra những thông tin tổng hợp
dưới góc nhìn thuận tiện, hữu ích, hỗ trợ cho nhà quản trị doanh nghiệp.
Luận văn của tôi dựa trên nghiên cứu của WMP Van der Aalst và Minseok Song
trình bày trong [1]. Trong đó, các bản ghi sự kiện sẽ được sử dụng trong khai
phá mạng xã hội (mà cụ thể hơn là khai phá mối quan hệ giữa các cá nhân/nhóm
người) nhằm phục vụ cho việc quản trị nhân sự trong doanh nghiệp.
Nội dung đề tài tôi sẽ trình bày bao gồm các phần như sau:
Chương 1: Trình bày những khái niệm cơ bản về nhật ký sự kiện, khai phá quy
trình và những kiến thức khác liên quan đến đề tài.


10

Chương 2: Trình bày về khai phá mạng xã hội bao gồm những khái niệm cơ bản,
các độ đo trong trích xuất đồ thị quan hệ xã hội và phân tích mạng xã hội.
Chương 3: Cải thiện độ đo trong trích xuất đồ thị quan hệ xã hội.
Chương 4: Cài đặt và thực nghiệm.
Hà Nội, ngày18 tháng10 năm 2015
Trần Thị Phương


11

Chương 1. Những khái niệm cơ bản về nhật ký sự kiện và
khai phá quy trình
Trong luận văn này, tôi sử dụng các bản ghi sự kiện lấy được từ các hệ thống
thông tin doanh nghiệp, kết hợp với phân tích quy trình như đầu vào đã biết cho
khai phá mạng xã hội. Vì vậy, trước khi trình bày về khai phá mạng xã hội cũng
như việc ứng dụng khai phá mạng xã hội trong môi trường doanh nghiệp, tôi xin

trình bày một vài khái niệm và lý thuyết liên quan bao gồm: khái niệm nhật ký
sự kiện (event log) và khai phá quy trình(process mining).
1.1.

Khái niệm nhật kýsự kiện

Giả sử rằng các hệ thống thông tin doanh nghiệp lưu trữ lịch sử hoạt động của
doanh nghiệp trong nhật ký sự kiện (event log)dưới dạng các bản ghi có cấu trúc
gọi là sự kiện (event). Các sự kiện ghi trong nhật ký sự kiện thỏa mãn những
tính chất sau[2]:
-

Mỗi sự kiện tương ứng với một trường hợp (case), một thể hiện quy trình
hoạt động.

-

Mỗi sự kiện tương ứng với một hoạt động(activity), một bước nào đó
trong một thể hiện quy trình hoạt động.

-

Mỗi sự kiện tương ứng có một người thực thi (performer hoặc resource).

-

Trong cùng một trường hợp, các sự kiện được ghi lại theo đúng trình tự
thực hiện về thời gian.

Để hiểu rõ hơn về các khái niệm trường hợp, hoạt động,người thực thi, ta xét ví

dụ sau về một quy trình tuyển dụng như Hình 1.1.

Hình 1.1. Sơ đồ quy trình tuyển dụng
Quy trình tuyển dụng bao gồm các bước


Bước 1: Trưởng phòng nhân sự lên kế hoạch tuyển dụng.



Bước 2: Bộ phận nhân sự (HumanResource -HR) đăng tin tuyển dụng.


12


Bước 3: Ứng viên nộp hồ sơ ứng dụng.



Bước 4: HR liên hệ với ứng viên để sắp xếp lịch phỏng vấn.



Bước 5: Trưởng bộ phận/HR v.v. phỏng vấn ứng viên.



Bước 6: Trưởng bộ phận/HR v.v. đánh giá kết quả phỏng vấn và lựa chọn
ứng viên phù hợp.




Bước 7: HR thông báo kết quả tuyển dụng cho ứng viên.

Trong ví dụ này, mỗi lần tuyển dụng tương ứng là một trường hợp. Các bước
trong quy trình tuyển dụng (1, 2,..., 6, 7) là các hoạt động. Trưởng phòng nhân
sự, HR, ứng viên, trưởng bộ phận… là những người thực thi.
1.2.

Khai phá quy trình

Sử dụng đầu vào là nhật ký sự kiện, mục tiêu của khai phá quy trình (Process
mining)là trích xuất thông tin về các quy trình [3], qua đó phát hiện, xây dựng và
cải tiến quy trình để nâng cao hiệu suất làm việc của doanh nghiệp. Trong phát
hiện quy trình, yếu tố con người được bỏ qua, và chúng ta chỉ quan tâm đến thứ
tự thực hiện của các hoạt động trong các trường hợp.
Để minh họa cho khái niệm khai pháquy trình, xét ví dụ với một nhật ký sự
kiệntổng quát như trongBảng 1.1.
Bảng 1.1 Một ví dụ nhật ký sự kiện tổng quát

Trường h
1
2
3
3
1
1
2
4

2
2
5
4
1
3
3


Sắp xếp lại theo từng trường hợp, chúng ta có Bảng 1.2.
Bảng 1.2 Nhật ký sự kiện tổng quát đã sắp xếp theo từng trường hợp
Trường hợp

Quan sát ví dụ trên ta thấy:
Mỗi trường hợp đều bắt đầu với hoạt động A và kết thúc bằng hoạt động
D.
- Giữa A và D có thể là E hoặc B và C.
-

- B và C không có thứ tự thực hiện cố định.
Áp dụng thuật toán alphaα1, chúng ta có thể biểu diễn mô hình thể hiện mối
quan hệ về mặt thứ tự thực hiện giữa các hoạt động dưới dạng lưới Petri 2 như
trong Hình 1.2:
1 />2
/>

14

Hình 1.2. Sơ đồ quy trình dạng lưới Petri cho nhật ký sự kiện tổng quát
Trong luận văn này, tôi tập trung vào khía cạnh xã hội (tức mối quan hệ giữa các

cá nhân) của nhật ký sự kiện. Vì vậy, các khái niệm cụ thể trong khai phá quy
trình, thuật toán và ký pháp biểu diễntôi sẽ không trình bày chi tiết.


15

Chương 2. Khai phá mạng xã hội
Khác với khai phá quy trình, khai phá mạng xã hội nhằm tới mục tiêu hỗ trợ nhà
quản trị đưa ra các quyết định về mặt nhân sự trong doanh nghiệp.Do đó, thay vì
tập trung vào thứ tự thực hiện của các hoạt động, khai phá mạng xã hội khai thác
mối quan hệ giữa các cá nhân, nhóm người tham gia vào quy trình trích xuất
được từ nhật ký sự kiện.
Quá trình khai phá mạng xã hội trải qua hai bước. Đầu tiên, đồ thị quan hệ xã
hội (sociogram) giữa các cá nhân tham gia vào quy trình hoạt động của doanh
nghiệp được trích xuất từ nhật ký sự kiện. Sau đó,đồ thị quan hệ xã hội được sử
dụng làm đầu vào cho phân tích mạng xã hội, tổng hợp dữ liệu và biểu diễn dưới
các góc độ, khía cạnh khác nhau, thuận tiện hơn cho việc ra quyết định.
2.1.

Trích xuất đồ thị quan hệ xã hội từ các bản ghi sự kiện

Từ góc nhìn toán học, đồ thị quan hệ xã hội là đồ thị G(P, R) trong đó[1]


P:tập các nút của đồ thị, tương ứng tập những người thực thi các hoạt
động trong các bản ghi sự kiện.



R ⊆ P × P là tập các mối quan hệ giữa những người thực thi.


Tùy thuộc vào yêu cầu phân tích mà đồ thị có thể có hướng hoặc vô hướng, có
trọng số hoặc không có trọng số. Nếu đồ thị G có trọng số, G có một hàm W
dùng để gán giá trị cho các phần tử của R. Tập P có thể được xác định trực tiếp
từ các bản ghi sự kiện. Tuy nhiên, R và W thì có nhiều tiêu chí khác nhau để xác
định. Ví dụ, ta có thể coi giữa những người trong cùng một phòng ban trên cây
cơ cấu tổ chức là có mối liên hệ với nhau. Trong cùng phòng ban đó, những
người làm việc cùng một nhóm nhỏ sẽ có mối liên hệ mạnh hơn so với những
người cùng phòng ban nhưng khác nhóm. Những người có cùng vai trò trong
công việc hay có sự chuyển giao công việc cho nhau cũng được coi là có mối
liên hệ với nhau(ta gọi đó là mối quan hệ chuyển giao công việc – Transfer of
work)
Theo ngôn ngữ của khai phá quy trình, giả sử trong cùng một trường hợp C, nếu
hoạt động A2 được thực hiện ngay sau hoạt động A1 thì mối quan giữa người
thực thi A1 và A2 được gọi là quan hệ chuyển giao công việc. Nhìn chung, mối
quan hệ chuyển giao công việc phản ánh khá chính xác mối quan hệ trong thực
tế hoạt động của doanh nghiệp.


16

Quay lại với ví dụ nhật ký sự kiện trong Bảng 1.1, ta có nhận xét như sau:
-

Chi và Duy có thể thực hiện các hoạt động như nhau (B và C)

-

Duy thì luôn làm việc với An (trường hợp 1 và 2), còn Chi thì lại luôn làm
việc với Mai (trường hợp 3 và 4).


Như vậy, mặc dù có thể Chi và Duy có cùng vai trò nhưng Chi không làm việc
với An và Duy không làm việc với Mai. Lập luận tương tự, dựa trên mối quan hệ
chuyển giao công việc, từ nhật ký sự kiệnBảng 1.1, ta có thể trích xuất ra đồ thị
quan hệ xã hội như Hình 2.1.

Hình 2.1. Đồ thị quan hệ xã hội trích xuất từ nhật ký sự kiện Bảng 1.1
Trong đồ thị trên Hình 2.1, giữa An và Duy, Mai và Chi có sự chuyển giao công
việc qua lại. Tuy nhiên giữa Mai và Minh chỉ có sự chuyển giao công việc từ
Mai sang Minh mà không có chiều ngược lại. Tương tự với mối quan hệ giữa An
và Minh, Mai và Nga. Đồ thị trên là đồ thị không có trọng số, tuy nhiên, để phục
vụ cho việc phân tích mạng xã hội, trọng số có thể được thêm vào đồ thị. Trọng
số được đánh căn cứ vào tần suất chuyển giao công việc, ví dụ, cung từ An tới
Duy có trọng số là 2.
2.2.

Các độ đo trong xây dựng đồ thị quan hệ xã hội

Để xây dựng được đồ thị quan hệ xã hội, chúng ta định nghĩa ra các độ đo khác
nhau nhằm đánh trọng số cho các cung thể hiện mối quan hệgiữa những người
thực thi. Gọi trọng số trên cung nối giữa người thực thi i và j là Wi,j. Nếu Wi,j>=
τ nào đó (τ là giá trị ngưỡng) thì ta thêm cung ịj vào tập R. Bằng cách đó, chúng
ta có được đồ thị G (P, R, W) có thể dùng làm đầu vào cho các công cụ phân tích
mạng xã hội. Trong luận văn này, tôi chỉ trình bày ba loại độ đo có thể được
trích xuất từ nhật ký sự kiện [1][2]:
(1)

Độ đo dựa trên quan hệ nhân quả



17
(2)

Độ đo dựa trên những trường hợp chung

(3)

Độ đo dựa trên các hoạt động chung

Để thuận tiện, tôi xin định nghĩa lại dưới dạng toán học khái niệm nhật ký sự
kiện và các ký pháp tôi sẽ sử dụng trong phần này[1][2].
Định nghĩa 2.1(Nhật ký sự kiện):Gọi A là một tập các hoạt động, P là tập ntác
nhân (cá nhân, nhóm người tham gia vào quy trình).E = A×P là tập hợp các sự
kiện có thể xảy ra. Khi đó:
-

Mỗi sự kiện được định nghĩa dưới dạng một cặp giá trị (a, p) thể hiện hoạt
động a được thực hiện bởi p.

-

C = E là tập các chuỗi sự kiện có thể (mỗi chuỗi sự kiện tương ứng với
một trường hợp).

-

B(C) là tập các túi từ trên C.

*


L ⊆ B(C) là một nhật ký sự kiện và là tập con của C.

Với sự kiện e(a, p) ta định nghĩa hai phép toán
(e) = a

-

a

-

p(e)

=p

2.2.1. Độ đo dựa trên quan hệ nhân quả
Độ đo dựa trên quan hệ nhân quả phản ánh cách luồng công việc di chuyển giữa
các cá nhân trong từng trường hợp. Tính nhân quả thể hiện trong hai loại mối
quan hệ mà chúng ta sẽ sử dụng làm độ đo trong phần này: quan hệ chuyển giao
công việc (Handover of work) và quan hệ thầu phụ (Sub-contracting).
Quan hệ chuyển giao công việc: Trong cùng một trường hợp, nếu có một hoạt
động thực hiện bởi j được thực hiện ngay sau hoạt động thực hiện bởi i thì ta nói
ở đây có sự chuyển giao công việc từ i sang j. Khi đánh giá quan hệ chuyển giao
công việc ta có thể kết hợp với khai phá quy trình để xác định có thật sự có mối
quan hệ nhân quả trong việc chuyển giao hay không. Ngoài ra, khi sử dụng làm
độ đo, khái niệm chuyển giao công việc cũng cần thay đổi để có thể phân cấp
được độ mạnh yếu của mối quan hệ giữa những người thực thi. Ngoài việc dựa
vào sự chuyển giao trực tiếp, chuyển giao gián tiếp cũng có thể được tính
tớithông qua việc sử dụng hệ số nhân quả β[1]. Ví dụ nếu có 3 hoạt động xen



18

giữa hoạt động thực hiện bởi i và hoạt động thực hiện bởi j thì hệ số nhân quả là

3

β .
Quan hệ thầu phụ: Nếu giữa hai hoạt động được thực hiện bởiicó hoạt động
được thực hiện bởi j thì ta có nói có mối quan hệ thầu phụ giữa i và j[1].
Độ đo dựa trên mối quan hệ nhân quả trong chuyển giao công việc

a.

tưởng cơ bản của độ đo này là những người thực thi có mối liên hệ với nhau
nếu giữa họ có sự chuyển giao công việc cho nhau. Khi đánh giá theo độ đo này,
có 3 yếu tố cần cân nhắc[1]:
Ý

-

Ta chỉ quan tâm đến chuyển giao công việc trực tiếp hay tính tới cả chuyển
giao công việc gián tiếp.

-

Nếu trong cùng một trường hợp, hai người thực thi chuyển giao công việc cho
nhau nhiều lần thì tính thành một lần hay nhiều lần.

-


Chỉ xét tới chuyển giao công việc khi có mối quan hệ nhân quả hay cả khi
chuyển giao công việc theo thứ tự bất kỳ (ví dụ trong Hình 1.2, ta thấy A và B
không có quan hệ nhân quả vì sau A không nhất thiết phải là B mà còn có thể
là C hoặc E)

3

Căn cứ theo những tiêu chí trên, chúng ta có thể có 8 (2 ) biến thể khác nhau
của độ đo này.
Công thức độ đo và các toán tử sử dụng trong độ đo được định nghĩa như sau:
Định nghĩa 2.2 (⊳, ⊵):Gọi L là một nhật ký sự kiện. Ký hiệu → biểu diễn mối quan hệ nhân quả trích xuất được từ L. Với a 1, a2∈ A, p1, p2∈ P, c = (c0, c1,…) ∈ L và n ∈
N ta có[1]

n

p

c

1

p = ∃ ≤ < − π (C ) = p ∧π (C + ) = p
2

0 i |c| n

p

i


1

p

i n

2

|p n p |
c =∑0 ≤ i < |c|−n
1

2

n

p

p=∃

1c

2

|p n p |
1c

2


=∑0 ≤ i < |c|−n

0 ≤ i < |c|−n


19


p1 nc p2 là một hàm trả về giá trị 1 nếu tồn tại ít nhất một trường hợp

trong

đó có cả p1 và p2 cùng tham gia, và khoảng cách giữa 2 hoạt động mà

p1 và

p2 thực hiện là n. Nếu n = 1 thì sự chuyển giao công việc là trực tiếp, ngược
lại, nếu n > 1 là chuyển giao gián tiếp.


| p1 nc p2 | trả ra số lần của p1 nc p2 trong cùng trường hợp c, hay nói cách
n
khác, | p1 c p2 | có tính đến việc trong cùng một trường hợp có thể có nhiều
lần chuyển giao công việc giữa những người thực thi.



p1
n


c

c

n

p2



| p1

c

n

p2 | cũng tương tự như p1

n
c

p2 và | p1

p2 | , chỉ khác

chỗ là ở đây ta có tính tới cả trường hợp chuyển giao công việc ngẫu nhiên
chứ không nhất thiết phải có mối quan hệ nhân quả.


Ví dụ với nhật ký sự kiện Bảng 1.1, xét trường hợp 1, thứ tự thực hiện của các

hoạt động là: A (An), B (Duy), C (An), D (Minh). Ta có


Duy

n



Duy

n



Duy c An = 0 vì mặc dù Duy thực hiện B ngay sau A thực hiện bởi An thực
hiện A nhưng giữa A và B không có mối quan hệ nhân quả bởi sau A không
nhất thiết là B mà có thể là C.



Duy c Minh = 1 do B và C có mối quan hệ nhân quả (sau B nhất định phải
có D)

c An
c

=1

Minh = 0


n

n

Sử dụng định nghĩa ở trên, ta có 8 công thức về mối quan hệ chuyển giao công
việc như sau:
Định nghĩa 2.3 (Độ đo dựa trên sự chuyển giao công việc): Gọi L là một nhật ký sự kiện, p1, p2∈ P và giá trị hệ số β (0 < β < 1) ta có [1]


p

1

p1

.

L

20

=

p ( ∑ c∈ L | p
2

1
1


c

p |) / ( ∑c∈L | c| −1)
2

p2 =

L

β

p

p2 =

1L

p .βp=
L
1
1

1

∑ c∈L ∑1≤ n <|c| ∧ p1

n

c p2


( ∑ c∈L ∑1≤ n <|c| β n−1)
=
1
c
L p2 ( ∑c∈L | p1

p
p

(

β n−1 )

2

.

L

p |) / ( ∑c∈L | c| −1)
p =(
2

∑c∈L ∧ p 1 p

2

(∑
β


p

1

p2 =

L

( ∑ c∈L ∑

.

p1

β

p2

=

L

p p



1L

2


.

tổng số lần chuyển giao công việc của nhật ký sự kiện.
p1 L p2 cũng vậy
nhưng đã được bỏ qua những lần chuyển giao công việc trùng nhau trong
cùng một trường hợp. Ví dụ trong Bảng 1.1 ta có:
An

L Duy

= 2/14

L Duy

= 2/5.

.

An

vào độ đo bằng cách bổ sung thêm hệ số giảm β. Nếu trong cùng một trường
hợp, giữa hai người thực thi có n sự kiện thì hệ số giảm sẽ là βn.


p1 βL p2 quan tâm đến tất cả các lần chuyển giao công việc trong nhật ký sự
kiện
.




p1

β
L

p2 bỏ qua những lần những lần chuyển giao công việc trong cùng một

trường hợp.


Nếu áp dụng công thức trên cho nhật ký sự kiện trong Bảng 1.1, ta có kết quả
như trong Bảng 2.1.


21

Bảng2.1. Giá trị độ đo dựa trên sự chuyển giao công việc
β
0.1
0.5
0.9
Ta thấy Nếu β = 1 thì khả năng phân loại độ mạnh yếu của mối quan hệ giảm đi
đáng kể bởi khoảng cách giữa các cá nhân được san bằng, chỉ cần có chuyển
giao công việc, bất kể là có bao nhiêu sự kiện xen giữa đều coi như nhau. Điều
này là không chính xác khi đánh giá mối quan hệ xã hội trong thực tế. Khi β
càng tăng thì độ chênh lệch giữa các giá trị càng giảm [1].
Bốn công thức còn lại cũng tương tự như bốncông thức trên, chỉ khác là chúng
chỉ tính tới quan hệ nhân quả giữa các hoạt động.
Ta có thể gộp 8 công thức trên thành 4 công thức như sau:
Định nghĩa 2.4 (Công thức chung cho độ đo dựa trên sự chuyển giao công

việc): Gọi L là một nhật ký sự kiện, p1, p2∈ P và giá trị hệ số β (0 < β < 1), k ∈ N ta có [1]

β ,k
L

p1
.

p

p2 =
β ,k

p2 =

L

1

β ,k

p1

p2 =
L

.

β ,k


p
L

1

Trong các công thức gộp này, chúng ta thêm vào một hệ số nữa là độ sâu tính
toán k (calculation depth factor). Khi tính toán độ đo, k thể hiện giá trị lớn nhất
của số sự kiện xen giữa hai hoạt động thực hiện bởi 2 người thực thi. Ví dụ với k

p2 =


22

3 thì ta chỉ tính tới những lần chuyển giao trực tiếp hoặc chuyển giao gián tiếp
chỉ cách nhau 1 hoặc 2 sự kiện. Ta thấy:
=



Với k = 1, β= 1 thì ta có công thức



Với k > max(|c|) ta có công thức

p1

p1


1,1
L p2 = p1

β ,k
L

p2 = p1

L

p2

β
L

p2

Do các nhật ký sự kiện thường có kích thước lớn nên việc tính tới tất cả các
trường hợp chuyển giao công việc dẫn đến phân tích chậm và không hiệu quả.
Vì vậy chọn giá trị k phù hợp là rất quan trọng trong khai phá mạng xã hội.
a. Độđo dựa trên quan hệ thầu phụcông việc
Quan hệ thầu phụ công việc cũng dựa trên sự nối tiếp công việc giữa những
người thực thi. Với mối quan hệ thầu phụ, cũng giống như chuyển giao công
việc, tacũng có thể điều chỉnh để cho ra các công thức độ đo khác nhau. Sự nối
tiếp công việc là trực tiếp tức là chỉ có 1 hoạt động ở giữa 2 hoạt động thực hiện
bởi một người thực thi khác. Khi có nhiều hoạt động xen giữa thì đó là thầu phụ
gián tiếp. Hệ số giảm β cũng được đưa vào công thức cho trường hợp thầu phụ
gián tiếp. Ví dụ, giả sử có 4 hoạt động, trong đó hoạt động đầu và cuối được
thực hiện bởi cùng người thực thi i, hoạt động thứ 2 và 3 được thực hiện theo
thứ tự bởi người thực thi j, k.Khi đó, chúng ta có thể trích xuất hai mối quan hệ

từ i tới j và k.
Định nghĩa 2.5 (◊, ◊) Gọi L là một nhật ký sự kiện. Ký hiệu → biểu diễn mối
quan hệ nhân quả trích xuất được từ L. Với a1, a2∈ A, p1, p2∈ P, c = (c0, c1,…) ∈ L, |c| > 2, n ∈ N và n > 1 ta có[1]

p◊n

1

| p ◊ n p |=
1

c

2

c

2

0

∑ 0 ≤ i <|c|−n ∑i < j p◊n

p=∃
c

1

| p1


p=∃

2


0 trong trường hợp khác

0


23

p1◊cn p2



trả ra giá trị 1 nếu giữa haihoạt độngcó khoảng cách n được thực

hiện bởi p1 có hoạt động thực hiện bởi p 2. Công thức này đã bỏ qua cả yếu tố
ràng buộc nhân quả và bỏ qua việc chuyển giao công việc nhiều lần trong
2

cùng một trường hợp. Ví dụ trong Bảng 1.1, trường hợp 1 thì An ◊c Duy = 1

| p1◊cn p2 | trả ra số lần p1◊cn p2 trong trường hợp c, hay nói cách khác, ở đây



ta tính tới cả việc chuyển giao công việc nhiều lần trong cùng một trường

hợp.

p1 ◊cn p2 và | p1 ◊cn p2 | cũng tương tự như trên, nhưng ở đây ta chỉ tính tới



những trường hợp mà giữa các hoạt động thực sự có quan hệ nhân quả thay
vì thực thi ngẫu nhiên.
Sử dụng những ký pháp được xác định tại định nghĩa 2.5 ta có các công thức cho
độ đo mức độ trung gian (in-between metric) dựa trên mối quan hệ thầu phụnhư
sau:
Định nghĩa 2.6 (Độ trung gian): Gọi L là một nhật ký sự kiện. p1, p2∈ P, c = (c0, c1,…) ∈ L, |c| > 2 và giá trị hệ số β (0 < β < 1) [1]

p

◊L

1

p2

=

(∑ c∈L

| p1◊c2 p2 |) / ( ∑c∈L | c| −2)

.

=


p1 ◊L p2
p1◊βL

p2

1

( ∑c∈L ∧ p ◊2 p ) / | L |

=

(

.

p1 ◊ βL

p2

( ∑ c∈L ∑2 ≤ n
∑ c∈L ∑2 ≤ n <|c|

=

p ◊

(∑

1


L

p
◊L

. p2

= (∑c∈L

| p1 ◊c2 p2 |) / ( ∑c∈L | c|

p =(

1)

1

−2)

2

∑c∈L ∧ p1◊c2 p2

p1 ◊βL

.
p1 ◊

(∑


/|L|

p2 =

(

( ∑ c∈L ∑2 ≤ n <
∑ c∈L ∑2 ≤ n <|c|

( ∑ c∈

β
L

p2

=

( ∑ c∈


Tuy nhiên, cũng như mối quan hệ chuyển giao công việc, ta cũng có thể gộp 8
công thức trên thành 4 công thức cho độ trung gian bằng cách đưa thêm vào hệ