Tải bản đầy đủ (.docx) (9 trang)

Tiểu luận môn cơ sở dữ liệu nâng cao KEY PLAYER TRONG MANG XÃ HỘI

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (148.85 KB, 9 trang )

KEY PLAYER TRONG
MẠNG XÃ HỘI
Đồ án hết môn CSDL nâng cao
Đồ án trình bày tóm tắt cơ sở lý thuyết về phân tích
mạng xã hội và tìm tập key players thông qua các chỉ số
centrality. Đi kèm với báo cáo là chương trình minh họa có hỗ
trợ chức năng vẽ đồ thị và hỗ trợ tính toán các thông số để
phục vụ việc minh họa cơ sở lý thuyết.
Giảng viên hướng dẫn: PGS. TS. ĐỖ
PHÚC
Học viên thực hiện: Phạm Nguyễn
Trường An
Mục lục
2
CHƯƠNG 1. TỔNG QUAN VỀ PHÂN TÍCH MẠNG
XÃ HỘI
Mạng xã hội đang là một hiện tượng trong lĩnh vực công nghệ
thông tin ngày nay. Ngay cả với những người không công tác trong lĩnh
vực công nghệ thông tin cũng khó có thể một tuần (hoặc có lẽ là một
ngày) trôi qua mà bạn không nhận được kết nối của một đồng nghiệp trên
LinkedIn, yêu cầu kết bạn trên Facebook. Vậy mạng xã hội là gì?
Theo Stanley Wasserman và Katherine Faust trong [1] thì mạng xã
hội là “Một cấu trúc xã hội được hình thành từ nhiều tác tử (có thể là các
nhân hoặc tổ chức) và các quan hệ tay đôi giữa những tác tử đó”. Trong
ngữ cảnh giao tiếp thường nhật chúng ta dung lẫn lộn thuật ngữ “mạng xã
hội” để chỉ một trang web cung cấp dịch vụ mạng xã hội. Một trang trang
mạng xã hội nơi mọi người kết nối, trao đổi và chia sẻ trực tuyến. Chúng
ta có thể tìm thấy rất nhiều trang xã hội trên Web ngày nay. Chúng bao
gồm các mạng xã hội (như Facebook và LinkedIn), các trang tin tức xã
hội (Digg và Reddit), và các trang khám phá/đánh dấu (Delicious và
Stumble-Upong). Mỗi trang sở hữu những đặc tính riêng, nhưng hầu hết


đều có khả năng tạo lập hồ sơ người sử dụng, kết nối, trao đổi cũng như
chia sẻ thông tin với các thành viên khác trong cùng mạng lưới đó.
Với sự trợ giúp của internet, các trang mạng xã hội có thể được tiếp
cận trên toàn thế giới mà không bị giới hạn về địa lý. Điều này giúp hình
thành những mạng xã hội cực lớn với hang trăm triệu tác tử đến từ nhiều
quốc gia và nền văn hóa khác nhau. Nghien cứu các cấu trúc mạng xã hội
này cung cấp những cái nhìn vô giá đối với ngành xã hội học cũng như
ngành khoa học hành vi. Để có thển nghiên cứu những mạng xã hội cực
lớn như vậy thì cần sự trợ giúp của phương pháp Phân tích mạng xã hội
(social network analysis).
Khi phân tích mạng xã hội, chúng ta xem các mối liên hệ xã hội
như những mối liên hệ trong lý thuyết đồ thị. Trong đó mỗi tác tử là một
đỉnh và mối liên hệ giữa các tác tử sẽ tương ứng với các cạnh trong đồ thị
[2].
3
Tại sao bạn nên quan tâm đến mạng xã hội? Cũng giống như đáp
án cho câu hỏi tại sao bạn nên quan tâm đến Google, câu trả lời là bởi vì
nó mang đến một phương thức tuyệt vời giúp bạn kết nối và thu hút các
khách hàng tiềm năng. So với Google, nhiều khách hàng tiềm năng của
bạn hay “lượn lờ” trên các mạng xã hội, và bạn cũng cần phải tham gia
cuộc chơi này nếu muốn kết nối với họ.
1.1. Giới thiệu khái niệm.
Phân tích mạng xã hội sử dụng nhiều kiến thức cả về xã hội học, lý
thuyết đồ thị và khoa học máy tính. Trong phạm vi báo cáo chúng ta
không đi vào kiến thức xã hội học mà chỉ khảo sát những phần giao thoa
của lý thuyết đồ thị và khoa học máy tính có thể được sử dụng trong phân
tích mạng xã hội.
Centrality: Centrality là một độ đo giúp đánh giá mức độ quan
trọng của một node (hoặc một nhóm node) trong mạng xã hội. Có nhiều
cách đánh giá centrality như betweeness centrality, closeness centrality,

eigenvector centrality, alpha centrality and degree centrality[4].
Density: Độ dày của các liên kết trong mạng xã hội. Tính bằng số
liên kết trên tổng số liên kết cần thiết để mạng xã hội tạo thành một đồ thị
đầy đủ (complete graph).
Đường đi (path): Đường đi giữa hai node là danh sách các node kết
nối hai node này. Độ dài đường đi có thể được tính bằng số node hoặc
bằng tổng các trọng số những cạnh nối trong đường đi nếu như đồ thị là
có trọng số
Tie strength: Thể hiện mức độ thân thiết giữa hai tác tử, chỉ số này
thường được mô tả bằng trọng số của cạnh tương ứng trong đồ thị.
Cliques: Clique là một nhóm node bên trong mạng xã hội có tất cả
các đỉnh liên kết trực tiếp đến nhau. Clique thường thể hiện một nhóm
bạn thân thiết hay một nhóm quen biết có cùng một mối quan tâm nào đó.
Các clique thường được đặc biệt chú ý khi phân tích mạng xã hội.
CHƯƠNG 2. KEYPLAYERS.
4
Keyplayes là những tác tử có uy tín cao trong mạng xã hội, có khả
năng tác động và truyền đạt thông tin tới một lượng lớn các tác tử khác.
Đây là những tác tử quan trọng thường được đặc biệt chú ý khi phân tích
mạng xã hội.Đầu tiên, chúng ta sẽ cùng phân tích các độ đo có liên quan
đến việc xác định keyplayes và phương pháp tính các độ đo này.
2.1. Degree centrality:
Trong mạng xã hội thì degree centrality của một tác tử là số lượng
các tác tử có quan hệ với tác tử đang xét. Nói cách khác chính là số bậc
của một đỉnh. Nếu đồ thị của chúng ta là đồ thị có hướng có trọng số,
chúng ta sẽ có hai loại degree centrality là: Degree centrality đến (in-
degree centrality), số đỉnh có cạnh liên kết với dỉnh đang xét. Và Degree
centrality đi (out-degree centrality), số đỉnh mà đỉnh đang xét liên kết
đến.
Degree centrality cho ta biết mức độ nổi tiếng hay mức độ rộng rãi

trong quan hệ của một tác tử. Một tác tử có degree centrality càng cao thì
khả năng tác tử đó có vai trò càng lớn trong mạng, có sức ảnh hưởng đến
tác tử khác nên degree centrality là một yếu tố để xác định keyplayes. Ta
có công thức:
Tính toán degree centrality cho tất cả các đỉnh của đồ thị là một
thao tác có độ phức tạp: nếu đồ thị là dày và nếu đồ thị
thưa.
2.2. Closeness centrality:
Closeness centrality đo mức độ gần gũi của một node đến tất cả các
node khác liên thông với nó. Trong mạng xã hội độ đo này tương ứng với
thời gian cần thiết để thôgn tin truyền từ một tác tử đến các tác tử khác
mà tác từ này bằng cách nào đó có thể liên hệ được. Khoảng cách này
càng nhỏ thì khả năng truyền tin của tác tử càng lớn và tác tử có vai trò
càng cao.
Tuy nhiên trong trường hợp đặc biệt nếu tác tử không liên hệ với ai
thì closeness centrality của tác tử đó sẽ đặt cực tiểu (là 0). Để tránh
trường hợp này đã có nhiều công thức biến đổi được đưa ra trong đó có
công thức của Dangalchev[7]:
5
2.3. Betweeness centrality.
Betweeness centrality của một tác tử là xác xuất để thông tin truyền
qua lại giữa hai tác tử khác phải đi qua tác tử này. Độ đo này càng lớn
nếu tầm quan trọng của tác tử càng cao. Ta có công thức:
Trong đó là tổng số các đường đi ngắn nhất giữa 2 node s và t.
Và là số lượng các đường đi ngắn nhất giữa s và t có đi qua v
Để tính betweeness centrality nếu phải tìm tất cả các dường đi ngắn
nhất ko phải là dễ dàng. Tuy nhiên Ulrik Brandes đã phát triển một thuật
toán có thẻ thực hiện trong độ phức tạp O(VE):
6
2.4. Key players hay key player?

Một câu hỏi thường được đặt ra là: Ai là người quan trọng nhất
trong mạng xã hội. Tuy nhiên thực tế để xác định duy nhất chỉ một người
quan trọng là rất khó. Đặc biệt là với các mạng xã hội lớn vẫn có trường
hợp một người chơi chính lại không thể liên hệ được với một clique nào
đó trong mạng. Vì thế thông thường chúng ta sẽ xác định tập các người
chơi chính được lấy bằng hội của tập hợp những tác tử có những độ đo
centrality là lớn nhất.
7
CHƯƠNG 3. CHƯƠNG TRÌNH MINH HỌA
Chương trình được nộp chung với lớp trong đĩa CD của lớp trưởng.
Dưới đây là sơ lược về một số định nghĩa và một số độ đo thường
được sử dụng trong phân tích mạng xã hội. Chi tiết hơn về các
8
TÀI LIỆU THAM KHẢO
[1]Wasserman, Stanley; Faust, Katherine (1994). "Social
Network Analysis in the Social and Behavioral Sciences".
Social Network Analysis: Methods and Applications.
Cambridge University Press. pp. 1–27
[2]Pinheiro, Carlos A.R. (2011). Social Network Analysis in
Telecommunications. John Wiley & Sons. p. 4
[3]D'Andrea, Alessia et al. (2009). "An Overview of Methods
for Virtual Social Network Analysis". In Abraham, Ajith et
al Computational Social Network Analysis: Trends, Tools
and Research Advances. Springer. p. 8.
[4]Opsahl, Tore; Agneessens, Filip; Skvoretz, John (2010).
"Node centrality in weighted networks: Generalizing degree
and shortest paths". Social Networks 32 (3): 245.
[5]Granovetter, M. (1973). “The strength of weak ties”. 78. pp.
1360-1380.
[6]Dangalchev Ch., Residual Closeness in Networks, Phisica A

365, 556 (2006).
[7]Brandes, Ulrik (2001). "A faster algorithm for betweenness
centrality" (PDF). Journal of Mathematical Sociology 25:
163–177. Retrieved 10.11.2011
9

×