Tải bản đầy đủ (.doc) (17 trang)

Tiểu luận môn cơ sở dữ liệu nâng cao Nhận dạng tập Key Players trong Mạng xã hội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (344.76 KB, 17 trang )

Đại học Quốc Gia Thành phố Hồ Chí Minh
Trường Đại học Công nghệ thông tin
Khoa Mạng máy tính và truyền thông
o0o
Bài báo cáo môn:
CƠ SỞ DỮ LIỆU NÂNG CAO
Đề tài:
Nhận dạng tập Key Players
trong Mạng xã hội
GVHD : PGS.TS. Đỗ Phúc
Học viên : Bùi Anh Kiệt
MSHV : CH1101018
Tp. Hồ Chí Minh – Ngày 11 tháng 08 năm 2012
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
Lời mở đầu
Ngày nay, cùng với sự phát triển bùng nổ của công nghệ thông tin trong hầu hết
các lĩnh vực trong cuộc sống, các ứng dụng ngày càng có một lượng dữ liệu
khổng lồ, từ đó dẫn đến việc lưu trữ và xử lý dữ liệu ngày càng khó khăn. Hơn
nữa hệ thống cở sở dữ luôn được cập nhật và thay đổi. Đôi khi việc cập nhật và
thay đổi hệ thông cơ sở dữ liệu sẽ làm thay đổi cả cấu trúc của hệ thống hiện thời.
Do đó hệ thống cơ sở dữ liệu ngày nay cần đòi hỏi tính mềm dẻo và quá trình thao
tác vào hệ thống phải linh động và không làm gián đoạn ứng dụng.
Với những yêu cầu trên, dữ liệu đồ thị đã ra đời. Dữ liệu đồ thị là cách thức lưu
trữ thông tin ở dạng đồ thị những nút và cạnh. Với cách thức lưu trữ này, việc
quản lý dữ liệu trở nên mềm dẽo và dễ dàng hơn ngay cả trong việc ứng dụng tri
thức vào khối dữ liệu lưu trữ.
Tuy nhiên khi lượng dữ liệu này lớn, việc quản lý và truy xuất trở nên khó khăn và
phức tạp hơn nhiều. Với dạng mô hình đồ thì với những nút và cạnh, ý tưởng quản
lý dựa trên trên đồ thị được hình thành. Một trong số này đó là việc quản lý dữ
liệu đồ thị dựa trên các Key Players.
Tài liệu này được viết với mục đích trình bày cách nhận dạng các Key Players


trong Mạng xã hộ, trên cơ sở xác định Key Players trên đồ thịi. Đây là một bài
toán cần thiết cho những Mạng xã hội hiện nay vốn có lượng dữ liệu vô cùng lớn
và phức tạp hiện nay.
Và để hoàn thành tài liệu này, ngoài nổ lực bản thân còn có sự giúp đỡ rất lớn từ
PGS.TS Đỗ Phúc, người đã truyền đạt ý tưởng và những vấn đề quan trọng trong
bài toán xác định Key Players của Mạng xã hội
Học viên: Bùi Anh Kiệt – CH1101018 2
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
Mục lục
Lời mở đầu 2
Mục lục 3
1 Mạng xã hội 4
1.1 Khái niệm 4
1.2 Đặc điểm chính 5
1.3 Phân tích mạng xã hội 6
2 Key Players và Đồ thị mạng xã hội 7
2.1 Khái niệm 7
2.2 Đặc điểm 8
2.3 Vai trò 9
3 Xác định Key Players trong mạng xã hội 10
3.1 Một số định nghĩa 10
3.2 Liên hệ trên Mạng xã hội 13
3.3 Cách xác định Key Players 13
4 Kết luận 16
Tài liệu tham khảo 17
Học viên: Bùi Anh Kiệt – CH1101018 3
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
1 Mạng xã hội
1.1 Khái niệm
Có rất nhiều khái niệm Mạng xã hội tồn tại hiện nay có thể kể ra như:

(1) Mạng xã hội hay còn gọi là Mạng xã hội ảo là dịch vụ nối kết các thành
viên cùng sở thích trên Internet lại với nhau với nhiều mục đích khác nhau
không phân biệt không gian và thời gian. Mạng xã hội có những tính năng
như chat, e-mail, phim ảnh, voice chat, chia sẻ tập tin, blog và xã hội.
Như vậy Mạng xã hội có thể ngầm hiểu là một thế giới ảo (xã hội ảo) với
các thành viên là các cư dân mạng. Cách để các cư dân mạng liên kết với
nhau có thể dựa trên các nhóm, dựa trên các thông tin cá nhân, dựa trên sở
thích cá nhân hoặc lĩnh vực quan tâm. (Theo Wikimedia).
(2) Mạng xã hội là một tập hợp người hoặc các tổ chức hoặc các thực thể xã
hội khác được kết nối với nhau thông qua mạng máy tính. (Theo nhà xã hội
học Laura Garton – Trường ĐH Toronto)
(3) Mạng xã hội như một đồ thị trong đó các nút có thể là một cá thể, tổ chức,
còn các liên kết là mô phỏng các quan hệ trong xã hội thực. (Theo ông Vũ
Kiêm Văn, giám đốc công ty truyền thông VSMC - công ty sáng lập Mạng
xã hội thehetre.vn)
Từ những khái niệm trên có thể hình dung Mạng xã hội là một tập hợp các cá
thể (con người) thông qua mạng máy tính và các cá thể này có cùng sở thích,
không phân biệt không gian và thời gian. Mỗi cá thể được xem như một nút
trong một Đồ thị mạng xã hội và mối quan hệ giữa các cá thể đó chính là cạnh
của đồ thị.
Học viên: Bùi Anh Kiệt – CH1101018 4
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
Hình 1-1 Ví dụ về mạng xã hội
1.2 Đặc điểm chính
o Điểm nổi bật của Mạng xã hội mà ai cũng nhận thấy đó là tính kết nối và
chia sẻ rất mạnh mẽ. Nó phá vỡ những ngăn cách về địa lý, ngôn ngữ, giới
tính lẫn quốc gia. Những gì bạn làm, bạn nghĩ, cả thế giới có thể chia sẻ với
bạn bè chỉ trong tích tắc.
o Mạng xã hội được tạo ra để tự thân nó lan rộng trong cộng đồng thông qua
các tương tác của các thành viên trong chính cộng đồng đó. Mọi thành viên

trong Mạng xã hội cùng kết nối và mỗi người là một mắt xích để tạo nên
một mạng lưới rộng lớn truyền tải thông tin trong đó.
o Về cơ bản, Mạng xã hội giống như một trang web mở với nhiều ứng dụng
khác nhau. Mạng xã hội khác với trang web thông thường ở cách truyền tải
thông tin và tích hợp ứng dụng. Trang web thông thường cũng giống như
truyền hình, cung cấp càng nhiều thông tin, thông tin càng hấp dẫn càng tốt
còn Mạng xã hội tạo ra các ứng dụng mở, các công cụ tương tác để mọi
người tự tương tác và tạo ra dòng tin rồi cùng lan truyền dòng tin đó.
Học viên: Bùi Anh Kiệt – CH1101018 5
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
1.3 Phân tích mạng xã hội
Phân tích Mạng xã hội là một khoa học xã hội, với mục đích tìm hiểu về những
mối quan hệ tồn tại và các hành vi ứng xử trong xã hội. Bên cạnh đó việc phân
tích Mạng xã hội còn hổ trợ cho việc giải quyết các vấn đề khác trong xã hội như
việc hình thành cơ cấu xã hội. Việc phân tích Mạng xã hội có ý nghĩa quang trọng
trong việc quản lý xã hội.
Có rất nhiều phương pháp phân tích Mạng xã hội, tuy nhiên phương pháp phân
tích dựa trên Đồ thị mạng xã hội là phương pháp được lựa chọn nhiều nhất. Với
những khái niệm đã có có trong Lý thuyết đồ thị, việc nghiên cứu dựa trên Đồ thị
mạng xã hội trở nên đơn giản hơn. Trong Đồ thị mạng xã hội mỗi cá thể đước xem
là một nút, và mối quan hệ giữa các cá thể được xem như các cạnh nối các nút đó.
Một trong những vấn đề quan trọng trong quá trình nghiên cứu Mạng xã hội đó là
việc xác định các nhân tố đóng vai trò quan trọng trong việc quyết định cấu trúc
hay là cơ sở để thực hiện việc tìm kiếm các nhân tố khác trong Mạng xã hội nhanh
chóng và hiệu quả. Các nhân tố này được gọi là Key Player. Cách thức để xác định
tập Key Players trong một Mạng xã hội sẽ được trình bày trong phần Xác định
Key Players trong Mạng xã hội được trình bày bên dưới.
Việc xác định Key Player trong Mạng xã hội giống như việc xác định các nút chốt
trong đồ thị. Và trong bài viết này, Key Players được xác định dựa trên dữ liệu Đồ
thị mạng xã hội.

Học viên: Bùi Anh Kiệt – CH1101018 6
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
2 Key Players và Đồ thị mạng xã hội
2.1 Khái niệm
2.1.1 Đồ thị mạng xã hội
Đồ thị mạng xã hội là một khái niệm dung để mô tả mạng xã hội dưới dạng đồ
thị. Trong Đồ thị mạng xã hội các cá thể được biểu hiện như một nút và mối
quan hệ của các cá thể trong Mạng xã hội chính là các cạnh nối các nút lại với
nhau.
Hình 2-2 Ví dụ về Đồ thị mạng xã hội
2.1.2 Key Players:
Key Players trong Đồ thị mạng xã hội là những nốt trong đồ thị có vai trò
quyết định đến đồ thị. Các Key Players này chính thường là các nốt có bậc cao
trong đồ thị hoặc là những nốt không có số bậc cao nhưng có tính quyết định
đến cấu trúc của đồ thị.
Học viên: Bùi Anh Kiệt – CH1101018 7
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
Hình 2-3 Ví dụ về các Key Players trong mạng xã hội
Trong ví dụ trên, ta thấy các đỉnh (3) có số bậc là 3, (6) có số bậc là 4, (9) có số
bậc là 4 có thể xem là các đỉnh cơ bản của đồ thị vì từ các đỉnh này ta có thể tìm
được hầu hết các đỉnh còn lại.
Tuy nhiên có một đỉnh cần chú ý là (7). Đỉnh này tuy có số bậc chỉ là 2 nhưng có
vai trò quan trọng trong đồ thị. Đỉnh này có ý nghĩa quyết định đến cấu trúc của đồ
thị. Nếu thiếu đỉnh này, đồ thị sẽ bị chia thành 2 phần độc lập. Do đó, đỉnh (7)
đáng được xem là Key Players hơn những đỉnh khác.
Vậy nên việc xác định Key Players trong Đồ thị mạng xã hội nên nghĩ đến việc
xác định một tập các đỉnh hơn là một đỉnh.
2.2 Đặc điểm
Key Players là những thành phần quan trọng của một đồ thị và chúng có một số
đặt trưng như sau:

o Nhân tố quyết định cho cấu trúc của đồ thị. Từ các phần tử Key Players này
ta có thể xác định được tất cả các các đỉnh còn lại của đồ thị.
Học viên: Bùi Anh Kiệt – CH1101018 8
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
o Thông thường thì các Key Players có số bậc lớn trong đồ thị. Tuy nhiên
trong một số trường hợp đặc biệt thì các Key Players có số bậc không lớn
nhưng lại là thành phần không thể thiếu.
o Tập Key Players trong Đồ thị mạng xã hội tốt là một tập hợp mà trong đó
không có những phần tử thừa. Với một tập Key Players tối giản sẽ hổ trợ
rất nhiều cho các thao tác trên cơ sở dữ liệu
2.3 Vai trò
Các Key Players là thành phần không thể thiếu của một đồ thị. Đặt biệt với những
Đồ thị mạng xã hội có cơ sở dữ liệu lớn, Key Players càng thể hiện vai trò một
cách rỏ nét hơn. Việc xác định Key Players trong hệ thống Đồ thị mạng xã hội sẽ
giúp cho việc quản lý hệ thống Đồ thị mạng xã hội trở nên dễ dàng và thuận tiện
hơn đặt biệt là trong quá trình tìm kiếm và cập nhật cơ sở dữ liệu.
Học viên: Bùi Anh Kiệt – CH1101018 9
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
3 Xác định Key Players trong mạng xã hội
3.1 Một số định nghĩa
3.1.1 Bậc
Trong Mạng xã hội, khái niệm bậc là khái niệm dùng để chỉ số lượng mối quan
hệ mà một người nào đó có được, là số lượng những người khác mà người đó
có khả năng tìm trực tiếp đến.
3.1.2 Nút trung tâm
Những nút ở trung tâm đồ thị, có được nhiều liên kết đến các nút khác (có số
bậc cao), thì nút đó được gọi là nút trung tâm của đồ thị.
3.1.3 Đường đi ngắn nhất
Đường đi ngắn nhất giữa hai nút là đường đi tốn ít chi phí nhất (Qua ít nút
trung gian nhất).

3.1.4 Độ giữa
Độ giữa của một nút là tầng số xuất hiện của nút đó với tư cách là đỉnh trung
gian trong danh sách đường đi ngắn nhất của đồ thị. Độ giữa của một nút được
tính bằng tỉ lệ giữa số đường đi ngắn nhất có trung gian là nút đó và tổng độ
dài của các cạnh trong đồ thị.
Học viên: Bùi Anh Kiệt – CH1101018 10
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
Hình 3-4 Ví dụ về cách xác định độ giữa
Xét ví dụ trên (Hình 3-1):
 Danh sách đường đi ngắn nhất có thể có tồn tại đỉnh trung gian:
(1, 3, 4), (1, 2, 5), (1, 3, 5) , (1, 2, 5, 6), (1, 2, 5, 7), (1, 3, 5, 6), (1, 3, 5, 7)
(2, 3, 4), (2, 5, 6), (2, 5, 7)
(3, 5, 6), (3, 5, 7)
(4, 3, 5), (4, 3, 5, 6), (4, 3, 5, 7)
(6, 5, 7)
 Tổng số cạnh ngắn nhất có thể có trên đồ thị: 16
 Xét nút 1: không xuất hiện với vai trò là nút trung gian trong danh
sách các cạnh ngắn nhất, nên độ giữa của nút 1 là 0.
 Xét nút 2: Nút 2 xuất hiện một lần vậy độ giữa của nút 2: B
2
= 3/16
= 0.19
 Tương tự cho các nút còn lại.
Học viên: Bùi Anh Kiệt – CH1101018 11
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
3.1.5 Độ kề
Độ kề trong Đồ thị mạng xã hội có thể được hiểu là độ nhanh mà người đó có
thể tìm đến tất cả những người khác trong Đồ thị mạng xã hội. Độ kề được xác
định bằng hệ số của tổng tất cả các đường đi ngắn nhất và số nút mà từ đỉnh đó
có đường đi đến.

Hình 3-5 Ví dụ về cách xác định đồ kề
Trong ví dụ trên ta có độ kề của các đỉnh được xác định như sau:
• Nút 1:
Tổng số nút có thể tìm tới là: 6
Danh sác đường đi ngắn nhất: (1, 2), (1, 3), (1, 3, 4), (1, 3, 5), (1, 3,
5, 6), (1, 3, 5, 7). Tổng đường đi ngắn nhất là: 12 (mỗi đường nối
giữa hai nút được tính là 1).
==> Độ kề của nút 1 = 12/6 = 2
• Nút 2:
Tổng số nút có thể tìm tới là: 6
Danh sác đường đi ngắn nhất: (2, 1), (2, 3), (2, 3, 4), (2, 5), (2, 5, 6),
(2, 5, 7). Tổng đường đi ngắn nhất là: 9
==> Độ kề của nút 1 = 9/6 = 1.5
Học viên: Bùi Anh Kiệt – CH1101018 12
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
• Tương tự cho các nút còn lại.
3.1.6 Vector riêng
Là tỉ lệ của tổng các nút trung tâm và tổng số các nút kết nối trực tiếp đến nút
đang xét.
3.2 Liên hệ trên Mạng xã hội
o Bậc: Bậc của một cá thể là số cá thể khác trên Mạng xã hội mà cá thể đó
kết nối trực tiếp đến.
o Độ giữa: Độ giữa của một cá thể trên Mạng xã hội là số mối quan hệ giữa
các cá thể khác mà cá thể này là trung gian gần nhất.
o Độ kề: Là khả năng của một cá thể tìm đến các cá thể khác trên Mạng xã
hội
o Vector riêng: Là khả năng kết nối trực tiếp của một cá thể đến các cá thể
trung tâm khác. Hay có thể hiểu là khả năng tìm đến những cá thể “nổi bật”
khác trong mạng.
3.3 Cách xác định Key Players

Việc xác định Key Players trong Mạng xã hội được tiến hành tương tự như việc
xác định Key Players trên một đồ thị. Vì thực chất, Mạng xã hội là một dạng đồ thị
với mỗi các nhân là một nút và mối quan hệ giữa các cá nhân trong mạng là cạnh
của đồ thị. Vì vậy việc xác định Key Players cho một Mạng xã hội sẽ được minh
hoạ thông qua việc xác định Key Players của một đồ thị.
3.3.1 Điều kiện của một Key Player
Key Players của một đồ thị là những nút thoả mãn các điều kiện sau:
(1) Có số bậc cao trong đồ thị
(2) Có độ giữa cao
Học viên: Bùi Anh Kiệt – CH1101018 13
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
(3) Có độ kề thấp
(4) Có trị số vector đặc trưng cao.
3.3.2 Các bước xác định Key Players
Các bước xác định Key Players của đồ thị được trình bày như sau:
(1) Biểu diễn đồ thị dưới dạng ma trận kề
Hình 3-6 Mô hình Đồ thị mạng xã hội
Từ đồ thị ở ví dụ trên (Hình 3-3), ta có được ma trận kề như sau:
Bảng 3-1 Ma trận kề
1 2 3 4 5 6 7
1 - 1 1 0 0 0 0
2 1 - 1 0 1 0 0
3 1 1 - 1 1 0 0
4 0 0 1 - 0 0 0
5 0 1 1 0 - 1 1
6 0 0 0 0 1 - 0
7 0 0 0 0 1 0 -
Học viên: Bùi Anh Kiệt – CH1101018 14
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
(2) Tính số bậc của mỗi nút trên đồ thị. Dựa vào ma trận kề, ta có thể xác định

được các thông số như bậc, độ kề, độ giữa hay vector riêng như bảng bên
dưới:
Bảng 3-2 Bảng kết quả các thông số xác định Key Players
Đỉnh 1 2 3 4 5 6 7
Bậc 2 3 4 1 4 1 1
Độ giữa 0 0.19 0.5 0 0.56 0 0
Độ kề 2 1.5 1.33 2.17 1.33 2.17 2.17
Vector riêng 0.34 0.5 0.5 0.17 0.5 0.17 0.17
Danh sách đường đi ngắn nhất có thể có trong đồ thị:
(1-2-5), (1-2-5-6), (1-2-5-7), (1-3-4), (1-3-5), (1-3-5-6), (1-3-5-7)
(2-3-4), (2-5-6), (2-5-7)
(3-5-6), (3-5-7)
(4-3-5), (4-3-5-6), (4-3-5-7)
(6-5-7)
Từ kết quả phân tích ở trên (Bảng 3-2) ta dựa vào các tiêu chí để xác định Key
Players là: bậc cao, độ giữa cao, trị vector riêng cao và độ kề thấp ta chọn được
các Key Players của mạng gồm có: Nút 2, 3, 5
Học viên: Bùi Anh Kiệt – CH1101018 15
Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
4 Kết luận
Việc xác định Key Players trong một đồ thị là rất cần thiết, vì với các Key Players
ta có thể định hình được cấu trúc của đồ thị, có thể tìm kiếm các thành phần của
đồ thị một cách nhanh và hiệu quả nhất.
Ứng dụng Key Players trong Mạng xã hội sẽ giúp cho việc quản lý mạng đạt được
hiệu quả hơn. Với hệ thống cơ sở dữ liệu vô cùng lớn hiện có trên các Mạng xã
hội việc xác định các Key Players là hoàn toàn không dễ thực hiện, nhất là khi cấu
trúc của mạng trở nên dày đặc và số lượng mối quan hệ giữa các thành phần trong
mạng tăng lên. Nhất là khi cập nhật cơ sở dữ liệu cho mạng mà làm thay đổi cấu
trúc của mạng, lúc đó việc tìm Key Players phải được thực hiện lại từ đầu.
Học viên: Bùi Anh Kiệt – CH1101018 16

Cơ sở dữ liệu nâng cao Xác định tập Key Players trong mạng xã hội
Tài liệu tham khảo
1. Định nghĩa khoá công khai từ wikimedia:
/>2. NUS - Social Network Analysis của Đại học Quốc gia Singapo
3. Bài giảng về Phân tích mạng xã hội – PGS.TS Đỗ Phúc
Học viên: Bùi Anh Kiệt – CH1101018 17

×