Tải bản đầy đủ (.pdf) (70 trang)

Kỹ thuật, công cụ phân tích mạng xã hội và thử nghiệm ứng dụng trong phân tích số liệu viễn thông

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.06 MB, 70 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

LÊ SỸ THÔNG

KỸ THUẬT, CÔNG CỤ PHÂN TÍCH MẠNG XÃ HỘI VÀ THỬ NGHIỆM
ỨNG DỤNG TRONG PHÂN TÍCH SỐ LIỆU VIỄN THÔNG
Chuyên ngành: Công nghệ thông tin

LUẬN VĂN THẠC SỸ KỸ THUẬT

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS HUỲNH QUYẾT THẮNG

Hà Nội – Năm 2016


LỜI CAM ĐOAN
Tôi xin cam đoan :
1 Những nội dung trong luận văn này là do tôi thực hiện dưới sự
hướng dẫn trực tiếp của PGS.TS. Huỳnh Quyết Thắng
2 Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng
tên tác giả, tên công trình, thời gian, địa điểm công bố.
3 Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian
trá, tôi xin chịu hoàn toàn trách nhiệm.

Người cam đoan

LÊ SỸ THÔNG



MỤC LỤC
Trang
Trang bìa phụ ................................................................................................................
Lời cam đoan .................................................................................................................
Danh mục các ký hiệu, các chữ viết tắt .........................................................................
Danh mục các bảng .......................................................................................................
Danh mục các hình vẽ ...................................................................................................
MỞ ĐẦU ..................................................................................................................... 1
Chương 1 - TỔNG QUAN VỀ MẠNG XÃ HỘI .................................................... 4
1.1. Khái niệm về mạng xã hội ............................................................................... 4
1.2. Đặc điểm của mạng xã hội............................................................................... 5
1.3. Xây dựng các mạng xã hội dựa trên các nút và liên kết .................................. 8
1.4. Cấu trúc các mạng xã hội............................................................................... 10
1.5. Phương pháp phân tích cho mạng xã hội ....................................................... 12
1.6. Kết luận chương ............................................................................................. 14
Chương 2 - PHÂN TÍCH MẠNG XÃ HỘI VÀ ỨNG DỤNG TRONG PHÂN
TÍCH SỐ LIỆU TRONG KINH DOANH ............................................................ 15
2.1. Khái quát về phân tích mạng xã hội .............................................................. 15
2.1.1. Khái niệm về phân tích mạng xã hội .................................................... 15
2.1.2. Sự phát triển của phân tích mạng xã hội .............................................. 16
2.1.3. Lý thuyết đồ thị và phân tích mạng xã hội ........................................... 22
2.1.4. Khoa học thống kê và phân tích mạng xã hội ...................................... 27
2.1.5. Một số độ đo được sử dụng trong phân tích mạng xã hội .................... 29
2.2. Ứng dụng mạng xã hội trong phân tích số liệu kinh doanh viễn thông ......... 33
2.2.1. Số liệu và bài toán kinh doanh viễn thông ........................................... 33
2.2.2. Kỹ thuật phân tích mạng xã hội trong môi trường kinh doanh viễn
thông ............................................................................................................... 38
2.2.3. Mô hình hệ số ảnh hưởng khách hàng cho kinh doanh viễn thông...... 39



2.3. Công cụ PAJEK hỗ trợ phân tích mạng xã hội .............................................. 48
2.4. Kết luận chương ............................................................................................. 49
Chương 3 - ỨNG DỤNG THỬ NGHIỆM KỸ THUẬT PHÂN TÍCH MẠNG
XÃ HỘI TRONG XỬ LÝ PHÂN TÍCH SỐ LIỆU BÀI TOÁN KINH DOANH
VIỄN THÔNG ......................................................................................................... 51
3.1. Đặt vấn đề ...................................................................................................... 51
3.2.Xây dựng mạng xã hội thử nghiệm cho việc phân tích số liệu trong kinh
doanh viễn thông ................................................................................................... 51
3.3.Thử nghiệm ..................................................................................................... 52
3.3.1. Phương pháp thử nghiệm ..................................................................... 53
3.3.2. Kết quả thử nghiệm và đánh giá .......................................................... 53
3.4. Kết luận chương ............................................................................................. 52
KẾT LUẬN .............................................................................................................. 58
A. Kết quả đạt được trong luận văn ...................................................................... 58
B. Hướng phát triển của luận văn ......................................................................... 59
TÀI LIỆU THAM KHẢO .................................................................................... 61


DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
TT

Viết tắt

1

SNA

2

UCINet


3

ORA

Đầy đủ

Diễn giải

Social Network Phân tích mạng xã hội
Analysis
Là phần mềm phân tích dữ liệu mạng xã hội.
Được phát triển bởi Lin Freeman, Martin
Everett và Steve Borgatti.
Là công cụ phân tích mạng xã hội được phát
triển CASOS tại Carnegie Mellon.


DANH MỤC CÁC BẢNG

Trang
Bảng 1.1: Tiềm năng đối với mạng xã hội thông qua vài con số ................................ 7
Bảng 2.1: Các thành phần được sử dụng để tính toán nhân tố ảnh hưởng của khách
hàng ........................................................................................................................... 47


DANH MỤC CÁC HÌNH

Trang
Hình 1.1: Đồ thị biểu diễn cấu trúc đơn giản của mạng xã hội .................................. 4

Hình 1.2: Các mạng Small world ................................................................................ 9
Hình 1.3: Bốn cấu trúc mạng được xác định bởi Borgatti và các đồng nghiệp tại
MIT. Mỗi nút biểu diễn một người; mỗi đường biểu diễn kênh giao tiếp giữa người
với người. Nút trung tâm nhất trong mỗi mạng là màu đỏ. ...................................... 11
Hình 2.1: Ví dụ cho biểu đồ mạng xã hội ................................................................. 16
Hình 2.2: Mô tả thiết lập kết nối bằng số lượng các đường kết nối .......................... 24
Hình 2.3: Mô tả thiết lập kết nối thể hiện bằng độ dầy của liên kết ......................... 24
Hình 2.4: Bài toán bẩy cây cầu của Königsberg ....................................................... 25
Hình 2.5: Chu trình Euler cho bài toán bẩy cây cầu ................................................. 26
Hình 2.6: Minh họa bậc của nút trong mạng xã hội .................................................. 29
Hình 2.7: Độ đo trung tâm của nút theo màu (từ đỏ = 0 tới xanh nước biển = max) 30
Hình 2.8: Minh họa độ đo k-neighbours ................................................................... 32
Hình 2.9: Trung tâm bậc 1 ........................................................................................ 40
Hình 2.10: Trung tâm bậc 2 ...................................................................................... 41
Hình 2.11: Các thuộc tính nhân tố ảnh hưởng của khách hàng cho các cuộc gọi đi 43
Hình 2.12: Các thuộc tính nhân tố ảnh hưởng của khách hàng nhận các cuộc gọi đến44
Hình 2.13: Các thuộc tính trọng số cho các cuộc gọi đi và đến ................................ 45
Hình 2.14: Giảm sự phân tán của các thuộc tính liên quan tới các nhân tố ảnh hưởng
của khách hàng .......................................................................................................... 46
Hình 2.15: Giao diện chính của PAJEK ................................................................... 49
Hình 3.1: Mô hình mạng xã hội thử nghiệm cho việc phân tích số liệu trong bài toán
kinh doanh viễn thông ............................................................................................... 52
Hình 3.2: Kết quả cho Betweenness ......................................................................... 53
Hình 3.3: Kết quả cho Closeness gọi đến ................................................................. 53
Hình 3.4: Kết quả cho Closeness gọi đi .................................................................... 54


Hình 3.5: Kết quả cho Closeness cả cuộc gọi đi và gọi đến ..................................... 54
Hình 3.6: Kết quả k-neighbours của đỉnh 42 – cả hai chiều ..................................... 55
Hình 3.7: Đồ thị sau khi lấy đỉnh 42 làm trung tâm và phân loại mức gần xa ......... 55

Hình 3.8: Kết quả k-neighbours của đỉnh 98 – chiều gọi đi ..................................... 56
Hình 3.9: Đồ thị sau khi lấy đỉnh 98 làm trung tâm và phân loại mức gần xa theo
chiều gọi đi ................................................................................................................ 56
Hình 3.10: K-neighbours của đỉnh 46 – gọi vào ....................................................... 57


MỞ ĐẦU
Mỗi tháng các nhà cung cấp dịch vụ viễn thông lớn đã mất đi một số khách
hàng và các nhà cung cấp dịch vụ viễn thông đã làm việc tích cực để giữ con số này
ở mức thấp nhất có thể. Thực tế, phần lớn các nhà cung cấp dịch vụ viễn thông đã
hiểu các nguyên nhân mà khách hàng rời bỏ họ và đã cải thiện dịch vụ để giảm đến
mức tối thiểu những vấn đề mà làm cho các khách hàng rời bỏ dịch vụ của họ. Tất
nhiên, sự cạnh tranh cũng đã tạo ra những lời mời chào để thu hút khách hàng. Việc
cạnh tranh lành mạnh đã có lợi cho các khách hàng và là nguồn gốc của sự đổi mới,
và thúc đẩy các nhà cung cấp dịch vụ luôn luôn hỏi: “Chúng tôi có thể làm như thế
nào để tốt hơn?”
Một cách để các nhà cung cấp dịch vụ viễn thông làm tốt hơn đó là quan tâm
những người đặc biệt – những người kết nối. Vậy những người kết nối đó là ai? và
cái gì tạo ra cho họ đặc biệt?
Có rất nhiều phương pháp để có thể tìm được câu trả lời cho vấn đề ở trên.
Tuy nhiên một trong những phương pháp mà đã và đang được nhiều nhà nghiên cứu
khoa học quan tâm hiện nay là sử dụng kỹ thuật phân tích mạng xã hội cho việc
phân tích số liệu trong bài toán kinh doanh viễn thông. Từ phương pháp này, những
nhà cung cấp dịch vụ viễn thông có thể hiểu được hành vi của khách hàng khi có sự
kiện diễn ra, tìm được các khách hàng có ảnh hưởng lớn.... Từ đó, sẽ có những
chiến lược kinh doanh hoặc những dịch vụ chăm sóc phù hợp để có thể thu hút được
nhiều khách hàng sử dụng dịch vụ của mình.
Ngoài ra, qua quá trình tìm hiểu và nghiên cứu, tôi nhận thấy lĩnh vực ứng
dụng kỹ thuật phân tích mạng xã hội cho việc phân tích số liệu trong bài toán kinh
doanh viễn thông trong nước ta chưa thực sự được những nhà nghiên cứu khoa học

quan tâm. Do vậy, tôi đã chọn đề tài: “Kỹ thuật, công cụ phân tích mạng xã hội và
thử nghiệm ứng dụng trong phân tích số liệu viễn thông”
Mục tiêu: Nghiên cứu tổng quan về mạng xã hội để nắm những kiến thức cơ
bản như khái niệm, đặc điểm, cấu trúc và phương pháp phân tích mạng xã hội nói

1


chung; Nghiên cứu khái quát về phân tích mạng xã hội như khái niệm... Phân tích
mạng xã hội gắn với lý thuyết đồ thị và khoa học thống kê. Ứng dụng phân tích
mạng xã hội trong phân tích số liệu kinh doanh viễn thông. Cuối cùng, tiến hành thử
nghiệm phân tích số liệu kinh doanh viễn thông bằng phần mềm phân tích mạng xã
hội PAJEK.
Cấu trúc của luận văn được chia thành ba chương cụ thể như sau:
Chương 1: Tổng quan về mạng xã hội
Trình bày những khái niệm cơ bản liên quan đến mạng xã hội, đặc điểm của
mạng xã hội,... và phương pháp phân tích mạng xã hội nói chung.
Chương 2: Phân tích mạng xã hội và ứng dụng phân tích số liệu kinh
doanh viễn thông
Trình bày tổng quan về phân tích mạng xã hội, trong đó phân tích mạng xã
hội gắn liền với lý thuyết đồ thị... và ứng dụng phân tích mạng xã hội trong phân
tích số liệu kinh doanh viễn thông. Đồng thời, trong chương này cũng trình bày về
phần mềm PAJEK dùng để phân tích mạng xã hội.
Chương 3: Ứng dụng thử nghiệm kỹ thuật phân tích mạng xã hội trong
xử lý phân tích số liệu viễn thông
Trình bày mô hình mạng xã hội thử nghiệm cho việc phân tích số liệu trong
bài toán kinh doanh viễn thông cùng với phương pháp thử nghiệm. Sử dụng phần
mềm phân tích mạng xã hội PAJEK để phân tích mô hình mạng xã hội thử nghiệm
trên dựa trên các độ đo. Từ đó đưa ra kết quả và nhận xét đối với mô hình mạng xã
hội thử nghiệm.

Kết luận
Chương này tóm tắt những kết quả đạt được của đề tài cùng với những
những khó khăn trong quá trình thực hiện đề tài và hướng giải quyết. Sau đó trình
bày những hướng nghiên cứu của đề tài.
Để hoàn thành được luận văn, em xin được gửi lời cảm ơn tới các Thầy giáo
trong Bộ môn Công nghệ phần mềm – Viện Công nghệ thông tin và truyền thông –

2


Trường Đại học Bách Khoa Hà Nội đã tận tình giảng dạy, cung cấp nguồn kiến thức
quý giá trong suốt quá trình học tập.
Đặc biệt em xin chân thành cảm ơn thầy giáo PGS. TS Huỳnh Quyết Thắng
đã tận tình hướng dẫn, góp ý, tạo điều kiện cho em hoàn thành luận văn này.

3


Chương 1
TỔNG QUAN VỀ MẠNG XÃ HỘI
Trong chương này, nghiên cứu và trình bày những khái niệm cơ liên quan
đến mạng xã hội như khái niệm, đặc điểm và cấu trúc mạng xã hội… Đặc biệt, trình
bày sơ lược về phương pháp phân tích mạng xã hội.
1.1. Khái niệm về mạng xã hội
Theo Wikipedia và Whatissocialnetworking.com, mạng xã hội hay còn gọi là
mạng xã hội ảo là một cấu trúc mang tính xã hội tạo thành từ các nút, mỗi nút có thể
là cá nhân, hay tổ chức... Mạng xã hội làm nhiệm vụ kết nối các thành viên, người
dùng trên Internet lại với nhau dựa theo những tiêu chí nào đó, với nhiều mục đích
khác nhau, không phân biệt thời gian và không gian.


Hình 1.1: Đồ thị biểu diễn cấu trúc đơn giản của mạng xã hội
Cấu trúc xã hội của mạng xã hội được thể hiện ở cách thức mạng xã hội “giả
lập” xã hội loài người. Mạng xã hội nhìn nhận những mối quan hệ xã hội thông qua
các nút và ràng buộc giữa các nút. Trong một mạng xã hội, các nút là các cá thể, và
ràng buộc giữa các nút là các mối quan hệ giữa các cá thể đó. Với cấu trúc đơn giản
như vậy, một mạng xã hội có thể được biểu diễn thành một “đồ thị” như Hình 1.1,

4


trong đó mỗi cá thể (mỗi nút) là một điểm trên đồ thị, và quan hệ giữa các nút được
thể hiện bằng một đoạn nối điểm này với điểm khác.
1.2. Đặc điểm của mạng xã hội
Có thể nói, mạng xã hội có thể phát triển mạnh mẽ được như hiện nay là do
những ưu thế đáng kể so với các phương pháp cộng đồng truyền thống. Dưới đây, là
một số ưu điểm mà mạng xã hội:
 Vấn đề chi phí
Có thể thấy rằng việc tham gia vào các mạng xã hội, dù là đối với các cá
nhân hay tổ chức đều chiếm một chi phí tương đối thấp, trên thực tế, các mạng xã
hội hiện nay hầu hết cho phép đăng ký và sử dụng miễn phí. Trong khi đó, khi đã
trở thành một thành viên của một mạng xã hội, các cá nhân hay tổ chức đó có thể có
được rất nhiều thông tin hữu ích. Ví dụ như một công ty sau khi tham gia vào một
mạng xã hội nào đó, có thể chỉ cần vài cú nhấp chuột là đã có thể tìm hiểu về các sở
thích của người dùng, xu hướng của những sở thích đó. Qua đó, công ty có thể phát
hiện ra được những khách hàng tiềm năng, vạch ra một chiến lược kinh doanh mới
cho thời kỳ khó khăn... Những việc làm này có thể giúp ích rất nhiều cho hoạt động
kinh doanh hiện tại của công ty đó.
 Khả năng xây dựng các mối quan hệ tin cậy
Nhờ vào việc quan sát được các bài viết, đánh giá của các thành viên trong
mạng xã hội, một tổ chức có thể nắm bắt được nhu cầu và đánh giá của khách hàng

về các sản phẩm hay dịch vụ mà họ cung cấp. Hơn thế là khi họ có những phản hồi
tích cực đối với khách hàng, từ đó xây dựng một mối quan hệ “ảo” với khách hàng
trong khi có thể mang lại một niềm tin “thực”. Không quá tốn kém như những hệ
thống chăm sóc khách hàng lớn mà mang lại hiệu quả cũng không hề nhỏ, đó chính
là lợi thể của mạng xã hội.
Hay đối với những cá nhân, nhờ việc đọc được những bài viết phần nào
mang tính chất riêng tư, tâm sự của bạn bè, hay con cái, họ có thể có được những
hiểu biết rõ ràng hơn về bạn bè, con cái của mình, thấy được vấn đề mà người kia
đang gặp phải, từ đó giúp họ giải quyết vấn đề dễ dàng hơn. Nghiên cứu cho thấy,

5


giới trẻ đang có xu hướng kể ra những phức tạp cá nhân trên blog, trên mạng xã hội,
vì thông qua mạng xã hội dễ dàng chia sẻ hơn là nói chuyện trực tiếp với các bậc
phụ huynh, bạn bè. Khi ấy niềm tin trong mối quan hệ cũng được nâng lên đáng kể.
 Dễ dàng tạo ra các mối quan hệ trong mạng xã hội
Trong một mạng xã hội nào đó, người dùng có một vài người bạn và những
người ấy lại có nhiều bạn bè khác và cứ như vậy. Nhờ vào mạng xã hội, ban đầu,
người dùng có thể thiết lập một mối quan hệ với bất cứ ai chỉ đơn giản bằng việc
gửi đi một lời nhắn đề nghị được kết nối bạn bè. Sau khi được chấp nhận từ phía
bên kia, việc cần làm để giữ gìn mối quan hệ đó là cố gắng cân bằng giữa việc cho
đi và nhận lại. Việc này ở trên một mạng xã hội tỏ ra đơn giản hơn so với việc duy
trì mối quan hệ trong xã hội thực tế vì cho đi và nhận về trong mạng xã hội nhiều
khi chỉ nằm ở mức có những bình luận trong những bài viết.
Những ưu điểm mà mạng xã hội mang lại như đã trình bày ở trên là rất to
lớn, tuy nhiên, mạng xã hội cũng có những mặt hạn chế như sau:
 Vấn đề về thông tin cá nhân của người dùng
Khi đã kết nối vào một mạng xã hội, có bạn bè trên đó đồng nghĩa với việc
người dùng cũng phải đối mặt với nguy cơ bị lợi dụng các thông tin cá nhân để

đăng tải lên đó. Với những thông tin như vậy, những kẻ có ý đồ không tốt có thể lợi
dụng những thông tin cá nhân của người dùng đó để thực hiện những hành vi xuyên
tạc... Điều này có thể làm ảnh hưởng tới lợi ích cá nhân của người dùng đó ngay
trong thời điểm hiện tại cũng như tương lai. Biết đâu một bức ảnh xưa có thể được
lôi ra để làm hại tới thanh danh của người dùng đó về sau này?
 Cơ chế vận hành của các mạng xã hội
Mạng xã hội cũng như mọi trang web khác, đều phải giải quyết các vấn đề
liên quan tới bảo mật thông tin. Hơn nữa, các trang mạng xã hội còn gặp phải một
số vấn đề như tình trạng tin nhắn rác làm phiền những thành viên tham gia... Vấn đề
này xuất hiện khá nhiều trên các phương tiện thông tin đại chúng gần đây, có thể lấy
vài sự cố các tài khoản mạng xã hội của những người nổi tiếng bị hacker kiểm soát,
những thông tin nhạy cảm được tung ra...

6


 Việc tiêu tốn thời gian sử dụng mạng xã hội
Việc tham gia một mạng xã hội, kiểm tra các thay đổi gần đây từ bạn bè, cập
nhật những thay đổi, thông tin cho chính mình nhiều khi làm mất thời gian của
người tham gia. Tất nhiên điều này còn tùy thuộc vào cách từng người phân phối
thời gian của mình cho việc “online” trên các mạng xã hội mà họ tham gia. Tuy vậy
theo những phân tích gần đây thì có tình trạng khá nhiều người trẻ bị hội chứng
“nghiện” khi tham gia mạng xã hội. Nếu tình trạng này xảy ra ở diện rộng thì sẽ có
rất nhiều hiệu ứng không tốt kèm theo.
Như vậy, cũng như những dịch vụ khác triển khai và khai thác trên nền
Internet, mạng xã hội cũng thể hiện được những ưu và nhược điểm nhất định.
Nhược điểm của mạng xã hội phần lớn kế thừa từ những nhược điểm vốn có của
các dịch vụ nền web, nhưng những ưu điểm của dịch vụ này lại mang tính chất đột
phá so với các phương pháp truyền thông truyền thống. Như trong một cuốn sách
với tựa đề Groundswell của nhà xuất bản Forrester Research ra đời năm 2008,

mạng xã hội và tác động của nó đã được mô tả với thuật ngữ “groundswell”, tạm
hiểu là: “Một bước tiến tự nhiên của loài người khi sử dụng các công cụ trên mạng
để kết nối, tích lũy kiến thức, lấy những gì họ cần – thông tin, hỗ trợ, các ý tưởng,
các sản phẩm hay khả năng thương lượng với cộng đồng”1. Và với những tiềm năng
hiện tại mà mạng xã hội mang lại (xem Bảng 1.1), việc tham gia, phân tích và tận
dụng những điểm mạnh mà mạng xã hội mang lại là cần thiết.
Bảng 1.1: Tiềm năng đối với mạng xã hội thông qua vài con số [11],[13]

Nguyên văn: “a spontaneous movement of people using online tools to connect, take charge of
their own experience, and get what they need-information, support, ideas, products, and bargaining
power-from each other.”
1

7


1.3. Xây dựng các mạng xã hội dựa trên các nút và liên kết
Phân tích mạng xã hội không phải là một phương pháp mới vì đã phổ biến
trong giới nghiên cứu. Các nhà nghiên cứu đã công bố các thử nghiệm mô tả các kết
nối giữa mọi người trong các môi trường khác nhau. Cùng với các thử nghiệm, một
số lý thuyết liên quan đến phân tích mạng xã hội và liên quan đến các thuật toán
tính toán các độ đo mạng cũng đã được công bố. Một trong những bài báo lâu đời
nhất về phân tích mạng xã hội là bài báo Small world experiment [10]. Đây là bài
báo nổi tiếng và nói về độ dài đường đi trong một mạng xã hội cụ thể.

8


Hình 1.2: Các mạng Small world
Stanley Milgram đã tiến hành một số thử nghiệm để xác định độ dài trung

bình đường đi cho một số mạng xã hội đặc thù. Mục đích chủ yếu của những thử
nghiệm này đã thể hiện rằng: các cộng đồng người không quá lớn (một người có thể
quen một người khác thông qua số bước tối đa nào đó, nói theo cách khác, thông
qua một số người trung gian). Các kết quả nghiên cứu trên đã đưa ra như sau: các
mạng xã hội được đặc trưng bởi đường đi ngắn giữa các nút.
Milgram là đồng tác giả của thử nghiệm bài toán Small world, đã công bố
rộng rãi thông qua một số nghiên cứu và tập trung vào các khái niệm rằng thế giới
đã trở nên tương tác kết nối cao. Thử nghiệm này đã được triển khai năm 1967. Bây
giờ, không khó để tưởng tượng sự ảnh hưởng của những khái niệm về các mối quan
hệ có thể có của con người có thể được thiết lập với việc sử dụng các thiết bị, các
công nghệ, các địa lý khác nhau.
Thử nghiệm của Milgram đã nhấn mạnh sự thật rằng: hai người được lựa
chọn ngẫu nhiên có thể biết nhau. Đây là cách để giải quyết bài toán Small world.
Một phương pháp chính xác để giải quyết bài toán Small world là bằng cách tính

9


toán độ dài trung bình các đường đi kết nối giữa hai nút bất kỳ bên trong mạng xã
hội. Cuối cùng, thử nghiệm của Migram đã đưa ra thuật toán tính toán số lượng
trung bình các liên kết mà kết nối giữa hai nút bất kỳ.
Thủ tục liên quan đến bài toán Small world đã được trình bày trong bài báo
“Một nghiên cứu thử nghiệm của bài toán Small world” của Jeffrey Travers và
Stanley Milgram [10].
Travers and Milgram cũng đã định nghĩa quy tắc của người tham gia cho
nghiên cứu của họ, miêu tả cách những người tham gia sẽ lấy những thông tin cá
nhân và chuyển tài liệu đi. Quy tắc này cũng định nghĩa người đích, người phân
công (có chức năng tránh lặp đi lặp lại) và các thẻ dấu vết.
1.4. Cấu trúc các mạng xã hội
Dựa vào loại mạng xã hội và cấu trúc của mạng xã hội, các kết quả của các

độ đo khác nhau, dẫn đến các phương pháp khác nhau để khám phá các mạng xã
hội.
Dựa vào nghiên cứu của Borgatti [3], có 4 nhóm chính để phân loại các
Mạng xã hội.
- Mạng lan truyền tham số biểu diễn các mạng xã hội có các kết nối được
phân tán trên phạm vi rộng bởi các nút.
- Mạng điều chỉnh tham số biểu diễn hai nút có vị trí mạng tương tự nhau,
nghĩa là có những hành vi tương tự nhau khi đối mặt với những hoàn cảnh tương tự
nhau.
- Mạng gắn kết tham số biểu diễn hai mạng xã hội con gắn kết với nhau, do
vậy chúng hoạt động như một mạng đơn.
- Mạng loại trừ tham số chỉ biểu diễn một liên kết cụ thể. Nghĩa là trong
mạng chỉ có một loại liên kết, không chứa nhiều loại liên kết.

10


Hình 1.3: Bốn cấu trúc mạng được xác định bởi Borgatti và các đồng nghiệp tại
MIT. Mỗi nút biểu diễn một người; mỗi đường biểu diễn kênh giao tiếp giữa người
với người. Nút trung tâm nhất trong mỗi mạng là màu đỏ.
Trong viễn thông, loại mạng lan truyền tham số là thích hợp nhất. Với một
vài hình thức giao tiếp như tin nhắn văn bản... các kết nối bên trong mạng loại này
có thể lan truyền nhanh hơn và rộng hơn những loại mạng khác. Xét chiến dịch tiếp
thị có quy mô và tin nhắn rác, mạng lan truyền tham số có thể rất thích hợp để phân
tích cấu trúc và hành vi mạng.
Loại mạng điều chỉnh tham số có hai khía cạnh khác nhau, đó là:
- Xảy ra đồng thời.
- Xảy ra tuần tự.
Khi hai nút thực hiện cùng sự kiện tại cùng thời điểm và hai nút không có kết
nối với nhau, có thể xét rằng các vị trí tương tự nhau bên trong các mạng con hoặc

các ràng buộc và các tình huống tương tự nhau có thể cũng diễn ra cùng một lúc.
Tuy nhiên nếu hai nút mà có kết nối với bằng kiểu kết nối nào đó, hoặc thậm chí hai
nút có một mối quan hệ gắn kết, có thể xét rằng hai nút có ảnh hưởng lẫn nhau nào
đó. Hai nút này có thể trước đấy đã quyết định thực hiện sự kiện giống nhau diễn ra
cùng thời điểm. Trong trường hợp hai nút không có kết nối với nhau, loại mạng
điều chỉnh tham số phù hợp cho miêu tả môi trường và kịch bản nhưng trong trường

11


hợp hai nút có kết nối với nhau, loại mạng điều chỉnh tham số này phù hợp cho
miêu tả sự ảnh hưởng.
Loại mạng gắn kết tham số liên quan chặt chẽ với một khái niệm được gọi là
điểm khớp nối. Điểm khớp nối là nút mà liên kết hai thành phần được kết nối với
nhau. Các thành phần gồm tập nút liên quan với nhau, không quan tâm đến đường
đi mà chúng kết nối với nhau. Các nút mà đóng vai trò là điểm khớp nối thường là
các nút trung tâm, kết nối các nhóm nhỏ, các mạng con hoặc thậm chí kết nối các
cộng đồng với nhau. Tất cả các nút là các điểm khớp nối có thể là chủ đề nghiên
cứu trong tương lai.
Loại mạng trừ tham số không thể ứng dụng trong viễn thông. Ví dụ, một
mạng xã hội dựa trên người sử dụng lao động và người lao động, nếu hai người đã
kết hôn thì họ không thể làm việc trong cùng công ty. Như vậy, trong mạng trừ
tham số liên kết kết hôn loại trừ liên kết đồng nghiệp. Tuy nhiên, trong viễn thông,
có thể có vài loại liên kết tại cùng thời điểm như các cuộc gọi, các văn bản, phương
tiện, email...
1.5. Phương pháp phân tích cho mạng xã hội
Tất cả dữ liệu trong các mạng xã hội quyết định cho việc sử dụng phương
pháp phân tích. Ở đây, dữ liệu gồm có thông tin về các nút và các liên kết, cũng như
các loại nút, các loại liên kết, các trọng số của các nút và các liên kết [4].
Một trong những phân tích quan trọng nhất trong các mạng xã hội đó là so

sánh giữa các hành vi khác nhau. Các hành vi này không chỉ được gắn với các nút
mà cũng được gắn với các liên kết. Thông thường, các hành vi của các liên kết – tần
suất, độ phù hợp... Có thể thay đổi tầm quan trọng của nút được gắn với các liên
kết. Đối với các mạng xã hội trong viễn thông, các khách hàng mà có một số các
liên kết tới các nút rất quan trọng thì cũng trở nên quan trọng. Phân tích mạng xã
hội trong viễn thông, có thể có các thuộc tính đặc thù như phân khúc khách hàng,
giá trị khách hàng, hóa đơn trung bình và khi đó, sử dụng các thuộc tính đặc thù này
trong phân tích mạng xã hội trong viễn thông. Như vậy, có thể có các thuộc tính đặc
thù cho các liên kết như giá cuộc gọi, thời gian… và khi đó sử dụng các thuộc tính

12


này trong phân tích. Các thuộc tính khác nhau này có thể tạo ra các trọng số khác
nhau cho các nút và các liên kết và do vậy chúng thay đổi trong phân tích. Nhắc lại
lần nữa, các nút có các liên kết giá trị cao trở thành quan trọng hơn, và các liên kết
kết nối các nút giá trị cao cũng trở nên quan trọng.
Vài độ đo có thể được tính toán để biểu diễn các thuộc tính hoặc đặc tính của
mạng xã hội, cũng như các mạng xã hội con hoặc các đồ thị con bên trong các mạng
xã hội. Các độ đo trong các mạng xã hội gồm có số lượng các kết nối mà một nút
có. Độ đo này có thể phân chia thành hai độ đo khác nhau:
- Miêu tả số lượng các kết nối đi vào.
- Miêu tả số lượng các kết nối đi ra.
Điều này là khá phù hợp trong lĩnh vực viễn thông, biểu diễn giá trị các cuộc
gọi đi và đến giữa các khách hàng. Các độ đo khác liên quan đến đường đi mạng
như độ dài các đường đi kết nối các nút, khoảng cách giữa các nút, bao nhiêu nút
trung tâm có trong mạng xã hội...
Ngoài ra, khoảng cách các mối quan hệ trên có thể trình bày vài thuộc tính
liên quan đến cấu trúc của mạng xã hội. Độ mạnh của các liên kết là rất quan trọng
khi thiết lập hành vi mối quan hệ giữa các nút. Một liên kết đặc thù giữa hai nút có

thể là trung tâm của toàn bộ mạng xã hội. Do vậy, không chỉ các nút có giá trị gần
nhau mà các liên kết cũng có giá trị phụ thuộc cách các liên kết kết nối các nút với
nhau trong mạng xã hội.
Hơn nữa, khi phân tích mạng diễn ra, các thuộc tính của toàn mạng xã hội sẽ
được tính toán. Các thuộc tính như số bậc cho mỗi nút, các liên kết đi vào và đi ra
trung tâm... và sự ảnh hưởng của các nút đối với nút khác tất cả sẽ được tính toán
chính xác và được so sánh với nhau. Phân tích sự so sánh này làm tăng mẫu hành vi
cho toàn bộ mạng nhưng đặc biệt làm tăng mẫu hành vi riêng cho mỗi nút và mỗi
liên kết bên trong mạng xã hội, phát hiện các nút có giá trị cao theo các độ đo mạng.
Các mạng xã hội cũng có thể được phân tích bằng cách chia toàn bộ mạng
thành các cộng đồng nhỏ kết nối với nhau. Tương tự phân tích so sánh cho các nút
và các liên kết, sự đánh giá so sánh dựa trên các cộng đồng nhỏ có thể phát hiện bao

13


nhiêu mạng được phân cụm và bao nhiêu cộng đồng là quan trọng hơn theo các độ
đo mạng. Với cách này, có thể thấy rằng các độ đo mạng trung bình cho các nút của
các cộng đồng cũng là các độ đo mạng cho chính bản thân các cộng đồng.
Phân tích cộng đồng có thể phát hiện hành vi mạng, nhưng chủ yếu là có ích
trong việc làm nổi bật các cụm không mong muốn bên trong mạng theo hành vi.
Khi xét việc sử dụng của các nút, các nhóm nút không thường xuyên – ví dụ như
trong viễn thông, khả năng miêu tả một tập khách hàng thực hiện các sự kiện gian
lận. Nếu các khách hàng này không tham gia gian lận mà chỉ mới là các khách hàng
sử dụng các dịch vụ viễn thông cao, nhóm các nút này sẽ được kiểm soát bởi công
ty viễn thông, giữ khách hàng từ các đối thủ cạnh tranh.
1.6. Kết luận
Trong chương này, đầu tiên nghiên cứu và trình bày khái niêm về mạng xã
hội. Tiếp đến, trình bày các ưu điểm và nhược điểm của mạng xã hội mang lại…
Đặc biệt, nghiên cứu và trình bày phương pháp phân tích cho mạng xã hội.

Như vậy, để phân tích được mạng xã hội, cần phải có dữ liệu về mạng xã
hội, dữ liệu về các nút, các liên kết và các trọng số gán tới nút, liên kết trong mạng
xã hội. Sau đó, xác định tầm quan trọng của các nút và các liên kết theo bài toán đặt
ra. Để nghiên cứu sâu hơn về phân tích mạng xã hội, trong chương tới sẽ nghiên
cứu và trình bày phân tích mạng xã hội và ứng dụng phân tích mạng xã hội để phân
tích dữ liệu trong kinh doanh viễn thông.

14


Chương 2
PHÂN TÍCH MẠNG XÃ HỘI VÀ ỨNG DỤNG TRONG PHÂN TÍCH SỐ
LIỆU TRONG KINH DOANH
Như đã trình bày trong chương 1, chương này sẽ tập trung nghiên cứu và
trình bày những vấn đề cơ bản liên quan đến phân tích mạng xã hội... Đặc biệt,
trình bày ứng dụng phân tích mạng xã hội trong phân tích số liệu kinh doanh viễn
thông để giúp các công ty kinh doanh viễn thông có thể đạt được hiệu quả kinh
doanh với mục tiêu đạt được doanh thu tốt nhất.
2.1. Khái quát về phân tích mạng xã hội
2.1.1. Khái niệm về phân tích mạng xã hội
Phân tích mạng xã hội (Social network analysis - SNA) sử dụng lý thuyết
mạng để phân tích các mạng xã hội. Phân tích mạng xã hội xem xét các mối quan hệ
xã hội theo khía cạnh của lý thuyết mạng, gồm có: các nút miêu tả các cá nhân có
trong mạng xã hội, và các liên kết (ties, cũng có thể gọi là các cạnh, các kết nối)
miêu tả các mối quan hệ giữa các cá nhân trong mạng, ví dụ như quan hệ bạn bè,
quan hệ họ hàng, quan hệ cơ quan (công ty) và quan hệ giới tính. Các mạng xã hội
thường được thể hiện bằng một biểu đồ (diagram) mạng xã hội, Hình 2.1, trong biểu
đồ thì các nút chính là các điểm và các ties chính là các đường liên kết [13].

15



Hình 2.1: Ví dụ cho biểu đồ mạng xã hội
Phân tích mạng xã hội đã trở thành một công cụ gồm tập các phương pháp
sử dụng cho việc phân tích các cấu trúc xã hội. Các phương pháp này phục vụ
chuyên biệt cho điều tra, khảo sát sự quan hệ theo một khía cạnh nào đó của các cấu
trúc xã hội. Do vậy, sử dụng phương pháp này phụ thuộc vào mối quan hệ hơn là sử
dụng các thuộc tính của dữ liệu [13].
2.1.2. Sự phát triển của phân tích mạng xã hội
Phân tích mạng xã hội nghiên cứu cuộc sống xã hội theo các mối quan hệ
giữa các cá nhân khác nhau. Các hành vi bên trong mạng quyết định việc hiểu các
kết nối xã hội và quan trọng hơn, ngụ ý rằng các hành vi tạo ra bên trong một cộng
đồng. Ngụ ý thích hợp nhất là mỗi người trong mạng xã hội có thể ảnh hưởng lẫn
nhau như thế nào khi thực hiện các sự kiện giống nhau. Xét trong lĩnh vực kinh
doanh, cái gì tạo ra sự khác biệt giữa người dẫn dắt và người theo sau? Khi một
công ty kinh doanh viễn thông mất một khách hàng có ảnh hưởng bên trong mạng
xã hội thì tác động như thế nào? Các công ty có thể thuyết phục các khách hàng
mua sản phẩm mới hoặc sử dụng dịch vụ mới được không? Hiểu được các kết quả
từ hành vi mới của các mối quan hệ xã hội có thể cho phép các công ty dự báo được
các sự kiện kinh doanh mới và tập trung vào quản lý mối quan hệ khách hàng chính
xác hơn.
Nghiên cứu các mạng xã hội được định nghĩa hình thức như là tập các nút
(gồm các thành phần của mạng). Các nút này được kết nối bằng các loại quan hệ
khác nhau (được định nghĩa hình thức như là các liên kết). Nghiên cứu phân tích
mạng xem xét tất cả các liên kết này như là các khối kiến trúc cơ bản của xã hội.
Nghiên cứu phân tích mạng không chỉ tập trung vào mỗi kiểu dữ liệu thuộc tính như
phân tích truyền thống chỉ nghiên cứu các dữ liệu thuộc tính mà phân tích mạng xã
hội còn xem xét các đặc trưng của các quan hệ từ các hoàn cảnh khác nhau. Các
phương pháp truyền thống của phân tích dữ liệu thường xem xét các đặc trưng riêng
lẻ từ tất cả các quan sát để phân tích thông tin tồn tại bên trong dữ liệu. Cái gì là nét

đặc trưng từ một quần thể gồm các công ty, các nhân viên, các khách hàng hoặc các

16


thị trường? Trong kinh doanh viễn thông sử dụng các phương pháp truyền thống là
khá phổ biến để phân tích dữ liệu riêng lẻ để hiểu hành vi các khách hàng như hóa
đơn, hình thức thanh toán, tần số và số lượng sử dụng dịch vụ… Bên cạnh các đặc
trưng riêng lẻ, phân tích mạng xã hội còn xem xét tất cả thông tin về các mối quan
hệ giữa các thành viên của mạng (các nút). Từ thực tế, thông tin về các mối quan hệ
giữa các cá nhân bên trong một mạng xã hội thường thích hợp hơn các thuộc tính
riêng lẻ của từng cá nhân. Các mối quan hệ giữa các cá nhân có thể cho biết thông
tin về các khách hàng nhiều hơn là các đặc trưng riêng lẻ của các khách hàng. Đây
là sự khác nhau cơ bản giữa phân tích dữ liệu và phân tích mạng xã hội. Bạn là gì
không quan trọng bằng bạn ứng xử và kết nối với người khác như thế nào?
Alexandra Marin và Barry Wellman [1] đã công bố công trình nghiên cứu
mô tả một số trường hợp nghiên cứu về các mối quan hệ xã hội.
Về cơ bản, một mạng xã hội gồm tập các nút được kết nối bằng một hay
nhiều liên kết (các loại quan hệ khác nhau). Ví dụ, trong kinh doanh viễn thông, các
nút là các khách hàng, các đường truyền, dải sóng rộng, thiết bị di động hoặc loại
thiết bị truyền thông khác. Các liên kết, đặc biệt trong môi trường điện thoại, là các
cuộc gọi, các tin nhắn, thư điện tử...
Khái niệm các nút và liên kết có thể thay đổi theo bài toán cần giải quyết
hoặc lĩnh vực kinh doanh mà được nghiên cứu. Trong ngành tài chính và ngân hàng,
các nút có thể không chỉ là các khách hàng mà còn có thể là các tài khoản và các
liên kết có thể được biểu diễn bởi các giao dịch, các chính sách, các thế chấp...
Một trong những bước quan trọng nhất trong phân tích mạng xã hội đó là
định nghĩa chính xác vai trò các nút và các liên kết. Bước này quyết định các ứng
dụng liên quan đến các vấn đề kinh doanh. Nếu không định nghĩa vai trò của các
nút và liên kết thì có thể xây dựng và phân tích mạng xã hội nhưng sẽ không giải

quyết cho các ứng dụng kinh doanh.
Nhiệm vụ lựa chọn loại dữ liệu có sẵn nào để sử dụng, dựa trên các loại bài
toán khác nhau để xây dựng công việc của phân tích mạng xã hội. Một vấn đề thực
tế, cùng một lĩnh vực kinh doanh, nhưng lại có các bài toán khác nhau (dữ liệu

17


×