Tải bản đầy đủ (.pdf) (71 trang)

Nghiên cứu ứng dụng của lý thuyết đồ thị trong việc phân tích mạng xã hội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.39 MB, 71 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
------------------------------------

CHU QUANG PHỔ

NGHIÊN CỨU ỨNG DỤNG CỦA LÝ THUYẾT ĐỒ THỊ
TRONG VIỆC PHÂN TÍCH MẠNG XÃ HỘI

Chuyên ngành: CÔNG NGHỆ THÔNG TIN

LUẬN VĂN THẠC SỸ KỸ THUẬT
CÔNG NGHỆ THÔNG TIN

NGƢỜI HƢỚNG DẪN KHOA HỌC
PGS.TS: HUỲNH THỊ THANH BÌNH

Hà nội 2016


LỜI CAM ĐOAN
Luận văn thạc sỹ này do tôi nghiên cứu và thực hiện dƣới sự hƣớng dẫn của
cô giáo PGS.TS. HUỲNH THỊ THANH BÌNH. Với mục đích học tập, nghiên
cứu để nâng cao kiến thức và trình độ chuyên môn nên tôi đã làm luận văn này một
cách nghiêm túc và hoàn toàn trung thực.
Để hoàn thành bản luận văn này, ngoài các tài liệu tham khảo đã liệt kê, tôi
cam đoan không sao chép toàn văn các công trình ho ặc thiết kế tốt nghiệp của
ngƣời khác.
Hà Nội, tháng 4 năm 2016
Học viên



Chu Quang Phổ

Học viên: Chu Quang Phổ

-1-

Luận văn thạc sĩ


LỜI CẢM ƠN
Những kiến thức căn bản trong luận văn này là kết quả của ba năm (20132015) tôi có may mắn đƣợc các thầy cô giáo trong Trƣờng Đại học Bách Khoa Hà
Nội, Viện Công nghệ Thông tin và Truyền Thông và một số Viện khác trực tiếp
giảng dạy, đào tạo và dìu dắt.
Tôi xin bày tỏ lời cảm ơn chân thành tới các thầy cô giáo trong Viện Công
nghệ thông tin và Truyền thông, Phòng đào tạo sau đại học Đại học Bách Khoa Hà
Nội đã tạo điều kiện thuận lợi cho tôi trong thời gian học tập tại trƣờng.
Tôi xin bày tỏ lòng biết ơn chân thành, lời cảm ơn sâu sắc nhất đối với cô
giáo PGS.TS. Huỳnh Thị Thanh Bình đã trực tiếp hƣớng dẫn, định hƣớng cho tôi
giải quyết các vấn đề trong luận văn.
Tôi cũng xin cảm ơn các bạn, các anh chị em lớp CHBK2013B1 đã đồng
hành và cùng giúp đỡ tôi trong quá trình học tập và làm luận văn.
Luận văn cũng xin đƣợc là lời chia vui với ngƣời thân, đồng nghiệp, bạn bè
và các bạn đồng môn hai lớp cao học CHBK2013B1 và CHBK2013B2.

Học viên: Chu Quang Phổ

-2-

Luận văn thạc sĩ



MỤC LỤC

DANH MỤC CÁC KÝ HIỆU, THUẬT NGỮ VIẾT TẮT ...........................................5
DANH MỤC HÌNH VẼ, BẢNG BIỂU ............................................................................6
LỜI NÓI ĐẦU .....................................................................................................................8
CHƢƠNG 1: GIỚI THIỆU TỔNG QUAN .................................................................. 10
1. Giới thiệu về Mạng xã hội ....................................................................................... 10
1.1 Khái niệm Mạng xã hội...................................................................................... 10
1.2 Sự phát triển của Mạng xã hội .......................................................................... 10
1.3 Các mạng xã hội của Việt Nam hiện nay......................................................... 11
2. Cơ sở khoa học và thực tiễn của đề tài .................................................................. 14
2.1 Cơ sở khoa học .................................................................................................... 14
2.2 Cơ sở thực tiễn .................................................................................................... 15
3. Mục đích của đề tài (các kết quả cần đạt đƣợc).................................................... 17
4. Bố cục Luận văn ....................................................................................................... 17
CHƢƠNG 2: ỨNG DỤNG CỦA LÝ THUYẾT ĐỒ THỊ TRONG PHÂN TÍCH
MẠNG XÃ HỘI ............................................................................................................... 18
2.1 Lý thuyết đồ thị....................................................................................................... 18
2.1.1 Định nghĩa đồ thị ............................................................................................. 18
2.1.2 Biểu diễn mạng xã hội theo đồ thị................................................................. 21
2.2 Cộng đồng trong mạng xã hội .............................................................................. 22
2.2.1 Các khái niệm chung ....................................................................................... 22
2.2.2 Ý nghĩa của việc phát hiện cộng .................................................................... 23
2.3 Các kỹ thuật gom nhóm – phát hiện cộng đồng ................................................. 26
2.3.1 Xác định trung tâm trong mạng (Centrality) ................................................ 26
2.3.2 Thuật toán CONGA ........................................................................................ 39
2.3.3 Thuật toán K-Mean ......................................................................................... 45
Chƣơng 3: BÀI TOÁN CỘNG ĐỒNG HIẾM MUỘN ............................................... 47

3.1. Phát biểu bài toán .................................................................................................. 47
3.1.1 Thực trạng về tình hình hiếm muộn ở Việt Nam hiện nay......................... 47
Học viên: Chu Quang Phổ

-3-

Luận văn thạc sĩ


3.1.2 Những vấn đề của các cặp hiếm muộn ......................................................... 48
3.2 Yêu cầu đối với mạng xã hội cộng đồng hiếm muộn ........................................ 51
3.2.1 Forum Cộng đồng hiếm muộn ....................................................................... 51
3.2.2 Giới thiệu kết bạn ............................................................................................ 52
3.2.3 Phân nhóm cộng đồng..................................................................................... 53
3.3. Phân tích các yêu cầu............................................................................................ 53
3.3.1 Forum cộng đồng hiếm muộn ........................................................................ 53
3.3.2 Giới thiệu kết bạn ............................................................................................ 54
3.3.3 Phân nhóm cộng đồng..................................................................................... 55
Chƣơng 4: THỰC NGHIỆM VÀ KẾT QUẢ ĐẠT ĐƢỢC........................................ 56
4.1 Mô hình hệ thống ................................................................................................... 56
4.2 Giới thiệu về PHPFOX .......................................................................................... 57
4.2.1 Giới thiệu chung .............................................................................................. 57
4.2.2 Cấu trúc thƣ mục trong PhpFox..................................................................... 59
4.3. Xây dựng Forum ................................................................................................... 60
4.4. Xây dựng chức năng kết bạn ............................................................................... 62
4.4.1 Thiết kế cơ sở dữ liệu...................................................................................... 62
4.4.2 Các bƣớc xây dựng ứng dụng tổng hợp kết bạn .......................................... 63
4.4.3 Xây dựng chức năng giới thiệu kết bạn ........................................................ 64
4.5 Kết quả đạt đƣợc..................................................................................................... 64
4.5.1 Chức năng Forum ............................................................................................ 64

4.5.2 Chức năng tính kết bạn ................................................................................... 67
Chƣơng 5: KẾT LUẬN ................................................................................................... 68
TÀI LIỆU THAM KHẢO ............................................................................................... 70

Học viên: Chu Quang Phổ

-4-

Luận văn thạc sĩ


DANH MỤC CÁC KÝ HIỆU, THUẬT NGỮ VIẾT TẮT
STT

Viết tắt

Mô tả

1

MXH

2

CĐHM

Cộng đồng hiếm muộn

3


CNTT

Công nghệ thông tin

4

CEO

Chief Executive Officer

5

WHO

World Health Organization

Học viên: Chu Quang Phổ

Mạng xã hội.

-5-

Luận văn thạc sĩ


DANH MỤC HÌNH VẼ, BẢNG BIỂU
Danh mục hình vẽ
Hình 1 Thống kê số lƣợng truy cập vào ZingMe ......................................................... 12
Hình 2 Đơn đồ thị vô hƣớng ........................................................................................... 19
Hình 3 Đa đồ thị vô hƣớng .............................................................................................. 19

Hình 4 Giả đồ thị vô hƣớng............................................................................................. 20
Hình 5 Đơn đồ thị vô hƣớng ........................................................................................... 20
Hình 6 Đa đồ thị có hƣớng .............................................................................................. 21
Hình 7 Biểu diễn mạng xã hội theo đồ thị..................................................................... 22
Hình 8 Ví dụ về một đồ thị với 3 cộng đồng............................................................... 23
Hình 9 Đồ thị vô hƣớng 7 đỉnh ....................................................................................... 28
Hình 10 Mối quan hệ giữa 10 thành viên ...................................................................... 30
Hình 11 Đồ thị 6 đỉnh ...................................................................................................... 31
Hình 12 Đồ thị gồm 6 đỉnh.............................................................................................. 35
Hình 13 Đồ thị 7 đỉnh ...................................................................................................... 38
Hình 14 Ví dụ về phát hiện cộng đồng theo thuật toán Newman-Girvan ................. 40
Hình 15 Ví dụ về phép phân chia một đỉnh trong đồ thị ............................................ 43
Hình 16 Thuật toán K-Means.......................................................................................... 45
Hình 17 Mô hình hệ thống MXH Cộng đồng hiếm muộn .......................................... 56
Hình 18 Cấu trúc thƣ mục PhpFox................................................................................. 59
Hình 19 Trang quản trị Modules PhpFox ...................................................................... 61
Hình 20 Thêm mới chuyên mục diễn đàn ..................................................................... 62
Hình 21 Sửa chuyên mục diễn đàn................................................................................. 62
Hình 22 Diễn đàn.............................................................................................................. 65
Hình 23 Trang giới thiệu kết bạn.................................................................................... 67

Học viên: Chu Quang Phổ

-6-

Luận văn thạc sĩ


Danh mục bảng biểu
Bảng 1 Độ đo Degree Centrality của các đỉnh sau khi tính toán ................................ 28

Bảng 2 Độ đo trung tâm dựa vào trung gian ................................................................. 32
Bảng 3 Phân cụm theo độ đo trung gian........................................................................ 34

Học viên: Chu Quang Phổ

-7-

Luận văn thạc sĩ


LỜI NÓI ĐẦU
Theo thống kế có đƣợc tại hội thảo quốc tế về “Cập nhật về hộ trợ sinh sản”
diễn ra tại Hà Nội cuối năm 2013 với sự góp mặt của các bác sĩ ngành Sản khoa tới
từ nhiều nơi trên thế giới đã thống kê tỷ lệ vô sinh tại Châu Âu và Châu Mỹ trung
bình từ 13-25% các cặp vợ chồng. Tỷ lệ này ở Việt Nam là khoảng gần 8% và tính
ra có khoảng 1 triệu ngƣời cần tới các biện pháp hỗ trợ sinh sản.
Cũng là 1 trong 1 triệu trƣờng hợp cần tới các biện pháp hỗ trợ sinh sản nên
tôi hiểu đƣợc khó khan các trƣờng hợp ngƣời cần tới sự giúp đợ của các biện pháp
hỗ trợ sinh sản. Là một nƣớc mang nặng tƣ tƣởng A Đông nhƣ Việt Nam thì điều
khó khan nhất mà các cặp hiếm muộn gặp phải đó là tƣ tƣởng và sức ép từ phía gia
đình. Ngoài các vấn đề lien quan tới tài chính thì sức ép từ gia đình là điều mà
không phải cặp hiếm muộn nào cũng có thể vƣợt qua. Các cặp hiếm muộn thiếu một
nơi chia sẻ các thong tin về bệnh hiếm muốn cũng nhƣ tìm đƣợc các trƣờng hợp
giống mình để cùng giải quyết vấn đề.
Ngày nay với sự phát triển của CNTT nói chung và việc xây dựng các ứng
dụng CNTT trong việc phát triển MXH nói riêng đã đạt đƣợc thành quả to lớn, với
việc ra đời của các MXH nhƣ Twitter, Google+, Linked, Myspace và đ ặc biệt là
FaceBook. Các trang MXH này đều hƣớng tới các nhóm đối tƣợng ngƣời dung
khác nhau, nhƣ Twitter: Chia sẽ ảnh, link, tin nhắn ngắn…Google+ hƣớng tới các
đối tƣợng thành viên từ 13 tuổi trở lên, Linked hƣớng tới các thành viên là những

ngƣời từ 18 tuổi trở lên và có nhu c ầu chia sẻ thong tin về việc làm, kinh doanh,
công ty…FaceBook hƣớng tới mọi đối tƣợng thành viên giúp họ chia sẻ ảnh, video,
blog, game, link, tin nhắn,…
Nhƣ vậy mặc dù các trang MXH đều có các đặc điểm chung là giúp các
thành viên chia sẻ các thong tin cá nhân, hình ảnh, video, tin nhắn… nhƣng mỗi
trang MXH cũng hƣớng tới muc tiêu và các đối tƣợng thành viên khác nhau.

Học viên: Chu Quang Phổ

-8-

Luận văn thạc sĩ


Vì vậy tôi muốn xây dựng một trang MXH riêng cho các cặp hiếm muộn,
trên đó có 2 chức năng chính: Forum chia sẻ các kinh nghiệm của các cặp hiếm
muộn dành cho tất cả mọi ngƣời dù là thành viên c ủa MXH hay không là thành
viên, chức năng thứ 2 là xây dựng MXH cho các thành viên có thể kết bạn và chia
sẻ nhiều hơn các thong tin với nhau.

Học viên: Chu Quang Phổ

-9-

Luận văn thạc sĩ


Chương 1: Giới thiệu tổng quan

CHƢƠNG 1: GIỚI THIỆU TỔNG QUAN

1.

Giới thiệu về Mạng xã hội

1.1

Khái niệm Mạng xã hội
Mạng xã hội, hay gọi là mạng xã hội ảo, (social network) là một trang Web

mà ở đó một ngƣời có thể kết nối với nhiều ngƣời thô ng quan việc chia sẻ các sở
thích cá nhân, vị trí địa lý ... Các thành viên trong mạng xã hội có nhiều cách khác
nhau để tìm kiếm bạn bè, đối tác, những ngƣời có chung điểm quan tâm nào đó…
nhƣ: dựa vào trƣờng lớp đã từng học, cùng làm việc trong công ty, dựa theo các
thông tin cá nhân email, hoặc dựa theo sở thích cá nhân (phim ảnh, thời trang, sách
báo, thong tin lien quan tới các vấn đề hiếm muộn)….
Mạng xã hội có những tính năng chung: chat, email, chia sẻ file, hình ảnh,
viadeo, bài viết… Thông qua MXH mọi thành viên có thể kết nối với nhau cùng
nhau tạo nên các nhóm có chung sở thích, mối quan tâm… để cùng nhau chia sẻ
thông tin và hình thành nên cộng đồng.
Nhƣ vậy khi nhắc tới khái niệm MXH thì ta hiểu đây là một mạng xã hội ảo
online và nó mang nhiều đặc điểm, đặc tính tƣơng tự nhƣ xã hội thực. MXH là xã
hội ảo tồn tại online có những đặc điểm riêng biệt nên nó sẽ có những điểm khác
với xã hội thực.
Trong phạm vi của ứng dụng MXH dành cho Cộng đồng hiếm muộn xin sử
dụng khái niệm MXH đơn giản nhƣ sau: Mạng xã hội cộng đồng hiếm muộn là
dịch vụ nối kết các thành viên cùng gặp các vẫn đề liên quan tới với đề hiếm muộn
trên Internet lại với nhau, mục đích tạo ra một cộng đồng chia sẻ các thông tin và
nơi giao lưu, tâm sự những vấn đề khó khăn trong việc điều trị hiếm muộn.
1.2


Sự phát triển của Mạng xã hội
Theo các thô ng tin trên Wikipedia từ khi MXH xuất hiện trên thế giới từ

những năm 1995 với sự ra đời của trang Classmate với mục đích kết nối bạn học,
tiếp theo là sự xuất hiện của SixDegrees vào năm 1997 với mục đích giao lƣu kết

Học viên: Chu Quang Phổ

-10-

Luận văn thạc sĩ


Chương 1: Giới thiệu tổng quan
bạn dựa theo sở thích. Tới nay theo thống kế Search Engine Journal trong năm
2014 có 72% số ngƣời sử dụng Internet hiện nay đang hoạt động trên các mạng xã
hội, 71% ngƣời dùng truy cập mạng xã hội từ thiết bị di động. Đây là con số thống
kê từ năm 2014 và với tốc độ phát triển của Internet thì con số này ở thời điểm hiện
tại sẽ còn tang lên đáng kể. Các thống kê về 3 MXH đƣợc nhiều ngƣời sử dụng
nhất hiện nay:
-

Facebook
Facebook vẫn đang là mạng xã hội lớn nhất hiện nay với hơn 1,15 tỷ ngƣời

dùng. Theo thống kê, hiện có 23% ngƣời dùng Facebook đăng nhập ít nhất 5 lần
mỗi ngày, thời gian dành cho Facebook trong mỗi giờ vào mạng tùy thuộc vào từng
quốc gia (top 3 sử dụng nhiều nhất hiện nay đang là Mỹ với 16 phút, Australia 14
phút và Anh là 13 phút).
-


Google plus
Google plus hiện đã đạt đến 359 triệu ngƣời dùng hoạt động hàng tháng, đạt

tốc độ tăng trƣởng 33% mỗi năm. Những ngƣời trong độ tuổi 45 đến 54 đã gia tăng
mức độ sử dụng Google plus thêm 56% kể từ năm 2012
-

Twitter
Twitter là mạng xã hội phát triển nhanh nhất với tốc độ tăng trƣởng 44%

trong giai đoạn 2012 đến 2013. Hiện nay đã có hơn 550 triệu ngƣời dùng đã đăng
ký Twitter và 215 triệu ngƣời dùng hoạt động hàng tháng trên mạng xã hội này.
Các mạng xã hội của Việt Nam hiện nay

1.3
-

ZingMe

Zingme có lẽ là cái tên nổi bật nhất trong số các trang MXH đƣợc phát triển của
Việt Nam với mong muốn đánh bật FaceBook vào thời kỳ sơ khai khi FaceBook
mới bƣớc chân vào Việt Nam trong năm 2009.
Khi vừa đƣợc giới thiệu, Zing Me không gây đƣợc ấn tƣợng vì nó gần nhƣ là
bản "copy-cat" hoàn chỉnh của Facebook, từ giao diện cho tới tính năng. CEO Lê

Học viên: Chu Quang Phổ

-11-


Luận văn thạc sĩ


Chương 1: Giới thiệu tổng quan
Hồng Minh chia sẻ bài học đầu tiên để khi làm việc gì, là chấp nhận đi học ở ngƣời
giỏi hơn mình, xem thành công của họ đi trƣớc ra sao và khi mình làm thì có thể
đƣợc nhƣ vậy không. Và tất nhiên khi học phải chịu khó học hỏi, kiên nhẫn…,
đừng ngần ngại sao chép lại, nhƣng sao chép thì phải hiểu mới thành công đƣợc.
Đúng nhƣ tiêu chí trên, Zing Me là mạng xã hội sao chép không hơn không kém.
Đƣợc VNG xây dựng trên tập game thủ lớn nhất trên thị trƣờng Việt Nam,
Zing Me có lợi thế rất lớn khi ra mắt với lƣợng thành viên khi đó( tháng 9 năm
2009) đƣợc Zing Me công bố là 945.000 và số lƣợng thành viên c ủa FaceBook ở
Việt Nam đƣợc công bố là 918.000. Nhƣng hiện tại theo thống kê của Genk số
lƣợng truy cập vào Zing Me chiếm 1 số con số rất nhỏ

Hình 1 Thống kê số lƣợng truy cập vào ZingMe
Ở đây chúng ta không bàn tới việc số lƣợng thành viên của Zingme mà
chúng ta quan tâm tới số lƣợng truy cập và sự phổ biến của Zingme ở Việt Nam.
Cũng theo 1 bài viết trên Genk đã ví von Zing me nay chỉ là “Thành phố
ma”.
-

Go.vn
Cũng đƣợc phát triển bởi VNG, mạng xã hội GO.VN chú trọng phát triển

Giáo dục online nhằm đổi mới cách thức học tập, tạo ra cơ hội cho ngƣời học có thể
tự học, nghiên cứu và trau dồi kiến thức dù ở bất kỳ đâu, bất kỳ thời điểm nào.

Học viên: Chu Quang Phổ


-12-

Luận văn thạc sĩ


Chương 1: Giới thiệu tổng quan
Sự ra đời của GO.VN là dự án lớn nằm trong chủ trƣơng và kỳ vọng của
Chính phủ, Bộ Thông tin & Truyền thông, sự ủng hộ và mong đợi của các doanh
nghiệp và cộng đồng mạng Việt Nam, với mục tiêu huy động trí tuệ ngƣời Việt
Nam để xây dựng mạng thông tin khổng lồ của ngƣời Việt Nam, sản phẩm trí tuệ,
công nghệ cao có quy mô và tầm vóc thế giới về giáo dục, giải trí và chia sẻ thông
tin.
-

Yume.vn
Đƣợc phát triển bởi Vietnam Online Network (VON) ra đời vào tháng 10

năm 2008, với mục đích “Liên kết hàng triệu user, kết nối không giới hạn. Yume đi
theo mô hình gần giống với mạng cộng đồng Facebook và MySpace. Nhƣng xét về
giao diện, YuMe.vn sẽ giúp ngƣời dùng Việt Nam tiếp cận dễ dàng hơn, dễ dùng
hơn.
-

Tamtay.vn
Ra đời cùng thời điểm bùng nổ mạng xã hội tại Việt Nam vào tháng 3/2007,

Tamtay.vn là mạng xã hội “made in Vietnam” đầu tiên tích hợp đầy đủ tính năng
của một mạng xã hội theo chuẩn quốc tế: Cho phép ngƣời dùng đăng và chia sẻ
miễn phí video, ảnh, nhạc, viết blog, tìm và kết bạn, cập nhật thông tin bạn bè, chơi
game, chat…

Đặc điểm chung của các trang mạng xã hội này là ra đời vào thời kỳ phát triển
mạnh mẽ nhất của trào lƣu mạng xã hội những năm 2007-2009. Là các trang mạng
xã hội của ngƣời Việt và dành cho ngƣời Việt. Những trang này đề cao cái "tôi"
dân tộc, đánh vào thế mạnh bản địa hóa để lấy nó làm lợi thế so với Facebook. Đây
tƣởng chừng là lợi thế trời cho nhƣng nó lại không mang tới tác dụng nhƣ mong
muốn. Và mình chứng rõ rà nhất là đến này các trang mạng xã hội này gần khi đã bị
khai tử và đƣợc ví von nhƣ những thành phố ma. Đây thực sự là một điều đáng
buồn nhƣng nó là sự tất yếu của quá trình chọn lọc. Xin trích dẫn lời nói của CEO
Nokia đã nói: The advantage you have yesterday, will be replaced by the trends of
tomorrow(Các lợi thế bạn có ngày hôm qua, sẽ đƣợc thay thế bởi các xu hƣớng của
ngày mai).
Học viên: Chu Quang Phổ

-13-

Luận văn thạc sĩ


Chương 1: Giới thiệu tổng quan

Cơ sở khoa học và thực tiễn của đề tài

2.

2.1 Cơ sở khoa học
Với sự ra đời và phát triển của các MXH từ năm 1995 và thời kỳ nở rộ của các
trang MXH những năm 2007-2009 tới nay, thì cách thức xây dựng MXH không còn
là một điều gì mới mẻ đối với các nhà phát triển và lập trình viên. Trên mạng hiện
nay các trang MXH lớn đều có các bộ Open Source đƣợc đăng tải miễn phí với bộ
khung cơ bản giúp cho các những đơn vị muốn phát triển một trang MXH riêng cho

mình có thể tận dụng và xây dựng dựa vào bộ khung đó. Các bộ open source về
mạng xã hội:
-

PhpFox:
PhpFox là công c ụ đƣợc xem là phổ biến và dễ dàng nhất để tạo nên một

mạng xã hội. PhpFox là mã nguồn mở đƣợc phát triển trên nền tảng PHP &
MySQL. PhpFox cung cấp cho ngƣời dung rất nhiều tính năng tiện lợi để xây dựng
và quản lý một trang mạng xã hội:
Quản trị hệ thống đơn giản.
Khả năng thêm/tạo blog, diễn đàn, chat, hình ảnh, video…
Độ bảo mật cao(ví dụ: riêng tƣ, ngăn chặn spam,…).
Hỗ trợ tích hợp các modul từ bên thứ 3.
Cho phép tích hợp thêm quảng cáo.
Dễ dàng tích hợp Content Delivery Network(CDN) để tăng tốc độ
trang web.
Có cả phiên bản dành cho di động.
Cho phép tích hợp các ứng dụng và trò chơi vào mạng xã hội….
Đây là bộ Open source đáp ứng nhu cầu mục đích xây dựng một trang mạng
xã hội cộng đông hiếm muộn. Bởi mục đích xây dựng trang MXH cộng đồng hiếm
muộn cần: tính đơn giản khi xây dựng, có diễn đàn, và các tính năng của một trang
MXH.

Học viên: Chu Quang Phổ

-14-

Luận văn thạc sĩ



Chương 1: Giới thiệu tổng quan
-

JomSocial
Jomsocial cũng là công cụ để phát triển mạng xã hộ với các đặc tính nổi bật:
Hỗ trợ nhiều tính năng độc đáo khác: tập tin tải lên, nghe nhạc, hệ
thống trò chuyện và dịch thuật với nhiều ngôn ngữ khác nhau
Công nghệ Responsive, dùng đƣợc trên các thiết bị di động, máy tính
bảng…
Quản lý danh sách bạn bè
Quản lý sự kiện các hoạt động cộng đồng
Chia sẻ media với bộ sƣu tập hình ảnh và video.
Dễ dàng hiết lập các diễn đàn thảo luận nhóm bằng nhiều chế độ tùy
chỉnh khác nhau.
Chia sẻ thông tin với bạn bè qua tin nhắn
Hỗ trợ Postbox để gửi thông tin cập nhật, hình ảnh, video và các sự
kiện.
Cung cấp tính năng 'Like' và 'Comment' trên các hoạt động.

-

Social Engine
Social Engine và PhpFox mang nhiều điểm giống nhau với các tính năng nổi
bật: tạo diễn đàn, Blog, chia sẻ Abum, Chat…

2.2 Cơ sở thực tiễn
Theo thống kê của các nhà khoa học tỷ lệ hiếm muộn vô sinh trên thế giới
ngày càng đƣợc ghi nhận nhiều. Theo nghiên cứu của tổ chức WHO tỷ lệ vô sinh
của các cặp vợ chồng trên toàn thế giới khoảng 10-15% và tỷ lệ này đang ngày càng

đƣợc ghi nhận có xu hƣớng tang lên. Ở Việt Nam hiện nay theo thống kê của Thạc
sĩ Hồ Mạnh Tƣờng - Tổng Thƣ ký Hội Nội tiết sinh sản và vô sinh cho biết thông
tin trên tại Hội thảo quốc tế về hỗ trợ sinh sản tổ chức vào sáng 31-04-2014 tại
Thành phố Hồ Chí Minh.

Học viên: Chu Quang Phổ

-15-

Luận văn thạc sĩ


Chương 1: Giới thiệu tổng quan
Theo bác sĩ Tƣờng nghiên cứu dịch tễ vừa đƣợc Bộ Y tế thực hiện cho thấy
có 7,7% các cặp vợ chồng ở Việt Nam bị hiếm muộn cần khám và điều trị. Tính ra
là gần 1 triệu cặp vợ chồng gặp các vấn đề liên quan tới hiếm muộn.
Xuất phát từ thực tế bản thân tôi hiện tại cũng là một trong những cặp vợ
chồng hiếm muộn đã đi chữa trị ở các trung tâm nổi tiếng về nam học ở Việt Nam
nhƣ: phòng khám Tâm Anh của GS. Trần Quán Anh, viện 103 của GS.TS Quảng
Hoàng Lâm, tôi cũng đã tiếp xúc với rất nhiều các cặp hiếm muộn khác và tôi đã
thấy đƣợc rằng các cặp hiếm muộn đều có điểm chung là không biết chia sẻ cùng ai
những vấn đề mình gặp phải. Gia đình, bạn bè nhận đƣợc rất ít sự chia sẻ. Đặc biệt
là về phía gia đình, có 90% các cặp vợ chồng tôi đã từng nói chuyện thì đều nhận
thấy gia đình luôn là áp lực rất lớn ảnh hƣởng tới các cặp hiếm muộn.
Những vấn đề mà một cặp hiếm muộn gặp phải khi điều trị: thời gian, tiền
của, công sức, thông tin về việc điều trị những phƣơng pháp mới nhất đƣợc áp dụng
cho điều trị, những điều khó nói và không đƣợc chia sẻ với ai.
Vấn đề thời gian và tiền của thì tự thân các cặp hiếm muộn phải tự lo liệu và
cần sự giúp đỡ của ngƣời thân. Nhƣng bên cạnh đó vẫn đề thông tin và chia sẻ
những vấn đề liên quan tới tâm lý thì chƣa có một diễn đàn chuyên về việc này.

Về vấn đề thông tin khi bạn lên mạng tìm hiểu thì sẽ ra rất nhiều quảng cáo
về các bài thuốc chữa hiếm muộn, đông y có, tây y có, bệnh viện nổi tiếng có, bệnh
viện tƣ nhân có. Nơi nào cũng đƣa ra các bài viết và cho dẫn chứng về các trƣờng
hợp mình chữa trị đƣợc. Bạn sẽ dễ dẫn đến tình trạng loạn thông tin và không biết
trƣờng hợp của mình thì nên theo phƣơng pháp nào, địa chỉ nào cho phù hợp.
Không có một cơ sở nào dẫn chứng nhiều cho các trƣờng hợp thực tế đã theo chữa
trị ở các địa chỉ đó nói lên các kinh nghiệm hoặc những điều mình đã trải qua khi
thực hiện ở đó.
Việt Nam cũng là một nƣớc Á Đông và mang nặng tƣ tƣởng phong kiến thì
nhắc đến vấn đề gặp phải khi cần hỗ trợ của các biện pháp hỗ trợ sinh sản thì các
cặp hiếm muộn rất khó để nói ra. Sức ép của gia đình và sự nhìn nhận chƣa đúng
cũng nhƣ bảo thủ, cái tôi quá lớn của cá nhân… tác động lên các cặp hiếm muộn
Học viên: Chu Quang Phổ

-16-

Luận văn thạc sĩ


Chương 1: Giới thiệu tổng quan
thực sự là quá lớn. Là ngƣời trong cuộc tôi hiểu rất rõ vấn đề này. Thiếu tự tin trƣớc
những câu hỏi của mọi ngƣời xung quanh, tìm cách l ẩn trốn và sống thu ngƣời lại.
Muốn tìm những ngƣời cùng cảnh ngộ để chia sẻ cũng khó khăn.
Xuất phát từ cơ sở khoa hoc và thực tế đã nêu trên, tôi đã quyết định xin
nhận đề tài: NGHIÊN CỨU ỨNG DỤNG CỦA LÝ THUYẾT ĐỒ THỊ TRONG
VIỆC PHÂN TÍCH MẠNG XÃ HỘI. Với mong muốn xây dựng lên một MXH
dành riêng cho các cặp hiếm muộn ở Việt Nam. Một nơi mà các cặp hiếm muộn có
thể chia sẻ các thông tin với nhau, chia sẻ cảm xúc, chia sẻ những điều khó nói mà
không biết chia sẻ cùng ai.
3. Mục đích của đề tài (các kết quả cần đạt đƣợc)

-

Xây dựng đƣợc một diễn đàn là nơi chia sẻ các vấn đề lien quan tới vấn đề
hiếm muộn.

-

Xây dựng đƣợc MXH dành riêng cho các thành viên có quan tâm nhiều tới
việc hiếm muộn.

-

Hoàn thành đƣợc tính năng gợi ý kết bạn trên trang Cộng đồng hiếm muộn

-

Đƣa ra lý thuyết đã đƣợc áp dụng cho việc phân nhóm cộng đồng.

4. Bố cục Luận văn
Nội dung chính của luận văn đƣợc chia thành 4 chƣơng nhƣ sau:
Chương 1: Giới thiệu tổng quan
Lý do chọn đề tài, cơ sở khoa hoc và thực tiễn đề tài, mục đích đề tài
Chương 2: Ứng dụng của lý thuyết đồ thị trong phân tích mạng xã hội
Giới thiệu ứng dụng lý thuyết đồ thị trong việc phân nhóm MXH.
Chương 3: Bài toán Cộng đồng hiếm muộn
Phân tích thiết kế MXH Cộng đồng hiếm muộn
Chương 4: Thực nghiệm và kết quả đạt được
Xây dựng tính năng cho MXH Cộng đồng hiếm muộn và kết quả đạt đƣợc.

Học viên: Chu Quang Phổ


-17-

Luận văn thạc sĩ


Chương 2: ứng dụng của lý thuyết đồ thị trong phân tích mạng xã hội

CHƢƠNG 2: ỨNG DỤNG CỦA LÝ THUYẾT ĐỒ THỊ TRONG PHÂN
TÍCH MẠNG XÃ HỘI
Lý thuyết đồ thị là lĩnh vực nghiên cứu đã tồn tại từ những năm đầu của thế kỷ
18 nhƣng lại có những ứng dụng hiện đại. Những tƣ tƣởng cơ bản của lý thuyết đồ
thị đƣợc nhà toán học ngƣời Thụy Sĩ Leonhard Euler đề xuất và chính ông là ngƣời
dùng lý thuyết đồ thị giải quyết bài toán nổi tiếng “Cầu Konigsberg”.
Đồ thị đƣợc sử dụng để giải quyết nhiều bài toán thuộc các lĩnh vực khác nhau.
Chẳng hạn, ta có thể dùng đồ thị biểu diễn mối quan hệ giữa các cá nhân, tổ chức
với nhau, dùng đồ thị để biểu diễn những mạch vòng của một mạch điện, dùng đồ
thị biểu diễn quá trình tƣơng tác giữa các loài trong thế giới động thực vật... Có thể
nói, lý thuyết đồ thị đƣợc ứng dụng rộng rãi trong tất cả các lĩnh vực khác nhau của
thực tế cũng nhƣ những lĩnh vực trừu tƣợng của lý thuyết tính toán.
Trong việc phân tích mạng xã hội bản chất là chúng ta đi tìm các điểm chung của
các thực thể để xác định và phân chia các thực thể đó và các nhóm hay chính là
cộng đồng trong mạng xã hội đó.

2.1 Lý thuyết đồ thị
2.1.1 Định nghĩa đồ thị
Đồ thị (Graph) là một cấu trúc dữ liệu rời rạc bao gồm các đỉnh và các cạnh
nối các cặp đỉnh này. Chúng ta phân biệt đồ thị thông qua kiểu và số lƣợng cạnh nối
giữa các cặp đỉnh của đồ thị. Dựa vào sự phân biệt này chúng ta chia đồ thì ra thanh
các dạng đồ thị nhƣ sau:

Đơn đồ thị vô hƣớng
Đơn đồ thị vô hƣớng G = <V, E> bao gồm V là tập các đỉnh, E là tập các cặp
có thứ tự gồm hai phần tử khác nhau của V gọi là các cạnh hay là các cung.

Học viên: Chu Quang Phổ

-18-

Luận văn thạc sĩ


Chương 2: ứng dụng của lý thuyết đồ thị trong phân tích mạng xã hội

Hình 2 Đơn đồ thị vô hƣớng
Đa đồ thị vô hƣớng
Đa đồ thị vô hƣớng G = <V, E> bao gồm V là tập các đỉnh, E là họ các cặp
không có thứ tự gồm hai phần tử khác nhau của V gọi là tập các cạnh. e1, e2 đƣợc
gọi là cạnh lặp nếu chúng cùng tƣơng ứng với một cặp đỉnh.

Hình 3 Đa đồ thị vô hƣớng

Học viên: Chu Quang Phổ

-19-

Luận văn thạc sĩ


Chương 2: ứng dụng của lý thuyết đồ thị trong phân tích mạng xã hội
Giả đồ thị vô hƣớng

Giả đồ thị vô hƣớng G = <V, E> bao gồm V là tập đỉnh, E là họ các cặp không
có thứ tự gồm hai phần tử (hai phần tử không nhất thiết phải khác nhau) trong V
đƣợc gọi là các cạnh. Cạnh e đƣợc gọi là khuyên nếu có dạng e =(u, u), trong đó u
là đỉnh nào đó thuộc V.

Hình 4 Giả đồ thị vô hƣớng
Đơn đồ thị có hƣớng
Đơn đồ thị có hƣớng G = <V, E> bao gồm V là tập các đỉnh, E là tập các cặp
có thứ tự gồm hai phần tử của V gọi là các cung.

Hình 5 Đơn đồ thị vô hƣớng

Học viên: Chu Quang Phổ

-20-

Luận văn thạc sĩ


Chương 2: ứng dụng của lý thuyết đồ thị trong phân tích mạng xã hội
Đa đồ thị có hƣớng
Đa đồ thị có hƣớng G = <V, E> bao gồm V là tập đỉnh, E là cặp có thứ tự
gồm hai phần tử của V đƣợc gọi là các cung. Hai cung e 1, e2 tƣơng ứng với cùng
một cặp đỉnh đƣợc gọi là cung lặp.

Hình 6 Đa đồ thị có hƣớng
2.1.2 Biểu diễn mạng xã hội theo đồ thị
MXH đƣợc cấu tạo từ các nút và các cung, trong đó các nút đƣợc liên kết
với nhau bởi một hoặc nhiều cung, thể hiện kiểu mối quan hệ cụ thể. Mỗi nút,
còn đƣợc gọi là tác nhân (actor), biểu diễn cho một đối tƣợng trong xã hội, có

thể là một ngƣời, một tài liệu, một tổ chức, một quốc gia,… Mối liên hệ giữa
các nút đƣợc biểu diễn bởi một liên kết giữa các nút đó. Liên kết này có thể là
mối quan hệ bạn bè, họ hàng, đồng nghiệp,…, cũng có thể là các trao đổi tài chính,
các giao dịch, số liệu,…Các liên kết này có thể là liên kết vô hƣớng (hay còn gọi
là liên kết đối xứng ), trong đó mối quan hệ giữa 2 nút A và B là mối quan hệ qua
lại, ví dụ A là bạn B, và B cũng là bạn A, hay A và B học cùng một lớp tại trƣờng
tiểu học, trƣờng trung học hoặc cùng lớp đại học,…Các liên kết này cũng có thể là
liên kết có hƣớng, ví dụ A thích B, nhƣng B chƣa chắc đã thích A, hay là A nợ
tiền của B….Mặt khác, các liên kết còn có thể đƣợc đánh trọng số, trọng số này
biểu diễn độ mạnh của liên kết đó giữa hai nút.

Học viên: Chu Quang Phổ

-21-

Luận văn thạc sĩ


Chương 2: ứng dụng của lý thuyết đồ thị trong phân tích mạng xã hội
Trong biểu diễn đồ thị của mạng xã hội, các đỉnh đƣợc dùng để biểu diễn
các nút và các cạnh dùng để biểu diễn liên kết giữa các nút. Các cạnh trong đồ
thị có thể vô hƣớng hay có hƣớng, cũng có thể đƣợc đánh trọng số tùy thuộc
vào nhu cầu biểu diễn liên kết là vô hƣớng hay có hƣớng, trọng số nhƣ thế nào.

Hình 7 Biểu diễn mạng xã hội theo đồ thị

2.2 Cộng đồng trong mạng xã hội
2.2.1 Các khái niệm chung
- Xã hội là một tập thể hay một nhóm những ngƣời đƣợc phân biệt với các
nhóm ngƣời khác bằng các lợi ích, mối quan hệ đặc trƣng, chia sẻ cùng một thể

chế và có cùng văn hóa. Đây là khái niệm về xã hội trong thực tế và một khái niệm
rất rộng. Nhƣng từ khái niệm tổng quát về xã hội thực tế ta thấy rằng một trong
những yếu tố cơ bản của xã hội là sự phân nhóm hay chính đó là cộng đồng.
- Một cộng đồng là một nhóm xã hội của các cơ thể sống chung trong cùng
một môi trƣờng thƣờng là có cùng các mối quan tâm chung. Trong cộng đồng ngƣời
đó là kế hoạch, niềm tin, các mối ƣu tiên, nhu cầu, nguy cơ và một số điều kiện
khác có thể có và cùng ảnh hƣởng đến đặc trƣng và sự thống nhất của các thành
viên trong cộng đồng. Cộng đồng đƣợc hình thành trên cơ sở các mối liên hệ giữa
cá nhân và tập thể dựa trên cơ sở tình cảm là chủ yếu, ngoài ra còn có các mối liên

Học viên: Chu Quang Phổ

-22-

Luận văn thạc sĩ


Chương 2: ứng dụng của lý thuyết đồ thị trong phân tích mạng xã hội
hệ tình cảm khác. Cộng đồng có sự liên kết cố kết nội tại không phải do các quy tắc
rõ ràng thành văn, mà do các quan hệ sâu hơn, đƣợc coi nhƣ kà một hằng số văn
hóa.

Hình 8 Ví dụ về một đồ thị với 3 cộng đồng

2.2.2 Ý nghĩa của việc phát hiện cộng
Trong xã hội hiện nay xuất hiện nhiều nhóm hoặc tổ chức với kích cỡ
khác nhau, ví dụ nhƣ gia đình, nhóm các bạn bè hoặc đồng nghiệp, thành phố, quốc
gia…Sự khuếch tán của Internet ngày nay cũng sinh ra nhiều nhóm ảo trên Web,
hay còn đƣợc gọi là các cộng đồng trực tuyến. Các cộng đồng xã hội đã đƣợc
nghiên cứu trong một thời gian rất dài và thƣờng xuyên xuất hiện trong nhiều các

hệ thống mạng trong sinh học, khoa học máy tính, công nghệ, chính trị, kinh
tế,…ví dụ nhƣ: các nhóm protein với các chức năng tƣơng tự nhau trong tế bào
trong mạng tƣơng tác protein, các nhóm trang web thảo luận về cùng một chủ đề
hoặc các chủ đề tƣơng tự nhau trên World Wide Web,…
Với sự phát triển nhanh chóng của các cộng đồng trong thời điểm hiện
tại và nhu cầu cần thiết về tìm hiểu tính cộng đồng trong các mạng xã hội, bài
toán phát hiện cộng đồng trở thành một bài toán phổ biến trong các nghiên cứu

Học viên: Chu Quang Phổ

-23-

Luận văn thạc sĩ


Chương 2: ứng dụng của lý thuyết đồ thị trong phân tích mạng xã hội
về mạng xã hội. Mục tiêu của bài toán là từ các mạng xã hội cho trƣớc, phát
hiện đƣợc các cấu trúc cộng đồng nằm trong đó và tìm hiểu về mối liên hệ bên
trong các cộng đồng cũng nhƣ giữa các cộng đồng với nhau, mối liên hệ đó có
ảnh hƣởng thế nào đến cấu trúc của toàn mạng xã hội.
Việc phát hiện cộng đồng có rất nhiều ứng dụng cụ thể. Ví dụ nhƣ phân
cụm các Web client có sở thích tƣơng tự nhau và gần nhau về mặt địa lý có thể
cải thiện hiệu suất của việc cung cấp dịch vụ trên World Wide Web, trong đó
mỗi cụm khách hàng đƣợc phục vụ bởi một server chuyên dụng. Một ứng dụng
khác đó là việc xác định các cụm khách hàng có chung sở thích trong một mạng
thể hiện quan hệ giữa ngƣời mua và sản phẩm trên một trang web bán hàng trực
tuyến (ví dụ www.amazon.com ) có thể giúp xây dựng hệ thống tƣ vấn mua bán
một cách hiệu quả. Ngoài ra, sự phân cụm trong các đồ thị cỡ lớn có thể đƣợc
sử dụng trong việc lƣu trữ các dữ liệu của đồ thị một cách thuận tiện. Một ứng
dụng khác nữa là nhóm thành cụm các nút trong mạng lƣới giao thông có thể

giúp ích trong việc xây dựng các bảng định tuyến nhỏ gọn giúp ích trong việc
tham gia giao thông thuận tiện.
Ngoài ra, việc phát hiện cộng đồng có ý nghĩa rất quan trọng vì một
lý do khác. Việc xác định các module và ranh giới của chúng cho phép ta phân
lớp các đỉnh dựa trên cấu trúc vị trí của chúng trong module. Từ đó, các đỉnh ở vị
trí trung tâm trong module của chúng (có nhiều kết nối cạnh đến các đỉnh khác
trong module) có thể đóng vai trò quan trọng trong việc điều khiển và giữ ổn định
trong cụm. Mặt khác, các đỉnh ở vùng biên có thể giữ vai trò quan trọng trong
việc dẫn dắt mối quan hệ và giao lƣu giữa các cụm khác nhau trong mạng. Các
phân lớp nhƣ thế mang một ý nghĩa nhất định trong việc nghiên cứu mạng xã
hội. Cuối cùng, ta có thể nghiên cứu về đồ thị rút gọn, trong đó các đỉnh là các
cụm và các cạnh là các liên kết giữa các cụm trong đồ thị ban đầu (nếu có) từ đó
ta thu đƣợc một đồ thị biểu diễn mối quan hệ của các module trong mạng.

Học viên: Chu Quang Phổ

-24-

Luận văn thạc sĩ


×