Tải bản đầy đủ (.pdf) (62 trang)

Nghiên cứu đánh giá độ tin cậy của người dùng trên mạng xã hội dựa vào ontolohy

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.34 MB, 62 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC NHA TRANG

NGUYỄN ĐỨC THỌ

NGHIÊN CỨU ĐÁNH GIÁ ĐỘ TIN CẬY CỦA NGƯỜI DÙNG
TRÊN MẠNG XÃ HỘI DỰA VÀO ONTOLOGY

LUẬN VĂN THẠC SĨ

KHÁNH HÒA - 2020


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC NHA TRANG

NGUYỄN ĐỨC THỌ

NGHIÊN CỨU ĐÁNH GIÁ ĐỘ TIN CẬY CỦA NGƯỜI DÙNG
TRÊN MẠNG XÃ HỘI DỰA VÀO ONTOLOGY
LUẬN VĂN THẠC SĨ

Ngành:

Công nghệ thông tin

Mã số:

8480201

Mã số học viên:



59CH320

Quyết định giao đề tài:

453/ QĐ - ĐHNT ngày 04/05/2019

Quyết định thành lập hội đồng: 499/ QĐ - ĐHNT ngày 22/05/2020
Ngày bảo vệ:

07/06/2020

Người hướng dẫn khoa học:
TS. PHẠM THỊ THU THÚY
Chủ tịch Hội đồng
TS. ĐINH ĐỒNG LƯỠNG
Phịng Đào tạo Sau đại học:

KHÁNH HỊA – 2020


LỜI CAM ĐOAN
Tôi xin cam đoan đề tài luận văn ‘‘Nghiên cứu đánh giá độ tin cậy của người
dùng trên mạng xã hội dựa vào ontology” là cơng trình nghiên cứu khoa học của riêng
cá nhân tôi, các kết quả nghiên cứu trong luận văn không trùng với đề tài khác.
Khánh Hòa, ngày

tháng năm 2020

Tác giả luận văn


Nguyễn Đức Thọ

iii


LỜI CẢM ƠN
Trước hết tôi xin gửi tới các thầy cô Khoa Công nghệ thông tin, Trường Đại học
Nha Trang lời cảm ơn sâu sắc. Với sự quan tâm, dạy dỗ tận tình chu đáo của thầy cơ để
tơi có thể hồn thành khóa học.
Tơi xin được bày tỏ lịng biết ơn chân thành và sâu sắc nhất đến cô giáo hướng
dẫn, TS. Phạm Thị Thu Thúy, người đã tận tình hướng dẫn và tạo mọi điều kiện tốt
nhất để tơi có thể hồn thành luận văn này.
Tơi xin cám ơn các tác giả của các tài liệu mà tôi đã tham khảo để hồn thành
luận văn.
Cuối cùng tơi xin cảm ơn các thành viên trong gia đình của tơi, tập thể lớp cao học,
cơ quan đang công tác đã hỗ trợ, tạo điều kiện thuận lợi để tơi hồn thành tốt chương
trình học tập cũng như hồn thành luận văn này.
Tơi xin chân thành cảm ơn!
Khánh Hịa, ngày

tháng năm 2020

Tác giả luận văn

Nguyễn Đức Thọ

iv



MỤC LỤC
LỜI CAM ĐOAN .......................................................................................................... iii
LỜI CẢM ƠN .................................................................................................................iv
MỤC LỤC .......................................................................................................................v
DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT ............................................................ vii
DANH MỤC CÁC BẢNG .......................................................................................... viii
DANH MỤC CÁC HÌNH VẼ ........................................................................................ix
TRÍCH YẾU LUẬN VĂN .............................................................................................. x
MỞ ĐẦU .........................................................................................................................1
* Lý do chọn đề tài .......................................................................................................1
* Mục tiêu nghiên cứu ..................................................................................................1
* Đối tượng và phạm vi nghiên cứu .............................................................................2
* Phương pháp nghiên cứu ...........................................................................................2
* Ý nghĩa khoa học và thực tiễn ...................................................................................2
CHƯƠNG 1: MẠNG XÃ HỘI VÀ ĐỘ TIN CẬY .........................................................3
1.1. Mạng xã hội ...........................................................................................................3
1.1.1. Mạng xã hội là gì ?..........................................................................................3
1.2.2. Lịch sử ra đời ..................................................................................................3
1.2.3. Tính năng mạng xã hội ....................................................................................5
1.2.4. Những thành phần trong mạng xã hội ............................................................6
1.2.5. Mục tiêu của mạng xã hội ...............................................................................6
1.2.6. Mạng xã hội Facebook ....................................................................................7
1.2.Độ tin cậy ...............................................................................................................9
1.2.1. Khái niệm ........................................................................................................9
1.2.2. Biểu diễn độ tin cậy .......................................................................................11
1.2.3. Thuộc tính của sự tin cậy ..............................................................................11
1.3. Các nghiên cứu liên quan đến biểu diễn dữ liệu mạng xã hội ............................. 13
CHƯƠNG 2. BIỂU DIỄN VÀ TÍNH ĐỘ TIN CẬY CỦA DỮ LIỆU MẠNG XÃ HỘI
DƯỚI DẠNG ONTOLOGY .........................................................................................17
2.1. Biểu diễn dữ liệu mạng xã hội dưới dạng Ontology ...........................................17

2.2. Một số cơng thức tính độ tin cậy .........................................................................21
2.2.1. Tính độ tin cậy dựa trên độ đo khoảng cách .................................................22
2.2.2. Tính độ tin cậy trung bình cộng ....................................................................23
2.3. Một số ứng dụng của việc tính độ tin cậy ........................................................... 24
2.3.1. Trust Web Service ..........................................................................................24
2.3.2. TrustBot .........................................................................................................24
2.3.3. TrustMail .......................................................................................................24
CHƯƠNG 3: TÌM HIỂU CẤU TRÚC FOAF VÀ THUẬT TỐN TÍNH ĐỘ TIN
CẬY ............................................................................................................................... 26
v


3.1. Cấu trúc FOAF và cơng thức tính độ tin cậy ......................................................26
3.1.1. Cấu trúc FOAF .............................................................................................. 26
3.1.2. Thuật tốn tính độ tin cậy .............................................................................30
3.2. Xây dựng mạng tin cậy dựa trên sự mở rộng của FOAF ....................................34
CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ .........................................................37
4.1. Chương trình minh họa........................................................................................37
4.2 Đánh giá kết quả của ứng dụng trust cài đặt theo công thức cải tiến ..................44
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ....................................................................48
TÀI LIỆU THAM KHẢO ............................................................................................. 50

vi


DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT
Thuật ngữ

Nghĩa tiếng Anh


Nghĩa tiếng Việt

FOAF

Friend Of A Friend

Bạn của bạn

OWL

Web Ontology Language

Ngôn ngữ ontology web

Resource Description
RDF

Khung mô tả tài nguyên

Framework
Resource Description
Framework Schema

Lược đồ khung mô tả tài nguyên

SPARQL Protocol and RDF

Giao thức SPARQL và ngôn ngữ

SPARQL


Query Language

truy vấn RDF

URL

Universal Resource Locator

Định vị tài nguyên chung

XML

Extensible Markup Language

Ngôn ngữ đánh dấu mở rộng

W3C

World Wide Web Consortium

Tổ chức mạng toàn cầu

RDFS

vii


DANH MỤC CÁC BẢNG
Bảng 3.1: Các lớp được định nghĩa trong FOAF ................................................ 27

Bảng 3.2: Một số thuộc tính được định nghĩa trong FOAF ................................ 29
Bảng 3.3: Danh sách các quan hệ........................................................................ 31
Bảng 4.1: So sánh kết quả dự đoán mối quan hệ bạn của hai thuật toán ............ 44

viii


DANH MỤC CÁC HÌNH VẼ

Hình 1.1: Các mạng xã hội [2] .............................................................................. 3
Hình 1.2: Các mạng xã hội đang hoạt động hiện nay[21] .................................... 5
Hình 1.3: Mạng xã hội Twitter [2] ........................................................................ 7
Hình 1.4: Mạng xã hội Instagram [2] .................................................................... 8
Hình 1.5: Mạng xã hội Google Plus [2] ................................................................. 8
Hình 1.6: Đồ thị tin cậy [1] ................................................................................. 10
Hình 1.7: Sơ đồ biểu diễn chuỗi tin cậy .............................................................. 12
Hình 1.8: Mơ tả tính tổng hợp của tin cậy .......................................................... 13
Hình 1.9: Đồ thị đơn giản (phía trên bên trái) được mơ tả trong Pajek NET, UCINET
DL và các định dạng GraphML [5] ..................................................................... 14
Hình 1.10: Ví dụ về trường hợp nhận dạng lý luận [20] ....................................... 15
Hình 2.1: Sơ đồ thể hiện dữ liệu mạng xã hội [2] ............................................... 19
Hình 2.2: Quan hệ xã hội của Tony [2] ............................................................... 21
Hình 2.3: Sơ đồ biểu diễn độ đo tin cậy dựa trên khoảng cách [1]..................... 22
Hình 2.4: Đồ thị biểu diễn độ đo trung bình cộng .............................................. 23
Hình 2.5: Ứng dụng TrustMail [20] .................................................................... 25
Hình 3.1: Thuật tốn tính độ tin cậy của mối quan hệ láng giềng [3] ................ 32
Hình 3.2: Độ tin cậy trong mạng xã hội [3] ........................................................ 35
Hình 4.1: Cơ sở dữ liệu FOAF ............................................................................ 37
Hình 4.2. Giao diện thực hiện truy vấn SPARQL .............................................. 42
Hình 4.3: Giao diện tính độ tin cậy một người ................................................... 42

Hình 4.4: Giao diện kết quả trust ........................................................................ 43
Hình 4.5: Giao diện tìm độ tin cậy của 2 người bất kỳ trong tập dữ liệu ........... 43

ix


TRÍCH YẾU LUẬN VĂN
Qua q trình nghiên cứu thực hiện luận văn, tác giả đã đạt được các kết quả sau:
Nắm được những kiến thức cơ bản về mạng xã hội, cũng như tính năng, thành
phần và mục tiêu của mạng xã hội, giới thiệu các mạng xã hội đang thịnh hành hiện nay,
đặc biệt là Facebook. Hiểu biết được các khái niệm, cách biểu diễn, những thuộc tính
của sự tin cậy và các nghiên cứu liên quan đến biểu diễn dữ liệu mạng xã hội.
Nghiên cứu phương pháp biểu diễn dữ liệu mạng xã hội dưới dạng Ontology, đặc
biệt mô tả thông tin người dùng qua tập tin RDF từ đó có thể xây dựng biểu đồ về các
quan hệ xã hội của người dùng. Giới thiệu một số cơng thức tính độ tin cậy dựa trên
khoảng cách trong mạng tin cậy, tính độ tin cậy trung bình cộng và một số ứng dụng của
việc tính độ tin cậy.
Trình bày cấu trúc của FOAF (Friend of A Friend), FOAF thể hiện một đặc trưng
cơ bản để biểu diễn thông tin về con người, nhóm, tổ chức và các thơng tin liên quan
khác và đặc biệt là những người khác mà người đó quen biết. Đưa ra các phương pháp
để xác định độ tin cậy dựa trên tương tác, sở thích, mức độ quan hệ và áp dụng cơng
thức để rút trích dữ liệu FOAF, tính tốn độ tin cậy, xây dựng mạng tin cậy dựa trên sự
mở rộng của FOAF.
Tìm hiểu cấu trúc FOAF nhằm mơ tả đối tượng và các mối quan hệ giữa chúng,
xây dựng mạng tin cậy dựa trên sự mở rộng của FOAF, thu thập dữ liệu từ mạng xã hội
Facebook. Tác giả đã đề xuất cải tiến thuật tốn tính độ tin cậy dựa trên mối quan hệ xã
hội, đồng thời đã xây dựng được ứng dụng tính độ tin cậy dựa vào mối quan hệ trong
tập tin RDF của một người trong mạng Facebook. Ứng dụng đã khai thác được những
điểm quan trọng của mạng xã hội là sự tin cậy vào mối quan hệ, liên kết giữa bạn bè,
người thân, người quen biết để từ đó khai thác thơng tin và tính được độ tin cậy của một

người với những người khác trong tập dữ liệu.
Từ khóa: Ontology, FOAF, độ tin cậy.

x


MỞ ĐẦU
* Lý do chọn đề tài
Mạng xã hội là khái niệm chỉ chung các dịch vụ kết nối thành viên, bạn bè qua
Internet. Các dịch vụ, ứng dụng này cho phép người dùng chia sẻ thông tin qua tin nhắn,
thậm chí gọi điện trực tuyến. Có thể nói, mạng xã hội là một trong những sản phẩm khoa
học trí tuệ của con người trong thời đại bùng nổ công nghệ thông tin như hiện nay.
Theo thống kê của trang web wearesocial [29], hiện nay trên tồn thế giới có
khoảng 3,8 tỷ người sử dụng các mạng xã hội. Theo xu hướng thì số lượng người dùng
có dấu hiệu khơng ngừng gia tăng trên mạng xã hội. Mỗi ngày chúng ta có thể dễ dàng
nắm bắt được các thơng tin từ rất nhiều nguồn khác nhau trên internet và đặc biệt là
thông qua mạng xã hội với tốc độ lan truyền nhanh chóng.
Tương tác với mạng xã hội là đã trở thành thường xuyên trong cuộc sống của mỗi
chúng ta, chính vì điều này đã làm cho mạng xã hội phát triển nhanh chóng, đặc biệt là
mạng xã hội Facebook. Mạng xã hội tạo ra một đồ thị xã hội của những người dùng, bao
gồm người sử dụng và mối quan hệ về tình bạn của họ. Đồ thị xã hội này rất phong phú,
không chỉ là mối quan hệ của một hoặc hai người bạn với nhau mà là mối quan hệ giữa
nhiều người bạn (ví dụ, bạn của bạn). Trong mối quan hệ rộng lớn đó, việc chia sẻ và
trao đổi thông tin hoặc kết bạn mới,... đều đa số dựa vào sự tin cậy lẫn nhau. Do đó,
cũng như trong cuộc sống, sự tin cậy giữa những người dùng trong mạng xã hội cũng
được quan tâm và đã được nhiều nghiên cứu trong khoa học máy tính đề cập trong những
năm gần đây.
Đề tài này nhằm tìm hiểu phương pháp truy xuất và cách biểu diễn dữ liệu mạng
xã hội, cụ thể là Facebook, dưới dạng ontology FOAF, sau đó đánh giá độ tin tưởng của
mỗi tài khoản người dùng trên Facebook thông qua các hoạt động của họ. Luận văn này

trình bày việc rút trích ontology về FOAF và cài đặt thuật tốn tính độ tin cậy trên
Facebook. Trên cơ sở kết quả cài đặt, luận văn nhận định thuật toán và đề xuất một số
bổ sung cho thuật tốn tính độ tin cậy.

* Mục tiêu nghiên cứu
Tìm hiểu phương pháp thu thập dữ liệu mạng xã hội FOAF thơng qua việc tìm
hiểu cấu trúc của dữ liệu FOAF.
1


Nghiên cứu các phương pháp đánh giá độ tin cậy dựa vào FOAF ontology, cài
đặt thuật toán đánh giá độ tin cậy, đồng thời đề xuất và cải tiến thuật toán.

* Đối tượng và phạm vi nghiên cứu
Luận văn nghiên cứu các mối quan hệ và cách thức biểu diễn các mối quan hệ
dựa trên FOAF ontology của mạng xã hội Facebook.
Nghiên cứu các thuật toán đánh giá độ tin cậy dựa vào ontology.

* Phương pháp nghiên cứu
- Tiếp cận theo cách sử dụng kết quả của các nghiên cứu trong nước và trên thế
giới, phát triển phù hợp với mục tiêu của đề tài.
- Thu thập, phân tích, thống kế và xây dựng Ontology để tính độ tin cậy của các
quan hệ trên mạng xã hội.
- Nghiên cứu về độ tin cậy trên mạng xã hội và công thức tính độ tin cậy.
- Biểu diễn tri thức trên Ontology, hiện thực cụ thể bằng công cụ phần mềm.

* Ý nghĩa khoa học và thực tiễn
Nghiên cứu FOAF Ontology và độ tin cậy trên mạng xã hội, cơng thức tính độ tin
cậy (Trust) trong việc mô tả các mối quan hệ trên mạng xã hội để giải quyết bài toán tính
độ tin cậy trên mạng xã hội;

Góp phần xây dựng ứng dụng để tính độ tin cậy của các quan hệ trên mạng xã
hội, cụ thể là mạng xã hội Facebook; Tạo ra một tài liệu đáng tin cậy cho những ai muốn
nghiên cứu về lĩnh vực Ontology và Mạng xã hội

2


CHƯƠNG 1: MẠNG XÃ HỘI VÀ ĐỘ TIN CẬY
1.1. Mạng xã hội
1.1.1. Mạng xã hội là gì ?
Mạng xã hội là một mơ hình mạng (đồ thị) được cấu tạo bởi các đỉnh và các cạnh.
Các đỉnh là tập các đối tượng và các cạnh là tập các liên kết thể hiện mối quan hệ hoặc
sự tương tác giữa các đối tượng này.

Hình 1.1: Các mạng xã hội [2]
Về cơ bản, mạng xã hội tương tự như một trang web tích hợp nhiều ứng dụng
khác nhau. Mạng xã hội khác với trang web thông thường ở cách thức truyền thông tin
và tích hợp nhiều tiện ích. Mạng xã hội cung cấp nhiều công cụ tương tác để mọi người
tự tương tác và tạo ra dòng tin rồi cùng Điều làm cho mạng xã hội trở nên độc đáo là
người dùng không thể gặp được “người lạ”, “người lạ” ở đây là những người dùng trong
hệ thống, nhưng chưa kết nối (kết bạn) với ta. Tuy nhiên, mạng xã hội cho phép ta tìm
kiếm và kết bạn với bất kỳ ai trong hệ thống. Nhưng điều tuyệt vời hơn của mạng xã
hội, là khám phá ra những mối quan hệ tiềm ẩn giữa những người dùng với nhau từ đó
tạo ra cho người dùng cảm giác thích thú và khơng ngừng khám phá.
Ngày nay, các mạng xã hội đang có những bước phát triển hết sức mạnh mẽ. Các
mạng xã hội đang dần thay thế các diễn đàn, trang blog… để trở thành trung tâm chia
sẻ tin tức của người dùng mạng. Tận dụng số lượng người dùng đông đảo và có dấu hiệu
khơng ngừng gia tăng trên mạng xã hội để phục vụ mục tiêu của đề tài.
1.2.2. Lịch sử ra đời
Mạng xã hội xuất hiện lần đầu tiên vào năm 1995 với việc giới thiệu trang web

3


Classmate với mục đích kết nối các bạn cùng lớp, sau đó là sự xuất hiện của SixDegrees
vào năm 1997 với mục đích kết bạn dựa trên sở thích. [23]
Năm 2002, Friendster trở thành xu hướng mới ở Hoa Kỳ với hàng triệu thành
viên đã đăng ký. Tuy nhiên, sự phát triển nhanh chóng này cũng là con dao hai lưỡi:
máy chủ của Friendster thường bị quá tải mỗi ngày, gây ra sự bất bình cho nhiều thành
viên. [23]
Năm 2004, MySpace ra đời với các tính năng như phim ảnh (embedded video)
và nhanh chóng thu hút hàng chục ngàn thành viên mới mỗi ngày, các thành viên cũ của
Friendster cũng lũ lượt chuyển qua MySpace và trong vòng một năm, MySpace trở
thành mạng xã hội đầu tiên có nhiều lượt xem hơn cả Google và được tập đoàn News
Corporation mua lại với giá 580 triệu USD. [23]
Năm 2004, MySpace được ra mắt với các tính năng như video nhúng và nhanh
chóng thu hút hàng chục nghìn thành viên mới mỗi ngày, các thành viên cũ của
Friendster cũng chuyển sang MySpace và trong vòng một năm. MySpace trở thành
mạng xã hội đầu tiên có nhiều lượt xem hơn Google và được News Corporation mua lại
với giá 580 triệu USD. [23]
Năm 2006, sự ra đời của Facebook đã đánh dấu một bước ngoặt cho hệ thống mạng
xã hội trực tuyến với nền tảng lập trình "Nền tảng Facebook" cho phép các thành viên tạo
ra các cơng cụ (ứng dụng) mới cho chính họ cũng như các thành viên khác sử dụng. [23]
Hiện nay, thế giới có hàng trăm mạng xã hội khác nhau, MySpace và Facebook
nổi tiếng nhất ở thị trường Bắc Mỹ và Tây Âu; Orkut và Hi5 ở Nam Mỹ; Friendster ở
Châu Á và Quần đảo Thái Bình Dương. Các mạng xã hội khác đạt được thành công
đáng kể bởi các khu vực như Bebo ở Anh, CyWorld ở Hàn Quốc, Mixi ở Nhật Bản và
tại Việt Nam hiện cũng xuất hiện rất nhiều mạng xã hội như Zalo, Zing Me, Govn,
YuMe,... [23]

4



Hình 1.2: Các mạng xã hội đang hoạt động hiện nay[24]
1.2.3. Tính năng mạng xã hội
Mạng xã hội mang đến cơ hội gặp gỡ những người mới trên khắp thế giới. Người
dùng của các trang web này có một cách để hàng triệu hồ sơ từ khắp nơi trên thế giới.
Trước sự ra đời của các trang mạng xã hội, các phòng chat là cách duy nhất để kết nối
những người mới trên internet. Nhưng lỗ hổng chính của các phịng trị chuyện là bạn
có thể khơng biết người mà bạn thực sự đang tương tác. Việc giới thiệu một hồ sơ trên
các trang mạng xã hội cho phép mọi người biết thêm thông tin về một người trước khi
họ tương tác với họ.
Mạng xã hội được tạo ra để lan rộng trong cộng đồng thông qua sự tương tác của
các thành viên. Mỗi thành viên của mạng xã hội được kết nối và mỗi người là một liên
kết để tạo ra một mạng lưới truyền tải thông tin rộng lớn trong đó. Mỗi mạng xã hội
giống như một xã hội ảo, mỗi tài khoản là một ngôi nhà trong xã hội đó, một mạng xã
hội hoạt động như một phản ứng dây chuyền, A chia sẻ B, B chia sẻ C, C chia sẻ cho D
..., chuỗi chia sẻ này sẽ liên tục và lan truyền rất nhanh, từ đó ngày càng có nhiều người
biết và sử dụng các tiện ích mà mạng xã hội mang lại.
5


Mạng xã hội có cấu trúc bao gồm các thành phần chính: bộ phận chia sẻ thơng
tin (hình ảnh, đoạn phim, liên kết, trạng thái ...), bộ phận cập nhật thông tin, bộ phận kết
bạn, bộ phận tương tác với bạn bè (trị chuyện, cuộc gọi video ...), tìm kiếm , giải trí (trị
chơi, musics ...), cá nhân hóa.
Các tính năng mạng xã hội như trò chuyện, email, phim ảnh, trị chuyện bằng
giọng nói, chia sẻ tệp, blog và biên tập. Mạng hoàn toàn đổi mới cách cư dân mạng kết
nối với nhau và trở thành một phần thiết yếu mỗi ngày, cho hàng trăm triệu thành viên
trên khắp thế giới. Các dịch vụ này có nhiều cách để các thành viên tìm bạn bè và đối
tác: dựa trên các nhóm (như tên trường hoặc tên thành phố), dựa vào thông tin cá nhân

(như địa chỉ email hoặc tên hiển thị) hoặc dựa trên sở thích cá nhân (như thể thao , phim,
sách hoặc âm nhạc), các lĩnh vực quan tâm: kinh doanh, thương mại ...
Tất cả hầu hết tất cả các mạng xã hội cho phép người dùng tạo các nhóm với
những người cùng chí hướng để chia sẻ sở thích và sở thích của họ. Một nhóm hoạt động
như một câu lạc bộ thành viên cho bất kỳ ai cũng có thể chia sẻ mối quan tâm giống
nhau.
1.2.4. Những thành phần trong mạng xã hội
Nút (node): Trong mạng có một hoặc nhiều thực thể. Một cá nhân, doanh nghiệp
hay tổ chức cũng được gọi nút.
Liên kết (tie): là mối quan hệ giữa các thực thể này. Trong mạng, có nhiều loại
liên kết. Ở dạng đơn giản nhất, mạng xã hội là sự sắp xếp các liên kết liên quan giữa các
nút. Chúng ta có thể biểu diễn lưới này bằng một sơ đồ trong đó các nút và được các
liên kết thành đoạn thẳng.
1.2.5. Mục tiêu của mạng xã hội
Tạo ra một hệ thống dựa trên Internet cho phép người dùng trao đổi và chia sẻ
thông tin một cách hiệu quả, vượt quá giới hạn địa lý và thời gian.
Xây dựng một danh tính trực tuyến để phục vụ các yêu cầu công cộng và các giá
trị cộng đồng chung.
Tăng cường vai trị của mỗi cơng dân trong việc tạo mối quan hệ và tự tổ chức
xung quanh lợi ích chung trong cộng đồng, thúc đẩy sự liên kết của các tổ chức xã hội.

6


1.2.6. Mạng xã hội Facebook
1.2.6.1. Giới thiệu
Facebook, công ty Mỹ cung cấp dịch vụ mạng xã hội trực tuyến. Facebook được
thành lập vào năm 2004 bởi Mark Zuckerberg, Eduardo Saverin, Dustin Moskovitz và
Chris Hughes, tất cả đều là sinh viên tại Đại học Harvard. Facebook trở thành mạng xã
hội lớn nhất thế giới, ước tính Facebook có khoảng 2,234 tỷ người dùng tính đến năm

2018 và khoảng một nửa số đó đang sử dụng Facebook mỗi ngày. Trụ sở chính của công
ty là ở Menlo Park, California. [23]
1.2.6.2. Một số mạng xã hội khác.
 Twitter
Twitter là một dịch vụ mạng xã hội trực tuyến miễn phí cho phép người dùng
đọc, nhắn tin và cập nhật các tweet được gọi là tweet, một dạng tiểu blog. Các tweet
được giới hạn tối đa 280 ký tự được lan truyền nhanh chóng trong nhóm bạn bè của tin
nhắn hoặc có thể được hiển thị cho công chúng. Được thành lập vào năm 2006, Twitter
đã trở thành một hiện tượng toàn cầu. Twitter Inc. được đặt tại San Francisco và có hơn
35 cơng ty trên tồn thế giới. Nó dùng để liên lạc với các cá nhân có chung sở thích khác
nhau đối với người dùng có biết nhau ngồi Twitter hay khơng, ngồi ra, nó cịn có khả
năng theo dõi và cập nhật tin tức. Người dùng cũng có thể tải lên hình ảnh, chia sẻ liên
kết và gửi tin nhắn cá nhân cho những người họ đang theo dõi.

Hình 1.3: Mạng xã hội Twitter [2]
 Instagram
Đây có lẽ là mạng xã hội trẻ tuổi nhất trong số các mạng xã hội phổ biến. Instagram
ra đời năm 2010 bởi Kevin Systrom và Mike Krieger. Nó là mạng xã hội chỉ chun về
hình ảnh, video và khởi đầu như một ứng dụng chủ yếu trên smartphone.
7


Hình 1.4: Mạng xã hội Instagram [2]
Với việc là một mạng xã hội chỉ chuyên về hình ảnh đã tạo cho Instagram một dấu
ấn vô cùng đặc biệt. Hơn thế, Instagram còn hỗ trợ chỉnh sửa ảnh và bắt kịp thời đại
bùng nổ smartphone. Giờ đây, những bức ảnh vuông với nhiều màu sắc, trạng thái khác
nhau đã khơng cịn gì xa lạ trong cộng đồng mạng trên thế giới.
 Google Plus
Google Plus cũng là mạng xã hội phát triển nhanh nhất hiện nay. Google Plus được
ra đời tháng 6 năm 2011. Hiện tại Google Plus có khoảng 1,1 tỷ người sử dụng đăng ký.

Mạng xã hội này dần trở nên phổ biến ở Việt Nam nhờ có sự liên kết với các dịch vụ được
cung cấp từ Google khác như Gmail, Youtube,… Giao diện và cách sử dụng trên Google
Plus khá đơn giản và thân thiện nhưng vẫn rất đa dạng.

Hình 1.5: Mạng xã hội Google Plus [2]
8


Chỉ cần người sử dụng đăng nhập qua tài khoản Gmail của mình hay truy cập vào
Youtube thì các thơng báo của họ ở Google Plus cũng có thể được cập nhật thơng qua
đó. Với Google Plus, việc đăng tải thông tin cá nhân, các bản tin thời sự đọc được trên
Google News hay đoạn phim từ Youtube đều được thực hiện một cách trực tiếp và đơn
giản. Các địa chỉ trong danh sách liên lạc của bạn đến từ Gmail cũng dễ dàng tìm thấy
và thêm vào trên Google Plus.
Chúng ta đều nhận thấy những tính năng nổi bật của những mạng xã hội này.
Nhưng đối với Facebook có thể nói là một mạng xã hội có những tính năng tổng hợp tất
cả các tính năng của các mạng xã hội ta đã biết và không ngừng cho ra những tính năng
mới để thu hút người tham gia. Khi tham gia Facebook bạn sẽ được trải nghiệm trong
môi trường mạng xã hội ảo khơng khác gì so với đời sống thực với đầy đủ các tính năng
từ các mối quan hệ, nhóm quan hệ, hình ảnh, video, video trực tuyến, chat, quảng cáo,...
Vì thế tơi đã chọn Facebook làm đối tượng khảo sát để giải quyết bài toán trong luận
văn này.
1.2.Độ tin cậy
1.2.1. Khái niệm
Một trong những thành phần chính trong sự tương tác của con người là lịng tin.
Có rất nhiều định nghĩa về độ tin cậy, một trong số đó là: sự tin cậy là một thước đo
niềm tin rằng một thực thể sẽ cư xử theo cách ta mong đợi, mặc dù thiếu khả năng
giám sát hoặc kiểm sốt mơi trường mà nó hoạt động (theo Singh et al., 2007). Độ
tin cậy được thể hiện dưới dạng một đồ thị tin cậy có các cạnh chứa quy định rõ ràng
các giá trị tin cậy. Nó được sử dụng để suy ra các giá trị tin cậy giữa hai người không

kết nối trực tiếp với nhau. Các tính tốn đã chỉ ra rằng giá trị tối đa và tối thiểu của
mỗi đường đi sẽ:
- Xác định độ tin tưởng của các đường đi với mức cao nhất hoặc thấp nhất tương
ứng
- Xác định bằng cách tính tốn lưu lượng mạng cho mỗi đường đi riêng giữa nguồn
và điểm hội tụ
- Mức tối đa của sự tin tưởng một nguồn tới một điểm hội tụ được giới hạn bởi
trọng số của các cạnh nhỏ dọc theo đường đi
9


Hình 1.6: Đồ thị tin cậy [1]
Sự tin cậy được nghiên cứu ở nhiều lĩnh vực, bao gồm cả xã hội học, tâm lý học,
khoa học chính trị, kinh tế, lịch sử, triết học và khoa học máy tính. Sự tin cậy ở mỗi lĩnh
vực là khác nhau, có rất nhiều loại tin cậy và chúng có ý nghĩa khác nhau với từng đối
tượng và khác nhau trong từng hoàn cảnh cụ thể [11].
Tuy nhiên, tác động tiêu cực của kết quả xấu ảnh hưởng lớn hơn so với tác động
tích cực của kết quả tốt. Việc này địi hỏi An phải đưa ra lựa chọn tốt nhất. Anh ấy
tin tưởng rằng Bình sẽ thực hiện các bước cần thiết để đảm bảo kết quả tốt. Vì vậy,
An sẽ chọn kế hoạch hành động khi anh tin rằng Bình sẽ có những hành động tin cậy
(giả thuyết về kết quả xấu có ảnh hưởng tiêu cực lớn hơn so với kết quả tốt có ý nghĩa
tích cực đã được phân tích trong [10], [11] và cho thấy giả thuyết này chưa đúng
trong mọi trường hợp)
Một khái niệm về niềm tin được giới thiệu bởi Deutsch [9] thường được tham
khảo. Ông ta cho rằng tin vào hành vi xảy ra khi một người (giả sử An) gặp phải một
tình huống cụ thể trong đó anh ấy thấy việc xử lý chưa rõ ràng. Kết quả tốt hay xấu
phụ tùy thuộc vào kết quả của hành động trước đó, có thể dẫn đến một kết quả tốt
hay xấu, và kết quả này sẽ phụ thuộc vào hành động của người khác (giả sử Bình).
Tuy nhiên, tác động tiêu cực của kết quả xấu lớn hơn tác động tích cực của kết quả
tốt.


10


Sztompka [13] đưa ra cho một định nghĩa đơn giản, tổng quát của tin cậy tương tự
như của Deutsch: “Tin cậy (Trust) là sự đánh cược về những hành động ngẫu nhiên
tương lai của những người khác”. Bao gồm hai yếu tố chính của định nghĩa này: tin
tưởng và cam kết. Đầu tiên, một người tin tưởng rằng một người đáng tin cậy sẽ thực
hiện hành động theo một cách nhất định. Tuy nhiên, chỉ có tin tưởng thơi là chưa đủ để
có sự tin cậy. Tin cậy xảy ra khi sự tin tưởng được sử dụng làm cơ sở để đưa ra cam kết
đối với một hành động cụ thể. Hai yếu tố này cũng được thể hiện trong định nghĩa của
Deutsch: “chúng ta cam kết đi theo con đường mơ hồ nếu chúng ta tin rằng những người
đáng tin cậy sẽ hành động theo cách tạo ra kết quả tốt”. Lấy các khía cạnh xã hội chính
của các định nghĩa trên: An tin tưởng Bình nếu anh ấy cam kết hành động dựa trên một
niềm tin rằng hành động của Bình trong tương lai sẽ dẫn đến một kết quả tốt.
1.2.2. Biểu diễn độ tin cậy
Khi bàn về độ tin cậy trên mạng xã hội thì chúng ta thường nghĩ về các phương
pháp dùng để tính tốn độ tin cậy của một người đối với một người khác. Các phương
pháp đó có thể được phân thành hai loại chính: xác suất và khoảng giá trị.
- Phương pháp xác suất dùng để tính một giá trị tin tưởng của người này đối với
người khác.
- Ngược lại với phương pháp tiếp cận xác suất, phương pháp tiếp theo khoảng
giá trị sẽ cho kết quả là sự ước lượng độ tin cậy trong một khoảng nào đó.
1.2.3. Thuộc tính của sự tin cậy
1.2.3.1. Tính bắt cầu
Tính bắt cầu là thuộc tính cơ bản nhất của sự tin cậy. Tính bắt cầu khơng có tính
chất bảo tồn. [1]
Ví dụ: Anh tin tưởng Bình, Bình tin tưởng Nga nhưng chưa chắc rằng Anh sẽ tin
tưởng Nga. Tuy nhiên, Anh có thể tin tưởng Nga ở một mức độ nào đó. Thơng qua các
mối quan hệ, sự tin tưởng được lan truyền từ người này sang người khác.

Có hai loại tin cậy được đề cập : tin tưởng một ai đó và dựa vào sự giới thiệu của
người đó với người khác.

11


Ví dụ: Anh cần thuê một nhà thiết kế Web giỏi. Anh hỏi Bình: "Nga có phải là nhà
thiết kế web giỏi khơng?", anh sẽ quyết định có nên th Nga hay khơng vì Anh tin rằng
lời nói của Bình sẽ đưa ra kết quả tốt khi tìm thấy người thiết kế web giỏi. Nếu Bình
khuyên Anh nên tin vào Nga, anh sẽ có niềm tin nhất định vào Nga vì cơ tin vào Bình.
Vì vậy, sự giới thiệu của Bình đóng vai trị là quan trọng giúp phát triển sự tin tưởng
Anh về Nga (Anh → Bình → Nga)
Ví dụ: Một ví dụ tương tự để biểu diễn về chuỗi tin cậy:

Anh tin Bình

Bình tin Dung

Dun
g

Bình

Anh

Bình kêt với Anh
về Nga

Dung tin Nga


Nga

Dung kể Bình về
Nga

Hình 1.7: Sơ đồ biểu diễn chuỗi tin cậy
Giả sử Bình khơng biết gì về Nga, nhưng một người bạn tên Dung mà anh tin tưởng
biết rất nhiều về Nga. Bình hỏi Dung về Nga và được nói rằng "Nga là một nhà thiết kế web
giỏi". Bình đã nói lại điều này cho Anh. Anh tin rằng Bình sẽ cho anh thơng tin có ích cho
ra kết quả tốt. Bình lựa chọn cách để có được thơng tin có ích là hỏi một người bạn mà anh
ta tin là Dung. Vì Dung tin rằng Nga là một nhà thiết kế web giỏi, nên theo niềm tin trên,
Bình sẽ tin tưởng Nga. Vì tin vào Bình, anh cũng tin Nga. Sự tin tưởng như vậy có thể được
lan truyền đến nhiều người như một chuỗi tin cậy. Nó có thể được viết như sau: Anh →
Bình → Dung → Nga.
Bởi vì tính chất bắc cầu khơng được bảo toàn nên tin cậy sẽ bị giảm. Trong trường
hợp trên, Anh tin tưởng Nga hơn nếu Bình biết Nga trực tiếp, thay vì phải trải qua các
bước trung gian khác để tìm hiểu Nga. Ý tưởng cách lan truyền đáng tin cậy này được
sử dụng rộng rãi trong các mơ hình tính tốn của tin cậy ([14], [15], [16], [17])
1.2.3.2. Tính tổng hợp
Trong ví dụ Anh muốn thuê người thiết kế Web, nếu Duy được nhiều người tin
tưởng để giới thiệu với Anh, Anh sẽ lựa chọn như thế nào?
12


Hình 1.8: Mơ tả tính tổng hợp của tin cậy
Tập hợp lại các lời khuyên đáng tin cậy như dẫn chứng, lập luận, vận động để hỗ
trợ niềm tin. Trong ví dụ trên, Anh cần phải tổng hợp các câu trả lời tin cậy từ Bình và
Dung để đưa ra quyết định.
1.2.3.3. Tính cá nhân hóa và tính khơng đối xứng:
Mỗi quan điểm cá nhân, sở thích, sự quan tâm của mỗi cá nhân có thể khác nhau.

Sự tin tưởng vào cùng một người sẽ khác nhau khi có nhiều quan điểm khác nhau
về người đó. Vì vậy, giá trị tin cậy là khác nhau ở riêng mỗi người khi đánh giá vào
cùng một sự việc.
Giữa hai người khác nhau, sự tin tưởng giữa họ hồn tồn khác nhau vì mỗi người
có trải nghiệm bản thân, tâm lý và hồn cảnh khác nhau
1.3. Các nghiên cứu liên quan đến biểu diễn dữ liệu mạng xã hội
Chúng ta đã thấy rằng dữ liệu mạng xã hội có thể được mơ hình hóa bằng một đồ
thị nơi các nút đại diện cho các cá nhân và các cạnh đại diện cho các mối quan hệ xã hội
nhị phân. Ngoài ra, các nghiên cứu mạng xã hội xây dựng trên các thuộc tính của nút và
các cạnh, có thể được chính thức hóa như các chức năng hoạt động trên các nút hoặc các
cạnh.[5]
Dữ liệu thuộc tính trong tài liệu điện tử có thể được xử lý tuần tự và lưu trữ,
xây dựng lại sau đó trong cùng một hoặc nhiều mơi trường máy tính. Các định dạng
13


thường gặp nhất là những người sử dụng thường gặp các gói phân tích mạng phổ biến
Pajek và UCINET. Đây là định dạng dựa trên văn bản đã được thiết kế theo cách để
họ có thể dễ dàng thay đổi nội dung sử dụng soạn thảo văn bản đơn giản. Hình 1.9
cho thấy một ví dụ đơn giản của những định dạng.

Hình 1.9: Đồ thị đơn giản (phía trên bên trái) được mô tả trong Pajek NET,
UCINET DL và các định dạng GraphML [5]
Nhận xét: hai định dạng không tương thích (UCINET có khả năng đọc và viết các
định dạng .net của Pajek, nhưng ngược lại thì khơng). Hơn nữa, các nhà nghiên cứu
trong các ngành khoa học xã hội thường sử dụng bảng tính Microsoft Excel đại diện cho
dữ liệu ban đầu của họ, có thể được xuất ra trong định dạng CSV đơn giản (Comma
Separated Values). Khi định dạng này là không cụ thể cho các cấu trúc đồ thị (nó chỉ là
một cách để xuất một bảng dữ liệu), thì việc bổ sung hạn chế cần phải được đưa vào nội
dung trước khi một tập tin có thể được xử lý bởi các gói đồ thị.

Các định dạng GraphML đại diện cho một bước tiến so với các định dạng đã đề cập
cả về khả năng tương tác và mở rộng [28]. GraphML bắt nguồn từ các cộng đồng ảo
14


nơi một định dạng chia sẻ rất nhiều và làm tăng khả năng sử dụng phương pháp trực
quan mới. GraphML dựa trên XML (Xtensible Markup Language) với một lược đồ được
định nghĩa trong XML Schema. Điều này có lợi thế mà các file GraphML có thể được
chỉnh sửa, lưu trữ, truy vấn… bằng cách sử dụng công cụ XML chung.
Phổ biến cho tất cả các đại diện đồ thị chung là họ tập trung vào cấu trúc đồ thị,
mà đầu vào chính để phân tích mạng và trực quan. Thuộc tính dữ liệu khi nhập vào biểu
mẫu điện tử thường được lưu giữ riêng từ mạng dữ liệu trong các trang Excel (sheets),
cơ sở dữ liệu.
Tuy nhiên, trong số các định dạng thì khơng định dạng nào hỗ trợ tập hợp và tái
sử dụng các dữ liệu điện tử, đó là mối quan tâm chính. Để tập hợp được dữ liệu thì
hãy xem xét các kịch bản trong hình 1.10, thực hiện một nghiên cứu mạng bằng cách
tái sử dụng một số nguồn dữ liệu mô tả, cùng một tập hợp các cá nhân và các mối
quan hệ của họ (ví dụ, lưu trữ email và cơ sở dữ liệu xuất bản giữ thơng tin về các
nhà nghiên cứu).

Hình 1.10: Ví dụ về trường hợp nhận dạng lý luận [20]
Giải pháp đề xuất: căn cứ vào ngữ nghĩa đại diện dựa trên các đối tượng chính
trong dữ liệu mạng xã hội, cụ thể là các cá nhân và mối quan hệ xã hội của họ. Một biểu
ngữ nghĩa như trên sẽ cho phép chúng ta vận dụng sức mạnh của ngôn ngữ Ontology và
15


×