Tải bản đầy đủ (.pdf) (89 trang)

Nghiên cứu phương pháp tư vấn dựa trên hành vi người dùng mạng xã hội (LV thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.12 MB, 89 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
-----------------------------

NGUYỄN THỊ YẾN

NGHIÊN CỨU PHƯƠNG PHÁP TƯ VẤN DỰA TRÊN
HÀNH VI NGƯỜI DÙNG TRONG MẠNG XÃ HỘI

LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)

HÀ NỘI – 2016


HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------

NGUYỄN THỊ YẾN
NGHIÊN CỨU PHƯƠNG PHÁP TƯ VẤN DỰA TRÊN
HÀNH VI NGƯỜI DÙNG TRONG MẠNG XÃ HỘI

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01

LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)

NGƯỜI HƯỚNG DẪN KHOA HỌC : TS.VŨ VĂN THỎA

HÀ NỘI – NĂM 2016



i

LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Nội dung của
luận văn có tham khảo và sử dụng các tài liệu, thông tin được đăng tải trên các tạp
chí và các trang web theo danh mục tài liệu tham khảo. Tất cả các tài liệu tham khảo
đều có xuất xứ rõ ràng và được trích dẫn hợp pháp.
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỉ luật theo quy
định cho lời cam đoan của mình.
Học viên

Nguyễn Thị Yến


ii

LỜI CẢM ƠN
Lời đầu tiên em xin gửi lời cảm ơn chân thành tới tất cả các thầy cô đang
giảng dạy tại Học Viện Công nghệ Bưu Chính Viễn thông đã tận tình truyền đạt
những kiến thức quý báu giúp em hoàn thành khóa học này.
Em xin chân thành cảm ơn khoa Quốc Tế và Đào Tạo Sau Đại Học, Học
Viện Công Nghệ Bưu Chính Viễn Thông đã tạo điều kiện tốt cho em thực hiện
luận văn tốt nghiệp này.
Em xin gửi lời biết ơn sâu sắc đến thầy TS. Vũ Văn Thỏa, người đã tận tình
hướng dẫn, chỉ bảo em trong suốt thời gian thực hiện luận văn.
Tôi xin bày tỏ lòng biết ơn chân thành đối với gia đình đã luôn động viên,
ủng hộ, cổ vũ và tạo mọi điều kiện giúp tôi.
Tôi cảm ơn tất cả những người bạn của tôi, những người luôn chia sẻ, cổ vũ
và giúp đỡ tôi.

Mặc dù đã cố gắng hoàn thành luận văn trong phạm vi và khả năng cho
phép, nhưng chắc chắn sẽ không tránh khỏi những thiếu sót, kính mong sự cảm
thông và tận tình chỉ bảo, góp ý của thầy cô và các bạn.
Hà Nội, ngày

/

Học viên

Nguyễn Thị Yến

/2016


MỤC LỤC
LỜI CAM ĐOAN ............................................................................................................................. ii
LỜI CẢM ƠN ................................................................................................................................... ii
MỤC LỤC ............................................................................................................................................
DANH MỤC CÁC HÌNH VẼ ............................................................................................................
DANH MỤC CÁC BẢNG..................................................................................................................
DANH MỤC THUẬT NGỮ ..............................................................................................................
MỞ ĐẦU .............................................................................................................................................1
CHƯƠNG 1: ĐỘ TƯƠNG ĐỒNG HÀNH VI NGƯỜI DÙNG TRÊN MẠNG XÃ HỘI ......3
1.1 Giới thiệu về mạng xã hội ..................................................................................................... 3
1.1.1 Lịch sử hình thành ........................................................................................................ 4
1.1.2 Cấu trúc chung của mạng xã hội ................................................................................. 5
1.1.3 Một số mạng xã hội phổ biến hiện nay ....................................................................... 6
1.2 Giới thiệu về hành vi trong mạng xã hội ............................................................................ 11
1.3 Độ tương đồng giữa các cặp người dùng dựa vào các hành vi mạng xã hội ................... 12
1.3.1 Độ tương tự giữa các cặp người dùng dựa vào hành vi Like ..................................... 12

1.3.2 Độ tương tự giữa các cặp người dùng dựa vào hành vi Post ...................................... 15
1.3.3 Độ tương tự giữa các cặp người dùng dựa vào hành vi Comment ............................ 18
1.3.4 Độ tương tự giữa các cặp người dùng dựa vào hành vi Friend .................................. 21
1.4 Kết luận chương 1 ............................................................................................................... 24
CHƯƠNG 2: PHƯƠNG PHÁP TƯ VẤN DỰA TRÊN HÀNH VI NGƯỜI DÙNG ............25
2.1. Phát biểu bài toán hệ tư vấn cộng tác dựa vào hành vi người dùng trong mạng xã hội 25
2.2. Phương pháp tư vấn dựa vào một hành vi ........................................................................ 27
2.2.1 Phương pháp tư vấn dựa vào hành vi Like .................................................................. 28
2.2.2 Phương pháp tư vấn dựa vào hành vi Post .................................................................. 33
2.2.3 Phương pháp tư vấn dựa vào hành vi Comment ......................................................... 37
2.2.4 Phương pháp tư vấn dựa vào hành vi Friend ............................................................... 41
2.3 Phương pháp tư vấn kết hợp hai hành vi ............................................................................ 45
2.3.1 Phương pháp tư vấn kết hợp hai hành vi Comment và Friend ................................... 45
2.3.2 Phương pháp tư vấn kết hợp hai hành vi Comment và Like ...................................... 48


2.3.3 Phương pháp tư vấn kết hợp hai hành vi Comment và Post ...................................... 50
2.4 Phương pháp tư vấn kết hợp ba hành vi ............................................................................. 53
2.4.1 Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Friend .............................. 53
2.4.2 Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Post .................................. 56
2.5 Phương pháp tư vấn kết hợp bốn hành vi Comment, Like, Friend, Post ......................... 59
2.5.1 Thuật toán ...................................................................................................................... 59
2.5.2 Ví dụ minh họa .............................................................................................................. 63
2.6 Kết luận chương 2 ............................................................................................................... 65
CHƯƠNG 3. THỬ NGHIỆM VÀ ĐÁNH GIÁ ..........................................................................66
3.1 Dữ liệu thử nghiệm .............................................................................................................. 66
3.2 Phương pháp thử nghiệm .................................................................................................... 71
3.3 Kết quả thử nghiệm ............................................................................................................. 72
3.4. Kết luận chương 3 .............................................................................................................. 76
KẾT LUẬN ......................................................................................................................................77

1.Kết quả đạt được ..................................................................................................................... 77
2.Hướng phát triển ..................................................................................................................... 78
TÀI LIỆU THAM KHẢO..............................................................................................................79


DANH MỤC CÁC HÌNH VẼ
Hình 1.1. Một số trang mạng xã hội phổ biến............................................................. 3
Hình 1.2. Mô hình liên kết một mạng xã hội .............................................................. 6
Hình 1.3. Giao diện Facebook trên Window 7 ........................................................... 7
Hình 1.4. Giao diện Twitter trên Window 7 ............................................................... 9
Hình 1.5. Giao diện Google Plus trên Windows 7 .................................................... 10
Hình 1.6. Đồ thị 2 phía biểu diễn mối quan hệ thích người dùng-sản phẩm ............ 14
Hình 1.7. Đồ thị 2 phía biểu diễn cho lọc cộng tác theo mô hình đề xuất ................ 17
Hình 1.8. Đồ thị 2 phía biểu diễn mối quan hệ comment người dùng-sản phẩm ..... 20
Hình 1.9. Đồ thị biểu diễn mối quan hệ friend giữa các người dùng........................ 23
Hình 2.1. Thuật toán Combinated-Like .................................................................... 30
Hình 2.2. Thuật toán Combinated-Post ..................................................................... 35
Hình 2.3. Thuật toán Combinated-Comment ............................................................ 39
Hình 2.4. Thuật toán Combinated-Friend ................................................................. 43
Hình 2.5. Thuật toán Combinated - Comment-Friend .............................................. 48
Hình 2.6. Thuật toán Combinated -Comment-Like .................................................. 50
Hình 2.7. Thuật toán Combinated-Comment-Post.................................................... 53
Hình 2.8. Thuật toán Combinated-Comment-Friend-Like ....................................... 56
Hình 2.9. Thuật toán Combinated-Like-Post-Comment ........................................... 59
Hình 2.10. Thuật toán Combinated- Comment-Friend- Like-Post ........................... 63
Hình 3.1. Mô hình dữ liệu hệ thống HotelRecomendSystem ................................... 67


DANH MỤC CÁC BẢNG
Bảng 1.1. Ma trận đánh giá người dùng-sản phẩm ... Error! Bookmark not defined.

Bảng 1.2. Ma trận Like người dùng-sản phẩm ......................................................... 13
Bảng 1.3. Ma trận Post người dùng-sản phẩm .......................................................... 16
Bảng 1.4. Ma trận comment người dùng-sản phẩm .................................................. 19
Bảng 1.5. Ma trận Friend người dùng-người dùng ................................................... 22
Bảng 3.1. Giá trị MAE thử nghiệm dựa trên hành vi đánh giá ................................. 72
Bảng 3.2. Giá trị MAE thử nghiệm dựa trên việc kết hợp với một hành vi ............. 72
Bảng 3.3. Giá trị MAE thử nghiệm dựa trên việc kết hợp với hai hành vi ............... 74
Bảng 3.4. Giá trị MAE thử nghiệm dựa trên việc kết hợp với ba hành vi ................ 75
Bảng 3.5. Giá trị MAE thử nghiệm dựa trên việc kết hợp tất cả các hành vi ........... 75


DANH MỤC THUẬT NGỮ
Nghĩa tiếng Việt

Thuật ngữ tiếng Anh
Recommender System

Hệ tư vấn

Social network

Mạng xã hội

Combinated-Like

Kết hợp với hành vi Like

Combinated-Post

Kết hợp với hành vi Post


Combinated-Comment

Kết hợp với hành vi Comment

Combinated-Friend

Kết hợp với hành vi Friend

Combinated-Comment-Friend

Kết hợp với hành vi Comment, Friend

Combinated-Comment-Like

Kết hợp với hành vi Comment, Like

Combinated-Comment-Post

Kết hợp với hành vi Comment, Post

Combinated-Comment-Friend-Like

Kết hợp với hành vi Comment, Friend,
Like

Combinated-Like-Post-Comment

Kết hợp với hành vi Comment, Like,
Post


Combinated-Comment-Friend-Like-Post

Kết hợp với hành vi Comment, Like,
Post, Friend


1

MỞ ĐẦU
1. Đặt vấn đề
Hê ̣ hê ̣ tư vấ n (Recommender System) là hê ̣ thố ng có khả năng tự đô ̣ng phân
tić h, dự đoán và gơị ý thông tin mới phù hơ ̣p cho mỗ i người dùng các dịch vụ
Internet. Hê ̣ tư vấn xuấ t hiê ̣n trong nhiề u ứ ng du ̣ng khác nhau của khoa ho ̣c má y
tin
̣ vu ̣, tư vấn khách hàng tiề m
́ h như tư vấn kế t quả tim
̀ kiế m, tư vấn sử du ̣ng dich
năng. Đă ̣c biê ̣t, hê ̣ tư vấn đóng vai trò quan tro ̣ng trong viê ̣c nâng cao hiê ̣u quả của
các hê ̣ thố ng thương ma ̣i điê ̣n tử.
Các phương pháp xây dựng hê ̣ tư vấn trước đây xem xét tâ ̣p người dùng
trong hê ̣ gơị ý là tâ ̣p người dùng cố đinh
̣ có quyề n lơị gắ n bó mâ ̣t thiế t với hê ̣ thố ng
và đươ ̣c hưởng lơị từ viê ̣c cung cấ p thông tin trong hê ̣ thố ng. Mố i liên hê ̣ của người
dùng luôn bi ̣đóng kín trong tâ ̣p người dùng hê ̣ thố ng. Vì vâ ̣y, với cách tiế p câ ̣n này
hê ̣ tư vấn gă ̣p phải mô ̣t số khó khăn trong khi giải quyế t trường hơp̣ người dùng
mới, sản phẩ m mới và mô ̣t số vấ n đề khác.
Sự ra đời các mạng xã hội làm thay đổi phương thức trao đổi thông tin toàn
cầ u. Mỗi người dùng trong mạng không còn độc lập với những người dùng khác mà
họ bị chi phố i và ảnh hưởng bởi các mối quan hệ xã hội như gia đình, bạn bè, đồng

nghiệp, sở thić h hoă ̣c chủ đề quan tâm. Người dùng trong mạng xã hội tự do chia sẻ
và bày tỏ quan điểm, ý tưởng, và đánh giá của mình tất cả các vấn đề với cộng đồng
các quan hệ khác nhau. Sự tương tác của người dùng với các mối quan hệ xã hội tạo
nên nguồn tài nguyên thông tin to lớn độc lập với nguồn tài nguyên sẵn có của các
hệ thố ng gơị ý trước đây. Chính vì vậy, nếu tích hợp hệ tư vấn với hành vi người
dùng trong các mạng xã hội sẽ góp phần cải thiện chất lượng tư vấn.
Với những lý do nêu trên, học viên lựa chọn đề tài “Nghiên cứu phương
pháp tư vấn dựa trên hành vi người dùng trong mạng xã hội” để thực hiện trong
khuôn khổ luận văn thạc sĩ ngành khoa học máy tính.

2. Mục tiêu của luận văn
Mục tiêu nghiên cứu luận văn là phương pháp tư vấn cộng tác kết hợp với
hành vi friend, post, lile, comment của người dùng trong ma ̣ng xã hội, đánh giá mức


2

độ tương tự giữa các cặp người dùng đã tương tác trên mạng xã hội, để từ đó ứng
dụng vào hệ tư vấn sao cho việc tư vấn đạt hiệu quả nhất. Các tiêu chí tiếp cận đánh
giá sẽ dùng 4 hành vi phổ biến nhất trong các hành vi của người dùng trên mạng xã
hội để có hành vi tổng quát là: post bài về sản phẩm, comment về sản phẩm, like
sản phẩm và kết bạn với nhau. Xây dựng tập dữ liệu, thử nghiệm và đánh giá
phương pháp tích hợp so với phương pháp tư vấn truyền thống không sử dụng tài
nguyên trong mạng xã hội.

3. Các đóng góp của luận văn
- Nghiên cứu phương pháp xác định độ tương tự hành vi giữa các cặp người
dùng trên mạng xã hội, bao gồm: phương pháp xác định độ tương tự hành vi friend,
post, like, comment.
- Nghiên cứu phương pháp xây dựng hệ tư vấn dựa vào một hành vi, hai

hành vi, ba hành vi người dùng và phương pháp kết hợp với tất cả hành vi người
dùng.
- Xây dựng tập dữ liệu thử nghiệm cho các điạ điể m du lich
̣ (khách sạn) do
tâ ̣p người dùng trong ma ̣ng xã hô ̣i đánh giá .

4. Bố cục của luận văn
Bố cục luận văn gồm 3 phần:
Chương 1. Độ tương đồng hành vi người dùng trong mạng xã hội
Nội dung chính của chương 1 bao gồm giới thiệu về mạng xã hội, các hành
vi trong mạng xã hội và phương pháp tính độ tương tự giữa các cặp người dùng
trong mạng xã hội.
Chương 2. Phương pháp tư vấn dựa trên hành vi người dùng
Chương 2 trình bày phát biểu bài toán tư vấn cộng tác dựa vào hành vi người
dùng trong mạng xã hội, phương pháp tư vấn dựa trên một hành vi, hai hành vi, ba
hành vi và bốn hành vi.
Chương 3. Thử nghiệm và đánh giá
Chương 3 luận văn đưa ra bộ dữ liệu, phương pháp và thuật toán thử nghiệm,
đồng thời đánh giá phương pháp tư vấn tích hợp hành vi so với phương pháp tư vấn
truyền thống.


3

CHƯƠNG 1: ĐỘ TƯƠNG ĐỒNG HÀNH VI
NGƯỜI DÙNG TRÊN MẠNG XÃ HỘI
Nội dung chính của chương này là trình bày những vấn đề tổng quan về
mạng xã hội và hành vi người dùng trên mạng xã hội, đề xuất phương pháp tính
toán mức độ tương tự giữa các cặp người dùng dựa vào hành vi trong mạng xã hội.


1.1 Giới thiệu về mạng xã hội
Mạng xã hội (social network) là dịch vụ nối kết các thành viên cùng sở thích
trên Internet lại với nhau với nhiều mục đích khác nhau không phân biệt không gian
và thời gian. Những người tham gia vào mạng xã hội được gọi là cư dân mạng [13].
Hình 1.1 dưới đây liệt kê một số trang mạng xã hội phổ biến.

Hình 1.1. Một số trang mạng xã hội phổ biến
Mạng xã hội có những tính năng như chat, e-mail, phim ảnh, voice chat, chia
sẻ file, blog và xã luận. Mạng đổi mới hoàn toàn cách cư dân mạng liên kết với
nhau và trở thành một phần tất yếu của mỗi ngày cho hàng trăm triệu thành viên
khắp thế giới. Các dịch vụ này có nhiều phương cách để các thành viên tìm kiếm


4

bạn bè, đối tác: dựa theo group , dựa trên thông tin cá nhân , hoặc dựa trên sở thích
cá nhân, lĩnh vực quan tâm: kinh doanh, mua bán..
Về cơ bản, mạng xã hội giống như một trang web mở với nhiều ứng dụng
khác nhau. Mạng xã hội khác với trang web thông thường ở cách truyền tải thông
tin và tích hợp ứng dụng.
Về mặt bản chất, mạng xã hội chính là hình thức làm marketing truyền
miệng trên môi trường Internet.

1.1.1 Lịch sử hình thành
Trong quá khứ, mạng xã hội luôn đồng hành cùng với sự phát triển của
Internet. Từ những email đầu tiên được gởi đi vởi các nhà nghiên cứu Thụy Sĩ vào
năm 1971 đến những mạng xã hội hiện đại như Google+ hay Pinterest. Internet và
các nội dung chia sẻ luôn gắn liền với tính chất cộng đồng.
Mục tiêu chính của Internet là tạo phương tiện để mọi người có thể kết nối,
giao tiếp và cộng tác với nhau. Hiện nay, những công cụ xã hội trực tuyến được

nhắc tới nhiều nhất là Facebook, Twitter hay Google+. Tuy nhiên, từ lúc xuất hiện
đến nay, mạng xã hội đã trải qua nhiều thay đổi nhanh chóng cả về nguyên lý làm
việc lẫn giao diện đồ họa.
Mạng xã hội xuất hiện lần đầu tiên năm 1995 với sự ra đời của trang
Classmate với mục đích kết nối bạn học, tiếp theo là sự xuất hiện của SixDegrees
vào năm 1997 với mục đích giao lưu kết bạn dựa theo sở thích.
Năm 2002, Friendster trở thành một trào lưu mới tại Hoa Kỳ với hàng triệu
thành viên ghi danh. Tuy nhiên sự phát triển quá nhanh này cũng là con dao hai
lưỡi: server của Friendster thường bị quá tải mỗi ngày, gây bất bình cho rất nhiều
thành viên.
Năm 2004, MySpace ra đời với các tính năng như phim ảnh (embedded
video) và nhanh chóng thu hút hàng chục ngàn thành viên mới mỗi ngày, các thành
viên cũ của Friendster cũng nhanh chóng chuyển qua MySpace và trong vòng một
năm, MySpace trở thành mạng xã hội đầu tiên có nhiều lượt xem hơn cả Google và
được tập đoàn News Corporation mua lại với giá 580 triệu USD.


5

Hai năm sau, Twitter cũng kịp thời ra đời, ghi dấu mốc quan trọng trong quá
trình phát triển của mạng xã hội.
Năm 2006, sự ra đời của Facebook đánh dấu bước ngoặt mới cho hệ thống
mạng xã hội trực tuyến với nền tảng lập trình "Facebook Platform" cho phép thành
viên tạo ra những công cụ (apps) mới cho cá nhân mình cũng như các thành viên
khác dùng [13].

1.1.2 Cấu trúc chung của mạng xã hội
Về cơ bản, mạng xã hội giống như một trang web mà nó hoạt động như một
tâm điểm kết nối, giúp các thành viên thiết lập mối quan hệ với nhau. Mạng xã hội
được tạo ra để tự thân nó lan rộng trong cộng đồng thông qua các tương tác của các

thành viên trong chính cộng đồng đó. Mọi thành viên trong mạng xã hội cùng kết
nối và mỗi người là một nút để tạo nên một mạng lưới rộng lớn truyền tải thông tin
trong đó.
Mạng xã hội chứa các thành phần cụ thể và cho phép người dùng:
-

Tạo hồ sơ cá nhân trực tuyến

-

Danh sách bạn bè trong kết nối của họ

-

Nhận được thông báo từ các kết nối của họ

-

Tham gia hoạt động hàng ngày: đăng bài, thích bài, nhận xét bài, tham
gia nhóm - cộng đồng,….

-

Thiết lập quyền kiểm soát dữ liệu.

Mỗi thành viên trong mạng xã hội giống như một nút. Mỗi nút lại liên kết với
các nút khác thông qua các cạnh chính là các hành động thực hiện hàng ngày. Có 2
kiểu liên kết tồn tại trong mạng xã hội:
-


Liên kết trực tiếp: mối liên kết giữa 2 nút trực tiếp với nhau, tức là 2 nút
này có thể quen biết nhau là bạn, đồng nghiệp, có chung sở thích, có
chung vấn đề quan tâm,….

-

Liên kết gián tiếp: liên kết giữa 2 nút thông qua 1 hoặc nhiều nút trung
gian. Ví dụ: Người A liên kết trực tiếp với người B, người B liên kết trực
tiếp với người C, người C liên kết trực tiếp với người D. Người A và


6

người D không có liên kết trực tiếp nào nên giữa họ hình thành liên kết
gián tiếp qua người B và người C. Do vậy, giữa người A và người D có ít
nhất một điểm chung là B và C.
Hình 1.2 dưới đây biểu diễn mô hình liên kết một mạng xã hội.

Hình 1.2. Mô hình liên kết một mạng xã hội
Như vậy trong chuỗi liên kết của một thành viên trong mạng xã hội sẽ luôn
tồn tại ít nhất một đặc điểm chung nào đó với các thành viên khác cũng nằm trên
liên kết đó.

1.1.3 Một số mạng xã hội phổ biến hiện nay
1.1.3.1 Facebook
Facebook ( là một dịch vụ mạng xã hội được
sáng lập bởi Mark Zuckerburg, ra mắt vào tháng 2 năm 2004, do Facebook.Inc điều
hành. Facebook đã phổ biến với lượng người dùng khổng lồ và hiện đang là mạng



7

xã hội lớn nhất thế giới. Theo thống kê, Facebook hiện có hơn 1.409 tỉ người dùng
và đứng đầu trên toàn thế giới.
Hình 1.3 dưới đây mô tả một giao diện Facebook trên Window 7.

Hình 1.3. Giao diện Facebook trên Window 7
Facebook là nơi mọi người có thể giao lưu kết bạn cũng như chia sẻ thông
tin, hình ảnh, tin tức, những sở thích cá nhân hay bất cứ điều gì người dùng muốn.
Hiện có rất nhiều các nhà tiếp thị sử dụng Facebook để thu hút thêm khách hàng
mới, rất nhiều người dân tại các quốc gia đang sử dụng Facebook, nhiều nhất là Mỹ
cho biết Facebook là nhân tố số 1 ảnh hưởng đến quyết định mua sắm của họ. Do
đặc tính thân thiện, dễ sử dụng cũng như phù hợp với lối sống năng động của đại bộ
phận giới trẻ Việt mà mạng xã hội này ngày càng phổ biến.
Tính năng với người sử dụng: Ban đầu, Facebook được hướng chủ yếu tới
sinh viên, nhưng ngày nay đã được phổ cập ở mọi lứa tuổi. Mặc dù phạm vi của
Facebook đã được mở rộng và nâng cấp thêm rất nhiều tính năng so với trước đây
nhưng mục đích thì không thay đổi - chia sẻ thông tin và tính chất giải trí. Mọi
người dùng cần đăng ký để tạo một tài khoản cá nhân, sau đó Facebook sẽ cung cấp
cho người dùng một hồ sơ để gia nhập vào mạng. Sau khi gia nhập, người dùng sẽ
được cung cấp một vài cách để tìm kiếm bạn:


8

-

Cách 1: Facebook tự động đẩy danh sách liên hệ từ địa chỉ email có tài khoản
Facebook sang


-

Cách 2: người dùng tự tham gia vào các nhóm, các trang trên Facebook và tự
tìm kiếm bạn bè trong đó

-

Cách 3: sử dụng cỗ máy tìm kiếm của Facebook để tìm ra người cụ thể dựa
vào tên của người đó.

Một số cơ chế trên Facebook giúp người dùng thuận tiện trong việc giao tiếp và
chia sẻ thông tin:
-

Đăng bài “post” trên trang cá nhân – bài đăng có thể là bất cứ cái gì (suy
nghĩ, video, ảnh…) có thể bật định vị để đưa lên vị trí người dùng đang viết
bài.

-

Cơ chế đánh dấu “tag”, đó là một loại liên kết đặc biệt. Khi “tag” ai đó nghĩa
là tạo một đường liên kết tới dòng thời gian (timeline) của người đó. Người
được “tag” sẽ được thông báo và lựa chọn xem họ có cho phép hiển thị “tag”
hay không.

-

Theo dõi “follow” cũng được sử dụng và hoạt động như “subscribe” (đăng
ký theo dõi). Khi chọn “follow” ai đó, sẽ nhìn thấy những cập nhật từ người
mà có theo dõi.


-

Nút “like” là một nút nổi tiếng do Facebook khởi xướng. Nút này thường
được gắn với một nội dung cụ thể, khi nhấn “like” nghĩa là đã đưa ra một
phản hồi tích cực đến thứ mà đang quan tâm.

1.1.3.2 Twitter
Twitter (https: twitter.com/) được sáng lập năm 2006 bởi Jack Dorsey, Evan
Williams và Biz Stone, Twitter là một mạng xã hội trực tuyến và dịch vụ tiểu blog
cho phép người dùng gửi và đọc các tin nhắn văn bản. Sau khi ra đời Twitter nahnh
chóng trở nên phổ biến trên toàn thế giới với hơn 316 triệu người dùng (tháng
8/2015). Hình 1.4 dưới đây mô tả một giao diện Facebook trên Window 7.


9

Hình 1.4. Giao diện Twitter trên Window 7
Tuy nhiên, cách sử dụng khá phức tạp cùng với các nguyên tắc khó hiểu
cũng như giao diện lạ mắt khiến Twitter được đánh giá là khó gần. Hơn thế, Twitter
còn giới hạn 140 kí tự trong một bài đăng gọi là Tweet, điều này gây rất nhiều bất
tiện cho nhiều người khi họ muốn chia sẻ nhiều cảm xúc, suy nghĩ, ý kiến của bản
thân. Điều đó tương tự như việc khi ai đó muốn nhắn tin cho người yêu nhưng lại
không đủ ký tự, thì họ sẽ lựa chọn gọi điện hay một phương pháp nào khác nhanh
gọn và tiện lợi hơn. Dù du nhập vào Việt Nam gần như đồng thời với Facebook
nhưng số phận của Twitter lại ảm đạm hơn hẳn.
Tính năng của người dùng trên Twitter: Người dùng cần phải đăng ký một tài
khoản bằng email. Sau đó Twitter sẽ cung cấp cho người dùng một hồ sơ vào mạng.
Người dùng có thể đăng tweet có một vài giới hạn như độ dài không quá 140 kí tự
và chỉ có thể bao gồm dữ liệu dạng văn bản, không thể đính kèm tranh, ảnh, video.

Mỗi người dùng Twitter sinh ra một luồng “tweet” và có thể chọn theo sau luồng
của một người khác để luôn được cập nhật tin tức từ người đó. Có 3 cách để theo
dấu thông tin trên Twitter:
-

Cách 1: theo dõi quá trình lan truyền của một “tag”: người sử dụng sẽ ghi
chú lên tweet của mình sử dụng một “tag” ngắn.


10

-

Cách 2: theo dõi quá trình lan truyền của một URL cụ thể

-

Cách 3: dựa vào các “retweet” (phản hồi của tweet): khi B nhìn thấy tweet
của A và chuyển tiếp nó cho các người theo dõi của mình bằng cách
“retweet”, những người theo dõi B có thể nhìn thấy “tweet” của A, tạo thành
một thác lan truyền thông tin. “Favourite” có chức năng giống như “Like”
của Facebook đó là đưa ra một ý kiến tích cực về một tweet nào đó.

1.1.3.3 Google Plus
Google Plus ( mặc dù từng bị xem là một thất bại
trên lĩnh vực mạng xã hội của Google nhưng qua 3 năm tồn tại và phát triển, Google
Plus đã bất ngờ vượt mặt các ông lớn để trở thành mạng xã hội lớn thứ 3 trên toàn
cầu, chỉ đứng sau Facebook theo số liệu thống kê đến thang 8/2015.

Hình 1.5. Giao diện Google Plus trên Windows 7

Google Plus hiện đã đạt đến 300 triệu người dùng hoạt động. Tuy nhiên, việc
Google Plus sử dụng chung tài khoản với các dịch vụ của Google như Gmail,
Youtube dẫn đến sự chồng chéo trong thống kê và làm “ảo” số lượng người dùng
của mình. Chỉ cần người dùng đăng nhập qua tài khoản Gmail hay Youtube thì các
thông báo của họ ở Google Plus cũng được cập nhật. Việc đăng tải thông tin cá
nhân, các bản tin thời sự đọc trên Google News hay đoạn phim từ Youtube được
thực hiện một cách trực tiếp và đơn giản.


11

Cũng giống như Twitter, không có một thống kê chính thức nào về số lượng
người dùng Google Plus tại Việt Nam. Vì một lý do nào đó, Google Plus không
mấy phổ biến ở nước ta và số lượng tài khoản Google Plus phần nhiều đều xuất phát
từ công ty mẹ Google, với các ấn phẩm đi kèm như Gmail, Youtube…

1.2 Giới thiệu về hành vi trong mạng xã hội
Trong mạng xã hội, hành vi của một người dùng là hoạt động hằng ngày mà
người dùng tương tác với người dùng khác:
-

Đăng bài “Post” trên trang cá nhân – bài đăng có thể là bất cứ cái gì (suy
nghĩ, video, ảnh,…)

-

Thích “Like” là một nút do Facebook khởi xướng. Nút “like” thường được
gắn với một nội dung cụ thể, khi nhấn “like” nghĩa là người dùng đã đưa ra
một phản hồi tích cực đến thứ mà người dùng đang quan tâm.


-

Nhận xét “Comment” là khi người dùng đưa ra quan điểm hay nhận xét về
một bài nào đó.

-

Kết bạn “Add friend” với một người nào đó mà người dùng muốn.

-

Tham gia hay gia nhập nhóm, cộng đồng là hành động người dùng quan tâm
đến nội dung của nhóm hay cộng đồng đó.

-

Theo dõi “Follow” với một người nào đó mà người dùng muốn.

-

Tạo/tham gia các sự kiện “Event” là hành động người dùng quan tâm đến nội
dung của sự kiện.

-

Chia sẻ “Share” bài đăng lên trang cá nhân.
Tất cả yếu tố trên được gọi chung là hành vi người dùng trên mạng xã hội.
Như vậy, người dùng trên mạng xã hội nào đó có thể có nhiều hành vi khác

nhau. Các hành vi này tạo ra mối quan hệ giữa các người dùng trong mạng xã hội.

Mối quan hệ đó là một trong các thông tin hữu ích có thể hỗ trợ quá trình tư vấn
người dùng mua/sử dụng sản phẩm. Trong phạm vi của luận văn, học viên chỉ xem
xét 4 hành vi sau đây:
-

Like (thích);

-

Comment (nhận xét);


12

-

Post (đăng bài);

-

Friend (kết bạn).

Các kết quả nghiên cứu của luận văn sẽ là cơ sở cho việc tích hợp hành vi
người dùng trong mạng xã hội vào hệ tư vấn.

1.3 Độ tương đồng giữa các cặp người dùng dựa vào các hành vi mạng xã
hội
Xét một hệ thống gồm N người dùng U  u1 , u2 ,..., u N  và M sản phẩm (hàng
hóa, phim, ảnh, tạp chí, tài liệu, sách, báo, dịch vụ hoặc bất kỳ dạng thông tin nào
mà người dùng cần đến) P   p1 , p2 ,..., pM  .

Trong mục này, luận văn sẽ đánh giá mức độ tương đồng giữa hai người dùng
ui, uj, ký hiệu bởi cặp (i, j), i, j = 1, 2, .., N (i≠ j) thông qua độ đo tương tự dựa vào
các hành vi trong mạng xã hội (gọi tắt là độ tương tự).
1.3.1 Độ tương tự giữa các cặp người dùng dựa vào hành vi Like
(a) Khái niệm
Mức độ hài lòng của tập người dùng U đối với tập sản phẩm P được biểu diễn
thông qua ma trận Like
Li
Trong đó, mỗi giá trị
đối với sản phẩm
Giá trị

ix

.

ix

biểu diễn không thích/thích của người dùng
.

có thể thu thập trực tiếp bằng cách hỏi ý kiến người dùng hoặc thu

thập gián tiếp thông qua cơ chế phản hồi của người dùng và được biểu diễn theo
công thức (1.1) dưới đây:
(1.1)
Ma trận Li có thể xem như biểu diễn của một đồ thị hai phía G, trong đó chỉ
chứa các cạnh nối trực tiếp đỉnh

với đỉnh


khi và chỉ khi lix =1.


13

Độ tương tự giữa hai người dùng chính là tổng trọng số các đường đi có độ
đến đỉnh j U trên đồ thị G, trong đó L là nguyên dương

dài L từ đỉnh
chẵn[1].

Độ tương tự giữa các cặp người dùng được tính toán dựa vào ma trận Like:
(1.2)
Khi đó, độ tương tự giữa cặp người dùng (i, j) dựa trên hành vi Like được
xem như giá trị

là phần tử thuộc hàng i, cột j của ma trận LiL theo công thức

ij

(1.2). Hằng số L được chọn tùy vào ngữ cảnh cụ thể. Thông thường, chọn L là số
nhỏ nhất sao cho liLij ≠ 0 với mọi i ≠ j.
(b) Ví dụ 1.1
Giả sử kết quả đánh giá của một số người dùng với một số khách sạn, thu
thập được thông qua mạng xã hội dựa trên hành vi Like (không thích/thích) được
thể hiện trong bảng 1.1 (giá trị 1: người dùng i thích khách sạn x, giá trị 0: người
dùng i không thích khách sạn x).
Bảng 1.1. Ma trận Like người dùng-sản phẩm
Grand


Calypso

Big

Hagl

Hanoi

Hanoi

Sunrise

Suites

Home

Plaza

Zesty

Brother

Hotel

Inn

Người dùng 1
Người dùng 2


1
1

Người dùng 3
Người dùng 4
Người dùng 5

1

1

1

1
1

1
1

1
1

1

1

1
1

Ma trận like người dùng – sản phẩm, sẽ được chuyển đổi thành ma trận như

sau:


14

Đồ thị hai phía biểu diễn sự tương tác của người dùng với sản phẩm dựa vào
hành vi like được thể hiện qua hình 1.6

Hình 1.6. Đồ thị 2 phía biểu diễn mối quan hệ thích người dùng-sản phẩm
Theo công thức 1.2 ta có:
Với L = 2:

Với L = 4:


15

Quá trình tính toán dừng lại với L = 4 khi
Mỗi phần tử trên ma trận thể hiện mức độ tương tự giữa các cặp người
dùng. Trong ví dụ trên khi L=4 thì mức độ tương tự giữa tất cả các cặp người dùng
đều được xác định (Ví dụ : mức độ tương tự giữa u1 và u2 dựa vào hành vi Like là
21…).
1.3.2 Độ tương tự giữa các cặp người dùng dựa vào hành vi Post
(a) Khái niệm
Mối quan hệ giữa tập người dùng U và tập sản phẩm P được biểu diễn thông
qua ma trận Post
Po
Mỗi giá trị
người dùng
Giá trị


.

ix

biểu diễn việc post bài là tích cực,chưa post bài của
đối với sản phẩm

.

có thể thu thập trực tiếp bằng cách hỏi ý kiến người dùng hoặc thu

thập gián tiếp thông qua cơ chế phản hồi của người dùng, sau đó phân loại, gán
nhãn cho các bài Post là tích cực, loại bỏ các bài Post trung tính và tiêu cực. Giá trị
được hiểu rằng người dùng i chưa có post bài tích cực cho sản phẩm x.
Không mất đi tính tổng quát của bài toán, giả sử
post bài là tích cực đối với sản phẩm
post bài cho sản phẩm x. Giá trị

,

nếu người dùng
nếu người dùng i chưa

được biểu diễn theo công thức (1.3) dưới đây.
(1.3)

Ma trận Po có thể xem như biểu diễn của một đồ thị hai phía G, trong đó chỉ
chứa các cạnh nối trực tiếp đỉnh


với đỉnh

khi và chỉ khi po ix =1.


16

Độ tương tự giữa hai người dùng chính là tổng trọng số các đường đi có độ
đến đỉnh j U trên đồ thị G, trong đó L là nguyên dương

dài L từ đỉnh
chẵn[1].

Để xác định mức độ tương tự giữa các cặp người dùng, ta dựa vào ma trận
Post.
(1.4)
Khi đó, độ tương tự giữa cặp người dùng (i, j) dựa trên hành vi Post được
xem như giá trị poij là phần tử thuộc hàng i, cột j của ma trận PoL theo công thức
(1.4). Hằng số L được chọn tùy vào ngữ cảnh cụ thể. Thông thường, chọn L là số
nhỏ nhất sao cho poLij ≠ 0 với mọi i ≠ j.
(b) Ví dụ 1.2:
Giả sử kết quả đánh giá của một số người dùng với một số khách sạn, thu
thập được thông qua mạng xã hội dựa trên hành vi Post thể hiện trong bảng 1.2 (giá
trị 1: bài Post của người dùng là tích cực với khách sạn x):
Bảng 1.2. Ma trận Post người dùng-sản phẩm
Grand

Calypso

Big


Hagl

Hanoi

Hanoi

Sunrise

Suites

Home

Plaza

Zesty

Brother

Hotel

Inn

Người dùng 1
Người dùng 2

1
1

Người dùng 3

Người dùng 4
Người dùng 5

1

1

1
1

1

1
1

1
1

1
1

Ma trận Post người dùng – sản phẩm (ví dụ 1.2), sẽ được chuyển đổi thành ma
trận như sau:


×